




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第5章數(shù)據(jù)可視化之PowerBI篇商務(wù)智能與數(shù)據(jù)可視化分析基礎(chǔ)1本章內(nèi)容數(shù)據(jù)源連接與數(shù)據(jù)處理建立基礎(chǔ)視覺對象制作柱形圖和樹狀圖地圖可視化樓盤主標簽詞云圖切片器與篩選器的應(yīng)用制作數(shù)據(jù)看板頁面背景及布局設(shè)計數(shù)據(jù)看板的上傳與發(fā)布數(shù)據(jù)圖表的交互在線分享圖表數(shù)據(jù)的方式201數(shù)據(jù)源連接與數(shù)據(jù)處理
Excel和MySQL的連接基于Python的數(shù)據(jù)處理基于PowerBI的數(shù)據(jù)處理數(shù)據(jù)庫中表與表的關(guān)系數(shù)據(jù)可視化之PowerBI篇1.1Excel的連接3打開PowerBIDesktop,選擇“主頁”→“獲取數(shù)據(jù)”→“Excel”選項,獲取Excel數(shù)據(jù)數(shù)據(jù)預(yù)覽單擊列名左側(cè)的圖標按鈕來轉(zhuǎn)換數(shù)據(jù)格式,如整數(shù)、文本、百分數(shù)、日期/時間等。1.2Excel的連接4數(shù)據(jù)預(yù)覽在目標路徑下選擇想要導(dǎo)入的Excel文件,可以直接加載數(shù)據(jù),或者在“PowerQuery編輯器”界面中轉(zhuǎn)換數(shù)據(jù)格式。1.3Excel的連接5數(shù)據(jù)導(dǎo)入完成調(diào)整完數(shù)據(jù)格式,并確保沒有錯誤數(shù)據(jù)(Error會有紅色提示)后點擊關(guān)閉并應(yīng)用回到PowerBIDesktop的畫布界面,右側(cè)會出現(xiàn)剛才導(dǎo)入的Excel數(shù)據(jù)。1.4Excel的連接6PowerBIDesktop中依次點擊“獲取數(shù)據(jù)”→“更多”1.5PowerBI連接MySQL7在彈出的“獲取數(shù)據(jù)”對話框中選擇“數(shù)據(jù)庫”→“MySQL數(shù)據(jù)庫”選項1.6PowerBI連接MySQL此時點擊確定并聯(lián)網(wǎng)下載mysql-connector-net-8.0.21.msi并安裝:8在彈出的“獲取數(shù)據(jù)”對話框中選擇“數(shù)據(jù)庫”→“MySQL數(shù)據(jù)庫”選項如果是第一次連接MySQL的話,會彈出提示:在彈出的“獲取數(shù)據(jù)”對話框中選擇“數(shù)據(jù)庫”→“MySQL數(shù)據(jù)庫”選項。如果是第一次連接MySQL的話,會彈出數(shù)據(jù)導(dǎo)入組件缺失的提示框。單擊提示框中的“確定”按鈕,會連網(wǎng)下載數(shù)據(jù)導(dǎo)入組件“MySQLConnectorNet8.0.21.msi”并安裝1.7PowerBI連接MySQL9安裝完畢后重啟PowerBIDesktop,并重復(fù)之前的步驟,就可以進入連接界面,輸入服務(wù)器地址(默認3306端口,可以忽略端口號)及數(shù)據(jù)庫名稱。勾選目標數(shù)據(jù)庫的復(fù)選框,之后的操作與導(dǎo)入Excel的操作基本一致。1.8PowerBI連接MySQL10MySQL數(shù)據(jù)導(dǎo)航器1.9PowerBI連接MySQL11選擇“主頁”→“獲取數(shù)據(jù)”→“更多”選項,在彈出的“獲取數(shù)據(jù)”對話框中選擇“其他”→“Python腳本”選項,并單擊“連接”按鈕。1.10基于Python的數(shù)據(jù)處理12“Python腳本”對話框importpandasaspddf=pd.DataFrame(data=['Apple','Banana','Cherry','Dates','Eggfruit'])1.11基于Python的數(shù)據(jù)處理13“導(dǎo)航器”對話框在對話框左側(cè)列出的是Python腳本數(shù)據(jù)類型為“df”(即DataFrame)的變量,右側(cè)為數(shù)據(jù)。1.12基于Python的數(shù)據(jù)處理14DAX全稱DataAnalysiseXpressions,是面向PowerBI和MicrosoftPowerPivotforExcel的編程式數(shù)據(jù)分析語言。它創(chuàng)建于2010年,隨PowerPivot的第一個版本PowerPivotforExcel2010一起發(fā)布。微軟公司在官方的介紹中稱DAX是一種簡單的語言,其在開發(fā)DAX的時候從Excel中移植了很多函數(shù),它們的名稱相同,參數(shù)用法類似。與Excel處理大數(shù)據(jù)量時的卡頓相比,DAX中的函數(shù)基于其優(yōu)秀的列式數(shù)據(jù)引擎,能夠在幾秒內(nèi)完成復(fù)雜的Excel計算并輸出結(jié)果。1.13基于PowerBI的數(shù)據(jù)處理——DAX函數(shù)15編寫DAX函數(shù)有三種場景:計算列、度量值和查詢。計算列如果想在Excel中創(chuàng)建一個計算列,則可以先將鼠標指針移動到表的最后一列(即添加列),再開始編寫公式。在PowerPivot中創(chuàng)建計算列,與創(chuàng)建其他列一樣,可以在數(shù)據(jù)透視表或其他報表的行、列、篩選器中添加。如果有需要,還可以使用計算列來定義關(guān)系。定義計算列的DAX函數(shù)可以在它所屬表的當前行上下文中計值。任何對列的引用都會返回當前行中該列的值,不能直接訪問其他行的值。1.14基于PowerBI的數(shù)據(jù)處理——度量值16度量值在DAX函數(shù)中還有一種定義計算的方法,當我們不想沿著表格逐行計算,而是想在上下文環(huán)境中對表的多行進行聚合計算時,該計算方式被稱為度量值。度量值的表達式通常是使用聚合函數(shù)(SUM、MIN、MAX、AVERAGE等)生成標量結(jié)果。例如,可以在銷售表中定義名為“GrossMargin”的列來計算毛利:Sales[GrossMargin]=Sales[SalesAmount]–Sales[TotalProductCost]但如果想顯示毛利占銷售額的百分比應(yīng)該怎樣做呢?可以使用以下公式來計算列:Sales[GrossMarginPct]=Sales[GrossMargin]/Sales[SalesAmount]度量值在表中的展示1.15基于PowerBI的數(shù)據(jù)處理——度量值17自動創(chuàng)建度量值除了手動編寫度量值,還有一種方法可以自動創(chuàng)建度量值。例如,將銷售額列拖放至圖表后可以選擇多種匯總方式(包括求和、平均值、最小值、最大值、計數(shù)(非重復(fù))、計數(shù)等),無須為每種聚合類型手動創(chuàng)建度量值。1.16基于PowerBI的數(shù)據(jù)處理——度量值18編寫查詢語句也是DAX的常用功能之一。與度量值和計算列不同的是,查詢返回的是表結(jié)構(gòu)的數(shù)據(jù),而不是標量值。DAX查詢語句的編寫與結(jié)構(gòu)化查詢語言(StructuredQueryLanguage,SQL)類似。1.17基于PowerBI的數(shù)據(jù)處理——查詢19CALCULATE函數(shù)篩選函數(shù):ALL系列函數(shù)包括ALL、ALLEXCEPT、ALLNOBLANKROW、ALLCROSSFILTERED和ALLSELECTED。時間函數(shù)1.18基于PowerBI的數(shù)據(jù)處理——常用函數(shù)20PowerBI數(shù)據(jù)模型與其他數(shù)據(jù)庫一樣,存在一對一、一對多和多對多三種關(guān)系。1.19數(shù)據(jù)庫里表與表的關(guān)系212202建立基礎(chǔ)視覺對象制作柱形圖和樹狀圖地圖可視化樓盤主標簽詞云圖切片器與篩選器的應(yīng)用數(shù)據(jù)可視化之PowerBI篇導(dǎo)入數(shù)據(jù)后,在“導(dǎo)航器”對話框中同時勾選“成交信息”和“項目信息”復(fù)選框,然后單擊“轉(zhuǎn)換數(shù)據(jù)”按鈕進入“PowerQuery編輯器”界面。2.1PowerQuery界面23選擇“視圖”選項卡,在“數(shù)據(jù)預(yù)覽”組中勾選“列質(zhì)量”、“顯示空白”和“列分發(fā)”復(fù)選框,可以在數(shù)據(jù)列上方看到此列的數(shù)據(jù)分布、是否有錯誤值或空值等信息。2.2數(shù)據(jù)預(yù)覽24使用鼠標拖曳底部的橫向滾動條,顯示“開盤時間”列,該列本應(yīng)該被識別為時間格式,但是列中的“2020-04-99”等非法時間導(dǎo)致該列被識別為字符串類型。2.3數(shù)據(jù)格式調(diào)整25使用鼠標右擊列名左側(cè)的圖標按鈕,在彈出的快捷菜單中將該列數(shù)據(jù)轉(zhuǎn)換為日期格式。右擊“開盤時間”列,在彈出的快捷菜單中選擇“刪除錯誤”選項。2.4數(shù)據(jù)格式調(diào)整26如果需要保留其余數(shù)據(jù),則可以將錯誤值替換為“null”,右擊“開盤時間”列,在彈出的快捷菜單中選擇“替換錯誤”命令。在數(shù)據(jù)格式轉(zhuǎn)換完成后,可以選擇“文件”→“關(guān)閉并應(yīng)用”選項回到制作界面。2.5數(shù)據(jù)格式調(diào)整27在報表視圖中選擇“可視化”→“簇狀柱形圖”選項。在“數(shù)據(jù)”窗格中,勾選“項目信息”表的“樓盤名稱”復(fù)選框并拖放至“Y軸”框,勾選“樓盤銷售狀態(tài)”復(fù)選框并拖放至“X軸”框。2.6制作柱形圖和樹狀圖28生成了一個簡單的柱形圖,可以展示不同樓盤在不同銷售狀態(tài)下的分類統(tǒng)計信息。2.7制作柱形圖和樹狀圖29柱形圖美化:單擊“可視化”選項卡中的按鈕,設(shè)置“Y軸”為“開”,“X軸”為“開”,“數(shù)據(jù)標簽”為“開”。2.8制作柱形圖和樹狀圖30柱形圖美化:單擊“Y軸”左側(cè)的下拉按鈕,在“標題文本”輸入框中輸入“項目數(shù)”。2.9制作柱形圖和樹狀圖31樹狀圖的制作過程步驟與柱形圖類似,在“字段”窗格中,勾選“樓盤名稱”復(fù)選框并拖放至“值”框,勾選“樓盤銷售狀態(tài)”復(fù)選框并拖放至“組”框,樹狀圖的制作和生成的效果。2.10制作柱形圖和樹狀圖32在PowerBI的默認可視化對象中,有兩種地圖對象:ArcGISMap圖和氣泡圖。樓盤名稱ArcGISMap圖單擊“可視化”窗格里的“地圖”按鈕,然后勾選右側(cè)的“經(jīng)度”復(fù)選框并拖放至左側(cè)的“經(jīng)度”框,勾選右側(cè)的“緯度”復(fù)選框并拖放至左側(cè)的“緯度”框。2.11地圖可視化33樓盤名稱氣泡圖勾選“樓盤名稱”復(fù)選框并拖放至“氣泡大小”框,將顯示樓盤名稱氣泡圖。2.12地圖可視化34在“可視化”窗格中單擊“詞頻插件”按鈕,在“數(shù)據(jù)”窗格中勾選“主標簽”復(fù)選框并拖放至“類別”框,生成樓盤主標簽詞云圖。2.13樓盤主標簽詞云圖35切片器的應(yīng)用切片器和篩選器的作用都是篩選數(shù)據(jù),不同之處在于,切片器更多地用于對某個或某些視覺對象進行篩選,而篩選器更多地用于整個頁面或所有頁面的共同篩選。先單擊“可視化”窗格中的“切片器”圖標按鈕,然后勾選“供水方式”復(fù)選框并拖放至“字段”框;在看板界面中勾選“民水”復(fù)選框,可以看到主標簽詞云圖中的文字也改變了。2.14切片器與篩選器的應(yīng)用36篩選器的應(yīng)用首先勾選“樓盤銷售狀態(tài)”復(fù)選框并拖放至“篩選器”窗格,設(shè)置篩選類型為“基本篩選”。然后,勾選“即將開盤”復(fù)選框。接著,勾選“樓盤分級”復(fù)選框并拖放至“所有頁面上的篩選器”框,可以看到每加入一個字段進行篩選,視覺對象也跟著改變。2.15切片器與篩選器的應(yīng)用373803制作數(shù)據(jù)看板頁面背景及布局設(shè)計數(shù)據(jù)看板的上傳與發(fā)布數(shù)據(jù)圖表的交互在線共享圖表數(shù)據(jù)的方式數(shù)據(jù)可視化之PowerBI篇3.1頁面背景及布局設(shè)計393.2頁面背景及布局設(shè)計403.3數(shù)據(jù)看板的上傳與發(fā)布413.4數(shù)據(jù)看板的上傳與發(fā)布42在線看板的兩種交互方式。點按:可以點按切片器,也可以點按表格中的一行數(shù)據(jù)、柱形圖中的一列或詞云中的一個字符串,都可以完成交互。懸停:當鼠標指針懸停在一個位置時就會彈出該位置的詳細信息(如果有)。例如,當鼠標指針懸停在項目名稱上時可以顯示制作的工具提示頁面。3.5數(shù)據(jù)圖表的交互43在實際的業(yè)務(wù)場景中,看板除了有展示的功能,還有數(shù)據(jù)分發(fā)的功能,可以以看板的形式來共享數(shù)據(jù)。當打開新的鏈接并登錄之后,將鼠標指針懸停在表格上時,表格的右上角會比原來鏈接里多出三個點的按鈕,單擊該按鈕,在彈出的菜單中選擇“導(dǎo)出數(shù)據(jù)”命令。3.6在線分享圖表數(shù)據(jù)的方式44思考題(1)請嘗試比較從Python、MySQL及PowerQuery導(dǎo)入數(shù)據(jù)的優(yōu)劣。(2)請闡述在DAX中計算列和度量值的區(qū)別。(3)CALCULATE函數(shù)接受哪三種類型的篩選器?(4)如何使用時間序列函數(shù)與模型建立關(guān)系?(5)建立基礎(chǔ)視覺對象包括很多元素,請列舉其中兩個并闡述它們的基本操作。(6)請嘗試用PowerBI導(dǎo)入數(shù)據(jù)集(使用5.1節(jié)中的combination.txt文件,基于3DMark官網(wǎng)的20萬條公開數(shù)據(jù)),并以此制作一頁數(shù)據(jù)看板。45第6章數(shù)據(jù)可視化之詞云圖篇商務(wù)智能與數(shù)據(jù)可視化分析基礎(chǔ)47本章內(nèi)容詞云圖與分詞算法詞云圖分詞算法中文分詞的難點Excel實現(xiàn)中文分詞Python實現(xiàn)中文分詞與第三方插件詞云圖與詞云看板的實現(xiàn)
Excel分詞結(jié)果展示Python分詞結(jié)果展示背景制作與看板美化4801詞云圖與分詞算法詞云圖分詞算法中文分詞的難點數(shù)據(jù)可視化之詞云圖篇詞云就是對文本中出現(xiàn)頻率較高的關(guān)鍵詞予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,以便讓瀏覽者一眼掃過就可以領(lǐng)略文本的重點。詞云圖又稱文字云,是信息可視化的表現(xiàn)形式之一。1.1詞云圖49
分詞就是將連續(xù)的“字序列”按照一定的規(guī)范重新組合成語義獨立的“詞序列”的過程?;谠~典分詞算法基于詞典的分詞算法也稱字符串匹配分詞算法,該算法是按照一定的策略將待匹配的字符串和一個已建立好的“充分大的”詞典中的詞進行匹配,如果找到某個詞條,則說明匹配成功,識別了該詞。常見的基于詞典的分詞算法分為以下幾種:正向最大匹配法、逆向最大匹配法和雙向匹配分詞法等?;谠~典的分詞算法是應(yīng)用最廣泛、分詞速度最快的。很長一段時間內(nèi),研究者都在使用基于字符串匹配的方法進行優(yōu)化。例如,優(yōu)化最大長度設(shè)定、字符串存儲和查找方式,以及對詞表的組織結(jié)構(gòu)優(yōu)化,如采用Trie樹、哈希索引等。1.2分詞算法50基于統(tǒng)計的機器學(xué)習(xí)算法目前常用的算法是HMM、CRF、SVM、深度學(xué)習(xí)等算法。例如,自然語言處理工具包Stanford、Hanlp就是基于CRF算法來實現(xiàn)的。以CRF為例,其基本思路是對漢字進行標注訓(xùn)練,基于統(tǒng)計的機器學(xué)習(xí)算法不僅考慮詞語出現(xiàn)的頻率,還考慮上下文,具備較好的學(xué)習(xí)能力,因此其對歧義詞和未登錄詞的識別都具有良好的效果。
隨著深度學(xué)習(xí)的興起,出現(xiàn)了基于神經(jīng)網(wǎng)絡(luò)的分詞器。例如,有人嘗試使用雙向LSTM+CRF實現(xiàn)分詞器功能,其本質(zhì)是序列標注,所以具有通用性。當命名、實體識別時都可以使用該模型,據(jù)報道其分詞器字符的準確率可高達97.5%。1.3分詞算法51目前中文分詞難點主要如下:
(1)分詞標準:比如人名,在哈工大的標準中姓和名是分開的,但在HanLP(HanLanguageProcessing
)中是合在一起的。這需要根據(jù)不同的需求制定不同的分詞標準。
(2)歧義:對同一個待切分的字符串存在多個分詞結(jié)果。歧義又分為組合型歧義、交集型歧義和真歧義三種類型。
組合型歧義:分詞是有不同的粒度的,某個詞條中的一部分也可以被切分為一個獨立的詞條。例如,“北京大學(xué)歷史悠久”,粗粒度的分詞就是“北京大學(xué)/歷史/悠久”,細粒度的分詞可能是“北京/大學(xué)/歷史/悠久”。
交集型歧義:在“杭州西湖南邊”中,“西湖”是湖名,是一個專有詞,“湖南”也是一個詞,它們共享了“湖”字。真歧義:本身的語法和語義都沒有問題,即使采用人工切分也會產(chǎn)生同樣的歧義,只有通過上下文的語義環(huán)境才能給出正確的切分結(jié)果。例如,句子“我知道你也認識小王”,既可以切分成“我知道/你也認識小王”,又可以切分成“我知道你/也認識小王”。(3)新詞:即未被詞典收錄的詞,該問題的解決依賴于人們對分詞技術(shù)和漢語語言結(jié)構(gòu)的進一步認識。1.4中文分詞的難點525302Excel實現(xiàn)中文分詞下載插件安裝插件插件安裝確認中文分詞數(shù)據(jù)規(guī)整詞頻統(tǒng)計數(shù)據(jù)可視化之詞云圖篇Excel本身沒有分詞的功能,可以借助插件——“方方格子”工具箱來實現(xiàn)中文分詞的功能。(1)下載插件首先登錄方方格子官網(wǎng),單擊“方方格子工具箱”按鈕,并選擇下載地址進行安裝包的下載。2.1Excel實現(xiàn)中文分詞54(2)安裝插件將下載的安裝包解壓縮后,在確認關(guān)閉Excel的情況下,以管理員權(quán)限運行安裝向?qū)?,按照提示進行安裝。2.2Excel實現(xiàn)中文分詞55(3)插件安裝確認在完成安裝之后打開Excel,可以在菜單欄中找到“方方格子”選項卡。2.3Excel實現(xiàn)中文分詞56(4)方方格子安裝異常處理如果Excel的菜單欄中未出現(xiàn)“方方格子”選項卡,則選擇“文件”→“選項”命令,在彈出的“Excel選項”對話框中選擇“加載項”選項,并設(shè)置啟用“FFCell”加載項。2.4Excel實現(xiàn)中文分詞57中文分詞在分詞之前,首先將配套素材文件中的內(nèi)容以文本的格式粘貼到A1單元格中。然后在“方方格子”選項卡的“高級文本處理”組中選擇“更多”→“分割更多”→“文本分詞”選項。
2.5Excel實現(xiàn)中文分詞58中文分詞在彈出的“文本分詞”對話框中,設(shè)置區(qū)域為“A1”,分隔符為“/”,并單擊“確定”按鈕,最后設(shè)置將結(jié)果存放在“$A$2”區(qū)域中。2.6Excel實現(xiàn)中文分詞59數(shù)據(jù)規(guī)整在分詞完成之后,A2單元格中存放著以“/”為分隔符的詞語集合,為之后看板制作的數(shù)據(jù)做準備,需要將詞語集合轉(zhuǎn)換為一列。首先選中單元格A2,然后選擇“數(shù)據(jù)”→“分列”選項,在彈出的對話框中勾選“分隔符號”單選按鈕,并單擊“下一步”按鈕。2.7Excel實現(xiàn)中文分詞60數(shù)據(jù)規(guī)整勾選“分隔符號”區(qū)域中的“其他”復(fù)選框,在輸入框中輸入“/”,單擊“完成”按鈕。2.8Excel實現(xiàn)中文分詞61數(shù)據(jù)規(guī)整在完成分列后,首先選中分列后的全部詞語所在的A2單元格進行復(fù)制(按“Ctrl+C”組合鍵),然后在A3單元格處右擊,在彈出的快捷菜單中選擇“選擇性粘貼”命令,在彈出的“選擇性粘貼”對話框中,勾選“轉(zhuǎn)置”復(fù)選框并單擊“確定”按鈕。2.9Excel實現(xiàn)中文分詞62數(shù)據(jù)規(guī)整最后在“A1”單元格處鍵入“分詞結(jié)果”作為列名,并刪除A2行。2.10Excel實現(xiàn)中文分詞63詞頻統(tǒng)計在得到一列分詞結(jié)果后,可以在Excel中使用數(shù)據(jù)透視表進行簡單的詞頻統(tǒng)計,單擊“插入”→“數(shù)據(jù)透視表”按鈕,在彈出的“來自表格或區(qū)域的數(shù)據(jù)透視表”對話框中,選擇表格區(qū)域中的“A”列,在“選擇放置數(shù)據(jù)透視表的位置”區(qū)域中選中“現(xiàn)有工作表”單選按鈕,并設(shè)置“位置”為B1單元格。2.11Excel實現(xiàn)中文分詞64詞頻統(tǒng)計在數(shù)據(jù)透視表字段中,勾選“分詞結(jié)果”復(fù)選框并分別拖放至“行”框和“值”框,在“值”框中設(shè)置默認“計數(shù)項”為分詞結(jié)果。2.12Excel實現(xiàn)中文分詞656603Python實現(xiàn)中文分詞與第三方插件精確模式全模式搜索引擎模式
文本分詞示例第三方插件數(shù)據(jù)可視化之詞云圖篇現(xiàn)成的分詞工具有不少,其中Python環(huán)境下的分詞工具也很多,包括盤古分詞、Yaha分詞、結(jié)巴分詞等,這些分詞工具都是開源軟件,在許可協(xié)議下可以免費使用這些分詞工具。其中結(jié)巴分詞(jieba庫)是一款優(yōu)秀的Python第三方中文分詞庫,它支持三種分詞模式:精確模式、全模式和搜索引擎模式:1、精確模式:可以精確地切分語句,不存在冗余數(shù)據(jù),適合進行文本分析。jieba.cut(text,cut_all=False)#精確模式2、全模式:將語句中所有可能是詞語的部分都切分出來,切分速度快,但是存在冗余數(shù)據(jù)。jieba.cut(text,cut_all=True)#全模式3、搜索引擎模式:jieba.cut_for_search(text)#搜索引擎模式3.1Python實現(xiàn)中文分詞67
文本分詞示例:1、分詞庫安裝
全自動安裝:pipinstalljieba(window環(huán)境)pip3installjieba(Linux環(huán)境)2、導(dǎo)入相關(guān)工具庫importjieba,osimportpandasaspd3、導(dǎo)入文本與停用詞表root='D:\\1'#文件夾所在路徑stopwords=[line.strip()forlineinopen(os.path.join(root,'6.stopwords.txt'),encoding='UTF-8').readlines()]df_fcb=pd.DataFrame()
3.2Python實現(xiàn)中文分詞684、分詞過程3.3Python實現(xiàn)中文分詞695、完成分詞結(jié)果整理與導(dǎo)出
df_fcb.to_excel('6.6_jieba分詞后.xlsx',index=None)PowerBI本身并沒有詞云的可視化對象,可安裝第三方插件來實現(xiàn),既可通過“獲取更多視覺對象”,也可通過“從文件導(dǎo)入視覺對象”來安裝。其中通過“獲取更多視覺對象”安裝的步驟如下:
(1)從“可視化效果”窗格中選擇省略號。
(2)點擊“獲取更多視覺對象”,從而加載更多豐富的第三方插件來實現(xiàn)詞云圖。
(3)點擊WordCloud進行加載,此時需要稍等一會,PowerBI會自動下載并安裝該插件。3.4安裝第三方插件70通過“從文件導(dǎo)入視覺對象”安裝第三方插件的步驟如下:(1)在“可視化”窗格中單擊“…”按鈕。(2)在彈出的快捷菜單中選擇“從文件導(dǎo)入視覺對象”命令。(3)在彈出的對話框中,選中待導(dǎo)入的文件,如WordCloud_ImportTest.pbiviz,并單擊“打開”按鈕。(4)視覺對象將在“可視化效果”窗格中顯示為新圖標。3.5加載第三方插件717204詞云圖與詞云看板的實現(xiàn)Excel分詞結(jié)果展示背景制作與看板美化數(shù)據(jù)可視化之詞云圖篇標題提升4.1Excel分詞結(jié)果展示73默認詞云圖接著導(dǎo)入詞云的可視化對象,勾選“行標簽”復(fù)選框并拖放至“類別”框,勾選“計數(shù)項:分詞結(jié)果”復(fù)選框并拖放至“值”框,并將聚合類型設(shè)置為“求和”,即可得到默認詞云圖。4.2Excel分詞結(jié)果展示74除了可以在Excel中統(tǒng)計詞頻,還可以使用DAX來建立一個“分詞計數(shù)”的度量值,要勾選未統(tǒng)計過的“分詞結(jié)果”復(fù)選框并拖放至“類別”框,勾選“分詞計數(shù)”復(fù)選框并拖放至“值”框,即可得到可視化結(jié)果。4.3使用度量值繪制詞云75雖然在Excel中通過方方盒子插件實現(xiàn)了“0代碼”中文分詞功能,但分詞過程中無法手動去除如“的”“與”“基于”“研究”“二”“我們”這樣的無意義的助詞、代詞或名詞。依次選擇“主頁”→“輸入數(shù)據(jù)”選項,輸入需要去除的如“的”“與”“基于”“研究”“二”“我們”這樣的無意義的助詞、代詞或名詞。4.4去除無意義的詞76勾選輸入的“列1”復(fù)選框并拖放至“不包含”框,可以發(fā)現(xiàn)之前的“的”“基于”等字樣消失了。4.5去除無意義的詞774.6Python分詞結(jié)果展示78PowerBI作為微軟產(chǎn)品,默認版面尺寸和PowerPoint(PPT)是一致的,因此可借助PPT來快速完成背景的制作。以“上海大創(chuàng)項目名稱”看板為例,首先在網(wǎng)上收集幾張與主題強相關(guān)的圖片,然后將它們插入PPT。4.7背景制作與看板美化79選擇合適的背景,并插入后,依次設(shè)置標題為“上海大創(chuàng)項目名稱”,設(shè)置目錄切片器,并插入在之前制作的詞云可視化對象4.8背景制作與看板美化80可以看到目錄切片器中的順序較混亂。由于PowerBI是英文的軟件,所以不支持中文升序或降序,目錄順序是按照首字母默認進行排序的。但是在PowerBIDesketop中編輯報表時,可以選擇用一列來定義另一列的方式進行排序。按月份排序的示例如下:4.9背景制作與看板美化81(1)首先選擇要排序的列,在本例中為目錄列。請注意,視覺對象中的目錄按字母順序排序。設(shè)置“列工具”選項卡為活動狀態(tài),并單擊“按列排序”按鈕。4.10背景制作與看板美化82(2)然后選中作為排序依據(jù)的列。4.11背景制作與看板美化83注意選擇“排序”列時,該字段要與文本內(nèi)容一一對應(yīng),若出現(xiàn)不對應(yīng)問題,則要在編輯器中將文本內(nèi)容中的重復(fù)項刪去,并調(diào)整“排序”列數(shù)據(jù)類型為“整數(shù)”。4.12背景制作與看板美化84(3)經(jīng)過排序調(diào)整后的視覺對象自動按正確的中文順序排序,效果如下。4.13背景制作與看板美化85思考題(1)中文分詞算法主要的分類有幾種,分別有什么特點?(2)Python的jieba庫支持哪幾種分詞模式?(3)在中國政府網(wǎng)(/zhengce/zuixin/)中的最新政策一欄下,任選五篇政策文章按照本章的操作指南來完成中文分詞與看板搭建。86第7章數(shù)據(jù)可視化之數(shù)據(jù)看板篇商務(wù)智能與數(shù)據(jù)可視化分析基礎(chǔ)88本章內(nèi)容一維表和二維表頁面導(dǎo)航按鈕看板導(dǎo)航書簽切片器利潤分析數(shù)據(jù)看板數(shù)據(jù)發(fā)布與報表下載使用指標報表與脫機工作注意事項8901一維表和二維表一維表
二維表一維表數(shù)據(jù)可視化數(shù)據(jù)可視化之數(shù)據(jù)看板篇一維表里將相同屬性(維度)的數(shù)據(jù)放在同一列。1.1一維表901.2二維表91二維表是以一個或多個屬性數(shù)據(jù)橫向排列,同一屬性數(shù)據(jù)占據(jù)多列的呈現(xiàn)方式。1.3一維表數(shù)據(jù)可視化92待可視化的一維表1.4一維表數(shù)據(jù)可視化93一維表的數(shù)據(jù)可視化呈現(xiàn)9402頁面導(dǎo)航按鈕創(chuàng)建按鈕自定義按鈕設(shè)置按鈕狀態(tài)選擇按鈕操作創(chuàng)建頁導(dǎo)航設(shè)置頁導(dǎo)航設(shè)置導(dǎo)航圖像數(shù)據(jù)可視化之數(shù)據(jù)看板篇目錄頁導(dǎo)航按鈕2.1頁面導(dǎo)航按鈕952.3創(chuàng)建按鈕按鈕屬性界面按鈕創(chuàng)建界面962.4自定義按鈕97按鈕圖像按鈕瀏覽圖像修改按鈕形狀2.5自定義按鈕98按鈕屬性變更圖標相對文本的位置設(shè)置圖標位置2.6按鈕狀態(tài)99按鈕操作的選項:?“返回”可讓用戶返回到報表的上一頁。此操作非常適合鉆取頁。?“書簽”可顯示與為當前報表定義的書簽關(guān)聯(lián)的報表頁。詳細了解PowerBI中的書簽。?“鉆取”可讓用戶導(dǎo)航到已按照所選內(nèi)容篩選的鉆取頁,而無需使用書簽。詳細了解報表中的鉆取按鈕。?“頁面導(dǎo)航”可讓用戶導(dǎo)航到報表中的其他頁面,也無需使用書簽。有關(guān)詳細信息,請參閱創(chuàng)建頁面導(dǎo)航。?“問答”可打開一個“問答資源管理器”窗口。報表讀者選擇“問答”按鈕時,“問答”資源管理器將打開,然后即可使用自然語言詢問數(shù)據(jù)相關(guān)問題。?WebURL在瀏覽器中打開網(wǎng)頁。2.7選擇按鈕的操作100若要設(shè)置單頁導(dǎo)航按鈕,請執(zhí)行以下操作:1.創(chuàng)建將“頁面導(dǎo)航”作為其“操作”的“類型”的按鈕,然后選擇“目標”頁面。2.也可以有條件地設(shè)置“操作”下的“工具提示”的格式,就像對其他按鈕類型執(zhí)行的操作一樣。3.如果需要自定義導(dǎo)航窗格,請創(chuàng)建頁面和書簽導(dǎo)航器,而不是單獨的按鈕。
除了按鈕支持導(dǎo)航操作外,形狀和圖像也支持頁面導(dǎo)航操作2.8創(chuàng)建與設(shè)置頁面導(dǎo)航10110203看板導(dǎo)航書簽創(chuàng)建書簽創(chuàng)建報表書簽排列書簽使用“選擇”窗格向按鈕分配書簽創(chuàng)建書簽組數(shù)據(jù)可視化之數(shù)據(jù)看板篇看板導(dǎo)航書簽見左側(cè)的小圖標。3.1看板導(dǎo)航書簽103按鈕能起到了頁面導(dǎo)航的功能,“書簽”同樣可以實現(xiàn)這個功能,甚至在實際應(yīng)用中更加靈活,但書簽在使用之前需要提前“添加”,具體方式如下,在“視圖”中點擊“書簽”,然后在右側(cè)點擊“添加”。3.2創(chuàng)建書簽104創(chuàng)建報表書簽的前提是操作者具有編輯報表的權(quán)限,已經(jīng)獲得權(quán)限的操作者才能創(chuàng)建報表書簽。尤其值得注意的是,在創(chuàng)建書簽時,與該書簽一起保存的元素包括當前頁、篩選器、切片器、視覺對象選擇狀態(tài)、排序順序、鉆取位置、對象可見性等。
3.3創(chuàng)建報表書簽105排列書簽。
(1)在“書簽”窗格中,勾選某書簽前的復(fù)選框,并將其拖放至合適的位置,即可更改書簽順序。(2)書簽之間的橫線決定了書簽的拖放目標位置。3.4排列書簽106“選擇”窗格中列出了當前頁上的所有對象,方便用戶選擇對象,并可以設(shè)置對象是否可見。在“選擇”窗格中,選擇一個對象并通過選擇該對象右側(cè)的眼睛圖標切換該對象當前是否可見。3.5使用“選擇”窗格107如果要將書簽分配給按鈕,則執(zhí)行以下操作。(1)在“插入”選項卡中,選擇“按鈕”→“空白”選項。(2)在“格式”窗格中,設(shè)置按鈕的“操作”為“開”。(3)展開“操作”菜單,設(shè)置“類型”為“書簽”。(4)在“書簽”窗格中,選擇“書簽1”選項。3.6向按鈕分配書簽108在編輯報表時,可以創(chuàng)建和使用書簽組。書簽組是指定書簽的集合,可以按照組的形式顯示和排列,創(chuàng)建書簽組的步驟如下。(1)按“Ctrl”鍵,并單擊選中要包含在組中的書簽。(2)單擊所選書簽右側(cè)的“更多”按鈕,在彈出的快捷菜單中選擇“分組”命令。3.7創(chuàng)建書簽組10911004切片器使用切片器的場合創(chuàng)建切片器控制切片器交互同步切片器篩選切片器數(shù)據(jù)可視化之數(shù)據(jù)看板篇在以下場合中,切片器非常有用。(1)使用切片器來簡化訪問在報表畫布上顯示常用或重要的篩選器。(2)使用切片器來更輕松地查看當前篩選的狀態(tài),而無須打開下拉列表。(3)使用切片器按數(shù)據(jù)表中不需要的列和隱藏的列進行篩選。(4)通過將切片器置于重要的視覺對象旁邊,創(chuàng)建更能突出重點的報表。4.1使用切片器的場合1114.2創(chuàng)建切片器1124.3控制切片器交互113同步切片器具體操作如下:單擊“數(shù)據(jù)/鉆取”→“同步切片器”按鈕,在“同步切片器”窗格中,依次勾選“資產(chǎn)分析”“負債分析”“利潤分析”“往來分析”復(fù)選框4.4同步切片器114可以將視覺對象級篩選器應(yīng)用于切片器,以減少切片器中顯示的值的列表。例如,可以從列表切片器中篩選出空白值,或者從范圍切片器中篩選出特定日期。在篩選切片器時,篩選只是影響切片器中顯示的值,而不是當進行選擇時將切片器應(yīng)用于其他視覺對象的篩選器。假設(shè)將篩選器應(yīng)用于范圍切片器,以便僅顯示特定日期。對切片器的選擇僅用于顯示該范圍中的第一個日期和最后一個日期,但仍會在其他視覺對象中顯示其他日期。在更改切片器中的所選范圍后,會看到其他視覺對象更新。清除切片器會再次顯示所有日期。4.5篩選切片器11511605利潤分析數(shù)據(jù)看板
杜邦財務(wù)分析法
利潤分析看板數(shù)據(jù)可視化之數(shù)據(jù)看板篇杜邦財務(wù)分析法,也稱杜邦分析體系、杜邦方法,是美國化工集團——杜邦集團從20世紀20年代開始使用的一種財務(wù)分析方法。杜邦財務(wù)分析法利用各財務(wù)指標之間的內(nèi)在關(guān)系,對企業(yè)財務(wù)狀況及經(jīng)濟效益進行綜合分析。這種系統(tǒng)性的分析方法主要側(cè)重于對公司財務(wù)管理中三個至關(guān)重要的方面的管理,分別是:營運管理、資產(chǎn)管理、資本結(jié)構(gòu)。5.1杜邦財務(wù)分析法117杜邦分析體系5.2杜邦財務(wù)分析法118基于杜邦分析的理論,搭建的利潤分析看板。5.3杜邦財務(wù)分析法11912006數(shù)據(jù)發(fā)布與報表下載
重新發(fā)布或替換數(shù)據(jù)集報表下載數(shù)據(jù)可視化之數(shù)據(jù)看板篇重新發(fā)布或替換數(shù)據(jù)集時,需要注意以下幾點。(1)當在線PowerBI服務(wù)中有兩個或多個與PowerBIDesktop文件同名的數(shù)據(jù)集時,可能導(dǎo)致發(fā)布操作失敗。(2)如果進行重命名、刪除列或度量值操作,則在線PowerBI服務(wù)中的任何含有該字段的可視化對象都可能會被破壞。(3)在線PowerBI服務(wù)將忽略對現(xiàn)有列的某些格式的更改。例如,如果將列的格式從0.25%更改為25%,則該操作將被忽略。(4)假設(shè)有一個為在線PowerBI服務(wù)中的現(xiàn)有數(shù)據(jù)集配置的刷新計劃。當新數(shù)據(jù)源被添加到文件中,并重新發(fā)布時,必須在下一次計劃的刷新前登錄這些數(shù)據(jù)源。(5)重新發(fā)布從PowerBIDesktop發(fā)布的數(shù)據(jù)集并定義刷新計劃時,在重新發(fā)布數(shù)據(jù)集后就可以開始數(shù)據(jù)集的刷新。(6)對數(shù)據(jù)集進行更改并重新發(fā)布時,會有一條消息提示有多少工作區(qū)、報表和看板可能會受到更改的影響。(7)如果正在覆蓋的在線PowerBI服務(wù)中的數(shù)據(jù)集具有與擴展名為“pbix”的文件中的標簽不同的敏感度標簽,則將顯示一個對話框。該對話框?qū)⑻崾居脩羰沁x擇保留現(xiàn)有標簽,還是選擇使用擴展名為“pbix”的文件中的標簽來覆蓋它們。6.1重新發(fā)布或替換數(shù)據(jù)集121在PowerBIDesktop中,可以將報表從本地計算機發(fā)布到PowerBI服務(wù)。當然PowerBI報表也可以反向流動。需要注意的是,如果要下載擴展名為“pbix”的文件,下載的賬戶身份應(yīng)該至少是工作區(qū)的參與者。下載報表文件步驟:(1)在在線PowerBI服務(wù)中,打開要下載的報表??梢栽凇伴喿x”視圖或“編輯”視圖中下載報表。(2)在頂部菜單欄中,選擇“文件”→“下載此文件”選項。(3)在彈出的下載內(nèi)容提示框中,選擇所需的下載類型??梢赃x擇下載包含數(shù)據(jù)的報表,或者下載包含實時數(shù)據(jù)連接的報表。選擇一種模式,并單擊“下載”按鈕開始下載,6.2下載報表文件122在PowerBIDesktop中,可以將報表從本地計算機發(fā)布到PowerBI服務(wù)。當然PowerBI報表也可以反向流動。需要注意的是,如果要下載擴展名為“pbix”的文件,下載的賬戶身份應(yīng)該至少是工作區(qū)的參與者。下載報表文件步驟:(1)在在線PowerBI服務(wù)中,打開要下載的報表??梢栽凇伴喿x”視圖或“編輯”視圖中下載報表。(2)在頂部菜單欄中,選擇“文件”→“下載此文件”選項。(3)在彈出的下載內(nèi)容提示框中,選擇所需的下載類型??梢赃x擇下載包含數(shù)據(jù)的報表,或者下載包含實時數(shù)據(jù)連接的報表。選擇一種模式,并單擊“下載”按鈕開始下載。6.3下載數(shù)據(jù)集中的文件12312407使用指標報表與脫機工作注意事項查看使用指標報表使用情況指標說明
脫機工作注意事項數(shù)據(jù)可視化之數(shù)據(jù)看板篇通過指標報表,閱讀者可以發(fā)現(xiàn)誰正在組織中使用這些報表,以及了解如何使用,還可以展示系統(tǒng)的性能情況。使用指標報表的先決條件,主要有如下三點。(1)需要有PowerBIPro或PremiumPerUser(PPU)許可證才能運行和訪問使用指標數(shù)據(jù)。(2)如果訪問報表的使用指標,則必須有權(quán)編輯該報表。(3)PowerBI管理員必須已啟用內(nèi)容創(chuàng)建者的使用情況指標。7.1查看使用指標報表125當首次執(zhí)行此操作時,會創(chuàng)建使用指標報表,并在創(chuàng)建完成后顯示“使用指標準備就緒”提示框。如果查看結(jié)果,則單擊“查看使用指標”按鈕。第一次執(zhí)行此操作時,可能會打開舊的使用指標報表。如果要顯示改進的使用指標報表,則在右上角將“啟用新的使用情況報表”的開關(guān)切換為“開”。7.2查看使用指標報表1267.3使用情況指標說明1277.4創(chuàng)建使用情況指標報表128根據(jù)“使用指標報表”數(shù)據(jù)集,可以在PowerBIDesktop中創(chuàng)建使用情況指標報表。如果要建立與“使用情況指標報表”數(shù)據(jù)集的連接,并創(chuàng)建自己的報表,則必須登錄PowerBIDesktop中的PowerBI服務(wù),具體操作如下。(1)打開PowerBIDesktop。(2)如果未登錄PowerBI服務(wù),選擇“文件”→“登錄”選項。(3)如果需要連接到“使用指標報表”數(shù)據(jù)集,則在“主頁”選項卡中選擇“獲取數(shù)據(jù)”→“更多”選項。(4)在“獲取數(shù)據(jù)”對話框中,選擇“PowerPlatform”→“PowerBI數(shù)據(jù)集”選項,并單擊“連接”按鈕。(5)滾動找到所需數(shù)據(jù)集,或者在搜索框中輸入“使用指標”。(6)在“工作區(qū)”列確認已選擇了正確數(shù)據(jù)集,單擊“創(chuàng)建”按鈕。(7)在PowerBIDesktop中選擇“可視化”→“字段”列表,該列表提供了對所選數(shù)據(jù)集中的表、列和度量值的訪問權(quán)限。(8)創(chuàng)建和共享自定義使用報表。7.5創(chuàng)建使用情況指標報表129(1)在打開下載的文件時,始終使用最新版本的PowerBIDesktop。在PowerBIDesktop的非當前版本中可能無法打開下載的擴展名為“pbix”的文件。例如,無法在不支持信息保護的PowerBIDesktop版本中打開下載的擴展名為“pbix”的文件。(2)如果管理員已關(guān)閉數(shù)據(jù)下載功能,則此功能在PowerBI服務(wù)中將不可見。(3)如果多次下載相同的擴展名為“pbix”的文件,則擴展名為“pbix”的文件中的SecurityBindings文件部分每次都會被更改。7.6脫機工作與注意事項130思考題(1)按鈕的狀態(tài)有哪幾種?請自行完成頁面導(dǎo)航按鈕示例,并采用按鈕自定義設(shè)置。(2)切片器通常在哪些場合下使用比較合適?請自行完成切片器的示例。(3)請自行采集一家企業(yè)的3年財務(wù)數(shù)據(jù),并制作一個完整的數(shù)據(jù)看板,需要包含但不限于償債能力分析、盈利能力分析、營運能力分析和發(fā)展能力分析等,對該公司進行綜合分析與業(yè)績評價,幫助企業(yè)管理者了解企業(yè)管理中的問題與趨勢。131第8章數(shù)據(jù)可視化之Matplotlib篇商務(wù)智能與數(shù)據(jù)可視化分析基礎(chǔ)133本章內(nèi)容Matplotlib概述與安裝Matplotlib繪制圖形
繪制線行圖繪制散點圖繪制等高線圖繪制三維圖13401Matplotlib概述與安裝
Matplotlib概述
Matplotlib安裝數(shù)據(jù)可視化之Matplotlib篇1.1Matplotlib概述Matplotlib是一個基于Python的2D繪圖庫工具包,其提供了豐富的數(shù)據(jù)繪圖工具,主要用于繪制一些統(tǒng)計圖形。135安裝并引入必要的庫Matplotlib的導(dǎo)入:!pipinstallnumpy==1.16.0!pipinstallpandas==0.25.0!pipinstallmatplotlib==3.1.0importnumpyasnpimportmatplotlibasmplimportmatplotlib.pyplotasplt設(shè)置樣式plt.style.use('classic')1.2Matplotlib安裝136如何展示圖像
Matplotlib有三個適用的場景,分別是是在腳本中使用Matplotlib,在IPython終端中,以及在IPythonnotebook中。
在腳本中繪圖#-------file:myplot.py------importmatplotlib.pyplotaspltimportnumpyasnpx=np.linspace(0,10,100)plt.plot(x,np.sin(x))plt.plot(x,np.cos(x))plt.show()從命令行提示符運行該腳本,顯示圖形$pythonmyplot.py1.3Matplotlib安裝與基礎(chǔ)設(shè)置137在IPythonshell中繪圖
ipython之后使用%matplotlib的命令:
在IPythonnotebook中繪圖
IPythonnotebook是一種基于瀏覽器的交互式數(shù)據(jù)分析工具,可以將敘事、代碼、圖形、HTML元素和更多的內(nèi)容結(jié)合到一個可執(zhí)行文檔中。
可以使用%matplotlib命令在IPython筆記本中交互繪圖,并以類似于IPythonshell的方式工作。
1.4Matplotlib安裝與基礎(chǔ)設(shè)置138
在Ipythonnotebook中,可以直接嵌入圖形,有兩個命令:
%matplotlibnotebook將會導(dǎo)致在notebook中嵌入互動的圖像。
%matplotlibinline將會導(dǎo)致在notebook中嵌入靜態(tài)的圖像。
通常使用%matplotlibinline:
%matplotlibinlinex=np.linspace(0,10,100)fig=plt.figure()plt.plot(x,np.sin(x),'-')plt.plot(x,np.cos(x),'--')
保存圖形
Matplotlib里可使用savefig()命令來保存一個圖形。
fig.savefig('my_figure.png')1.5Matplotlib安裝與基礎(chǔ)設(shè)置139繪制線形圖代碼示例:
%matplotlibinline
importmatplotlib.pyplotasplt
plt.style.use('seaborn-whitegrid')
importnumpyasnp
fig=plt.figure()
ax=plt.axes()
x=np.linspace(0,10,1000)
ax.plot(x,np.sin(x))1.6Matplotlib繪制線形圖140figure對象與Axes軸域的使用
fig=plt.figure()#返回Figure對象
ax1=fig.add_axes([0.1,0.3,0.7,0.7])#添加一個軸域
ax2=fig.add_axes([0.3,0.5,0.3,0.3])#四個參數(shù)為左下、寬高對整體figure大小
plt.plot(np.arange(3))#在該畫布區(qū)域繪圖
plt.show()調(diào)整圖形:線條的顏色和風(fēng)格#通過顏色名稱來指定顏色plt.plot(x,np.sin(x-0),color='blue’)圖形的標簽importnumpyasnpt=np.arange(0.,5.,0.2)plt.plot(t,t,'r--',label='y=t’)plt.plot(t,t**2,'bs',label='y=t^2’)plt.plot(t,t**3,'g^',label='y=t^3’)plt.xlabel("Xvalues")plt.ylabel("Yvalues")plt.legend()plt.show()1.7Matplotlib的對象和屬性141標簽的設(shè)置plt.plot(x,np.sin(x),'-g',label='sin(x)’)plt.plot(x,np.cos(x),':b',label='cos(x)’)plt.axis('equal’)plt.legend()1.8Matplotlib的對象和屬性142散點圖也叫X-Y圖,它將所有的數(shù)據(jù)以點的形式展現(xiàn)在直角坐標系上,以顯示變量之間的相互影響程度,點的位置由變量的數(shù)值決定。%matplotlibinlineimportmatplotlib.pyplotaspltplt.style.use('seaborn-whitegrid‘)importnumpyasnpx=np.linspace(0,10,30)y=np.sin(x)plt.plot(x,y,'o',color='black')1.9Matplotlib繪制簡單的散點圖143?用plt.scatter來繪制散點圖plt.scatter函數(shù)原型:plt.scatter(x,y,s=None,c=None,marker=None,cmap=None,
norm=None,vmin=None,vmax=None,alpha=None,linewidths=None,verts=None,edgecolors=None,
hold=None,data=None,**kwargs)
plt.scatter與plt.plot的主要區(qū)別是,它可以用來創(chuàng)建散點圖,
其中每個點的屬性(大小、顏色、邊緣顏色等)可以單獨控制或映射到數(shù)據(jù)。
1.10Matplotlib繪制簡單的散點圖144plt.contour函數(shù)來創(chuàng)建等高線圖,需要三個參數(shù):一個x值的網(wǎng)格,一個y值的網(wǎng)格,以及一個z值的網(wǎng)格。x和y值表示圖上的位置,z值將用等值線表示。使用np.meshgrid函數(shù),從一維數(shù)組中構(gòu)建二維網(wǎng)格:x=np.linspace(0,5,50)y=np.linspace(0,5,40)X,Y=np.meshgrid(x,y)Z=f(X,Y)plt.contour(X,Y,Z,colors='black')1.11Matplotlib繪制等高線圖145三維圖:#導(dǎo)入mplot3d工具包frommpl_toolkitsimportmplot3d%matplotlibinlineimportnumpyasnpimportmatplotlib.pyplotasplt通過關(guān)鍵字projection='3d'創(chuàng)建三維坐標軸:
fig=plt.figure()ax=plt.axes(projection='3d')1.12Matplotlib中的三維圖146三維的點和線
最基本的三維圖是散點圖的線或集合創(chuàng)建的組(x,y,z)三元組,可用ax.plot3D和ax.scatter3D函數(shù)實現(xiàn)。
ax=plt.axes(projection='3d’)
#Dataforathree-dimensionalline
zline=np.linspace(0,15,1000)
xline=np.sin(zline)
yline=np.cos(zline)
ax.plot3D(xline,yline,zline,'gray’)
#Dataforthree-dimensionalscatteredpoints
zdata=15*np.random.random(100)
xdata=np.sin(zdata)+0.1*np.random.randn(100)
ydata=np.cos(zdata)+0.1*np.random.randn(100)
ax.scatter3D(xdata,ydata,zdata,c=zdata,cmap='Greens');1.13Matplotlib中的三維圖147三維輪廓圖三維正弦函數(shù)的三維輪廓圖:
deff(x,y):returnnp.sin(np.sqrt(x**2+y**2))x=np.linspace(-6,6,30)y=np.linspace(-6,6,30)X,Y=np.meshgrid(x,y)Z=f(X,Y)fig=plt.figure()ax=plt.axes(projection='3d')ax.contour3D(X,Y,Z,50,cmap='binary')ax.set_xlabel('x')ax.set_ylabel('y')ax.set_zlabel('z');1.14Matplotlib中的三維圖148設(shè)置高程和方位角有時默認的視角不是最優(yōu)的,可以使用view_init()函數(shù)來設(shè)置高程和方位角。
ax.view_init(60,35)fig1.14Matplotlib中的三維圖149線框圖fig=plt.figure()ax=plt.axes(projection='3d')ax.plot_wireframe(X,Y,Z,color='black')ax.set_title('wireframe');1.15Matplotlib中的三維圖150曲面圖ax=plt.axes(projection='3d')ax.plot_surface(X,Y,Z
,rstride=1
,cstride=1
,cmap='viridis’
,edgecolor='none')ax.set_title('surface');1.15Matplotlib中的三維圖151思考題(1)在Matplotlib中,散點圖的適用范圍是什么?(2)通過Matplotlib,繪制線
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療銷售咨詢合同范本
- 供應(yīng)商尾款合同范本
- 北京拆遷合同范本
- 單人旅游合同范本
- 單位郊區(qū)租房合同范本
- 丟車包賠協(xié)議合同范本
- 單位電線更換維修合同范例
- 醫(yī)藥調(diào)查項目合同范本
- 出錢經(jīng)營合同范本
- 農(nóng)業(yè)種植股合同范本
- 課件:認識鏡頭語言1:運鏡方式和常用的鏡頭術(shù)語
- (完整版)三年級上冊口算題卡1400道
- 淘寶客服轉(zhuǎn)正述職報告
- 提升電子商務(wù)的發(fā)展邏輯
- 提升醫(yī)療質(zhì)量減少醫(yī)療糾紛
- (完整)特種設(shè)備專項應(yīng)急預(yù)案
- 工程設(shè)計項目擬投入設(shè)計人員及設(shè)備
- 人教版五年級數(shù)學(xué)下冊課后作業(yè)設(shè)計 2.4質(zhì)數(shù)和合數(shù)(解析版)
- 高??蒲泄芾韻徝嬖噯栴}及回答
- 小學(xué)體質(zhì)測試標準
- 機床安全操作培訓(xùn)課件
評論
0/150
提交評論