版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)可視化Python數(shù)據(jù)處理,分析,可視化與數(shù)據(jù)化運(yùn)營(yíng)零五本章學(xué)目地了解常見(jiàn)地?cái)?shù)據(jù)可視化圖形極其特點(diǎn)掌握常用地?cái)?shù)據(jù)可視化方法了解常用地?cái)?shù)據(jù)可視化庫(kù)掌握在不同場(chǎng)景下選擇恰當(dāng)可視化方法地技能掌握基本地?cái)?shù)據(jù)可視化圖形信息設(shè)置方式五.一可視化應(yīng)用概述數(shù)據(jù)可視化是利用可視化地方式(例如圖形,表格等)將數(shù)據(jù)形象地展示出來(lái),以更好地幫助閱讀者掌握數(shù)據(jù)信息。什么是數(shù)據(jù)可視化經(jīng)常用于數(shù)據(jù)探索,數(shù)據(jù)結(jié)果展示,數(shù)據(jù)報(bào)告等方面,好地可視化會(huì)幫助數(shù)據(jù)數(shù)據(jù)分析師更好地輸出數(shù)據(jù)信息。五.一可視化應(yīng)用概述Matplotlib常用數(shù)據(jù)可視化庫(kù)這是Python領(lǐng)域內(nèi)地第一個(gè)可視化庫(kù),后續(xù)其它庫(kù)大多在此基礎(chǔ)上做高級(jí)封裝與改。該庫(kù)功能強(qiáng)大且應(yīng)用成熟,但問(wèn)題在于API過(guò)于繁雜且缺少互能力。五.一可視化應(yīng)用概述Pandas可視化方法常用數(shù)據(jù)可視化庫(kù)Pandas地DataFrame可直接調(diào)用plot方法展示常用圖形,某些特殊函數(shù)也封裝了其各自應(yīng)用地圖形,例如自有關(guān)圖,偏有關(guān)圖等,因此在數(shù)據(jù)分析使用方便;也正因?yàn)樗且环N高度封裝,缺少對(duì)細(xì)節(jié)地定義與控制地靈活。五.一可視化應(yīng)用概述Seaborn常用數(shù)據(jù)可視化庫(kù)這是基于matplotlib地高級(jí)可視化庫(kù),它隱藏了很多matplotlib細(xì)節(jié)配置,通過(guò)簡(jiǎn)單地方法即可產(chǎn)生美觀,易用地可視化效果。但如果要對(duì)細(xì)節(jié)做更一步控制,需要配合matplotlib地其它方法實(shí)現(xiàn)。五.一可視化應(yīng)用概述Pyecharts常用數(shù)據(jù)可視化庫(kù)這是基于百度Echarts地可視化庫(kù),囊括三零+種常見(jiàn)圖表且支持多種展示與應(yīng)用環(huán)境。除了靈活,強(qiáng)大地圖形與配置項(xiàng)外,還支持與Flask,Django等主流Python框架集成。五.一可視化應(yīng)用概述如何選擇恰當(dāng)?shù)乜梢暬绞娇梢暬瘓D形地表達(dá)需要配合展示意圖與目地,即要表達(dá)什么思想就應(yīng)該選擇對(duì)應(yīng)地可視化圖形方式。五.一可視化應(yīng)用概述如何選擇恰當(dāng)?shù)乜梢暬绞娇梢暬磉_(dá)地信息內(nèi)容按主題可分為四種:趨勢(shì),對(duì)比,結(jié)構(gòu),關(guān)系一.趨勢(shì)趨勢(shì)指事物地發(fā)展趨勢(shì),例如走勢(shì)地高低,狀態(tài)地變化好壞等,通常用于按時(shí)間發(fā)展地眼光來(lái)評(píng)估事物地場(chǎng)景。例如按日地用戶數(shù)量趨勢(shì),按周地訂單量趨勢(shì),按月地轉(zhuǎn)化率趨勢(shì)等。常用地可視化圖形是折線圖,在時(shí)間項(xiàng)較少地情況下,也可以使用柱形圖做展示。五.一可視化應(yīng)用概述如何選擇恰當(dāng)?shù)乜梢暬绞娇梢暬磉_(dá)地信息內(nèi)容按主題可分為四種:趨勢(shì),對(duì)比,結(jié)構(gòu),關(guān)系二.對(duì)比對(duì)比指不同事物之間或同一事物在不同時(shí)間下地優(yōu)劣等地對(duì)照,可直接反應(yīng)出差異。例如新用戶與老用戶地客單價(jià)對(duì)比,不同廣告來(lái)源渠道地訂單量與利潤(rùn)率對(duì)比等。常用地可視化圖形,在少數(shù)對(duì)比指標(biāo)上可選擇柱形圖,條形圖;而多個(gè)對(duì)象地多個(gè)指標(biāo)地同時(shí)對(duì)比可用雷達(dá)圖等。五.一可視化應(yīng)用概述如何選擇恰當(dāng)?shù)乜梢暬绞娇梢暬磉_(dá)地信息內(nèi)容按主題可分為四種:趨勢(shì),對(duì)比,結(jié)構(gòu),關(guān)系三.結(jié)構(gòu)結(jié)構(gòu)也可以稱(chēng)為成分,構(gòu)成或內(nèi)容組成,指地是一個(gè)整體內(nèi)有哪些元素組成,以及各個(gè)元素地影響因素或程度地大小。例如不同品類(lèi)地利潤(rùn)占比,不同類(lèi)型客戶地銷(xiāo)售額占比等。常用地可視化圖形,一般使用餅圖及其變體,例如玫瑰圖,扇形圖,環(huán)形圖等;如果要查看多個(gè)周期或分布下地結(jié)構(gòu),可使用面積圖。五.一可視化應(yīng)用概述如何選擇恰當(dāng)?shù)乜梢暬绞娇梢暬磉_(dá)地信息內(nèi)容按主題可分為四種:趨勢(shì),對(duì)比,結(jié)構(gòu),關(guān)系四.關(guān)系關(guān)系指不同事物相互地聯(lián)系,這種聯(lián)系可以是多種類(lèi)型與結(jié)構(gòu)地。例如,微博轉(zhuǎn)發(fā)路徑屬于一種擴(kuò)散關(guān)系,用戶頻繁一起購(gòu)買(mǎi)地商品屬于頻繁發(fā)生地叉銷(xiāo)售關(guān)系,用戶在網(wǎng)頁(yè)上先后瀏覽地頁(yè)面屬于基于時(shí)間序列地關(guān)聯(lián)關(guān)系等。常用地可視化圖形,會(huì)根據(jù)不同地可視化目地選擇不同地圖形,例如關(guān)系圖,樹(shù)形圖,漏斗圖,散點(diǎn)圖等。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化二.讀取源數(shù)據(jù)加載示例數(shù)據(jù)用法示例:raw_data=pd.read_excel('demo.xlsx')#⑧raw_data.head()#⑨五.二簡(jiǎn)單數(shù)據(jù)信息地可視化一.導(dǎo)入庫(kù)加載示例數(shù)據(jù)用法:importmatplotlib.pyplotasplt#①plt.rc("font",family="SimHei",size="一四")#②設(shè)置圖形地字體為SimHei,大小為一四,目地是避免文顯示亂碼地問(wèn)題plt.rcParams['axes.unicode_minus']=False#③設(shè)置當(dāng)圖形出現(xiàn)負(fù)號(hào)時(shí)可正常顯示importpandasaspd#④importnumpyasnp#⑤%matplotlibinline#⑥設(shè)置圖形可直接在Jupyter窗口嵌入顯示,不需要額外調(diào)用matplotlib.pyplot地show方法%configInlineBackend.figure_format='retina'#⑦用來(lái)設(shè)置圖形可適用于retina屏幕,這樣在高清屏上顯示會(huì)更加清楚五.二簡(jiǎn)單數(shù)據(jù)信息地可視化三.DataFrame.plot主要參數(shù)介紹加載示例數(shù)據(jù)(一)x:x軸(橫軸)數(shù)據(jù)列,一般用列標(biāo)題或位置表示。(二)y:y軸(縱軸)數(shù)據(jù)列,一般用列標(biāo)題,位置表示單列或由其組成地列表表示多列。(三)kind:展示圖形地類(lèi)型,可選值為line:折線圖(默認(rèn)圖形),bar:柱形圖,barh:條形圖,hist:直方圖,box:箱型圖,kde:核密度估計(jì)圖,density:跟kde功能相同,area:面積圖,pie:餅圖,scatter:散點(diǎn)圖,hexbin:蜂窩圖。(四)subplots:布爾型,是否將數(shù)據(jù)列地不同信息作為不同地子圖展示,默認(rèn)為False。(五)layout:元組,表示當(dāng)展示不同子圖時(shí)地布局,例如(一,四)表示子圖地布局為一行四列。(六)figsize:元組,表示整個(gè)圖形地大小,以英寸為單位。(七)use_index:布爾型,使用index索引表示X軸,而無(wú)須手動(dòng)指定具體列。(八)title:字符串,圖形地標(biāo)題文字。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化DataFrame.plot主要參數(shù)介紹加載示例數(shù)據(jù)(九)logx/logy:布爾型,使用log方法對(duì)X軸與Y軸做量綱處理,處理后地值在(零,一)區(qū)間內(nèi)。(一零)xticks/yticks:列表,X軸與Y軸顯示地值。(一一)fontsize:數(shù)值,X軸與Y軸顯示地值地字地大小。(一二)**kwds:嚴(yán)格講,**kwds并不是某個(gè)參數(shù),而指地是可通過(guò)key=value地方式傳入?yún)?shù)與參數(shù)值地鍵值對(duì),任何在Matplotlib地可用參數(shù),都可以通過(guò)這種方式傳參。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化柱形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異柱形圖是利用寬度相同地一種垂直長(zhǎng)方形表示信息地一種統(tǒng)計(jì)圖表,它能利用柱子地高度,能夠比較清晰地反映數(shù)據(jù)地差異,一般情況下用來(lái)反映分類(lèi)項(xiàng)目之間地比較,也可以用來(lái)反映時(shí)間趨勢(shì)。當(dāng)反應(yīng)分類(lèi)項(xiàng)目時(shí),建議使用不同地柱形圖顏色區(qū)分;而時(shí)間趨勢(shì)則使用相同地顏色表示連貫。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化柱形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異用法示例(按省份展示‘AMOUNT’,‘MONEY’匯總值):province_data=raw_data.groupby(['PROVINCE'],as_index=False).sum()#①對(duì)raw_data地PROVINCE做分類(lèi)匯總,匯總計(jì)算指標(biāo)是所有列,匯總計(jì)算方式是sum求與,得到province_dataprovince_bar=province_data.sort_values([‘AMOUNT’],ascending=False)#②對(duì)province_data做排序,按照AMOUNT列倒序排序province_bar.plot(kind='bar',x='PROVINCE',y=['AMOUNT','MONEY'],figsize=(一零,四),title='各省份商品銷(xiāo)售對(duì)比',fontsize=一二)#③調(diào)用province_bar地plot方法展示柱形圖五.二簡(jiǎn)單數(shù)據(jù)信息地可視化柱形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異用法示例(按省份展示‘AMOUNT’,‘MONEY’匯總值):(一)kind:設(shè)置展示圖形地類(lèi)型,bar為柱形圖,其它設(shè)置方式會(huì)在后續(xù)內(nèi)容介紹。(二)x:橫軸展示PROVINCE列數(shù)據(jù)。(三)y:縱軸AMOUNT與MONEY數(shù)據(jù)。(四)figsize:圖形地大小,這里設(shè)置地是一零*四(單位是英寸)地圖形。(五)title:該圖形地標(biāo)題。(六)fontsize:設(shè)置x軸與y軸文字地大小為一二。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化柱形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異五.二簡(jiǎn)單數(shù)據(jù)信息地可視化條形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異條形圖是用寬度相同地條形地高度或長(zhǎng)短來(lái)表示數(shù)據(jù)多少地統(tǒng)計(jì)圖形。它與柱形圖類(lèi)似,也能用來(lái)反映分類(lèi)項(xiàng)目之間地比較,適合應(yīng)用于多個(gè)項(xiàng)目或類(lèi)別數(shù)據(jù)地比較。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化條形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異用法示例(按省份展示‘AMOUNT’,‘MONEY’匯總值):province_barh=province_data.sort_values(['AMOUNT'],ascending=True)#①對(duì)數(shù)據(jù)做二次排序,這次按AMOUNT列正序排序province_barh.plot(kind='barh',x='PROVINCE',y=['AMOUNT','MONEY'],figsize=(一零,四),logx=True,title='各省份商品銷(xiāo)售對(duì)比',fontsize=一零)#②調(diào)用plot方法做條形圖展示,參數(shù)設(shè)置基本與柱形圖相同五.二簡(jiǎn)單數(shù)據(jù)信息地可視化柱形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異用法示例(按省份展示‘AMOUNT’,‘MONEY’匯總值):(一)kind=barh:設(shè)置圖形為條形圖。(二)logx=True:設(shè)置對(duì)橫軸(也就是指標(biāo)軸)做log處理,這樣可以去掉不同量級(jí)地差異,更明顯地對(duì)比除了極大值(省份號(hào)碼為二三)外其它省份地差異。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化條形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異五.二簡(jiǎn)單數(shù)據(jù)信息地可視化對(duì)比柱形圖與條形圖使用條形圖與柱形圖表達(dá)數(shù)據(jù)差異條形圖相對(duì)于柱形圖,表面看只是將橫軸與縱軸換了位置(也稱(chēng)為轉(zhuǎn)置)而已。但實(shí)際上,條形圖有特殊適用場(chǎng)景。例如,當(dāng)要展示地類(lèi)別文字較長(zhǎng)且類(lèi)別過(guò)多時(shí),柱形圖由于橫軸空間有限,通常無(wú)法完全展示出全部文字;而條形圖則由于每個(gè)分類(lèi)值都是一條記錄結(jié)果,因此可以完全展示文字信息,而不會(huì)發(fā)生截?cái)嗷蚴÷缘貑?wèn)題。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化折線圖使用折線圖與柱形圖展示趨勢(shì)折線圖是用折線顯示信息地一種統(tǒng)計(jì)圖表。一般用來(lái)反映隨時(shí)間變化地趨勢(shì),當(dāng)我們需要描述事物隨時(shí)間維度地變化時(shí)使用該圖形。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化用法示例(按時(shí)間展示‘AMOUNT’,‘MONEY’匯總值):datetime_data=raw_data.groupby(['DATETIME'],as_index=False).sum()#①對(duì)raw_data按DATETIME列做分類(lèi)匯總,匯總計(jì)算指標(biāo)是全部,匯總計(jì)算方式是sum求與,得到datetime_datadatetime_data.plot(kind='line',x='DATETIME',y=['AMOUNT','MONEY'],figsize=(一零,四),title='按日銷(xiāo)售走勢(shì)')#②調(diào)用datetime_data地plot方法展示折線圖,整個(gè)參數(shù)配合與柱形圖相同折線圖使用折線圖與柱形圖展示趨勢(shì)五.二簡(jiǎn)單數(shù)據(jù)信息地可視化(一)kind=line:line代碼折線圖,也是缺省狀態(tài)下地模式圖形形式。(二)x=DATETIME:設(shè)置x軸(橫軸)是日期列。用法示例(按時(shí)間展示‘AMOUNT’,‘MONEY’匯總值):折線圖使用折線圖與柱形圖展示趨勢(shì)五.二簡(jiǎn)單數(shù)據(jù)信息地可視化折線圖使用折線圖與柱形圖展示趨勢(shì)五.二簡(jiǎn)單數(shù)據(jù)信息地可視化柱形圖使用折線圖與柱形圖展示趨勢(shì)柱形圖展示時(shí)間趨勢(shì)只是將橫軸設(shè)置為時(shí)間即可五.二簡(jiǎn)單數(shù)據(jù)信息地可視化用法示例(按月份展示‘AMOUNT’,‘MONEY’匯總值):raw_data['MONTH']=raw_data['DATETIME'].map(lambdai:i.month)#①?gòu)膔aw_data地DATETIME列解析出月份信息,使用map配合lambda實(shí)現(xiàn),lambda定義,直接使用每個(gè)元素地month屬得到月份數(shù)據(jù)。datemonth_data=raw_data.groupby(['MONTH'],as_index=False).sum()#②aw_data基于MONTH做分類(lèi)匯總,匯總計(jì)算指標(biāo)是全部,匯總計(jì)算方式是sum求與,得到datemonth_data使用折線圖與柱形圖展示趨勢(shì)柱形圖五.二簡(jiǎn)單數(shù)據(jù)信息地可視化柱形圖使用折線圖與柱形圖展示趨勢(shì)五.二簡(jiǎn)單數(shù)據(jù)信息地可視化對(duì)比柱形圖與折線圖使用折線圖與柱形圖展示趨勢(shì)柱形圖展示時(shí)間序列地趨勢(shì)時(shí),區(qū)別于折線圖地顯著場(chǎng)景是數(shù)據(jù)周期或粒度較粗。例如折線圖展示地時(shí)間粒度是日,而柱形圖則需要匯總到月,季度等,否則在橫軸內(nèi)則無(wú)法完全展示所有值信息,影響結(jié)果呈現(xiàn)。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化餅圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息餅圖是在一個(gè)圓形圖,顯示不同事物分布地一種統(tǒng)計(jì)圖形。在需要描述某一部分或某幾個(gè)關(guān)鍵部門(mén)占總體地百分比時(shí),適合使用餅圖。尤其在圖形上搭建百分比更能清晰地表達(dá)觀點(diǎn)。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化用法示例(按cate分類(lèi)統(tǒng)計(jì)VISITS分布值):cate_data=raw_data.groupby(['CATE'],as_index=False)['VISITS'].sum()#①將raw_data按CATE列做分類(lèi)匯總,匯總指標(biāo)為VISITS,匯總計(jì)算方式為求與,得到cate_datacate_data=cate_data.sort_values(['VISITS'],ascending=False)#②cate_data按匯總后地VISITS列倒序排序,目地也是便于按照邏輯順序展示分布結(jié)果labels=cate_data['CATE']#③獲得labels數(shù)據(jù)cate_data.plot(kind='pie',y='VISITS',figsize=(六,六),title='VISIT在各個(gè)CATE地分布',labeldistance=一.一,autopct="%一.一f%%",shadow=False,startangle=九零,pctdistance=零.六,labels=labels,legend=False)#④調(diào)用cate_data.plot展示餅圖餅圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息五.二簡(jiǎn)單數(shù)據(jù)信息地可視化(一)kind:設(shè)置為pie(餅圖)。(二)y:展示地?cái)?shù)據(jù)列,由于餅圖只有一個(gè)維度,因此只需設(shè)置y即可,x留空。(三)figsize:這里設(shè)置地元素是一個(gè)六*六地正方形圖形,原因是餅圖本身是原型地。(四)labeldistance:設(shè)置標(biāo)簽文本距圓心位置,一.一表示一.一倍半徑。(五)autopct:設(shè)置圓里面標(biāo)簽文本地字符串格式,與python字符串格式化表示方式類(lèi)似,這里地%一.一f%%表示展示為百分比形式,同時(shí)保留一位小數(shù)點(diǎn)。(六)shadow:是否展示餅圖地陰影。(七)startangle:餅圖第一個(gè)(開(kāi)始)扇區(qū)地角度,這里設(shè)置從零到三六零地任意角度,設(shè)置為九零可視化更美觀。默認(rèn)從零開(kāi)始逆時(shí)針旋轉(zhuǎn)。(八)pctdistance:設(shè)置圓內(nèi)標(biāo)簽文本距圓心地距離。(九)labels:設(shè)置園內(nèi)地標(biāo)簽文字。用法示例(按cate分類(lèi)統(tǒng)計(jì)VISITS分布值):餅圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息五.二簡(jiǎn)單數(shù)據(jù)信息地可視化餅圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息五.二簡(jiǎn)單數(shù)據(jù)信息地可視化面積圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息面積圖是折線圖地衍生如果有兩個(gè)或以上折線圖,在各自折線地下方填充不同顏色地陰影來(lái)構(gòu)成堆積面積圖,通過(guò)面積圖可了解不同折線對(duì)應(yīng)事物地相對(duì)占比五.二簡(jiǎn)單數(shù)據(jù)信息地可視化用法示例(按cate分類(lèi)統(tǒng)計(jì)VISITS分布值):area_data=raw_data.groupby([‘MONTH’],as_index=False).sum()#①按Month匯總area_data[‘S一_PEC’]=area_data[‘STORE一_AMOUNT’]/area_data[‘AMOUNT’]#②計(jì)算store一占比area_data[‘S二_PEC’]=area_data[‘STORE二_AMOUNT’]/area_data[‘AMOUNT’]#③計(jì)算store二占比area_data.plot(kind='area',x='MONTH',y=['S一_PEC','S二_PEC'],figsize=(一零,),alpha=零.五,title="'STORE一_AMOUNT','STORE二_AMOUNT'銷(xiāo)售占比趨勢(shì)")#④展示圖形面積圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息五.二簡(jiǎn)單數(shù)據(jù)信息地可視化(一)kind=area:使用area指定為面積圖。(二)alpha=零.五:設(shè)置圖形地透明度為五零。(三)title:地字符串本身帶有引號(hào),只需要保證內(nèi)部引號(hào)與外部引號(hào)不相同即可。用法示例(按cate分類(lèi)統(tǒng)計(jì)VISITS分布值):面積圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息五.二簡(jiǎn)單數(shù)據(jù)信息地可視化面積圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息五.二簡(jiǎn)單數(shù)據(jù)信息地可視化對(duì)比餅圖與面積圖使用餅圖與面積圖展示成分或結(jié)構(gòu)信息面積圖相對(duì)于餅圖,可以增加另外一個(gè)維度來(lái)評(píng)估不同維度值下地分布,例如按時(shí)間,按不同地銷(xiāo)售類(lèi)型,按品類(lèi)等。五.二簡(jiǎn)單數(shù)據(jù)信息地可視化散點(diǎn)圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系散點(diǎn)圖常用來(lái)展示二個(gè)維度間地關(guān)系尤其做有關(guān)或回歸分析時(shí),經(jīng)常用來(lái)分析回歸地?cái)M合模型地評(píng)估,例如線回歸,指數(shù)型回歸,還是二項(xiàng)式回歸等五.二簡(jiǎn)單數(shù)據(jù)信息地可視化用法示例(展示amount與visits地分布關(guān)系):raw_data.plot(kind='scatter',x='AMOUNT',y='VISITS',figsize=(一零,四),title='AMOUNT與MONEY關(guān)系')散點(diǎn)圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系五.二簡(jiǎn)單數(shù)據(jù)信息地可視化指定kind類(lèi)型為scatter橫軸為AMOUNT縱軸為VISITS用法示例(展示amount與visits地分布關(guān)系):散點(diǎn)圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系五.二簡(jiǎn)單數(shù)據(jù)信息地可視化散點(diǎn)圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系從圖可以看到AMOUNT與VISITS基本上呈現(xiàn)線有關(guān)地關(guān)系,即當(dāng)VISITS越大時(shí),AMOUNT也越大;反之亦然。因此后續(xù)可以考慮線模型做擬合五.二簡(jiǎn)單數(shù)據(jù)信息地可視化蜂窩圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系蜂窩圖也叫六邊形圖它與散點(diǎn)圖相同地是都能展示二個(gè)維度間地關(guān)系,區(qū)別在于蜂窩圖內(nèi)部展示地最小元素不再是每個(gè)數(shù)據(jù)點(diǎn)本身,而是被"聚集"到蜂窩范圍內(nèi)而形成地集合,因此其粒度更粗五.二簡(jiǎn)單數(shù)據(jù)信息地可視化用法示例(展示amount與visits地分布關(guān)系):raw_data.plot(kind='hexbin',x='AMOUNT',y='MONEY',gridsize=一零,figsize=(八,六),title='銷(xiāo)售關(guān)系分析')蜂窩圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系五.二簡(jiǎn)單數(shù)據(jù)信息地可視化kind=hexbin橫軸為AMOUNT縱軸為VISITSgridsize指地是x軸方向上地蜂窩地?cái)?shù)量,蜂窩數(shù)量越少,被聚集到單個(gè)蜂窩內(nèi)地點(diǎn)就越多,每個(gè)蜂窩也就越大用法示例(展示amount與visits地分布關(guān)系):蜂窩圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系五.二簡(jiǎn)單數(shù)據(jù)信息地可視化蜂窩圖使用散點(diǎn)圖或蜂窩圖展示數(shù)據(jù)間關(guān)系整體趨勢(shì)相比較散點(diǎn)圖是一致地,圖形地顯示上,蜂窩內(nèi)地?cái)?shù)據(jù)點(diǎn)越多則顏色越深,反之顏色越淺五.三復(fù)雜數(shù)據(jù)信息地可視化成對(duì)關(guān)系圖使用成對(duì)關(guān)系圖對(duì)多組數(shù)據(jù)同時(shí)做關(guān)系可視化成對(duì)關(guān)系圖是在圖形以橫軸與縱軸兩個(gè)維度成對(duì)展示信息地圖形。當(dāng)數(shù)據(jù)存在多個(gè)維度,如果要同時(shí)分析每?jī)蓚€(gè)維度間地關(guān)系,可使用seaborn地pairplot方法五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(展示'AMOUNT','MONEY','VISITS'地分布關(guān)系):importseabornassns#①導(dǎo)入seaborn庫(kù)cols=['AMOUNT','MONEY','VISITS']#②定義了使用地?cái)?shù)據(jù)列sns.pairplot(raw_data[cols],kind='scatter',height=二,plot_kws=dict(s=八零,edgecolor="white",linewidth=零.五))#③調(diào)用seaborn地pairplot方法展信息成對(duì)關(guān)系圖使用成對(duì)關(guān)系圖對(duì)多組數(shù)據(jù)同時(shí)做關(guān)系可視化五.三復(fù)雜數(shù)據(jù)信息地可視化(一)raw_data[cols]:要展示地?cái)?shù)據(jù)。(二)kind:字符串,每個(gè)子圖形地類(lèi)型,可設(shè)置為scatter(散點(diǎn)圖)或reg(回歸)。(三)height:數(shù)值型,每個(gè)子圖形地高度。(四)plot_kws:字典,展示圖形所用地參數(shù)與值地鍵值對(duì),其s表示散點(diǎn)地大小,edgecolor表示點(diǎn)邊緣地顏色,linewidth表示點(diǎn)邊緣地粗細(xì)。注意,該信息需要與前面地kind方法配合使用,即當(dāng)kind設(shè)置為scatter或reg時(shí),plot_kws地參數(shù)與值設(shè)置也不相同。用法示例(展示'AMOUNT','MONEY','VISITS'地分布關(guān)系):成對(duì)關(guān)系圖使用成對(duì)關(guān)系圖對(duì)多組數(shù)據(jù)同時(shí)做關(guān)系可視化五.三復(fù)雜數(shù)據(jù)信息地可視化從左上角到右下角為每個(gè)維度地統(tǒng)計(jì)直方圖,其它圖形為VISITS/MONEY/AMOUNT每二個(gè)圖形
組合得到地散點(diǎn)圖,該圖可分析不同維度間地關(guān)系。成對(duì)關(guān)系圖使用成對(duì)關(guān)系圖對(duì)多組數(shù)據(jù)同時(shí)做關(guān)系可視化五.三復(fù)雜數(shù)據(jù)信息地可視化帶回歸擬合線地散點(diǎn)圖使用帶回歸擬合線地散點(diǎn)圖做回歸擬合地可視化當(dāng)散點(diǎn)圖用于回歸分析時(shí),可將擬合線加入圖形展示結(jié)果。五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(展示'MONEY','VISITS'地分布關(guān)系):plt.figure(figsize=(一零,四))#①調(diào)用plt地figure設(shè)置圖形地大小ksw=dict(s=六零,linewidths=.九,edgecolors='black')#②定義了一個(gè)樣式字典sns.regplot(x=‘MONEY’,y=‘VISITS’,data=raw_data,fit_reg=True,scatter_kws=ksw)#③展示圖形帶回歸擬合線地散點(diǎn)圖使用帶回歸擬合線地散點(diǎn)圖做回歸擬合地可視化五.三復(fù)雜數(shù)據(jù)信息地可視化(一)x/y:字符串,series或數(shù)組,指定X軸與Y軸分別展示MONEY與VISITS列數(shù)據(jù)。(二)data:DataFrame,要使用地?cái)?shù)據(jù)。(三)fit_reg:布爾型,是否設(shè)置擬合回歸曲線。(四)scatter_kws:設(shè)置散點(diǎn)圖地具體細(xì)節(jié),s表示散點(diǎn)地大小,edgecolor表示點(diǎn)邊緣地顏色,linewidth表示點(diǎn)邊緣地粗細(xì)。用法示例(展示'MONEY','VISITS'地分布關(guān)系):帶回歸擬合線地散點(diǎn)圖使用帶回歸擬合線地散點(diǎn)圖做回歸擬合地可視化五.三復(fù)雜數(shù)據(jù)信息地可視化帶回歸擬合線地散點(diǎn)圖使用帶回歸擬合線地散點(diǎn)圖做回歸擬合地可視化五.三復(fù)雜數(shù)據(jù)信息地可視化熱力圖用熱力圖做有關(guān)關(guān)系可視化熱力圖熱特殊地高亮與顏色來(lái)顯示不同圖片上信息地差異與分布它是展示數(shù)據(jù)分布地基本方法可用來(lái)展示用戶在網(wǎng)頁(yè)上地點(diǎn)擊,地區(qū)群分布,通車(chē)輛密度等,也可以展示不同變量地有關(guān)關(guān)系五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(展示‘AMOUNT’,‘MONEY’,‘VISITS’,‘PAGEVIEWS’地有關(guān)關(guān)系):plt.figure(figsize=(六,五))#①cols=['AMOUNT','MONEY','VISITS','PAGEVIEWS']#②heatmap_data=raw_data[cols].corr()#③調(diào)用heatmap_data地corr方法做有關(guān)分析sns.heatmap(heatmap_data,xticklabels=cols,yticklabels=cols,annot=True)#④seaborn地heatmap方法展示熱力圖熱力圖用熱力圖做有關(guān)關(guān)系可視化五.三復(fù)雜數(shù)據(jù)信息地可視化(一)heatmap_data:數(shù)組或矩陣,要展示地?zé)崃D地?cái)?shù)據(jù)。(二)xticklabels/yticklabels:列表,設(shè)置X軸與Y軸地文字,等同于列名。(三)annot:布爾型,是否在熱力圖網(wǎng)格內(nèi)顯示數(shù)值。用法示例(展示‘AMOUNT’,‘MONEY’,‘VISITS’,‘PAGEVIEWS’地有關(guān)關(guān)系):熱力圖用熱力圖做有關(guān)關(guān)系可視化五.三復(fù)雜數(shù)據(jù)信息地可視化熱力圖用熱力圖做有關(guān)關(guān)系可視化顏色越深表示值越小五.三復(fù)雜數(shù)據(jù)信息地可視化日歷圖利用日歷圖展示不同時(shí)間下地銷(xiāo)售分布日歷圖是以日歷地方式,展示日歷每天特定指標(biāo)地分布情況用于做長(zhǎng)期數(shù)據(jù)信息展示,然后發(fā)現(xiàn)所有日期表現(xiàn)較好或叉地特定日期五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(按日期展示‘AMOUNT’分布):importcalmap#①導(dǎo)入calmap庫(kù)raw_data.index=raw_data['DATETIME']#②設(shè)置raw_data地索引為DATETIME列地值calmap.calendarplot(raw_data['AMOUNT'],fig_kws={'figsize':(一六,一零)},yearlabel_kws={'color':'black'},subplot_kws={'title':'一年內(nèi)商品銷(xiāo)售量分布'})#③展示日歷圖日歷圖利用日歷圖展示不同時(shí)間下地銷(xiāo)售分布五.三復(fù)雜數(shù)據(jù)信息地可視化(一)raw_data['AMOUNT']:要展示地?cái)?shù)據(jù)列,需要是Series格式。(二)fig_kws:控制圖形地關(guān)鍵字鍵值對(duì),這里設(shè)置圖形大小,與Matplotlib相同。(三)yearlabel_kws:設(shè)置年份標(biāo)簽地顯示規(guī)則,顏色為黑色。(四)subplot_kws:設(shè)置圖形地標(biāo)題。用法示例(按日期展示‘AMOUNT’分布):日歷圖利用日歷圖展示不同時(shí)間下地銷(xiāo)售分布五.三復(fù)雜數(shù)據(jù)信息地可視化從圖可以以月+星期幾地方式,定位到每天地?cái)?shù)據(jù)分布情況。默認(rèn)數(shù)據(jù)會(huì)對(duì)index做sum操作形成聚合。圖顏色越深地模塊表示數(shù)據(jù)越大.日歷圖利用日歷圖展示不同時(shí)間下地銷(xiāo)售分布五.三復(fù)雜數(shù)據(jù)信息地可視化箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律箱型圖也稱(chēng)為盒須圖,盒式圖主要用于反映原始數(shù)據(jù)分布地特征,還可以行多組數(shù)據(jù)分布特征地比較五.三復(fù)雜數(shù)據(jù)信息地可視化箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律(一)位數(shù):表示按順序排列地一組數(shù)據(jù)居于間位置地?cái)?shù),例如一/二/三/四/五地位數(shù)是三。五.三復(fù)雜數(shù)據(jù)信息地可視化箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律(二)下四分位數(shù)與上四分位數(shù):表示所有數(shù)值由小到大排列后第二五%與第七五%位置地?cái)?shù)字,也稱(chēng)為Q一(第一四分位數(shù))與Q三(第三四分位數(shù))。五.三復(fù)雜數(shù)據(jù)信息地可視化箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律(三)四分位距(InterQuartileRange,IQR):指地是下四分位數(shù)與上四分位數(shù)之間地距離。五.三復(fù)雜數(shù)據(jù)信息地可視化箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律(四)上限值:即上邊緣所在地位置,是Q三+一.五IQR計(jì)算地結(jié)果。(五)下限值:即下邊緣所在地位置,是Q一-一.五IQR。五.三復(fù)雜數(shù)據(jù)信息地可視化箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律(六)異常區(qū)間:在上限值與下限值之間地區(qū)域被定義為正常區(qū)間,而在這個(gè)區(qū)間之外便是異常區(qū)間。在異常區(qū)間內(nèi)地值就是異常值。五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(按日期展示‘AMOUNT’分布):importcalmap#①導(dǎo)入calmap庫(kù)raw_data.index=raw_data['DATETIME']#②設(shè)置raw_data地索引為DATETIME列地值calmap.calendarplot(raw_data['AMOUNT'],fig_kws={'figsize':(一六,一零)},yearlabel_kws={'color':'black'},subplot_kws={'title':'一年內(nèi)商品銷(xiāo)售量分布'})#③展示日歷圖箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律五.三復(fù)雜數(shù)據(jù)信息地可視化importcalmap#①導(dǎo)入calmap庫(kù)raw_data.index=raw_data['DATETIME']#②設(shè)置raw_data地索引為DATETIME列地值calmap.calendarplot(raw_data['AMOUNT'],fig_kws={'figsize':(一六,一零)},yearlabel_kws={'color':'black'},subplot_kws={'title':'一年內(nèi)商品銷(xiāo)售量分布'})#③展示日歷圖用法示例(按日期展示‘AMOUNT’分布):箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律五.三復(fù)雜數(shù)據(jù)信息地可視化四/五/六/七/九地上限上面都有一些散點(diǎn)分布,存在一些異常值記錄,表現(xiàn)為高于上限值,但數(shù)量較少箱型圖利用箱型圖與散點(diǎn)圖查看數(shù)據(jù)分布規(guī)律五.三復(fù)雜數(shù)據(jù)信息地可視化分類(lèi)柱形圖使用分類(lèi)柱形圖展示多個(gè)維度細(xì)分值分布分類(lèi)柱形圖是普通柱形圖基礎(chǔ)上,增加一個(gè)分類(lèi)維度,這樣可以同時(shí)展示不同類(lèi)別下地柱形圖結(jié)果在展示不同地群組信息時(shí),數(shù)據(jù)分析師很多時(shí)候需要在不同地維度上做對(duì)比展示,此時(shí)會(huì)出現(xiàn)兩個(gè)維度與一個(gè)指標(biāo)地組合展示情況,這時(shí)可選擇分類(lèi)柱形圖五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(按日期‘month’,以IS_PRO作為分類(lèi)標(biāo)志展示數(shù)據(jù)分布):sns.catplot("IS_PRO",col="MONTH",col_wrap=六,data=raw_data,kind="count",height=二,aspect=.九)分類(lèi)柱形圖使用分類(lèi)柱形圖展示多個(gè)維度細(xì)分值分布五.三復(fù)雜數(shù)據(jù)信息地可視化(一)"IS_PRO":指定每個(gè)子柱形圖分類(lèi)地次級(jí)維度。(二)col:字符串,設(shè)置拆分柱形圖地主要維度。(三)col_wrap:整數(shù)型,col列自定地維度唯一值在每行地?cái)?shù)量,例如MONTH地月份值從一到一一,col_wrap設(shè)置為六意思是第一行顯示MONTH一到MONTH六,第二行顯示剩下地。(四)data:顯示地源數(shù)據(jù)。(五)kind:字符串,設(shè)置每個(gè)子圖展示地樣式,可設(shè)置三類(lèi)樣式:第一類(lèi)為分類(lèi)散點(diǎn)圖,值為strip或swarm;第二類(lèi)是分類(lèi)分布圖,可選值為box,violin與boxen;第三類(lèi)是分類(lèi)評(píng)估圖,可選值為point,bar與count。(六)height:數(shù)值型,以英寸為單位,設(shè)置每個(gè)子圖地高度。(七)Aspect:浮點(diǎn)型,設(shè)置每個(gè)子圖地寬高比。用法示例(按日期‘month’,以IS_PRO作為分類(lèi)標(biāo)志展示數(shù)據(jù)分布):分類(lèi)柱形圖使用分類(lèi)柱形圖展示多個(gè)維度細(xì)分值分布五.三復(fù)雜數(shù)據(jù)信息地可視化分類(lèi)柱形圖使用分類(lèi)柱形圖展示多個(gè)維度細(xì)分值分布五.三復(fù)雜數(shù)據(jù)信息地可視化等高線圖利用等高線繪制核密度分布等高線圖用于展示不同地?cái)?shù)據(jù)沿著特定"邊緣"地分布狀態(tài)在地理上指地是高度分布與變化,在數(shù)據(jù)可展示多種指標(biāo)五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(按PAGEVIEWS與MONEY展示數(shù)據(jù)分布):sns.jointplot(x="PAGEVIEWS",y="MONEY",data=raw_data,kind="kde")等高線圖利用等高線繪制核密度分布五.三復(fù)雜數(shù)據(jù)信息地可視化(一)x與y分別表示X軸與Y軸地?cái)?shù)據(jù)列。(二)data表示所用地?cái)?shù)據(jù)源。(三)kind表示圖形地展示方法,設(shè)置為kde則使用核密度圖方法。用法示例(按PAGEVIEWS與MONEY展示數(shù)據(jù)分布):等高線圖利用等高線繪制核密度分布五.三復(fù)雜數(shù)據(jù)信息地可視化等高線圖利用等高線繪制核密度分布上面與右側(cè)是核密度分布曲線,分布顯示了PAGEVIEWS與MONEY數(shù)據(jù)地分布狀態(tài);間是等高線圖,每個(gè)等高線邊緣表示不同地?cái)?shù)據(jù)值界限,界限內(nèi)地?cái)?shù)據(jù)越多,則顏色越深。五.三復(fù)雜數(shù)據(jù)信息地可視化坡度圖利用坡度圖繪制數(shù)據(jù)變化差異坡度圖是表示地面傾斜率地地圖通過(guò)顯示"坡度"地兩側(cè)不同指標(biāo)上地差異變化,方便對(duì)比多個(gè)指標(biāo)地變化五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(以IS_PRO為維度對(duì)比不同IS_PRO值下AMOUNT值)sns.pointplot(x="IS_PRO",y="AMOUNT",hue="CATE",data=raw_data)坡度圖利用坡度圖繪制數(shù)據(jù)變化差異五.三復(fù)雜數(shù)據(jù)信息地可視化(一)x與y分別表示X軸與Y軸地?cái)?shù)據(jù)列。(二)hue:拆分具體值做對(duì)比地列。如果不設(shè)置,則僅基于指定地X軸顯示不同分類(lèi)值。(三)data:所用源數(shù)據(jù)。用法示例(以IS_PRO為維度對(duì)比不同IS_PRO值下AMOUNT值)坡度圖利用坡度圖繪制數(shù)據(jù)變化差異五.三復(fù)雜數(shù)據(jù)信息地可視化在IS_PRO(是否促銷(xiāo))上,當(dāng)IS_PRO發(fā)生時(shí),除了CATE為三外,其它值都是持或上升,可以看出促銷(xiāo)對(duì)其它品類(lèi)地促作用坡度圖利用坡度圖繪制數(shù)據(jù)變化差異五.三復(fù)雜數(shù)據(jù)信息地可視化漏斗圖使用漏斗圖展示不同轉(zhuǎn)化環(huán)節(jié)地完成情況漏斗圖,就是數(shù)據(jù)地下一步是從上一步"漏"下來(lái)地,形成類(lèi)似于漏斗地形狀。常用來(lái)展示轉(zhuǎn)化地不同環(huán)節(jié)地完成情況。五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(廣告單擊,到達(dá)與轉(zhuǎn)化漏斗)#導(dǎo)入庫(kù)frompyechartsimportoptionsasopts#①pyecharts用到地options配置庫(kù)frompyecharts.chartsimportFunnel#②pyecharts用到Funnel庫(kù)importpandasaspd#③#讀取并處理數(shù)據(jù)raw_data二=pd.read_excel('demo.xlsx',sheet_name=一)#④讀取demo文件第二個(gè)sheet地?cái)?shù)據(jù)data=raw_data二.drop(['DATE','IMPRESSIONS'],axis=一).sum(axis=零)#⑤丟棄名為DATE與IMPRESSIONS列,并按列求與,得到datafunnel_data=[[i,j]fori,jinzip(data.index,data.to_list())]#⑥使用列表推導(dǎo)式,從data地index與data地?cái)?shù)據(jù),并依次以子列表地形式添加到funnel_data漏斗圖使用漏斗圖展示不同轉(zhuǎn)化環(huán)節(jié)地完成情況五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(廣告單擊,到達(dá)與轉(zhuǎn)化漏斗)#展示漏斗圖funnel=Funnel()#⑦初始化Funnel對(duì)象為funnelfunnel.add("流量轉(zhuǎn)化漏斗",funnel_data)#⑧調(diào)用add方法添加每層漏斗地?cái)?shù)據(jù)funnel.set_global_opts(title_opts=opts.TitleOpts(title="廣告單擊,到達(dá)與轉(zhuǎn)化漏斗"))#⑨用set_global_opts方法設(shè)置圖形標(biāo)題funnel.render_notebook()#⑩render_notebook()方法將數(shù)據(jù)顯示在JupyterNotebook漏斗圖使用漏斗圖展示不同轉(zhuǎn)化環(huán)節(jié)地完成情況五.三復(fù)雜數(shù)據(jù)信息地可視化(一)x與y分別表示X軸與Y軸地?cái)?shù)據(jù)列。(二)hue:拆分具體值做對(duì)比地列。如果不設(shè)置,則僅基于指定地X軸顯示不同分類(lèi)值。(三)data:所用源數(shù)據(jù)。用法示例(廣告單擊,到達(dá)與轉(zhuǎn)化漏斗)漏斗圖使用漏斗圖展示不同轉(zhuǎn)化環(huán)節(jié)地完成情況五.三復(fù)雜數(shù)據(jù)信息地可視化從單擊到下一步到達(dá)網(wǎng)站之間地流失非常大漏斗圖使用漏斗圖展示不同轉(zhuǎn)化環(huán)節(jié)地完成情況五.三復(fù)雜數(shù)據(jù)信息地可視化關(guān)系圖使用關(guān)系圖展示不同元素見(jiàn)地關(guān)聯(lián)關(guān)系當(dāng)多個(gè)對(duì)象之間發(fā)生關(guān)系時(shí),普通圖形大多只能同時(shí)顯示二個(gè)數(shù)據(jù)對(duì)象間地關(guān)系。關(guān)系圖則可以同時(shí)顯示每個(gè)對(duì)象與其它對(duì)象地關(guān)系,尤其適合于做關(guān)聯(lián)分析結(jié)果展示。五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(展示用戶每次都一起購(gòu)買(mǎi)那些商品)frompyecharts.chartsimportGraph#①導(dǎo)入關(guān)系圖所用地Graph庫(kù)raw_data三=pd.read_excel('demo.xlsx',sheet_name=二)#②從demo文件讀取第三個(gè)sheetnode_data=raw_data三['前項(xiàng)商品'].append(raw_data三['后項(xiàng)商品'])#③將"后項(xiàng)"數(shù)據(jù)列添加到"前項(xiàng)"數(shù)據(jù)列,形成前后項(xiàng)目數(shù)據(jù)列地總列表(Series)value_count=node_data.value_counts()#④value_counts方法統(tǒng)計(jì)合并后地項(xiàng)目每個(gè)項(xiàng)目出現(xiàn)地次數(shù)nodes=[opts.GraphNode(name=node,symbol_size=int(np.log(value)*一零))fornode,valueinzip(value_count.index,value_count.values)]#⑤使用列表推導(dǎo)式將value_count地index與值分別讀取,并以node節(jié)點(diǎn)地方法添加到nodes對(duì)象,每個(gè)node設(shè)置通過(guò)opts.GraphNode方法實(shí)現(xiàn)關(guān)系圖使用關(guān)系圖展示不同元素見(jiàn)地關(guān)聯(lián)關(guān)系五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(展示用戶每次都一起購(gòu)買(mǎi)那些商品)links=[opts.GraphLink(source=i,target=j)fori,jinraw_data三[['前項(xiàng)商品','后項(xiàng)商品']].values]#⑥使用列表推導(dǎo)式,將raw_data三地前項(xiàng)商品與后項(xiàng)商品讀出,并調(diào)用GraphLink方法分別作為邊地起點(diǎn)與重點(diǎn)添加到linksgraph=Graph()#⑦初始化Graph對(duì)象為graphgraph.add("",nodes,links,repulsion=四零零零)#⑧graph.set_global_opts(title_opts=opts.TitleOpts(title="商品關(guān)系"))#⑨graph.render_notebook()#⑩關(guān)系圖使用關(guān)系圖展示不同元素見(jiàn)地關(guān)聯(lián)關(guān)系五.三復(fù)雜數(shù)據(jù)信息地可視化name:字符串,節(jié)點(diǎn)文字信息symbol_size:數(shù)值型,節(jié)點(diǎn)大小用法示例(展示用戶每次都一起購(gòu)買(mǎi)那些商品)關(guān)系圖使用關(guān)系圖展示不同元素見(jiàn)地關(guān)聯(lián)關(guān)系五.三復(fù)雜數(shù)據(jù)信息地可視化fish,softdrink,freshmeat地權(quán)重很大,表現(xiàn)在節(jié)點(diǎn)面積大,說(shuō)明了其它很多節(jié)點(diǎn)都與之發(fā)生關(guān)系,因此更重要關(guān)系圖使用關(guān)系圖展示不同元素見(jiàn)地關(guān)聯(lián)關(guān)系五.三復(fù)雜數(shù)據(jù)信息地可視化雷達(dá)圖使用雷達(dá)圖展示多個(gè)元素在不同屬上地差異雷達(dá)圖是以從同一點(diǎn)開(kāi)始地軸上表示地三個(gè)或更多個(gè)變量地圖形方法。雷達(dá)圖也稱(chēng)為網(wǎng)絡(luò)圖,蜘蛛圖,星圖,極坐標(biāo)圖等。它相當(dāng)于行坐標(biāo)圖,軸徑向排列。當(dāng)要對(duì)比地元素多,且對(duì)比指標(biāo)也有多個(gè)時(shí),雷達(dá)圖是非常好地展示差異地方法。五.三復(fù)雜數(shù)據(jù)信息地可視化用法示例(展示用戶每次都一起購(gòu)買(mǎi)那些商品)#讀取數(shù)據(jù)及預(yù)處理frompyecharts.chartsimportRadar#①radar_gb=raw_data.groupby('CATE',as_index=False).mean()#②基于本章開(kāi)始讀取到地raw_data,基于CATE做分類(lèi)匯總,匯總計(jì)算指標(biāo)為所有指標(biāo),計(jì)算方式為求均值names=['AMOUNT','MONEY','VISITS','PAGEVIEWS','STORE一_AMOUNT','STORE二_AMOUNT']#③radar_data=radar_gb[names]#④ma
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 玉溪師范學(xué)院《環(huán)境生態(tài)監(jiān)測(cè)》2021-2022學(xué)年第一學(xué)期期末試卷
- 玉溪師范學(xué)院《二維設(shè)計(jì)基礎(chǔ)》2022-2023學(xué)年第一學(xué)期期末試卷
- 玉溪師范學(xué)院《測(cè)量基礎(chǔ)實(shí)驗(yàn)》2022-2023學(xué)年第一學(xué)期期末試卷
- 2024專(zhuān)利實(shí)施許可合同樣式
- 2024復(fù)印機(jī)出租合同范文
- 2024農(nóng)村土地流轉(zhuǎn)合同【農(nóng)村土地承包經(jīng)營(yíng)權(quán)流轉(zhuǎn)合同】
- 2024不簽勞動(dòng)合同受到《勞動(dòng)法》保護(hù)管理資料
- 2024廣告牌承攬合同范本
- 鹽城師范學(xué)院《算法設(shè)計(jì)與分析》2021-2022學(xué)年期末試卷
- 2024房屋裝修合同銀行貸款
- 農(nóng)作物種植與農(nóng)業(yè)生產(chǎn)項(xiàng)目風(fēng)險(xiǎn)評(píng)估報(bào)告
- 教案網(wǎng)線制作教案
- 關(guān)于大型體育場(chǎng)館鋼結(jié)構(gòu)工程造價(jià)控制的報(bào)告
- 云南少數(shù)民族服飾賞析課件
- 《裝配式建筑構(gòu)造與識(shí)圖》考試復(fù)習(xí)題庫(kù)(含答案)
- 血液運(yùn)輸物流服務(wù)投標(biāo)方案
- 心電監(jiān)護(hù)儀故障應(yīng)急預(yù)案
- 整式加減2-去括號(hào)、添括號(hào)-課件
- 退休后單位繼續(xù)留用協(xié)議書(shū)
- 化學(xué)混凝法課件
- 鋼結(jié)構(gòu)樓梯工程施工組織設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論