數(shù)據(jù)可視化課件:有關關系的可視化_第1頁
數(shù)據(jù)可視化課件:有關關系的可視化_第2頁
數(shù)據(jù)可視化課件:有關關系的可視化_第3頁
數(shù)據(jù)可視化課件:有關關系的可視化_第4頁
數(shù)據(jù)可視化課件:有關關系的可視化_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

有關關系的可視化在關系中尋求什么關聯(lián)性(圓點、探索更多的變量、氣泡)分布(老式分布圖表、有關分布的柱形、延續(xù)性的密度)

對照和比較4.本章主要內(nèi)容1.2.

3.D

當某個數(shù)量增加時,另一個數(shù)量是否會減少?

它們之間是因果關系還是關聯(lián)關系?群體彼此之間是存在交疊還是互不干涉?D

關聯(lián)性可以幫助我們根據(jù)某一已知指標來預測另一指標。7.1

在關系中尋求什么7.2

關聯(lián)性——散點圖(探索更多的變量)圖.

散點圖矩陣的基本框架優(yōu)勢在于一次比較3個變量:D

x軸D

y軸D

氣泡的面積7.2關聯(lián)性

氣泡圖圖.

氣泡圖的基本框架直方圖Hist()用一系列寬度相等、

高度不等的長方形來表

示數(shù)據(jù)分布7.3

分布matplotlib.pyplot.hist(x,

bins,

range,

density,weights,

cumulative,

bottom,

histtype,**kwargs)參數(shù)說明(部分):Dx→作圖所用的數(shù)據(jù),一維數(shù)組,多維數(shù)組可以扁平化后再作圖

Dbins→直方圖的柱數(shù),可選項,整數(shù)、序列或字符串型。默認10

Drange→

指定直方圖數(shù)據(jù)的上下界,默認包含繪圖數(shù)據(jù)的最大值和最小值

(范圍)Ddensity→布爾值,如果為"True”,將y軸轉(zhuǎn)化為密度刻度,默認為None

Dweights→為每個數(shù)據(jù)點設置權重Dcumulative→布爾值,是否需要計算累計頻數(shù)或頻率,默認為False

Dbottom→為直方圖添加基準線,數(shù)組型,默認為noneDhisttype→直方圖類型,

分為bar,barstacked,step,stepfilled。默認為bar主要用于反映原始數(shù)據(jù)分布的特征,也可以進行多組數(shù)據(jù)分布特征的比較。盒須圖(箱形圖Range

分位差。內(nèi)距IQR

Inter-

Quartile,四盒須圖變種可以水平或者垂直繪制盒須圖變種2D

Box

Plot

Relplot

Rangefinder

Box

Plot

Bag

Plot值,默認值為False??蛇x參數(shù)。D

sym:離群點的默認標記符號,詳解flierprops參數(shù)。類型為字符串,默認值

為'None'。可選參數(shù)。取值為''隱藏離群點,取值為'None'時,取值為'b+’。D

vert:箱體的方向,當取值為True時,繪制垂直箱體,當取值為False時,繪

制水平箱體。類型為布爾值,默認值為True??蛇x參數(shù)。D

whis:箱須的位置。類型為浮點數(shù)或浮點數(shù)二元組,默認值為1.5。

可選參數(shù)。matplotlib.pyplot.boxplot(x,

notch,

vert,

patch_artist,

whis,

widths,

labels,**kwargs)D

x

:輸入數(shù)據(jù)。

類型為數(shù)組或向量序列。必備參數(shù)。D

notch:控制箱體中央是否有V型凹槽。當取值為True時,箱體中央有V型凹

槽,凹槽表示中位數(shù)的置信區(qū)間;取值為False時,箱體為矩形。類型為布爾1.

切爾諾夫臉譜圖(Chernoff

Faces)D

根據(jù)數(shù)據(jù),將多個變量一次性展現(xiàn)在人臉的各個部位上,例如耳朵、頭發(fā)、眼睛、鼻子等7.4

對照和比較(多變量比較)

圖.

2008—2009賽季NBA前50位得分手的切爾諾夫臉譜圖?也稱為網(wǎng)絡圖、蜘蛛圖、星圖、

蜘蛛網(wǎng)圖,是一種表現(xiàn)多維數(shù)據(jù)

的圖表。?將多個維度的數(shù)據(jù)量映射到坐標

軸上,

每一個維度的數(shù)據(jù)都分別

對應一個坐標軸,

這些坐標軸以

相同的間距沿著徑向排列,并且

刻度相同。?網(wǎng)格線通常只作為輔助元素,

坐標軸上的數(shù)據(jù)點用線連接起來就形成了一個多邊形。2.

雷達圖(Radar

Chart,Spider

Chart)

多組多維對比-多雷達鏈D

兩款手機的綜合表現(xiàn)雷達圖:matplotlib

庫polar(

)函數(shù):matplotlib.pyplot.

polar(theta,

rp

**kwargs)D

theta:旋轉(zhuǎn)角度D

r:每個標記到圓心的距離D

kwargs:關鍵字參數(shù)集合網(wǎng)格線設置函數(shù):matplotlib.pyplot.thetagrids(angles=None,

labels=None,

fmt=None,

**kwargs)D

通過色差、亮度來展示數(shù)據(jù)的差

異,直觀了解點位的聚集情況,

易于理解。D

熱力圖尤其關注分布。D

熱力圖可以不需要坐標軸,其背

景常常是圖片或地圖。3.

熱力圖(Heat

Map)杭州房租熱力圖,用于顯示杭州市房租價格分布Dseaborn.heatmap(data,

vmin,

vmax,

cmap,

annot,

fmt,

linewidths,

xticklabels,

yticklabels,

**kwargs)D

根據(jù)data傳入的值畫出熱力圖,一般是二維矩陣D

vmin設置最小值,

vmax設置最大值D

cmap換用不同的顏色D

center設置中心值D

annot

是否在方格上寫上對應的數(shù)字Dfmt

寫入熱力圖的數(shù)據(jù)類型,默認為科學計數(shù),

d表示整數(shù),

.1f表示保留一位小數(shù)D

linewidths

設置方格之間的間隔D

xticklabels,yticklabels填到橫縱坐標的值??梢允莃ool,填或者不填。可以是int,以什么間隔填,可以是list4.

平行坐標圖(Parallel)DDD一種用來呈現(xiàn)多變量關系,或者高維度數(shù)據(jù)的可視化技術??v向是屬性值,橫向是屬性類別。為了反映變化趨勢和各個變量間相互關系,

往往將描述不同變量的各點連接成折線。一、基于Pandaspandas.plotting.parallel_coordinates(frame,

class_column,

cols=None,

ax=None,

color=None,

use_columns=False,

xticks=None,

colormap=None,

axvlines=True,

axvlines_kwds=None,

sort_labels=False,

**kwarg

s)參數(shù):Dframe:

DataFrame

D

class_column:str

包含類名的列名。

Dcols

:列表,可選。

要使用的列名列表。

返回:類

matplotlib.axis.Axes二、基于Pyecharts的Parallel-value:表示坐標軸的類型為連續(xù)型數(shù)值型數(shù)據(jù),坐標軸上的刻度間距會按照數(shù)據(jù)范圍和

坐標軸長度自動計算。-category:表示坐標軸的類型為離散型類別數(shù)據(jù),坐標軸上的刻度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論