版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第十一章第十一章 多變量的可視化分析多變量的可視化分析 第一節(jié)第一節(jié) 引言引言 第二節(jié)第二節(jié) 折線圖分析法折線圖分析法 第三節(jié)第三節(jié) 條形圖分析法條形圖分析法 第四節(jié)第四節(jié) 散點圖分析法散點圖分析法 第五節(jié)第五節(jié) 雷達圖分析法雷達圖分析法 第六節(jié)第六節(jié) 星座圖分析法星座圖分析法 第一節(jié)第一節(jié) 引言引言n眾所周知,圖形是我們直觀了解、認識數(shù)據(jù)的一種可視化手眾所周知,圖形是我們直觀了解、認識數(shù)據(jù)的一種可視化手段。假設(shè)能將所研討的數(shù)據(jù)直接顯示在一個平面圖上,便可段。假設(shè)能將所研討的數(shù)據(jù)直接顯示在一個平面圖上,便可以一目了然地看出分析變量間的數(shù)量關(guān)系。直方圖、散點圖以一目了然地看出分析變量間的數(shù)量關(guān)系
2、。直方圖、散點圖等就是我們常用的二維平面圖示方法。雖然三維數(shù)據(jù)也可以等就是我們常用的二維平面圖示方法。雖然三維數(shù)據(jù)也可以用三維圖形來表示,但觀測三維數(shù)據(jù)卻存在一定的難度,而用三維圖形來表示,但觀測三維數(shù)據(jù)卻存在一定的難度,而且在許多實踐問題中,多變量數(shù)據(jù)的維數(shù)通常又都大于且在許多實踐問題中,多變量數(shù)據(jù)的維數(shù)通常又都大于3,那么如何用圖形直觀表現(xiàn)三維以上的數(shù)據(jù)呢?自上世紀那么如何用圖形直觀表現(xiàn)三維以上的數(shù)據(jù)呢?自上世紀70年年代以來,多變量數(shù)據(jù)的可視化分析研討就不斷是人們關(guān)注的代以來,多變量數(shù)據(jù)的可視化分析研討就不斷是人們關(guān)注的一個問題。一個問題。n從研討的成果來看,主要可以分為兩類從研討的成果
3、來看,主要可以分為兩類:n一類是使高維空間的點與平面上的某種圖形對應(yīng),這種圖形一類是使高維空間的點與平面上的某種圖形對應(yīng),這種圖形能反映高維數(shù)據(jù)的某些特點或數(shù)據(jù)間的某些關(guān)系;能反映高維數(shù)據(jù)的某些特點或數(shù)據(jù)間的某些關(guān)系;n另一類是對多變量數(shù)據(jù)進展降維處置,在盡能夠多地保管原另一類是對多變量數(shù)據(jù)進展降維處置,在盡能夠多地保管原始信息的原那么下,將數(shù)據(jù)的維數(shù)降為始信息的原那么下,將數(shù)據(jù)的維數(shù)降為2維或維或1維,然后再在維,然后再在平面上表示。例如前面引見的主成分分析方法、因子分析方平面上表示。例如前面引見的主成分分析方法、因子分析方法、多維尺度法等就屬于此類方法。這里僅引見法、多維尺度法等就屬于此類
4、方法。這里僅引見5種適用而種適用而有效的多變量可視化方法。有效的多變量可視化方法。 n表表11.1是我國華北地域是我國華北地域5個省市個省市2019年城鎮(zhèn)居民家庭平均每人年城鎮(zhèn)居民家庭平均每人全年消費性支出的六項目的數(shù)據(jù),下面分別用全年消費性支出的六項目的數(shù)據(jù),下面分別用5種可視化方種可視化方法對數(shù)據(jù)進展分析。法對數(shù)據(jù)進展分析。n思索微機的普及運用,本章主要引見思索微機的普及運用,本章主要引見5種圖形的制造方法,種圖形的制造方法,圖形的制造那么經(jīng)過電腦實現(xiàn)。折線圖、條形圖、矩陣散點圖形的制造那么經(jīng)過電腦實現(xiàn)。折線圖、條形圖、矩陣散點圖在圖在SPSS中制造,雷達圖和星座圖那么在中制造,雷達圖和星
5、座圖那么在EXCEL中實現(xiàn)。中實現(xiàn)。n 表表11.1 華北華北5省市城鎮(zhèn)居民家庭消費性支出省市城鎮(zhèn)居民家庭消費性支出第二節(jié)第二節(jié) 折線圖分析法折線圖分析法n折線圖是將多個樣品觀測數(shù)據(jù)以折線的方式表示在平面圖中折線圖是將多個樣品觀測數(shù)據(jù)以折線的方式表示在平面圖中的一種多變量可視化圖形。折線圖用線段的升降來表示變量的一種多變量可視化圖形。折線圖用線段的升降來表示變量的大小,常用于表示景象在時間上的變化趨勢、景象的分配的大小,常用于表示景象在時間上的變化趨勢、景象的分配情況和兩個景象之間的依存關(guān)系等。情況和兩個景象之間的依存關(guān)系等。n折線圖的作圖原理如下:折線圖的作圖原理如下:n 1作平面坐標系,橫
6、坐標取作平面坐標系,橫坐標取p個點,表示個點,表示p個變量,縱個變量,縱坐坐n 標表示變量取值。標表示變量取值。n 2對給定的樣品觀測值,在對給定的樣品觀測值,在p個點的縱坐標上標出相應(yīng)個點的縱坐標上標出相應(yīng)的的n 變量取值。變量取值。n 3將表示將表示p個變量取值的點銜接成一條折線,即得到了個變量取值的點銜接成一條折線,即得到了表表n 示一個樣品觀測數(shù)據(jù)的折線,示一個樣品觀測數(shù)據(jù)的折線,n次觀測可繪出次觀測可繪出n條折條折 線,構(gòu)成多變量折線圖。線,構(gòu)成多變量折線圖。 n在在SPSS中作折線圖的方法如下:中作折線圖的方法如下:n 1將原始數(shù)據(jù)輸入將原始數(shù)據(jù)輸入SPSS中。留意數(shù)據(jù)的組織方式要
7、像中。留意數(shù)據(jù)的組織方式要像圖圖11.1那樣。即把不同地域當成變量,而把支出目的當成觀那樣。即把不同地域當成變量,而把支出目的當成觀測。測。圖圖11.1 作折線圖時的數(shù)據(jù)組織方式作折線圖時的數(shù)據(jù)組織方式 2選擇菜單項選擇菜單項GraphsLine,翻開,翻開Line Charts對話框,對話框,如圖如圖11.2。在對話框上方的三個選項用于選擇折線圖的方式,。在對話框上方的三個選項用于選擇折線圖的方式,由于是這里是多變量作圖,所以選擇由于是這里是多變量作圖,所以選擇Multiple。在對話框下。在對話框下面的三個選項中選擇面的三個選項中選擇Value of individual cases。單擊
8、。單擊Define按鈕,翻開按鈕,翻開Define Multiple Line對話框。對話框。 圖圖11.2 Line Charts對話框?qū)υ捒?3在在Define Multiple Line對話框中,將代表不同地域的對話框中,將代表不同地域的5個變量移入個變量移入Lines Represent列表框中,將代表支出目的的變列表框中,將代表支出目的的變量量variable移入移入Variable框中。單擊框中。單擊OK按鈕,即可作出按鈕,即可作出如圖如圖11.4所示的折線圖。從圖中可以清楚地看出北京市幾乎所示的折線圖。從圖中可以清楚地看出北京市幾乎各項支出都排在第一,而山西省那么幾乎每項支出都是
9、最低各項支出都排在第一,而山西省那么幾乎每項支出都是最低的。的。 圖圖11.3 Define Multiple Line對話框?qū)υ捒驁D圖11.4 折線圖折線圖第三節(jié)第三節(jié) 條形圖分析法條形圖分析法n條形圖是由假設(shè)干平行條狀的矩形所構(gòu)成,而以每一個矩形條形圖是由假設(shè)干平行條狀的矩形所構(gòu)成,而以每一個矩形的高度來代表數(shù)值的大小。的高度來代表數(shù)值的大小。n按圖按圖11.1所示的方式在所示的方式在SPSS中組織好數(shù)據(jù)后,條形圖的制造中組織好數(shù)據(jù)后,條形圖的制造步驟如下:步驟如下:n 1選擇菜單項選擇菜單項GraphsLine,翻開,翻開Bar Charts對話框,對話框,該對話框與圖該對話框與圖11.
10、2所示的所示的Line Charts對話框有一樣的選項。對話框有一樣的選項。在對話框上方的三個選項用于選擇條形圖的方式,由于是這在對話框上方的三個選項用于選擇條形圖的方式,由于是這里是多變量作圖,所以選擇里是多變量作圖,所以選擇Clustered。在對話框下面的三個。在對話框下面的三個選項中選擇選項中選擇Value of individual cases。單擊。單擊Define按鈕,翻按鈕,翻開開Define Clustered Bar對話框。對話框。 n 2在在Define Clustered Bar對話框中,將代表不同地域的對話框中,將代表不同地域的5個變量移入個變量移入Bars Repr
11、esent列表框中,將代表支出目的的變列表框中,將代表支出目的的變量移入量移入Variable框中。單擊框中。單擊OK按鈕,即可作出如圖按鈕,即可作出如圖11.5所示所示的條形圖。的條形圖。 圖圖11.5 條形圖條形圖n可以發(fā)現(xiàn),折線圖和條行圖的作圖過程幾乎一樣,作圖原理可以發(fā)現(xiàn),折線圖和條行圖的作圖過程幾乎一樣,作圖原理也大同小異,折線圖是以折線的高低來表示變量的大小,條也大同小異,折線圖是以折線的高低來表示變量的大小,條形圖是以矩形的高低來表示變量的大小。形圖是以矩形的高低來表示變量的大小。n從圖從圖11.5也可以得出與折線圖同樣的結(jié)論:北京市各項支出也可以得出與折線圖同樣的結(jié)論:北京市各
12、項支出都比較高,而山西省各項支出都比較低。都比較高,而山西省各項支出都比較低。第四節(jié)第四節(jié) 散點圖分析法散點圖分析法n散點圖又稱分布圖,它是以點的分布反映變量之間相關(guān)關(guān)系散點圖又稱分布圖,它是以點的分布反映變量之間相關(guān)關(guān)系的可視化方法。矩陣散點圖那么是一種反映多個變量之間相的可視化方法。矩陣散點圖那么是一種反映多個變量之間相關(guān)關(guān)系的二維散點圖。關(guān)關(guān)系的二維散點圖。n利用利用SPSS制造矩陣散點圖的步驟如下:制造矩陣散點圖的步驟如下:n 1在在SPSS中按圖中按圖11.6的方式組織數(shù)據(jù),即把支出目的當?shù)姆绞浇M織數(shù)據(jù),即把支出目的當成變量,而把不同地域當成觀測。成變量,而把不同地域當成觀測。 圖圖
13、11.6 作散點圖時的數(shù)據(jù)組織方式作散點圖時的數(shù)據(jù)組織方式 2選擇菜單項選擇菜單項GraphsScatter,翻開,翻開Scatter plot對話框?qū)υ捒?如圖如圖11.7。該對話框用于選擇散點圖的方式。選定。該對話框用于選擇散點圖的方式。選定Matrix,即矩陣散點圖即矩陣散點圖 ,單擊,單擊Define按鈕,翻開按鈕,翻開Scatter plot Matrix對對話框,如圖話框,如圖11.8。 圖圖11.7 Scatter plot對話框?qū)υ捒驁D圖11.8 Scatter plot Matrix對話框?qū)υ捒?3在翻開的在翻開的Scatter plot Matrix對話框中,將食品、穿著、
14、對話框中,將食品、穿著、居住三個變量移入居住三個變量移入Matrix Variables列表框中,將標志變量列表框中,將標志變量region移入移入Label Cases by列表框中。列表框中。 4點擊點擊OK按鈕,得到如圖按鈕,得到如圖11.9所示的矩陣散點圖。所示的矩陣散點圖。 從圖從圖11.9可以看出,河北、山西、內(nèi)蒙古在居住和食品消費支可以看出,河北、山西、內(nèi)蒙古在居住和食品消費支出方面與北京、天津相比較低,食品與居住支出變量之間存出方面與北京、天津相比較低,食品與居住支出變量之間存在一定的線性關(guān)系。天津在穿著支出方面較低,與最低的河在一定的線性關(guān)系。天津在穿著支出方面較低,與最低的
15、河北接近,與最高居住支出構(gòu)成鮮明對比。北京那么除在居住北接近,與最高居住支出構(gòu)成鮮明對比。北京那么除在居住支出方面低于天津外,其他方面支出均高于華北其他省市。支出方面低于天津外,其他方面支出均高于華北其他省市。內(nèi)蒙古那么在穿著支出方面僅次于北京,顯示出某種特殊消內(nèi)蒙古那么在穿著支出方面僅次于北京,顯示出某種特殊消費特征。費特征。 圖圖11.9 矩陣散點圖矩陣散點圖 n另外,還可以作三維立體散點圖。只需在另外,還可以作三維立體散點圖。只需在Scatter plot對話框?qū)υ捒驁D圖11.7中選擇中選擇3-D選項。在跳出的選項。在跳出的3-D Scatter plot對話框?qū)υ捒蛑袑⑹称?、穿著、居?/p>
16、三個變量分別移入中將食品、穿著、居住三個變量分別移入X Axis、Y Axis和和Z Axis列表框中,將標志變量列表框中,將標志變量region移入移入Label Cases by列表列表框中。單擊框中。單擊OK按鈕,那么作出圖按鈕,那么作出圖11.10所示的三維立體散點所示的三維立體散點圖。圖。n矩陣散點圖不僅可以在二維平面上同時反映多個變量數(shù)值,矩陣散點圖不僅可以在二維平面上同時反映多個變量數(shù)值,而且可以用于直觀反映多個變量間能否存在某種關(guān)系。與三而且可以用于直觀反映多個變量間能否存在某種關(guān)系。與三維立體圖相比,有著更好的可視性。比較圖維立體圖相比,有著更好的可視性。比較圖11.9與圖與
17、圖11.10不不難看出這一點。難看出這一點。 圖圖11.10 三維立體散點圖三維立體散點圖 第五節(jié)第五節(jié) 雷達圖分析法雷達圖分析法n雷達圖是一種較為常用的多變量可視化圖形。在雷達圖中,雷達圖是一種較為常用的多變量可視化圖形。在雷達圖中,每個變量都有它本人的數(shù)值軸,每個數(shù)值軸都是從中心向外每個變量都有它本人的數(shù)值軸,每個數(shù)值軸都是從中心向外輻射。由于圖形就好似雷達熒光屏上的圖像,故稱其為雷達輻射。由于圖形就好似雷達熒光屏上的圖像,故稱其為雷達圖。又像蜘蛛網(wǎng),所以也稱蛛網(wǎng)圖。圖。又像蜘蛛網(wǎng),所以也稱蛛網(wǎng)圖。n雷達圖的作圖方法:雷達圖的作圖方法:n 1作一圓,并按變量的個數(shù)作一圓,并按變量的個數(shù)p將
18、圓周分成將圓周分成p等分。等分。n 2銜接圓心和各分點,將這銜接圓心和各分點,將這p條半徑連線依次定義為條半徑連線依次定義為各變量的坐標軸,并標以適當?shù)目潭?。各變量的坐標軸,并標以適當?shù)目潭?。n 3對給定的一次觀測值,將每個變量值分別標在相應(yīng)對給定的一次觀測值,將每個變量值分別標在相應(yīng)的坐標軸上,把的坐標軸上,把p個點相連就構(gòu)成了一個個點相連就構(gòu)成了一個p邊形,邊形,n次觀測值次觀測值就可畫出就可畫出n個個p邊形。邊形。 n例如,根據(jù)表例如,根據(jù)表11.1中的數(shù)據(jù),調(diào)用中的數(shù)據(jù),調(diào)用EXCEL圖表導游,選擇雷圖表導游,選擇雷達圖,然后按圖表導游提示,即可制造出如圖達圖,然后按圖表導游提示,即可
19、制造出如圖11.1117所示所示的雷達圖。圖的雷達圖。圖11.5畫出了北京、天津和河北的雷達圖,從圖畫出了北京、天津和河北的雷達圖,從圖可以看出,三省市消費支出構(gòu)造有較大差別。北京人均消費可以看出,三省市消費支出構(gòu)造有較大差別。北京人均消費支出的各項目的都高,對應(yīng)面積最大的六邊形,其次是天津,支出的各項目的都高,對應(yīng)面積最大的六邊形,其次是天津,在三個省市中面積最小的是河北,天津在居住支出方面與北在三個省市中面積最小的是河北,天津在居住支出方面與北京較為接近,而在穿著和交通、通訊支出方面那么與河北接京較為接近,而在穿著和交通、通訊支出方面那么與河北接近。其他支出方面三地存在較大差別。利用雷達圖的外形、近。其他支出方面三地存在較大差別。利用雷達圖的外形、面積大小,可以對樣品進展初始分類分析。面積大小,可以對樣品進展初始分類分析。n為了加強雷達圖的效果,在雷達圖中適當?shù)姆峙渥鴺溯S是很為了加強雷達圖的效果,在雷達圖中適當?shù)姆峙渥鴺溯S是很重要的,詳細的分配方法要結(jié)合分析的問題而定。例如可將重要的,詳細的分配方法要結(jié)合分析的問題而定。例如可將要對比的目的分布在左、右或上、下方,以便
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國礦產(chǎn)資源勘查行業(yè)商業(yè)模式創(chuàng)新戰(zhàn)略制定與實施研究報告
- 新形勢下塑膠玩具行業(yè)轉(zhuǎn)型升級戰(zhàn)略制定與實施研究報告
- 2025-2030年中國電視劇行業(yè)營銷創(chuàng)新戰(zhàn)略制定與實施研究報告
- 2025-2030年中國金屬注射成型行業(yè)資本規(guī)劃與股權(quán)融資戰(zhàn)略制定與實施研究報告
- 自動噴水滅火系統(tǒng)試壓記錄表
- 比較法在圖書館學研究中的應(yīng)用
- 真絲睡衣體驗調(diào)查
- 生活防火知識培訓課件
- 2024-2030年中國自動血液分析儀行業(yè)市場發(fā)展監(jiān)測及投資潛力預測報告
- 2023-2029年中國愛情服務(wù)行業(yè)市場運行態(tài)勢及投資戰(zhàn)略規(guī)劃報告
- 藝術(shù)漆培訓課件
- 建德海螺二期施工組織設(shè)計
- 山東省菏澤市2023-2024學年高一上學期期末測試物理試題(解析版)
- 2024年學校后勤日用品采購合同范本2篇
- 中建中建機電工程聯(lián)動調(diào)試實施方案范本
- 新《安全生產(chǎn)法》安全培訓
- 山東省濟南市2023-2024學年高一上學期1月期末考試 物理 含答案
- 中華人民共和國安全生產(chǎn)法知識培訓
- 物業(yè)品質(zhì)提升方案課件
- 《ROHS知識培訓》課件
- 服裝行業(yè)倉庫管理流程
評論
0/150
提交評論