一組空氣污染數(shù)據(jù)的主成分分析_第1頁
一組空氣污染數(shù)據(jù)的主成分分析_第2頁
一組空氣污染數(shù)據(jù)的主成分分析_第3頁
一組空氣污染數(shù)據(jù)的主成分分析_第4頁
一組空氣污染數(shù)據(jù)的主成分分析_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

t精心整理t一組空污數(shù)據(jù)的成分析【說明面的多元統(tǒng)計分析練習題摘自等編寫用多元統(tǒng)計分五版原書為:RichardA.JohnsonandDeanW.Wichern.Ed).PearsonEducation,Inc.2003。我看的是中國統(tǒng)計出版社()2003年發(fā)行的影印本。第一題為原書第1.6題,即第章的第題,第二題為原書第題,即第8章的第12。第二題用的是第一題的數(shù)據(jù)。1題1.6.ThedatainTable1.5are42measurementsonair-pollutionvariablesrecordedat12:00noonintheLos(a)(b)Constructthex,,andRarrays,andinterprettheentriesin.nTABLE1.5Solarradiation(Wind()x)x))NO(x)()HC(x)12353678987212871073957103356108828156914281089052121298474121557264211478251111186452139671541036914212777274181010702117107218109774191087641738715316496742132969339310623144988427388042131153033536835110238843273

精心整理686108756108557768

78796237715248753585868679796840

4243446444377564

2131115111124223

1179710128106961398116

111082784249101218256145

3333343322223232SourceConsidertheair-pollutiondatalistedinTable1.5.Yourjobistosummarizethesedatainfewerthan=7dimensSandthecorrelabesummarizedinthreeorfewerdimensions?Canyouinterprettheprincipalcomponents?2部分答2.1部分計參數(shù)利用Excel計算的平均值(x)和標準差SolarradiationNOO2

HC73.8571434.54761910.047619Stdev1.581138817.3353881.23372093.3709837Excel給出的協(xié)方差矩陣SolarradiationNO22.4404762CO-0.369048NO-0.452381NO23Excel給出相關系數(shù)矩陣RNONOOHC23CO0.18279341NO

1

精心整理NO0.296898112-0.1339520.166642230.23470430.44776780.15445061從相關系數(shù)矩陣可以看出,CO與NO、相關性明顯,O與Solarradiation、CO相關性明2顯。后面的主成分分析將CO與NO、歸并到一個主成分,將O與歸并到一個23主成分,Wind歸并到一個主成分與的相關系數(shù)并不高,但從正相關的角度看,二者的數(shù)值倒是最高的。方差極大正交旋轉之后,HC與CO、、歸并到一個因子,因為2與的相關系數(shù)較高,與、的相關系數(shù)高于其他變量。22.2主成分析之——數(shù)據(jù)未標準化下面是從相關矩陣R出發(fā),給出的結果。原始數(shù)據(jù)未經(jīng)標準化。所謂從出發(fā),就是在—選項中選中CorrelationMatrix。出的相關系數(shù)矩陣(CorrelationMatrix),與Excel計的結果一樣。公因子方差(Communalities)表如下。公因子方差變化~0.795之間,相差不是很大。但是,公因子方差值沒有達到以上的,可見每一個變量體現(xiàn)在三個主成分中的信息都不超過。特征根與方差貢獻(TotalVarianceExplained如下表??梢娞崛∪齻€主成分可以解釋原7格變量的主成分載荷矩陣()見下表。將上表從中復制到中,進行涂色分類,結果如下表所示。Component13-0.362020.31424-0.619970.24631CO0.842417-0.00803-0.12466NO0.511736NO0.2351830.215682230.4882570.593692主成分分類如下:第一主成分的主要相關變量:CO、NO、NO。2第二主成分的主要相關變量:Solarradiation、。3第三主成分的主要相關變量:、HC在主成分載荷圖(ComponentPlot)中,三個變量分別落入三個不同的主成分代表的區(qū)域。主成分得分表如下最后一欄對幾個典型的樣本給出了簡單的解釋注意解釋的時候看主成分載荷矩陣中載荷值的正負號。Casesf1f2f3

典型的說明S1-0.8186S2-0.36015S3S40.2425樣本4代表的區(qū)域Wind、染嚴重S5-0.4042S6-0.192781.21954S7S8

樣本78表的區(qū)域與、NO、2-0.34124污染有明顯的關系

精心整理S9S10S11S12S13S14S15S16S17S18S19S20S21

-0.50662-0.89378-0.66037-0.87787-0.42935-0.751

-0.81736-0.45848-0.17036-0.39862-0.3635

-1.48345-0.27016-0.66029

樣本21表的區(qū)域Solarradiation、O污染3較小S22S23S24S25S26S27S28S29S30S31S32S33S34S35S36S37

-0.69373-1.16263-0.91899-1.32458-0.10472-1.8593-0.62672-0.14264-1.71429-0.80238-1.00653

-0.09747-1.70335-0.13915-0.51948-0.6911-0.08347-1.95681-1.13269-1.92662

-2.12097-0.37202-1.08681-2.63096樣本33表的區(qū)域Wind、HC污染較小-0.08554-0.0517-1.17569樣本和代表的區(qū)域、S38S39S40S41S42

-0.48079-1.17776

-1.77265-1.04272-0.49683-0.53042

-1.32357-0.66334-1.07633-0.57934-1.55538

污染嚴重32.3主成分析之——數(shù)據(jù)未標準化下面是從協(xié)方差矩陣S發(fā),給出的結果。原始數(shù)據(jù)未經(jīng)標準化。所謂從S發(fā),就是在FactorAnalysis:Extraction—選項中選中CovarianceMatrix。公因子方差()表如下。在未經(jīng)處理的)公因子方差一欄,數(shù)值都是原始數(shù)據(jù)的方差。不過與前面給出的協(xié)方差矩陣有所不同,Excel給出的是總體方差,給的是抽樣方差。例如以的Initial為例,2.4404762×,或者2.5(對照前面的協(xié)方差矩陣)。重標的()結果是Extraction值與Initial之比。公因子方差的合計結果如下:

精心整理RescaledExtractionExtraction1300.51568300.1336710.9987288CO1.52206740.060166610.0395295NO1.18234610.006750210.00570913.84594280.478513410.0034839合計特征根與方差貢獻()如下表。在一欄中顯示,提取一個主成分似乎可以解釋原來7變量的但重標之后顯示的數(shù)值卻是17.137%。根據(jù)公因子方差表和合計結果,重標之前,全部的方差解釋為304.25786/348.54065*100=87.295%;重標之后,全部的方差解釋為=17.137%。主成分載荷矩(ComponentMatrix見下表可以看來由于變量的方差很大,它絕對地控制了第一主成分。2.4主成分析之——數(shù)據(jù)經(jīng)標準化下面是從協(xié)方差矩陣S發(fā),SPSS給出的結果。原始數(shù)據(jù)經(jīng)過標準化??梢缘剿械慕Y果重標前后一樣,并且與從相關矩陣出發(fā)計算的結果一樣。公因子方差(Communalities)表如下,重標前后的結果一樣。特征根與方差貢獻(TotalVarianceExplained)如下表。重標前后結果一樣。主成分載荷矩陣(ComponentMatrix)見下表,重標前后一樣??梢钥吹?,第一主成分的相對重要性受到標準化的極大影響結論自然是如果在極其不同的范圍內測量變量或者測量單位的量綱不同,變量必須經(jīng)過標準化。否則,應該從相關系數(shù)矩陣出發(fā)開展主成分分析。2.5因子析——差極大旋轉數(shù)據(jù)經(jīng)過標準化,從任意矩陣出發(fā),在因子分析中進行方差極大旋轉(Varimax),載荷矩陣如下。載荷矩陣和因子分類結果如下表。Component

公因子方1差0.73707030.04301990.7359707-0.0167460.543784CO0.7252709NO-0.38278-0.4816890.79463070.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論