主成分分析法例子_第1頁
主成分分析法例子_第2頁
主成分分析法例子_第3頁
主成分分析法例子_第4頁
主成分分析法例子_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一、主成分分析的基本原理,假定有n個樣本,每個樣本共有p個變量,構成一個np階的數據矩陣,(1),降維處理!,當p較大時,在p維空間中考察問題比較麻煩。 降維是用較少的幾個綜合指標代替原來較多的變量指標,而且使這些較少的綜合指標既能盡量多地反映原來較多變量指標所反映的信息,同時它們之間又是彼此獨立的。,定義:記x1,x2,xP為原變量指標,z1,z2,zm(mp)為新變量指標,(2),系數lij的確定原則: zi與zj( ij;i,j=1,2,m )相互無關; z1是x1,x2,xP的一切線性組合中方差最大者,z2是與z1不相關的x1,x2,xP的所有線性組合中方差最大者; zm是與z1,z2

2、,zm1都不相關的x1,x2,xP, 的所有線性組合中方差最大者。 則新變量指標z1,z2,zm分別稱為原變量指標x1,x2,xP的第一,第二,第m主成分。,從以上的分析可以看出,主成分分析的實質就是確定原來變量xj(j=1,2 , p)在諸主成分zi(i=1,2,m)上的載荷 lij( i=1,2,m; j=1,2 ,p)。 從數學上可以證明,載荷lij分別是相關矩陣的m個較大的特征值所對應的特征向量。,二、計算步驟,(一)計算相關系數矩陣 rij(i,j=1,2,p)為原變量xi與xj的相關系數, rij=rji,其計算公式為:,(3),(4),(二)計算特征值與特征向量: 解特征方程,求

3、出特征值,并使其按大小順序排列 ;, 分別求出對應于特征值的特征向量 ,要求 =1,即,其中表示向量 的第j個分量。, 計算主成分貢獻率及累計貢獻率 貢獻率:,累計貢獻率:,一般取累計貢獻率達8595%的特征值 所對應的第一、第二、第m(mp)個主成分。,(6),各主成分的得分,三、 主成分分析方法應用實例,表1 某農業(yè)生態(tài)經濟系統(tǒng)各區(qū)域單元的有關數據,步驟如下: (1)將表1中的數據作標準差標準化處理,然后將它們代入公式(4)計算相關系數矩陣(見表2)。,表2相關系數矩陣,(2)由相關系數矩陣計算特征值,以及各個主成分的貢獻率與累計貢獻率(見表3)。由表3可知,第一,第二,第三主成分的累計貢

4、獻率已高達86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。,表3特征值及主成分貢獻率,(3)對于特征值=4.6610,=2.0890,=1.0430分別求出其特征向量l1,l2,l3。,表4 主成分載荷,第一主成分z1與x1,x5,x6,x7,x9呈顯出較強的正相關,與x3呈顯出較強的負相關,而這幾個變量則綜合反映了生態(tài)經濟結構狀況,因此可以認為第一主成分z1是生態(tài)經濟結構的代表。 第二主成分z2與x2,x4,x5呈顯出較強的正相關,與x1呈顯出較強的負相關,其中,除了x1為人口總數外,x2,x4,x5都反映了人均占有資源量的情況,因此可以認為第二主成分z2代表了人均資源量。,分析:,顯然,用三個主成分z1、z2、z3代替原來9個變量(x1,x2,x9),描述農業(yè)生態(tài)經濟系統(tǒng),可以使問題更進一步簡化、明了。,第三主

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論