主成分分析法及其在SPSS中的操作_第1頁
主成分分析法及其在SPSS中的操作_第2頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、最新精品資料整理推薦.更新于二O二 O 年十二月十八口 2020年12月18日星期五19:36:31 址新資料推薦 一、主成分分析基本原理 概念:主成分分析是把原來多個(gè)變量劃為少數(shù)兒個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分 析方法。從數(shù)學(xué)角度來看,這是一種降維處理技術(shù)。 思路:一個(gè)研究對象,往往是多要素的復(fù)雜系統(tǒng)。變量太多無疑會(huì)增加分 析問題的難度和復(fù)雜性,利用原變量之間的相關(guān)關(guān)系,用較少的新變量代替原 來較多的變量,并使這些少數(shù)變量盡可能多的保留原來較多的變量所反應(yīng)的信 息,這樣問題就簡單化了。 原理:假定有 n個(gè)樣本,每個(gè)樣本共有 p 個(gè)變量,構(gòu)成一個(gè) nXp 階的數(shù)據(jù) 矩陣, 記原變量指標(biāo)為X1, X,x

2、”設(shè)它們降維處理后的綜合指標(biāo),即新變量 為 Zi,z:, z3,,Za(mWp),貝|J 勺=厶 1 州+厶 2%2 hpXp z2=l2lx+l22x2+-+l2pxp =厶內(nèi)+4勺+仏理 系數(shù) U的確定原則: Zi與 Z5 (iHj; i, j二 1, 2,,m)相互無關(guān); N 是X1,比,対的一切線性組合中方差最大者,n 是與 Z不相關(guān)的, X2,,Xp 的所有線性組合中方差最大者; Zn是與 Zl, Z2, . , ZH-1 都不相 關(guān)的 X” x2,心,的所有線性組合中方差最大者。 新變量指標(biāo) S,N,Z=分別稱為原變量指標(biāo)亞,氐,Xp 的第 1,第 2, ,第 m主成分。 從以上的

3、分析可以看出,主成分分析的實(shí)質(zhì)就是確定原來變量 X, (j二 1, 2 ,,p)在諸主成分 Zi (i二 1, 2,,m)上的荷載 g ( i二 1, 2,, m: j=l, 2 ,,p) o 址新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八口 2020年12月18日星期五19:36:31 從數(shù)學(xué)上可以證明,它們分別是相關(guān)矩陣 m個(gè)較大的特征值所對應(yīng)的特征 向量。 二、主成分分析的計(jì)算步驟 1、 計(jì)算相關(guān)系數(shù)矩陣 入“2ri/ R= 也 % rp2 g J(,盧 1, 2,,p)為原變量 k 與占的相關(guān)系數(shù),兀尸巧其計(jì)算公 式為 ” % = _ 挖Ei-耳)空(S-耳)2 A

4、-l A-1 2、 計(jì)算特征值與特征向量 解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大 小順序排列人兒、兒丫 ; 分別求出對應(yīng)于特征值人的特征向量 M,2,L,p),要求甌|二 1,即家 =1 其中表示向量耳的第丿個(gè)分量。 3、 計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率 (心 l,2,L,p) 貝獻(xiàn)率: 才九 A-I 累計(jì)貢獻(xiàn)率: V Q = l,2,L,p) 盅1 一般取累計(jì)貢獻(xiàn)率達(dá) 85%-95%的特征值,人,仏丄,人所對應(yīng)的第 1、第 2、第 m C/np)個(gè)主成分。 4、 計(jì)算主成分載荷 lij = P( (Zi ,Xj) = J入 Sj (ij = 1,2, L,p) 5、 各

5、主成分得分最新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八日2020年12月18日星期五19:36:31 11 召2 % z = 22 “2 乙嘰 三、主成分分析法在 SPSS中的操作 1、指標(biāo)數(shù)據(jù)選取、收集與錄入(表 1) 1沿海10個(gè)省帀經(jīng)濟(jì)數(shù)據(jù) 地區(qū) GDP 人均GDP 農(nóng)業(yè) 伽值 工業(yè) 增加值 第三產(chǎn)業(yè) 增加值 固定資 產(chǎn)投資 堪本建 設(shè)投資 社自消費(fèi)品 宅書總額 海關(guān)出 口總瀕 地方財(cái) 政收入 遼寧 5458.2 13000 14883.3 13762 2258.4 1315.9 529.0 2258.4 123.7 399.7 山東 10550.0 11643 1

6、390.0 3502.5 3851.0 2288.7 1070.7 3181.9 211.1 610.2 河北 6076.6 9047 950.2 1406.7 2092.6 1161.6 597.1 1968.3 45.9 302.3 天津 2022.6 22068 83.9 822.8 960.0 703.7 361.9 941.4 115.7 171.8 江蘇 10636.0 14397 1122.6 3536.3 3967.2 2320.0 1141.3 3215.8 384.7 643.7 上海 5408.8 40627 86.2 2196.2 2755.8 1970.2 779.3

7、 2035.2 320.5 709.0 浙江 7670.0 16570 6S0.0 2356.5 3065.0 2296.6 1180.6 2877.5 294.2 566.9 4682.0 13510 663.0 1047.1 1859.0 964.5 397.9 1663.3 173.7 272.9 廣東 11770.0 15030 1023.9 4224.6 4793.6 3022.9 1275.5 5013.6 1843.7 1202.0 廣西 2437.2 5062 591.4 367.0 995.7 542.2 352.7 1025.5 15.1 186.7 2、Analyze D

8、ata Reduction Factor Analysis, 彈出 Factor Analysis 對話框: S 2 Factor Analyze 對話框與 Descriptives 子對話框 3 把指標(biāo)數(shù)據(jù)選入 Variables 框,Descriptives: Correlation Matrix 框組 中選中 Coefficients,然后點(diǎn)擊 Continue,返回 Factor Analysis 對話框,單 擊 0K。 注意:SPSS在凋用Factor Analyze過程進(jìn)行分析時(shí),SPSS會(huì)自動(dòng)對原始數(shù)據(jù)進(jìn)行標(biāo)Vafiables r GDRlf $ 人均GDP|X2| 農(nóng)業(yè)增加值|

9、X3) 參工業(yè)増加BM) 砂篇三產(chǎn)業(yè)増加值 .萩E1證產(chǎn)投資旌 砂基本題設(shè)投資1X7 必1+仝法審品垂隹門 SeteslwnViaWe: a$te . Statsbc$ 環(huán) Reset jUmvariate descriptive Caroel Cancel Hdp v Iniial solution Help . txtracbon.; Sigriftcancefevefc Reproduced gelermncfi Anli-imge KMO arxlBatetl: test of sphericily OK Couelatcn Mabix & odfaentej Irr/erxe

10、 Rojatcn. : $co:es. 最新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八日2020年12月18日星期五19:36:31 準(zhǔn)化處理 ,所以在得到計(jì)算結(jié)果后的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量,但SPSS并不直接給 出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives過程進(jìn)行計(jì)算。 表3 相關(guān)系數(shù)矩殊 Ca lation Matrix GDP 人均 GDP 農(nóng)業(yè) 增加值 工業(yè) 增加值 第三 產(chǎn)業(yè) 増加值 苗總額 海關(guān) 出口 總額 地方 財(cái)政 收入 GDP 1 000 -0 094 0 052 0.967 0.979 0.923 0.922 0.9

11、41 0.637 0.826 人均GDP 0 094 1.000 0 171 0.113 0.074 0214 0093 -0 043 0 081 0273 農(nóng)業(yè)增加值 -0 052 -0.171 1.000 -0.132 0.050 0 098 0.176 0.013 0.125 086 工業(yè)増加值 0.967 0.113 -0.132 1.000 0985 0963 0939 0.935 0 705 0 898 第三產(chǎn)業(yè)增加值 0979 0.074 0 050 0.985 1.000 0.973 0.940 0.962 0.714 0.913 固定鋌產(chǎn)投還 0923 0.214 -0 09

12、8 0.963 0.973 1.000 0.971 0.937 0.717 0.934 基本if設(shè)投資 0 922 0 093 0 176 0.939 0 940 0971 1 000 0.897 0.624 848 社會(huì)消龍品零豊總額 0 941 0 043 0.013 0.935 0.962 0937 0 897 1.000 0.836 0 929 附關(guān)出口總頷 0637 0.0S1 0 125 0.705 0.714 0717 0 624 0.836 1.000 0 882 地方財(cái)畋收入 0 826 0.273 -0 086 0.898 0.913 0.934 0.848 0.929 0

13、.882 1.000 我4 方芒分解主成分提取分析農(nóng) 從表 3可知 GDP 與工業(yè)增加值,第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建 設(shè)投資、社會(huì)消費(fèi)品零售總額、地方財(cái)政收入這兒個(gè)指標(biāo)存在著極其顯著的關(guān) 系,與海關(guān)出口總額存在著顯著關(guān)系??梢娫S多變量之間直接的相關(guān)性比較強(qiáng), 證明他們存在信息上的重疊。 主成分個(gè)數(shù)提取原則為主成分對應(yīng)的特征值大于 1的詢 m個(gè)主成分。特征值 在某種程度上可以被看成是表示主成分影響力度大小的指標(biāo),如果特征值小于 1, 說明該主成分的解釋力度還不如直接引入一個(gè)原變量的平均解釋力度大,因此 一般可以用特征值大于1 作為納入標(biāo)準(zhǔn)。通過表 4(方差分解主成分提取分析)Ccupo

14、nent Initial EixnvahiM Extraction Slims of Skmared Lnadincs Total %ofVanance Qinulatn % Total % c Variance Qinwlatix % 1 7.220 72.205 72.205 7.220 72.205 72.205 2 1.235 12.346 84.551 1.235 12346 84 551 3 0.877 8 769 93 319 4 0.547 5 466 98.786 5 0.085 0.854 99 640 6 0.021 0.211 99.850 7 0.012 0.119

15、99.970 8 0.002 0.018 99.988 9 0.001 0012 100 000 10 0.000 0 000 100 000 Ccwpooeut 1 2 GDP 0 949 0.195 人均GOT 0.112 0.824 農(nóng)業(yè)tfl加值 0.109 0.677 工業(yè)堆加值 0.978 -0.005 第三產(chǎn)業(yè)增如值 0 986 0.070 固此遂產(chǎn)投資 0.983 -0.068 星本建設(shè)投資 0.947 -0024 社會(huì)消費(fèi)品寧吿總額 0977 0.176 海關(guān)出1總額 0 800 0 051 地方財(cái)政收入 0954 0.128 Total Variance Explained

16、 Extraction Kfethod- Pnnapal Component Analysis Conqoncnt Matrix* Exiractioa Nfeebd: Piincipal Caiwiienr Aoahsis. a 2 caipooents extracted 最新精品資料整理推薦.更新于二O二 O 年十二月十八口 2020年12月18日星期五19:36:31 址新資料推薦 可知,提取 2個(gè)主成分,即呼 2,從表 5(初始因子載荷矩陣)可知 GDP、工業(yè)增 加值、第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會(huì)消費(fèi)品零售總 額、海關(guān)出口總額、地方財(cái)政收入在第一主成分上有較高載荷

17、 ,說明笫一主成分基本反映了這些指標(biāo)的信息;人均 GDP 和農(nóng)業(yè)增加值指 標(biāo)在第二主成分上有較高載荷,說明第二主成分基本反映了人均 GDP 和農(nóng)業(yè)增 加值兩個(gè)指標(biāo)的信息。所以提取兩個(gè)主成分是可以基本反映全部指標(biāo)的信息, 所以決定用兩個(gè)新變量來代替原來的十個(gè)變量。但這兩個(gè)新變量的表達(dá)還不能 從輸出窗口中直接得到,因?yàn)镃omponent Matrixn是指初始因子載荷矩陣, 每一個(gè)載荷量表示主成分與對應(yīng)變量的相關(guān)系數(shù)。 用表 5(主成分載荷矩陣)中的數(shù)據(jù)除以主成分相對應(yīng)的特征值開平方根便 得到兩個(gè)主成分中每個(gè)指標(biāo)所對應(yīng)的系數(shù)。 將初始因子載荷矩陣中的兩列數(shù)據(jù) 輸入 (可用復(fù)制粘貼的方法) 到數(shù)據(jù)編

18、輯窗口 (為變量 Bl、B2),然后利用 Transform-Compute Variable”,在 Compute Variable對話框中輸入 “Al 二 B1/SQR(7.22)” 注:第二主成分 SQR 后的括號(hào)中填 1. 235,即可得到特征 向量 A(見表 6)。同理,可得到特征向量比。將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù) 據(jù)相乘,然后就可以得出主成分表達(dá)式注:因本例只是為了說明如何在 SPSS 進(jìn)行主成分分析,故在此不對提取的主成分進(jìn)行命名,有興趣的讀者可自行命 名。 F】=0.3532X1 -H).042ZX2 -0.041ZXS 403642兀 + 0.367ZX,刊.366級 +

19、0.352ZX:弋.364強(qiáng) +0.298ZXp + O.355ZX10 F2 n).175ZX -0.741ZX, +0.609卒 -0.004ZX, + 0063ZX,0.061ZX6 0.022ZX7 -Hj.SZXg 0.046ZX. 0.115ZX。最新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八日2020年12月18日星期五19:36:31 表 6 Compute Variable 對話框 ( I . 丿. *W- a?p TaroetVandbte: UpeSLbH . EZJ |) 二tr.dQ Zi SjLl? fuxtm: I_J 一i 亠二!勺亙&

20、; P茹而詼廣 .* iAKMiettvaJ-re.vje. .I J8! JjXJJ ;zS|N(aufreKpi) /: L | o I !AfiTAH:nurroxpri ZOFNCWM iJ QI Ookge_ ;CDF.BERN0ULU(q,p, !L. ! Q Pwle | Rc說 Caned , Hdp 標(biāo)準(zhǔn)化:通過 AnalyzeDescriptive StatisticsDescriptives 對話框 來實(shí)現(xiàn):彈出Descriptives 對話框后,把 XiXio選入 Variables 框,在 Save standardized values as variables 前的方框打上鉤,點(diǎn)擊OK”,經(jīng)標(biāo)準(zhǔn)化 的數(shù)據(jù)會(huì)自動(dòng)填入數(shù)據(jù)窗口中,并以 Z開頭命名。 表 7 Descriptives 對話框 二3曲心頭壬/韻紳 ; - - :: - dJ J/afiabWw _ I i. GDP JX1) _人均GDP旳 d衣業(yè)増加OB仁3 t 工業(yè)增加 M i疵:算三產(chǎn)業(yè)増崩S: q SB定次嚴(yán)嚴(yán). V Sdrvc* il/v r|Qfed Vsi*ue aa v cfiaL) )fes 以每個(gè)主成分所對應(yīng)的特征值占所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論