版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
SPSS在主成分分析中的應(yīng)用摘要主成成分分析是一種對數(shù)據(jù)進行分析的技術(shù),最重要的應(yīng)用是對原有數(shù)據(jù)進行簡化。本文首先對主成成分分析方法的原理進行了簡單的闡述。介紹了進行主成成分分析的工具SPSS,并以分析全國31個省市的8項經(jīng)濟目標為例,給出了詳盡的分析。實驗結(jié)果表明,主成成分分析能有效的將原有的復(fù)雜數(shù)據(jù)降維,同時包含原數(shù)據(jù)的大部分信息。關(guān)鍵詞SPSS主成分分析經(jīng)濟發(fā)展指標一.主成分分析的原理。主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如P個指標),重新組合成一組新的互相無關(guān)的綜合指標來代替原來的指標。通常數(shù)學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。最經(jīng)典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(FD越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應(yīng)該是方差最打的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F(xiàn)1已有的信息就不需要再出現(xiàn)再F2中,用數(shù)學語言表達就是要求Cov(F1,F2)=0,則稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四,……,第P個主成分。主成分模型:F=aX+aX+…aX111212 plpF=aX+aX+???aX121 222 p2pF=aX+aX+?…aX
p1p1 2p2 ppp滿足以下條件:.每個主成分系數(shù)平方和為1即:a2+a2H—a2=1(i=1,2,…m)1i 2i pi.主成分之前互不相關(guān)即:cov(F,F)=0ii.主成分方差依次遞減,即Var(F)≥Var(F)≥…Var(F)12 p二.利用SPSS進行主成成分分析實例以全國31個省市的8項經(jīng)濟指標為例,進行主成分分析。第一步:錄入或調(diào)入數(shù)據(jù)(圖1)。省份國內(nèi)生產(chǎn)居民消費I固定資產(chǎn)職HH資貨物周轉(zhuǎn)消費價格商品零售一業(yè)戶土i^北京1劃朋2505.30519.318144Co373.COP7.3C1I2,G0S43.43天津920.112/2U.JUJ4s.4o民LilUJ必上Ll115.201IU.UUW51河北2349.521258.DO7θΓS7「39UJ2033.30115.201ι?.∪u1JJ4.z!o■iLL西1092.43IALuLlJJUJJ心UJ717.30Γt.UL1I,HLlW』5內(nèi)蒙S32.S313S7.D0250.234134.□□731.7□117.5011E.S0419.33b遼寧2733.37Ξ397.DO3S7.904911.□□1371.7□116.10114.001B40.55 7當林1129.301S72.D0320.454J30.□□497.J□115.30114.30762AT~~θ事盛江201J.532334.DO435.73414500824.a□ι7e7ια114.3012d0.37g上海2462.575343.DO996.4B927900207.JO11S,7Q113.001642.95-1□iT7?616626192A101434把6943∩□102Ff口115.80114.302D2En4~?↑浙江352J.79224cl101QQA汨GG19∩□7544口11B.G01135091E5912安徵7∩MnF12nz-∣∩47411ZFm口1aγ?-∩IdB「112.70F∣24U13福建2160.52沖∩In55397∏Fn7?!?09.30IF"114.404336714江西1205.1111∩?1∩232944211004117∩116.901∣<ιnn571.94埼山東rι∩∩:M1527.001229.55帛姑m1196.60117.60114.20RT-βIG河南3002.1HiTCI670.35<44Co屈4,口rc.GC1149013Dτ,3217湖北2391.421527.3057I.334B二CoCl幻工口I2C.0C1IC.CO1220.721口湖南2I^,7C140θ.DO422.31±797Co1011.00ΓC.OC115.加043.33i□廣東5301.722399.301G39.33MZlCoCCG.CO1r.co12X.35Σ□廣西1G0E√E1314.DO332.S3510≡Co5EG.C0r∈.4t1IG.405≡4湖南36^1,17IT14」LlUU.j?七4」U」上JIU113.50111.30S4,J3Ξ四川∑?34L∣L1Jb-.JUU2J.D4UJLUUΓL.?L1L.UU14JI.JI23貴州b3L.U∕942.0015L∣.z∣?4^?∕DUJ3L1.1U121.40117.203247224云南1205.5312E1.D0334.OD6149UOmι□.w□121.3011S.1071B.5525西藏65.931110.DO17.S773S2.□□4.2□117.30114.906.57西陞百100□.0312OS.DO300.27心36.005□□.g□119.00117.00000.3027目肅553.351007.DO114.S16JS3.□O507.QO1?9,80116.50468.79寺汨165.311d46.DOd7.7B67530061.60ι7aoa116.30106.30寧亙1B9761366DO61=IB5079∩□121.a□117.10115.30114.40一門「春在n714Gq1037Fi花534S∩□33c∣Γ□119.7011Gτ04287E圖1原始數(shù)據(jù)(未經(jīng)標準化)第二步:打開“因子分析”對話框。沿著主菜單的“AnalyzefDataReduction-factor...”的路徑(圖2)打開因子分析選項框(圖3)。國全國3□個省市區(qū)曼濟龍展的8項指標-SPSSDataEditorFileEditViewDataIransforrnAnalyzeGraphsUtilitiesWindowHelp晝H?]凹SICl?∣F?□□rDescriCompcGenerCorrelRegreClassiF?卜?tiveStatistics卜一??廠reMeans 卜alLinearModel卜ate 卜5si□n 卜£ 卜^省份國內(nèi)生,匚職工工資北京~1394.E18144.002天津320.166501.003河北2849.EDataReduction ΓΓFactor...4山西儂2」5cale 卜^^NonparametricTests>MultipleResponse 卜IT4『/I-LlLJ5內(nèi)蒙832.E34134.00 6遼寧279X∣94911.00產(chǎn)費產(chǎn)資轉(zhuǎn)格售值生梢費工周價零產(chǎn)份內(nèi)民定工物費品業(yè)省國居固職貨捎商T叫胡&松筋的筋e電Options...Descriptives...Extraction...Rotation...困圖3因子分析選項框第三步:選項設(shè)置。首先,在源變量框中選中需要進行分析的變量,點擊右邊的箭頭符號,將需要的變量調(diào)入變量(Variables)欄中(圖3)。在本例中,全部8個變量都要用上,故全部調(diào)入(圖4)。因無特殊需要,故不必理會"Value...”欄。下面逐項設(shè)置。圖4將變量移到變量欄以后stesetnce5paRecaH產(chǎn)費產(chǎn)資轉(zhuǎn)格售值生消資工周價零產(chǎn)內(nèi)民定工物費品業(yè)國居固職貨港商丁1?設(shè)置DescriptiVes選項。單擊DescriptiVes按鈕(圖4),彈出DescriptiVes對話框(圖5)。FactorAnalγsis:DescriptiYesStatistics弁Univariatede≡criptives
l√initialsolutionCorrelationMatrixl√Coefficients I- InverseΓSignificance levels ?~ Reproducedl√Determinant I- Anti-imageΓKMOandBartlett'stestofsphericity圖5描述選項框在Statistics欄中選中UniVariatedescriptives復(fù)選項,則輸出結(jié)果中將會給出原始數(shù)據(jù)的抽樣均值、方差和樣本數(shù)目(這一欄結(jié)果可供檢驗參考);選中Initialsolution復(fù)選項,則會給出主成分載荷的公因子方差(這一欄數(shù)據(jù)分析時有用)。在COrrelatiOnMatriX欄中,選中COefficients復(fù)選項,則會給出原始變量的相關(guān)系數(shù)矩陣(分析時可參考);選中Determinant復(fù)選項,則會給出相關(guān)系數(shù)矩陣的行列式,如果希望在EXcel中對某些計算過程進行了解,可選此項,否則用途不大。其它復(fù)選項一般不用,但在特殊情況下可以用到(本例不選)。設(shè)置完成以后,單擊COntinue按鈕完成設(shè)置(圖5)。.設(shè)置EXtractiOn選項。打開EXtractiOn對話框(圖6)。因子提取方法主要有7種,在Method欄中可以看到,系統(tǒng)默認的提取方法是主成分.因此對此欄不作變動,就是認可了主成分分析方法。在Analyze欄中,選中CorrelationmatirX復(fù)選項,則因子分析基于數(shù)據(jù)的相關(guān)系數(shù)矩陣進行分析;如果選中COvariancematriX復(fù)選項,則因子分析基于數(shù)據(jù)的協(xié)方差矩陣進行分析。對于主成分分析而言,由于數(shù)據(jù)標準化了,這兩個結(jié)果沒有分別,因此任選其一即可。在Display欄中,選中UnrOtatedfactorsOlutiOn(非旋轉(zhuǎn)因子解)復(fù)選項,則在分析結(jié)果中給出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。對于主成分分析而言,這一項選擇與否都一樣;對于旋轉(zhuǎn)因子分析,選擇此項,可將旋轉(zhuǎn)前后的結(jié)果同時給出,以便對比。選中ScreePlot“山麓”圖),則在分析結(jié)果中給出特征根按大小分布的折線圖(形如山麓截面,故得名),以便我們直觀地判定因子的提取數(shù)量是否準確。在EXtract欄中,有兩種方法可以決定提取主成分(因子)的數(shù)目。一是根據(jù)特征根(EigenValues)的數(shù)值,系統(tǒng)默認的是Xc=1。我們知道,在主成分分析中,主成分得分的方差就是對應(yīng)的特征根數(shù)值。如果默認λ=1,則所有方差大于等于1的主成分將被保留,其余舍棄。如果覺得最后選取的主成分數(shù)量不足,可λ λ09以將c值降低,例如取C0.9;如果認為最后的提取的主成分數(shù)量偏多,則可以提高λC值,例如取XC=1.1。主成分數(shù)目是否合適,要在進行一輪分析以后才能肯定。因此,特征根數(shù)值的設(shè)定,要在反復(fù)試驗以后才能決定。一般而言,在初次分析時,最好降低特征根的臨界值(如取λ=0.8),這樣提取的主成分將會偏多,根據(jù)初次分析的結(jié)果,在第二輪分析過程中可以調(diào)整特征根的大小。第二種方法是直接指定主成分的數(shù)目即因子數(shù)目,這要選中Numberoffactors復(fù)選項。主成分的數(shù)目選多少合適?開始我們并不十分清楚。因此,首次不妨將數(shù)值設(shè)大一些,但不能超過變量數(shù)目。本例有8個變量,因此,最大的主成分提取數(shù)目為8,不得超過此數(shù)。在我們第一輪分析中,采用系統(tǒng)默認的方法提取主成分。圖6提取對話框需要注意的是:主成分計算是利用迭代(Iterations)方法,系統(tǒng)默認的迭代次數(shù)是25次。但是,當數(shù)據(jù)量較大時,25次迭代是不夠的,需要改為50次、100次乃至更多。對于本例而言,變量較少,25次迭代足夠,故無需改動。設(shè)置完成以后,單擊COntinue按鈕完成設(shè)置(圖6)。.設(shè)置ScOres設(shè)置。選中SaVeasvariables欄,則分析結(jié)果中給出標準化的主成分得分(在數(shù)據(jù)表的后面)。至于方法復(fù)選項,對主成分分析而言,三種方法沒有分別,采用系統(tǒng)默認的“回歸”(Regression)法即可。甲SaveasvariablesMethod足RegressionCBartlett「Anderson-Rubinl√DisplayfactorscoreCoefficienimatrix圖7因子得分對話框選中Displayfactorscorecoefficientmatrix則在分析結(jié)果中給出因子得分系數(shù)矩陣及其相關(guān)矩陣。設(shè)置完成以后,單擊賓口五口口0按鈕完成設(shè)置(圖7)。4?其它。對于主成分分析而言,旋轉(zhuǎn)項(Rotation)可以不必設(shè)置;對于數(shù)據(jù)沒有缺失的情況下,OptiOn項可以不必理會。全部設(shè)置完成以后,點擊OK確定,SPSS很快給出計算結(jié)果(圖8)。FactorAnalysisDescriptiveStatisticsMegnStcLDeWaIIm,∏3∣出5N國內(nèi)生產(chǎn)LK1.093-W74.∈ffi□3方居民消費1745933Θ6L6419330固?貸產(chǎn)511.S□B34D2.aes?30膽T"Γ資5457.6331310.31SD530貨物周“?fi.L4C0459,曰第59和消費愉格117.23672,0Σ53130商品零售LM用67i.a?ɑa30x?產(chǎn)魚862?99H5日43盟28 ≈COTrdatiOtiiMIatri爐國內(nèi)生產(chǎn)居民消漁固定修產(chǎn)職工工資由物周桂消法僑格商品零售工業(yè)產(chǎn)值Correlation~國內(nèi)生產(chǎn)1.000.267,951,191,617-.Ξ73-,Ξ64,974居民消藉,2b71.COO由26,7ia-.151-.235-.593,3E3固定流產(chǎn).951.4261.D∞.4D0.431-.230-.353.752職工T贄,191,710ECO1,0□0-.356-.135-.539,1E4段韌周轉(zhuǎn),617-.151-.356l,0∏0-.Ξ53.OΞΞ,659消費價格-.273-.23S-.2∞-.135-.253ι.mo.763-.1≡商品等售-.264-.593-.339-.539.022.7fi3ι.□m-.152 工業(yè)產(chǎn)值IS74,口4,659-.125-.1?2I8OCCIa.DEtEfEhait-=1.L33E<I4I.L圖8主成分分析的結(jié)果第四步,結(jié)果解讀。在因子分析結(jié)果(OUtpUt)中,首先給出的DescriptiVeStatistics,第一列Mean對應(yīng)的變量的算術(shù)平均值,計算公式為X二12jniji=1第二列Std.DeViatiOn對應(yīng)的是樣本標準差,計算公式為C=[-1-Z(X—X)2]1∕2
jn—1jji=1第三列AnalySiSN對應(yīng)是樣本數(shù)目。這一組數(shù)據(jù)在分析過程中可作參考。DescriptiveStatisticsMeanStd.DeViationAnaIySiSN國內(nèi)生產(chǎn)1921.093―1474.806033g-居民消費1745.933861.6419330固定資產(chǎn)511.5083402.8854830職工工資5457.6331310.2180530貨物周轉(zhuǎn)666.1400459.9669930消費價格117.28672.0253130商品零售114.90671.8980830工業(yè)產(chǎn)值862.9980584.5872630接下來是CorrelationMatriX相關(guān)系數(shù)矩陣),一般而言,相關(guān)系數(shù)高的變量,大多會進入同一個主成分,但不盡然,除了相關(guān)系數(shù)外,決定變量在主成分中分布地位的因素還有數(shù)據(jù)的結(jié)構(gòu)。相關(guān)系數(shù)矩陣對主成分分析具有參考價值,畢竟主成分分析是從計算相關(guān)系數(shù)矩陣的特征根開始的。相關(guān)系數(shù)陣下面的Determinant=1.133E是楠關(guān)矩陣的行列式{根據(jù)關(guān)系式det(XI—R)=0可知,det(λI)=det(R),從而Determinant=1.133E-0.4=λ1*λ2*λ3*λ4*λ5*λ6*λ7*λ8。這一點在后面將會得到驗證。CorrelationMatrba國內(nèi)生產(chǎn)居民消費固定資產(chǎn)職工工資貨物周轉(zhuǎn)消費價格商品零售工業(yè)產(chǎn)值―國內(nèi)生產(chǎn)1.000~.267~.951~.191-.617-.273-.264e.874居民消費.2671.000.426.718-.151-.235-.593.363固定資產(chǎn).951.4261.000.400.431-.280-.359.792職工工資.191.718.4001.000-.356-.135-.539.104貨物周轉(zhuǎn).617-.151.431-.3561.000-.253.022.659消費價格-.273-.235-.280-.135-.2531.000.763-.125商品零售-.264-.593-.359-.539.022.7631.000-.192工業(yè)產(chǎn)值.874.363.792.104.659-.125-.1921.000a.Determinant=1.133E-04在COmmunalitieS公因子方差)中,給出了因子載荷陣的初始公因子方差(Initial)和提取公因子方差(EXtraCtion),后面將會看到它們的含義。CommunalitieSInitialEXtraCtion國內(nèi)生產(chǎn)1.000.945居民消費1.000.800固定資產(chǎn)1.000.902職工工資1.000.875貨物周轉(zhuǎn)1.000.857消費價格1.000.957商品零售1.000.929工業(yè)產(chǎn)值1.000.903ExtractionMethod:PrincipalComponentAnalysis.在TotalVarianceEXPlained(全部解釋方差)表的InitialEigenvalues(初始特征根)中,給出了按順序排列的主成分得分的方差(TOta1),在數(shù)值上等于相關(guān)系數(shù)矩陣的各個特征根λ,因此可以直接根據(jù)特征根計算每一個主成分的方差百分比(%ofVarianCe)。由于全部特征根的總和等于變量數(shù)目,即有m=∑λi=8,故第一個特征根的方差百分比為λ1加=3.755/8=46.939,第二個特征根的百分比為λ2/m=2.197/8=27.459,……,其余依此類推。然后可以算出方差累計值(Cumulative)%在ExtractionSumsofSquaredLoadings ,給出了從左邊欄目中提取的三個主成分及有關(guān)參數(shù),提取的原則是滿足λ>1,這一點我們在圖6所示的對話框中進行了限定。TotalVarianceExplainedComponent InitialEigenValUeS EXtraCtiOnSUmSofSqUaredLOadingSTotal%ofVarianCeCumulative%Total%ofVarianCeCumulative%~3.75546.93946.939-3.75546.93946.93922.19727.45974.3982.19727.45974.39831.21515.18689.5841.21515.18689.5844.4025.03194.6155.2132.66097.2756.1381.72498.99976.5E-02.81899.8178 1.5E-02.183100.000ExtractionMethod:PrincipalComponentAnalysis.eulavnegi主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定,如前所說,相關(guān)系數(shù)矩陣的特征根剛好等于主成分的方差,而方差是變量數(shù)據(jù)蘊涵信息的重要判據(jù)之一。根據(jù)λ值決定主成分數(shù)目的準則有三:i只取λ>1的特征根對應(yīng)的主成分從TotalVarianceExplained表中可見,第一、第二和第三個主成分對應(yīng)的λ值都大于1,這意味著這三個主成分得分的方差都大于1。本例正是根據(jù)這條準則提取主成分的。ii累計百分比達到80%~85%以上的λ值對應(yīng)的主成分在TotalVarianceExplained表可以看出,前三個主成分對應(yīng)的λ值累計百分比達到89.584%,這暗示只要選取三個主成分,信息量就夠了。iii根據(jù)特征根變化的突變點決定主成分的數(shù)量從特征根分布的折線圖(ScreePlot)上可以看到,第4個λ值是一個明顯的折點,這暗示選取的主成分數(shù)目應(yīng)有p≤4(圖8)。那么,究竟是3個還是4個呢?根據(jù)前面兩條準則,選3個大致合適(但小有問題)。在ComponentMatriX(成分矩陣)中,給出了主成分載荷矩陣,每一列載荷值都顯示了各個變量與有關(guān)主成分的相關(guān)系數(shù)。以第一列為例,0.885實際上是國內(nèi)生產(chǎn)總值(GDP)與第一個主成分的相關(guān)系數(shù)。將標準化的GDP數(shù)據(jù)與第一主成分得分進行回歸,決定系數(shù)R2=0.783(圖9),容易算出R=0.885,這正是GDP在第一個主成分上的載荷。ComponentMatri* ComPonent 123國內(nèi)生產(chǎn).885.384.121居民消費.607-.598.271固定資產(chǎn).912.161.212職工工資.466-.722.368貨物周轉(zhuǎn).486.738-.275消費價格-.509.252.797商品零售-.620.594.438工業(yè)產(chǎn)值.823.427.211ExtractionMethod:PrincipalComponentAnalysis.a.3componentsextracted.下面將主成分載荷矩陣拷貝至IEXCel上面作進一步的處理:計算公因子方差和方差貢獻。首先求行平方和,例如,第一行的平方和為h12=0.88492+0.38362+0.12092=0.9449這是公因子方差。然后求列平方和,例如,第一列的平方和為s12=0.88492+0.60672…?+0.82272=3.7551這便是方差貢獻(圖10)。在Excel中有一個計算平方和的命令SumSq,可以方便地算出一組數(shù)據(jù)的平方和。顯然,列平方和即方差貢獻。事實上,有如下關(guān)系成立:相關(guān)系數(shù)矩陣的特征根=方差貢獻=主成分得分的方差至于行平方和,顯然與前面公因子方差(CommunalitieS)表中的Extraction列對應(yīng)的數(shù)據(jù)一樣。如果我們將8個主成分全部提取,則主成分載荷的行平方和都等于1(圖11),即有hi=1,sj=λjo到此可以明白:在CommunalitieS中,Initial對應(yīng)的是初始公因子方差,實際上是全部主成分的公因子方差;Extraction對應(yīng)的是提取的主成分的公因子方差,我們提取了3個主成分,故計算公因子方差時只考慮3個主成分。圖9國內(nèi)生產(chǎn)總值(GDP)的與第一主成分的相關(guān)關(guān)系(標準化數(shù)據(jù))ABCDE5第一主成分第二主成分第三主成分公因子方差6國內(nèi)生產(chǎn)0,ΘΘ49OO0.3S36150.1S03360.9448Ξ47居民消費0.606719-0.5981770.2713130.799534B固定資產(chǎn)0.9116S70.1611060.2119970.90Ξ071g職工工資0.466ΞΞΞ-0.7ΞΞ4100.367?S80.87461710貨物周轉(zhuǎn)0.4B5B310,7Ξ8Ξ75-0.2T52520,日5684511消費價格-0.50B5630.Ξ519090.7?S6330.9567181Ξ商品零售-0.6195890.5943750.4375550,9Ξ86Ξ713工業(yè)產(chǎn)值0.SΞΞ7Ξ90.4Ξ67370.Ξ10?700.90349614方差貢獻3.7551332.196T041.2148957.166T3315特征根3.7551332.1967041.214S957.166733圖10主成分方差與方差貢獻ComponentMatriX ComPonent 12345678國內(nèi)生產(chǎn).885.384.121-.203-6.87E-021.143E-022.420E-029.192E-02居民消費.607-.598.271.409-7.61E-02.1575.525E-021.317E-02固定資產(chǎn).912.161.212-.270-7.71E-028.271E-028.113E-02-7.36E-02職工工資.466-.722.368-.164.304-1.64E-02-7.62E-023.949E-03貨物周轉(zhuǎn).486.738-.275.212.3052.254E-026.855E-02-6.02E-03消費價格-.509.252.797.0722.716E-02-.161.1072.435E-03商品零售-.620.594.438-.0273.531E-02.247-9.23E-021.634E-03工業(yè)產(chǎn)值.823.427.211.209-9.38E-02-.137-.157-2.30E-02ExtractionMethod:PrincipalComponentAnalysis.a.8componentsextracted.ABCDEFGHIJ12345678公因子方差Ξ國內(nèi)生產(chǎn)0.88490.38360.1209-C.Ξ03Ξ-0.06870.31140.0242C.091913居民消費0.6067-0.5980.2713C.4085-0.07610.15680.0552C.013214固定資產(chǎn)0.yιιγ0.16110.212-C.2705-0.07710.08270.UaiL-U.OY?L5職工工黨0.4662-0.7ΞΞ0.3□τe-C.16350.30421-0.016-0.075C.003?16貨物周特0.48580.σ333-0.Ξ750.Ξ11Θ40.3050Ξ0.0Ξ2S0.O6Θ5-0.OOG17消費價格-0.5090.25190.7)6∈0.071760.0Ξ7ie-0.1∈10.10710.0024:1S兩品零售-0.620.5944O.-C.02670.035310.24∈θ-0.0520.001619工業(yè)產(chǎn)值0.82270.42670.Ξll0.2088S-0,0938-0,137-0.157-0.023110方差貢獻特征根3.75512.19673.75512.19671.21490.40Ξ440.21281.21490.40Ξ440.21280.138∣0.0654∣0.0146∣ 80.1380.0654[θ.0146[1,133E-D4圖11全部主成分的公因子方差和方差貢獻提取主成分的原則上要求公因子方差的各個數(shù)值盡可能接近,亦即要求它們的方差極小,當公因子方差完全相等時,它們的方差為0,這就達到完美狀態(tài)。實際應(yīng)用中,只要公因子方差數(shù)值彼此接近(不相差太遠)就行了。從上面給出的結(jié)果可以看出:提取3個主成分的時候,居民消費的公因子方差偏小,這暗示提取3個主成分,居民消費方面的信息可能有較多的損失。至于方差貢獻,反映對應(yīng)主成分的重要程度,這一點從方差的統(tǒng)計學意義可以得到理解。在圖11中,將最后一行的特征根全部乘到一起,得0.,這正是相關(guān)系數(shù)矩陣的行列式數(shù)值(在Excel中,求一組數(shù)據(jù)的乘積之和的命令是product)。最后說明ComponentScoreCoefficientMatrix(成分得分系數(shù)矩陣)和ComponentScoreCOvarianCeMatrix(成分得分協(xié)方差矩陣),前者是主成分得分系數(shù),后者是主成分得分的協(xié)方差即相關(guān)系數(shù)。從ComponentScoreCovarianceMatrix可以看出,標準化主成分得分之間的協(xié)方差即相關(guān)系數(shù)為0(j/k)或1(j=k),這意味著主成分之間彼此正交即垂直。初學者常將ComponentScoreCoefficientMatrix表中的數(shù)據(jù)當成主成分得分或因子得分,這是誤會。成分得分系數(shù)矩陣的數(shù)值是主成分載荷除以相應(yīng)的特征根得到的結(jié)果。在ComponentMatrix表中,將第一列數(shù)據(jù)分別除以λ1=3.755,第二列數(shù)值分別除以λ2=2.197,…,立即得到ComponentScoreCoefficient;反過來,如果將ComponentScoreCoefficientMatrix表中的各列數(shù)據(jù)分別乘以λ1=3.755,λ2=2.197,…,則可將其還原為主成分載荷即ComponentMatrix中的數(shù)據(jù)。ComponentScoreCoefficientMatrix Component 123國內(nèi)生產(chǎn).236.175.100居民消費.162-.272.223固定資產(chǎn).243.073.174職工工資.124-.329.303貨物周轉(zhuǎn).129.336-.227消費價格-.135.115.656商品零售-.165.271.360工業(yè)產(chǎn)值.219.194.174ExtractionMethod:PrincipalComponentAnalysis.ComponentScores.ComponentScoreCovarianceMatrixComponent123-11.000.000.0002.0001.000.0003 .000.0001.000ExtractionMethod:PrincipalComponentAnalysis.ComponentScores.實際上,主成分得分在原始數(shù)據(jù)所在的SPSS當前數(shù)據(jù)欄中給出,不過給出的都是標準化的主成分得分(圖12a);將各個主成分乘以相應(yīng)的√丸即特征根的二次方根可以將其還原為未經(jīng)標準化的主成分得分。得分1得分2得分3.42743-1.52320.49020,33935-178001-1.06264700551.58632■1.19211-.51028.2G259-.51833-.83667-.34594.85822.65619-.?E565-.1995S-.Ξ8G04-1.0974G.27330,22855-.6428B1.G4990-2.211322.E15G31.84235.85033.34924.97196-.32761.20469,22957,08007-1,E8897.21602-.62016-.59561-7172G.20176-.479531.540011.39457.49539.527421.44744-.85351-.14599,977271.03S43-.2117771673.231002.380G2-.07418.08G30-.59311,25733,33502-.29055-1.54444-2.18402,293711.33351,77269■1.44632.396411.10800-1.04217,487711.71494-1.04023-1.35153,01475-.91716.47667.41703-1.091S9,11265,E2990■1.21110-72563.23914-1.11530-.G71G2-.44176-.05905-.02915,92500a.標準化的主成分得分得分一得分二得分三.B4250-2.29500.64B7□,GG940-2,G023O-1.193101.381302.39050-1.33560-1,OOGOO.39530-.58090-1.5495073500-.387301.69230,9B94□-.63430-.39310-.43140-1.23100.53320.34440-.721203.252G0-3.331202.930003.532301.20340,391501.91620-.49320.22900.45300.120G0-1.89400.42600-.93470-.66040-1.41400.303G0-.537503.052002.10230.555901.040002.18140-.95620-.23S101.472901.1E510-.417601.00010.253704.G9350-1.31G00WEGO-1.16950,3Θ75O,37720-.57230-2.32800-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 疾病保險課件教學課件
- 2024年度影視版權(quán)許可協(xié)議
- 04年影視制作委托合同
- 2024年度辦公樓照明系統(tǒng)燈具更換外包協(xié)議
- 2024年度“生態(tài)修復(fù)”工程咨詢服務(wù)合同
- 制作課件教學課件
- 2024年廣告發(fā)布與裝修施工合同協(xié)議
- 2024在熔盛重工與淡水河谷砂石船建造合同簽約儀式上的致辭熔盛重工朱文花
- 2024年度暖通設(shè)備安裝及調(diào)試合同
- 2024土地使用權(quán)轉(zhuǎn)讓合同(含開發(fā)權(quán))
- 黃河商品交易市場介紹稿
- Unit 3 My friends Part C Story time(教學設(shè)計)-2024-2025學年人教PEP版英語四年級上冊
- 2024中國海油校園招聘2024人(高頻重點提升專題訓(xùn)練)共500題附帶答案詳解
- 孫中山誕辰紀念日主題班會主題班會
- 2024年安徽省合肥市中考語文題卷(含答案)
- G -B- 43630-2023 塔式和機架式服務(wù)器能效限定值及能效等級(正式版)
- 24春國開電大《工具書與文獻檢索》平時作業(yè)1-4答案
- 文藝復(fù)興經(jīng)典名著選讀 知到智慧樹網(wǎng)課答案
- 2024年北京出版集團有限責任公司招聘筆試沖刺題(帶答案解析)
- 2022-2023學年福建省廈門一中九年級(上)期中物理試卷
- 足球球性球感練習教案
評論
0/150
提交評論