應(yīng)用多元分析主成分分析作業(yè)_第1頁
應(yīng)用多元分析主成分分析作業(yè)_第2頁
應(yīng)用多元分析主成分分析作業(yè)_第3頁
應(yīng)用多元分析主成分分析作業(yè)_第4頁
應(yīng)用多元分析主成分分析作業(yè)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、應(yīng)用多元分析主成分分析6.1試述主成分分析的基本思想。答:在處理多指標變量問題的過程中,由于多個變量之間往往存在著一定程度的相關(guān)性,人們可以通過線性組合的方式,從這些指標中盡可能快的提取信息。當?shù)谝粋€組合不能提取更多信息時,再考慮第二個線性組合繼續(xù)這個快速提取的過程,如此繼續(xù)下去,直到提取的信息與原指標差不多時為止,這就是主成分分析的基本思想。6.5試述根據(jù)協(xié)差陣進行主成分分析和根據(jù)相關(guān)陣進行主成分分析的區(qū)別。 答:從相關(guān)陣求得的主成分與協(xié)差陣求得的主成分一般情況是不相同的,而實際表明,這種差異有時很大。根據(jù)協(xié)方差矩陣進行主成分分析的,其結(jié)果受變量單位的影響。不同的變量往往有不同的單位,對同一

2、變量單位的改變會產(chǎn)生不同的主成分,主成分傾向于多歸納方差大的變量的信息,對于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)”的問題。如果各指標之間的數(shù)量級相差懸殊,特別是各指標有不同的物理量綱的話,較為合理的做法是使用R代替,在采用R代替后,可以看作是用標準化的數(shù)據(jù)做分析,而且在研究單位變量大都不統(tǒng)一的經(jīng)濟問題是,會使得主成分有現(xiàn)實經(jīng)濟意義,不僅便于剖析實際問題,又可以避免突出數(shù)值大的變量。6.6已知X=(X1,X2,X3)的協(xié)差陣為 113/23/23/221/453/43/253/431/4 試進行主成分分析。解:令|-E|=11-=0計算得-64(-4)(-8)(-12)=0即特征值分

3、別為1=12,2=8,3=4所以DY1=12,DY2=8,DY3=4當1=12時,(-E)=-17經(jīng)過一系列的初等行變換可化為10-203-1000則特征向量為1=23,1,3同理,當2=8時,2=(-2,3,3)當3=4時,3=(0,-3,1)易知1,2,3相互正交,通過單位化向量可得T2=1|1|=32 ,14 ,34, T2=2|2|=-12 ,34 ,34, T3=3|3|=0 ,-32 ,12而Y1=T1X ,Y2=T2X , Y3=T3X所以,帶入數(shù)據(jù)可得第一主成分為Y1=32 X1+14 X2+34X3,DY1=12第二主成分為Y2=-12 X1+34 X2+34X3,DY2=8

4、第三主成分為Y3=-32 X2+12X3, DY3=46.7 設(shè)X=(X1,Xp)的協(xié)方差陣(pp)為 =21 1 1 , 0p1證明:1=21-1-為最大特征根,其對應(yīng)的主成分為Y1=1i=1pxi證明:令-E=2-2 222- 2 22 2-=(p-1)2+2-2 2 (p-1)2+2-2- 2 (p-1)2+2- 2 2-=p-12+2- 2 2 0 21- 2 0 0 21-=0=p-12+2-(21-)p-1又00則1=1-1-p 2 為最大特征根當1=1-1-p 2時,-1E=21-p 2 2 2 2(1-p) 2(1-p) 2 2 2(1-p)=01 000 0 00 0所以特征

5、向量為1=1,1,,1通過標準化可得T1=1p,1p,1p 即證得,Y1=1i=1pxi6.8通過對各地區(qū)的六個指標進行主成分分析,然后對各地區(qū)城市設(shè)施水平進行綜合評價和排序。解:將原始數(shù)據(jù)輸入spss編輯窗口,將六個變量分別命名為X1X6,在spss窗口選擇AnalyseData ReductionFactor菜單項,調(diào)出因子分析界面,并將六個變量移入Variable框中,其他均保持系統(tǒng)默認選項,單擊ok按鈕,執(zhí)行因子分析過程,如下圖所示。得到特征根和方差貢獻率表(表一)和因子載荷陣(表二)Total Variance ExplainedComponentInitial Eigenvalue

6、sExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %12.15535.91735.9172.15535.91735.91721.56626.09362.0101.56626.09362.01031.23020.50782.5171.23020.50782.5174.61710.28092.7975.2584.29997.0966.1742.904100.000Extraction Method: Principal Component Analysis.表

7、一Component MatrixaComponent123城市用水普及率(%).770.444-.349城市燃氣普及率(%).857.113-.208每萬人擁有公共交通車輛(標臺).246.839.291人均城市道路面積(平方米).633-.396.359人均公園綠地面積(平方米).605-.642.275每萬人擁有公共廁所(座)-.019.286.881Extraction Method: Principal Component Analysis.a. 3 components extracted.表二將表二中的因子載荷陣中的數(shù)據(jù)輸入spss數(shù)據(jù)編輯窗口,分別命名為a1,a2,a3,如下圖

8、為了計算第一個特征向量,點擊菜單中的TransformComputer,調(diào)出Computer variable對話框,在對話框中輸入等式:z1=a1/SQRT(2.155)點擊ok按鈕,即可在數(shù)據(jù)編輯窗口中得到以z1為變量名的第一特征向量,如下圖再次調(diào)出Computer variable對話框,在對話框中輸入等式:z2=a2/SQRT(1.566)點擊ok按鈕,即可在數(shù)據(jù)編輯窗口中得到以z2為變量名的第二特征向量再次調(diào)出Computer variable對話框,在對話框中輸入等式:z3=a2/SQRT(1.230)點擊ok按鈕,即可在數(shù)據(jù)編輯窗口中得到以z3為變量名的第三特征向量如此得到了如下

9、圖所示的特征向量矩陣z1z2z3x10.525 0.355 -0.315 x20.584 0.090 -0.188 x30.168 0.670 0.262 x40.431 -0.316 0.324 x50.412 -0.513 0.248 x6-0.013 0.229 0.794 根據(jù)特征向量矩陣可以得到主成分的表達式Y(jié)1=0.525x1+0.584x2+0.168x3+0.431x4+0.412x5-0.013x6Y2=0.355x1+0.090x2+0.670x3-0.316x4-0.513x5+0.229x6Y3=-0.315x1-0.188x2+0.262x3+0.324x4+0.248x5+0.794x6分別計算出以上三項后,利用公式Y(jié)=1i=13iY1+2i=13iY2+3i=13iY3得到Y(jié)=0.435Y1+0.316Y

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論