應(yīng)用統(tǒng)計學(xué)因子分析與主成分分析案例解析+SPSS操作分析_第1頁
應(yīng)用統(tǒng)計學(xué)因子分析與主成分分析案例解析+SPSS操作分析_第2頁
應(yīng)用統(tǒng)計學(xué)因子分析與主成分分析案例解析+SPSS操作分析_第3頁
應(yīng)用統(tǒng)計學(xué)因子分析與主成分分析案例解析+SPSS操作分析_第4頁
應(yīng)用統(tǒng)計學(xué)因子分析與主成分分析案例解析+SPSS操作分析_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、因子分析與主成分分析學(xué)號:2010209583 姓名:錢志雷 專業(yè):信息管理與信息系統(tǒng) 班級:四班 一、 問題概述現(xiàn)希望對30個省市自治區(qū)經(jīng)濟(jì)發(fā)展基本情況的八項指標(biāo)進(jìn)行分析。具體采用的指標(biāo)只有:GDP 、居民消費(fèi)水平、固定資產(chǎn)投資、職工平均工資、貨物周轉(zhuǎn)量、居民消費(fèi)價格指數(shù)、商品零售價格指數(shù)、工業(yè)總產(chǎn)值。這是一個綜合分析問題,八項指標(biāo)較多,用主成分分析法進(jìn)行綜合。 二、 數(shù)據(jù)由于樣本數(shù)比較多,這里不再給出,可參見factor1.sav 文件 三、數(shù)據(jù)處理與分析 1. 因子分析打開數(shù)據(jù)后,在SPSS 中進(jìn)行因子分析的步驟如下: 選擇“分析-降維-因子分析”,在彈出的對話框里 (1)描述-系數(shù)、K

2、MO 與Bartlett 的球形度檢驗 (2)抽取-碎石圖、未旋轉(zhuǎn)的因子解 (3)旋轉(zhuǎn)-最大方差法、旋轉(zhuǎn)解、載荷圖(4)得分-保存為變量、顯示因子得分系數(shù)矩陣 (5)選項-按大小排序 點(diǎn)擊確定得到如下各圖:圖3-1圖3-2KMO 和 Bartlett 的檢驗取樣足夠度的 Kaiser-Meyer-Olkin 度量。 Bartlett 的球形度檢驗近似卡方 df Sig.相關(guān)矩陣GDP 固定資產(chǎn)投資職工平均工資 貨物周轉(zhuǎn)量 居民消費(fèi)價格指數(shù)商品價格指數(shù)工業(yè)總產(chǎn)值相關(guān)GDP居民消費(fèi)水平 固定資產(chǎn)投資 職工平均工資 貨物周轉(zhuǎn)量 居民消費(fèi)價格指數(shù) 商品價格指數(shù) 工業(yè)總產(chǎn)值 圖3-9 (2)因子模型中各

3、統(tǒng)計量的意義 A)因子載荷:因子載荷為第i 個變量在第j 個因子上的載荷,實際上就 是與的相關(guān)系數(shù),表示變量依賴因子的程度,反應(yīng)了第i 個變量對于第j 個因子的重要性。B )變量的變量共同度:k 個公因子對第i 個變量方差的貢獻(xiàn),也稱為公因子方差比,記為,公式為:=(j=1,2,.,k ) 表示全部公因子對變量的總方差所做出的貢獻(xiàn),也即是變量的信息能夠被k 個公因子所描述的程度。C )公因子的方差貢獻(xiàn)率:在因子載荷矩陣A 中,各列元素的平方和記為,表示第j 個公因子對于X 所提供方差的總和,它是衡量公因子相對重要性的指標(biāo)。方差貢獻(xiàn)率越大,表明公因子對X 的貢獻(xiàn)越大。 (3)基本分析結(jié)果A )K

4、MO 和球形Bartlett 檢驗用于因子分析的適用性檢驗。KMO 檢驗變量間的偏相關(guān)是否較小,Bartlett 球形檢驗是判斷相關(guān)矩陣是否是單位陣,參見圖3-2。由Bartlett 檢驗可以看出,應(yīng)拒絕個變量獨(dú)立的假設(shè),即變量間具有較強(qiáng)的相關(guān)性,但是KMO 的統(tǒng)計量為0.620,小于0.7,說明個變量間信息的重疊程度可能不是特別的高,有可能做出的因子分析模型不是很完善,但還是值得嘗試的。B )變量共同度Communalities 是表示各變量中所含原始信息能被提取的公因子所表示的程度,由圖3-3所示的變量共同度可知:幾乎所有變量的共同度都在80%以上,因此提取出的這幾個公因子對各變量的解釋能

5、力是較強(qiáng)的。C )碎石圖用于顯示各因子的重要程度,橫軸為因子序號,縱軸表示特征根大小,從中可以非常直觀的了解到哪些是最主要的因子,參見圖3-5。本例中可見前三個因子的散點(diǎn)位于陡坡之上,而后五個因子散點(diǎn)成了平臺,且特征根均小于1,因此至多考慮前三個公因子即可。D) 圖3-4給出的是各成分的方差貢獻(xiàn)率和累計貢獻(xiàn)率, 以及進(jìn)行因子旋轉(zhuǎn)后 的方差貢獻(xiàn)率和累計貢獻(xiàn)率,前者將在主成分分析中進(jìn)行說明。 E)圖3-6為因子載荷矩陣,在前面已經(jīng)直接按列的方向?qū)⑵浣忉尀閭€成分的 系數(shù),實際上嚴(yán)格講因子載荷矩陣應(yīng)該是各因子在各變量上的載荷,即是各因子 對各變量的影響度。表示如下: ZX1=0.884F1+0.385

6、F2+0.120F3+ ZX2=0.606F1-0.596F2-0.277F3+ . . ZX8=0.822F1+0.429F2-0.210F3+ 在表達(dá)式中各變量已經(jīng)不是原始變量,而是標(biāo)準(zhǔn)化變量。 表示特殊因子, 是除了這3個公因子之外影響該變量的其他因素。 原來設(shè)計了8個指標(biāo)來表示經(jīng)濟(jì) 發(fā)展水平,但是經(jīng)過因子分析后,只需要三個因子即可描述影響地區(qū)經(jīng)濟(jì)發(fā)展?fàn)?況。 F)為了使因子載荷矩陣中系數(shù)更加顯著,可以對初始因子載荷矩陣進(jìn)行轉(zhuǎn) 換,使因子和原始變量間的關(guān)系進(jìn)行重新分配,相關(guān)系數(shù)向0-1分化,從而更加 容易解釋。圖3-9是進(jìn)行因子旋轉(zhuǎn)的空間示意圖,值得注意的是旋轉(zhuǎn)前后各變量 散點(diǎn)的相對位置

7、保持不變,即旋轉(zhuǎn)并不改變因子分析的整體結(jié)果,只是影響各因 子在各變量上的載荷分布,并影響各因子的貢獻(xiàn)率。本例中采用的是方差最大正 交旋轉(zhuǎn)法進(jìn)行因子旋轉(zhuǎn),輸出的結(jié)果參見圖3-4.,由圖可知,只有前三個特征根 大于1,因此SPSS只提取了前三個公因子。在旋轉(zhuǎn)后三個公因子的方差累計貢獻(xiàn) 率均發(fā)生了變化,但仍然會保持從大到小的順序,而且前三個因子的方差貢獻(xiàn)率 仍為89.55%, 和旋轉(zhuǎn)前完全相同, 因此選前三個因子已足夠描述經(jīng)濟(jì)發(fā)展的水平。 G)進(jìn)行方差最大旋轉(zhuǎn)后,旋轉(zhuǎn)后的因子載荷矩陣如圖3-7所示,由圖可以看 出,第一公因子在 、 、 、 有較大的載荷,主要從GDP、固定資產(chǎn)投資、 貨物周轉(zhuǎn)量和工業(yè)

8、總產(chǎn)值反映經(jīng)濟(jì)發(fā)展?fàn)顩r,可以命名為總量因子。第二公因子 在 、 上有較大載荷,從居民消費(fèi)水平和職工平均工資方面反映經(jīng)濟(jì)發(fā)展水 和 上有較大載荷,表現(xiàn)為居民消 平,因此命名為消費(fèi)因子。第三公因子在 費(fèi)價格指數(shù)和水平價格指數(shù)方面,因此命名為價格因子。與未旋轉(zhuǎn)前相比較,旋 轉(zhuǎn)后各公因子的意義顯然更加明確合理。 H)因子得分:前面得到了因子結(jié)構(gòu)表達(dá)式, 可以將各變量表示為公因子 的線性形式,但是更多的時候需要將公因子表達(dá)為各變量的線性形式。公因子的 得分系數(shù)函數(shù)不能通過矩陣變換的方法由因子載荷陣得到, 只能采用估計的方法 求得,本例采用的是回歸法。因子得分系數(shù)矩陣如圖3-10所示,據(jù)此可以直接寫 出各

9、公因子的得分表達(dá)式: F1=0.306ZX1+0.025ZX2+0.270ZX3-0.025ZX4+0.248ZX5+0.070ZX6+0.077Z X7+0.317ZX8 F2=0.011ZX1+0.387ZX2+0.129ZX3+0.451ZX4-0.319ZX5+0.180ZX6-0.098Z X7+0.026ZX8 F3=0.047ZX1+0.040ZX2+0.075ZX3+0.096ZX4-0.139ZX5+0.653ZX6+0.462Z X7+0.123ZX8 SPSS已經(jīng)給出三個公因子的得分,保存在fac_1fac_3中,按各因子對應(yīng)的 方差貢獻(xiàn)率為權(quán)數(shù)計算如下綜合統(tǒng)計量: F=

10、 F1+ F2+ F3 =0.730F1+0.141F2+0.129F3 在SPSS中用程序計算綜合因子得分: Comp score=0.73* fac1_1+0.141* fac2_1+0.129* fac3_1 2.主成分分析 A由圖 3-1(各變量相關(guān)系數(shù)矩陣)可以看出,許多變量之間直接的相關(guān)性比 較強(qiáng),的確存在信息上的重疊。 B由圖 3-4(具體不再闡述)可知,只有前三個特征根大于 1,因此 SPSS 只 提取了前三個主成分,前三個主成分的方差貢獻(xiàn)率達(dá)到 89.55%,因此選前 三個主成分已足夠描述經(jīng)濟(jì)發(fā)展的水平。 C圖 3-6 輸出為主成分系數(shù)矩陣,從而得到各主成分的表達(dá)式,在表達(dá)式

11、中 各變量已經(jīng)不是原始變量,而是標(biāo)準(zhǔn)化變量。 F1=0.884ZX1+0.606ZX2+0.911ZX3+0.465ZX4+0.486ZX5-0.51ZX6-0.621ZX 7+0.822ZX8 F2=0.385ZX1-0.596ZX2+0.163ZX3-0.725ZX4+0.737ZX5+0.257ZX6-0.596Z X7+0.429ZX8 F3=0.120ZX1+0.277ZX2+0.213ZX3+0.362ZX4-0.279ZX5+0.794X6-0.433ZX 7+0.210ZX8 因為各自變量已經(jīng)過標(biāo)準(zhǔn)化,因此以上三個主成分的均數(shù)均為 0。 可以證明,各主成分的方差應(yīng)當(dāng)為前述特征根 ,但這里計算的數(shù)值方差均 為特征根的平方,即各主成分的原始數(shù)值還應(yīng)該除以一個特征根的平方根才行, 但是因為不會對分析結(jié)果產(chǎn)生影響,因此在這里不再給出詳細(xì)計算過程及結(jié)果。 在第一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論