主成分分析計(jì)算方法和步驟56323_第1頁(yè)
主成分分析計(jì)算方法和步驟56323_第2頁(yè)
主成分分析計(jì)算方法和步驟56323_第3頁(yè)
主成分分析計(jì)算方法和步驟56323_第4頁(yè)
主成分分析計(jì)算方法和步驟56323_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.主成分分析計(jì)算方法和步驟:在對(duì)某一事物或現(xiàn)象進(jìn)行實(shí)證研究時(shí),為了充分反映被研究對(duì)象個(gè)體之間的差異, 研究者往往要考慮 增加測(cè)量指標(biāo),這樣就會(huì)增加研究問(wèn)題的負(fù)載程度。但由于各指標(biāo)都 是對(duì)同一問(wèn)題的反映,會(huì)造成信息的重疊,引起變量之間的共線性,因此,在多指標(biāo)的數(shù) 據(jù)分析中,如何壓縮指標(biāo)個(gè)數(shù)、壓縮后的指標(biāo)能否充分 反映個(gè)體之間的差異,成為研究 者關(guān)心的問(wèn)題。而主成分分析法可以很好地解決這一問(wèn)題。主成分分析的應(yīng)用目 的可以簡(jiǎn)單地歸結(jié)為: 數(shù)據(jù)的壓縮、數(shù)據(jù)的解釋。它常被用來(lái)尋 找和判斷某種事物或現(xiàn)象的綜合指標(biāo),并 且對(duì)綜合指標(biāo)所包含的信息給予適當(dāng)?shù)慕忉? 從而更加深刻地揭示事物的內(nèi)在規(guī)律。主成分分析的

2、基本步驟分為: 對(duì)原始指標(biāo)進(jìn)行標(biāo)準(zhǔn)化,以消除變量在數(shù)量極或量 綱上的影響;根據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣求出相關(guān)系數(shù)矩陣 r; 求出 r 矩陣的特征 根和特征向量; 確定主成分,結(jié)合專 業(yè)知識(shí)對(duì)各主成分所蘊(yùn)含的信息給予適當(dāng)?shù)慕?釋;合成主成分,得到綜合評(píng)價(jià)值。結(jié)合數(shù)據(jù)進(jìn)行分析本題分析的是全國(guó)各個(gè)省市高???jī)效評(píng)價(jià),利用全國(guó)2014年的相關(guān)統(tǒng)計(jì)數(shù)據(jù)(見(jiàn)附錄),從相關(guān)的指標(biāo)數(shù)據(jù)我們無(wú)法直接評(píng)價(jià)我國(guó)各省市的高等教育績(jī)效,而通過(guò)表5-6的相關(guān)系數(shù)矩陣,可以看到許多的變量之間的相關(guān)性很高。如:招生人數(shù)與教職工人數(shù)之間具有較強(qiáng)的相關(guān)性,教育投入經(jīng)費(fèi)和招生人數(shù)也具有較強(qiáng)的相關(guān)性,教工人數(shù)與本科院校數(shù)之間的相關(guān)系數(shù)最高

3、,到達(dá)了0.963,而各組成成分之間的相關(guān)性都很高,這也充分說(shuō)明了主成分分析的必要性。精品.表5-6 相關(guān)系數(shù)矩陣本科院校數(shù)招生人數(shù)教育經(jīng)費(fèi)投入相關(guān)性師生比0.2790.3290.252重點(diǎn)高校數(shù)0.3450.2040.310教工人數(shù)0.9630.9540.896本科院校數(shù)1.0000.9380.881招生人數(shù)0.9381.0000.893教育經(jīng)費(fèi)投入0.8810.8931.000師生比重點(diǎn)高校數(shù)教工人數(shù)相關(guān)性師生比1.000-0.2180.208重點(diǎn)高校數(shù)-0.2181.0000.433教工人數(shù)0.2080.4331.000本科院校數(shù)0.2790.3450.963精品.招生人數(shù)0.3290.

4、2040.954教育經(jīng)費(fèi)投入(元)0.2520.3100.896表5-7給出的是各主成分的方差貢獻(xiàn)率和累計(jì)貢獻(xiàn)率,我們選取主成分的標(biāo)準(zhǔn)有兩個(gè):第一,特征根大于1,因?yàn)椋绻卣鞲∮?,說(shuō)明該主成分的解釋力度太弱,還比不上直接引入一個(gè)原始變量的平均解釋力度大;第二,方差貢獻(xiàn)率大于85%,如果這兩個(gè)標(biāo)準(zhǔn)不能同時(shí)符合要求,則往往是因?yàn)檫x擇的指標(biāo)不合理或者樣本容量太小,應(yīng)繼續(xù)調(diào)整。表5-7還顯示,只有前2個(gè)特征根大于1,因此spss只提取了前兩個(gè)主成分,而這兩個(gè)主成分的方差貢獻(xiàn)率達(dá)到了87.081%,因此選取前兩個(gè)主成分已經(jīng)能夠很好地描述我國(guó)高等教育地區(qū)現(xiàn)狀。表5-7 方差貢獻(xiàn)率以及累計(jì)貢獻(xiàn)率元件起

5、始特征值提取平方和載入合計(jì)方差的貢獻(xiàn)率 %累加貢獻(xiàn)率 %合計(jì)方差的貢獻(xiàn)率 %累加貢獻(xiàn)率 %13.98366.39066.3903.98366.39066.39021.24120.69187.0811.24120.69187.081精品.30.5719.50896.589.5719.50896.58940.1402.33598.925.1402.33598.92550.0520.86999.794.0520.86999.79460.0120.206100.000.0120.206100.000表5-8為輸出的主成分系數(shù)矩陣,可以說(shuō)明各主成分在各變量上的載荷。由表5-8可以看出,標(biāo)準(zhǔn)化后的第一主成

6、分( 簡(jiǎn)稱) 對(duì)所有變量都有載荷,且載荷絕對(duì)值幾乎都在0.7以上, 因此可以說(shuō)第一主成分是對(duì)人口結(jié)構(gòu)的度量,代表了一個(gè)地區(qū)人口結(jié)構(gòu)狀況,可以稱之為“綜合因子”。在綜合因子中,平均每戶人口,農(nóng)業(yè)與非農(nóng)業(yè)人口比例, 人口的自然增長(zhǎng)率比重即 人口自然增長(zhǎng)各指標(biāo)具有較強(qiáng)的作用,人與經(jīng)濟(jì)等其他指標(biāo)所起的作用次之,男女比例也起一定作用。第二主成分( 簡(jiǎn)稱 ) 對(duì)重點(diǎn)高校數(shù)和教工人數(shù)具有負(fù)載荷,其他變量具有正載荷,并且除 師生比和重點(diǎn)高校數(shù)載荷絕對(duì)值均小于0.2,有的甚至 接近于 0.1。因此,第二個(gè)主成分只是匯集了第一主成分遺漏的部分信息,我們稱之為“輔助 因子”。表5-8主成分矩陣成分師生比0.3170

7、.799重點(diǎn)高校數(shù)0.396-0.759精品.教工人數(shù)0.984-0.095本科院校數(shù)0.9730.005招生人數(shù)0.9640.131教育經(jīng)費(fèi)投入0.9390.011表5-9 主成分評(píng)分系數(shù)矩陣成分師生比.079.643重點(diǎn)高校數(shù).099-.612教工人數(shù).247-.077本科院校數(shù).244.004招生人數(shù).242.106教育經(jīng)費(fèi)投入.236.009精品.根據(jù)表5-9可以得到各主成分的表達(dá)式把變量分別代入以上表達(dá)式,可以得出和兩個(gè)主成分得分,但單獨(dú)一個(gè)主成分不能很好地評(píng)價(jià)十個(gè)地區(qū)人口結(jié)構(gòu)的情況,因此需要按照各主成分對(duì)應(yīng)的方差貢獻(xiàn)率為權(quán)數(shù)計(jì)算綜合統(tǒng)計(jì)f,()主成分分析法的優(yōu)點(diǎn): 1、 可消除評(píng)價(jià)

8、指標(biāo)之間的相關(guān)影響 因?yàn)橹鞒煞址治鲈趯?duì)原指標(biāo)變量進(jìn)行變換后形成了彼此相互獨(dú)立的主成分,而且實(shí)踐證明指標(biāo)之間相關(guān)程度越高,主成分分析效果越好。 2、 可減少指標(biāo)選擇的工作量 對(duì)于其它評(píng)價(jià)方法,由于難以消除評(píng)價(jià)指標(biāo)間的相關(guān)影響,所以選擇指標(biāo)時(shí)要花費(fèi)不少精力,而主成分分析由于可以消除這種相關(guān)影響,所以在指標(biāo)選擇上相對(duì)容易些。 3、 當(dāng)評(píng)級(jí)指標(biāo)較多時(shí)還可以在保留絕大部分信息的情況下用少數(shù)幾個(gè)綜合指標(biāo)代替原指 標(biāo)進(jìn)行分析 主成分分析中各主成分是按方差大小依次排列順序的,在分析問(wèn)題時(shí),可以舍棄一部分主成分,只取前后方差較大的幾個(gè)主成分來(lái)代表原變量,從而減少了計(jì)算工作量。 4、 在綜合評(píng)價(jià)函數(shù)中,各主成分的權(quán)數(shù)為其貢獻(xiàn)率,它反映了該主成分包含原始數(shù)據(jù)的信 息量占全部信息量的比重,這樣確定權(quán)數(shù)是客觀的、合理的,它克服了某些評(píng)價(jià)方法中認(rèn)為確定權(quán)數(shù)的缺陷。 5、 這種方法的計(jì)算比較規(guī)范,便于在計(jì)算機(jī)上實(shí)現(xiàn),還可以利用專門(mén)的軟件精品.主成分分析法的缺點(diǎn):1、在主成分分析中,我們首先應(yīng)保證所提取的前幾個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的水平(即變量降維后的信息量須保持在一個(gè)較高水平上),其次對(duì)這些被提取的主成分必須都能夠給出符合實(shí)際背景和意義的解釋(否則主成分將空有信息量而無(wú)實(shí)際含義)。2、主成分的解釋其

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論