主成分分析計算方法和步驟_第1頁
主成分分析計算方法和步驟_第2頁
主成分分析計算方法和步驟_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、主成分分析計算方法和步驟:在對某一事物或現(xiàn)象進行實證研究時,為了充分反映被研究對象個體之間的差異,研究者往往 要考慮 增加測量指標(biāo),這樣就會增加研究問題的負(fù)載程度。但由于各指標(biāo)都是對同一問題的反映,會造成信息的重疊,引起變量之間的共線性,因此,在多指標(biāo)的數(shù) 據(jù)分析中,如何壓縮指 標(biāo)個數(shù)、壓縮后的指標(biāo)能否充分 反映個體之間的差異,成為研究 者關(guān)心的問題。而主成分分 析法可以很好地解決這一問題。主成分分析的應(yīng)用目 的可以簡單地歸結(jié)為:數(shù)據(jù)的壓縮、數(shù)據(jù)的解釋。它常被用來尋 找和判 斷某種事物或現(xiàn)象的綜合指標(biāo),并且對綜合指標(biāo)所包含的信息給予適當(dāng)?shù)慕忉?,從而更加?刻地揭示事物的內(nèi)在規(guī)律。主成分分析的基

2、本步驟分為:對原始指標(biāo)進行標(biāo)準(zhǔn)化,以消除變量在數(shù)量極或量 綱上的影 響;根據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣求出相關(guān)系數(shù)矩陣 R;求出R矩陣的特征 根和特征向量; 確定主成分,結(jié)合專 業(yè)知識對各主成分所蘊含的信息給予適當(dāng)?shù)慕忉?合成主成分,得到綜合評價值。結(jié)合數(shù)據(jù)進行分析本題分析的是全國各個省市高校績效評價,利用全國2014年的相關(guān)統(tǒng)計數(shù)據(jù)(見附錄),從相關(guān)的指標(biāo)數(shù)據(jù)我們無法直接評價我國各省市的高等教育績效,而通過表5-6的相關(guān)系數(shù)矩陣,可以看到許多的變量之間的相關(guān)性很高。如:招生人數(shù)與教職工人數(shù)之間具有較強的相關(guān)性, 教育投入經(jīng)費和招生人數(shù)也具有較強的相關(guān)性,教工人數(shù)與本科院校數(shù)之間的相關(guān)系數(shù)最高, 到達

3、了,而各組成成分之間的相關(guān)性都很高,這也充分說明了主成分分析的必要性。表5-6相關(guān)系數(shù)矩陣本科院校 數(shù)招生人數(shù)教育經(jīng)費投入相關(guān)性師生比重點咼校數(shù) 教工人數(shù) 本科院校數(shù) 招生人數(shù) 教育經(jīng)費投 入師生比重點咼校數(shù)教工人數(shù)相關(guān)性師生比重點咼校數(shù) 教工人數(shù) 本科院校數(shù) 招生人數(shù) 教育經(jīng)費投 入(元)表5-7給出的是各主成分的方差貢獻率和累計貢獻率,我們選取主成分的標(biāo)準(zhǔn)有兩個:第一, 特征根大于1,因為,如果特征根小于1,說明該主成分的解釋力度太弱,還比不上直接引入 一個原始變量的平均解釋力度大;第二,方差貢獻率大于85%如果這兩個標(biāo)準(zhǔn)不能同時符合要求,則往往是因為選擇的指標(biāo)不合理或者樣本容量太小 ,應(yīng)

4、繼續(xù)調(diào)整。表5-7還顯示,只有前2個特征根大于1,因此SPSS只提取了前兩個主成分,而這兩個主成分的方差貢獻率達到了 % 因此選取前兩個主成分已經(jīng)能夠很好地描述我國高等教育地區(qū)現(xiàn)狀。表5-7方差貢獻率以及累計貢獻率元 件起始特征值提取平方和載入合計方差的貢 獻率%累加貢獻率%合計方差的貢獻率%累加貢獻率%123456.571.140.052.012表5-8為輸出的主成分系數(shù)矩陣,可以說明各主成分在各變量上的載荷。由表5-8可以看出,標(biāo)準(zhǔn)化后的第一主成分(簡稱Fi)對所有變量都有載荷,且載荷絕對值幾乎都在以上, 因此可以說第一主成分是對人口結(jié)構(gòu)的度量,代表了一個地區(qū)人口結(jié)構(gòu)狀況,可以稱之為“綜合

5、 因子”。在綜合因子中,平均每戶人口,農(nóng)業(yè)與非農(nóng)業(yè)人口比例, 人口的自然增長率比重即 人 口自然增長各指標(biāo)具有較強的作用,人與經(jīng)濟等其他指標(biāo)所起的作用次之,男女比例也起一定作 用。第二主成分(簡稱F?)對重點高校數(shù)和教工人數(shù)具有負(fù)載荷,其他變量具有正載荷,并且除 師生比和重點高校數(shù)載荷絕對值均小于,有的甚至接近于。因此,第二個主成分只是匯集了第 一主成分遺漏的部分信息,我們稱之為“輔助因子”。表5-8主成分矩陣成分師生比 重點咼校數(shù) 教工人數(shù) 本科院校數(shù) 招生人數(shù) 教育經(jīng)費投 入表5-9主成分評分系數(shù)矩陣成分師生比.079.643重點咼校數(shù).099教工人數(shù).247本科院校數(shù).244.004招生

6、人數(shù).242.106教育經(jīng)費投.236.009入根據(jù)表5-9可以得到各主成分的表達式把變量分別代入以上表達式,可以得出 F1和F2兩個主成分得分,但單獨一個主成分不能很好地評價十個地區(qū)人口結(jié)構(gòu)的情況,因此需要按照各主成分對應(yīng)的方差貢獻率為權(quán)數(shù)計算綜合統(tǒng)計F,0.6639Fj 0.20691F20.87081主成分分析法的優(yōu)點:1、可消除評價指標(biāo)之間的相關(guān)影響因為主成分分析在對原指標(biāo)變量進行變換后形成了彼此相互獨立的主成分,而且實踐證明指標(biāo)之間相關(guān)程度越高,主成分分析效果越好。2、可減少指標(biāo)選擇的工作量 對于其它評價方法,由于難以消除評價指標(biāo)間的相關(guān)影響, 所以選擇 指標(biāo)時要花費不少精力,而主成

7、分分析由于可以消除這種相關(guān)影響, 所以在指標(biāo)選擇上相對容 易些。3、當(dāng)評級指標(biāo)較多時還可以在保留絕大部分信息的情況下用少數(shù)幾個綜合指標(biāo)代替 原指 標(biāo)進行分析 主成分分析中各主成分是按方差大小依次排列順序的,在分析問題時,可 以舍棄一部分主成分,只取前后方差較大的幾個主成分來代表原變量, 從而減少了計算工作量。4、在綜合評價函數(shù)中,各主成分的權(quán)數(shù)為其貢獻率,它反映了該主成分包含原始數(shù)據(jù)的信息 量占全部信息量的比重,這樣確定權(quán)數(shù)是客觀的、合理的,它克服了某些評價方法中認(rèn)為確定 權(quán)數(shù)的缺陷。5、這種方法的計算比較規(guī)范,便于在計算機上實現(xiàn),還可以利用專門的軟件主成分分析法的缺點:?1、在主成分分析中,我們首先應(yīng)保證所提取的前幾個主成分的累計貢獻率達到一個較高的水 平(即變量降維后的信息量須保持在一個較高水平上),其次對這些被提取的主成分必須都能 夠給出符合實際背景和意義的解釋(否則主成分將空有信息量而無實際含義)。 ?2、主成分的解釋其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論