主成分分析 第二講_第1頁
主成分分析 第二講_第2頁
主成分分析 第二講_第3頁
主成分分析 第二講_第4頁
主成分分析 第二講_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第七章主成分分析二、由相關(guān)矩陣求解主成分

當(dāng)分析中所選擇的經(jīng)濟變量具有不同的量綱,變量水平差異很大,應(yīng)該選擇基于相關(guān)系數(shù)矩陣的主成分分析。

量綱對于主成分分析的影響及消除方法——對數(shù)據(jù)進行標(biāo)準化處理,以使每一個變量的均值為0,方差為1。

數(shù)據(jù)標(biāo)準化后,總體的協(xié)方差矩陣與總體的相關(guān)系數(shù)相等.主成分與原始變量的關(guān)系式為:例:企業(yè)經(jīng)濟效益綜合分析。用5個經(jīng)濟指標(biāo)進行考核。用相關(guān)系數(shù)矩陣法求解主成分。其中計算出的相關(guān)系數(shù)矩陣為:(1)計算其特征值:(2)各特征值的累計方差貢獻率為:(3)從以上方差貢獻率看,k=2時主成分個數(shù)較為合適。對應(yīng)的特征向量為:(4)建立第一和第二主成分:從相關(guān)系數(shù)矩陣出發(fā)求解主成分的步驟:1、標(biāo)準化各觀測變量數(shù)據(jù)。2、求解標(biāo)準化各觀測變量的相關(guān)系數(shù)矩陣。3、求解相關(guān)系數(shù)矩陣的特征根。4、求解各特征根對應(yīng)的特征向量。三、主成分性質(zhì)1,主成分的協(xié)方差陣為對角陣2、P個隨機變量的總方差為協(xié)方差矩陣的所有特征根之和

說明主成分分析把P個隨機變量的總方差分解成為P個不相關(guān)的隨機變量的方差之和。當(dāng)進行相關(guān)系數(shù)矩陣求解主成分,各變量標(biāo)準化后,則p個主成分總的方差之和等于p。

3、貢獻率:

第i個主成分的方差在全部方差中所占比重,稱為貢獻率,反映了原來P個指標(biāo)多大的信息,有多大的綜合能力。

4、累積貢獻率:

前k個主成分共有多大的綜合能力,用這k個主成分的方差和在全部方差中所占比重來描述,稱為累積貢獻率。

5.原始變量與主成分之間的相關(guān)系數(shù)(因子負荷量)

和的相關(guān)密切程度與對應(yīng)線性組合系數(shù)向量成正比,與主成分標(biāo)準差成正比,與原始變量的標(biāo)準差成反比。當(dāng)原始變量標(biāo)準化后,標(biāo)準化變量與主成分的相關(guān)關(guān)系:樣本主成分求解變量X樣本協(xié)方差為總體協(xié)方差的無偏估計相關(guān)矩陣R為總體相關(guān)矩陣的估計若X已標(biāo)準化,則可用相關(guān)矩陣代替協(xié)方差矩陣λ為相關(guān)矩陣的特征值將R的特征根依大小順序排列其對應(yīng)的特征向量記為U1,U2,…,Up說明y1有最大方差,y2有次大方差。。。說明新的綜合指標(biāo)即主成分彼此不相關(guān)樣本主成分的性質(zhì):1、第K個主成分yk的系數(shù)向量是第K個特征根λk所對應(yīng)的標(biāo)準化特征向量。2、第K個主成分的方差為第K個特征根λk,且任意兩個主成分都是不相關(guān)的,也就是y1,y2,…,yp的樣本協(xié)方差矩陣是對角矩陣3、樣本主成分的總方差等于原變量樣本的總方差,為p4、第K個樣本主成分與第j個變量樣本之間的相關(guān)系數(shù)為:(因子載荷量)主成分個數(shù)的確定以及主成分分析的實現(xiàn)一、主成分個數(shù)的選取

1.累積貢獻率達到85%以上2.根據(jù)特征根的變化來確定數(shù)據(jù)標(biāo)準化情況下:

3.作碎石圖描述特征值的貢獻三、主成分分析的步驟1、根據(jù)研究問題選取初始分析變量;2、根據(jù)初始變量特性判斷用協(xié)方差矩陣求主成分還是用相關(guān)矩陣求主成分;(量綱不一致則將原始數(shù)據(jù)進行標(biāo)準化處理用相關(guān)矩陣求主成分)3、求協(xié)方差矩陣或相關(guān)矩陣的特征根與相應(yīng)的特征向量;4、判斷是否存在明顯的多重共線性,若存在,返回至第1步;5、得到主成分表達式并確定主成分個數(shù),依據(jù)方差貢獻率選取主成分;6、對主成分作出合理解釋,并結(jié)合其他研究法對研究問題進行深入分析。例3.

城市環(huán)境生態(tài)化是城市發(fā)展的必然趁勢,表現(xiàn)為社會、經(jīng)濟、環(huán)境與生態(tài)全方位的現(xiàn)代化水平,一個符合生態(tài)規(guī)律的生態(tài)城市應(yīng)該是結(jié)構(gòu)合理、功能高效和關(guān)系協(xié)調(diào)的城市生態(tài)系統(tǒng)。所謂結(jié)構(gòu)合理是指適度的人口密度,合理的土地利用,良好的環(huán)境質(zhì)量,充足的綠地系統(tǒng),完善的基礎(chǔ)設(shè)施,有效的自然保護;功能高效是指資源的優(yōu)化配置、物力的經(jīng)濟投入、人力的充分發(fā)揮、物流的暢通有序、信息流的快捷;關(guān)系協(xié)調(diào)是指人和自然協(xié)調(diào)、社會關(guān)系協(xié)調(diào)、城鄉(xiāng)協(xié)調(diào)、資源利用和更新協(xié)調(diào)。一個城市要實現(xiàn)生態(tài)城市的發(fā)展目標(biāo),關(guān)鍵是在市場經(jīng)濟的體制下逐步改善城市的生態(tài)環(huán)境質(zhì)量,防止生態(tài)環(huán)境質(zhì)量惡化,因此,對城市的生態(tài)環(huán)境水平調(diào)查評價很有必要。

我們對江蘇省十個城市的生態(tài)環(huán)境狀況進行了調(diào)查,得到生態(tài)環(huán)境指標(biāo)的指數(shù)值,見表1?,F(xiàn)對生態(tài)環(huán)境水平分析和評價。利用Matlab中的princomp命令實現(xiàn)。具體程序如下X=[0.78830.73910.81110.65870.65430.82590.84860.68340.84950.78460.76330.72870.76290.85520.75640.74550.78000.94900.89180.89540.47450.51260.88100.89030.82880.78500.80320.88620.39870.39700.82460.76030.68880.89770.79260.78560.65090.89020.67990.98770.87910.87360.81830.94460.92020.92630.91850.95050.86200.88730.95380.92570.92850.94340.91540.88710.93570.87600.95790.97410.87850.85420.85370.90270.87290.84850.84730.90440.88660.90350.63050.61870.63130.74150.63980.61420.57340.89800.61860.73820.89280.78310.56080.84190.84640.76160.82340.63840.96040.8514];這樣,前三個主成分為

第一主成分貢獻率為43.12%,第二主成分貢獻率為29.34%,第三主成分貢獻率為11.97%,前三個主成分累計貢獻率達84.24%。如果按80%以上的信息量選取新因子,則可以選取前三個新因子。第一新因子z1包含的信息量最大為43.12%,它的主要代表變量為X8(城市文明)、X7(生產(chǎn)效率)、X4(城市綠化),其權(quán)重系數(shù)分別為0.4815、0.4236、0.4048,反映了這三個變量與生態(tài)環(huán)境水平密切相關(guān),第二新因子Z2

包含的信息量次之為29.34%,它的主要代表變量為X3(地理結(jié)構(gòu))、X6(資源配置)、X9(可持續(xù)性),其權(quán)重系數(shù)分別為0.5299、0.5273、0.4589,第三新因子Z3包含的信息量為11.97%,代表總量為X9(可持續(xù)性)、X5(物質(zhì)還原),權(quán)重系數(shù)分別為0.5933、0.5664。這些代表變量反映了各自對該新因子作用的大小,它們是生態(tài)環(huán)境系統(tǒng)中最重要的影響因素。根據(jù)前三個主成分得分,用其貢獻率加權(quán),即得十個城市各自的總得分根據(jù)總得分排序,結(jié)果見表1。

2.主成分回歸考察進口總額Y與三個自變量:國內(nèi)總產(chǎn)值x1,存儲量x2,總消費量x3之間的關(guān)系,現(xiàn)收集數(shù)據(jù)如下,試用主成分回歸分析方法求進口總額與總產(chǎn)值、存儲量和總消費量的定量關(guān)系式.序號

x1

x2

x3

Y1234567891011149.3161.2171.5175.5180.8190.7202.1212.4226.1231.9239.04.24.13.13.11.12.22.15.65.05.10.7108.1114.8123.2126.9132.1137.7146.0154.1162.3164.3167.615.916.419.019.118.820.422.726.528.127.626.3

分析:本題目可先嘗試一般

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論