版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章主成分分析二、由相關(guān)矩陣求解主成分
當(dāng)分析中所選擇的經(jīng)濟(jì)變量具有不同的量綱,變量水平差異很大,應(yīng)該選擇基于相關(guān)系數(shù)矩陣的主成分分析。
量綱對(duì)于主成分分析的影響及消除方法——對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以使每一個(gè)變量的均值為0,方差為1。
數(shù)據(jù)標(biāo)準(zhǔn)化后,總體的協(xié)方差矩陣與總體的相關(guān)系數(shù)相等.主成分與原始變量的關(guān)系式為:例:企業(yè)經(jīng)濟(jì)效益綜合分析。用5個(gè)經(jīng)濟(jì)指標(biāo)進(jìn)行考核。用相關(guān)系數(shù)矩陣法求解主成分。其中計(jì)算出的相關(guān)系數(shù)矩陣為:(1)計(jì)算其特征值:(2)各特征值的累計(jì)方差貢獻(xiàn)率為:(3)從以上方差貢獻(xiàn)率看,k=2時(shí)主成分個(gè)數(shù)較為合適。對(duì)應(yīng)的特征向量為:(4)建立第一和第二主成分:從相關(guān)系數(shù)矩陣出發(fā)求解主成分的步驟:1、標(biāo)準(zhǔn)化各觀測(cè)變量數(shù)據(jù)。2、求解標(biāo)準(zhǔn)化各觀測(cè)變量的相關(guān)系數(shù)矩陣。3、求解相關(guān)系數(shù)矩陣的特征根。4、求解各特征根對(duì)應(yīng)的特征向量。三、主成分性質(zhì)1,主成分的協(xié)方差陣為對(duì)角陣2、P個(gè)隨機(jī)變量的總方差為協(xié)方差矩陣的所有特征根之和
說(shuō)明主成分分析把P個(gè)隨機(jī)變量的總方差分解成為P個(gè)不相關(guān)的隨機(jī)變量的方差之和。當(dāng)進(jìn)行相關(guān)系數(shù)矩陣求解主成分,各變量標(biāo)準(zhǔn)化后,則p個(gè)主成分總的方差之和等于p。
3、貢獻(xiàn)率:
第i個(gè)主成分的方差在全部方差中所占比重,稱為貢獻(xiàn)率,反映了原來(lái)P個(gè)指標(biāo)多大的信息,有多大的綜合能力。
4、累積貢獻(xiàn)率:
前k個(gè)主成分共有多大的綜合能力,用這k個(gè)主成分的方差和在全部方差中所占比重來(lái)描述,稱為累積貢獻(xiàn)率。
5.原始變量與主成分之間的相關(guān)系數(shù)(因子負(fù)荷量)
和的相關(guān)密切程度與對(duì)應(yīng)線性組合系數(shù)向量成正比,與主成分標(biāo)準(zhǔn)差成正比,與原始變量的標(biāo)準(zhǔn)差成反比。當(dāng)原始變量標(biāo)準(zhǔn)化后,標(biāo)準(zhǔn)化變量與主成分的相關(guān)關(guān)系:樣本主成分求解變量X樣本協(xié)方差為總體協(xié)方差的無(wú)偏估計(jì)相關(guān)矩陣R為總體相關(guān)矩陣的估計(jì)若X已標(biāo)準(zhǔn)化,則可用相關(guān)矩陣代替協(xié)方差矩陣λ為相關(guān)矩陣的特征值將R的特征根依大小順序排列其對(duì)應(yīng)的特征向量記為U1,U2,…,Up說(shuō)明y1有最大方差,y2有次大方差。。。說(shuō)明新的綜合指標(biāo)即主成分彼此不相關(guān)樣本主成分的性質(zhì):1、第K個(gè)主成分yk的系數(shù)向量是第K個(gè)特征根λk所對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量。2、第K個(gè)主成分的方差為第K個(gè)特征根λk,且任意兩個(gè)主成分都是不相關(guān)的,也就是y1,y2,…,yp的樣本協(xié)方差矩陣是對(duì)角矩陣3、樣本主成分的總方差等于原變量樣本的總方差,為p4、第K個(gè)樣本主成分與第j個(gè)變量樣本之間的相關(guān)系數(shù)為:(因子載荷量)主成分個(gè)數(shù)的確定以及主成分分析的實(shí)現(xiàn)一、主成分個(gè)數(shù)的選取
1.累積貢獻(xiàn)率達(dá)到85%以上2.根據(jù)特征根的變化來(lái)確定數(shù)據(jù)標(biāo)準(zhǔn)化情況下:
3.作碎石圖描述特征值的貢獻(xiàn)三、主成分分析的步驟1、根據(jù)研究問(wèn)題選取初始分析變量;2、根據(jù)初始變量特性判斷用協(xié)方差矩陣求主成分還是用相關(guān)矩陣求主成分;(量綱不一致則將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理用相關(guān)矩陣求主成分)3、求協(xié)方差矩陣或相關(guān)矩陣的特征根與相應(yīng)的特征向量;4、判斷是否存在明顯的多重共線性,若存在,返回至第1步;5、得到主成分表達(dá)式并確定主成分個(gè)數(shù),依據(jù)方差貢獻(xiàn)率選取主成分;6、對(duì)主成分作出合理解釋?zhuān)⒔Y(jié)合其他研究法對(duì)研究問(wèn)題進(jìn)行深入分析。例3.
城市環(huán)境生態(tài)化是城市發(fā)展的必然趁勢(shì),表現(xiàn)為社會(huì)、經(jīng)濟(jì)、環(huán)境與生態(tài)全方位的現(xiàn)代化水平,一個(gè)符合生態(tài)規(guī)律的生態(tài)城市應(yīng)該是結(jié)構(gòu)合理、功能高效和關(guān)系協(xié)調(diào)的城市生態(tài)系統(tǒng)。所謂結(jié)構(gòu)合理是指適度的人口密度,合理的土地利用,良好的環(huán)境質(zhì)量,充足的綠地系統(tǒng),完善的基礎(chǔ)設(shè)施,有效的自然保護(hù);功能高效是指資源的優(yōu)化配置、物力的經(jīng)濟(jì)投入、人力的充分發(fā)揮、物流的暢通有序、信息流的快捷;關(guān)系協(xié)調(diào)是指人和自然協(xié)調(diào)、社會(huì)關(guān)系協(xié)調(diào)、城鄉(xiāng)協(xié)調(diào)、資源利用和更新協(xié)調(diào)。一個(gè)城市要實(shí)現(xiàn)生態(tài)城市的發(fā)展目標(biāo),關(guān)鍵是在市場(chǎng)經(jīng)濟(jì)的體制下逐步改善城市的生態(tài)環(huán)境質(zhì)量,防止生態(tài)環(huán)境質(zhì)量惡化,因此,對(duì)城市的生態(tài)環(huán)境水平調(diào)查評(píng)價(jià)很有必要。
我們對(duì)江蘇省十個(gè)城市的生態(tài)環(huán)境狀況進(jìn)行了調(diào)查,得到生態(tài)環(huán)境指標(biāo)的指數(shù)值,見(jiàn)表1?,F(xiàn)對(duì)生態(tài)環(huán)境水平分析和評(píng)價(jià)。利用Matlab中的princomp命令實(shí)現(xiàn)。具體程序如下X=[0.78830.73910.81110.65870.65430.82590.84860.68340.84950.78460.76330.72870.76290.85520.75640.74550.78000.94900.89180.89540.47450.51260.88100.89030.82880.78500.80320.88620.39870.39700.82460.76030.68880.89770.79260.78560.65090.89020.67990.98770.87910.87360.81830.94460.92020.92630.91850.95050.86200.88730.95380.92570.92850.94340.91540.88710.93570.87600.95790.97410.87850.85420.85370.90270.87290.84850.84730.90440.88660.90350.63050.61870.63130.74150.63980.61420.57340.89800.61860.73820.89280.78310.56080.84190.84640.76160.82340.63840.96040.8514];這樣,前三個(gè)主成分為
第一主成分貢獻(xiàn)率為43.12%,第二主成分貢獻(xiàn)率為29.34%,第三主成分貢獻(xiàn)率為11.97%,前三個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)84.24%。如果按80%以上的信息量選取新因子,則可以選取前三個(gè)新因子。第一新因子z1包含的信息量最大為43.12%,它的主要代表變量為X8(城市文明)、X7(生產(chǎn)效率)、X4(城市綠化),其權(quán)重系數(shù)分別為0.4815、0.4236、0.4048,反映了這三個(gè)變量與生態(tài)環(huán)境水平密切相關(guān),第二新因子Z2
包含的信息量次之為29.34%,它的主要代表變量為X3(地理結(jié)構(gòu))、X6(資源配置)、X9(可持續(xù)性),其權(quán)重系數(shù)分別為0.5299、0.5273、0.4589,第三新因子Z3包含的信息量為11.97%,代表總量為X9(可持續(xù)性)、X5(物質(zhì)還原),權(quán)重系數(shù)分別為0.5933、0.5664。這些代表變量反映了各自對(duì)該新因子作用的大小,它們是生態(tài)環(huán)境系統(tǒng)中最重要的影響因素。根據(jù)前三個(gè)主成分得分,用其貢獻(xiàn)率加權(quán),即得十個(gè)城市各自的總得分根據(jù)總得分排序,結(jié)果見(jiàn)表1。
2.主成分回歸考察進(jìn)口總額Y與三個(gè)自變量:國(guó)內(nèi)總產(chǎn)值x1,存儲(chǔ)量x2,總消費(fèi)量x3之間的關(guān)系,現(xiàn)收集數(shù)據(jù)如下,試用主成分回歸分析方法求進(jìn)口總額與總產(chǎn)值、存儲(chǔ)量和總消費(fèi)量的定量關(guān)系式.序號(hào)
x1
x2
x3
Y1234567891011149.3161.2171.5175.5180.8190.7202.1212.4226.1231.9239.04.24.13.13.11.12.22.15.65.05.10.7108.1114.8123.2126.9132.1137.7146.0154.1162.3164.3167.615.916.419.019.118.820.422.726.528.127.626.3
分析:本題目可先嘗試一般
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安裝工程分包合同書(shū)3篇
- 數(shù)據(jù)中心運(yùn)維合同3篇
- 收購(gòu)牧草合同書(shū)樣本3篇
- 教育志愿者服務(wù)合作合同3篇
- 整棟樓房租賃合同3篇
- 工業(yè)廢油再生合同3篇
- 工業(yè)灰渣再利用合同3篇
- 文藝演出音響設(shè)備租賃協(xié)議3篇
- 就讀委托代為辦理就學(xué)手續(xù)3篇
- 施工分包協(xié)議書(shū)模板3篇
- 工程報(bào)價(jià)單格式范本
- 過(guò)磅單打印模板
- 鋪貼瓷磚地磚勞務(wù)綜合施工合同
- 特選2023江蘇小高考政治試題及答案
- 全國(guó)用水總量控制指標(biāo)及跨省江河流域水量分配方案制訂技術(shù)
- 機(jī)械原理課程設(shè)計(jì)-沖壓機(jī)構(gòu)及送料機(jī)構(gòu)設(shè)計(jì)說(shuō)明書(shū)
- 智能化弱電系統(tǒng)投標(biāo)技術(shù)文件
- 年產(chǎn)萬(wàn)噸甲醇制二甲醚生產(chǎn)工藝的初步設(shè)計(jì)說(shuō)明書(shū)
- 膠原蛋白行業(yè)報(bào)告
- 新生兒科:換血療法的操作流程
- 《新媒體文案寫(xiě)作》試卷1
評(píng)論
0/150
提交評(píng)論