主成分分析法_第1頁
主成分分析法_第2頁
主成分分析法_第3頁
主成分分析法_第4頁
主成分分析法_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于主成分分析法PPT第1頁,課件共48頁,創(chuàng)作于2023年2月一、主成分分析法概述每個(gè)人都會(huì)遇到有很多變量的數(shù)據(jù)。這些數(shù)據(jù)的共同特點(diǎn)是變量很多,在如此多的變量之中,有很多是相關(guān)的。人們希望能夠找出它們的少數(shù)“代表”來對(duì)它們進(jìn)行描述。介紹兩種把變量維數(shù)降低以便于描述、理解和分析的方法:主成分分析(principalcomponentanalysis)和因子分析(factoranalysis)。實(shí)際上主成分分析可以說是因子分析的一個(gè)特例。第2頁,課件共48頁,創(chuàng)作于2023年2月定義:主成分分析(PrincipalComponentsAnalysis,PCA)也稱為主分量分析,是一種通過降維來簡化數(shù)據(jù)結(jié)構(gòu)的方法,即如何把多個(gè)變量(變量)轉(zhuǎn)化為少數(shù)幾個(gè)綜合變量(綜合變量),而這幾個(gè)綜合變量可以反映原來多個(gè)變量的大部分信息。主成分:把相關(guān)的變量變?yōu)闊o關(guān)的主成分。注意:進(jìn)行主成分的變量之間必須要有相關(guān)性,經(jīng)過分析后變量之間獨(dú)立。第3頁,課件共48頁,創(chuàng)作于2023年2月二、主成分分析法基本原理主成分分析就是設(shè)法將原來眾多具有一定相關(guān)性的變量(如p個(gè)變量),重新組合成一組新的相互無關(guān)的綜合變量來代替原來變量。怎么處理?通常數(shù)學(xué)上的處理就是將原來p個(gè)變量作線性組合作為新的綜合變量。如何選擇?如果將選取的第一個(gè)線性組合即第一個(gè)綜合變量記為F1,自然希望F1盡可能多的反映原來變量的信息。怎樣反映?第4頁,課件共48頁,創(chuàng)作于2023年2月最經(jīng)典的方法就是用方差來表達(dá),即var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中所選取的F1應(yīng)該是方差最大的,故稱之為第一主成分(principalcomponentI)。如果第一主成分不足以代表原來p個(gè)變量的信息,再考慮選取F2即第二個(gè)線性組合。F2稱為第二主成分(principalcomponentII)。F1和F2的關(guān)系?第5頁,課件共48頁,創(chuàng)作于2023年2月1、基于類型的古村落旅游競(jìng)爭(zhēng)力分析

本文以社區(qū)參與型古村落為主要研究對(duì)象,采用主成分分析法、層次熵法等確定主要的旅游評(píng)價(jià)指標(biāo)并獲得其貢獻(xiàn)指數(shù)。三、主成分分析法的應(yīng)用

第6頁,課件共48頁,創(chuàng)作于2023年2月2、基于主成分分析的新疆與全國旅游產(chǎn)業(yè)競(jìng)爭(zhēng)力評(píng)價(jià)

本文采用主成分分析(PCA)方法,對(duì)新疆旅游業(yè)的競(jìng)爭(zhēng)能力與全國其他省、區(qū)、直轄市進(jìn)行比較。對(duì)全國31個(gè)省、區(qū)、直轄市的310個(gè)原始數(shù)據(jù),根據(jù)PCA方法的原理和步驟進(jìn)行計(jì)算機(jī)處理,可以得到主成分因子的特征值、貢獻(xiàn)率與累積貢獻(xiàn)率及因子提取結(jié)果。前3個(gè)主成分因子的累積貢獻(xiàn)率達(dá)87.154%,根據(jù)累積貢獻(xiàn)率大于85%的主成分因子選取原則,選擇前3個(gè)主成分因子,而且選擇的3個(gè)主成分因子相互之間不存在相關(guān)性。第7頁,課件共48頁,創(chuàng)作于2023年2月四、主成分分析法的步驟1)數(shù)據(jù)歸一化處理:數(shù)據(jù)標(biāo)準(zhǔn)化(Z)2)計(jì)算相關(guān)系數(shù)矩陣R:3)計(jì)算特征值;特征值越大說明重要程度越大。4)計(jì)算主成分貢獻(xiàn)率及方差的累計(jì)貢獻(xiàn)率;5)計(jì)算主成分載荷與特征向量:

主成分的負(fù)荷值大小反映了主成分因子對(duì)可測(cè)變量的影響程度;載荷值越大說明此變量對(duì)主成分的解釋越多,及貢獻(xiàn)越大。6)寫出主成分模型第8頁,課件共48頁,創(chuàng)作于2023年2月主成分選取的條件:

(1)特征值(特征值>1);

(2)方差的累計(jì)貢獻(xiàn)率。(前K個(gè)主成分的方差累計(jì)貢獻(xiàn)率達(dá)到了80%或85%,也可以說累計(jì)貢獻(xiàn)率≥80%或≥85%)(較多)。

兩個(gè)條件滿足其一就可以了,究竟以哪個(gè)為主依個(gè)人情況而定或根據(jù)實(shí)際情況兩個(gè)結(jié)合使用。如果前K個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到了85%,則表明取前K個(gè)主成分基本包含了全部測(cè)量指標(biāo)所具有的信息,從而達(dá)到了變量降維的目的。第9頁,課件共48頁,創(chuàng)作于2023年2月五、主成分分析法的操作流程第10頁,課件共48頁,創(chuàng)作于2023年2月第11頁,課件共48頁,創(chuàng)作于2023年2月第12頁,課件共48頁,創(chuàng)作于2023年2月第13頁,課件共48頁,創(chuàng)作于2023年2月第14頁,課件共48頁,創(chuàng)作于2023年2月第15頁,課件共48頁,創(chuàng)作于2023年2月第16頁,課件共48頁,創(chuàng)作于2023年2月KMO檢驗(yàn)是在主成份分析前對(duì)數(shù)據(jù)的分析:

KMO越接近于1越好,等于相關(guān)系數(shù),≥0.5就可以。1、相關(guān)系數(shù)R:KMO檢驗(yàn)六、主成分分析法的結(jié)果分析第17頁,課件共48頁,創(chuàng)作于2023年2月第18頁,課件共48頁,創(chuàng)作于2023年2月2、確定主成分本操作是選擇以特征根大于1為標(biāo)準(zhǔn)提取主成分,提取了4個(gè)主成分。按照累積方差的觀點(diǎn),應(yīng)該提取≥80%或≥85%的值,本例題提取5個(gè)主成分,其累積方差貢獻(xiàn)率為85.644%,應(yīng)該提取前五個(gè)主成分。第19頁,課件共48頁,創(chuàng)作于2023年2月兩個(gè)條件都滿足第20頁,課件共48頁,創(chuàng)作于2023年2月3、寫出主成分模型

第21頁,課件共48頁,創(chuàng)作于2023年2月2、寫出主成分模型

主成分因子載荷矩陣:

載荷值越大,說明此變量對(duì)主成分的解釋越多,及貢獻(xiàn)越大;越大越好。第22頁,課件共48頁,創(chuàng)作于2023年2月前面的表給出的是因子載荷矩陣,主成分系數(shù)應(yīng)該為特征向量,其換算方法為:用主成分載荷矩陣中的數(shù)據(jù)除以主成分相對(duì)應(yīng)的特征值開平方根便得到兩個(gè)主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù)。(1)主成分系數(shù)(特征向量)計(jì)算第23頁,課件共48頁,創(chuàng)作于2023年2月第24頁,課件共48頁,創(chuàng)作于2023年2月第25頁,課件共48頁,創(chuàng)作于2023年2月第26頁,課件共48頁,創(chuàng)作于2023年2月第27頁,課件共48頁,創(chuàng)作于2023年2月第28頁,課件共48頁,創(chuàng)作于2023年2月第29頁,課件共48頁,創(chuàng)作于2023年2月(2)寫各主成分模型F1=0.50X1+0.40X2-0.02X3+0.07X4+0.36X5+0.14X6

F1主要表示X1、X2、X5的信息F2=1.28X1-0.18X2-0.07X3+0.38X4-0.08X5+0.50X6

F2主要表示X1、X4、X6F3=2.27X1+0.14X2-0.54X3-0.47X4-0.12X5+0.07X6

F3主要表示X1F4=3.69X1-0.01X2+0.38X3-0.13X4+0.52X5-0.03X6

F4主要表示X1、X3、X5第30頁,課件共48頁,創(chuàng)作于2023年2月主成分的綜合模型:兩個(gè)公式之意:F中X1的綜合系數(shù)w1=(F1的x1的系數(shù)×x1在F1中的方差貢獻(xiàn)率+F2的x1的系數(shù)×x1在F2中的方差貢獻(xiàn)率…Fn)/方差累計(jì)貢獻(xiàn)率注意:X1、X2在F1、F2中各自所對(duì)應(yīng)的方差貢獻(xiàn)率。

方差貢獻(xiàn)率與方差累計(jì)貢獻(xiàn)率的區(qū)別

第31頁,課件共48頁,創(chuàng)作于2023年2月主成分賦權(quán)法其中,aij描述了因子i在第j個(gè)主成分中的因子得分系數(shù),即第i個(gè)因子對(duì)第j個(gè)主成分的貢獻(xiàn),它與該主成分對(duì)應(yīng)方差的貢獻(xiàn)率Ej的組合,便是需要確定的第i個(gè)環(huán)境因子的權(quán)重值。第32頁,課件共48頁,創(chuàng)作于2023年2月主成分賦權(quán)法:計(jì)算權(quán)重集進(jìn)行歸一化處理由此即得到權(quán)重集:和為1.第33頁,課件共48頁,創(chuàng)作于2023年2月4、旋轉(zhuǎn):

從下表的因子荷載看,第三個(gè)主成分因子在10個(gè)指標(biāo)上的載荷值都不明顯,因此很難對(duì)第三個(gè)主成分因子進(jìn)行有效定義。旋轉(zhuǎn)的條件:當(dāng)某個(gè)主成分因子的各載荷值大小都不明顯,很難對(duì)此主成分因子進(jìn)行有效定義時(shí),采用旋轉(zhuǎn)進(jìn)一步分析。第34頁,課件共48頁,創(chuàng)作于2023年2月旋轉(zhuǎn)后的主成分因子載荷矩陣第35頁,課件共48頁,創(chuàng)作于2023年2月景區(qū)滿意度旋轉(zhuǎn)前后成分矩陣圖對(duì)比第36頁,課件共48頁,創(chuàng)作于2023年2月選取主成分的個(gè)數(shù),急轉(zhuǎn)處是確定主成分的個(gè)數(shù)處。5、碎石圖分析景區(qū)滿意度碎石圖第37頁,課件共48頁,創(chuàng)作于2023年2月八、與因子分析法的區(qū)別第38頁,課件共48頁,創(chuàng)作于2023年2月1、基本概念主成分分析就是將多項(xiàng)指標(biāo)轉(zhuǎn)化為少數(shù)幾項(xiàng)綜合指標(biāo),用綜合指標(biāo)來解釋多變量的方差-協(xié)方差結(jié)構(gòu)。綜合指標(biāo)即為主成分。所得出的少數(shù)幾個(gè)主成分,要盡可能多地保留原始變量的信息,且彼此不相關(guān)。因子分析是研究如何以最少的信息丟失,將眾多原始變量濃縮成少數(shù)幾個(gè)因子變量,以及如何使因子變量具有較強(qiáng)的可解釋性的一種多元統(tǒng)計(jì)分析方法。第39頁,課件共48頁,創(chuàng)作于2023年2月因子分析實(shí)例:第40頁,課件共48頁,創(chuàng)作于2023年2月第41頁,課件共48頁,創(chuàng)作于2023年2月第42頁,課件共48頁,創(chuàng)作于2023年2月2、基本思想的異同共同點(diǎn)主成分分析法和因子分析法都是用少數(shù)的幾個(gè)變量(因子)來綜合反映原始變量(因子)的主要信息,變量雖然較原始變量少,但所包含的信息量卻占原始信息的85%以上,所以即使用少數(shù)的幾個(gè)新變量,可信度也很高,也可以有效地解釋問題。并且新的變量彼此間互不相關(guān),消除了多重共線性。這兩種分析法得出的新變量,并不是原始變量篩選后剩余的變量。主成分分析和因子分析都產(chǎn)生了新變量。第43頁,課件共48頁,創(chuàng)作于2023年2月不同之處主成分分析中,最終確定的新變量是原始變量的線性組合,每個(gè)主成分都是由原有p個(gè)變量線性組合得到。在諸多主成分Zi中,Zi在方差中占的比重最大,說明它綜合原有變量的能力最強(qiáng),越往后主成分在方差中的比重也小,綜合原信息的能力越弱。因子分析是要利用少數(shù)幾個(gè)公共因子去解釋較多個(gè)要觀測(cè)變量中存在的復(fù)雜關(guān)系,它不是對(duì)原始變量的重新組合,而是對(duì)原始變量進(jìn)行分解,分解為公共因子與特殊因子兩部分。公共因子是由所有變量共同具有的少數(shù)幾個(gè)因子;特殊因子是每個(gè)原始變量獨(dú)自具有的因子。第44頁,課件共48頁,創(chuàng)作于2023年2月主成分分析是研究如何通過少數(shù)幾個(gè)主成分來解釋多變量的方差一協(xié)方差結(jié)構(gòu)的分析方法,也就是求出少數(shù)幾個(gè)主成分(變量),使它們盡可能多地保留原始變量的信息,且彼此不相關(guān)。因子分析是尋找潛在的起支配作用的因子模型的方法。因子分析是根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同的組的變量相關(guān)性較低,每組變量代表一個(gè)基本結(jié)構(gòu),這個(gè)基本結(jié)構(gòu)稱為公共因子。通過因子分析得來的新變量是對(duì)每個(gè)原始變量進(jìn)行內(nèi)部剖析。第45頁,課件共48頁,創(chuàng)作于2023年2月3、應(yīng)用中的優(yōu)缺點(diǎn)比較

主成分分析優(yōu)點(diǎn):首先它利用降維技術(shù)用少數(shù)幾個(gè)綜合變量來代替原始多個(gè)變量,這些綜合變量集中了原始變量的大部分信息。其次它通過計(jì)算綜合主成分函數(shù)得分,對(duì)客觀經(jīng)濟(jì)現(xiàn)象進(jìn)行科學(xué)評(píng)價(jià)。再次它在應(yīng)用上側(cè)重于信息貢獻(xiàn)影響力綜合評(píng)價(jià)。缺點(diǎn):當(dāng)主成分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論