第七講 因子分析課件_第1頁(yè)
第七講 因子分析課件_第2頁(yè)
第七講 因子分析課件_第3頁(yè)
第七講 因子分析課件_第4頁(yè)
第七講 因子分析課件_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七講因子分析

在研究實(shí)際問(wèn)題時(shí),往往需要收集多個(gè)變量。但這樣會(huì)使多個(gè)變量間存在較強(qiáng)的相關(guān)關(guān)系,即這些變量間存在較多的信息重復(fù),直接利用它們進(jìn)行分析,不但模型復(fù)雜,還會(huì)因?yàn)樽兞块g存在多重共線性而引起較大的誤差。為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來(lái)較多的舊變量,同時(shí)要求這些新變量盡可能反映原變量的信息。因子分子正式解決這類問(wèn)題的有效方法。它們能夠提取信息,使變量簡(jiǎn)化降維,從而使問(wèn)題更加簡(jiǎn)單直觀。2024/8/251第七講因子分析

因子分析最初于1904年由心理學(xué)家Spearman提出來(lái)的,用以分析學(xué)生考試的得分。1905年由W.C.Krumbein引進(jìn)地質(zhì)學(xué)。由于此法的特點(diǎn),此后該法在經(jīng)濟(jì)學(xué)上得到廣泛的應(yīng)用。基本思路:在影響某個(gè)目標(biāo)的許多經(jīng)濟(jì)變量中,用某種方法構(gòu)造出幾個(gè)綜合指標(biāo)值,這幾個(gè)綜合指標(biāo)完全能代表原有的經(jīng)濟(jì)變量對(duì)目標(biāo)的影響,這幾個(gè)指標(biāo)值稱為公共因子,然后由這幾個(gè)公共因子與原目標(biāo)的關(guān)系,構(gòu)造出它們之間的線性函數(shù)關(guān)系,這樣可由多個(gè)影響因素簡(jiǎn)化為幾個(gè)影響因素(這些因素能夠反映原變量提供的絕大部分信息,稱為公共因子)。由此可算出每個(gè)樣品得分再進(jìn)行排序。這種方法廣泛應(yīng)用于:如若干個(gè)企業(yè)、行業(yè)或地區(qū)的綜合效率評(píng)價(jià)的排序等等。2024/8/252第七講因子分析例如,企業(yè)經(jīng)濟(jì)效益的分析在企業(yè)的經(jīng)濟(jì)效益的評(píng)價(jià)中,有許多衡量經(jīng)濟(jì)效益的指標(biāo),如固定資產(chǎn)利稅率、資金利稅率、銷售收入利稅率、固定資產(chǎn)產(chǎn)值率、資金利潤(rùn)率,這五個(gè)指標(biāo)反映了企業(yè)盈利能力;流動(dòng)資金周轉(zhuǎn)天數(shù)、全員勞動(dòng)生產(chǎn)率反映了企業(yè)的資金與人力利用狀況;而萬(wàn)元產(chǎn)值能耗反映了企業(yè)的能耗狀況。如何評(píng)價(jià)不同的企業(yè)經(jīng)濟(jì)效益?因子分析就是一種較好的綜合評(píng)價(jià)方法。2024/8/253第七講因子分析什么是因子分析?

(factoranalysis)

因子分析是通過(guò)對(duì)變量之間關(guān)系的研究,找出能綜合原始變量的少數(shù)幾個(gè)因子,使得少數(shù)因子能夠反映原始變量的絕大部分信息,然后根據(jù)相關(guān)性的大小將原始變量分組,使得組內(nèi)的變量之間相關(guān)性較高,而不同組的變量之間相關(guān)性較低。因此,因子分析屬于多元統(tǒng)計(jì)中處理降維的一種統(tǒng)計(jì)方法,其目的就是要減少變量的個(gè)數(shù),用少數(shù)因子代表多個(gè)原始變量。2024/8/254第七講因子分析

因子分析分為兩類,即R型因子分析(對(duì)變量作因子分析),Q型因子分析(對(duì)樣品作因子分析)。

下面只討論研究變量之間相關(guān)系的R型因子分析。(對(duì)樣品點(diǎn)進(jìn)行排序)2024/8/255第七講因子分析因子分析的數(shù)學(xué)模型原始的p個(gè)變量表達(dá)為k個(gè)因子的線性組合變量設(shè)p個(gè)原始變量為,要尋找的k個(gè)因子(k<p)為,主成分和原始變量之間的關(guān)系表示為系數(shù)aij為第個(gè)i變量與第k個(gè)因子之間的線性相關(guān)系數(shù),反映變量與因子之間的相關(guān)程度,也稱為載荷(loading)。由于因子出現(xiàn)在每個(gè)原始變量與因子的線性組合中,因此也稱為公因子。

為特殊因子,代表公因子以外的因素影響2024/8/256第七講因子分析因子分析的相關(guān)概念因子載荷在因子變量不相關(guān)的條件下,aij就是第i個(gè)原始變量與第j個(gè)因子變量的相關(guān)系數(shù)。aij絕對(duì)值越大,則Xi與Fi的關(guān)系越強(qiáng)變量的共同度(Communality)也稱公共方差。Xi的變量共同度為因子載荷矩陣A中第i行元素的平方和可見(jiàn):Xi的共同度反應(yīng)了全部因子變量對(duì)Xi總方差的解釋能力2024/8/257第七講因子分析因子分析的相關(guān)概念因子變量Fj的方差貢獻(xiàn)因子變量Fj的方差貢獻(xiàn)為因子載荷矩陣A中第j列各元素的平方和可見(jiàn):因子變量Fj的方差貢獻(xiàn)體現(xiàn)了同一因子Fj對(duì)原始所有變量總方差的解釋能力Sj/p表示了第j個(gè)因子解釋原所有變量總方差的比例2024/8/258第七講因子分析因子分析的步驟

(數(shù)據(jù)檢驗(yàn))因子分析要求樣本的個(gè)數(shù)要足夠多一般要求樣本的個(gè)數(shù)至少是變量的5倍以上。同時(shí),樣本總數(shù)據(jù)量理論要求應(yīng)該在100以上用于因子分析的變量必須是相關(guān)的如果原始變量都是獨(dú)立的,意味著每個(gè)變量的作用都是不可替代的,則無(wú)法降維檢驗(yàn)方法計(jì)算各變量之間的相關(guān)矩陣,觀察各相關(guān)系數(shù)。若相關(guān)矩陣中的大部分相關(guān)系數(shù)小于0.3,則不適合作因子分析使用Kaiser-Meyer-Olkin檢驗(yàn)(簡(jiǎn)稱KMO檢驗(yàn))和Bartlett球度檢驗(yàn)(Bartlett’stestofsphericity)來(lái)判斷(SPSS將兩種檢驗(yàn)統(tǒng)稱為“KMOandBartlett’stestofsphericity”)2024/8/259第七講因子分析因子分析的步驟

(數(shù)據(jù)檢驗(yàn))Bartlett球度檢驗(yàn)以變量的相關(guān)系數(shù)矩陣為基礎(chǔ),假設(shè)相關(guān)系數(shù)矩陣是單位陣(對(duì)角線元素不為0,非對(duì)角線元素均為0)。如果相關(guān)矩陣是單位陣,則各變量是獨(dú)立的,無(wú)法進(jìn)行因子分析KMO檢驗(yàn)用于檢驗(yàn)變量間的偏相關(guān)性,KMO統(tǒng)計(jì)量的取值在0~1之間如果統(tǒng)計(jì)量取值越接近1,變量間的偏相關(guān)性越強(qiáng),因子分析的效果就越好KMO統(tǒng)計(jì)量在0.7以上時(shí),因子分析效果較好;KMO統(tǒng)計(jì)量在0.5以下時(shí),因子分析效果很差2024/8/2510第七講因子分析因子分析的步驟

(因子提取)Principalcomponents(主成分法):多數(shù)情況下可以使用該方法(這也是SPSS的默認(rèn)選項(xiàng))。通過(guò)主成分分析的思想提取公因子,它假設(shè)變量是因子的線性組合UnweightLeastSquare(不加權(quán)最小平方法):該方法使實(shí)際的相關(guān)矩陣和再生的相關(guān)矩陣之差的平方和達(dá)到最小GeneralizedLeastSquare(加權(quán)最小平方法):用變量值進(jìn)行加權(quán),該方法也是使實(shí)際的相關(guān)矩陣和再生的相關(guān)矩陣之差的平方和達(dá)到最小MaximumLikelihood(最大似然法):該方法不要求數(shù)據(jù)服從正態(tài)分布,在樣本量較大時(shí)使用較好PrincipalAxisFactoring(主軸因子法):該方法從原始變量的相關(guān)性出發(fā),使得變量間的相關(guān)程度盡可能地被公因子解釋2024/8/2511第七講因子分析主成分分析的數(shù)學(xué)模型數(shù)學(xué)上的處理是將原始的p個(gè)變量作線性組合,作為新的變量設(shè)p個(gè)原始變量為,新的變量(即主成分)為,主成分和原始變量之間的關(guān)系表示為確定因子變量--主成份分析aij為第i個(gè)主成分yi和原來(lái)的第j個(gè)變量xj之間的線性相關(guān)系數(shù),稱為載荷(loading)。比如,a11表示第1主成分和原來(lái)的第1個(gè)變量之間的相關(guān)系數(shù),a21表示第2主成分和原來(lái)的第1個(gè)變量之間的相關(guān)系數(shù)2024/8/2512第七講因子分析主成分的選擇選擇幾個(gè)主成分?選擇標(biāo)準(zhǔn)是什么?被選的主成分所代表的主軸的長(zhǎng)度之和占了主軸總程度之和的大部分在統(tǒng)計(jì)上,主成分所代表的原始變量的信息用其方差來(lái)表示。因此,所選擇的第一個(gè)主成分是所有主成分中的方差最大者,即Var(yi)最大如果第一個(gè)主成分不足以代表原來(lái)的個(gè)變量,在考慮選擇第二個(gè)主成分,依次類推這些主成分互不相關(guān),且方差遞減2024/8/2513第七講因子分析主成分的選擇究竟選擇幾個(gè)主成分才合適呢?一般要求所選主成分的方差總和占全部方差的80%以上就可以了。當(dāng)然,這只是一個(gè)大體標(biāo)準(zhǔn),具體選擇幾個(gè)要看實(shí)際情況如果原來(lái)的變量之間的相關(guān)程度高,降維的效果就會(huì)好一些,所選的主成分就會(huì)少一些,如果原來(lái)的變量之間本身就不怎么相關(guān),降維的效果自然就不好不相關(guān)的變量就只能自己代表自己了2024/8/2514第七講因子分析因子分析的步驟

(因子提取)因子數(shù)量的確定用公因子方差貢獻(xiàn)率提?。号c主成分分析類似,一般累計(jì)方差貢獻(xiàn)率達(dá)到80%以上的前幾個(gè)因子可以作為最后的公因子用特征根提?。阂话阋笠蜃訉?duì)應(yīng)的特征根要大于1,因?yàn)樘卣鞲∮?說(shuō)明該共因子的解釋力度太弱,還不如使用原始變量的解釋力度大實(shí)際應(yīng)用中,因子的提取要結(jié)合具體問(wèn)題而定,在某種程度上,取決于研究者自身的知識(shí)和經(jīng)驗(yàn)

2024/8/2515第七講因子分析因子分析的步驟

(因子命名)因子命名是因子分析重要一步一個(gè)因子包含了多個(gè)原始變量的信息,它究竟反映了原始變量的哪些共同信息?因子分析得到的因子的含義是模糊的,需要重新命名,以便對(duì)研究的問(wèn)題作出合理解釋可通過(guò)考察觀察因子載荷矩陣并結(jié)合實(shí)際問(wèn)題完成命名已經(jīng)不是統(tǒng)計(jì)問(wèn)題。它需要研究者自身的專業(yè)素質(zhì)和對(duì)實(shí)際問(wèn)題背景的了解程度,這需要更多的實(shí)踐經(jīng)驗(yàn)2024/8/2516第七講因子分析因子分析的步驟

(因子命名)觀察因子載荷矩陣如果因子載荷aij的絕對(duì)值在第i行的多個(gè)列上都有較大的取值(通常大于0.5),表明原始變量與多個(gè)因子都有較大的相關(guān)關(guān)系,意味著原始變量xi需要由多個(gè)因子來(lái)共同解釋如果因子載荷aij的絕對(duì)值在第j列的多個(gè)行上都有較大的取值,則表因子fi能共同解釋許多變量的信息,而對(duì)每個(gè)原始變量只能解釋其中的少部分信息,表明因子不能有效代表任何一個(gè)原始變量,因子的含義模糊不清,難以對(duì)因子給出一個(gè)合理的解釋需要進(jìn)行因子旋轉(zhuǎn),以便得到更加合理的解釋2024/8/2517第七講因子分析因子分析的步驟

(因子命名—旋轉(zhuǎn))因子旋轉(zhuǎn)(factorrotation)的目的是使因子的含義更加清楚,以便于對(duì)因子的命名和解釋旋轉(zhuǎn)的方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)兩種正交旋轉(zhuǎn)是指坐標(biāo)軸始終保持垂直90度旋轉(zhuǎn),這樣新生成的因子仍可保持不相關(guān)斜交旋轉(zhuǎn)坐標(biāo)軸的夾角可以是任意的,因此新生成的因子不能保證不相關(guān)。因此實(shí)際應(yīng)用中更多地使用正交旋轉(zhuǎn)SPSS提供5種旋轉(zhuǎn)方法,其中最常用的是Varimax(方差最大正交旋轉(zhuǎn))法2024/8/2518第七講因子分析因子分析的步驟

(因子命名—旋轉(zhuǎn))Varimax(方差最大正交旋轉(zhuǎn)):最常用的旋轉(zhuǎn)方法。使各因子保持正交狀態(tài),但盡量使各因子的方法達(dá)到最大,即相對(duì)的載荷平方和達(dá)到最大,從而方便對(duì)因子的解釋Quartimax(四次方最大正交旋轉(zhuǎn)):該方法傾向于減少和每個(gè)變量有關(guān)的因子數(shù),從而簡(jiǎn)化對(duì)原變量的解釋Equamax(平方最大正交旋轉(zhuǎn)):該方法介于方差最大正交旋轉(zhuǎn)和四次方最大正交旋轉(zhuǎn)之間DirectOblimin(斜交旋轉(zhuǎn)):該方法需要事先指定一個(gè)因子映像的自相關(guān)范圍Promax:該方法在方差最大正交旋轉(zhuǎn)的基礎(chǔ)上進(jìn)行斜交旋轉(zhuǎn)2024/8/2519第七講因子分析因子分析的步驟

(計(jì)算因子得分)因子得分(factorscore)是每個(gè)因子在每個(gè)樣本上的具體取值,它由下列因子得分函數(shù)給出因子得分是各變量的線性組合2024/8/2520第七講因子分析構(gòu)造綜合評(píng)價(jià)函數(shù)

求出各樣品的因子得分:

Fj=bj1x1+bj2x2+……+bjpxpj=1,2,……,m

構(gòu)造綜合評(píng)價(jià)函數(shù):

F=α1F1+α2F2+……+αmFm

然后,進(jìn)行綜合得分的排序和分析。2024/8/2521第七講因子分析因子分析法的計(jì)算步驟為:數(shù)據(jù)標(biāo)準(zhǔn)化處理→相關(guān)矩陣R→求m個(gè)主成分(m個(gè)公共因子)→求因子載荷矩陣Ap×m→對(duì)Am×p進(jìn)行旋轉(zhuǎn)→計(jì)算因子得分→求出綜合評(píng)價(jià)模型。2024/8/2522第七講因子分析案例11-1:因子分析的應(yīng)用第一步:選擇因子分析法:

AnalyzeDataReduction→Factor。

2024/8/2523第七講因子分析

第二步:把變量導(dǎo)入右邊框然后進(jìn)行下面的操作:主要是設(shè)定因子分析法的輸出信息。2024/8/2524第七講因子分析點(diǎn)這按鈕,會(huì)彈出上述對(duì)話框,然后選取相應(yīng)的輸出結(jié)果。2024/8/2525第七講因子分析第三步:因子提取方法點(diǎn)這按鈕,會(huì)彈出上述對(duì)話框,然后選取相應(yīng)的輸出結(jié)果。2024/8/2526第七講因子分析第四步:旋轉(zhuǎn)點(diǎn)這按鈕,會(huì)彈出上述對(duì)話框,然后選取相應(yīng)的輸出結(jié)果。2024/8/2527第七講因子分析第五步:選取模型方法

點(diǎn)這按鈕,會(huì)彈出上述對(duì)話框,然后選取相應(yīng)的輸出結(jié)果。2024/8/2528第七講因子分析

經(jīng)過(guò)上面五步,得到輸出結(jié)果如下:2024/8/2529第七講因子分析KMO和Bartlett檢驗(yàn)。KM0統(tǒng)計(jì)量為0.882接近1,Bartlett檢驗(yàn)通過(guò),則可進(jìn)行因子分析。2024/8/2530第七講因子分析因子分析初始解1共同度

h2i。如h21=0.76,h27=0.592.2024/8/2531第七講因子分析因子分析初始解2共同度

h2i。如h21=0.767,h27=0.871.2024/8/2532第七講因子分析抽取二個(gè)公共因子的結(jié)果抽取二個(gè)公共因子并進(jìn)行最大方差旋轉(zhuǎn)后的結(jié)果.旋轉(zhuǎn)后的累計(jì)方差沒(méi)有改變,只是兩個(gè)因子所解釋的原始變量的方差發(fā)生了一些變化。

2024/8/2533第七講因子分析2024/8/2534第七講因子分析因子載荷矩陣A,aij的絕對(duì)值越大,表明公共因子Fj對(duì)xi的載荷量大。由于各公共因子的經(jīng)濟(jì)意義含糊不清,所以必須對(duì)A進(jìn)行旋轉(zhuǎn),用最大方差旋轉(zhuǎn)法計(jì)算得到如下表。2024/8/2535第七講因子分析旋轉(zhuǎn)后的因子載荷矩陣A,可看出x1,x2,x3,x4對(duì)F1依賴較大,x5,x6和x7對(duì)F2依賴較大,各公共因子的經(jīng)濟(jì)意義明確,F(xiàn)1代表內(nèi)部投資經(jīng)濟(jì),F(xiàn)2代表外來(lái)投資經(jīng)濟(jì)。2024/8/2536第七講因子分析2024/8/2537第七講因子分析

根據(jù)因子得分系數(shù)矩陣可將因子表示為變量的線性組合。2024/8/2538第七講因子分析由因子得分系數(shù)矩陣,可以將公因子表示為各變量的線性組合。得到的因子得分函數(shù)為

根據(jù)因子得分系數(shù)和原始變量的標(biāo)準(zhǔn)化值計(jì)算各觀測(cè)量的各因子的得分?jǐn)?shù)。SPSS會(huì)計(jì)算出每個(gè)因子的得分,并保存在工作表的FAC1_1和FAC2_1中。2024/8/2539第七講因子分析

綜合評(píng)價(jià)計(jì)算每個(gè)地區(qū)的因子得分每個(gè)地區(qū)的因子得分計(jì)算方法是:用每個(gè)共因子的方差貢獻(xiàn)率做權(quán)數(shù),對(duì)每個(gè)因子進(jìn)行加權(quán),然后加總得到每個(gè)地區(qū)的總因子得分按總得分的多少進(jìn)行排序,以反映各地區(qū)經(jīng)濟(jì)發(fā)展的差異2024/8/2540第七講因子分析各個(gè)地區(qū)在F1的得分值2024/8/2541第七講因子分析2024/8/2542第七講因子分析案例分析

根據(jù)我國(guó)31個(gè)省市自治區(qū)2006年的6項(xiàng)主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),進(jìn)行因子分析,對(duì)因子進(jìn)行命名和解釋,并計(jì)算因子得分和排序。2024/8/2543第七講因子分析數(shù)據(jù)的相關(guān)性檢驗(yàn)Bartlett球度檢驗(yàn)統(tǒng)計(jì)量為277.025。檢驗(yàn)的P值接近0。表明6個(gè)變量之間有較強(qiáng)的相關(guān)關(guān)系。而KMO統(tǒng)計(jì)量為0.695,接近0.7。適合作因子分析

因子分析2024/8/2544第七講因子分析因子分析共同度量

所有變量的共同度量都在80%以上,因此,提取出的公因子對(duì)原始變量的解釋能力應(yīng)該是很強(qiáng)的

2024/8/2545第七講因子分析因子分析因子方差貢獻(xiàn)率除最后3列外,其余部分與主成分分析中的表相同。“RotationSumsofSquaredLoadings”部分是因子旋轉(zhuǎn)后對(duì)原始變量方差的解釋情況。旋轉(zhuǎn)后的累計(jì)方差沒(méi)有改變,只是兩個(gè)因子所解釋的原始變量的方差發(fā)生了一些變化。2024/8/2546第七講因子分析因子分析Varimax法得到的旋轉(zhuǎn)后的因子載荷矩陣

第一個(gè)因子與年末總?cè)丝凇⒐潭ㄙY產(chǎn)投資、社會(huì)消費(fèi)品零售總額、財(cái)政收入這幾個(gè)載荷系數(shù)較大,主要解釋了這幾個(gè)變量。從實(shí)際意義上看,可以把因子1姑且命名為“經(jīng)濟(jì)水平”因子。而第二個(gè)因子與人均GDP、居民消水平這兩個(gè)變量的載荷系數(shù)較大,主要解釋了這兩個(gè)變量,從實(shí)際意義看,可以將因子2姑且命名為“消費(fèi)水平”因子(是否合理讀者自己評(píng)判)2024/8/2547第七講因子分析因子分析原始的6個(gè)變量與兩個(gè)因子的關(guān)系(模型表達(dá))表達(dá)式中的xi已經(jīng)不是原

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論