版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第11章主成分分析與因子分析
在實(shí)際問題中,我們?cè)O(shè)計(jì)調(diào)查表,收集到大量指標(biāo)(變量)數(shù)據(jù),但這些指標(biāo)間通常不是相互獨(dú)立,而是相關(guān)的。此時(shí),為了簡(jiǎn)化問題,我們就可以運(yùn)用主成分分析法,在眾多的指標(biāo)中找出少數(shù)幾個(gè)綜合性指標(biāo),來反映原來指標(biāo)所反映的主要信息(即,絕大部分的方差),實(shí)現(xiàn)簡(jiǎn)化問題的目的。例如,企業(yè)的利潤(rùn)、成本、市場(chǎng)占有率等是明顯相關(guān)的;某地區(qū)的企業(yè)數(shù)、GDP、物流量、信息量等也是明顯相關(guān)的;一組青年中人的年齡、身高、肺活量等指標(biāo)之間,通常也存在著相關(guān)性。對(duì)這些相關(guān)性較強(qiáng)的指標(biāo),可通過主成分分析法實(shí)現(xiàn)復(fù)雜問題的簡(jiǎn)單化。一、主成分分析基本概念
主成分(Principalcomponents)分析是把給定的一組變量,通過線性變換,轉(zhuǎn)化為一組不相關(guān)的變量。在這種變量的轉(zhuǎn)化過程中,變量的總方差(的方差之和)保持不變。同時(shí),使具有最大方差,稱為第一主成分;具有次大方差,稱為第二主成分。依次類推,原來有k個(gè)變量,就可以轉(zhuǎn)換出k個(gè)主成分。但在實(shí)際應(yīng)用中,為了簡(jiǎn)化問題,通常不是找出k個(gè)主成分,而是找出q(q<k)個(gè)主成分就夠了,只要這q個(gè)主成分反映出原來k個(gè)變量的絕大部分的方差就行。
調(diào)查n個(gè)個(gè)體(樣本)在k個(gè)指標(biāo)下的數(shù)值(或者用
k個(gè)指標(biāo)來評(píng)價(jià)n個(gè)對(duì)象),就可得到數(shù)據(jù)矩陣:
統(tǒng)計(jì)描述現(xiàn)在的目的是要求解出,使得即簡(jiǎn)記為向量Y滿足如下條件:指標(biāo)
之間不相關(guān)。方差盡可能大,即對(duì)n
個(gè)對(duì)象的分辨率盡可能強(qiáng),信息損失盡可能的少。主成分分析小結(jié):(1)從相關(guān)的多個(gè)指標(biāo)中,求出相互獨(dú)立的多個(gè)指標(biāo)。(2)的方差信息不損失,盡可能等同于的方差。
X
與Y
的轉(zhuǎn)換關(guān)系為:幾何解釋
在下圖的坐標(biāo)中,散點(diǎn)大致為橢圓狀。經(jīng)過線性變換可以得到新的坐標(biāo)。在橢圓的長(zhǎng)軸上,反映出了散點(diǎn)在這個(gè)方向的最大方差。在橢圓的短軸上,反映出了散點(diǎn)在這個(gè)方向的方差。主成分的計(jì)算流程步驟一:對(duì)矩陣而言(它是k階的實(shí)對(duì)稱矩陣),首先找到它的k個(gè)實(shí)特征根。步驟二:相應(yīng)的k個(gè)長(zhǎng)度為1的、相互正交的特征向量,
即特征向量矩陣為式中,,。
主成分的計(jì)算流程步驟三:按如下方法得到主成分:式中,。是相互正交的綜合變量。將k個(gè)主成分放到一起可得矩陣表達(dá)式:主成分的計(jì)算流程主成分更為明晰的表達(dá)式:
主成分的計(jì)算流程結(jié)語(yǔ):若從中只取q個(gè),就能使則,就是體現(xiàn)了原來多指標(biāo)下數(shù)據(jù)主要信息的少數(shù)幾個(gè)綜合性指標(biāo),就是我們要找的主成分。主成分分析實(shí)例例1:全國(guó)經(jīng)濟(jì)發(fā)展基本情況的指標(biāo)主要有八項(xiàng):GDP、居民消費(fèi)水平、固定資產(chǎn)投資、職工平均工資、貨物周轉(zhuǎn)量、居民消費(fèi)價(jià)格指數(shù)、商品零售價(jià)格指數(shù)、工業(yè)總產(chǎn)值,現(xiàn)收集有全國(guó)30個(gè)省市自治區(qū)的相關(guān)指標(biāo)(見例),請(qǐng)用主成分分析方法選出適當(dāng)?shù)闹笜?biāo)項(xiàng)。二、因子分析
方法概述
人們?cè)谘芯繉?shí)際問題時(shí),往往希望盡可能多的收集相關(guān)變量,以期望對(duì)問題有比較全面、完整的把握和認(rèn)識(shí)。為解決這些問題,最簡(jiǎn)單和最直接的解決方案是減少變量數(shù)目,但這必然又會(huì)導(dǎo)致信息丟失或不完整等問題。為此,人們希望探索一種有效的解決方法,它既能減少參與數(shù)據(jù)分析的變量個(gè)數(shù),同時(shí)也不會(huì)造成統(tǒng)計(jì)信息的大量浪費(fèi)和丟失。因子分析就是在盡可能不損失信息或者少損失信息的情況下,將多個(gè)變量減少為少數(shù)幾個(gè)因子的方法。這幾個(gè)因子可以高度概括大量數(shù)據(jù)中的信息,這樣,既減少了變量個(gè)數(shù),又同樣能再現(xiàn)變量之間的內(nèi)在聯(lián)系。
二、因子分析因子分析方法是利用各變量間存在一定的相關(guān)關(guān)系,用較少的綜合指標(biāo)分別綜合存在于各變量中的相關(guān)關(guān)系,而綜合指標(biāo)之間彼此不相關(guān),即各指標(biāo)代表的信息不重疊。代表各類信息的綜合指標(biāo)就稱為因子變量或公因子。這種方法能以較少的因子變量和最小的信息損失來解釋變量之間的結(jié)構(gòu)。因子分析概述因子變量的特點(diǎn):(1)因子變量的數(shù)量遠(yuǎn)少于原有變量的數(shù)量,對(duì)因子變量的分析可以減少分析中的計(jì)算工作量。(2)因子變量并不是原有變量簡(jiǎn)單的取舍,而是對(duì)原始變量的重新組構(gòu),他們能夠反映原始眾多變量的絕大部分信息,不會(huì)產(chǎn)生重要信息的丟失。(3)因子變量之間沒有線性相關(guān)關(guān)系,對(duì)因子變量的分析就能避開原始變量的共線性問題,使研究工作更加簡(jiǎn)便。(4)因子變量具有命名解釋性。因子變量的命名解釋性可以理解為某個(gè)因子變量是對(duì)某些原始變量的總和,它能夠反映這些原始變量的絕大部分信息。因此我們可以對(duì)因子變量根據(jù)專業(yè)知識(shí)和其所反映的獨(dú)特含義給予命名。因子分析概述因子分析的主要應(yīng)用有兩方面:一是尋求基本結(jié)構(gòu),簡(jiǎn)化觀測(cè)系統(tǒng),將具有錯(cuò)綜復(fù)雜關(guān)系的變量綜合為少數(shù)幾個(gè)因子(不可觀測(cè)的,相互獨(dú)立的隨機(jī)變量),以再現(xiàn)因子與原始變量之間的內(nèi)在聯(lián)系;二是用于分類,對(duì)p個(gè)變量或n個(gè)樣本進(jìn)行分類。因子分析概述因子分析根據(jù)研究對(duì)象可以分為R型和Q型因子分析:R型因子分析研究變量之間的相關(guān)關(guān)系,通過對(duì)變量的相關(guān)陣或協(xié)差陣內(nèi)部結(jié)構(gòu)的研究,找出控制所有變量的幾個(gè)公共因子,用以對(duì)變量或樣本進(jìn)行分類。Q型因子分析研究樣本之間的相關(guān)關(guān)系,通過對(duì)樣本的相似矩陣內(nèi)部結(jié)構(gòu)的研究找出控制所有樣本的幾個(gè)主因子。這兩種因子分析的處理方法一樣,只是出發(fā)點(diǎn)不同。R型從變量的相關(guān)陣出發(fā),Q型從樣本相似陣出發(fā)。因子分析實(shí)例為了了解青年對(duì)婚姻家庭的態(tài)度,隨機(jī)訪問了100人,詢問了30個(gè)問題,把這些問題歸結(jié)于不可測(cè)的因子變量,即對(duì)外型的重視、對(duì)孩子的教育觀點(diǎn)、對(duì)家庭的重視、對(duì)金錢的重視等其它方面,因子分析的目的就是要建立一個(gè)模型,用這些不可測(cè)的、所有原始變量共有的因子變量和一些每個(gè)原始變量所特有的特殊因子來描述可測(cè)的原始變量,進(jìn)而分析和解釋青年人對(duì)婚姻家庭的態(tài)度。因子模型描述如下:因子分析模型因子分析模型那么因子分析模型可以構(gòu)造成:因子分析模型則稱上式為因子模型,它的矩陣形式為:其中矩陣是待估系數(shù)矩陣,稱為因子載荷矩陣,系數(shù)a11稱為變量X1在因子F1上的載荷。稱F1,F(xiàn)2,…,F(xiàn)m為的公共因子,它一般對(duì)X每一個(gè)分量Xi都有作用;稱為的X1特殊因子,它起著殘差的作用,只對(duì)X1起作用因子分析模型因子模型的四個(gè)關(guān)鍵性假設(shè):因子分析的基本步驟因子分析的標(biāo)準(zhǔn)分析步驟為:(1)根據(jù)具體問題,判斷待分析的原始若干變量是否適合作因子分析,并采用某些檢驗(yàn)方法來判斷數(shù)據(jù)是否符合分析要求。(2)選擇提取公因子的方法,并按一定標(biāo)準(zhǔn)確定提取的公因子數(shù)目。(3)考察公因子的可解釋性,并在必要時(shí)進(jìn)行因子旋轉(zhuǎn),以尋求最佳的解釋方式。(4)計(jì)算出因子得分等中間指標(biāo)進(jìn)一步分析使用。1.判斷原始變量是否適合進(jìn)行因子分析因子分析有一個(gè)默認(rèn)的前提條件,就是原始各變量間必須有較強(qiáng)的相關(guān)性,否則根本無法從中綜合出能反映原始變量結(jié)構(gòu)的因子變量,這就是因子分析最為嚴(yán)格的前提要求,所以一般在進(jìn)行具體的因子分析前,需先對(duì)原始變量進(jìn)行相關(guān)分析。最簡(jiǎn)單的方法是計(jì)算變量之間的相關(guān)系數(shù)矩陣并進(jìn)行統(tǒng)計(jì)檢驗(yàn)。如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)都小于0.3且未通過統(tǒng)計(jì)檢驗(yàn),那么,這些變量就不適合作因子分析。除此之外,SPSS還提供了幾種幫助判斷變量是否適合作因子分析的統(tǒng)計(jì)檢驗(yàn)方法:1.判斷原始變量是否適合進(jìn)行因子分析(1)巴特利特球度檢驗(yàn)(Bartletttestofsphericity)巴特利特球度檢驗(yàn)原假設(shè)H0是:相關(guān)陣是單位陣,即各變量各自獨(dú)立。巴特利特球度檢驗(yàn)的統(tǒng)計(jì)量根據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算得到。如果該統(tǒng)計(jì)量值比較大,且其對(duì)應(yīng)的相伴概率值小于用戶心中的顯著性水平,則應(yīng)拒絕H0
,認(rèn)為相關(guān)系數(shù)矩陣不太可能是單位陣,適合作因子分析;相反,如果該統(tǒng)計(jì)量值比較小,且其對(duì)應(yīng)的相伴概率值大于用戶心中的顯著性水平,則不能拒絕H0
,可以認(rèn)為相關(guān)系數(shù)矩陣可能是單位陣,不適合作因子分析。1.判斷原始變量是否適合進(jìn)行因子分析(2)反映象相關(guān)矩陣(Anti-imagecorrelationmatrix)檢驗(yàn)反映象相關(guān)矩陣檢驗(yàn)是將偏相關(guān)系數(shù)矩陣的每個(gè)元素取反,得到反映象相關(guān)陣。如果變量之間確實(shí)存在較強(qiáng)的相互重疊傳遞影響,由于計(jì)算偏相關(guān)系數(shù)時(shí)是在控制其它變量對(duì)兩變量影響的條件下計(jì)算出來的凈相關(guān)系數(shù),因此如果變量中確實(shí)能夠提取出公共因子,那么偏相關(guān)系數(shù)必然很小,則反映象相關(guān)矩陣中的有些元素的絕對(duì)值比較大,則說明這些變量可能不適合作因子分析。1.判斷原始變量是否適合進(jìn)行因子分析(3)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)KMO統(tǒng)計(jì)量是比較各變量間簡(jiǎn)單相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小??梢?,KMO統(tǒng)計(jì)量的取值在0和1之間,KMO統(tǒng)計(jì)量越接近1,則越適合作因子分析,KMO越小,則越不適合作因子分析。一般認(rèn)為,KMO值大于0.9就非常適合,0.7以上效果一般;0.6則不太適合,0.5以下不適合。2.提取公因子和確定公因子數(shù)目因子分析有許多提取公因子的方法,如主成分分析法,最大似然法,α因子提取法等,其中應(yīng)用最廣泛的是主成分分析法。主成份分析法的目的是從原始的多個(gè)變量取若干線性組合,使得能盡可能多地保留原始變量中的信息。主成分分析法是通過坐標(biāo)變換手段,將原始變量轉(zhuǎn)換到新變量,是一個(gè)正交變換(坐標(biāo)變換)。2.提取公因子和確定公因子數(shù)目該方程組要求:考慮它的線性變換:設(shè)有
是一個(gè)p維隨機(jī)變量2.提取公因子和確定公因子數(shù)目2.提取公因子和確定公因子數(shù)目分別將如上確定的成為原始數(shù)據(jù)的第一、第二、……第p主成分。在實(shí)際應(yīng)用中,我們往往只需要能反映原始數(shù)據(jù)絕大部分信息的少數(shù)幾個(gè)主成分即可,因此一般選取前面幾個(gè)方差最大的主成分。2.提取公因子和確定公因子數(shù)目基于上述基本原理,現(xiàn)將主成分模型的系數(shù)求解步驟歸納如下:(1)將原有變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。(2)計(jì)算變量的簡(jiǎn)單相關(guān)系數(shù)矩陣。(3)求解協(xié)方差陣的特征根,并將特征值從大到小排序并重新編碼:2.提取公因子和確定公因子數(shù)目(4)按預(yù)先規(guī)定所取的P個(gè)公因子的累計(jì)方差貢獻(xiàn)率達(dá)到的百分比m%2.提取公因子和確定公因子數(shù)目(6)寫出因子負(fù)荷陣2.提取公因子和確定公因子數(shù)目選定提取因子方法的同時(shí),還需確定所需提取的公因子的數(shù)目。其實(shí)在確定公因子數(shù)量的問題上,并無統(tǒng)一的原則來遵循,也無統(tǒng)一的標(biāo)準(zhǔn)來確定所應(yīng)該有的公因子數(shù)目,一般來說,主要通過以下幾個(gè)方面來確定公因子數(shù)量。2.提取公因子和確定公因子數(shù)目(1)根據(jù)特征根來確定。特征根在某種程度上可以被看成是表示公因子影響力度大小的指標(biāo),如果特征根小于1,說明該公因子的解釋力度還不如直接引入一個(gè)原變量的平均解釋力度大。因此在SPSS中默認(rèn)用特征根大于1作為納入標(biāo)準(zhǔn)。2.提取公因子和確定公因子數(shù)目(2)根據(jù)公因子的累積方差貢獻(xiàn)率來確定。其實(shí)公因子的累積方差貢獻(xiàn)率也就是前面在主成分分析中講到的主成分的累積貢獻(xiàn)率。一般來說,提取公因子的方差累積貢獻(xiàn)率達(dá)到85%-90%以上就比較滿意了,可以此決定需要提取多少個(gè)公因子。2.提取公因子和確定公因子數(shù)目大量的實(shí)踐表明,根據(jù)方差累積貢獻(xiàn)率確定公因子數(shù)往往較多,而用特征根來確定又往往偏低,許多時(shí)候應(yīng)當(dāng)將兩者結(jié)合起來,以綜合確定合適的數(shù)量。其實(shí)在因子分析中,提取公因子數(shù)量的原則重點(diǎn)在于提取出的公因子的可解釋性上,如果有實(shí)際意義,即使貢獻(xiàn)率較小,也可以考慮保留。而如果特征根大于1,但是找不到合理的解釋,則也可考慮將該公因子去除。3.公因子的命名解釋某個(gè)原始變量xi同時(shí)與幾個(gè)公因子都有比較大的相關(guān)關(guān)系,即xi的信息要由若干個(gè)公因子共同解釋;同時(shí),雖然一個(gè)公因子能夠解釋許多原始變量的信息,但它都只是解釋每一個(gè)原始變量的一部分信息,而不是任何一個(gè)變量的典型代表。這樣在按照默認(rèn)的分解方式,各因子可能難以找到所代表的實(shí)際意義3.公因子的命名解釋因子模型的一個(gè)特點(diǎn):因子載荷陣不唯一,則可以利用這一特點(diǎn)對(duì)因子載荷矩陣進(jìn)行適當(dāng)?shù)男D(zhuǎn),使公因子載荷系數(shù)向更大(向1)或更小(向0)方向變化,使得對(duì)公因子的命名和解釋變得更加容易,但保持因子載荷矩陣A各行的元素的平方和即變量X的共同度不變。實(shí)現(xiàn)以上目的是通過因子軸的旋轉(zhuǎn)進(jìn)行變換的。3.公因子的命名解釋設(shè)從公因子F旋轉(zhuǎn)到公因子G,則模型變?yōu)椋菏切D(zhuǎn)后的因子模型,其中b11仍稱為因子載荷。由旋轉(zhuǎn)前后的模型比較可以看出旋轉(zhuǎn)并不會(huì)影響公因子的提取過程和結(jié)果,只會(huì)改變?cè)甲兞康男畔⒘吭诓煌蜃由系姆植?,即改變因子載荷陣。3.公因子的命名解釋常用的旋轉(zhuǎn)方法可分為正交和斜交兩大類。在因子旋轉(zhuǎn)過程中如果因子軸仍相互正交,則稱為正交旋轉(zhuǎn)。如果因子軸之間不是相互正交的,則是斜交旋轉(zhuǎn)。進(jìn)行正交變換可以保證變換后各因子仍正交,這是比較理想的情況。3.公因子的命名解釋常用的是方差最大化正交旋轉(zhuǎn)(Varimax),它旋轉(zhuǎn)的原則是各因子仍保持直角正交,但使得因子間方差的差異達(dá)到最大,即使得在每個(gè)因子具有較高載荷的變量個(gè)數(shù)最小化。這種方法一般能簡(jiǎn)化對(duì)因子的解釋。3.公因子的命名解釋但如果正交變換后對(duì)公因子仍然不易解釋,也可以進(jìn)行斜交旋轉(zhuǎn),或許可以得到比較容易解釋的結(jié)果。斜交旋轉(zhuǎn)最常用的是傾斜旋轉(zhuǎn)(Promax),這種方法是在方差最大化正交旋轉(zhuǎn)的基礎(chǔ)上進(jìn)行斜交旋轉(zhuǎn),計(jì)算速度較快,旋轉(zhuǎn)后允許因子間存在相關(guān)(交角非直角)。3.公因子的命名解釋在對(duì)因子矩陣進(jìn)行旋轉(zhuǎn)以后,就必須給不同的因子進(jìn)行命名。因子命名有一些原則:(1)因子分析的命名必須簡(jiǎn)明、用盡量少的詞(2~3個(gè))去解釋因子。(2)必須要注重不同因子荷載高的變量之間的相似性(3)可以根據(jù)因子中包含什么樣的變量來給因子命名。4.計(jì)算因子得分在因子分析中,還可以將公因子表示為原始變量的線性組合,這樣就可以從原始變量的觀測(cè)值估計(jì)各個(gè)公因子的值,求出的此值就是因子得分。4.計(jì)算因子得分由此可以得到以下模型:稱為因子得分模型,每一個(gè)式子都是因子得分函數(shù)。由它可計(jì)算出每個(gè)樣本的因子得分。SPSS在因子分析中的應(yīng)用
3、基本步驟總結(jié)(1)確認(rèn)待分析的原變量是否適合作因子分析因子分析的主要任務(wù)是將原有變量的信息重疊部分提取和綜合成因子,進(jìn)而最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。故它要求原始變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。進(jìn)行因子分析前,通??梢圆扇∮?jì)算相關(guān)系數(shù)矩陣、巴特利特球度檢驗(yàn)和KMO檢驗(yàn)等方法來檢驗(yàn)候選數(shù)據(jù)是否適合采用因子分析。(2)構(gòu)造因子變量將原有變量綜合成少數(shù)幾個(gè)因子是因子分析的核心內(nèi)容。它的關(guān)鍵是根據(jù)樣本數(shù)據(jù)求解因子載荷陣。因子載荷陣的求解方法有基于主成分模型的主成分分析法、基于因子分析模型的主軸因子法、極大似然法等。SPSS在因子分析中的應(yīng)用
(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性將原有變量綜合為少數(shù)幾個(gè)因子后,如果因子的實(shí)際含義不清,則不利于后續(xù)分析。為解決這個(gè)問題,可通過因子旋轉(zhuǎn)的方式使一個(gè)變量只在盡可能少的因子上有比較高的載荷,這樣使提取出的因子具有更好的解釋性。(4)計(jì)算因子變量得分實(shí)際中,當(dāng)因子確定以后,便可計(jì)算各因子在每個(gè)樣本上的具體數(shù)值,這些數(shù)值稱為因子得分。于是,在以后的分析中就可以利用因子得分對(duì)樣本進(jìn)行分類或評(píng)價(jià)等研究,進(jìn)而實(shí)現(xiàn)了降維和簡(jiǎn)化問題的目標(biāo)。SPSS在因子分析中的應(yīng)用
根據(jù)上述步驟,可以得到進(jìn)行因子分析的詳細(xì)計(jì)算過程如下:①將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)量級(jí)和量綱上的不同。②求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)矩陣。③求相關(guān)矩陣的特征值和特征向量。④計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率。⑤確定因子:設(shè)F1,F(xiàn)2,…,F(xiàn)p為p個(gè)因子,其中前m個(gè)因子包含的數(shù)據(jù)信息總量(即其累積貢獻(xiàn)率)不低于85%時(shí),可取前m個(gè)因子來反映原評(píng)價(jià)指標(biāo)。⑥因子旋轉(zhuǎn):若所得的m個(gè)因子無法確定或其實(shí)際意義不是很明顯,這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義。⑦用原指標(biāo)的線性組合來求各因子得分。⑧綜合得分:通常以各因子的方差貢獻(xiàn)率為權(quán),由各因子的線性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù)。SPSS在因子分析中的應(yīng)用實(shí)例分析:居民消費(fèi)結(jié)構(gòu)的變動(dòng)1.實(shí)例內(nèi)容消費(fèi)結(jié)構(gòu)是指在消費(fèi)過程中各項(xiàng)消費(fèi)支出占居民總支出的比重。它是反映居民生活消費(fèi)水平、生活質(zhì)量變化狀況以及內(nèi)在過程合理化程度的重要標(biāo)志。而消費(fèi)結(jié)構(gòu)的變動(dòng)不僅是消費(fèi)領(lǐng)域的重要問題,而且也關(guān)系到整個(gè)國(guó)民經(jīng)濟(jì)的發(fā)展。因?yàn)楹侠淼南M(fèi)結(jié)構(gòu)及消費(fèi)結(jié)構(gòu)的升級(jí)和優(yōu)化不僅反映了消費(fèi)的層次和質(zhì)量的提高,而且也為建立合理的產(chǎn)業(yè)結(jié)構(gòu)和產(chǎn)品結(jié)構(gòu)提供了重要的依據(jù)。表11-2是某市居民生活費(fèi)支出費(fèi)用,具體分為食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通通訊、文教娛樂及服務(wù)、居住和雜項(xiàng)商品與服務(wù)等8個(gè)部分。請(qǐng)利用因子分析探討該市居民消費(fèi)結(jié)構(gòu),為產(chǎn)業(yè)政策的制定和宏觀經(jīng)濟(jì)的調(diào)控提供參考。SPSS在因子分析中的應(yīng)用2.實(shí)例操作
數(shù)據(jù)文件11-1.sav是某市居民在食品、衣著、醫(yī)療保健等八個(gè)方面的消費(fèi)數(shù)據(jù),這些指標(biāo)之間存在著不同強(qiáng)弱的相關(guān)性。如果單獨(dú)分析這些指標(biāo),無法能夠分析居民消費(fèi)結(jié)構(gòu)的特點(diǎn)。因此,可以考慮采用因子分析,將這八個(gè)指標(biāo)綜合為少數(shù)幾個(gè)因子,通過這些公共因子來反映居民消費(fèi)結(jié)構(gòu)的變動(dòng)情況。SPSS在因子分析中的應(yīng)用3.實(shí)例結(jié)果及分析(1)描述性統(tǒng)計(jì)表下表顯示了食品、衣著等這八個(gè)消費(fèi)支出指標(biāo)的描述統(tǒng)計(jì)量,例如均值、標(biāo)準(zhǔn)差等。這為后續(xù)的因子分析提供了一個(gè)直觀的分析結(jié)果。可以看到,食品支出消費(fèi)所占的比重最大,其均值等于39.4750%,其次是文化娛樂服務(wù)支出消費(fèi)和交通通信支出消費(fèi)。所有的消費(fèi)支出中,醫(yī)療保健消費(fèi)支出占的比重最低。SPSS在因子分析中的應(yīng)用SPSS在因子分析中的應(yīng)用(2)因子分析共同度
下表是因子分析的共同度,顯示了所有變量的共同度數(shù)據(jù)。第一列是因子分析初始解下的變量共同度。它表明,對(duì)原有八個(gè)變量如果采用主成分分析法提取所有八個(gè)特征根,那么原有變量的所有方差都可被解釋,變量的共同度均為1(原有變量標(biāo)準(zhǔn)化后的方差為1)。事實(shí)上,因子個(gè)數(shù)小于原有變量的個(gè)數(shù)才是因子分析的目的,所以不可能提取全部特征根。于是,第二列列出了按指定提取條件(這里為特征根大于1)提取特征根時(shí)的共同度??梢钥吹剑凶兞康慕^大部分信息(全部都大于83%)可被因子解釋,這些變量信息丟失較少。因此本次因子提取的總體效果理想。SPSS在因子分析中的應(yīng)用SPSS在因子分析中的應(yīng)用(3)因子分析的總方差解釋接著Spss軟件計(jì)算得到相關(guān)系數(shù)矩陣的特征值、方差貢獻(xiàn)率及累計(jì)方差貢獻(xiàn)率結(jié)果如下表所示。在下頁(yè)表中,第一列是因子編號(hào),以后三列組成一組,組中數(shù)據(jù)項(xiàng)的含義依次是特征根、方差貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。第一組數(shù)據(jù)項(xiàng)(第二至第四列)描述了初始因子解的情況。可以看到,第一個(gè)因子的特征根值為4.316,解釋了原有8個(gè)變量總方差的53.947%。前三個(gè)因子的累計(jì)方差貢獻(xiàn)率為94.196%,并且只有它們的取值大于1。說明前3個(gè)公因子基本包含了全部變量的主要信息,因此選前3個(gè)因子為主因子即可。同時(shí),ExtractionSumsofSquaredLoadings和RotationSumsofSquaredLoadings部分列出了因子提取后和旋轉(zhuǎn)后的因子方差解釋情況。從表中看到,它們都支持選擇3個(gè)公共因子。SPSS在因子分析中的應(yīng)用因子分析的總方差解釋SPSS在因子分析中的應(yīng)用(4)因子碎石圖下圖為因子分析的碎石圖。橫坐標(biāo)為因子數(shù)目,縱坐標(biāo)為特征根??梢钥吹剑谝粋€(gè)因子的特征值很高,對(duì)解釋原有變量的貢獻(xiàn)最大;第三個(gè)以后的因子特征根都較小,取值都小于1,說明它們對(duì)解釋原有變量的貢獻(xiàn)很小,稱為可被忽略的“高山腳下的碎石”,因此提取前三個(gè)因子是合適的。SPSS在因子分析中的應(yīng)用SPSS在因子分析中的應(yīng)用(5)旋轉(zhuǎn)前的因子載荷矩陣下表中顯示了因子載荷矩陣,它是因子分析的核心內(nèi)容。通過載荷系數(shù)大小可以分析不同公共因子所反映的主要指標(biāo)的區(qū)別。從結(jié)果看,大部分因子解釋性較好,但是仍有少部分指標(biāo)解釋能力較差,例如“食品”指標(biāo)在三個(gè)因子的載荷系數(shù)區(qū)別不大。因此接著采用因子旋轉(zhuǎn)方法使得因子載荷系數(shù)向0或1兩極分化,使大的載荷更大,小的載荷更小。這樣結(jié)果更具可解釋性。SPSS在因子分析中的應(yīng)用旋轉(zhuǎn)前的因子載荷矩陣SPSS在因子分析中的應(yīng)用(6)旋轉(zhuǎn)后的因子載荷矩陣下表中顯示了實(shí)施因子旋轉(zhuǎn)后的載荷矩陣。可以看到,第一主因子在“交通和通信”和“醫(yī)療保健”等五個(gè)指標(biāo)上具有較大的載荷系數(shù),第二主因子在“居住”和“衣著”指標(biāo)上系數(shù)較大,而第三主因子在“雜項(xiàng)商品與服務(wù)”上的系數(shù)最大。此時(shí),各個(gè)因子的含義更加突出。SPSS在因子分析中的應(yīng)用實(shí)施因子旋轉(zhuǎn)后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年審計(jì)工作計(jì)劃表模版(三篇)
- 2024年小學(xué)六年級(jí)畢業(yè)班班主任工作計(jì)劃范文(三篇)
- 2024年市場(chǎng)營(yíng)銷專員工作職責(zé)歸納范本(三篇)
- 2024年學(xué)校傳染病防控工作管理制度模版(三篇)
- 2024年發(fā)電機(jī)租賃合同參考樣本(三篇)
- 2024年圖書出版合同參考樣本(四篇)
- 2024年工藝技術(shù)員職責(zé)范本(二篇)
- 2024年城市房屋租賃合同格式范本(二篇)
- 2024年小學(xué)班主任學(xué)期工作總結(jié)常用版(二篇)
- 【《智慧城市公共服務(wù)績(jī)效評(píng)價(jià)探究的國(guó)內(nèi)外文獻(xiàn)綜述》2500字】
- 主題班會(huì):拍賣會(huì)ppt課件
- 技能大師工作室建設(shè)PPT幻燈片課件(PPT 66頁(yè))
- 新版新幼兒園成長(zhǎng)檔案模板
- JIS G3507-1-2021 冷鐓用碳素鋼.第1部分:線材
- 封裝工藝介紹優(yōu)秀課件
- 建設(shè)工程竣工消防驗(yàn)收記錄表(DOC36頁(yè))
- 學(xué)生學(xué)習(xí)過程評(píng)價(jià)量表
- 高中數(shù)學(xué)必修2立體幾何教材分析和教學(xué)建議
- 運(yùn)動(dòng)的描述-主題單元設(shè)計(jì)
- 幼兒園報(bào)名登記表
- 蘇教版二年級(jí)數(shù)學(xué)上冊(cè)重難點(diǎn)易錯(cuò)題積累
評(píng)論
0/150
提交評(píng)論