SPSS進(jìn)行因子分析的技巧_第1頁(yè)
SPSS進(jìn)行因子分析的技巧_第2頁(yè)
SPSS進(jìn)行因子分析的技巧_第3頁(yè)
SPSS進(jìn)行因子分析的技巧_第4頁(yè)
SPSS進(jìn)行因子分析的技巧_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(優(yōu)選)SPSS進(jìn)行因子分析的技巧目前一頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析與因子分析的概念(續(xù))由于實(shí)測(cè)的變量間存在一定的相關(guān)關(guān)系,因此有可能用較少數(shù)的綜合指標(biāo)分別綜合存在于各變量中的各類(lèi)信息,而綜合指標(biāo)之間彼此不相關(guān),即各指標(biāo)代表的信息不重疊。綜合指標(biāo)稱(chēng)為因子或主成分(提取幾個(gè)因子),一般有兩種方法:特征值>1累計(jì)貢獻(xiàn)率>0.8目前二頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析實(shí)例P316-不旋轉(zhuǎn)使用默認(rèn)值進(jìn)行最簡(jiǎn)單的主成分分析(默認(rèn)為主成分分析法:Principalcomponents)例子P316:對(duì)美國(guó)洛杉磯12個(gè)人口調(diào)查區(qū)的5個(gè)經(jīng)濟(jì)學(xué)變量的數(shù)據(jù)進(jìn)行因子分析,data13-01a,數(shù)據(jù)見(jiàn)下一張幻燈片)菜單:Analyze-DataReduction-FactorVariables:pop,School,employ,Services,house其他使用默認(rèn)值(主成分分析法Principalcomponents,選取特征值>1,不旋轉(zhuǎn))比較有用的結(jié)果:兩個(gè)主成分(因子)f1,f2及因子載荷矩陣(ComponentMatrix),根據(jù)該表可以寫(xiě)出每個(gè)原始變量(標(biāo)準(zhǔn)化值)的因子表達(dá)式:Pop0.581f1+0.806f2School0.767f1-0.545f2employ0.672f1+0.726f2Services0.932f1-0.104f2house0.791f1-0.558f2每個(gè)原始變量都可以是5個(gè)因子的線(xiàn)性組合,提取兩個(gè)因子f1和f2,可以概括原始變量所包含信息的93.4%。f1和f2前的系數(shù)表示該因子對(duì)變量的影響程度,也稱(chēng)為變量在因子上的載荷。但每個(gè)因子(主成分)的系數(shù)(載荷)沒(méi)有很明顯的差別,所以不好命名。因此為了對(duì)因子進(jìn)行命名,可以進(jìn)行旋轉(zhuǎn),使系數(shù)向0和1兩極分化,這就要使用選擇項(xiàng)。目前三頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)洛衫磯對(duì)12個(gè)人口調(diào)查區(qū)的數(shù)據(jù)編號(hào)

總?cè)丝?/p>

中等學(xué)校平均

總雇員數(shù)專(zhuān)業(yè)服務(wù)

中等房?jī)r(jià)no

pop

校齡School employ項(xiàng)目數(shù)Services house1 5700 12.8 2500 270 250002 1000 10.9 600 10 100003 3400 8.8 1000 10 90004 3800 13.6 1700 140 250005 4000 12.8 1600 140 250006 8200 8.3 2600 60 120007 1200 11.4 400 10 160008 9100 11.5 3300 60 140009 9900 12.5 3400 180 1800010 9600 13.7 3600 390 2500011 9600 9.6 3300 80 1200012 9400 11.4 4000 100 13000目前四頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)因子分析實(shí)例322-旋轉(zhuǎn)Rotation由于系數(shù)沒(méi)有很明顯的差別,所以要進(jìn)行旋轉(zhuǎn)(Rotation:method一般用Varimax方差最大旋轉(zhuǎn)),使系數(shù)向0和1兩極分化,例子同上菜單:Analyze-DataReduction-FactorVariables:pop,School,employ,Services,houseExtraction:使用默認(rèn)值(method:Principalcomponents,選取特征值>1)Rotation:method選VarimaxScore:Saveasvariables和DisplayfactorscoreCoefficientmatrix比較有用的結(jié)果:兩個(gè)主成分(因子)f1,f2及旋轉(zhuǎn)后的因子載荷矩陣(RotatedComponentMatrix)

,根據(jù)該表可以寫(xiě)出每個(gè)原始變量(標(biāo)準(zhǔn)化值)的因子表達(dá)式:Pop0.01602

f1+0.9946f2School0.941f1-0.00882f2employ0.137f1+0.98f2Services0.825f1+0.447f2house0.968f1-0.00605f2第一主因子對(duì)中等學(xué)校平均校齡,專(zhuān)業(yè)服務(wù)項(xiàng)目,中等房?jī)r(jià)有絕對(duì)值較大的載荷(代表一般社會(huì)福利-福利條件因子);而第二主因子對(duì)總?cè)丝诤涂偣蛦T數(shù)有較大的載荷(代表人口-人口因子).P326比較有用的結(jié)果:因子得分fac1_1,fac2_1。其計(jì)算公式:因子得分系數(shù)和原始變量的標(biāo)準(zhǔn)化值的乘積之和(P326)。然后可以利用因子得分進(jìn)行聚類(lèi)p327(Analyze->Classify->HierarchicalCluster)。目前五頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析實(shí)例P330-不旋轉(zhuǎn)

市場(chǎng)研究中的顧客偏好分析在市場(chǎng)研究中,常常要求分析顧客的偏好和當(dāng)前市場(chǎng)的產(chǎn)品與顧客偏好之間的差別,從而找出新產(chǎn)品開(kāi)發(fā)的方向。顧客偏好分析時(shí)常用到主成分分析方法(因子沒(méi)有旋轉(zhuǎn))。例子P330:數(shù)據(jù)來(lái)自SAS公司,1980年一個(gè)汽車(chē)制造商在競(jìng)爭(zhēng)對(duì)手中選擇了17種車(chē)型,訪(fǎng)問(wèn)了25個(gè)顧客,要求他們根據(jù)自己的偏好對(duì)17種車(chē)型打分。打分范圍0~9.9,9.9表示最高程度的偏好。data13-02a(17×25:17個(gè)case,25個(gè)變量V1-V25)菜單:Analyze-DataReduction-FactorVariables:V1-V25Extraction:method:Principalcomponents Extract:Numberoffactors:3要三個(gè)主成分Score:Saveasvariables比較有用的結(jié)果:3個(gè)主成分及其因子載荷矩陣(ComponentMatrix):第一主成分和第二主成分的載荷圖(Loadingplots)比較有用的結(jié)果:因子得分fac1_1,fac2_1,fac3_1。然后可以利用因子得分進(jìn)行各種分析:做偏好圖:用fac1_1,fac2_1做散點(diǎn)圖(Graphs->Scatter:X-fac1_1,Y-fac2_1):第一主成分反映了車(chē)的產(chǎn)地,第二主成分反映了車(chē)的特性(質(zhì)量、動(dòng)力、座位數(shù)等)具體見(jiàn)P332-334目前六頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)補(bǔ)充:主成分分析和因子分析以下的講義是吳喜之教授有關(guān)主成分分析和因子分析的講義,我覺(jué)得比書(shū)上講得清楚。目前七頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析和因子分析

目前八頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)匯報(bào)什么?假定你是一個(gè)公司的財(cái)務(wù)經(jīng)理,掌握了公司的所有數(shù)據(jù),比如固定資產(chǎn)、流動(dòng)資金、每一筆借貸的數(shù)額和期限、各種稅費(fèi)、工資支出、原料消耗、產(chǎn)值、利潤(rùn)、折舊、職工人數(shù)、職工的分工和教育程度等等。如果讓你向上面介紹公司狀況,你能夠把這些指標(biāo)和數(shù)字都原封不動(dòng)地?cái)[出去嗎?

當(dāng)然不能。你必須要把各個(gè)方面作出高度概括,用一兩個(gè)指標(biāo)簡(jiǎn)單明了地把情況說(shuō)清楚。

目前九頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析每個(gè)人都會(huì)遇到有很多變量的數(shù)據(jù)。比如全國(guó)或各個(gè)地區(qū)的帶有許多經(jīng)濟(jì)和社會(huì)變量的數(shù)據(jù);各個(gè)學(xué)校的研究、教學(xué)等各種變量的數(shù)據(jù)等等。這些數(shù)據(jù)的共同特點(diǎn)是變量很多,在如此多的變量之中,有很多是相關(guān)的。人們希望能夠找出它們的少數(shù)“代表”來(lái)對(duì)它們進(jìn)行描述。本章就介紹兩種把變量維數(shù)降低以便于描述、理解和分析的方法:主成分分析(principalcomponentanalysis)和因子分析(factoranalysis)。實(shí)際上主成分分析可以說(shuō)是因子分析的一個(gè)特例。在引進(jìn)主成分分析之前,先看下面的例子。目前十頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)成績(jī)數(shù)據(jù)(student.sav)100個(gè)學(xué)生的數(shù)學(xué)、物理、化學(xué)、語(yǔ)文、歷史、英語(yǔ)的成績(jī)?nèi)缦卤恚ú糠郑?。目前十一?yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)從本例可能提出的問(wèn)題目前的問(wèn)題是,能不能把這個(gè)數(shù)據(jù)的6個(gè)變量用一兩個(gè)綜合變量來(lái)表示呢?這一兩個(gè)綜合變量包含有多少原來(lái)的信息呢?能不能利用找到的綜合變量來(lái)對(duì)學(xué)生排序呢?這一類(lèi)數(shù)據(jù)所涉及的問(wèn)題可以推廣到對(duì)企業(yè),對(duì)學(xué)校進(jìn)行分析、排序、判別和分類(lèi)等問(wèn)題。目前十二頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析例中的的數(shù)據(jù)點(diǎn)是六維的;也就是說(shuō),每個(gè)觀測(cè)值是6維空間中的一個(gè)點(diǎn)。我們希望把6維空間用低維空間表示。先假定只有二維,即只有兩個(gè)變量,它們由橫坐標(biāo)和縱坐標(biāo)所代表;因此每個(gè)觀測(cè)值都有相應(yīng)于這兩個(gè)坐標(biāo)軸的兩個(gè)坐標(biāo)值;如果這些數(shù)據(jù)形成一個(gè)橢圓形狀的點(diǎn)陣(這在變量的二維正態(tài)的假定下是可能的)那么這個(gè)橢圓有一個(gè)長(zhǎng)軸和一個(gè)短軸。在短軸方向上,數(shù)據(jù)變化很少;在極端的情況,短軸如果退化成一點(diǎn),那只有在長(zhǎng)軸的方向才能夠解釋這些點(diǎn)的變化了;這樣,由二維到一維的降維就自然完成了。目前十三頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析當(dāng)坐標(biāo)軸和橢圓的長(zhǎng)短軸平行,那么代表長(zhǎng)軸的變量就描述了數(shù)據(jù)的主要變化,而代表短軸的變量就描述了數(shù)據(jù)的次要變化。但是,坐標(biāo)軸通常并不和橢圓的長(zhǎng)短軸平行。因此,需要尋找橢圓的長(zhǎng)短軸,并進(jìn)行變換,使得新變量和橢圓的長(zhǎng)短軸平行。如果長(zhǎng)軸變量代表了數(shù)據(jù)包含的大部分信息,就用該變量代替原先的兩個(gè)變量(舍去次要的一維),降維就完成了。橢圓(球)的長(zhǎng)短軸相差得越大,降維也越有道理。目前十四頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)目前十五頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析對(duì)于多維變量的情況和二維類(lèi)似,也有高維的橢球,只不過(guò)無(wú)法直觀地看見(jiàn)罷了。首先把高維橢球的主軸找出來(lái),再用代表大多數(shù)數(shù)據(jù)信息的最長(zhǎng)的幾個(gè)軸作為新變量;這樣,主成分分析就基本完成了。注意,和二維情況類(lèi)似,高維橢球的主軸也是互相垂直的。這些互相正交的新變量是原先變量的線(xiàn)性組合,叫做主成分(principalcomponent)。

目前十六頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)主成分分析正如二維橢圓有兩個(gè)主軸,三維橢球有三個(gè)主軸一樣,有幾個(gè)變量,就有幾個(gè)主成分。選擇越少的主成分,降維就越好。什么是標(biāo)準(zhǔn)呢?那就是這些被選的主成分所代表的主軸的長(zhǎng)度之和占了主軸長(zhǎng)度總和的大部分。有些文獻(xiàn)建議,所選的主軸總長(zhǎng)度占所有主軸長(zhǎng)度之和的大約85%即可,其實(shí),這只是一個(gè)大體的說(shuō)法;具體選幾個(gè),要看實(shí)際情況而定。目前十七頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)對(duì)于我們的數(shù)據(jù),SPSS輸出為這里的InitialEigenvalues就是這里的六個(gè)主軸長(zhǎng)度,又稱(chēng)特征值(數(shù)據(jù)相關(guān)陣的特征值)。頭兩個(gè)成分特征值累積占了總方差的81.142%。后面的特征值的貢獻(xiàn)越來(lái)越少。目前十八頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)特征值的貢獻(xiàn)還可以從SPSS的所謂碎石圖看出目前十九頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)怎么解釋這兩個(gè)主成分。前面說(shuō)過(guò)主成分是原始六個(gè)變量的線(xiàn)性組合。是怎么樣的組合呢?SPSS可以輸出下面的表。

這里每一列代表一個(gè)主成分作為原來(lái)變量線(xiàn)性組合的系數(shù)(比例)。比如第一主成分作為數(shù)學(xué)、物理、化學(xué)、語(yǔ)文、歷史、英語(yǔ)這六個(gè)原先變量的線(xiàn)性組合,系數(shù)(比例)為-0.806,-0.674,-0.675,0.893,0.825,0.836。目前二十頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)如用x1,x2,x3,x4,x5,x6分別表示原先的六個(gè)變量,而用y1,y2,y3,y4,y5,y6表示新的主成分,那么,原先六個(gè)變量x1,x2,x3,x4,x5,x6與第一和第二主成分y1,y2的關(guān)系為:X1=-0.806y1+0.353y2X2=-0.674y1+0.531y2X3=-0.675y1+0.513y2X4=0.893y1+0.306y2x5=0.825y1+0.435y2x6=0.836y1+0.425y2這些系數(shù)稱(chēng)為主成分載荷(loading),它表示主成分和相應(yīng)的原先變量的相關(guān)系數(shù)。比如x1表示式中y1的系數(shù)為-0.806,這就是說(shuō)第一主成分和數(shù)學(xué)變量的相關(guān)系數(shù)為-0.806。相關(guān)系數(shù)(絕對(duì)值)越大,主成分對(duì)該變量的代表性也越大??梢钥吹贸?,第一主成分對(duì)各個(gè)變量解釋得都很充分。而最后的幾個(gè)主成分和原先的變量就不那么相關(guān)了。目前二十一頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)可以把第一和第二主成分的載荷點(diǎn)出一個(gè)二維圖以直觀地顯示它們?nèi)绾谓忉屧瓉?lái)的變量的。這個(gè)圖叫做載荷圖。目前二十二頁(yè)\總數(shù)二十六頁(yè)\編于十六點(diǎn)該圖左面三個(gè)點(diǎn)是數(shù)學(xué)、物理、化學(xué)三科,右邊三個(gè)點(diǎn)是語(yǔ)文、歷史、外語(yǔ)三科。圖中的六個(gè)點(diǎn)由于比較擠,不易分清,但只要認(rèn)識(shí)到這些點(diǎn)的坐標(biāo)是前面的第一二主成分載荷,坐標(biāo)是前面表中第一二列中的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論