SPSS數(shù)據(jù)的因子分析_第1頁
SPSS數(shù)據(jù)的因子分析_第2頁
SPSS數(shù)據(jù)的因子分析_第3頁
SPSS數(shù)據(jù)的因子分析_第4頁
SPSS數(shù)據(jù)的因子分析_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

因子分析

(FactorAnalysis)知識(shí)點(diǎn)1、什么是因子分析?2、理解因子分析的基本思想3、因子分析的數(shù)學(xué)模型以及模型中公共因子、因子載荷變量共同度的統(tǒng)計(jì)意義4、因子旋轉(zhuǎn)的意義5、結(jié)合SPSS軟件進(jìn)行案例分析zf案例1:

我們?cè)噲D對(duì)某快餐店的質(zhì)量進(jìn)行評(píng)估,選擇了就餐等待時(shí)間、清潔度等6個(gè)指標(biāo)作為觀測(cè)變量:這些變量之間有高度的相關(guān)關(guān)系這些變量能否綜合成兩個(gè)或多個(gè)因子?這些彼此相關(guān)的變量會(huì)導(dǎo)致某些信息多次考慮,引起分析的偏誤······如何避免??因子分析的基本理論zf2除了主成分分析(PCA)外,還有用來實(shí)現(xiàn)‘降維’的其他方法嗎

??因子分析Factoranalysis1、什么是因子分析?2、因子分析的基本思想?3、因子分析與主成分分析的區(qū)別??zf3Spearman(1904)

發(fā)表的論文“Generationintelligenceobjectivelydeterminedandmeasured”,AmericanJournalPsychology15,201-293.被認(rèn)為是因子分析研究的開端.這篇文章主要是針對(duì)中學(xué)生考試成績進(jìn)行因子分析zf4當(dāng)考慮該矩陣上三角中的相關(guān)元素會(huì)發(fā)現(xiàn):(1)每一行元素呈遞減的趨勢(shì),且遞減的大小大致相當(dāng);(2)任意兩列元素大致成比例。

中學(xué)生各門課程考試成績的相關(guān)系數(shù)矩陣

classicsfrenchenglishmathdiscrmusicclassics10.830.780.70.660.63french0.8310.670.670.650.57english0.780.6710.640.540.51math0.70.670.6410.450.51discr0.660.650.540.4510.4music0.630.570.510.510.41究竟是什么因素在影響著學(xué)生的成績呢?zf5Spearman提出:標(biāo)準(zhǔn)化的每個(gè)原始變量可用以下的方程形式表示:每門課程的考試成績可用兩個(gè)因素做解釋:(1)總體智力水平因子generalintelligence

f

;(2)特殊潛能因子specifictalentsordeficienciesClassics*、French*等是標(biāo)準(zhǔn)化后的考試成績,均值為0,方差為1f為公共因子,對(duì)各門課程的考試成績均有影響,且其均值為0,方差為1;為特殊因子,僅對(duì)第i門課程考試成績有影響;其中f與相互獨(dú)立。每門課程的考試成績可看作為由一個(gè)公共因子和一個(gè)特殊因子之和zf6

案例2:假設(shè)我們有學(xué)生以下幾門課程的成績Supposewehavestudents’testscoresforMathematics(M),Physics(P),Chemistry(C),English(E),History(H),andFrench(F).

其相關(guān)系數(shù)矩陣如下:

MPCEHFM1

P0.621

C0.540.511

E0.320.380.361

H0.2840.3510.3360.6861

F0.370.430.4050.730.7351這6門課程成績可用兩個(gè)或多個(gè)能力因子做解釋嗎?在M,P,C這幾門課程之間有較高的相關(guān)關(guān)系;在E,H,F這幾門課程之間有較高的相關(guān)關(guān)系。zf7案例3:在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場(chǎng)的24個(gè)方面的優(yōu)劣。因子分析方法可以通過24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對(duì)商店進(jìn)行綜合評(píng)價(jià)。而每個(gè)原始變量可表示為:稱是不可觀測(cè)的潛在因子,稱為公共因子。24個(gè)變量共享這三個(gè)因子,但是每個(gè)變量又有自己的個(gè)性,不被包含的部分,稱為特殊因子。zf81、什么是因子分析?因子分析是主成分分析的推廣,也是利用降維的思想,由研究原始變量相關(guān)矩陣的內(nèi)部依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多元統(tǒng)計(jì)分析方法。zf92、因子分析的基本思想:根據(jù)相關(guān)性大小把原始變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,而不同組的變量之間的相關(guān)性較低。每組變量代表一個(gè)基本結(jié)構(gòu),并用一個(gè)不可觀測(cè)的綜合變量表示,這個(gè)基本結(jié)構(gòu)就稱為公共因子。

因子分析將每個(gè)原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子組成的,另一部分是每個(gè)變量獨(dú)自具有的因素,即特殊因子。注意:原始變量是可觀測(cè)的,而公共因子是不可觀測(cè)的潛在變量。我們需要計(jì)算每個(gè)公共因子得分,從而替代原始變量。zf103、主成分分析分析與因子分析差異:(1)主成分分析模型是原始變量的線性組合,是將原始變量加以綜合、歸納;而因子分析是將原始變量加以分解。(2)主成分分析中,主成分載荷是唯一確定的;因子分析中因子載荷不是唯一的。(3)因子分析中因子載荷的不唯一性有利于對(duì)公因子進(jìn)行有效解釋;而主成分分析對(duì)提取的主成分的解釋能力有限。zf11例:對(duì)美國洛杉磯12個(gè)人口調(diào)查區(qū)的5個(gè)經(jīng)濟(jì)學(xué)變量的數(shù)據(jù)進(jìn)行因子分析(12個(gè)地區(qū)調(diào)查表.sav)zf12zf13每個(gè)因子的載荷系數(shù)沒有很明顯的差別,所以不好命名.為了對(duì)因子進(jìn)行命名,可以進(jìn)行旋轉(zhuǎn),使系數(shù)向0和1兩極分化第一主因子對(duì)中等學(xué)校平均校齡,專業(yè)服務(wù)項(xiàng)目,中等房價(jià)有絕對(duì)值較大的載荷(代表福利條件因子);第二主因子對(duì)總?cè)丝诤涂偣蛦T數(shù)有較大的載荷(代表人口因子).zf14因子分析的基本步驟(1)因子分析的前提條件鑒定考察原始變量之間是否存在較強(qiáng)的相關(guān)關(guān)系,是否適合進(jìn)行因子分析。如果原有變量相互獨(dú)立,不存在相關(guān)關(guān)系,也就無需進(jìn)行因子分析。(2)因子提取

研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取綜合因子。zf15(3)因子旋轉(zhuǎn)

通過正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)使提取出的因子具有可解釋性。(4)計(jì)算因子得分求解各樣本在各因子上的得分,為進(jìn)一步分析奠定基礎(chǔ)。zf16(1)計(jì)算相關(guān)系數(shù)矩陣(correlationcoefficientsmatrix)

如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3,即各變量間大多為弱相關(guān),原則上這些變量不適合進(jìn)行因子分析。(2)巴特利特球度檢驗(yàn)(Bartletttestofsphericity)

其零假設(shè)H0:相關(guān)系數(shù)矩陣為單位矩陣(即原始變量之間無相關(guān)關(guān)系)。如果統(tǒng)計(jì)量卡方值較大且對(duì)應(yīng)的sig值小于給定的顯著性水平a時(shí),零假設(shè)不成立。即說明相關(guān)系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關(guān)關(guān)系,適合做因子分析。因子分析前提條件——相關(guān)性分析方法zf17(3)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)

KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為:KMO值越接近1,意味著變量間的相關(guān)性越強(qiáng),原有變量適合做因子分析;越接近0,意味變量間的相關(guān)性越弱,越不適合作因子分析。Kaiser給出的KMO度量標(biāo)準(zhǔn):0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。zf18因子分析不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析。如果每個(gè)公共因子的含義不清,則可對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。因子旋轉(zhuǎn)的目的:使每個(gè)變量在盡可能少的因子上有比較高的載荷,讓某個(gè)變量在某個(gè)因子上的載荷趨于1,而在其他因子上的載荷趨于0。即:使載荷矩陣每列或行的元素平方值向0和1兩極分化。因子旋轉(zhuǎn)的目的及方法zf19因子旋轉(zhuǎn)方法:(1)正交旋轉(zhuǎn):在旋轉(zhuǎn)時(shí)始終保持公因子之間的相互獨(dú)立性。主要有以下方法:varimax方差最大旋轉(zhuǎn);

quartmax四次最大正交旋轉(zhuǎn);equamax等量正交旋轉(zhuǎn)(2)斜交旋轉(zhuǎn):在旋轉(zhuǎn)時(shí),放棄了因子之間彼此獨(dú)立的限制,旋轉(zhuǎn)后的新公因子更容易解釋。主要有以下的方法:directoblimin直接斜交旋轉(zhuǎn);

promax斜交旋轉(zhuǎn)方法。zf20生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對(duì)生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。案例分析3:生育率的影響因素分析zf21zf22特征根與各因子的貢獻(xiàn)EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000zf23沒有旋轉(zhuǎn)的因子結(jié)構(gòu)

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962zf24各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解釋方差Factor2可解釋方差2.99754292.1642615zf25

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。zf26因子分析的上機(jī)操作問題題項(xiàng)從未使用很少使用有時(shí)使用經(jīng)常使用總是使用12345A1電腦A2錄音磁帶A3錄像帶A4網(wǎng)上資料A5校園網(wǎng)或因特網(wǎng)A6電子郵件A7電子討論網(wǎng)A8CAI課件A9視頻會(huì)議A10視聽會(huì)議zf27題目編號(hào)A1A2A3A4A5A6A7A8A9A10011551111111022552221211034333431411044344442422054433441411064333342321074444332411081531111111094454442411105435543533115434442522125454443522133552221311145343332522154553332522164444351411175445554544185442341511195455553533205445552521zf28(01)建立數(shù)據(jù)文件zf29(02)選擇分析變量

——選SPSS[Analyze]菜單中的(DataReduction)→(Factor),出現(xiàn)【FactorAnalysis】對(duì)話框;——在【FactorAnalysis】對(duì)話框中左邊的原始變量中,選擇將進(jìn)行因子分析的變量選入(Variables)欄。zf30(03)設(shè)置描述性統(tǒng)計(jì)量——在【

FactorAnalysis】框中選【

Descriptives】按鈕,出現(xiàn)【Descriptives】對(duì)話框;——選擇Initialsolution(未轉(zhuǎn)軸的統(tǒng)計(jì)量)選項(xiàng)——選擇KMO選項(xiàng)——點(diǎn)擊(Contiue)按鈕確定。zf31zf32(04)設(shè)置對(duì)因子的抽取選項(xiàng)

——在【FactorAnalysis】框中點(diǎn)擊【Extraction】按鈕,出現(xiàn)【FactorAnalysis:Extraction】對(duì)話框;——在Method欄中選擇(Principalcomponents)選項(xiàng);——在Analyze欄中選擇Correlationmatrix選項(xiàng);——在Display欄中選擇Unrotatedfactorsolution選項(xiàng);——在Extract欄中選擇Eigenvaluesover并填上1;——點(diǎn)擊(Contiue)按鈕確定,回到【FactorAnalysis】對(duì)話框中。zf33zf34zf35(05)設(shè)置因子轉(zhuǎn)軸——在【FactorAnalysis】對(duì)話框中,點(diǎn)擊【Rotation】按鈕,出現(xiàn)【FactorAnalysis:Rotation】(因子分析:旋轉(zhuǎn))對(duì)話框?!贛ethod欄中選擇Varimax(最大變異法)——在Display欄中選擇Rotatedsolution(轉(zhuǎn)軸后的解)——點(diǎn)擊(Contiue)按鈕確定,回到【FactorAnalysis】對(duì)話框中。zf36zf37(06)設(shè)置因素分?jǐn)?shù)——在【FactorAnalysis】對(duì)話框中,點(diǎn)擊【Scores】按鈕,出現(xiàn)【FactorAnalysis:Scores】(因素分析:分?jǐn)?shù))對(duì)話框?!话闳∧J(rèn)值?!c(diǎn)擊(Contiue)按鈕確定,回到【FactorAnalysis】對(duì)話框。zf38zf39(07)設(shè)置因子分析的選項(xiàng)——在【FactorAnalysis】對(duì)話框中,單擊【Options】按鈕,出現(xiàn)【FactorAnalysis:Options】(因素分析:選項(xiàng))對(duì)話框。——在MissingValues欄中選擇Excludecaseslistwise(完全排除缺失值)——在CoefficientDisplayFormat(系數(shù)顯示格式)欄中選擇Sortedbysize(依據(jù)因素負(fù)荷量排序)項(xiàng);——在CoefficientDisplayFormat(系數(shù)顯示格式)勾選“Suppressabsolutevalueslessthan”,其后空格內(nèi)的數(shù)字不用修改,默認(rèn)為0.1。——如果研究者要呈現(xiàn)所有因素負(fù)荷量,就不用選取“Suppressabsolutevalueslessthan”選項(xiàng)。在例題中為了讓研究者明白此項(xiàng)的意義,才勾選了此項(xiàng),正式的研究中應(yīng)呈現(xiàn)題項(xiàng)完整的因素負(fù)荷量較為適宜?!獑螕簟癈ontinue”按鈕確定。zf40zf41zf42對(duì)SPSS因子分析結(jié)果的解釋取樣適當(dāng)性(KMO)檢驗(yàn)——KMO值越大,表示變量間的共同因素越多,越適合進(jìn)行因素分析,要求KMO>0.5——要求Barlett’s的卡方值達(dá)到顯著程度zf432.共同度檢查zf443.因子陡坡檢查,除去坡線平坦部分的因子圖中第三個(gè)因子以后較為平坦,故保留3個(gè)因子zf454.方差貢獻(xiàn)率檢驗(yàn)——取特征值大于1的因子,共有3個(gè),分別(6.358)(1.547)(1.032);——變異量分別為(63.58%)(15.467%)(10.32%)zf465.顯示未轉(zhuǎn)軸的因子矩陣zf476.分析轉(zhuǎn)軸后的因子矩陣----根據(jù)因子負(fù)荷量形成3個(gè)公共因子zf487.形成綜合分析結(jié)果題項(xiàng)貢獻(xiàn)率(解釋變異量)累積貢獻(xiàn)率(累積解釋變異量)Component(抽取的因子)因子1負(fù)荷量因子2負(fù)荷量因子3負(fù)荷量共同性A1電腦A8CAI課件A6電子郵件A5校園網(wǎng)或因特網(wǎng)A4網(wǎng)上資料43.885%43.885%0.9150.9120.8840.8240.7890.9280.9070.8670.9010.872A10視聽會(huì)議A9視頻會(huì)議A7電子討論網(wǎng)31.372%75.257%0.9390.9240.8580.9390.9650.919A3錄像帶A2錄音磁帶14.108%89.366%0.9480.6520.9000.738特征值4.3893.1371.411zf49生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對(duì)生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。案例分析:生育率的影響因素分析zf50zf51特征根與各因子的貢獻(xiàn)EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000zf52沒有旋轉(zhuǎn)的因子載荷

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論