因子分析法的理的論基礎和應用_第1頁
因子分析法的理的論基礎和應用_第2頁
因子分析法的理的論基礎和應用_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、壬北何鉅夬摩攻讀博士、碩士學位研究生試卷(作業(yè))圭寸面(2008至2009學年度第1學期)題 目因子分析法的理論基礎及其應用科 目高級心理統(tǒng)計姓 名梅專 業(yè)應用心理學入學年月 2007 年9月簡短評語成績:授課教師簽字:因子分析法的理論基礎及其應用【摘要】:因子分析是多元統(tǒng)計分析技術的一個分支,其主要目的是濃縮數(shù)據(jù)。 它通過研究眾多變量之間的部依賴關系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個假想變量來表示基本的數(shù)據(jù)結(jié)構(gòu)。因子分析就是研究如何以最少的信息丟失 把眾多的觀測變量濃縮為少數(shù)幾個因子。并通過實例了解因子分析的具體應用, 熟練因子分析在SPSS!的具體操作以及掌握數(shù)據(jù)解釋。關鍵詞:因子分

2、析法理論基礎數(shù)據(jù)濃縮SPSS1、因子分析的起源因子分析是由心理學家發(fā)展起來的,最初心理學家借助因子分析模型來解釋 人類的行為和能力,1904年Charles Spearman在美國心理學雜志上發(fā)表了第一 篇有關因子分析的文章,在以后的三四十年里,因子分析的理論和數(shù)學基礎逐步 得到了發(fā)展和完善。50年代以來,隨著計算機的普及和各種統(tǒng)計軟件的出現(xiàn), 因子分析在社會學、經(jīng)濟學、醫(yī)學等越來越多的領域得到應用。2、因子分析的原理2.1因子分析模型因子分析模型在形式上和多元回歸模型相似,每個觀測變量由一組因子的線 性組合來表示。因子模型的一般表達式為:人a, ai2 f2aim fm ui(i 1,2,

3、,k)在該模型中:(1) f1,f2, ,fm叫做公因子,它們是各個觀測變量所共有的因 子,解釋了變量之間的相關。(2) Ui稱為特殊因子,它是每個觀測變量所特有的 因子,表示該變量不能被公因子所解釋的部分。(3) aj稱為因子負載,它是第i 個變量在第j個公因子上的負載,相當于多元回歸分析中的標準回歸系數(shù)(i 1,2, ,k;j 1,2, ,m )。2.2因子分析的有關概念(1) 因子負載:是因子分析模型中最重要的一個統(tǒng)計量,它是連接觀測變 量和公因子之間的紐帶。當分因子之間完全不相關時,很容易證明因子負載aj等 于第i個變量和第j個因子之間的相關系數(shù)。因子負載不僅表示了觀測變量是如 何由因

4、子線性表示的,而且反應了因子和變量之間的相關程度,aj的絕對值越大,表示公因子fj與變量Xi關系越密切。(2) 公因子方差:也叫共同度,指觀測變量方差中由公因子決定的比例。 變量Xj的公因子方差記做h,。當公因子之間彼此正交時,公因子方差等于和該 變量有關的因子負載的平方和,用公式表示為:hi2 ai12 ai22aim2(3) 因子的貢獻:每個公因子 對數(shù)據(jù)的解釋能力,可以用該因子所解釋的總 方差來衡量,通常稱為該因子的貢獻,它等于和該因子有關的因子負載的平方和。3、因子分析的具體步驟3.1計算所有變量的相關矩陣相關矩陣是因子分析直接要用的數(shù)據(jù),根據(jù)計算出的相關矩陣還應該進一步判斷應用因子分

5、析方法是否合適。因子分析的目的是簡化數(shù)據(jù)或者找出基本的 數(shù)據(jù)結(jié)構(gòu),因此使用因子分析的前提條件是觀測變量之間應該有較強的相關關 系。如果變量之間的相關程度很小的話,它們不可能共享公因子。所以,計算出相關矩陣之后在進行下面的步驟之前應該對相關矩陣進行檢驗,如果相關矩陣中的大部分相關系數(shù)都小于 0.3,則不適合做因子 分析。一般用KMO測度和巴 特利特球體檢驗來判斷觀測數(shù)據(jù)是否適合做因子分析。一般情況KMC測度在0.6 以上巴特利特球體檢驗顯著,則觀測數(shù)據(jù)適合做因子分析。3.2提取因子主成分分析法主成分分析是一種數(shù)學變換的方法,它把給定的一組相關變量通過線性變換 轉(zhuǎn)換成一組不相關的變量,這些新的變量

6、按照方差依次遞減的順序排列。在數(shù)學 變換中保持變量的總方差不變,使第一個變量具有最大的方差,稱為第一主成分, 第二個變量的方差次大,并且和第一個變量不相關,稱為第二主成分,依次類推, K個變量就有K個主成分,最后一個主成分具有的方差最小,并且和前面的主成 分不相關。因子個數(shù)的確定:(1)特征值準則:取特征值大于等于1的主成分作為初始 因子,放棄特征值小于1的主成分。(2)碎石檢驗準則:按照因子被提取的順序, 畫出因子的特征值隨因子個數(shù)變化的散點圖, 根據(jù)圖的形狀來判斷因子的個數(shù) 。 該圖的形狀像一個山峰,從第一個因子開始,曲線迅速下降,然后下降變的平緩,最后變成近似一條直線,曲線變平開始的前一

7、點認為是提取的最大因子個數(shù)。 公因子分析法公因子模型是從解釋變量之間的相關關系出發(fā)的, 假設觀測變量之間的相關 能完全被公因子解釋,變量的方差不一定能完全被公因子解釋, 這樣每個變量被 公因子所解釋的方差不再是1,而是公因子方差。所以公因子模型在求因子解時, 指考慮公因子方差。3.3進行因子旋轉(zhuǎn)初始因子解達到了數(shù)據(jù)化簡的目的, 在求初始因子解這一步中,確定了公因 子數(shù),確定了每個變量的公因子方差。但是根據(jù)初始因子解,往往很難解釋因子的意義,大多數(shù)因子都和很多變量有關。因子是通過數(shù)學方法求解得到的,但 研究人員往往很關心每個因子的實際意義是什么,否則就很難理解和把握因子 分析的結(jié)果。因子旋轉(zhuǎn)是尋

8、求這一實際意義的有效工具, 因子旋轉(zhuǎn)的目的是通 過改變坐標軸的位置,重新分配各個因子所解釋的方差的比例, 使因子結(jié)構(gòu)更簡 單,更易于解釋。因子旋轉(zhuǎn)不改變模型對數(shù)據(jù)的擬合程度,不改變每個變量的公因子方差。正交旋轉(zhuǎn)正交旋轉(zhuǎn)是使因子軸之間仍然保持 90度角,即因子之間是不相關的。正交 旋轉(zhuǎn)方法主要有三種:四次方最大法、方差最大法和等量最大法。最常用的是方 差最大法,它從簡化因子負載矩陣的每一列出發(fā), 使和每個因子有關的負載平方 的方差最大。當只有少數(shù)幾個變量在某個因子上有較高的負載時,對因子的解釋是最簡單的,和某個因子有關負載平方的方差最大時,因子具有最大的可解釋性。 斜交旋轉(zhuǎn)方法斜交旋轉(zhuǎn)中,因子之

9、間的夾角可以是任意的,即因子之間不一定是正交的, 所以用斜交因子描述變量會使因子結(jié)構(gòu)更為簡潔。在斜交旋轉(zhuǎn)中,因子負載不再 等于因子和變量之間的相關系數(shù),因子結(jié)構(gòu)和因子模型之間是有區(qū)別的。3.4計算因子值如果我們要使用所提取的因子做其它研究,比如把得到的因子作為自變量來 做回歸分析對樣本進行分類或評價,這些都需要對因子進行測度,給出因子對應 每個樣本案例上的值,這些值稱為因子值。因子分析模型中,是用因子的線性組 合來表示一個觀測變量,因子負載實際是該線性組合的權(quán)數(shù)。求因子值的過程是 通過觀測變量的線性組合來表示因子, 因子是觀測變量的加權(quán)平均。因為各個變 量在因子上的負載不同,所以不能把變量簡單

10、的相加,權(quán)數(shù)是我大小表示了變量 對因子的重要程度。對于主成份分析法得到的因子解,可以直接得到因子值系數(shù), 對于其他方法得到的因子解,只能得到因子值系數(shù)的估計值,通常用回歸方法得 到因子值系數(shù)的估計值。4、案例分析4.1案例調(diào)查20個地區(qū)小學生輟學率的影響因素,包括家庭經(jīng)濟狀況、當?shù)亟?jīng)濟狀況、自身心理素質(zhì)、家庭成員素質(zhì)、師資力量、社會文化趨向、身體健康狀況、宏觀教育背景、國家教育政策等指標、具體調(diào)查數(shù)據(jù)如下,根據(jù)這9項容經(jīng)行因 子分析,得到維度較少的因子。*|a|捌關 盯I*|閔刪 捌輛剖網(wǎng) 劉豊|1 ”n毎序用H扎帀I二理業(yè)弋a(chǎn)吁味1r|兀m it忒1師啜力量犬比更向一豐au?:劇颱哥背廉21

11、21<kJ l1JOOPI1Q.DD831SC015011 2如-19C37213-DD24 DOzn.oc15JD1D DO300.B547?-.12712-1.16C2?325 DDmm10JD比EME渙002i mI曲425F1531C10 0010OI1C.0QJiOW100011 DOS9217/弼用額15if nn扛TIB EDVI.DD3D CDlace2J3X1-5713i612 CD120023.0D25.00ICJCO10 DO20001 55積id1號陽四6J52I"T133 DO26(012.QDM.D0iea)16 0039001 7LK316&

12、;K11116LH4ffieSOD幻帥J4W»oaDO1&0QIfiW SSflF10(7%押山irara9悔叩sawJ-5,0010 DO12.03I&w1.EW習.如占1023 DD22iLO1Q.0D12.00lorn20 DD3DB¥.麗旳51.1?.33?121110 0010 CO俎.帥耳血恬gIfi 00xoa20001 ceeia購加訂1斑CICQ詣皿nn1E TiZ2.DDWO3in ti15015QD鬥產(chǎn)討祈:-9161B1313 DD10 COigxn2-5.ro25 (Din m26002? 005TO3-51510-1 36TO31

13、426 DD蛙0015.0020.00ffina22 (Di&OOIB.®冷豳31 14J3J1510 00SCO葩前M.OO16 (B15 COlam20 0DI 2B201-;at們的1612 QQ10 QO22.00TD.QC力SIQ DQ街B壬QD扇73173MQla.oufew22 B15UJ10OQ &UO1巧1巧-JI354-103B3WIJiOOllfflSoF叢iux.tn加mIft CD"isanl&tD口地19130015 nn冏to24J0D2D.DCim兀! rowm置It®1 01IM.VII11-1 33BBG

14、1西1DD15 wZ2.0DbuiTBW13 CD16001ECD 硒冒-719®ss&di4.2結(jié)果分析表一檢驗結(jié)果Kaiser-Meyer-Olkin Measure of Sampling Adequacy .427Bartlett's Te st of SphericityApprox. Chi-Square87.058df36Sig.000從上表可以得出,KMO是 Kaiser-meyer-Olkin的取樣適當性量數(shù),當 KMO值愈大時,表示變量的共同因素愈多,愈適合進行因素分析,根據(jù)學者Kaiser觀點,如果KMO勺值小于0.5時較不宜進行因素分析,此處的

15、 KMOS為.427,不 太適合因子分析。巴特利特球行檢驗給出的相伴概率為0.000,小于顯著性水平0.05,因此拒絕其零假設,認為可以做因子分析。In itialExtractio n家庭經(jīng)濟1.000.892當?shù)貭顩r1.000.744心理素質(zhì)1.000.898成員素質(zhì)1.000.868師資力量1.000.854文化趨向1.000.657健康狀況1.000.970教育背景1.000.656教育政策1.000.902提取方法:主成份分析法,最右邊一欄為題項的共通性。表三主成分提取情況Comp onentIn itial Eige nv aluesExtractio n Sums of Squa

16、red Loadi ngsRotation Sum s of Squared LoadingsTotal% of Varia neeCumulative %Total% of Varia neeCumulative %Total% of Varia neeCumulative %13.40737.85337.8533.40737.85337.8533.23835.97735.97721.76419.60357.4561.76419.60357.4561.84020.44156.41831.21813.52970.9861.21813.52970.9861.26214.02670.44441.0

17、5211.69182.6771.05211.69182.6771.10112.23382.6775.7378.19090.8676.4535.02995.8957.1872.07497.9698.1321.46699.4369.051.564100.000表三中,第一列是因子序號。第二列是因子變量的方差貢獻(特征值),它是衡量因子重要程序的指標。第三列是各因子變量的方差貢獻率, 表示該因子描 述的方差占原有變量的總方差的比例。第四列是各因子變量的累計方差貢獻率。 第五到第七是旋轉(zhuǎn)以后得到的因子對原變量總體的刻畫情況。第八到第十列是從初始解上按照一定標準提取了四個公因子后對原變量總體的描述情況。

18、從上表可以得出,其中前四個因子的特征值大于 1可見提取四個因子后, 它們反映了原變量的大部分信息。碎石圖因子個數(shù)從碎石圖可以看出,第四個因子之后,碎石圖的變化比較平緩,這和表三分 析的結(jié)果一致。所以確定取四個因子。表四因子載荷矩陣Component1234家庭經(jīng)濟.919-.202-.084.024心理素質(zhì)-.915-.015.106.223成員素質(zhì)-.903.055.179.133當?shù)貭顩r.770-.340.188.031教育政策.227.814.433.035文化趨向-.081-.676.409-.160教育背景.453.656.068.124師資力量-.182.170-.808-.374

19、健康狀況.149-.160-.348.895此表表示的是,在沒有進行因子旋轉(zhuǎn)時因子的載荷情況,但此時的載荷不能 明顯的表明各個因子在因變量上的負荷情況。表五旋轉(zhuǎn)后因子載荷矩陣Component1234家庭經(jīng)濟.927.041.084.153心理素質(zhì)-.919-.198.074.090成員素質(zhì)-.917-.131.093-.026當?shù)貭顩r.782-.078.351.060教育政策-.016.902.216-.203教育背景.263.764-.019.051文化趨向.046-.607.483-.230師資力量-.054-.094-.915-.074健康狀況.073-.025.037.981表五中題

20、項在其所屬之因素層面順序,是按照因素負荷量的高低排列。轉(zhuǎn)軸的主要目的,在于重新安排題項在每個共同因素上的因素負荷量, 轉(zhuǎn)軸后,使 原先轉(zhuǎn)軸前較大因素負荷量變得更大, 而轉(zhuǎn)軸前較小的因素負荷量變得更小。 轉(zhuǎn) 軸后題項在每個共同因素之因素負荷量的平方總和不變。此表表示的是,在進行了因子旋轉(zhuǎn)后,因子的載荷情況,此時的載荷能明顯 的表明各個因子在因變量上的負荷情況Comp onent12341.956.261.108.0832-.216.934-.259-.1143-.118.177.902-.3754-.162.165.327.916旋轉(zhuǎn)表六表示的是因子旋轉(zhuǎn)矩陣,標明了因子提取的方法是主成分分析法, 的方法是方差極大法。表七因子得分矩陣C

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論