已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
因子分析的基本概念和步驟一、因子分析的意義在研究實(shí)際問題時往往希望盡可能多地收集相關(guān)變量,以期望能對問題有比較全面、完整的把握和認(rèn)識。例如,對高等學(xué)校科研狀況的評價研究,可能會搜集諸如投入科研活動的人數(shù)、立項(xiàng)課題數(shù)、項(xiàng)目經(jīng)費(fèi)、經(jīng)費(fèi)支出、結(jié)項(xiàng)課題數(shù)、發(fā)表論文數(shù)、發(fā)表專著數(shù)、獲得獎勵數(shù)等多項(xiàng)指標(biāo);再例如,學(xué)生綜合評價研究中,可能會搜集諸如基礎(chǔ)課成績、專業(yè)基礎(chǔ)課成績、專業(yè)課成績、體育等各類課程的成績以及累計獲得各項(xiàng)獎學(xué)金的次數(shù)等。雖然收集這些數(shù)據(jù)需要投入許多精力,雖然它們能夠較為全面精確地描述事物,但在實(shí)際數(shù)據(jù)建模時,這些變量未必能真正發(fā)揮預(yù)期的作用,“投入”和“產(chǎn)出”并非呈合理的正比,反而會給統(tǒng)計分析帶來很多問題,可以表現(xiàn)在:計算量的問題由于收集的變量較多,如果這些變量都參與數(shù)據(jù)建模,無疑會增加分析過程中的計算工作量。雖然,現(xiàn)在的計算技術(shù)已得到了迅猛發(fā)展,但高維變量和海量數(shù)據(jù)仍是不容忽視的。變量間的相關(guān)性問題收集到的諸多變量之間通常都會存在或多或少的相關(guān)性。例如,高??蒲袪顩r評價中的立項(xiàng)課題數(shù)與項(xiàng)目經(jīng)費(fèi)、經(jīng)費(fèi)支出等之間會存在較高的相關(guān)性;學(xué)生綜合評價研究中的專業(yè)基礎(chǔ)課成績與專業(yè)課成績、獲獎學(xué)金次數(shù)等之間也會存在較高的相關(guān)性。而變量之間信息的高度重疊和高度相關(guān)會給統(tǒng)計方法的應(yīng)用帶來許多障礙。例如,多元線性回歸分析中,如果眾多解釋變量之間存在較強(qiáng)的相關(guān)性,即存在高度的多重共線性,那么會給回歸方程的參數(shù)估計帶來許多麻煩,致使回歸方程參數(shù)不準(zhǔn)確甚至模型不可用等。類似的問題還有很多。為了解決這些問題,最簡單和最直接的解決方案是削減變量的個數(shù),但這必然又會導(dǎo)致信息丟失和信息不完整等問題的產(chǎn)生。為此,人們希望探索一種更為有效的解決方法,它既能大大減少參與數(shù)據(jù)建模的變量個數(shù),同時也不會造成信息的大量丟失。因子分析正式這樣一種能夠有效降低變量維數(shù),并已得到廣泛應(yīng)用的分析方法。因子分析的概念起源于20世紀(jì)初Karl Pearson和Charles Spearmen等人關(guān)于智力測驗(yàn)的統(tǒng)計分析。目前,因子分析已成功應(yīng)用于心理學(xué)、醫(yī)學(xué)、氣象、地址、經(jīng)濟(jì)學(xué)等領(lǐng)域,并因此促進(jìn)了理論的不斷豐富和完善。因子分析以最少的信息丟失為前提,將眾多的原有變量綜合成較少幾個綜合指標(biāo),名為因子。通常,因子有以下幾個特點(diǎn):因子個數(shù)遠(yuǎn)遠(yuǎn)少于原有變量的個數(shù)原有變量綜合成少數(shù)幾個因子之后,因子將可以替代原有變量參與數(shù)據(jù)建模,這將大大減少分析過程中的計算工作量。因子能夠反映原有變量的絕大部分信息因子并不是原有變量的簡單取舍,而是原有變量重組后的結(jié)果,因此不會造成原有變量信息的大量丟失,并能夠代表原有變量的絕大部分信息。因子之間的線性關(guān)系并不顯著由原有變量重組出來的因子之間的線性關(guān)系較弱,因子參與數(shù)據(jù)建模能夠有效地解決變量多重共線性等給分析應(yīng)用帶來的諸多問題。因子具有命名解釋性通常,因子分析產(chǎn)生的因子能夠通過各種方式最終獲得命名解釋性。因子的命名解釋性有助于對因子分析結(jié)果的解釋評價,對因子的進(jìn)一步應(yīng)用有重要意義。例如,對高??蒲星闆r的因子分析中,如果能夠得到兩個因子,其中一個因子是對科研人力投入、經(jīng)費(fèi)投入、立項(xiàng)項(xiàng)目數(shù)等變量的綜合,而另一個是對結(jié)項(xiàng)項(xiàng)目數(shù)、發(fā)表論文數(shù)、獲獎成果數(shù)等變量的綜合,那么,該因子分析就是較為理想的。因?yàn)檫@兩個因子均有命名可解釋性,其中一個反映了科研投入方面的情況,可命名為科研投入因子,另一個反映了科研產(chǎn)出方面的情況,可命名為科研產(chǎn)出因子??傊蜃臃治鍪茄芯咳绾我宰钌俚男畔G失將眾多原有變量濃縮成少數(shù)幾個因子,如何使因子具有一定的命名解釋性的多元統(tǒng)計分析方法。二、因子分析的基本概念1、因子分析模型因子分析模型中,假定每個原始變量由兩部分組成:共同因子(common factors)和唯一因子(unique factors)。共同因子是各個原始變量所共有的因子,解釋變量之間的相關(guān)關(guān)系。唯一因子顧名思義是每個原始變量所特有的因子,表示該變量不能被共同因子解釋的部分。原始變量與因子分析時抽出的共同因子的相關(guān)關(guān)系用因子負(fù)荷(factor loadings)表示。因子分析最常用的理論模式如下:(j=1,2,3,n,n為原始變量總數(shù))可以用矩陣的形式表示為。其中F稱為因子,由于它們出現(xiàn)在每個原始變量的線性表達(dá)式中(原始變量可以用表示,這里模型中實(shí)際上是以F線性表示各個原始變量的標(biāo)準(zhǔn)化分?jǐn)?shù)),因此又稱為公共因子。因子可理解為高維空間中互相垂直的m個坐標(biāo)軸,A稱為因子載荷矩陣,稱為因子載荷,是第j個原始變量在第i個因子上的負(fù)荷。如果把變量看成m維因子空間中的一個向量,則表示在坐標(biāo)軸上的投影,相當(dāng)于多元線性回歸模型中的標(biāo)準(zhǔn)化回歸系數(shù);U稱為特殊因子,表示了原有變量不能被因子解釋的部分,其均值為0,相當(dāng)于多元線性回歸模型中的殘差。其中,(1)為第j個變量的標(biāo)準(zhǔn)化分?jǐn)?shù);(2)(i=1,2,m)為共同因素;(3)m為所有變量共同因素的數(shù)目;(4)為變量的唯一因素;(5)為因素負(fù)荷量。2、因子分析數(shù)學(xué)模型中的幾個相關(guān)概念因子載荷(因素負(fù)荷量factor loadings)所謂的因子載荷就是因素結(jié)構(gòu)中,原始變量與因素分析時抽取出共同因素的相關(guān)??梢宰C明,在因子不相關(guān)的前提下,因子載荷是變量和因子的相關(guān)系數(shù),反映了變量與因子的相關(guān)程度。因子載荷值小于等于1,絕對值越接近1,表明因子與變量的相關(guān)性越強(qiáng)。同時,因子載荷也反映了因子對解釋變量的重要作用和程度。因子載荷作為因子分析模型中的重要統(tǒng)計量,表明了原始變量和共同因子之間的相關(guān)關(guān)系。因素分析的理想情況,在于個別因素負(fù)荷量不是很大就是很小,這樣每個變量才能與較少的共同因素產(chǎn)生密切關(guān)聯(lián),如果想要以最少的共同因素數(shù)來解釋變量間的關(guān)系程度,則彼此間或與共同因素間就不能有關(guān)聯(lián)存在。一般說來,負(fù)荷量為0.3或更大被認(rèn)為有意義。所以,當(dāng)要判斷一個因子的意義時,需要查看哪些變量的負(fù)荷達(dá)到了0.3或0.3以上。變量共同度(共同性,Communality)變量共同度也就是變量方差,就是指每個原始變量在每個共同因子的負(fù)荷量的平方和,也就是指原始變量方差中由共同因子所決定的比率。變量的方差由共同因子和唯一因子組成。共同性表明了原始變量方差中能被共同因子解釋的部分,共同性越大,變量能被因子說明的程度越高,即因子可解釋該變量的方差越多。共同性的意義在于說明如果用共同因子替代原始變量后,原始變量的信息被保留的程度。因子分析通過簡化相關(guān)矩陣,提取可解釋相關(guān)的少數(shù)因子。一個因子解釋的是相關(guān)矩陣中的方差,而解釋方差的大小稱為因子的特征值。一個因子的特征值等于所有變量在該因子上的負(fù)荷值的平方總和。變量的共同度的數(shù)學(xué)定義為:,該式表明變量的共同度是因子載荷矩陣A中第j行元素的平方和。由于變量的方差可以表示成,因此變量的方差可由兩個部分解釋:第一部分為共同度,是全部因子對變量方差解釋說明的比例,體現(xiàn)了因子全體對變量的解釋貢獻(xiàn)程度。變量共同度越接近1,說明因子全體解釋說明了變量的較大部分方差,如果用因子全體刻畫變量,則變量的信息丟失較少;第二部分為特殊因子U的平方,反應(yīng)了變量方差中不能由因子全體解釋說明的比例,越小則說明變量的信息丟失越少??傊?,變量d共同度刻畫了因子全體對變量信息解釋的程度,是評價變量信息丟失程度的重要指標(biāo)。如果大多數(shù)原有變量的變量共同度均較高(如高于0.8),則說明提取的因子能夠反映原有變量的大部分信息(80以上)信息,僅有較少的信息丟失,因子分析的效果較好。因子,變量共同度是衡量因子分析效果的重要依據(jù)。因子的方差貢獻(xiàn)(特征值eigenvalue)因子的方差貢獻(xiàn)(特征值)的數(shù)學(xué)定義為:,該式表明,因子的方差貢獻(xiàn)是因子載荷矩陣A中第i列元素的平方和。因子的方差貢獻(xiàn)反映了因子對原有變量總方差的解釋能力。該值越高,說明相應(yīng)因子的重要性越高。因此,因子的方差貢獻(xiàn)和方差貢獻(xiàn)率是衡量因子重要性的關(guān)鍵指標(biāo)。為了便于說明,以三個變量抽取兩個共同因素為例,三個變量的線性組合分別為:轉(zhuǎn)換成因素矩陣如下:變量(共同因素一)(共同因素二)共同性()唯一因素()特征值解釋量所謂共同性,就是每個變量在每個共同因素之負(fù)荷量的平方總和(一橫列中所有因素負(fù)荷量的平方和),也就是個別變量可以被共同因素解釋的變異量百分比,這個值是個別變量與共同因素間多元相關(guān)的平方。從共同性的大小可以判斷這個原始變量與共同因素之間關(guān)系程度。而各變量的唯一因素大小就是1減掉該變量共同性的值。(在主成分分析中,有多少個原始變量便有多少個“component”成分,所以共同性會等于1,沒有唯一因素)。至于特征值是每個變量在某一共同因素之因素負(fù)荷量的平方總和(一直行所有因素負(fù)荷量的平方和)。在因素分析之共同因素抽取中,特征值大的共同因素會最先被抽取,其次是次大者,最后抽取的共同因素之特征值最小,通常會接近0(在主成分分析中,有幾個題項(xiàng),便有幾個成分,因而特征值的總和剛好等于變量的總數(shù))。將每個共同因素的特征值除以總題數(shù),為此共同因素可以解釋的變異量,因素分析的目的,即在因素結(jié)構(gòu)的簡單化,希望以最少的共同因素,能對總變異量作最大的解釋,因而抽取的因素越少越好,但抽取因素之累積解釋的變異量則越大越好。3、社會科學(xué)中因素分析通常應(yīng)用在三個層面:(1)顯示變量間因素分析的組型(pattern)(2)偵測變量間之群組(clusters),每個群組所包括的變量彼此相關(guān)很高,同構(gòu)型較大,亦即將關(guān)系密切的個別變量合并為一個子群。(3)減少大量變量數(shù)目,使之稱為一組涵括變量較少的統(tǒng)計自變量(稱為因素),每個因素與原始變量間有某種線性關(guān)系存在,而以少數(shù)因素層面來代表多數(shù)、個別、獨(dú)立的變量。因素分析具有簡化數(shù)據(jù)變量的功能,以較少層面來表示原來的數(shù)據(jù)結(jié)構(gòu),它根據(jù)變量間彼此的相關(guān),找出變量間潛在的關(guān)系結(jié)構(gòu),變量間簡單的結(jié)構(gòu)關(guān)系稱為“成份”(components)或“因素”(factors).三、因素分析的主要方式圍繞濃縮原有變量提取因子的核心目標(biāo),因子分析主要涉及以下五大基本步驟:1、因子分析的前提條件由于因子分析的主要任務(wù)之一是對原有變量進(jìn)行濃縮,即將原有變量中的信息重疊部分提取和綜合成因子,進(jìn)而最終實(shí)現(xiàn)減少變量個數(shù)的目的。因此它要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則,如果原有變量相互獨(dú)立,相關(guān)程度很低,不存在信息重疊,它們不可能有共同因子,那么也就無法將其綜合和濃縮,也就無需進(jìn)行因子分析。本步驟正是希望通過各種方法分析原有變量是否存在相關(guān)關(guān)系,是否適合進(jìn)行因子分析。SPSS提供了四個統(tǒng)計量可幫助判斷觀測數(shù)據(jù)是否適合作因子分析:(1)計算相關(guān)系數(shù)矩陣Correlation Matrix在進(jìn)行提取因子等分析步驟之前,應(yīng)對相關(guān)矩陣進(jìn)行檢驗(yàn),如果相關(guān)矩陣中的大部分相關(guān)系數(shù)小于0.3,則不適合作因子分析;當(dāng)原始變量個數(shù)較多時,所輸出的相關(guān)系數(shù)矩陣特別大,觀察起來不是很方便,所以一般不會采用此方法或即使采用了此方法,也不方便在結(jié)果匯報中給出原始分析報表。(2)計算反映象相關(guān)矩陣Anti-image correlation matrix反映象矩陣重要包括負(fù)的協(xié)方差和負(fù)的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是在控制了其他變量對兩變量影響的條件下計算出來的凈相關(guān)系數(shù)。如果原有變量之間確實(shí)存在較強(qiáng)的相互重疊以及傳遞影響,也就是說,如果原有變量中確實(shí)能夠提取出公共因子,那么在控制了這些影響后的偏相關(guān)系數(shù)必然很小。反映象相關(guān)矩陣的對角線上的元素為某變量的MSA(Measure of Sample Adequacy)統(tǒng)計量,其數(shù)學(xué)定義為:,其中,是變量和其他變量()間的簡單相關(guān)系數(shù),是變量()在控制了剩余變量下的偏相關(guān)系數(shù)。由公式可知,某變量的統(tǒng)計量的取值在0和1之間。當(dāng)它與其他所有變量間的簡單相關(guān)系數(shù)平方和遠(yuǎn)大于偏相關(guān)系數(shù)的平方和時,值接近1。值越接近1,意味變量與其他變量間的相關(guān)性越強(qiáng);當(dāng)它與其他所有變量間的簡單相關(guān)系數(shù)平方和接近0時,值接近0。值越接近0,意味變量與其他變量間的相關(guān)性越弱。觀察反映象相關(guān)矩陣,如果反映象相關(guān)矩陣中除主對角元素外,其他大多數(shù)元素的絕對值均小,對角線上元素的值越接近1,則說明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。與(1)中最后所述理由相同,一般少采用此方法。(3)巴特利特球度檢驗(yàn)Bartlett test of sphericityBartlett球體檢驗(yàn)的目的是檢驗(yàn)相關(guān)矩陣是否是單位矩陣(identity matrix),如果是單位矩陣,則認(rèn)為因子模型不合適。Bartlett球體檢驗(yàn)的虛無假設(shè)為相關(guān)矩陣是單位陣,如果不能拒絕該假設(shè)的話,就表明數(shù)據(jù)不適合用于因子分析。一般說來,顯著水平值越?。?.05)表明原始變量之間越可能存在有意義的關(guān)系,如果顯著性水平很大(如0.10以上)可能表明數(shù)據(jù)不適宜于因子分析。(4)KMO(Kaiser-Meyer-Oklin Measure of Smapling Adequacy)KMO是Kaiser-Meyer-Olkin的取樣適當(dāng)性量數(shù)。KMO測度的值越高(接近1.0時),表明變量間的共同因子越多,研究數(shù)據(jù)適合用因子分析。通常按以下標(biāo)準(zhǔn)解釋該指標(biāo)值的大?。篕MO值達(dá)到0.9以上為非常好,0.80.9為好,0.70.8為一般,0.60.7為差,0.50.6為很差。如果KMO測度的值低于0.5時,表明樣本偏小,需要擴(kuò)大樣本。綜上所述,經(jīng)常采用的方法為巴特利特球度檢驗(yàn)Bartlett test of sphericity和KMO(Kaiser-Meyer-Oklin Measure of Smapling Adequacy)。2、抽取共同因子,確定因子的數(shù)目和求因子解的方法將原有變量綜合成少數(shù)幾個因子是因子分析的核心內(nèi)容。本步驟正是研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取和綜合因子。決定因素抽取的方法,有“主成份分析法”(principal components analysis)、主軸法、一般化最小平方法、未加權(quán)最小平方法、最大概似法、Alpha因素抽取法與映象因素抽取法等。使用者最常使用的是主成份分析法與主軸法,其中,又以主成份分析法使用最為普遍,在SPSS使用手冊中,也建議研究者多采用主成份分析法來估計因素負(fù)荷量(SPSS Inc,1998)。所謂主成份分析法,就是以較少的成份解釋原始變量方差的較大部分。進(jìn)行主成份分析時,先要將每個變量的數(shù)值轉(zhuǎn)換成標(biāo)準(zhǔn)值。主成份分析就是用多個變量組成一個多維空間,然后在空間內(nèi)投射直線以解釋最大的方差,所得的直線就是共同因子,該直線最能代表各個變量的性質(zhì),而在此直線上的數(shù)值所構(gòu)成的一個變量就是第一個共同因子,或稱第一因子()。但是在空間內(nèi)還有剩余的方差,所以需要投射第二條直線來解釋方差。這時,還要依據(jù)第二條準(zhǔn)則,即投射的第二條直線與第一條直線成直交關(guān)系(即不相關(guān)),意為代表不同的方面。第二條直線上的數(shù)值所構(gòu)成的一個變量,稱為第二因子()。依據(jù)該原理可以求出第三、第四或更多的因子。原則上,因子的數(shù)目與原始變量的數(shù)目相同,但抽取了主要的因子之后,如果剩余的方差很小,就可以放棄其余的因子,以達(dá)到簡化數(shù)據(jù)的目的。因子數(shù)目的確定沒有精確的定量方法,但常用的方法是借助兩個準(zhǔn)則來確定因子的個數(shù)。一是特征值(eigenvalue)準(zhǔn)則,二是碎石圖檢驗(yàn)(scree test)準(zhǔn)則。特征值準(zhǔn)則就是選取特征值大于或等于1的主成份作為初始因子,而放棄特征值小于1的主成份。因?yàn)槊總€變量的方差為1,該準(zhǔn)則認(rèn)為每個保留下來的因子至少應(yīng)該能解釋一個變量的方差,否則達(dá)不到精簡數(shù)據(jù)的目的。碎石檢驗(yàn)準(zhǔn)則是根據(jù)因子被提取的順序繪出特征值隨因子個數(shù)變化的散點(diǎn)圖,根據(jù)圖的形狀來判斷因子的個數(shù)。散點(diǎn)曲線的特點(diǎn)是由高到低,先陡后平,最后幾乎成一條直線。曲線開始變平的前一個點(diǎn)被認(rèn)為是提取的最大因子數(shù)。后面的散點(diǎn)類似于山腳下的碎石,可舍棄而不會丟失很多信息。3、使因子更具有命名可解釋性通常最初因素抽取后,對因素?zé)o法作有效的解釋。這時往往需要進(jìn)行因子旋轉(zhuǎn)(rotation),通過坐標(biāo)變換使因子解的意義更容易解釋。轉(zhuǎn)軸的目的在于改變題項(xiàng)在各因素負(fù)荷量的大小,轉(zhuǎn)軸時根據(jù)題項(xiàng)與因素結(jié)構(gòu)關(guān)系的密切程度,調(diào)整各因素負(fù)荷量的大小,轉(zhuǎn)軸后,使得變量在每個因素的負(fù)荷量不是變大(接近1)就是變得更?。ń咏?),而非轉(zhuǎn)軸前在每個因素的負(fù)荷量大小均差不多,這就使對共同因子的命名和解釋變量變得更容易。轉(zhuǎn)軸后,每個共同因素的特征值會改變,但每個變量的共同性不會改變。常用的轉(zhuǎn)軸方法,有最大變異法(Varimax)、四次方最大值法(Quartimax)、相等最大值法(Equamax)、直接斜交轉(zhuǎn)軸法(Direct Oblimin)、Promax轉(zhuǎn)軸法,其中前三者屬于“直交轉(zhuǎn)軸法”(orthogonal rotations),在直交轉(zhuǎn)軸法中,因素(成份)與因素(成份)間沒有相關(guān),亦即其相關(guān)為0,因素軸間夾角為90;而后二者(直接斜交轉(zhuǎn)軸、Promax轉(zhuǎn)軸法)屬“斜交轉(zhuǎn)軸”(oblique rotations),采用斜交轉(zhuǎn)軸法,表示因素與因素間彼此有某種程度的相關(guān),亦即因素軸間的夾角不是90。直交轉(zhuǎn)軸法的優(yōu)點(diǎn)是因素間提供的信息不會重疊,觀察體在某一個因素的分?jǐn)?shù)與在其它因素的分?jǐn)?shù),彼此獨(dú)立不相關(guān);而其缺點(diǎn)是研究者迫使因素間不相關(guān),但在實(shí)際情境中,它們彼此有相關(guān)的可能性很高。因而直交轉(zhuǎn)軸方法偏向較多人為操控方式,不需要正確響應(yīng)現(xiàn)實(shí)世界中自然發(fā)生的事件(Bryman&Cramer,1997)。所謂直交旋轉(zhuǎn)法(orthogonal rotations),就是要求各個因子在旋轉(zhuǎn)時都要保持直角關(guān)系,即不相關(guān)。在直交旋轉(zhuǎn)時,每個變量的共同性(commonality)是不變的。不同的直交旋轉(zhuǎn)方法有不同的作用。在直交旋轉(zhuǎn)法中,常用于社會科學(xué)研究的方式是Varimax旋轉(zhuǎn)法。該方法是在旋轉(zhuǎn)時盡量弄清楚在每一個因子上各個變量的因子負(fù)荷情況,也即讓因子矩陣中每一列的的值盡可能變成1或0,該旋轉(zhuǎn)法的作用是突出每個因子的性質(zhì),可以更清楚哪些變量是屬于它的。由此可見,Varimax旋轉(zhuǎn)法可以幫助找出多個因子,以澄清概念的內(nèi)容。Quartimax旋轉(zhuǎn)法可以則可以盡量弄清楚每個變量在各個因子上的負(fù)荷情況,即讓每個變量在某個因子上的負(fù)荷盡可能等于1,而在其它因子上則盡可能等于0。該方法可以增強(qiáng)第一因子的解釋力,而使其它因子的效力減弱??梢奞uartimax旋轉(zhuǎn)法適合于找出一個最強(qiáng)效力的因子。Equamax旋轉(zhuǎn)法則是一種折中的做法,即盡可能簡化因子,也可弄清楚負(fù)荷情況。其缺點(diǎn)是可能兩方面都未照顧好。斜交旋轉(zhuǎn)(oblique rotarion)方法是要求在旋轉(zhuǎn)時各個因子之間呈斜交的關(guān)系,表示允許該因子與因子之間有某種程度上的相關(guān)。斜交旋轉(zhuǎn)中,因子之間的夾可以是任意的,所以用斜交因子描述變量可以使因子結(jié)構(gòu)更為簡潔。選擇直接斜交旋轉(zhuǎn)時,必須指定Delta值。該值的取值范圍在01之間,0值產(chǎn)生最高相關(guān)因子,大的負(fù)數(shù)產(chǎn)生旋轉(zhuǎn)的結(jié)果與直交接近。Promax斜交旋轉(zhuǎn)方法也允許因子彼此相關(guān),它比直接斜交旋轉(zhuǎn)更快,因此適用于大數(shù)據(jù)集的因子分析。綜上所述,不同的因子旋轉(zhuǎn)方式各有其特點(diǎn)。因此,究竟選擇何種方式進(jìn)行因子旋轉(zhuǎn)取決于研究問題的需要。如果因子分析的目的只是進(jìn)行數(shù)據(jù)簡化,而因子的確切含義是什么并不重要,就應(yīng)該選擇直交旋轉(zhuǎn)。如果因子分析的目的是要得到理論上有意義的因子,應(yīng)該選擇斜交因子。事實(shí)上,研究中很少有完全不相關(guān)的變量,所以,從理論上看斜交旋轉(zhuǎn)優(yōu)于直交旋轉(zhuǎn)。但是斜交旋轉(zhuǎn)中因子之間的斜交程度受研究者定義的參數(shù)的影響,而且斜交選裝中所允許的因子之間的相關(guān)程度是很小的,因?yàn)闆]有人會接受兩個高度相關(guān)的共同因子。如果兩個因子確實(shí)高度相關(guān),大多數(shù)研究者會選取更少的因子重新進(jìn)行分析。因此,斜交旋轉(zhuǎn)的優(yōu)越性大打折扣。在實(shí)際研究中,直交旋轉(zhuǎn)(尤其是Varimax旋轉(zhuǎn)法)得到更廣泛的運(yùn)用。4、決定因素與命名轉(zhuǎn)軸后,要決定因素數(shù)目,選取較少因素層面,獲得較大的解釋量。在因素命名與結(jié)果解釋上,必要時可將因素計算后之分?jǐn)?shù)存儲,作為其它程序分析之輸入變量。5、計算各樣本的因子得分因子分析的最終目標(biāo)是減少變量個數(shù),以便在進(jìn)一步的分析中用較少的因子代替原有變量參與數(shù)據(jù)建模。本步驟正是通過各種方法計算各樣本在各因子上的得分,為進(jìn)一步的分析奠定基礎(chǔ)。此外,在因素分析中,研究者還應(yīng)當(dāng)考慮以下幾個方面(Bryman&Cramer,1997):(1)可從相關(guān)矩陣中篩選題項(xiàng)題項(xiàng)間如果沒有顯著的相關(guān),或相關(guān)太小,則題項(xiàng)間抽取的因素與研究者初始構(gòu)建的層面可能差距很大。相對的題項(xiàng)間如果有極其顯著的正/負(fù)相關(guān),則因素分析較易構(gòu)建成有意義的內(nèi)容。因素分析前,研究者可從題項(xiàng)間相關(guān)矩陣分布情形,簡扼看出哪些題項(xiàng)間有密切關(guān)系。(2)樣本大小因素分析的可靠性除與預(yù)試樣本的抽樣有關(guān)外,預(yù)樣本數(shù)的多少更有密切關(guān)系。進(jìn)行因素分析時,預(yù)試樣本應(yīng)該多少才能使結(jié)果最為可靠,學(xué)者間沒有一致的結(jié)論,然而多數(shù)學(xué)者均贊同“因素分析要有可靠的結(jié)果,受試樣本數(shù)要比量表題項(xiàng)數(shù)還多”,如果一個分量表有40個預(yù)試題項(xiàng),則因素分析時,樣本數(shù)不得少于40。此外,在進(jìn)行因素分析時,學(xué)者Gorshch(1983)的觀點(diǎn)可作為參考:題項(xiàng)與受試者的比例最好為1:5;受試總樣本總數(shù)不得少于100人。如果研究主要目的在找出變量群中涵括何種因素,樣本數(shù)要盡量大,才能確保因素分析結(jié)果的可靠性。(3)因素數(shù)目的挑選進(jìn)行因素分析,因素數(shù)目考慮與挑選標(biāo)準(zhǔn),常用的準(zhǔn)則有兩種:一是學(xué)者Kaiser所提的準(zhǔn)則標(biāo)準(zhǔn):選取特征值大于1的因素,Kaiser準(zhǔn)則判斷應(yīng)用時,因素分析的題項(xiàng)數(shù)最好不要超過30題,題項(xiàng)平均共同性最好在0.70以上,如果受試樣本數(shù)大于250位,則平均共同性應(yīng)在0.60以上(Stevens,1992),如果題項(xiàng)數(shù)在50題以上,有可能抽取過多的共同因素(此時研究者可以限定因素抽取的數(shù)目);二為CATTELL(1996)所倡導(dǎo)的特征值圖形的陡坡檢驗(yàn)(scree test),此圖根據(jù)最初抽取因素所能解釋的變異量高低繪制而成?!岸钙率保╯cree)原是地質(zhì)學(xué)上的名詞,代表在巖石斜坡底層發(fā)現(xiàn)的小碎石,這些碎石價值性不高。應(yīng)用于統(tǒng)計學(xué)之因素分析中,表示陡坡圖底端的因素不具重要性,可以舍棄不用。因而從陡坡圖的情形,也可作為挑選因素分析數(shù)目的標(biāo)準(zhǔn)。在多數(shù)的因素分析中,根據(jù)Kaiser選取的標(biāo)準(zhǔn),通常會抽取過多的共同因素,因而陡坡圖是一個重要的選取準(zhǔn)則。在因素數(shù)目準(zhǔn)則挑選上,除參考以上兩大主要判斷標(biāo)準(zhǔn)外,還要考慮到受試者多少、題項(xiàng)數(shù)、變量共同性的大小等。四、因素分析的操作說明Statistics/Data Reduction/Factor(統(tǒng)計分析/數(shù)據(jù)縮減/因子)出現(xiàn)“Factor Analysis”(因子分析)對話框,將左邊框中鑒別度達(dá)顯著性的a1a22選如右邊“Variables”(變量)下的空框中。其中五個按鈕內(nèi)的圖標(biāo)意義如下:Descriptives(描述性統(tǒng)計量)按鈕,會出現(xiàn)“Factor Analysis:Descriptives”(因子分析:描述性統(tǒng)計量)對話窗口1“Statistics”(統(tǒng)計量)選項(xiàng)框(1) “Univariate descriptives”(單變量描述性統(tǒng)計量):顯示每一題項(xiàng)的平均數(shù)、標(biāo)準(zhǔn)差。(2)“Initial solution”(未轉(zhuǎn)軸之統(tǒng)計量):顯示因素分析未轉(zhuǎn)軸前之共同性(communality)、特征值(eigenvalues)、變異數(shù)百分比及累積百分比。2“Correlation Matric”(相關(guān)矩陣)選項(xiàng)框(1)“Coefficients”(系數(shù)):顯示題項(xiàng)的相關(guān)矩陣;(2)“Significance levels”(顯著水準(zhǔn)):求出前述矩陣的顯著水準(zhǔn);(3)“Determinant”(行列式):求出前述相關(guān)矩陣的行列式值;(4)“KMO and Bartletts test of sphericity”(KMO與Bartlett的球形檢定):顯示KMO抽樣適當(dāng)性參數(shù)與Bartlett的球形檢定;(5)“Inverse”(倒數(shù)模式):求出相關(guān)矩陣的反矩陣;(6)“Reproduced”(重制的):顯示重制相關(guān)矩陣,上三角形矩陣代表殘差值;而主對角線及下三角形代表相關(guān)系數(shù);(7)“Anti-image”(反映象):求出反映象的共變量及相關(guān)矩陣;在“Factor Analysis:Descriptives”對話窗口中,選取“Initial solution”、“KMO and Bartletts test of sphericity”二項(xiàng)。Extraction(萃?。┌粹o,會出現(xiàn)“Factor Analysis:Extraction”(因子分析:萃取)對話窗口1“Method”(方法)選項(xiàng)框:下拉式選項(xiàng)內(nèi)有7種選取因素的方法(1)“Principal components”法:主成份分析法抽取因素,此為SPSS內(nèi)定方法;(2)“Unweighted least squares”法:未加權(quán)最小平方法;(3)“Ggeneralized least square”法:一般化最小平方法;(4)“Mmximum likelihood”法:最大概似法;(5)“Principal-axis factoring”法:主軸法;(6)“Alpha factoring”法:因素抽取法;(7)“Image factoring”法:映象因素抽取法;2“Analyze”(分析)選項(xiàng)方框(1)“Correlation matrix”(相關(guān)矩陣):以相關(guān)矩陣來抽取因素;(2)“Covariance matrix”(共變異系數(shù)矩陣):以共變量矩陣來抽取因素。3“Display”(顯示)選項(xiàng)方框(1)“Unrotated factor solution”(未旋轉(zhuǎn)因子解):顯示未轉(zhuǎn)軸時因素負(fù)荷量、特征值及共同性;(2)“Screet plot”(陡坡圖):顯示陡坡圖4“Extract”(萃取)選項(xiàng)方框(1)“Eigenvalue over:”(特征值):后面的空格內(nèi)定為1,表示因素抽取時,只抽取特征值大于1者,使用者可隨意輸入0至變量總數(shù)之間的值;(2)“Number of factors”(因子個數(shù)):選取此項(xiàng)時,后面的空格內(nèi)輸入限定之因素個數(shù)。在“Factor Analysis:Extraction”對話窗口中,抽取因素方法選擇“Principal components”,選取“Correlation matrix”、并勾選“Unrotated factor solution”、Screet plot”等項(xiàng),在抽取因素時限定在特征值大于1者,在“Eigenvalue over:”后面的空格內(nèi)輸入1。Rotation(萃?。┌粹o,會出現(xiàn)“Factor Analysis:Rotation”(因子分析:旋轉(zhuǎn))對話窗口1“Method”(方法)選項(xiàng)框內(nèi)有6中因素轉(zhuǎn)軸方法(1)“None”:不需要轉(zhuǎn)軸;(2)“Varimax”:最大變異法,屬正交轉(zhuǎn)軸法之一;(3)“Quarimax”:四次方最大值法,屬正交轉(zhuǎn)軸法之一;(4)“Equamax”:相等最大值法,屬正交轉(zhuǎn)軸法之一;(5)“Direct Oblimin”:直接斜交轉(zhuǎn)軸法,屬斜交轉(zhuǎn)軸法之一;(6)“Promax”:Promax轉(zhuǎn)軸法,屬斜交轉(zhuǎn)軸法之一。2“Display”(顯示)選項(xiàng)框:(1)“Rotated solution”(轉(zhuǎn)軸后的解):顯示轉(zhuǎn)軸后的相關(guān)信息,正交轉(zhuǎn)軸顯示因素組型(pattern)矩陣及因素轉(zhuǎn)換矩陣;斜交轉(zhuǎn)軸則顯示因素組型、因素結(jié)構(gòu)矩陣與因素相關(guān)矩陣。(2)“Loading plot”(因子負(fù)荷量):繪出因素的散布圖。3“Maximum Iterations for Convergence”:轉(zhuǎn)軸時執(zhí)行的疊代(iterations)最多次數(shù),后面內(nèi)定的數(shù)字25(算法執(zhí)行轉(zhuǎn)軸時,執(zhí)行步驟的次數(shù)上限)。在“Factor Analysis:Rotation”對話窗中,選取“Varimax”、“Rotated solution”等項(xiàng)。研究者要勾選“Rotated solution”選項(xiàng),才能顯示轉(zhuǎn)軸后的相關(guān)信息。Score(分?jǐn)?shù))按鈕1“Save as variable”(因素存儲變量)框勾選時可將新建立的因素分?jǐn)?shù)存儲至數(shù)據(jù)文件中,并產(chǎn)生新的變量名稱(內(nèi)定為fact_1、fact_2等)。在“Method”框中表示計算因素分?jǐn)?shù)的方法有三種:(1)“Regression”:使用回歸法;(2)“Bartlett”:使用Bartlette法;(3)“Anderson-Robin”:使用Anderson-Robin法;2“Display factor score coefficient matrix”(顯示因素分?jǐn)?shù)系數(shù)矩陣)選項(xiàng)勾選時可顯示因素分?jǐn)?shù)系數(shù)矩陣。Options(選項(xiàng))按鈕,會出現(xiàn)“Factor Analysis:Options”(因子分析:選項(xiàng))對話窗口1“Missing Values(遺漏值)框選項(xiàng):遺漏值的處理方式。(1)“Exclude cases listwise”(完全排除遺漏值):觀察值在所有變量中沒有遺漏者才加以分析;(2)“Exclude cases pairwise”(成對方式排除):在成對相關(guān)分析中出現(xiàn)遺漏值的觀察值舍棄;(3)“Replace with mean”(用平均數(shù)置換):以變量平均值取代遺漏值。2“Coefficient Display Format(系數(shù)顯示格式)框選項(xiàng):因素負(fù)荷量出現(xiàn)的格式。(1)“Sorted by size”(依據(jù)因素負(fù)荷量排序):根據(jù)每一因素層面之因素負(fù)荷量的大小排序;(2)“Suppress absolute values less than”(絕對值舍棄之下限):因素負(fù)荷量小于后面數(shù)字者不被顯示,內(nèi)定的值為0.1。在“Factor Analysis:Options”對話窗口中,勾選“Exclude cases listwise”、“Sorted by size”等項(xiàng),并勾選“Suppress absolute values less than”選項(xiàng),正式的論文研究中應(yīng)呈現(xiàn)題項(xiàng)完整的因素負(fù)荷量較為適宜。按Continue按鈕,再按OK確定。五、因素分析的結(jié)果解釋1報表1KMO測度和Bartlett球形檢驗(yàn)表KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.857Bartletts Test of SphericityApprox. Chi-Square1187.740df231Sig.000KMO是Kaiser-Meyer-Olkin的取樣適當(dāng)性量數(shù)。KMO測度的值越高(接近1.0時),表明變量間的共同因子越多,研究數(shù)據(jù)適合用因子分析。通常按以下標(biāo)準(zhǔn)解釋該指標(biāo)值的大?。篕MO值達(dá)到0.9以上為非常好,0.80.9為好,0.70.8為一般,0.60.7為差,0.50.6為很差。如果KMO測度的值低于0.5時,表明樣本偏小,需要擴(kuò)大樣本,此處的KMO值為0.857,表示適合進(jìn)行因素分析。Bartlett球體檢驗(yàn)的目的是檢驗(yàn)相關(guān)矩陣是否是單位矩陣(identity matrix),如果是單位矩陣,則認(rèn)為因子模型不合適。Bartlett球體檢驗(yàn)的虛無假設(shè)為相關(guān)矩陣是單位陣,如果不能拒絕該假設(shè)的話,就表明數(shù)據(jù)不適合用于因子分析。一般說來,顯著水平值越?。?.05)表明原始變量之間越可能存在有意義的關(guān)系,如果顯著性水平很大(如0.10以上)可能表明數(shù)據(jù)不適宜于因子分析。本例中,Bartlett球形檢驗(yàn)的值為1187.740(自由度為231),伴隨概率值為0.0000.01,達(dá)到了顯著性水平,說明拒絕零假設(shè)而接受備擇假設(shè),即相關(guān)矩陣不是單位矩陣,代表母群體的相關(guān)矩陣間有共同因素存在,適合進(jìn)行因素分析。2報表2共同因子方差(共同性)表Communalities InitialExtractiona11.000.719a21.000.656a31.000.734a41.000.675a51.000.612a61.000.755a71.000.631a81.000.572a91.000.706a101.000.784a111.000.756a121.000.774a131.000.564a141.000.706a151.000.662a161.000.500a171.000.748a181.000.554a191.000.502a201.000.767a211.000.654a221.000.471Extraction Method: Principal Component Analysis.上表報告的是共同因子方差,即表明每個變量被解釋的方差量。初始共同因子方差(Initial Communalities)是每個變量被所有成份或因子解釋的方差估計量。對于主成份分析法來說,它總是等于1,因?yàn)橛卸嗌賯€原始變量就有多少個成份(Communalitie),因此共同性會等于1。抽取共同因子方差是指因子解中每個變量被因子或成份解釋的方差估計量。這些共同因子方差是用來預(yù)測因子的變量的多重相關(guān)的平方。數(shù)值小就說明該變量不適合作因子,可在分析中將其排除。3報表3.1旋轉(zhuǎn)前總的解釋方差Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared Loadings Total% of VarianceCumulative %Total% of VarianceCumulative %18.14537.02437.0248.14537.02437.02422.72812.40049.4242.72812.40049.42431.3005.90855.3321.3005.90855.33241.2625.73661.0681.2625.73661.06851.0664.84565.9131.0664.84565.9136.9224.19370.106 7.8693.95174.057 8.7403.36577.422 9.6813.09680.518 10.6202.81883.336 11.5262.39185.727 12.4922.23587.962 13.4221.91989.882 14.4101.86491.746 15.3431.56093.306 16.2981.35494.661 17.2581.17295.833 18.2491.13496.966 19.211.95797.923 20.176.79898.721 21.146.66499.385 22.135.615100.000 Extraction Method: Principal Component Analysis.上表叫做總的解釋方差表。左邊第一欄為各成份(Component)的序號,共有22個變量,所以有22個成份。第二大欄為初始特征值,共由三欄構(gòu)成:特征值、解釋方差和累積解釋方差。Total欄為各成份的特征值,欄中只有5個成份的特征值超過了1;其余成份的特征值都沒有達(dá)到或超過1。of Variance欄為各成份所解釋的方差占總方差的百分比,即各因子特征值占總特征值總和的百分比。Cumulative欄為各因子方差占總方差的百分比的累計百分比。如在of Variance欄中,第一和第二成份的方差百分比分別為37.024、12.400,而在累計百分比欄中,第一成份的累計百分比仍然為37.024,第二成份的累計方差百分比為49.424,即是兩個成份的方差百分比的和(37.024+12.400)。第三大欄為因子提取的結(jié)果,未旋轉(zhuǎn)解釋的方差。第三大欄與第二大欄的前五行完全相同,即把特征值大于1的四個成份或因子單獨(dú)列出來了。這四個特征值由大到小排列,所以第一個共同因子的解釋方差最大。3報表3.2旋轉(zhuǎn)后總的解釋方差Total Variance ExplainedComponentRotation Sums of Squared Loadings Total% of VarianceCumulative %15.11323.24323.24323.91717.80641.04932.0359.24950.29841.7287.85658.15451.7077.75965.9136 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Extraction Method: Principal Component Analysis.第四大欄為旋轉(zhuǎn)后解釋的方差。(方便顯示起見,放在了表3.1下面,作為表3.2)Total欄為旋轉(zhuǎn)后的特征值。與旋轉(zhuǎn)前的Total欄相比,不難發(fā)現(xiàn),四個成份的特征值有所變化。旋轉(zhuǎn)前的特征值從8.145到1.066,最大特征值與最小特征值之間的差距比較大,而旋轉(zhuǎn)后的特征值相對集中。盡管如此,旋轉(zhuǎn)前、后的總特征值沒有改變,最后的累計方差百分比也沒有改變,讓然為65.913。4表4碎石圖碎石圖和結(jié)果3的被解釋的總方差的作用相同,都是為了確定因子的數(shù)目。從碎石圖可以看出,從第6個因子開始,以后的曲線變得比較平緩,最后接近一條直線。據(jù)此,可以抽取5個因子。最后決定抽取多少個因子,還要看后面的結(jié)果。5表5未旋轉(zhuǎn)成份矩陣(顯示全部載荷)Component Matrix(a) Component12345a6.796.273.065-.194.071a12-.734.354.253.178.119a3.731.419-.030-.150.019a1.730.391-.104-.137.061a8.727.108-.137-.040.106a10-.726.355-.145.332.014a2.682.397-.139-.118-.011a20.653.042.095.544-.184a11-.637.505.216.158.156a5.635.413-.171-.005.094a7.598.270-.295.236.242a22.567.115-.223.164-.243a17.567-.181.426.247-.390a9-.547.094-.378.193.467a19.527.053.397.146.206a13-.527.509.066.052-.142a14-.545.607-.030.164-.113a15-.455.561.332-.142-.093a4.501.556.255-.224-.003a18.375-.130.469.083.413a21.516.031-.116.599-.123a16-.366.278-.209-.196-.455Extraction Method:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第3章結(jié)締組織課件講課資料
- 更年期用藥未來發(fā)展趨勢報告
- 開展三責(zé)兩對標(biāo)教育活動培訓(xùn)資料
- 2024年浙江舟山群島新區(qū)旅游與健康職業(yè)學(xué)院高職單招職業(yè)技能測驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024年陽春市中醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 2024年江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測驗(yàn)歷年參考題庫(頻考版)含答案解析
- 二零二五年度門窗安裝工程質(zhì)保合同范本2篇
- 2024年武漢鐵路橋梁職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 二零二五版不履行離婚協(xié)議贍養(yǎng)費(fèi)追償起訴狀3篇
- 2024年杭州職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 2024年招投標(biāo)培訓(xùn)
- 新反詐知識考試題庫200題(含答案)
- 部編版三年級上冊語文期末復(fù)習(xí)資料
- 建筑施工承插型盤扣式鋼管腳手架技術(shù)標(biāo)準(zhǔn)
- 相反國課件-大班
- 2023-2024學(xué)年新疆烏魯木齊130中學(xué)九年級(上)期末物理試卷
- 2023-2024學(xué)年江蘇省徐州市九年級(上)期末物理試卷
- 湖北省石首楚源“源網(wǎng)荷儲”一體化項(xiàng)目可研報告
- 小學(xué)英語名詞單數(shù)變復(fù)數(shù)的語法規(guī)則及練習(xí)題含答案
- 基于自然語言處理的電子病歷解讀
- 四川省綿陽市高中2025屆高三二診模擬考試物理試卷含解析
評論
0/150
提交評論