版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、SPSS因子分析法 - 例子解釋因子分析的基本概念和步驟一、因子分析的意義在研究實際問題時往往希望盡可能多地收集相關(guān)變量, 以期望能對問題有比較全面、完整的把握和認(rèn)識。例如,對高等學(xué)??蒲袪顩r的評價研究,可能會搜集諸如投入科研活動的人數(shù)、立項課題數(shù)、項目經(jīng)費、經(jīng)費支出、結(jié)項課題數(shù)、發(fā)表論文數(shù)、發(fā)表專著數(shù)、獲得獎勵數(shù)等多項指標(biāo);再例如,學(xué)生綜合評價研究中,可能會搜集諸如基礎(chǔ)課成績、專業(yè)基礎(chǔ)課成績、專業(yè)課成績、體育等各類課程的成績以及累計獲得各項獎學(xué)金的次數(shù)等。雖然收集這些數(shù)據(jù)需要投入許多精力, 雖然它們能夠較為全面精確地描述事物,但在實際數(shù)據(jù)建模時,這些變量未必能真正發(fā)揮預(yù)期的作用, “投入”和
2、“產(chǎn)出”并非呈合理的正比,反而會給統(tǒng)計分析帶來很多問題,可以表現(xiàn)在:計算量的問題由于收集的變量較多,如果這些變量都參與數(shù)據(jù)建模,無疑會增加分析過程中的計算工作量。雖然,現(xiàn)在的計算技術(shù)已得到了迅猛發(fā)展,但高維變量和海量數(shù)據(jù)仍是不容忽視的。變量間的相關(guān)性問題收集到的諸多變量之間通常都會存在或多或少的相關(guān)性。例如,高??蒲袪顩r評價中的立項課題數(shù)與項目經(jīng)費、經(jīng)費支出等之間會存在較高的相關(guān)性;學(xué)生綜合評價研究中的專業(yè)基礎(chǔ)課成績與專業(yè)課成績、獲獎學(xué)金次數(shù)等之間也會存在較高的相關(guān)性。而變量之間信息的高度重疊和高度相關(guān)會給統(tǒng)計方法的應(yīng)用帶來許多障礙。例如,多元線性回歸分析中,如果眾多解釋變量之間存在較強(qiáng)的相關(guān)
3、性,即存在高度的多重共線性,那么會給回歸方程的參數(shù)估計帶來許多麻煩,致使回歸方程參數(shù)不準(zhǔn)確甚至模型不可用等。類似的問題還有很多。為了解決這些問題,最簡單和最直接的解決方案是削減變量的個數(shù),但這必然又會導(dǎo)致信息丟失和信息不完整等問題的產(chǎn)生。為此,人們希望探索一種更為有效的解決方法,它既能大大減少參與數(shù)據(jù)建模的變量個數(shù),同時也不會造成信息的大量丟失。因子分析正式這樣一種能夠 有效降低變量維數(shù) ,并已得到廣泛應(yīng)用的分析方法。因子分析的概念起源于 20 世紀(jì)初 Karl Pearson 和 Charles Spearmen等人關(guān)于智力測驗的統(tǒng)計分析。目前,因子分析已成功應(yīng)用于心理學(xué)、醫(yī)學(xué)、氣象、地址、
4、經(jīng)濟(jì)學(xué)等領(lǐng)域,并因此促進(jìn)了理論的不斷豐富和完善。因子分析以最少的信息丟失為前提,將眾多的原有變量綜合成較少幾個綜合指標(biāo),名為因子。通常,因子有以下幾個特點:因子個數(shù)遠(yuǎn)遠(yuǎn)少于原有變量的個數(shù)原有變量綜合成少數(shù)幾個因子之后,因子將可以替代原有變量參與數(shù)據(jù)建模,這將大大減少分析過程中的計算工作量。因子能夠反映原有變量的絕大部分信息因子并不是原有變量的簡單取舍,而是 原有變量重組后的結(jié)果 ,因此不會造成原有變量信息的大量丟失,并能夠代表原有變量的絕大部分信息。因子之間的線性關(guān)系并不顯著由原有變量重組出來的因子之間的線性關(guān)系較弱,因子參與數(shù)據(jù)建模能夠有效地解決變量多重共線性等給分析應(yīng)用帶來的諸多問題。因子
5、具有命名解釋性通常,因子分析產(chǎn)生的因子能夠通過各種方式最終獲得命名解釋性。因子的命名解 性有助于 因子分析 果的解 價, 因子的 一步 用有重要意 。例如, 高校科研情況的因子分析中,如果能 得到兩個因子,其中一個因子是 科研人力投入、 投入、立 目數(shù)等 量的 合,而另一個是 目數(shù)、 表 文數(shù)、 成果數(shù)等 量的 合,那么, 因子分析就是 理想的。因 兩個因子均有命名可解 性,其中一個反映了科研投入方面的情況,可命名 科研投入因子,另一個反映了科研 出方面的情況,可命名 科研 出因子。 之,因子分析是研究如何以最少的信息 失將眾多原有 量 成少數(shù)幾個因子,如何使因子具有一定的命名解 性的多元 分
6、析方法。二、因子分析的基本概念1、因子分析模型因子分析模型中,假定每個原始 量由兩部分 成:共同因子(common factors)和唯一因子( unique factors)。共同因子是各個原始 量所共有的因子,解 量之 的相關(guān)關(guān)系。唯一因子 名思 是每個原始 量所特有的因子,表示 量不能被共同因子解 的部分。原始 量與因子分析 抽出的共同因子的相關(guān)關(guān)系用因子 荷(factorloadings)表示。因子分析最常用的理 模式如下:Z ja j1 F1a j 2 F2a j 3 F3a jm FmU j ( j=1,2,3 ,n,n 原始 量 數(shù))可以用矩 的形式表示 ZAFU 。其中F 稱
7、因子,由于它 出 在每個原始 量的 性表達(dá)式中 (原始 量可以用 X j 表示, 里模型中 上是以 F 性表示各個原始 量的 準(zhǔn)化分?jǐn)?shù) Z j ),因此又稱 公共因子。因子可理解 高 空 中互相垂直的 m 個坐 , A 稱 因子 荷矩 , a ji ( j 1,2,3.n, i 1,2,3.m) 稱 因子 荷,是第 j 個原始 量在第 i 個因子上的 荷。如果把 量 Z j 看成 m 因子空 中的一個向量,則 a ji 表示 Z j 在坐 Fi 上的投影,相當(dāng)于多元 性回 模型中的 準(zhǔn)化回 系數(shù);U稱 特殊因子,表示了原有 量不能被因子解 的部分,其均 0,相當(dāng)于多元 性回 模型中的殘差。其中
8、,(1) Z j 第 j 個 量的 準(zhǔn)化分?jǐn)?shù);(2) Fi ( i=1,2,m) 共同因素;(3)m 所有 量共同因素的數(shù)目;(4) U j 量 Z j 的唯一因素;(5) a ji 因素 荷量。2、因子分析數(shù)學(xué)模型中的幾個相關(guān)概念因子 荷(因素 荷量factor loadings)所謂的因子載荷 就是因素結(jié)構(gòu)中,原始變量與因素分析時抽取出共同因素的相關(guān)??梢宰C明,在因子不相關(guān)的前提下,因子載荷a ji 是變量 Z j 和因子 Fi 的相關(guān)系數(shù), 反映了變量Z j與因子Fi的相關(guān)程度 。因子載荷 a ji 值小于等于 1,絕對值越接近 1,表明因子Fi 與變量 Z j 的相關(guān)性越強(qiáng)。同時,因子
9、載荷aji 也反映了因子 Fi 對解釋變量 Z j 的重要作用和程度。因子載荷作為因子分析模型中的重要統(tǒng)計量,表明了原始變量和共同因子之間的相關(guān)關(guān)系。因素分析的理想情況,在于個別因素負(fù)荷量a ji 不是很大就是很小,這樣每個變量才能與較少的共同因素產(chǎn)生密切關(guān)聯(lián),如果想要以最少的共同因素數(shù)來解釋變量間的關(guān)系程度,則 U j 彼此間或與共同因素間就不能有關(guān)聯(lián)存在。一般說來,負(fù)荷量為0.3 或更大被認(rèn)為有意義。所以, 當(dāng)要判斷一個因子的意義時, 需要查看哪些變量的負(fù)荷達(dá)到了 0.3 或 0.3 以上。變量共同度(共同性, Communality)變量共同度也就是變量方差,就是指每個原始變量在每個共同
10、因子的負(fù)荷量的平方和,也就是指原始變量方差中由共同因子所決定的比率。變量的方差由共同因子和唯一因子組成。 共同性表明了原始變量方差中能被共同因子解釋的部分,共同性越大,變量能被因子說明的程度越高,即因子可解釋該變量的方差越多。 共同性的意義在于說明如果用共同因子替代原始變量后,原始變量的信息被保留的程度。因子分析通過簡化相關(guān)矩陣,提取可解釋相關(guān)的少數(shù)因子。一個因子解釋的是相關(guān)矩陣中的方差,而解釋方差的大小稱為因子的特征值。一個因子的特征值等于所有變量在該因子上的負(fù)荷值的平方m2 ,該式表明 變量 Z j 的共同度是因總和。變量 Z j 的共同度 h2 的數(shù)學(xué)定義為: h2a jii 1子載荷矩
11、陣 A 中第 j 行元素的平方和 。由于變量 Z j 的方差可以表示成 h2u 21,因此變量 Z j 的方差可由兩個部分解釋:第一部分為共同度h 2 ,是全部因子對變量Z j 方差解釋說明的比例,體現(xiàn)了因子全體對變量Z j 的解釋貢獻(xiàn)程度。變量共同度h2 越接近1,說明因子全體解釋說明了變量Z j 的較大部分方差,如果用因子全體刻畫變量Z j,則變量Z j的信息丟失較少; 第二部分為特殊因子U 的平方,反應(yīng)了變量 Z j 方差中不能由因子全體解釋說明的比例,u 2 越小則說明變量Z j 的信息丟失越少。總之,變量d 共同度刻畫了因子全體對變量Z j 信息解釋的程度,是評價變量Z j 信息丟失
12、程度的重要指標(biāo)。 如果大多數(shù)原有變量的變量共同度均較高(如高于 0.8),則說明提取的因子能夠反映原有變量的大部分信息 (80以上)信息,僅有較少的信息丟失,因子分析的效果較好。因子,變量共同度是衡量因子分析效果的重要依據(jù)。因子的方差貢獻(xiàn)(特征值eigenvalue)n22因子的方差貢獻(xiàn)(特征值)的數(shù)學(xué)定義為:Sia ji ,該式表明,因子 Fi 的方差j1貢獻(xiàn)是因子載荷矩陣 A 中第 i 列元素的平方和。 因子 Fi的方差貢獻(xiàn)反映了因子 Fi 對原有變量總方差的解釋能力。 該值越高,說明相應(yīng)因子的重要性越高。因此,因子的方差貢獻(xiàn)和方差貢獻(xiàn)率是衡量因子重要性的關(guān)鍵指標(biāo)。為了便于說明,以三個變量
13、抽取兩個共同因素為例,三個變量的線性組合分別為:Z1a11 F1a12 F2U 1Z2a21 F1a22 F2U 2Z3a31F1a32 F2U 3轉(zhuǎn)換成因素矩陣如下:F1F2共同唯變一因素(共同(共同性量(因素一)因素二)( h2 )d 2 )X 1a11a12a112a1221h12X 2a21a22a2a21h221222a312a21h2X 3a31a32323特a11 2a21 2a312a112a212a312征值解a112a212a312a112a212a312釋量33所謂共同性,就是每個變量在每個共同因素之負(fù)荷量的平方總和(一橫列中所有因素負(fù)荷量的平方和),也就是個別變量可以被
14、共同因素解釋的變異量百分比,這個值是個別變量與共同因素間多元相關(guān)的平方。從共同性的大小可以判斷這個原始變量與共同因素之間關(guān)系程度。 而各變量的唯一因素大小就是1 減掉該變量共同性的值。(在主成分分析中,有多少個原始變量便有多少個“ component”成分,所以共同性會等于 1,沒有唯一因素)。至于特征值是每個變量在某一共同因素之因素負(fù)荷量的平方總和(一直行所有因素負(fù)荷量的平方和)。在因素分析之共同因素抽取中,特征值大的共同因素會最先被抽取,其次是次大者,最后抽取的共同因素之特征值最小,通常會接近 0(在主成分分析中,有幾個題項, 便有幾個成分,因而特征值的總和剛好等于變量的總數(shù)) 。將每個共
15、同因素的特征值除以總題數(shù),為此共同因素可以解釋的變異量,因素分析的目的,即在因素結(jié)構(gòu)的簡單化,希望以最少的共同因素,能對總變異量作最大的解釋,因而抽取的因素越少越好,但抽取因素之累積解釋的變異量則越大越好。3、社會科學(xué)中因素分析通常應(yīng)用在三個層面:(1)顯示變量間因素分析的組型(pattern)(2)偵測變量間之群組( clusters),每個群組所包括的變量彼此相關(guān)很高,同構(gòu)型較大,亦即將關(guān)系密切的個別變量合并為一個子群。(3)減少大量變量數(shù)目,使之稱為一組涵括變量較少的統(tǒng)計自變量(稱為因素) ,每個因素與原始變量間有某種線性關(guān)系存在,而以少數(shù)因素層面來代表多數(shù)、個別、獨立的變量。因素分析具
16、有簡化數(shù)據(jù)變量的功能,以較少層面來表示原來的數(shù)據(jù)結(jié)構(gòu),它根據(jù)變量間彼此的相關(guān),找出變量間潛在的關(guān)系結(jié)構(gòu),變量間簡單的結(jié)構(gòu)關(guān)系稱為“成份”(components)或“因素”(factors) .三、因素分析的主要方式圍繞濃縮原有變量提取因子的核心目標(biāo),因子分析主要涉及以下五大基本步驟:1、因子分析的前提條件由于因子分析的主要任務(wù)之一是對原有變量進(jìn)行濃縮,即將原有變量中的信息重疊部分提取和綜合成因子,進(jìn)而最終實現(xiàn)減少變量個數(shù)的目的。因此它要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則,如果原有變量相互獨立,相關(guān)程度很低,不存在信息重疊,它們不可能有共同因子,那么也就無法將其綜合和濃縮,也就無需進(jìn)行因子分析。本步驟正是希望通過各種方法分析原有變量是否存在相關(guān)關(guān)系,是否適合進(jìn)行因子分析。SPSS提供了四個統(tǒng)計量可幫助判斷觀測數(shù)據(jù)是否適合作因子分析:(1)計算相關(guān)系數(shù)矩陣Correlation Matrix在進(jìn)行提取因子等分析步驟之前,應(yīng)對相關(guān)矩陣進(jìn)行檢驗,如果相關(guān)矩陣中的大部分相關(guān)系數(shù)小于 0.3,則不適合作因子分析; 當(dāng)原始變量個數(shù)較多時,所輸出的相關(guān)系數(shù)矩陣特別大,觀察起來不是很方便,所以一般不會采用此方法或即使采用了此方法,也不方便在結(jié)果匯報中給出原始分析報表。(2)計算反映象相關(guān)矩陣Anti-image correlat
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 操作培訓(xùn)課程設(shè)計模板
- 2024年度擔(dān)保合同擔(dān)保機(jī)構(gòu)資質(zhì)認(rèn)定與監(jiān)管3篇
- 2024中美綠色環(huán)保技術(shù)引進(jìn)范文合同3篇
- 2024年水泥行業(yè)環(huán)保技術(shù)創(chuàng)新與推廣應(yīng)用合同模板3篇
- 機(jī)械原理課程設(shè)計代寫
- 2024年政府機(jī)構(gòu)房產(chǎn)轉(zhuǎn)讓協(xié)議書模板3篇
- 2024年標(biāo)準(zhǔn)型家用空調(diào)采購合同版
- 2024中介公司員工勞動合同(設(shè)立特殊崗位津貼)3篇
- 特色軍事化課程設(shè)計
- 2024年大理石大板石材質(zhì)量檢測與驗收合同3篇
- 旅游學(xué)概論最新復(fù)習(xí)題庫與答案
- 土木工程建筑中混凝土裂縫的施工處理技術(shù)畢業(yè)論文
- 水電站調(diào)速器系統(tǒng)最權(quán)威講義課件
- 膠合板生產(chǎn)工藝
- TROXLER3440核子密度儀
- 課程設(shè)計--高位自卸汽車的設(shè)計
- 初中數(shù)學(xué)八年級上《整式的乘法及因式分解》知識點及經(jīng)典題型
- 天罡儀表CR40系列數(shù)據(jù)集中器用戶手冊
- 威尼斯狂歡節(jié)長笛鋼琴伴奏譜PierreAgricolaGeninC
- 古傳五禽戲內(nèi)功法詳解(圖)
- 普外科電子病歷模板——腹部閉合性損傷
評論
0/150
提交評論