探索性因子分析與驗(yàn)證性因子分析_第1頁
探索性因子分析與驗(yàn)證性因子分析_第2頁
探索性因子分析與驗(yàn)證性因子分析_第3頁
探索性因子分析與驗(yàn)證性因子分析_第4頁
探索性因子分析與驗(yàn)證性因子分析_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、探索性因子分析與驗(yàn)證性因子分析比較研究湖北 武漢 楊 丹摘要:探索性因子分析與驗(yàn)證性因子分析是因子分析的兩種不同形式。它們都是以普通因子模型為基礎(chǔ), 但它們之間也存在著較大差異。本文通過對(duì)它們進(jìn)行比較分析, 找出其異同,并對(duì)實(shí)證分析提供一定的指導(dǎo)依據(jù)。關(guān)鍵詞:探索性因子分析、驗(yàn)證性因子分析、結(jié)構(gòu)方程模型現(xiàn)實(shí)生活中的事物是錯(cuò)綜復(fù)雜的,在現(xiàn)實(shí)的數(shù)據(jù)中,我們經(jīng)常遇到的是多元的情況,而不僅僅是單一的自變量和單一的因變量。因此要用到多元的分析方法,而因子分析就是其中一種非常重要的處理降維的方法。它是將具有錯(cuò)綜復(fù)雜關(guān)系的變量(或樣品)綜合為少數(shù)幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,同時(shí)根據(jù)不同因子

2、還可以對(duì)變量進(jìn)行分類。它實(shí)際上就是一種用來檢驗(yàn)潛在結(jié)構(gòu)是怎樣影響觀測(cè)變量的方法。因子分析主要有兩種基本形式:探索性因子分析(Exploratory Factor Analysis)和驗(yàn)證性因子分析(Confirmatory Factor Analysis)。探索性因子分析(EFA )致力于找出事物內(nèi)在的本質(zhì)結(jié)構(gòu);而驗(yàn)證性因子分析(CFA )是用來檢驗(yàn)已知的特定結(jié)構(gòu)是否按照預(yù)期的方式產(chǎn)生作用。兩者之間是既有聯(lián)系也有區(qū)別的,下面我們就從不同的方面進(jìn)行分析比較。一、 兩種因子分析的相同之處兩種因子分析都是以普通因子模型為基礎(chǔ)的。因子分析的基本思想是通過變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能控制所有

3、變量的少數(shù)幾個(gè)隨機(jī)變量去描述多個(gè)變量之間的相關(guān)關(guān)系,但在這里,這少數(shù)幾個(gè)隨機(jī)變量是不可觀測(cè)的,通常稱為因子。然后根據(jù)相關(guān)性的大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量相關(guān)性較低。如圖所示,我們假定一個(gè)模型,它表明所有的觀測(cè)變量(變量1到變量5)是一部分受到潛在公共因子(因子1和因子2)影響,一部分受到潛在特殊因子(E1到E5)影響的。而每個(gè)因子和每個(gè)變量之間的相關(guān)程度是不一樣的,可能某給定因子對(duì)于某些變量的影響要比對(duì)其他變量的影響大一些。我們可以把圖的因子模型表示成線性函數(shù):1111122122112222331132234411422455115225X a F a F

4、X a F a F X a F a F X a F a F X a F a F =+=+=+=+=+其中12, F F 表示兩個(gè)因子,它對(duì)所有(1,2, ,5 i X i = 是公有的因子,通常稱為公共因子,它們的系數(shù)(1,2, ,5; 1,2 ij a i j = 表示第i 個(gè)變量在第j 個(gè)因子上的載荷。(1,2, ,5 i i = 表示第i 個(gè)變量不能被前兩個(gè)因子包括的部分,稱為特殊因子,通常假定2(0, i i N 。 圖不論是探索性因子分析還是驗(yàn)證性因子分析都是為了考察觀測(cè)變量之間的相關(guān)系數(shù)和方差協(xié)方差。高度相關(guān)的觀測(cè)變量(不管是正相關(guān)還是負(fù)相關(guān))很可能是受同樣的因子影響,而相對(duì)來說相

5、關(guān)程度不是很高的觀測(cè)變量很可能是受不同的因子影響的。而因子必須盡可能多地解釋變量方差,每個(gè)變量在每個(gè)因子上都有一個(gè)因子載荷,因子的意義需由看哪些變量在哪個(gè)因子上載荷最大來決定。通過尋找潛在公共因子,并合理解釋因子的意義,我們就能揭示錯(cuò)綜復(fù)雜的事物的內(nèi)部結(jié)構(gòu)。二、兩種因子分析的差異(一)、基本思想的差異因子分析的基本思想是尋找公共因子以達(dá)到降維的目的。在尋找公共因子的過程中,是否利用先驗(yàn)信息,產(chǎn)生了探索性因子分析和確定性因子分析的區(qū)別。探索性因子分析是在事先不知道影響因素的基礎(chǔ)上,完全依據(jù)資料數(shù)據(jù),利用統(tǒng)計(jì)軟件以一定的原則進(jìn)行因子分析,最后得出因子的過程。而確定性因子分析充分利用了先驗(yàn)信息,是在

6、已知因子的情況下檢驗(yàn)所搜集的數(shù)據(jù)資料是否按事先預(yù)定的結(jié)構(gòu)方式產(chǎn)生作用。因此探索性因子分析主要是為了找出影響觀測(cè)變量的因子個(gè)數(shù),以及各個(gè)因子和各個(gè)觀測(cè)變量之間的相關(guān)程度;而驗(yàn)證性因子分析的主要目的是決定事前定義因子的模型擬合實(shí)際數(shù)據(jù)的能力。進(jìn)行探索性因子分析之前,我們不必知道我們要用幾個(gè)因子,各個(gè)因子和觀測(cè)變量之間的聯(lián)系如何;而驗(yàn)證性因子分析要求事先假設(shè)因子結(jié)構(gòu),我們要做的是檢驗(yàn)它是否與觀測(cè)數(shù)據(jù)一致。探索性因子分析試圖揭示一套相對(duì)比較大的變量的內(nèi)在結(jié)構(gòu)。研究者的假定是每個(gè)指示變量都與某個(gè)因子匹配 。這是因子分析最通常的形式。沒有先驗(yàn)理論形式。沒有先驗(yàn)理論,只能通過因子載荷憑知覺推斷數(shù)據(jù)的因子結(jié)構(gòu)

7、。驗(yàn)證性因子分析試圖檢驗(yàn)觀測(cè)變量的因子個(gè)數(shù)和因子載荷是否與基于預(yù)先建立的理論的預(yù)期一致。指示變量是基于先驗(yàn)理論選出的,而因子分析是用來看它們是否如預(yù)期的一樣。研究者的先驗(yàn)假設(shè)是每個(gè)因子都與一個(gè)具體的指示變量子集對(duì)應(yīng)。驗(yàn)證性因子分析至少要求預(yù)先假設(shè)模型中因子的數(shù)目,但有時(shí)也預(yù)期哪些變量依賴哪個(gè)因子(Kim and Mueller, 1978b: 55。例如,研究者試圖檢驗(yàn)代表潛在變量的觀測(cè)變量是否真屬于一類。(二)、分析方法的差異由于兩種因子分析的出發(fā)點(diǎn)不同而產(chǎn)生了不同的分析方法,我們分別從兩種因子分析的分析步驟來比較它們的差異。探索性因子分析主要有以下7個(gè)步驟:、收集觀測(cè)變量。由于總體的復(fù)雜性

8、和統(tǒng)計(jì)基本原理的保證,為了達(dá)到研究目的,我們通常采用抽樣的方法收集數(shù)據(jù)。所以我們必須按照實(shí)際情況收集觀測(cè)變量,并對(duì)其進(jìn)行觀測(cè),獲得觀測(cè)值。、獲得協(xié)方差陣(或相似系數(shù)矩陣)。我們所有的分析都是從原始數(shù)據(jù)的協(xié)方差陣(或相似系數(shù)矩陣)出發(fā)的,這樣使我們分析得到的數(shù)據(jù)具有可比性,所以首先要根據(jù)資料數(shù)據(jù)獲得變量協(xié)方差陣(或相似系數(shù)矩陣)。、確定因子個(gè)數(shù)。有時(shí)候你有具體的假設(shè),它決定了因子的個(gè)數(shù);但更多的時(shí)候沒有這樣的假設(shè),你僅僅希望最后的到的模型能用盡可能少的因子解釋盡可能多的方差。如果你有k 個(gè)變量,你最多只能提取k 個(gè)因子。通過檢驗(yàn)數(shù)據(jù)來確定最優(yōu)因子個(gè)數(shù)的方法有很多。Kaiser 準(zhǔn)則要求因子個(gè)數(shù)與

9、相關(guān)系數(shù)矩陣的特征根個(gè)數(shù)相等;而Scree 檢驗(yàn)要求把相關(guān)系數(shù)矩陣的的特征根按從小到大的順序排列,繪制成圖,然后來確定因子的個(gè)數(shù)。究竟采用哪種方法來確定因子個(gè)數(shù),具體操作時(shí)可以視情況而定。、提取因子。因子的提取方法也有多種,主要有主成分方法、不加權(quán)最小平方法、極大似然法等,我們可以根據(jù)需要選擇合適的因子提取方法。其中主成分方法一種比較常用的提取因子的方法,它是用變量的線性組合中,能產(chǎn)生最大樣品方差的那些組合(稱主成分)作為公共因子來進(jìn)行分析的方法。、因子旋轉(zhuǎn)。由于因子載荷陣的不唯一性,可以對(duì)因子進(jìn)行旋轉(zhuǎn),而正是由于這一特征,使得因子結(jié)構(gòu)可以朝我們可以合理解釋的方向趨近。我們用一個(gè)正交陣右乘已經(jīng)

10、得到的因子載荷陣(由線性代數(shù)可知,一次正交變化對(duì)應(yīng)坐標(biāo)系的一次旋轉(zhuǎn)),使旋轉(zhuǎn)后的因子載荷陣結(jié)構(gòu)簡化。旋轉(zhuǎn)的方法也有多種,如正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)等,最常用的是方差最大化正交旋轉(zhuǎn)。、解釋因子結(jié)構(gòu)。我們最后得到的簡化的因子結(jié)構(gòu)是使每個(gè)變量僅在一個(gè)公共因子上有較大載荷,而在其余公共因子上的載荷比較小,至多是中等大小。這樣我們就能知道我們所研究的這些變量到底是由哪些潛在因素(也就是公共因子)影響的,哪些因素是起主要作用的,而哪些因素的作用較小,甚至可以不用考慮。、因子得分。因子分析的數(shù)學(xué)模型是將變量表示為公共因子的線性組合,由于公共因子能反映原始變量的相關(guān)關(guān)系,用公共因子代表原始變量時(shí),有時(shí)更利于描述研究

11、對(duì)象的特征,因而往往需要反過來將公共因子表示為變量的線性組合,即因子得分。而驗(yàn)證性因子分析主要有以下6個(gè)步驟:、定義因子模型。包括選擇因子個(gè)數(shù)和定義因子載荷。因子載荷可以事先定為0或者其它自由變化的常數(shù)。或者在一定的約束條件下變化的數(shù)(比如與另一載荷相等)。這是和探索性因子分析在分析方法上的一個(gè)重要差異,我們可以用一個(gè)直觀的比喻,也就是說探索性因子分析是在一張白紙上作圖,而驗(yàn)證性因子分析是在一張有框架的圖上完善和修改。、收集觀測(cè)值。定義了因子模型以后,我們就可以根據(jù)研究目的收集觀測(cè)值了。這一點(diǎn)與探索性因子分析有一定的相似之處。、獲得相關(guān)系數(shù)矩陣。與探索性因子分析一樣,我們的分析都是在原始數(shù)據(jù)的

12、相關(guān)系數(shù)矩陣基礎(chǔ)上進(jìn)行的,所以首先就要得到相關(guān)系數(shù)矩陣。實(shí)際上方差協(xié)差陣、相似系數(shù)矩陣和相關(guān)陣之間是可以相互轉(zhuǎn)化的。、根據(jù)數(shù)據(jù)擬合模型。我們需要選擇一個(gè)方法來估計(jì)自由變化的因子載荷。在多元正態(tài)的條件下,最常用的是極大似然估計(jì),也可采用漸進(jìn)分布自由估計(jì)。、評(píng)價(jià)模型是否恰當(dāng)。這一步可以說是驗(yàn)證性因子分析的核心。當(dāng)因子模型能夠擬合數(shù)據(jù)時(shí),因子載荷的選擇要使模型暗含的相關(guān)陣與實(shí)際觀測(cè)陣之間的差異最小。最好的參數(shù)被選擇以后,差異量能被用來作為衡量模型與數(shù)據(jù)一致的程度。最常用的模型適應(yīng)性檢驗(yàn)是卡方擬合優(yōu)度檢驗(yàn)。原假設(shè)是模型是適應(yīng)性模型,備擇假設(shè)是存在顯著差異。但是,這個(gè)檢驗(yàn)受樣本量大小影響,包含大樣本的檢

13、驗(yàn)往往會(huì)導(dǎo)致拒絕原假設(shè),盡管因子模型是合適的。其他的統(tǒng)計(jì)方法,比如用Tucker-Lewis 指數(shù),比較建議模型和“原模型”的擬合度。這些方法受樣本量大小影響不大。、與其他模型比較。為了得到最優(yōu)模型,我們需要完成這一步。如果你想比較兩個(gè)模型,其中一個(gè)是另一個(gè)的縮略形式,你就能從卡方統(tǒng)計(jì)量的值檢查出他們的差別,大約服從卡方分布。幾乎所有獨(dú)立因子載荷的檢驗(yàn)?zāi)苡脕碜鳛槿蜃幽P秃秃喴蜃拥哪P椭g的比較。為以防你不是在檢查全模型和簡模型,你可以比較均方根誤差的近似值 (RMSEA,它是模型中每個(gè)自由度差異的一個(gè)估計(jì)值。三、兩種因子分析方法應(yīng)結(jié)合使用驗(yàn)證性因子分析與結(jié)構(gòu)方程模型(Structure Eq

14、uation Modeling)有著極強(qiáng)的聯(lián)系,SEM 是統(tǒng)計(jì)學(xué)領(lǐng)域中相對(duì)不太標(biāo)準(zhǔn)的領(lǐng)域, 其具體原理和應(yīng)用方法本人在另一篇文章中有詳細(xì)介紹,這里不在贅述。驗(yàn)證性因子分析比探索性因子分析處理要困難多了。驗(yàn)證性因子分析比探索性因子分析要求更大容量的樣本。主要是因?yàn)轵?yàn)證性因子分析要處理推論統(tǒng)計(jì)量。精確的樣本量要隨著觀測(cè)值和模型的因子數(shù)變化而變化,但一個(gè)標(biāo)準(zhǔn)模型至少需要200個(gè)個(gè)體。和探索性因子分析一樣,模型中每個(gè)因子至少需要3個(gè)變量;與探索性因子分析不同的是,你必須選擇與每個(gè)因子在很大程度上匹配的變量,而不是可能是潛在變量的“隨機(jī)樣本”。一般來說,如果你沒有堅(jiān)實(shí)的理論基礎(chǔ)支撐,有關(guān)觀測(cè)變量內(nèi)部結(jié)構(gòu),一般用探索性因子分析。先用探索性因子分析產(chǎn)生一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論