主成份分析因子分析_第1頁(yè)
主成份分析因子分析_第2頁(yè)
主成份分析因子分析_第3頁(yè)
主成份分析因子分析_第4頁(yè)
主成份分析因子分析_第5頁(yè)
已閱讀5頁(yè),還剩100頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于主成份分析因子分析zf第一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf2因子分析的重點(diǎn)1、什么是因子分析?2、理解因子分析的基本思想3、因子分析的數(shù)學(xué)模型以及模型中公共因子、因子載荷變量共同度的統(tǒng)計(jì)意義4、因子旋轉(zhuǎn)的意義 5、結(jié)合SPSS軟件進(jìn)行案例分析第二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf36.1 因子分析的基本理論1、什么是因子分析? 因子分析是主成分分析的推廣,也是利用降維的思想,由研究原始變量相關(guān)矩陣或協(xié)方差矩陣的內(nèi)部依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多元統(tǒng)計(jì)分析方法。2、因子分析的基本思想: 把每個(gè)研究變量分解為幾個(gè)影響因

2、素變量,將每個(gè)原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子組成的,另一部分是每個(gè)變量獨(dú)自具有的因素,即特殊因子。第三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf43、因子分析的目的:因子分析的目的之一,簡(jiǎn)化變量維數(shù)。即要使因素結(jié)構(gòu)簡(jiǎn)單化,希望以最少的共同因素(公共因子),能對(duì)總變異量作最大的解釋,因而抽取得因子愈少愈好,但抽取因子的累積解釋的變異量愈大愈好。在因子分析的公共因子抽取中,應(yīng)最先抽取特征值最大的公共因子,其次是次大者,最后抽取公共因子的特征值最小 通常會(huì)接近0。第四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf5例:在企業(yè)形象或品牌形象的研究中,消費(fèi)

3、者可以通過(guò)一個(gè)有24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場(chǎng)的24個(gè)方面的優(yōu)劣。但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過(guò)24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在的因子,對(duì)商店進(jìn)行綜合評(píng)價(jià)。而這三個(gè)公共因子可以表示為:稱 是不可觀測(cè)的潛在因子,稱為公共因子。24個(gè)變量共享這三個(gè)因子,但是每個(gè)變量又有自己的個(gè)性,不被包含的部分 ,稱為特殊因子。第五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf64、主成分分析分析與因子分析的聯(lián)系和差異: 聯(lián)系:(1)因子分析是主成分分析的推廣,是主成分分析的逆問(wèn)題。(2)二者都是以降維為目的,都是從

4、協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā)。 區(qū)別:(1)主成分分析模型是原始變量的線性組合,是將原始變量加以綜合、歸納,僅僅是變量變換;而因子分析是將原始變量加以分解,描述原始變量協(xié)方差矩陣結(jié)構(gòu)的模型;只有當(dāng)提取的公因子個(gè)數(shù)等于原始變量個(gè)數(shù)時(shí),因子分析才對(duì)應(yīng)變量變換。(2)主成分分析,中每個(gè)主成分對(duì)應(yīng)的系數(shù)是唯一確定的;因子分析中每個(gè)因子的相應(yīng)系數(shù)即因子載荷不是唯一的。(3)因子分析中因子載荷的不唯一性有利于對(duì)公因子進(jìn)行有效解釋;而主成分分析對(duì)提取的主成分的解釋能力有限。 第六張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf75、因子分析模型: 設(shè) 個(gè)變量,如果表示為第七張,PPT共一百零五頁(yè),創(chuàng)作于20

5、22年6月zf8(1)(2) 稱為 公共因子,是不可觀測(cè)的變量,他們的系數(shù)稱為因子載荷。 是特殊因子,是不能被前m個(gè)公共因子包含的部分。其中:相互獨(dú)立即不相關(guān);即 互不相關(guān),方差為1。第八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf9(3)即互不相關(guān),方差不一定相等, 。滿足以上條件的,稱為正交因子模型如果()不成立,即 各公共因子之間不獨(dú)立,則因子分析模型為斜交因子模型第九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf10公因子F1公因子F2共同度hi特殊因子ix1=代數(shù)10.8960.3410.9190.081x2=代數(shù)20.8020.4960.8890.111x3=幾何0.5160

6、.8550.9970.003x4=三角0.8410.4440.9040.096x5=解析幾何0.8330.4340.8820.118特征值 G3.1131.4794.9590.409方差貢獻(xiàn)率(變異量)62.26%29.58%91.85%因子分析案例F1 體現(xiàn)邏輯思維和運(yùn)算能力,F(xiàn)2 體現(xiàn)空間思維和推理能力第十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf116、因子分析模型中的幾個(gè)重要統(tǒng)計(jì)量的意義:(1)因子負(fù)荷量(或稱因子載荷)-是指因子結(jié)構(gòu)中原始變量與因子分析時(shí)抽取出的公共因子的相關(guān)程度。第十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf12 在各公共因子不相關(guān)的前提下, (載荷矩

7、陣中第i行,第j列的元素)是隨機(jī)變量xi*與公共因子Fj的相關(guān)系數(shù),表示xi*依賴于Fj的程度。反映了第i個(gè)原始變量在第j個(gè)公共因子上的相對(duì)重要性。因此 絕對(duì)值越大,則公共因子Fj與原有變量xi的關(guān)系越強(qiáng)。第十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf13(2)共同度-又稱共性方差或公因子方差(community或common variance)就是變量與每個(gè)公共因子之負(fù)荷量的平方總和(一行中所有因素負(fù)荷量的平方和)。變量 的共同度是因子載荷矩陣的第i行的元素的平方和。記為 從共同性的大小可以判斷這個(gè)原始實(shí)測(cè)變量與公共因子間之關(guān)系程度。如因子分析案例中 共同度h12=(0.896)平方

8、+(0.341)平方=0.919特殊因子方差(剩余方差)-各變量的特殊因素影響大小就是1減掉該變量共同度的值。如 =1- 0.919 = 0.081第十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf14統(tǒng)計(jì)意義:兩邊求方差 所有的公共因子和特殊因子對(duì)變量 的貢獻(xiàn)為1。 hi2反映了全部公共因子對(duì)變量Xi*的影響,是全部公共因子對(duì)變量方差所做出的貢獻(xiàn),或者說(shuō)Xi*對(duì)公共因子的共同依賴程度,稱為公共因子對(duì)變量Xi*的方差貢獻(xiàn)。 Hi2接近于1,表明該變量的原始信息幾乎都被選取的公共因子說(shuō)明了。 特殊因子的方差,反映了原有變量方差中無(wú)法被公共因子描述的比例。第十四張,PPT共一百零五頁(yè),創(chuàng)作于2

9、022年6月zf15(3)特征值-是第j個(gè)公共因子Fj對(duì)于X*的每一分量Xi*所提供的方差的總和。又稱第j個(gè)公共因子的方差貢獻(xiàn)。即每個(gè)變量與某一共同因素之因素負(fù)荷量的平方總和(因子載荷矩陣中某一公共因子列所有因子負(fù)荷量的平方和)。 如因子分析案例中 F1的特征值 G=(0.896)平方+(0.802)平方+(0.516)平方+(0.841)平方+(0.833)平方=3.113(4)方差貢獻(xiàn)率-指公共因子對(duì)實(shí)測(cè)變量的貢獻(xiàn),又稱變異量 方差貢獻(xiàn)率=特征值G/實(shí)測(cè)變量數(shù)p, 是衡量公共因子相對(duì)重要性的指標(biāo),Gi越大,表明公共因子Fj對(duì)X*的貢獻(xiàn)越大,該因子的重要程度越高 如因子分析案例中 F1的貢獻(xiàn)

10、率為3.113/5=62.26%第十五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf166.2 因子的基本內(nèi)容1、因子分析的基本步驟:(1)因子分析的前提條件鑒定 考察原始變量之間是否存在較強(qiáng)的相關(guān)關(guān)系,是否適合進(jìn)行因子分析。因?yàn)椋?因子分析的主要任務(wù)之一就是對(duì)原有變量中信息重疊的部分提取和綜合成因子,最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。所以要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。否則,如果原有變量相互獨(dú)立,不存在信息重疊,也就無(wú)需進(jìn)行綜合和因子分析。(2)因子提取 研究如何在樣本數(shù)據(jù)的基礎(chǔ)上提取綜合因子。第十六張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf17(3)因子旋轉(zhuǎn) 通過(guò)正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)

11、使提取出的因子具有可解釋性。(4)計(jì)算因子得分 通過(guò)各種方法求解各樣本在各因子上的得分,為進(jìn)一步分析奠定基礎(chǔ)。第十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf182、因子分析前提條件相關(guān)性分析:分析方法主要有:(1)計(jì)算相關(guān)系數(shù)矩陣(correlation coefficients matrix) 如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3,即各變量間大多為弱相關(guān),原則上這些變量不適合進(jìn)行因子分析。(2)計(jì)算反映象相關(guān)矩陣(Anti-image correlation matrix)第十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf19 反映象相關(guān)矩陣,如果其主對(duì)角線外的元素大

12、多絕對(duì)值較小,對(duì)角線上的元素值較接近1,則說(shuō)明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。 其中主對(duì)角線上的元素為某變量的MSA(Measure of Sample Adequacy): 是變量 和變量 ( )間的簡(jiǎn)單相關(guān)系數(shù),是變量 和變量 ( )在控制了其他變量影響下的偏相關(guān)系數(shù),即凈相關(guān)系數(shù)。 取值在0和1之間,越接近1,意味著變量 與其他變量間的相關(guān)性越強(qiáng),越接近0則相關(guān)性越弱。第十九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf20(3)巴特利特球度檢驗(yàn)(Bartlett test of sphericity) 該檢驗(yàn)以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),其零假設(shè)H0是:相關(guān)系數(shù)矩陣為單位

13、矩陣,即相關(guān)系數(shù)矩陣主對(duì)角元素均為1,非主對(duì)角元素均為0。(即原始變量之間無(wú)相關(guān)關(guān)系)。 依據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算可得其近似服從卡方分布。如果統(tǒng)計(jì)量卡方值較大且對(duì)應(yīng)的sig值小于給定的顯著性水平a時(shí),零假設(shè)不成立。即說(shuō)明相關(guān)系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關(guān)關(guān)系,適合做因子分析。第二十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf21(4)KMO(Kaiser-Meyer-Olkin)檢驗(yàn) KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為: KMO與MSA區(qū)別是它將相關(guān)系數(shù)矩陣中的所有元素都加入到了平方和計(jì)算中。KMO值越接近1,意味著變量間的相

14、關(guān)性越強(qiáng),原有變量適合做因子分析;越接近0,意味變量間的相關(guān)性越弱,越不適合作因子分析。 Kaiser給出的KMO度量標(biāo)準(zhǔn):0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。第二十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf223、因子提取和因子載荷矩陣的求解:因子載荷矩陣求解的方法: (1)基于主成分模型的主成分分析法 (2)基于因子分析模型的主軸因子法 (3)極大似然法 (4)最小二乘法 (5)a因子提取法 (6)映象分析法第二十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf23(1)基于主成分模型的主成分分析法Principal c

15、omponents 設(shè)隨機(jī)向量 的均值為,協(xié)方差為, 為的特征根, 為對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量,則第二十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf24上式給出的表達(dá)式是精確的,然而,它實(shí)際上是毫無(wú)價(jià)值的,因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋,故略去后面的p-m項(xiàng)的貢獻(xiàn),有:第二十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf25上式有一個(gè)假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。第二十五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf26 例: 假定某地固定資產(chǎn)投資率 ,通貨膨脹率 ,失業(yè)率 ,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。第二十六張,

16、PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf27(1)求解特征根(2)求解特征向量:(3)因子載荷矩陣:第二十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf28(4)因子分析模型: 可取前兩個(gè)因子F1和F2為公共因子,第一公因子F1物價(jià)就業(yè)因子,對(duì)X的貢獻(xiàn)為1.55。第一公因子F2為投資因子,對(duì)X的貢獻(xiàn)為0.85。共同度分別為1,0.706,0.706。第二十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf29(2)基于因子分析模型的主軸因子法Principal axis factoring 是對(duì)主成分方法的修正,假定我們首先對(duì)變量進(jìn)行標(biāo)準(zhǔn)化變換。則 R=AA+D R*=AA=R-D稱R

17、*為約相關(guān)矩陣,R*對(duì)角線上的元素是 ,而不是1。第二十九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf30 直接求R*的前p個(gè)特征根和對(duì)應(yīng)的正交特征向量。得如下的矩陣:第三十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf31當(dāng)特殊因子 的方差已知:第三十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf32方差矩陣未知,估計(jì)的方法有如下幾種: 1)取 ,在這個(gè)情況下主因子解與主成分解等價(jià); 2)取 , 為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方,即xi對(duì)其余的p-1個(gè)xj的回歸方程的判定系數(shù),這是因?yàn)閤i 與公共因子的關(guān)系是通過(guò)其余的p-1個(gè)xj 的線性組合聯(lián)系起來(lái)的; 3)取 ,

18、這意味著取xi與其余的xj的簡(jiǎn)單相關(guān)系數(shù)的絕對(duì)值最大者;第三十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf33 4)取 ,其中要求該值為正數(shù)。 5)取 ,其中 是 的對(duì)角元素。第三十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf34 例:假定某地固定資產(chǎn)投資率 ,通貨膨脹率 ,失業(yè)率 ,相關(guān)系數(shù)矩陣為試用主因子分析法求因子分析模型。假定用代替初始的 。 。第三十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf35(1)求解特征根:(2)對(duì)應(yīng)的非0特征向量:(3)因子載荷矩陣表:第三十五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf36(4)因子分析模型:(5)新的共同度:第三十六

19、張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf374、因子旋轉(zhuǎn):為什么要旋轉(zhuǎn)因子? 建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使每個(gè)變量在盡可能少的因子上有比較高的載荷,讓某個(gè)變量在某個(gè)因子上的載荷趨于1,而在其他因子上的載荷趨于0。即:使載荷矩陣每列或行的元素平方值向0和1兩極分化。第三十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf38奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析 百米跑成績(jī) 跳遠(yuǎn)

20、成績(jī) 鉛球成績(jī) 跳高成績(jī) 400米跑成績(jī) 百米跨欄 鐵餅成績(jī) 撐桿跳遠(yuǎn)成績(jī) 標(biāo)槍成績(jī) 1500米跑成績(jī) 第三十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf39第三十九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf40因子載荷矩陣 因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對(duì)比,似乎是長(zhǎng)跑耐力和短跑速度的對(duì)比。于是考慮旋轉(zhuǎn)因子,得下表第四十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf41旋轉(zhuǎn)變幻后因子載荷矩陣第四十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf42 通過(guò)旋轉(zhuǎn),因子有

21、了較為明確的含義。 百米跑, 跳遠(yuǎn)和 400米跑,需要爆發(fā)力的項(xiàng)目在 有較大的載荷, 可以稱為短跑速度因子; 鉛球, 鐵餅和 標(biāo)槍在 上有較大的載荷,可以稱為爆發(fā)性臂力因子; 百米跨欄, 撐桿跳遠(yuǎn), 跳遠(yuǎn)和為 跳高在 上有較大的載荷, 爆發(fā)腿力因子; 長(zhǎng)跑耐力因子。第四十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf43 旋轉(zhuǎn)的方法有:(1)正交旋轉(zhuǎn);(2)斜交旋轉(zhuǎn)(1)正交旋轉(zhuǎn) 由初始載荷矩陣A左乘一正交矩陣得到;目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)后的新的公因子仍保持獨(dú)立性。主要有以下方法:varimax:方差最大旋轉(zhuǎn)。簡(jiǎn)化對(duì)因子的解釋quartmax:四次最

22、大正交旋轉(zhuǎn)。簡(jiǎn)化對(duì)變量的解釋equamax:等量正交旋轉(zhuǎn)第四十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf44A、方差最大法 方差最大法從簡(jiǎn)化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上有較高的載荷時(shí),對(duì)因子的解釋最簡(jiǎn)單。方差最大的直觀意義是希望通過(guò)因子旋轉(zhuǎn)后,使每個(gè)因子上的載荷盡量拉開(kāi)距離,一部分的載荷趨于1,另一部分趨于0。第四十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf45B、四次方最大旋轉(zhuǎn) 四次方最大旋轉(zhuǎn)是從簡(jiǎn)化載荷矩陣的行出發(fā),通過(guò)旋轉(zhuǎn)初始因子,使每個(gè)變量只在一個(gè)因子上有較高的載荷,而在其它的因子上盡可能低的載荷。如果

23、每個(gè)變量只在一個(gè)因子上有非零的載荷,這時(shí)的因子解釋是最簡(jiǎn)單的。 四次方最大法通過(guò)使因子載荷矩陣中每一行的因子載荷平方的方差達(dá)到最大。第四十五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf46C、等量最大法 等量最大法把四次方最大法和方差最大法結(jié)合起來(lái)求行和列因子載荷平方的方差的加權(quán)平均最大。第四十六張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf47(2)斜交旋轉(zhuǎn) 目的是新的載荷系數(shù)盡可能的接近于0或盡可能的遠(yuǎn)離0;只是在旋轉(zhuǎn)時(shí),放棄了因子之間彼此獨(dú)立的限制,旋轉(zhuǎn)后的新公因子更容易解釋。主要有以下的方法:direct oblimin:直接斜交旋轉(zhuǎn)。允許因子之間具有相關(guān)性;promax:斜交旋

24、轉(zhuǎn)方法。允許因子之間具有相關(guān)性;第四十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf485、因子得分因子得分的概念 前面我們主要解決了用公共因子的線性組合來(lái)表示一組觀測(cè)變量的有關(guān)問(wèn)題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來(lái)做回歸分析,對(duì)樣本進(jìn)行分類或評(píng)價(jià),這就需要我們對(duì)公共因子進(jìn)行測(cè)度,即給出公共因子的值。第四十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf49例:人均要素變量因子分析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1 :人口(萬(wàn)人) X2 :面積(萬(wàn)平方公里)X3 :GDP(億元) X4 :人均水資源(立方米/人)X5:

25、人均生物量(噸/人) X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有科學(xué)家、工程師數(shù)(人) Rotated Factor Pattern FACTOR1 FACTOR2 FACTOR3 X1 -0.21522 -0.27397 0.89092 X2 0.63973 -0.28739 -0.28755 X3 -0.15791 0.06334 0.94855 X4 0.95898 -0.01501 -0.07556 X5 0.97224 -0.06778 -0.17535 X6 -0.11416 0.98328 -0.08300 X7 -0.11041 0.97851 -0.07246第四十九張,P

26、PT共一百零五頁(yè),創(chuàng)作于2022年6月zf50 X1=-0.21522F1-0.27397F2+0.89092F3 X2=0.63973F1-0.28739F2-0.28755F3 X3=-0.15791F1+0.06334F2+0.94855F3 X4=0.95898F1-0.01501F2-0.07556F3 X5=0.97224F1-0.06778F2-0.17535F3 X6=-0.11416F1+0.98328F2-0.08300F3 X7=-0.11041F1+0.97851F2-0.07246F3第五十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf51高載荷指標(biāo)因子命名因子1X

27、2;面積(萬(wàn)平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子因子2X6:萬(wàn)人擁有的大學(xué)生數(shù)(人)X7:萬(wàn)人擁有的科學(xué)家、工程師數(shù)(人)人力資源因子因子3X1;人口(萬(wàn)人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子第五十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf52Standardized Scoring Coefficients FACTOR1 FACTOR2 FACTOR3 X1 0.05764 -0.06098 0.50391 X2 0.22724 -0.09901 -0.07713 X3 0.14635 0.12957 0.59715 X4 0.47920

28、 0.11228 0.17062 X5 0.45583 0.07419 0.10129 X6 0.05416 0.48629 0.04099 X7 0.05790 0.48562 0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.040

29、99X6+0.04822X7第五十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf53 前三個(gè)因子得分REGION FACTOR1FACTOR2FACTOR3beijing-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj 0.10

30、839-0.11717-0.02219shanghai-0.200692.38962-0.04259第五十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf54因子分析的數(shù)學(xué)模型為: 原變量被表示為公共因子的線性組合,當(dāng)載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過(guò)來(lái)把公共因子表示為原變量的線性組合。因子得分函數(shù):第五十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf55可見(jiàn),要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于pm,所以不能得到精確的得分,只能通過(guò)估計(jì)。因子得分的計(jì)算方法:(1)運(yùn)用回歸分析思想求解(2) Bartlett(3)Anderson-rubin

31、第五十五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf56(1)運(yùn)用回歸分析思想求解第五十六張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf57則,我們有如下的方程組:第五十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf58j=1,2,m第五十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf59 注:共需要解m次才能解出 所有的得分函數(shù)的系數(shù)。第五十九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf60(2) Bartlett法(即:加權(quán)最小二乘法)把一個(gè)個(gè)體的p個(gè)變量的取值X*當(dāng)作因變量,把求因子解中得到的A作為自變量數(shù)據(jù)陣,對(duì)于這個(gè)個(gè)體在公因子上的取值f,當(dāng)作未知參數(shù),而特殊因子的

32、取值看作誤差e,于是得到如下的線性回歸模型: x*=Af+e,則稱未知參數(shù)f為取值為X*的因子得分。 最小二乘法第六十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf61(3)Anderson-rubin(略)第六十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf62案例分析:國(guó)民生活質(zhì)量的因素分析 國(guó)家發(fā)展的最終目標(biāo),是為了全面提高全體國(guó)民的生活質(zhì)量,滿足廣大國(guó)民日益增長(zhǎng)的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下,增加社會(huì)財(cái)富,創(chuàng)造更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上,維系人類與自然的平衡,達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過(guò)程的

33、最大合理性與空間分布的最大合理化)。 從1990年開(kāi)始,聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對(duì)于國(guó)民生活質(zhì)量進(jìn)行測(cè)度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合,即人的健康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度(使用組合的教育成就表達(dá))、人的福利水平(使用人均國(guó)民收入或人均GDP表達(dá)),并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵,去衡量一個(gè)國(guó)家或地區(qū)的社會(huì)發(fā)展總體狀況以及國(guó)民生活質(zhì)量的總水平。第六十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf63在這個(gè)指標(biāo)體系中有如下的指標(biāo):X1預(yù)期壽命X2成人識(shí)字率X3綜合入學(xué)率X4人均GDP(美圓)X5預(yù)期壽命指數(shù)X6教育成就

34、指數(shù)X7人均GDP指數(shù)第六十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf64旋轉(zhuǎn)后的因子結(jié)構(gòu) Rotated Factor Pattern FACTOR1 FACTOR2 FACTOR3 X1 0.38129 0.41765 0.81714 X2 0.12166 0.84828 0.45981 X3 0.64803 0.61822 0.22398 X4 0.90410 0.20531 0.34100 X5 0.38854 0.43295 0.80848 X6 0.28207 0.85325 0.43289 X7 0.90091 0.20612 0.35052 FACTOR1為經(jīng)濟(jì)發(fā)展因子

35、 FACTOR2為教育成就因子 FACTOR3為健康水平因子第六十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf65被每個(gè)因子解釋的方差和共同度: Variance explained by each factor FACTOR1 FACTOR2 FACTOR3 2.439700 2.276317 2.009490 Final Communality Estimates: Total = 6.725507 X1 X2 X3 X4 X5 0.987530 0.945796 0.852306 0.975830 0.992050 X6 X7 0.994995 0.976999 第六十五張,PPT

36、共一百零五頁(yè),創(chuàng)作于2022年6月zf66Standardized Scoring Coefficients標(biāo)準(zhǔn)化得分系數(shù) FACTOR1 FACTOR2 FACTOR3 X1 -0.18875 -0.34397 0.85077 X2 -0.24109 0.60335 -0.10234 X3 0.35462 0.50232 -0.59895 X4 0.53990 -0.17336 -0.10355 X5 -0.17918 -0.31604 0.81490 X6 -0.09230 0.62258 -0.24876第六十六張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf67 生育率的影響因素分析

37、生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對(duì)生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。 選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國(guó)民收入。下表是1990年中國(guó)30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。第六十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf68第六十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf69特征根與各因子的貢獻(xiàn)Ei

38、genvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201 1.0000第六十九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf70沒(méi)有旋轉(zhuǎn)的因子結(jié)構(gòu)Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.8706

39、60.34618x50.890760.36962第七十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf71各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解釋方差Factor2可解釋方差2.99754292.1642615第七十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf72 在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。Factor1Factor2x1-0.35310-0.87170 x20.077

40、570.95154x30.891140.25621x40.922040.16655x50.951490.15728Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標(biāo)準(zhǔn)化得分函數(shù)第七十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf736.3 因子分析的上機(jī)操作問(wèn)題題 項(xiàng)從未使用很少使用有時(shí)使用經(jīng)常使用總是使用12345A1電腦A2錄音磁帶A3錄像帶A4網(wǎng)上資料A5校園網(wǎng)或因特網(wǎng)A6電子郵件A7電子討論網(wǎng)A8CAI課件A9

41、視頻會(huì)議A10 視聽(tīng)會(huì)議第七十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf74 題目編號(hào)A1A2A3A4A5A6A7A8A9A100115511111110225522212110343334314110443444424220544334414110643333423210744443324110815311111110944544424111054355435331154344425221254544435221335522213111453433325221545533325221644443514111754455545441854423415111954555535332054

42、45552521第七十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf75(01)建立數(shù)據(jù)文件第七十五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf76(02)選擇分析變量 選SPSS Analyze菜單中的(Data Reduction)(Factor),出現(xiàn)【 Factor Analysis】對(duì)話框;在【 Factor Analysis】對(duì)話框中左邊的原始變量中,選擇將進(jìn)行因子分析的變量選入(Variables)欄。第七十六張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf77(03)設(shè)置描述性統(tǒng)計(jì)量在【 Factor Analysis】框中選【 Descriptives】按鈕,出現(xiàn)【

43、Descriptives 】對(duì)話框;選擇 Initial solution (未轉(zhuǎn)軸的統(tǒng)計(jì)量)選項(xiàng)選擇KMO 選項(xiàng)點(diǎn)擊(Contiue)按鈕確定。第七十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf78第七十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf79(04)設(shè)置對(duì)因子的抽取選項(xiàng) 在【 Factor Analysis】框中點(diǎn)擊【Extraction】按鈕,出現(xiàn)【 Factor Analysis:Extraction】對(duì)話框;在Method 欄中選擇(Principal components)選項(xiàng);在Analyze 欄中選擇Correlation matrix選項(xiàng);在Display

44、 欄中選擇Unrotated factor solution選項(xiàng);在Extract 欄中選擇Eigenvalues over 并填上 1 ;點(diǎn)擊(Contiue)按鈕確定,回到【 Factor Analysis】對(duì)話框中。第七十九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf80第八十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf81第八十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf82(05)設(shè)置因子轉(zhuǎn)軸 在【 Factor Analysis】對(duì)話框中,點(diǎn)擊【Rotation】按鈕,出現(xiàn) 【 Factor Analysis:Rotation 】(因子分析:旋轉(zhuǎn))對(duì)話框。 在Meth

45、od 欄中選擇 Varimax(最大變異法) 在Display欄中選擇 Rotated solution(轉(zhuǎn)軸后的解) 點(diǎn)擊(Contiue)按鈕確定,回到【 Factor Analysis】對(duì)話框中。 第八十二張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf83第八十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf84(06)設(shè)置因素分?jǐn)?shù) 在【 Factor Analysis】對(duì)話框中,點(diǎn)擊【Scores】按鈕,出現(xiàn) 【 Factor Analysis: Scores 】(因素分析:分?jǐn)?shù))對(duì)話框。 一般取默認(rèn)值。 點(diǎn)擊(Contiue)按鈕確定,回到【 Factor Analysis】對(duì)話

46、框。第八十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf85第八十五張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf86(07)設(shè)置因子分析的選項(xiàng)在【 Factor Analysis】對(duì)話框中,單擊【Options】按鈕,出現(xiàn) 【 Factor Analysis:Options 】(因素分析:選項(xiàng))對(duì)話框。在Missing Values 欄中選擇Exclude cases listwise(完全排除缺失值)在Coefficient Display Format(系數(shù)顯示格式)欄中選擇Sorted by size(依據(jù)因素負(fù)荷量排序)項(xiàng);在Coefficient Display Format

47、(系數(shù)顯示格式)勾選“Suppress absolute values less than”,其后空格內(nèi)的數(shù)字不用修改,默認(rèn)為0.1。如果研究者要呈現(xiàn)所有因素負(fù)荷量,就不用選取“Suppress absolute values less than”選項(xiàng)。在例題中為了讓研究者明白此項(xiàng)的意義,才勾選了此項(xiàng),正式的研究中應(yīng)呈現(xiàn)題項(xiàng)完整的因素負(fù)荷量較為適宜。單擊“Continue”按鈕確定。第八十六張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf87第八十七張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf88第八十八張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf89對(duì)SPSS因子分析結(jié)果的解釋取樣適

48、當(dāng)性(KMO)檢驗(yàn) KMO值越大,表示變量間的共同因素越多,越適合進(jìn)行因素分析,要求KMO0.5 要求Barletts的卡方值達(dá)到顯著程度第八十九張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf902.共同度檢查第九十張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf913.因子陡坡檢查,除去坡線平坦部分的因子圖中第三個(gè)因子以后較為平坦,故保留3個(gè)因子第九十一張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf924.方差貢獻(xiàn)率檢驗(yàn) 取特征值大于 1 的因子,共有3 個(gè),分別(6.358)(1.547)(1.032); 變異量分別為(63.58%)(15.467%)(10.32%)第九十二張,PPT

49、共一百零五頁(yè),創(chuàng)作于2022年6月zf935.顯示未轉(zhuǎn)軸的因子矩陣第九十三張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf946. 分析轉(zhuǎn)軸后的因子矩陣-根據(jù)因子負(fù)荷量形成3個(gè)公共因子第九十四張,PPT共一百零五頁(yè),創(chuàng)作于2022年6月zf957. 形成綜合分析結(jié)果題項(xiàng)貢獻(xiàn)率(解釋變異量)累積貢獻(xiàn)率(累積解釋變異量)Component(抽取的因子)因子1負(fù)荷量因子2負(fù)荷量因子3負(fù)荷量共同性A1 電腦A8 CAI課件A6 電子郵件A5校園網(wǎng)或因特網(wǎng)A4 網(wǎng)上資料43.88543.8850.9150.9120.8840.8240.7890.9280.9070.8670.9010.872A10 視聽(tīng)會(huì)議A9視頻會(huì)議A7電子討論網(wǎng)31.37275.2570.9390.9240.8580.9390.9650.919A3 錄像帶A2 錄音磁帶14.10889.3660.9480.6520.9000.738特征值4.3893.1371.41

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論