版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1因子分析因子分析2 1 1 引言引言 因子分析(factor analysis)是一種數(shù)據(jù)簡化的技術(shù)。它通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)假想變量能夠反映原來眾多變量的主要信息。原始的變量是可觀測的顯在變量,而假想變量是不可觀測的潛在變量,稱為因子。 例如,在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過一個(gè)有24個(gè)指標(biāo)構(gòu)成的評價(jià)體系,評價(jià)百貨商場的24個(gè)方面的優(yōu)劣。3 但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格的三個(gè)潛在
2、的因子,對商店進(jìn)行綜合評價(jià)。而這三個(gè)公共因子可以表示為: iiiiiiFFFx33221124, 1i 稱 是不可觀測的潛在因子。24個(gè)變量共享這三個(gè)因子,但是每個(gè)變量又有自己的個(gè)性,不被包含的部分 ,稱為特殊因子。321FFF、i4注:注: 因子分析與回歸分析不同,因子分析中的因因子分析與回歸分析不同,因子分析中的因子是一個(gè)比較抽象的概念,而回歸因子有非常明子是一個(gè)比較抽象的概念,而回歸因子有非常明確的實(shí)際意義;確的實(shí)際意義; 主成分分析分析與因子分析也有不同,主成主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型
3、。子模型。 主成分分析主成分分析: :原始變量的線性組合表示新的原始變量的線性組合表示新的綜合變量,即主成分;綜合變量,即主成分; 因子分析:潛在的假想變量和隨機(jī)影響變因子分析:潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量。量的線性組合表示原始變量。5 2 因子分析模型因子分析模型 一、數(shù)學(xué)模型一、數(shù)學(xué)模型 設(shè) 個(gè)變量,如果表示為iX), 2 , 1(pip11iiiimmiXa Fa F)(pm 11111211122212222212mmpppppmpmXFXFXF或XAF或6 稱為 公共因子,是不可觀測的變量,他們的系數(shù)稱為因子載荷。 是特殊因子,是不能被前m個(gè)公共因子包含的部分。
4、并且滿足:mFFF,21iIFD111)(cov( , )0,F,F即不相關(guān);mFFF,21即 互不相關(guān),方差為1。722221)(pD即互不相關(guān),方差不一定相等, 。), 0(2iiN8用矩陣的表達(dá)方式X- = AF+( )EF0( )E0( )VarFI22212( )(,)pVardiag1 11212 122212()()()()()()cov()()()()()ppppppE FE FE FE FE FE FEE FE FE FF,F09二、因子分析模型的性質(zhì) 1、原始變量X的協(xié)方差矩陣的分解X- = AF+()( )( )VarVarVarX- = AF A+x = AA +DA是
5、因子模型的系數(shù)22212( )(,)pVardiagD D的主對角線上的元素值越小,則公共因子共享的成分越多。10 2、模型不受計(jì)量單位的影響 將原始變量X做變換X*=CX,這里Cdiag(c1,c2,cn),ci0。)C(X-) = C(AF+CXC+CAF+C*XC+CAF+C*X + A F +*FF11*()EF0*( )E0*()VarFI*22212( )(,)pVardiag* *cov()()EF ,F 012 3、因子載荷不是惟一的 設(shè)T為一個(gè)pp的正交矩陣,令A(yù)*=AT,F(xiàn)*=TF,則模型可以表示為*X+ A F +()ET F0( )E0*()()( )VarVarVar
6、FT FTF TI22212( )(,)pVardiag*cov()()EF ,F 0且滿足條件因子模型的條件13 三、三、 因子載荷矩陣中的幾個(gè)統(tǒng)計(jì)特征因子載荷矩陣中的幾個(gè)統(tǒng)計(jì)特征 1 1、因子載荷、因子載荷a aijij的統(tǒng)計(jì)意義的統(tǒng)計(jì)意義 因子載荷 是第i個(gè)變量與第j個(gè)公共因子的相關(guān)系數(shù) ija模型為 imimiiFaFaX11 在上式的左右兩邊乘以 jF,再求數(shù)學(xué)期望 )()()()()(11jijmimjjijjijiFEFFEaFFEFFEaFXE 根據(jù)公共因子的模型性質(zhì),有ijFxji (載荷矩陣中第i行,第j列的元素)反映了第i個(gè)變量與第j個(gè)公共因子的相關(guān)重要性。絕對值越大,相
7、關(guān)的密切程度越高。14 2 2、變量共同度的統(tǒng)計(jì)意義、變量共同度的統(tǒng)計(jì)意義定義:定義:變量 的共同度是因子載荷矩陣的第i行的元素的平方和。記為iX統(tǒng)計(jì)意義統(tǒng)計(jì)意義:imimiiFaFaX11兩邊求方差 )()()()(2112imimiiVarFVaraFVaraXVarmjiija1221 所有的公共因子和特殊因子對變量 的貢獻(xiàn)為1。如果 非??拷?, 非常小,則因子分析的效果好,從原變量空間到公共因子空間的轉(zhuǎn)化性質(zhì)好。iXmjija122imjija12。mjijiah12215 3 3、公共因子、公共因子 方差貢獻(xiàn)的統(tǒng)計(jì)意義方差貢獻(xiàn)的統(tǒng)計(jì)意義jF因子載荷矩陣中各列元素的平方和 稱為所有的
8、 對 的方差貢獻(xiàn)和。衡量的相對重要性。piijjaS12), 1(mjjFiXjF16 3 3 因子載荷矩陣的估計(jì)方法因子載荷矩陣的估計(jì)方法 設(shè)隨機(jī)向量 的均值為 ,協(xié)方差為 , 為的特征根, 為對應(yīng)的標(biāo)準(zhǔn)化特征向量,則pxxx,21x021pp21u,u,u12p = UUAA +D(一)主成分分析法(一)主成分分析法17 上式給出的 表達(dá)式是精確的,然而,它實(shí)際上是毫無價(jià)值的,因?yàn)槲覀兊哪康氖菍で笥蒙贁?shù)幾個(gè)公共因子解釋,故略去后面的p-m項(xiàng)的貢獻(xiàn),有21111mmmmmmp1122ppu uu uu uuuu up2uuuuuuppp21122111100p212ppuuuuuu18 12
9、 mmm1122AA +Du uu uu uD1121122 mmp mpmm p2uuuuuDAADu 上式有一個(gè)假定,模型中的特殊因子是不重要的,因而從 的分解中忽略了特殊因子的方差。22212(,)pdiagD其中221miiiijjsa19注:殘差矩陣 SAAD其中S為樣本的協(xié)方差矩陣。20 (二)主因子法(二)主因子法 主因子方法是對主成分方法的修正,假定我們首先對變量進(jìn)行標(biāo)準(zhǔn)化變換。則 R=AA+D R*=AA=R-D稱R*為約相關(guān)矩陣,為約相關(guān)矩陣, R*對角線上的元素是對角線上的元素是 ,而不是1。2ih212112122122212ppppphrrrhrRrrhR-D直接求R
10、*的前p個(gè)特征根和對應(yīng)的正交特征向量。得如下的矩陣:*1122ppAuuu*10pR特征根:*12,pu uu正交特征向量:2221222pRR 當(dāng)特殊因子當(dāng)特殊因子 的方差不為且的方差不為且已知的,問題非常好解決。i*11*221122*ppppuuuuuu23*1122mmAuuu2121100phhD24 在實(shí)際的應(yīng)用中,個(gè)性方差矩陣一般都是未知的,可以通過一組樣本來估計(jì)。估計(jì)的估計(jì)的方法有如下幾種方法有如下幾種: 首先,求 的初始估計(jì)值,構(gòu)造出 2ih*R 1)取 ,在這個(gè)情況下主因子解與主成分解等價(jià); 2)取 , 為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方,即xi對其余的p-1
11、個(gè)xj的回歸方程的判定系數(shù),這是因?yàn)閤i 與公共因子的關(guān)系是通過其余的p-1個(gè)xj 的線性組合聯(lián)系起來的;12ih22iiRh 2iR25 2)取 ,這意味著取xi與其余的xj的簡單相關(guān)系數(shù)的絕對值最大者;)( |max2ijrhiji 4)取 ,其中要求該值為正數(shù)。pjijijirph, 1211 5)取 ,其中 是 的對角元素。iiirh/12iir1R26 (三)極大似然估計(jì)法(略) 如果假定公共因子F和特殊因子 服從正態(tài)分布,那么可以得到因子載荷和特殊因子方差的極大似然估計(jì)。設(shè) 為來自正態(tài)總體Np( , )的隨機(jī)樣本。 n21x,x,xAA )()(21exp)(112 iininp2
12、XX12 ()( )()()()nLff Xf Xf X,A,DX)()(21exp)2(12121 iipnixx27 它通過 依賴 和 。上式并不能唯一確定 ,為此可添加一個(gè)唯一性條件: 這里 式一個(gè)對角矩陣,用數(shù)值極大化的方法可以得到極大似然估計(jì) 。極大似然估計(jì) 將使 為對角陣,且似然函數(shù)達(dá)到最大。 相應(yīng)的共同度的似然估計(jì)為: 第J個(gè)因子對總方差的貢獻(xiàn):1和x和、1222212imiiiaaah222212pjjjjaaaS28 例例 假定某地固定資產(chǎn)投資率 ,通貨膨脹率 ,失業(yè)率 ,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。1x2x3x15/25/15/215/15/15/1129
13、 特征根為: 55. 11 85. 02 6 . 03 6 . 0707. 085. 0331. 055. 1629. 06 . 0707. 085. 0331. 055. 1629. 0085. 0883. 055. 1475. 0A707. 0331. 0629. 0707. 0331. 0629. 00883. 0475. 0U548. 0305. 0783. 0548. 0305. 0783. 00814. 0569. 030 可取前兩個(gè)因子F1和F2為公共因子,第一公因子F1物價(jià)就業(yè)因子,對X的貢獻(xiàn)為1.55。第一公因子F2為投資因子,對X的貢獻(xiàn)為0.85。共同度分別為1,0.706
14、,0.706。211814. 0569. 0FFx3212548. 0305. 0783. 0FFFx3213548. 0305. 0783. 0FFFx31 假定某地固定資產(chǎn)投資率 ,通貨膨脹率 ,失業(yè)率 ,相關(guān)系數(shù)矩陣為試用主因子分析法求因子分析模型。假定用代替初始的 。 。1x2x3x15/25/15/215/15/15/11)( |max2ijrhiji2ih52, 1,51232221hhh221251111515/25/25/15/215/15/15/15/1*R32 特征根為: 9123. 010877. 0203 對應(yīng)的非零特征向量為:261. 0657. 0261. 0657
15、. 0929. 0369. 00877. 0261. 09123. 0657. 00877. 0261. 09123. 0657. 00877. 0929. 09123. 0369. 0077. 0628. 0077. 0628. 0275. 0352. 0331211275. 0352. 0FFx2212077. 0625. 0FFx3211077. 0682. 0FFx新的共同度為:18129. 0275.352. 02221oh3966. 0077. 0625. 02222h4710. 0077. 0682. 02223h34 4 因子旋轉(zhuǎn)(正交變換) 建立了因子分析數(shù)學(xué)目的不僅僅要找出
16、公共因子以及對變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使因子載荷陣的結(jié)構(gòu)簡化,使載荷矩陣每列或行的元素平方值向0和1兩極分化。有三種主要的正交旋轉(zhuǎn)法。四次方最大法、方差最大法方差最大法和等量最大法。(一)為什么要旋轉(zhuǎn)因子(一)為什么要旋轉(zhuǎn)因子35 百米跑成績 跳遠(yuǎn)成績 鉛球成績 跳高成績 400米跑成績 百米跨欄 鐵餅成績 撐桿跳遠(yuǎn)成績 標(biāo)槍成績 1500米跑成績 1X2X3X4X5X6X7X8X9X10X奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)目奧運(yùn)會(huì)十項(xiàng)全能運(yùn)動(dòng)項(xiàng)
17、目得分?jǐn)?shù)據(jù)的因子分析得分?jǐn)?shù)據(jù)的因子分析 36102. 017. 002. 001. 039. 018. 008. 009. 007. 0124. 034. 018. 013. 017. 044. 021. 011. 0124. 033. 023. 039. 024. 036. 020. 0132. 017. 027. 073. 031. 028. 0134. 046. 036. 052. 040. 0129. 019. 049. 063. 0138. 051. 034. 0142. 035. 0159. 0137變量共同度0.6910.217-0.58-0.2060.840.7890.184-
18、0.1930.0920.70.7020.5350.047-0.1750.80.6740.1340.1390.3960.650.620.551-0.084-0.4190.870.6870.042-0.1610.3450.620.621-0.5210.109-0.2340.720.5380.0870.4110.440.660.434-0.4390.372-0.2350.570.1470.5960.658-0.2790.891F2F3F4F1X2X3X4X5X6X7X8X9X10X 因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動(dòng)因子。其他的3個(gè)因子不太容易解
19、釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉(zhuǎn)因子,得下表 38變量共同度0.844*0.1360.156-0.1130.840.631*0.1940.515*-0.0060.70.2430.825*0.223-0.1480.810.2390.150.750*0.0760.650.797*0.0750.1020.4680.870.4040.1530.635*-0.170.620.1860.814*0.147-0.0790.72-0.0360.1760.762*0.2170.66-0.0480.735*0.110.1410.570.045-0.0410.1120.93
20、4*0.891F2F3F4F1X2X3X4X5X6X7X8X9X10X39 通過旋轉(zhuǎn),因子有了較為明確的含義。 百米跑, 跳遠(yuǎn)和 400米跑,需要爆發(fā)力的項(xiàng)目在 有較大的載荷, 可以稱為短跑速度因子; 鉛球, 鐵餅和 標(biāo)槍在 上有較大的載荷,可以稱為爆發(fā)性臂力因子; 百米跨欄, 撐桿跳遠(yuǎn), 跳遠(yuǎn)和為 跳高在 上有較大的載荷, 爆發(fā)腿力因子; 長跑耐力因子。2X5X1F1F3X7X9X2F6X8X2X4X3F3F4F1X40變換后因子的共同度變換后因子的共同度設(shè) 正交矩陣,做正交變換正交矩陣,做正交變換 AB )()(1mlljilppijabBmjmjmlljilijiabh111222)()
21、(B mjmlmjmlmljttjljitilljilaaa1 11 1 122)(2111222Aimlmjmlilljilhaa變換后因子的共同度沒有發(fā)生變化!變換后因子的共同度沒有發(fā)生變化?。ǘ┬D(zhuǎn)方法(二)旋轉(zhuǎn)方法41變換后因子貢獻(xiàn)變換后因子貢獻(xiàn)設(shè) 正交矩陣,做正交變換正交矩陣,做正交變換 AB )()(1qlljilppijabBpipiqlljilijjabS111222)()(B piqlpiqlqltttjljitilljilaaa1111 122piqlqlljjljilSa1112222)(A變換后因子的貢獻(xiàn)發(fā)生了變化變換后因子的貢獻(xiàn)發(fā)生了變化!42 1、方差最大法 方差
22、最大法從簡化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子方差最大法從簡化因子載荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子有關(guān)的載荷的平方的方差最大。當(dāng)只有少數(shù)幾個(gè)變量在某個(gè)因子上又較高的載荷時(shí),對因子的解釋最簡單。上又較高的載荷時(shí),對因子的解釋最簡單。方差最大的直觀意義是希望通過因子旋轉(zhuǎn)后,使每個(gè)因子上的載荷盡量拉開距離,一部分的載荷趨于1,另一部分趨于0。2122211211ppaaaaaaA221122212122121111FaFaXFaFaXFaFaXppp43cossinsincosT設(shè)旋轉(zhuǎn)矩陣為:cossinsincosAATB則cossin
23、sincoscossinsincos112112111211ppppaaaaaaaa*2*1*12*11ppaaaa441,2, ;1,2ijijiadip jh令211(pjijiddp這是列和)max)()(1212 mjpijijddV簡化準(zhǔn)則為:00V令,則可以解出0000cossinsincosT旋轉(zhuǎn)矩陣為:max(8.4.2)123m即:V +V +V+V451000cossin0sincosT1000cossin0sincos T111 TT46 1 1、四次方最大旋轉(zhuǎn)、四次方最大旋轉(zhuǎn) 四次方最大旋轉(zhuǎn)是從簡化載荷矩陣的行出發(fā),通過旋轉(zhuǎn)初始四次方最大旋轉(zhuǎn)是從簡化載荷矩陣的行出發(fā),通
24、過旋轉(zhuǎn)初始因子,使每個(gè)變量只在一個(gè)因子上又較高的載荷,而在其它的因子,使每個(gè)變量只在一個(gè)因子上又較高的載荷,而在其它的因子上盡可能低的載荷。因子上盡可能低的載荷。如果每個(gè)變量只在一個(gè)因子上又非零的載荷,這是的因子解釋是最簡單的。 四次方最大法通過使因子載荷矩陣中每一行的因子載荷平方的方差達(dá)到最大。47max)1(2112 pimjijmbQ簡化準(zhǔn)則為: pimjijijpimjijmbmbmbQ112242112)112()1( pimjpimjijpimjijmbmb111122114)112( pimjpimjijpimjijmbmb111122114)112( pimjijmpb114)
25、2(MAXbQpimjij 114最終的簡化準(zhǔn)則為:48 3、等量最大法 等量最大法把四次方最大法和方差最大法結(jié)等量最大法把四次方最大法和方差最大法結(jié)合起來求合起來求Q Q和和V V的加權(quán)平均最大。的加權(quán)平均最大。 MAXpbbEpimjmjpiijij 1111224/)(最終的簡化準(zhǔn)則為:權(quán)數(shù)等于m/2,因子數(shù)有關(guān)。49 5 因子得分因子得分 (一)因子得分的概念(一)因子得分的概念 前面我們主要解決了用公共因子的線性組合來表示一組觀測變量的有關(guān)問題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來做回歸分析,對樣本進(jìn)行分類或評價(jià),這就需要我們對公共因子進(jìn)行測度,即給出公共
26、因子的值。50 人均要素變量因子分析人均要素變量因子分析。對我國32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1 :人口(萬人) X2 :面積(萬平方公里)X3 :GDP(億元) X4 :人均水資源(立方米/人)X5:人均生物量(噸/人) X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有科學(xué)家、工程師數(shù)(人) Rotated Factor Pattern FACTOR1 FACTOR2 FACTOR3 X1 -0.21522 -0.27397 0.89092 X2 0.63973 -0.28739 -0.28755 X3 -0.15791 0.06334 0.94855 X4 0.
27、95898 -0.01501 -0.07556 X5 0.97224 -0.06778 -0.17535 X6 -0.11416 0.98328 -0.08300 X7 -0.11041 0.97851 -0.0724651 高載荷指標(biāo) 因子命名 因子1X2;面積(萬平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子 因子2X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有的科學(xué)家、工程師數(shù)(人) 人力資源因子 因子3 X1;人口(萬人)X3:GDP(億元)經(jīng)濟(jì)發(fā)展總量因子 X1=-0.21522F1-0.27397F2+0.89092F3 X2=0.63973F1-0.
28、28739F2-0.28755F3 X3=-0.15791F1+0.06334F2+0.94855F3 X4=0.95898F1-0.01501F2-0.07556F3 X5=0.97224F1-0.06778F2-0.17535F3 X6=-0.11416F1+0.98328F2-0.08300F3 X7=-0.11041F1+0.97851F2-0.07246F352 Standardized Scoring Coefficients FACTOR1 FACTOR2 FACTOR3 X1 0.05764 -0.06098 0.50391 X2 0.22724 -0.09901 -0.077
29、13 X3 0.14635 0.12957 0.59715 X4 0.47920 0.11228 0.17062 X5 0.45583 0.07419 0.10129 X6 0.05416 0.48629 0.04099 X7 0.05790 0.48562 0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.099
30、01X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X753REGION FACTOR1FACTOR2FACTOR
31、3beijing-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj 0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個(gè)因子得分54 因子分析的數(shù)學(xué)模型為: mpmppmm
32、nFFFXXX2121222211121121 原變量被表示為公共因子的線性組合,當(dāng)載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過來把公共因子表示為原變量的線性組合。 因子得分函數(shù): pjpjjXXF11mj, 1可見,要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于pm,所以不能得到精確的得分,只能通過估計(jì)。551、巴特萊特因子得分巴特萊特因子得分( (加權(quán)最小二乘法)加權(quán)最小二乘法) 把 看作因變量;把因子載荷矩陣 看成自變量的觀測;把某個(gè)個(gè)案的得分 看著最小二乘法需要求的系數(shù) 。iixpmppmm212222111211ijF1) 巴特萊特因子得分計(jì)算方法的思想56
33、mmpmpppipmmimmifafafaxfafafaxfafafax221122222121221121211111由于特殊因子的方差相異,所以用加權(quán)最小二乘法求得分,每個(gè)各案作一次,要求出所有樣品的得分,需要作n次。 pjimimiiiijfafafax1222211/)()(1,mff使上式最小的是相應(yīng)個(gè)案的因子得分。57 用矩陣表達(dá):x- = AF+1()()minx-AF Dx-AF滿足上式的F是相應(yīng)個(gè)案的因子得分。2112200D其中58111D (x-) = D AF+D 1-1-1A D (x-) = A D AF+ A D -1-1A D (x-) = A D AF1-1-
34、1A D AA D (x- ) = F1()()0 x-AF Dx-AFF12()0A Dx-AF1( )0A D592)得分估計(jì)的無偏性如果將f和 不相關(guān)的假定加強(qiáng)為相互獨(dú)立,則1(E-1-1A D AA DAF+ /F)1)/ )EE-1-1(F/FA D AA D(x- ) F1-1-1A D AA D AF11-1A DAA D AF F603)F的估計(jì)精度1()FF-1-1A D AA DAF+ F1-1-1A D AA D ()EF-F)(F-F11E-1-1-1-1A D AA D D A A D A11-1-1-1-1A D AA D DD A A D A1-1A D A61
35、2、回歸方法 nmnmnnmmnFFFXXX212121222211121121pjpjjXbXbF11mj, 1mmpmmppbbbbbbbbbbbb212122221112111) 思想62)(jiFxijFXEji)(11pjpjiXbXbXEipjpijbb11jpjjipiibbbrrr2121 則,我們有如下的方程組:63pjjjjpjjppppppaaabbb2121212222111211j=1,2,m矩陣為原始變量的相關(guān)系數(shù)pppppp21222211121164個(gè)因子得分函數(shù)的系數(shù)為第 jbbbjpjj21列為載荷矩陣的第 jaaapjjj21 注:共需要解注:共需要解m次
36、才能解次才能解出出 所有的得分函數(shù)的系數(shù)。所有的得分函數(shù)的系數(shù)。65矩陣表示方法 在因子模型中,假設(shè) 服從(m+p)元的正態(tài)分布,有F( )( )EEEFF0 xxVE FFFx-xx-66()()()EEEEFFF x- x- Fx- x-()()IEEF x-x- F()()IEEF AF+AF+ FIAA67()E-1-12F/x-A + A x21xx這是一個(gè)對于給定的 的多元回歸模型。1()A x122()(E-1-11122212222x /x - )+ x1FA (AA +D) (x- )可見682)估計(jì)的有偏性11()()EF-F)(F-FI+ A D A3)平均預(yù)報(bào)誤差11(
37、)EF/FF-(I+ A D A) F69國民生活質(zhì)量的因素分析 國家發(fā)展的最終目標(biāo),是為了全面提高全體國民的生活質(zhì)量,滿足廣大國民日益增長的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下,增加社會(huì)財(cái)富,創(chuàng)自更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上,維系人類與自然的平衡,達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過程的最大合理性與空間分布的最大合理化)。 從1990年開始,聯(lián)合國開發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對于國民生活質(zhì)量進(jìn)行測度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合,即人的健康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度
38、(使用組合的教育成就表達(dá))、人的福利水平(使用人均國民收入或人均GDP表達(dá)),并且特別強(qiáng)調(diào)三類指標(biāo)組合的整體表達(dá)內(nèi)涵,去衡量一個(gè)國家或地區(qū)的社會(huì)發(fā)展總體狀況以及國民生活質(zhì)量的總水平。70在這個(gè)指標(biāo)體系中有如下的指標(biāo):X1預(yù)期壽命X2成人識(shí)字率X3綜合入學(xué)率X4人均GDP(美圓)X5預(yù)期壽命指數(shù)X6教育成就指數(shù)X7人均GDP指數(shù)71 旋轉(zhuǎn)后的因子結(jié)構(gòu) Rotated Factor Pattern FACTOR1 FACTOR2 FACTOR3 X1 0.38129 0.41765 0.81714 X2 0.12166 0.84828 0.45981 X3 0.64803 0.61822 0.22
39、398 X4 0.90410 0.20531 0.34100 X5 0.38854 0.43295 0.80848 X6 0.28207 0.85325 0.43289 X7 0.90091 0.20612 0.35052 FACTOR1為經(jīng)濟(jì)發(fā)展因子 FACTOR2為教育成就因子 FACTOR3為健康水平因子72 被每個(gè)因子解釋的方差和共同度 Variance explained by each factor FACTOR1 FACTOR2 FACTOR3 2.439700 2.276317 2.009490 Final Communality Estimates: Total = 6.72
40、5507 X1 X2 X3 X4 X5 0.987530 0.945796 0.852306 0.975830 0.992050 X6 X7 0.994995 0.976999 73 Standardized Scoring Coefficients標(biāo)準(zhǔn)化得分系數(shù) FACTOR1 FACTOR2 FACTOR3 X1 -0.18875 -0.34397 0.85077 X2 -0.24109 0.60335 -0.10234 X3 0.35462 0.50232 -0.59895 X4 0.53990 -0.17336 -0.10355 X5 -0.17918 -0.31604 0.81490
41、 X6 -0.09230 0.62258 -0.24876 *6*5*4*3*2*109230. 017918. 05399. 035462. 024109. 018875. 01xxxxxxf*6*5*4*3*2*162258. 031604. 017336. 050232. 060335. 034397. 02xxxxxxf*6*5*4*3*2*124876. 081490. 010335. 059895. 010234. 085077. 03xxxxxxf74生育率的影響因素分析 生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨(dú)立的,而是交織在一
42、起,如果直接用選定的變量對生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對生育率進(jìn)行分析。 選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。75多子率(%)綜合節(jié)育率(%) 初中以上文化程度比例(%)人均國民收入(元) 城鎮(zhèn)人口比例(%)0.9489.8964.51357773.082.5892.3255.41298168.6513.4690.7138.2114819.0812.4690.
43、0445.12112427.688.9490.4641.83108036.122.890.1750.64201150.868.9191.4346.32138342.658.8290.7847.33162847.170.891.4762.36482266.235.9490.3140.85169621.242.692.4235.14171732.817.0787.9729.5193317.914.4488.7129.04131321.3615.2489.4331.0594320.43.1690.2137.85137227.349.0488.7639.7188015.5212.0287.2838.7
44、6124828.9111.1589.1336.3397618.2322.4687.7238.38184536.7724.3484.8631.0779815.133.2183.7939.44119324.054.7890.5731.2690320.2521.568622.3865419.9314.0980.8621.4995614.7232.3187.67.786512.5911.1889.7141.0193021.4913.886.3329.6993822.0425.3481.5631.3110027.3520.8481.4534.59102425.8239.664.938.47137431.
45、9176EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201 1.0000特征根與各因子的貢獻(xiàn)特征根與各因子的貢獻(xiàn)77 Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x5
46、0.890760.36962沒有旋轉(zhuǎn)的因子結(jié)構(gòu)沒有旋轉(zhuǎn)的因子結(jié)構(gòu)78Factor1可解釋方差Factor2可解釋方差2.99754292.1642615各旋轉(zhuǎn)后的共同度各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.9300636979 在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析。 Factor1Factor2x1-0.35310-0.87170 x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728 Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 滬科版八年級(jí)物理全一冊《第三章光的世界》單元檢測卷及答案
- 利用元數(shù)據(jù)促進(jìn)數(shù)據(jù)共享協(xié)作
- 蘇教版五年級(jí)下冊課內(nèi)閱讀25篇、及課外閱讀材料(含答案)
- 2024高中地理第四章區(qū)域經(jīng)濟(jì)發(fā)展章末整合學(xué)案新人教版必修3
- 2024高中生物第5章生態(tài)系統(tǒng)及其穩(wěn)定性第1節(jié)生態(tài)系統(tǒng)的結(jié)構(gòu)課堂演練含解析新人教版必修3
- 2024高中語文第二單元第7課陸文學(xué)自傳課時(shí)作業(yè)含解析粵教版選修唐宋散文蚜
- 2024高考地理一輪復(fù)習(xí)第十六章第1講資源的跨區(qū)域調(diào)配-以我國西氣東輸為例教案含解析新人教版
- 2024高考?xì)v史一輪復(fù)習(xí)方案專題九走向世界的資本主義市場第22講“蒸汽”的力量與走向整體的世界教學(xué)案+練習(xí)人民版
- 2024高考地理一輪復(fù)習(xí)第一部分自然地理-重在理解第二章地球上的大氣第6講冷熱不均引起大氣運(yùn)動(dòng)學(xué)案新人教版
- (3篇)2024年幼兒園園長年度考核表個(gè)人總結(jié)
- 南京市勞動(dòng)合同書(全日制文本)
- 生物化學(xué)課件
- 內(nèi)蒙古自治區(qū)巴彥淖爾市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)及行政區(qū)劃代碼
- (精選word)洪恩識(shí)字-生字卡片1-200
- 課文背書統(tǒng)計(jì)表
- 三年級(jí)語文下冊教案-14 蜜蜂3-部編版
- 蘇教版小學(xué)數(shù)學(xué)四年級(jí)下冊全冊教案
- 藥理治療中樞神經(jīng)系統(tǒng)退行性疾病藥.pptx
- 強(qiáng)三基反三違除隱患促安全百日專項(xiàng)行動(dòng)實(shí)施方案
- 新人教版七年級(jí)數(shù)學(xué)上冊全冊專項(xiàng)訓(xùn)練大全
- 標(biāo)準(zhǔn)預(yù)防--ppt課件
評論
0/150
提交評論