![CH因子分析實用_第1頁](http://file4.renrendoc.com/view/aabf781f5661a792ab781bf5c7fb9415/aabf781f5661a792ab781bf5c7fb94151.gif)
![CH因子分析實用_第2頁](http://file4.renrendoc.com/view/aabf781f5661a792ab781bf5c7fb9415/aabf781f5661a792ab781bf5c7fb94152.gif)
![CH因子分析實用_第3頁](http://file4.renrendoc.com/view/aabf781f5661a792ab781bf5c7fb9415/aabf781f5661a792ab781bf5c7fb94153.gif)
![CH因子分析實用_第4頁](http://file4.renrendoc.com/view/aabf781f5661a792ab781bf5c7fb9415/aabf781f5661a792ab781bf5c7fb94154.gif)
![CH因子分析實用_第5頁](http://file4.renrendoc.com/view/aabf781f5661a792ab781bf5c7fb9415/aabf781f5661a792ab781bf5c7fb94155.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
會計學(xué)1CH因子分析實用2
但消費者主要關(guān)心的是三個方面,即商店的環(huán)境、商店的服務(wù)和商品的價格。因子分析方法可以通過24個變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價格的三個潛在的因子,對商店進行綜合評價。而這三個公共因子可以表示為:
稱是不可觀測的潛在因子。24個變量共享這三個因子,但是每個變量又有自己的個性,不被包含的部分,稱為特殊因子。第1頁/共86頁3注:
因子分析與回歸分析不同,因子分析中的因子是一個比較抽象的概念,而回歸因子有非常明確的實際意義;
主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。主成分分析:原始變量的線性組合表示新的綜合變量,即主成分;因子分析:潛在的假想變量和隨機影響變量的線性組合表示原始變量。第2頁/共86頁4§2因子分析模型
一、數(shù)學(xué)模型
設(shè)個變量,如果表示為第3頁/共86頁5
稱為公共因子,是不可觀測的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個公共因子包含的部分。并且滿足:即不相關(guān);即互不相關(guān),方差為1。第4頁/共86頁6即互不相關(guān),方差不一定相等,。第5頁/共86頁7用矩陣的表達方式第6頁/共86頁8二、因子分析模型的性質(zhì)1、原始變量X的協(xié)方差矩陣的分解D的主對角線上的元素值越小,則公共因子共享的成分越多。第7頁/共86頁92、模型不受計量單位的影響
將原始變量X做變換X*=CX,這里C=diag(c1,c2,…,cn),ci>0。第8頁/共86頁10第9頁/共86頁113、因子載荷不是惟一的
設(shè)T為一個p×p的正交矩陣,令A(yù)*=AT,F(xiàn)*=T’F,則模型可以表示為且滿足條件因子模型的條件第10頁/共86頁12
三、因子載荷矩陣中的幾個統(tǒng)計特征1、因子載荷aij的統(tǒng)計意義
因子載荷是第i個變量與第j個公共因子的相關(guān)系數(shù)
模型為
在上式的左右兩邊乘以
,再求數(shù)學(xué)期望
根據(jù)公共因子的模型性質(zhì),有
(載荷矩陣中第i行,第j列的元素)反映了第i個變量與第j個公共因子的相關(guān)重要性。絕對值越大,相關(guān)的密切程度越高。第11頁/共86頁132、變量共同度的統(tǒng)計意義定義:變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為統(tǒng)計意義:兩邊求方差
所有的公共因子和特殊因子對變量的貢獻為1。如果非??拷?,非常小,則因子分析的效果好,從原變量空間到公共因子空間的轉(zhuǎn)化性質(zhì)好。第12頁/共86頁143、公共因子方差貢獻的統(tǒng)計意義因子載荷矩陣中各列元素的平方和稱為所有的對的方差貢獻和。衡量的相對重要性。第13頁/共86頁15§3因子載荷矩陣的估計方法
設(shè)隨機向量的均值為,協(xié)方差為,
為的特征根,為對應(yīng)的標準化特征向量,則(一)主成分分析法第14頁/共86頁16
上式給出的表達式是精確的,然而,它實際上是毫無價值的,因為我們的目的是尋求用少數(shù)幾個公共因子解釋,故略去后面的p-m項的貢獻,有第15頁/共86頁17
上式有一個假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。第16頁/共86頁18注:殘差矩陣其中S為樣本的協(xié)方差矩陣。第17頁/共86頁19
(二)主因子法
主因子方法是對主成分方法的修正,假定我們首先對變量進行標準化變換。則
R=AA’+DR*=AA’=R-D稱R*為約相關(guān)矩陣,R*對角線上的元素是,而不是1。第18頁/共86頁20直接求R*的前p個特征根和對應(yīng)的正交特征向量。得如下的矩陣:第19頁/共86頁21
當特殊因子的方差不為且已知的,問題非常好解決。第20頁/共86頁22第21頁/共86頁23
在實際的應(yīng)用中,個性方差矩陣一般都是未知的,可以通過一組樣本來估計。估計的方法有如下幾種:
首先,求的初始估計值,構(gòu)造出
1)取,在這個情況下主因子解與主成分解等價;
2)取,為xi與其他所有的原始變量xj的復(fù)相關(guān)系數(shù)的平方,即xi對其余的p-1個xj的回歸方程的判定系數(shù),這是因為xi
與公共因子的關(guān)系是通過其余的p-1個xj
的線性組合聯(lián)系起來的;第22頁/共86頁242)取,這意味著取xi與其余的xj的簡單相關(guān)系數(shù)的絕對值最大者;4)取,其中要求該值為正數(shù)。5)取,其中是的對角元素。第23頁/共86頁25
(三)極大似然估計法(略)
如果假定公共因子F和特殊因子服從正態(tài)分布,那么可以得到因子載荷和特殊因子方差的極大似然估計。設(shè)為來自正態(tài)總體Np(,)的隨機樣本。
第24頁/共86頁26
它通過依賴和。上式并不能唯一確定,為此可添加一個唯一性條件:
這里式一個對角矩陣,用數(shù)值極大化的方法可以得到極大似然估計。極大似然估計將使為對角陣,且似然函數(shù)達到最大。相應(yīng)的共同度的似然估計為:第J個因子對總方差的貢獻:第25頁/共86頁27
例假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主成分分析法求因子分析模型。第26頁/共86頁28
特征根為:第27頁/共86頁29
可取前兩個因子F1和F2為公共因子,第一公因子F1物價就業(yè)因子,對X的貢獻為1.55。第一公因子F2為投資因子,對X的貢獻為0.85。共同度分別為1,0.706,0.706。第28頁/共86頁30
假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關(guān)系數(shù)矩陣為試用主因子分析法求因子分析模型。假定用代替初始的。。第29頁/共86頁31
特征根為:
對應(yīng)的非零特征向量為:第30頁/共86頁32第31頁/共86頁33
§4因子旋轉(zhuǎn)(正交變換)
建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對變量進行分組,更重要的要知道每個公共因子的意義,以便進行進一步的分析,如果每個公共因子的含義不清,則不便于進行實際背景的解釋。由于因子載荷陣是不惟一的,所以應(yīng)該對因子載荷陣進行旋轉(zhuǎn)。目的是使因子載荷陣的結(jié)構(gòu)簡化,使載荷矩陣每列或行的元素平方值向0和1兩極分化。有三種主要的正交旋轉(zhuǎn)法。四次方最大法、方差最大法和等量最大法。(一)為什么要旋轉(zhuǎn)因子第32頁/共86頁34
百米跑成績跳遠成績鉛球成績跳高成績
400米跑成績百米跨欄鐵餅成績撐桿跳遠成績標槍成績
1500米跑成績
奧運會十項全能運動項目得分數(shù)據(jù)的因子分析
第33頁/共86頁35第34頁/共86頁36
因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運動因子。其他的3個因子不太容易解釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉(zhuǎn)因子,得下表
第35頁/共86頁37第36頁/共86頁38
通過旋轉(zhuǎn),因子有了較為明確的含義。百米跑,跳遠和400米跑,需要爆發(fā)力的項目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠,跳遠和為跳高在上有較大的載荷,爆發(fā)腿力因子;長跑耐力因子。第37頁/共86頁39變換后因子的共同度設(shè)正交矩陣,做正交變換變換后因子的共同度沒有發(fā)生變化?。ǘ┬D(zhuǎn)方法第38頁/共86頁40變換后因子貢獻設(shè)正交矩陣,做正交變換變換后因子的貢獻發(fā)生了變化!第39頁/共86頁411、方差最大法
方差最大法從簡化因子載荷矩陣的每一列出發(fā),使和每個因子有關(guān)的載荷的平方的方差最大。當只有少數(shù)幾個變量在某個因子上又較高的載荷時,對因子的解釋最簡單。方差最大的直觀意義是希望通過因子旋轉(zhuǎn)后,使每個因子上的載荷盡量拉開距離,一部分的載荷趨于1,另一部分趨于0。第40頁/共86頁42第41頁/共86頁43第42頁/共86頁44第43頁/共86頁451、四次方最大旋轉(zhuǎn)
四次方最大旋轉(zhuǎn)是從簡化載荷矩陣的行出發(fā),通過旋轉(zhuǎn)初始因子,使每個變量只在一個因子上又較高的載荷,而在其它的因子上盡可能低的載荷。如果每個變量只在一個因子上又非零的載荷,這是的因子解釋是最簡單的。四次方最大法通過使因子載荷矩陣中每一行的因子載荷平方的方差達到最大。第44頁/共86頁46第45頁/共86頁47
3、等量最大法
等量最大法把四次方最大法和方差最大法結(jié)合起來求Q和V的加權(quán)平均最大。
權(quán)數(shù)等于m/2,因子數(shù)有關(guān)。第46頁/共86頁48
§5因子得分
(一)因子得分的概念
前面我們主要解決了用公共因子的線性組合來表示一組觀測變量的有關(guān)問題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來做回歸分析,對樣本進行分類或評價,這就需要我們對公共因子進行測度,即給出公共因子的值。第47頁/共86頁49
人均要素變量因子分析。對我國32個省市自治區(qū)的要素狀況作因子分析。指標體系中有如下指標:X1:人口(萬人)X2:面積(萬平方公里)X3:GDP(億元)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有科學(xué)家、工程師數(shù)(人)RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.07246第48頁/共86頁50
高載荷指標
因子命名
因子1X2;面積(萬平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子
因子2X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有的科學(xué)家、工程師數(shù)(人)
人力資源因子
因子3
X1;人口(萬人)X3:GDP(億元)經(jīng)濟發(fā)展總量因子
X1=-0.21522F1-0.27397F2+0.89092F3X2=0.63973F1-0.28739F2-0.28755F3X3=-0.15791F1+0.06334F2+0.94855F3X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F3第49頁/共86頁51StandardizedScoringCoefficients
FACTOR1
FACTOR2
FACTOR3X10.05764
-0.06098
0.50391X20.22724
-0.09901
-0.07713X30.14635
0.12957
0.59715X40.47920
0.11228
0.17062X50.45583
0.07419
0.10129X60.05416
0.48629
0.04099X70.05790
0.48562
0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7第50頁/共86頁52REGIONFACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個因子得分第51頁/共86頁53
因子分析的數(shù)學(xué)模型為:
原變量被表示為公共因子的線性組合,當載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過來把公共因子表示為原變量的線性組合。
因子得分函數(shù):可見,要求得每個因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過估計。第52頁/共86頁541、巴特萊特因子得分(加權(quán)最小二乘法)
把看作因變量;把因子載荷矩陣看成自變量的觀測;把某個個案的得分看著最小二乘法需要求的系數(shù)。1)巴特萊特因子得分計算方法的思想第53頁/共86頁55由于特殊因子的方差相異,所以用加權(quán)最小二乘法求得分,每個各案作一次,要求出所有樣品的得分,需要作n次。第54頁/共86頁56
用矩陣表達:滿足上式的F是相應(yīng)個案的因子得分。第55頁/共86頁57第56頁/共86頁582)得分估計的無偏性如果將f和不相關(guān)的假定加強為相互獨立,則第57頁/共86頁593)第58頁/共86頁602、回歸方法
1)思想第59頁/共86頁61
則,我們有如下的方程組:第60頁/共86頁62j=1,2,…,m第61頁/共86頁63
注:共需要解m次才能解出所有的得分函數(shù)的系數(shù)。第62頁/共86頁64矩陣表示方法
在因子模型中,假設(shè)服從(m+p)元的正態(tài)分布,有第63頁/共86頁65第64頁/共86頁66第65頁/共86頁672)估計的有偏性3)平均預(yù)報誤差第66頁/共86頁68國民生活質(zhì)量的因素分析國家發(fā)展的最終目標,是為了全面提高全體國民的生活質(zhì)量,滿足廣大國民日益增長的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費的統(tǒng)一理念下,增加社會財富,創(chuàng)自更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進化的基礎(chǔ)上,維系人類與自然的平衡,達到完整的代際公平和區(qū)際公平(即時間過程的最大合理性與空間分布的最大合理化)。從1990年開始,聯(lián)合國開發(fā)計劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標對于國民生活質(zhì)量進行測度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標組合,即人的健康狀況(使用出生時的人均預(yù)期壽命表達)、人的智力程度(使用組合的教育成就表達)、人的福利水平(使用人均國民收入或人均GDP表達),并且特別強調(diào)三類指標組合的整體表達內(nèi)涵,去衡量一個國家或地區(qū)的社會發(fā)展總體狀況以及國民生活質(zhì)量的總水平。第67頁/共86頁69在這個指標體系中有如下的指標:X1——預(yù)期壽命X2——成人識字率X3——綜合入學(xué)率X4——人均GDP(美圓)X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)第68頁/共86頁70
旋轉(zhuǎn)后的因子結(jié)構(gòu)
RotatedFactorPatternFACTOR1FACTOR2FACTOR3X10.381290.417650.81714X20.121660.848280.45981X30.648030.618220.22398X40.904100.205310.34100X50.388540.432950.80848X60.282070.853250.43289X70.900910.206120.35052
FACTOR1為經(jīng)濟發(fā)展因子
FACTOR2為教育成就因子
FACTOR3為健康水平因子第69頁/共86頁71
被每個因子解釋的方差和共同度
VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR32.4397002.2763172.009490FinalCommunalityEstimates:Total=6.725507X1X2X3X4X50.9875300.9457960.8523060.9758300.992050
X6X70.9949950.976999
第70頁/共86頁72StandardizedScoringCoefficients標準化得分系數(shù)
FACTOR1FACTOR2FACTOR3X1-0.18875-0.343970.85077X2-0.241090.60335-0.10234X30.354620.50232-0.59895X40.53990-0.17336-0.10355X5-0.17918-0.316040.81490X6-0.092300.62258-0.24876第71頁/共86頁73生育率的影響因素分析
生育率受社會、經(jīng)濟、文化、計劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨立的,而是交織在一起,如果直接用選定的變量對生育率進行多元回歸分析,最終結(jié)果往往只能保留兩三個變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對生育率進行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個省、自治區(qū)、直轄市的數(shù)據(jù)。第72頁/共86頁74第73頁/共86頁75EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201
1.0000特征根與各因子的貢獻第74頁/共86頁76
Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962沒有旋轉(zhuǎn)的因子結(jié)構(gòu)第75頁/共86頁77Factor1可解釋方差Factor2可解釋方差2.99754292.1642615各旋轉(zhuǎn)后的共同度0.884540230.911439980.859770610.877894530.93006369第76頁/共86頁78
在這個例子中我們得到了兩個因子,第一個因子是社會經(jīng)濟發(fā)展水平因子,第二個是計劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進行其他的統(tǒng)計分析。
Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728
Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu)標準化得分函數(shù)第77頁/共86頁79§6因子分析的步驟、展望和建議
計算所選原始變量的相關(guān)系數(shù)矩陣
相關(guān)系數(shù)矩陣描述了原始變量之間的相關(guān)關(guān)系??梢詭椭袛嘣甲兞恐g是否存在相關(guān)關(guān)系,這對因子分析是非常重要的,因為如果所選變量之間無關(guān)系,做因子分析是不恰當?shù)?。并且相關(guān)系數(shù)矩陣是估計因子結(jié)構(gòu)的基礎(chǔ)。
選擇分析的變量用定性分析和定量分析的方法選擇變量,因子分析的前提條件是觀測變量間有較強的相關(guān)性,因為如果變量之間無相關(guān)性或相關(guān)性較小的話,他們不會有共享因子,所以原始變量間應(yīng)該有較強的相關(guān)性。一、因子分析通常包括以下五個步驟第78頁/共86頁80
提取公共因子
這一步要確定因子求解的方法和因子的個數(shù)。需要根據(jù)研究者的設(shè)計方案或有關(guān)的經(jīng)驗或知識事先確定。因子個數(shù)的確定可以根據(jù)因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因為方差小于1的因子其貢獻可能很小;按照因子
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit 1 Knowing me,knowing you Listening and speaking 說課稿-2023-2024學(xué)年高一英語外研版(2019)必修第三冊
- Unit2 What is your hobby?Lesson 7(說課稿)-2024-2025學(xué)年人教精通版英語六年級上冊001
- 2025合同模板股東協(xié)議 范本
- 25《憶讀書》說課稿-2024-2025學(xué)年五年級上冊語文統(tǒng)編版
- 8空氣和我們的生活 說課稿-2024-2025學(xué)年科學(xué)三年級上冊教科版
- 遼寧新風(fēng)系統(tǒng)施工方案
- 8 網(wǎng)絡(luò)新世界說課稿-2024-2025學(xué)年道德與法治四年級上冊統(tǒng)編版
- 高空連廊除銹刷漆施工方案
- Unit 3 Asking the way(說課稿)-2023-2024學(xué)年譯林版(三起)英語五年級下冊
- 修理廠與公司車合同范例
- 2025年中國高價HPV疫苗行業(yè)競爭格局分析及投資規(guī)劃研究報告
- 2025年春新北師大版物理八年級下冊課件 第七章 運動和力 第四節(jié) 同一直線上二力的合成
- 《肝硬化的臨床表現(xiàn)》課件
- 新增值稅法學(xué)習(xí)課件
- 飛書項目管理
- 醫(yī)院醫(yī)共體2025年度工作計劃
- 決戰(zhàn)朝鮮課件
- 《酶聯(lián)免疫分析技術(shù)》課件
- 鮮棗貯藏技術(shù)規(guī)程
- DB23T 3838-2024商貿(mào)行業(yè)有限空間個體防護裝備配備規(guī)范
- 2024年循環(huán)水操作工(中級)職業(yè)鑒定理論考試題庫((含答案))
評論
0/150
提交評論