![多元統(tǒng)計-因子_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/21/e62b7736-867f-43c7-9314-8c7b7604f526/e62b7736-867f-43c7-9314-8c7b7604f5261.gif)
![多元統(tǒng)計-因子_第2頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/21/e62b7736-867f-43c7-9314-8c7b7604f526/e62b7736-867f-43c7-9314-8c7b7604f5262.gif)
![多元統(tǒng)計-因子_第3頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/21/e62b7736-867f-43c7-9314-8c7b7604f526/e62b7736-867f-43c7-9314-8c7b7604f5263.gif)
![多元統(tǒng)計-因子_第4頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/21/e62b7736-867f-43c7-9314-8c7b7604f526/e62b7736-867f-43c7-9314-8c7b7604f5264.gif)
![多元統(tǒng)計-因子_第5頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/21/e62b7736-867f-43c7-9314-8c7b7604f526/e62b7736-867f-43c7-9314-8c7b7604f5265.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析返回返回3.1.1 3.1.1 引引 例例3.1.2 3.1.2 因子分析的基本思想因子分析的基本思想3.1.3 3.1.3 與主成分分析的區(qū)別與主成分分析的區(qū)別2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析百貨商場的形象。,并解釋分析,變量來描述原始可測的相關(guān)和一個特殊因子也稱為潛因子),的公共因子個不可觀測的相互獨立用這pimimimiiiFFFaFaFampi112211(), 1( 3.1.1 引 例2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)
2、院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.1.2 因子分析的基本思想 因子分析(factor analysis)是一種數(shù)據(jù)簡化的技術(shù)。它是通過尋找眾多變量的公共因素來簡化變量中存在的復(fù)雜關(guān)系的一種方法。它將多個變量綜合為少數(shù)幾個“因子”(假想變量),以再現(xiàn)原始變量與“因子”之間的相互關(guān)系。這幾個因子能夠反映原來眾多變量的主要信息。原始的變量是可觀測的顯在變量,而因子是不可觀測的潛在變量。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 通過因子分析得來的新變量是對每一個原始變量進行內(nèi)
3、部剖析,打比喻來說,原始變量就如成千上萬的糕點,每一種糕點的原料都有面粉、油、糖及相應(yīng)的不同原料,這其中,面粉、油、糖是所有糕點的共同材料,正如因子分析中的新變量即因子變量, 正確選擇因子變量后,如果想考慮成千上萬糕點的物價變動,只需重點考慮面粉、油、糖等共因子的物價變動即可。 3.1.2 因子分析的基本思想 所以因子分析不是對原始變量的重新組合,而是對原始變量進行分解,分解為公共因子與特殊因子兩部分。即因子分析就是要利用少數(shù)幾個公共因子去解釋較多個要觀測變量中存在的復(fù)雜關(guān)系,它把原始變量分解為兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個公共因子構(gòu)成的,另一部分是每個原始變量獨自具有的因素
4、,即特殊因子。 2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.1.2 因子分析的基本思想 因子分析分為兩類,即R型因子分析(對變量作因子分析),Q型因子分析(對樣品作因子分析)。這兩種因子分析的處理方法一樣,只是出發(fā)點不同, R型從變量的相關(guān)陣出發(fā), Q型從樣品相似陣出發(fā)。 對一批觀測數(shù)據(jù),可以根據(jù)實際問題的要求來決定采用哪一種類型的因子分析。本章主要介紹R型因子分析。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 因子分析(Factor Ana
5、lysis)是主成分分析的推廣,它也是利用降維的思想,從研究原始變量相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個綜合變量(因子)的一種多變量統(tǒng)計分析方法。 相對于主成分分析,因子分析更傾向于描述原始變量之間的相關(guān)關(guān)系;因此,因子分析的出發(fā)點是原始變量的相關(guān)矩陣。 3.1.2 因子分析的基本思想2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 主成分分析分析與因子分析不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。 主成分分析:原始變量的線性組合表示新的綜合變量,即主成分; 因子分析:潛在
6、的假想變量和隨機影響變量的線性組合表示原始變量。3.1.3 與主成分分析的區(qū)別2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 因子分析與主成分分析的區(qū)別因子分析與主成分分析的區(qū)別(參見主成分分析與因子分析的異同比較及應(yīng)用): 1、主成分分析不能作為一個模型來描述,它只是通常的變量變換;而因子分析需要構(gòu)造因子模型。 2、主成分分析中主成分的個數(shù)和變量的個數(shù)P相同,它是將一組具有相關(guān)性的變量變換為一組獨立的變量(注意應(yīng)用主成分分析解決實際問題時,一般只選取前m(mp)個主成分;而因子分析的目的是要用盡可能少的公因子,以便構(gòu)造一
7、個結(jié)構(gòu)簡單的因子模型。 3、主成分分析是將主成分表示為可觀測的原變量的線性組合;而因子分析是將原始變量表示為公因子和特殊因子的線性組合。 另一方面,這兩種分析方法之間在某些情況下也有一定聯(lián)系,我們將從下面的介紹中看到。3.1.3 與主成分分析的區(qū)別2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析3.1.3 與主成分分析的區(qū)別 因子分析與回歸分析不同,因子分析中的因子是一個比較抽象的概念,而回歸因子有非常明確的實際意義。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多
8、元統(tǒng)計分析 3.1.2 因子分析的基本思想這些綜合指標稱為因子變量,是原變量的重新組構(gòu);個數(shù)遠遠少于原變量個數(shù),但可反映原變量的絕大部分方差;不相關(guān)性,對因子變量的分析能夠為研究工作提供較大的便利;因子變量具有可命名解釋性;2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 因子分析把每個原始變量分解成兩個部分:一部分是由所有變量共同具有的少數(shù)幾個因子構(gòu)成的,即所謂公共因素部分;另一部分是每個變量獨自具有的因素,即所謂獨特因素部分。 設(shè) 為觀察到的隨機向量, 是不可觀測的向量(m應(yīng)小于p)。于是:),(21mFFFF 3.2.
9、1 初始因子模型(R型)p,212007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析相等。與相關(guān)陣且協(xié)方差陣,協(xié)方差矩陣)(均值向量是可觀測隨機變量,且、REp,)cov(0,121)。,且方差皆為是相互獨立的(不相關(guān)各分量即向量,協(xié)方差矩陣)(值向量均是不可觀測的變量,其,、1,)cov(0,221FIFFEpmFFFFm 3.2.1 初始因子模型(R型)則模型:獨立的,的各分量之間也是相互是對角陣,說明的協(xié)方差陣,)(且相互獨立,與,、0, 0),cov(321EFFp2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一
10、下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 因子模型的一般表達形式:Xi=ai1F1+ai2F2+aimFm+ i( i=1, ,p)pmpm2p21p1p2m2m22212121m1m2121111FaFaFaxFaFaFaxFaFaFax 3.2.1 初始因子模型(R型)2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 也可以矩陣的形式表示為:X=AF+ 式中Xi(i=1,2,m)和Fj(j=1,2,p)都是標準化變量。 pmpmppmmpFFFaaaaaaaaa212121222211121121
11、3.2.1 初始因子模型(R型)或:2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析aaaaaaaaapmppmm212222111211pmpFFF,111,其中系數(shù)矩陣。是待估的pmpmppmmpFFFaaaaaaaaa2121212222111211212007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 1、因子模型中F l,F(xiàn) 2,F(xiàn) m叫做因子變量或公(共)因子(潛因子)(Common factors),它們是在各個原觀測變量 Xi 的表達式中共同
12、出現(xiàn)的因子(是各個原觀測變量所共有的因子)。 可理解為原始變量共同具有的公共因素,每個公因子 Fj (j=1, ,m)假定至少對兩個原始變量有作用(有貢獻),否則它將歸入特殊因子。 3.2.2 因子分析的幾個相關(guān)概念2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 公因子是相互獨立的不可觀測的理論變量(之所以稱其為因子,是因為它是不可觀測的,即不是具體的變量,與聚類分析不同)。公共因子的含義,必須結(jié)合具體問題的實際意義而定。 3.2.2 因子分析的幾個相關(guān)概念2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專
13、業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.2.2 因子分析的幾個相關(guān)概念 2、 (i=1,2,p)叫做特殊因子(Unique factor),是向量X的分量 Xi (i=1,,P)所特有的因子。i 每個特殊因子 僅僅出現(xiàn)在與之相應(yīng)的第 i 個原始變量Xi 的表達式中,它只對這個原始變量有作用,表示該變量不能被公因子所解釋的部分。相當于回歸分析中的殘差項。i2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.2.2 因子分析的幾個相關(guān)概念 3、模型中的矩陣A=(aij)中的元素aij稱為因子載荷(factor
14、 loadings),它是第i個變量在第j個公因子上的負載(或者叫做第i個變量在第j個主因子上的權(quán)) ,在各公共因子不相關(guān)的前提下,因子載荷aij就是第 i 個原有變量與第 j 個公共因子的相關(guān)系數(shù)。 AFEFFAEFAFEFEFEFEEF)()()()()()(),cov(aFxijjijijiFxFxr),cov()var()var(),cov( 因子載荷aij表示 Xi 依賴 Fj 的程度(比重)(心理學(xué)家將它稱為載荷) ,反映了第i 個原有變量在第 j 個公共因子上的相對重要性。因此, aij 的絕對值越大,則公共因子Fj 與原有變量Xi 的關(guān)系越強。或稱公共因子Fj 對于Xi 的載荷
15、量大,矩陣A稱為因子載荷矩陣。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 例:五個觀測變量,兩個公因子的模型: X1=0.9562F1+0.2012F2+0.2126 1 X2=0.8735F1+0.2896F2+0.3913 2 X3=0.1744F1+0.8972F2+0.40573 X4=0.5675F1+0.7586F2+0.32024 X5=0.8562F1+0.3315F2+0.39625 可看出,公因子F1與變量 X1,X2,X4,X5關(guān)系密切,它主要代表了這些變量的信息;公因子 F2 與變量 X3,X4
16、 關(guān)系密切,它主要代表了這兩個變量的信息。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 變量的方差由兩部分組成,一部分由公因子決定,一部分由特殊因子決定。), 1(), 1()()()()()(22122122222122221212211pipiVVarVarVarVariiiimjijimiimiiimimiiiimimiiihahFFaaaFaFaFaFaFaFa于是令相互獨立),因 3.2.2 因子分析的幾個相關(guān)概念 Xi標準化后 2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)
17、專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析aaaaaaaaapmppmm212222111211 h12=a112+a122+a1m2 h22=a212+a222+a2m2 hp2=ap12+ap22+apm2mjijiah122 3.2.2 因子分析的幾個相關(guān)概念2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 A的行元素平方和(因子載荷陣中第 i行元素的平方和)。反映了 Xi 對公共因子的共同依賴程度,它的意義在于說明如果用公因子替代原觀測變量后,原來每個變量的信息被保留的程度。故被稱為變量 Xi 的共同度。 3.2.2 因子
18、分析的幾個相關(guān)概念2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 公因子方差 表示了變量方差中能被公因子所解釋的部分(即反映了全部公因子對變量Xi 的影響,是全部公因子對Xi 的方差所做出的貢獻公因子對變量Xi 的方差貢獻),公因子方差越大,變量能被公因子說明的程度越高( 越接近1,說明公共因子已經(jīng)解釋說明了原有變量 Xi 的幾乎全部信息)。hi2hi2 3.2.2 因子分析的幾個相關(guān)概念2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.2.2 因子
19、分析的幾個相關(guān)概念 特殊因子的方差,反映了原有變量方差中無法被公共因子描述的比例。僅與變量 Xi 本身的變化有關(guān)。 2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 對于上面所舉的五個觀測變量、兩個公因子的例子,計算出每個變量的公因子方差, =0.9548,表明 F1和F2 兩 個因子解釋了變量 X1 信息量的95.48%。h21 3.2.2 因子分析的幾個相關(guān)概念2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.2.2 因子分析的幾個相關(guān)概念 因子載
20、荷矩陣A中第 j 列各元素的平方和,表示第j個公共因子 Fj 對于 X 諸分量 Xi 所提供的方差的總和。稱第j個公共因子的方差貢獻。是衡量公共因子相對重要性的指標。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 S21=a112+a212+ap12 S 22=a122+a222+ap22 S2m=a1m2+a2m2+apm2aaaaaaaaapmppmm212222111211 3.2.2 因子分析的幾個相關(guān)概念 每個公因子對原始數(shù)據(jù)的解釋能力,用該因子所解釋的總方差(稱為該因子的貢獻)來衡量,公因子 的貢獻等于和該因子
21、有關(guān)的因子載荷量的平方和。piijjas122(j=1, ,m)si22007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析的估計。載荷矩陣解決此問題,關(guān)鍵是求因子。要,提煉出最有影響的公我們就能夠以此為依據(jù)序,來,使相應(yīng)的貢獻有順的各列平方和都計算出愈大。如果把載荷矩陣的貢獻對愈大,恰好相反,的共同度的統(tǒng)計意義與,22221222sssFshsmjjiij 3.2.2 因子分析的幾個相關(guān)概念2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院miiaS12121miiaS12222 miippaS122ijijpjjmiiash21212
22、mSp211mSp222mSppp2 pjjmSp12pjmjmpjjpjjiahahah122122221212因子負荷矩陣的一般格式休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析3.3.1 3.3.1 因子載荷的求解因子載荷的求解3.3.2 3.3.2 求主因子解的步驟求主因子解的步驟2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 要建立某實際問題的因子分析模型,關(guān)鍵是要根據(jù)樣本數(shù)據(jù)矩陣估計載荷矩陣A(即求解初始因子主要目的是確定能夠解釋觀測變量之間相互關(guān)系的最小因子個數(shù))。根據(jù)所依據(jù)的準
23、則不同,有很多種求因子解的方法。其中使用最為普遍的方法是主成分法。 3.3.1 因子載荷的求解2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析設(shè)隨機向量的協(xié)差陣為。為的特征根,標準正交化特征向量(只要特征根不等,對應(yīng)的單位特征向量一定是正交的),則根據(jù)線性代數(shù)知識分解為:為對應(yīng)的 3.3.1 因子載荷的求解,21puuu2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析pppppiiiiPuuuuuuUUuu2211221111, 00 , 上面的分解式恰是
24、公共因子與變量個數(shù)一樣多且特殊因子的方差為0時,因子模型中協(xié)差陣的結(jié)構(gòu)。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析因為這時因子模型為:其中,所以:即對照的分解式,則因子載荷陣A的第列應(yīng)該是也就是說除常數(shù):外,第列 因子載荷恰是第成分個主的系數(shù),故稱為主成分法。 3.3.1 因子載荷的求解ujjuj2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 上邊給出的表達式是精確的,但實際應(yīng)用時總是希望公共因子個數(shù)小于變量的個數(shù)即 mp ,當最后pm個特征根較小
25、時,通常是略去最后pm項對的貢獻,于是得到: 3.3.1 因子載荷的求解ppmmuu,112007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 上式是假定了因子模型中特殊因子是不重要的,因而從的分解中忽略掉特殊因子的方差。如果考慮了特殊因子以后,協(xié)差陣為: 3.3.1 因子載荷的求解mmmmuuuuuu221122112007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 當未知,可用樣本協(xié)差陣S去代替,要經(jīng)過標準化處理,則S與相關(guān)陣R相同,仍然可作上面類似的表示。
26、 3.3.1 因子載荷的求解22122112211, 00 ,Pmmmmuuuuuu2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析則因子載荷陣的估計為:一般設(shè)為樣本相關(guān)陣R的特征根,相應(yīng)的標準正交化特征向量為;設(shè) m p,即 3.3.1 因子載荷的求解,21puuuuuumm,22112007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 AFiFaaaaaaaaapppppp212222111211=pppppppppuuuuuuuuu22112222121
27、1212111 當公共因子 有P個時,特殊因子為0,所以, A為因子載荷陣。 設(shè)隨機向量 的協(xié)方差為 , 的特征值為 ,其相應(yīng)的特征向量為 (標準正交基) 則因子載荷矩陣: ),(, 1pxxX021p,21puuu2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 aaaaaaaaapmppmm212222111211=mpmppmmmmuuuuuuuuu221122221211212111 因為因子載荷矩陣A是前m個主成分系數(shù)的倍數(shù),所以稱為主成分解。 由于因子分析的目的是減少變量個數(shù),因此,在計算因子載荷矩陣時,一般不選
28、取所有特征值,而只選取前m個特征值和對應(yīng)的特征向量,得到下面的有m個公共變量的因子載荷矩陣:2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 另外,當 未知時,用樣本協(xié)方差S 代替 ,或樣本相關(guān)陣R 代替 。一般設(shè) 為樣本相關(guān)陣R 的特征根,相應(yīng)的標準正交化特征向量為 。設(shè) ,則因子載荷陣的估計為 ,即p1 uup,1pm )(ijaA ),(11mmuuA2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.4.1 因子旋轉(zhuǎn) 建立因子分析數(shù)學(xué)模型的目的不
29、僅是為了找出公共因子,更重要的是要知道每個公共因子的意義,到底代表了什么?為此就要考察各個變量 X1,X2,XP 在某個因子上的負荷,負荷絕對值大的變量顯然與該因子的聯(lián)系就更密切,可是如果因子負荷的大小相差不大,對因子的解釋可能就有困難。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 為了能更清楚地將因子與變量的關(guān)系顯現(xiàn),希望通過某種手段使每個變量在盡可能少的因子上有比較高的載荷,即:在理想狀態(tài)下,讓某個變量在某個因子上的載荷趨于1,而在其他因子上的載荷趨于0。解釋因子時,這些小的載荷一般可以略去不計。 3.4.1 因子旋
30、轉(zhuǎn)2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 實現(xiàn)上述目標的方法是對初始公因子進行線性組合,即根據(jù)因子載荷陣的不唯一性,對因子載荷陣實行旋轉(zhuǎn),目的是通過改變坐標軸的位置,重新分配各個因子所解釋的方差的比例,使因子結(jié)構(gòu)更簡單,更易于解釋,以期找到意義更為明確,實際意義更明顯的公因子。 3.4.1 因子旋轉(zhuǎn) 簡單的因子結(jié)構(gòu)要求: 每一列上的載荷大部分為很小的盡可能接近0的值; 每一行中只有少量的最好只有一個較大的載荷值; 每兩列中大載荷與小載荷的排列模式應(yīng)該不同。這種變換因子載荷的方法稱為因子旋轉(zhuǎn)。 2007.8安徽財經(jīng)大
31、學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析F1F1F2F2X1X2X3X4X5X6 簡單結(jié)構(gòu) 示意圖 因子旋轉(zhuǎn)有方差最大正交旋轉(zhuǎn)和斜交旋轉(zhuǎn),應(yīng)用最為普遍的是方差最大正交旋轉(zhuǎn)。兩因子的方差最大正交旋轉(zhuǎn):2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析2112112121121112112122211211cossinsincoscossinsincoscossinsincosppppppppbbbbaaaaaaaaACBCaaaaaaA2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)
32、學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 這樣做的目的是希望所得結(jié)果能使載荷矩陣的每一列元素盡可能向1和0兩極分化,即原始變量中一部分主要與第一因子有關(guān),另一部分主要與第二因子有關(guān),也就是要求 這兩組的方差盡量大。 bbbbpp2221221211, 3.4.1 因子旋轉(zhuǎn) 旋轉(zhuǎn)后變量共同度沒有改變,但公共因子的方差貢獻發(fā)生了變化。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.4.2 因子得分 因子分析的數(shù)學(xué)模型是將變量表示為公共因子的線性組合,由于公共因子能反映原始變量的相關(guān)關(guān)
33、系,用公共因子代表原始變量時有時更有利于描述研究對象的特征,因而往往需要反過來將公共因子表示為變量的線性組合,即因子得分函數(shù),用它來計算每個樣本的公共因子得分。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 其實,在因子模型建立起來后,我們應(yīng)當反過來考察每一個樣本。例如企業(yè)經(jīng)濟效益的因子模型建立之后,我們希望知道每個企業(yè)經(jīng)濟效益的優(yōu)劣,把諸企業(yè)劃分歸類,如哪些企業(yè)是優(yōu)等,哪些企業(yè)是中等,哪些又是差等。要解決這個問題,在統(tǒng)計模型上就需要將公共因子F用變量的線性組合來表示,也即由企業(yè)經(jīng)濟效益的八項指標值來估計它的因子得分。 3
34、.4.2 因子得分2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 設(shè)公共因子F由變量x表示的線性組合為:pmpmmmppppxbxbxbFxbxbxbFxbxbxbF22112222121212121111 稱上式為因子得分函數(shù),用它可計算每個樣本的公因子得分。如果取m=2,則將每個樣品的P個變量代入上式,即可算出每個樣品的因子得分F1和F2 ,這樣就可以在二維平面上作出因子得分的散點圖,進而對樣品進行分類或?qū)栴}做更深入的研究。 3.4.2 因子得分2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干
35、課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析 3.4.2 因子得分 以每個因子的方差貢獻率為權(quán)數(shù),進行加權(quán)綜合,計算出每個因子的總得分,以此排隊。的方差貢獻率的方差貢獻率的方差貢獻率總得分FFmmFFFF2211 因子得分多用于對樣本及變量的分類,也可用于綜合評價。2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析因子分析常常有以下四個基本步驟: (1)確認待分析的原有變量是否適合作因子分析。 (2)構(gòu)造因子變量(求解初始因子)。 (3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性。 (4)計算因子變量得分。 3.5.1 計算步驟2007.8安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計學(xué)專業(yè)主干課程統(tǒng)計學(xué)專業(yè)主干課程多元統(tǒng)計分析多元統(tǒng)計分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度健身中心會員卡積分兌換實物獎品合同
- 2025年工業(yè)園區(qū)廢棄物處理與資源化利用服務(wù)合同
- 2025年度數(shù)字經(jīng)濟產(chǎn)業(yè)納稅擔保協(xié)議
- 2025年度生物制藥研發(fā)合同補充協(xié)議
- 二零二五年度跨國公司分支機構(gòu)設(shè)立合同標準
- 2025年度美容儀器產(chǎn)品認證及檢測服務(wù)合同
- 2025年度綠色能源項目合作環(huán)境保護協(xié)議書范本
- 2025年度國際貿(mào)易慣例操作手冊合同范本-@-1
- 2025年度貨架子采購合同范本包含節(jié)能環(huán)保標準
- 2025年度斷橋鋁門窗產(chǎn)品設(shè)計與創(chuàng)新合作協(xié)議
- SolidWorks培訓(xùn)課件完整版
- 各期前列腺癌治療的指南推薦
- 壓力管理與情緒應(yīng)對培訓(xùn)課件
- 提高預(yù)埋螺栓安裝一次驗收合格率五項qc2012地腳
- 六年級譯林版小學(xué)英語閱讀理解訓(xùn)練經(jīng)典題目(附答案)
- GB/T 12332-2008金屬覆蓋層工程用鎳電鍍層
- 建設(shè)工程項目管理(課件)
- CQJTG∕T D09-2021 重慶市高速公路特殊路段交通安全設(shè)施設(shè)計指南
- 東洋(TOYO)VF64C系列變頻器中文說明書
- 狄更斯與《圣誕頌歌》課件
- 康復(fù)科院感工作年度總結(jié)
評論
0/150
提交評論