主成分分析和因子分析ppt課件_第1頁
主成分分析和因子分析ppt課件_第2頁
主成分分析和因子分析ppt課件_第3頁
主成分分析和因子分析ppt課件_第4頁
主成分分析和因子分析ppt課件_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1 在建立多元回歸模型時,為了更準確地反映事物的特征,人們經(jīng)常會在模型中包在建立多元回歸模型時,為了更準確地反映事物的特征,人們經(jīng)常會在模型中包含較多相關(guān)解釋變量,這不僅使得問題分析變得復雜,而且變量之間可能存在多重共含較多相關(guān)解釋變量,這不僅使得問題分析變得復雜,而且變量之間可能存在多重共線性,使得數(shù)據(jù)提供的信息發(fā)生重疊,甚至會抹殺事物的真正特征。為了解決這些問線性,使得數(shù)據(jù)提供的信息發(fā)生重疊,甚至會抹殺事物的真正特征。為了解決這些問題,需要采用降維的思想,將所有指標的信息通過少數(shù)幾個指標來反映,在低維空間題,需要采用降維的思想,將所有指標的信息通過少數(shù)幾個指標來反映,在低維空間將信息分解為

2、互不相關(guān)的部分以獲得更有意義的解釋。本章介紹的主成分分析和因子將信息分解為互不相關(guān)的部分以獲得更有意義的解釋。本章介紹的主成分分析和因子分析可用于解決這類問題。分析可用于解決這類問題。 2 主成分分析(主成分分析(principal components analysis,簡稱,簡稱PCA)是由霍特林)是由霍特林(Hotelling)于)于1933年首先提出的。它通過投影的方法,實現(xiàn)數(shù)據(jù)的降維,在損年首先提出的。它通過投影的方法,實現(xiàn)數(shù)據(jù)的降維,在損失較少數(shù)據(jù)信息的基礎(chǔ)上把多個指標轉(zhuǎn)化為幾個有代表意義的綜合指標。失較少數(shù)據(jù)信息的基礎(chǔ)上把多個指標轉(zhuǎn)化為幾個有代表意義的綜合指標。3 假如對某一問題

3、的研究涉及假如對某一問題的研究涉及 p 個指標,記為個指標,記為X1,X2, , Xp,由這,由這 p 個隨機變量構(gòu)成的隨個隨機變量構(gòu)成的隨機向量為機向量為X=(X1, X2, , Xp) ,設(shè),設(shè) X 的均值向量為的均值向量為 ,協(xié)方差矩陣為,協(xié)方差矩陣為 。設(shè)。設(shè)Y=(Y1, Y2 , , Yp) 為為對對 X 進行線性變換得到的合成隨機向量,即進行線性變換得到的合成隨機向量,即 (13.1.1) 設(shè)設(shè) i=( i1, i2 , , ip) ,( ), A=( 1 , 2 , p) ,則有,則有 (13.1.2)ppppppppXXXYYY2121222211121121AXY pi,2,

4、14且且 (13.1.3) 由式(由式(13.1.1)和式()和式(13.1.2)可以看出,可以對原始變量進行任意的線性變換,不同)可以看出,可以對原始變量進行任意的線性變換,不同線性變換得到的合成變量線性變換得到的合成變量Y的統(tǒng)計特征顯然是不一樣的。每個的統(tǒng)計特征顯然是不一樣的。每個Yi 應(yīng)盡可能多地反映應(yīng)盡可能多地反映 p 個原個原始變量的信息,通常用方差來度量始變量的信息,通常用方差來度量“信息信息”,Yi 的方差越大表示它所包含的信息越多。由的方差越大表示它所包含的信息越多。由式(式(13.1.3)可以看出將系數(shù)向量)可以看出將系數(shù)向量 i 擴大任意倍數(shù)會使擴大任意倍數(shù)會使Yi 的方差

5、無限增大,為了消除這種的方差無限增大,為了消除這種不確定性,增加約束條件:不確定性,增加約束條件:pjiYYpiYjijiii,2,1,),cov(,2,1)var(i1iaai5 為了有效地反映原始變量的信息,為了有效地反映原始變量的信息,Y的不同分量包含的信息不應(yīng)重疊。綜上所述,式的不同分量包含的信息不應(yīng)重疊。綜上所述,式(13.1.1)的線性變換需要滿足下面的約束:)的線性變換需要滿足下面的約束: (1) ,即,即 ,i =1, 2, , p。 (2) Y1在滿足約束在滿足約束 (1) 即的情況下,方差最大;即的情況下,方差最大;Y2是在滿足約束是在滿足約束(1) ,且與,且與Y1不相關(guān)

6、的條不相關(guān)的條件下,其方差達到最大;件下,其方差達到最大;Yp是在滿足約束是在滿足約束(1) ,且與,且與Y1,Y2,Y p-1不相關(guān)的條件不相關(guān)的條件下,在各種線性組合中方差達到最大者。下,在各種線性組合中方差達到最大者。 滿足上述約束得到的合成變量滿足上述約束得到的合成變量Y1, Y2, , Yp分別稱為原始變量的第一主成分、第二主成分別稱為原始變量的第一主成分、第二主成分、分、第、第 p 主成分,而且各成分方差在總方差中占的比重依次遞減。在實際研究工作中,主成分,而且各成分方差在總方差中占的比重依次遞減。在實際研究工作中,僅挑選前幾個方差較大的主成分,以達到簡化系統(tǒng)結(jié)構(gòu)的目的。僅挑選前幾

7、個方差較大的主成分,以達到簡化系統(tǒng)結(jié)構(gòu)的目的。122221ipiiaaa1iaai6 13.1.1節(jié)中提到主成分分析的基本思想是考慮合成變量的方差大小及其對原始節(jié)中提到主成分分析的基本思想是考慮合成變量的方差大小及其對原始變量波動變量波動(方差方差)的貢獻大小,而對于原始隨機變量的貢獻大小,而對于原始隨機變量X1,X2,Xp,其協(xié)方差矩陣,其協(xié)方差矩陣或相關(guān)矩陣正是對各變量離散程度和相關(guān)程度的度量。在實際求解主成分時,一或相關(guān)矩陣正是對各變量離散程度和相關(guān)程度的度量。在實際求解主成分時,一般從原始變量的協(xié)方差矩陣或相關(guān)矩陣的結(jié)構(gòu)分析出發(fā)。般從原始變量的協(xié)方差矩陣或相關(guān)矩陣的結(jié)構(gòu)分析出發(fā)。7 設(shè)

8、設(shè) 1是任意是任意 p 1向量,求解主成份就是在約束條件向量,求解主成份就是在約束條件 下,求下,求 X 的線性函數(shù)的線性函數(shù) 使其使其方差方差 達到最大,即達到最大,且達到最大,即達到最大,且 ,其中,其中 是隨機變量向量是隨機變量向量X =(X1, X2, , Xp) 的協(xié)方差矩陣。設(shè)的協(xié)方差矩陣。設(shè) 1 2 p 0 為為 的特征值,的特征值,e1 , e2 , ep為為 矩陣各特征值對應(yīng)的矩陣各特征值對應(yīng)的標準正交特征向量,則對于任意的標準正交特征向量,則對于任意的ei 和和 ej,有,有 (13.1.4)且且 (13.1.5)Xa11Y1iaai111)var(aaY1iaaijiji

9、ji, 0, 1ee,1piiiieeIeeipii18因此因此 (13.1.6)當當 1 = e1 時有時有 (13.1.7)此時此時 達到最大值為達到最大值為 1。同理有。同理有 并且并且 (13.1.8)1111111111111)()(Iaaaeeaaeeaaapiiipiiii111111111eeeeee111)var(aaYii)var( Xepjijijjiji, 2, 1, 0),cov(eeeeXeXe9 由上述推導得由上述推導得 (13.1.9) 可見可見Y1, Y2, , Yp 即為原始變量的即為原始變量的 p 個主成份。因此,主成分的求解轉(zhuǎn)變?yōu)榍髠€主成份。因此,主成分

10、的求解轉(zhuǎn)變?yōu)榍?X1, X2, , Xp 協(xié)方差矩陣協(xié)方差矩陣 的特征值和特征向量的問題。的特征值和特征向量的問題。 XeXeXeppYYY,221110 Y的協(xié)方差矩陣為對角陣的協(xié)方差矩陣為對角陣 ,即,即 (13.1.10) 設(shè)設(shè) =( ij)pp是隨機變量向量是隨機變量向量 X 的協(xié)方差矩陣,可得的協(xié)方差矩陣,可得即即 p00)var(1YpiipiiYX11)var()var(piipiii1111 由此可見,主成分分析是把由此可見,主成分分析是把 p 個隨機變量的總方差分解為個隨機變量的總方差分解為 p 個不相關(guān)隨機變量的方差之個不相關(guān)隨機變量的方差之和和 1 2 P,則總方差中屬于

11、第,則總方差中屬于第 i 個主成分(被第個主成分(被第 i 個主成分所解釋)的比例為個主成分所解釋)的比例為 (13.1.12)稱為第稱為第 i 個主成分的貢獻度。定義個主成分的貢獻度。定義 (13.1.13)稱為前稱為前 m 個主成分的累積貢獻度,衡量了前個主成分的累積貢獻度,衡量了前 m 個主成份對原始變量的解釋程度。個主成份對原始變量的解釋程度。pi21pmpiimjj1112記第記第k個主成分個主成分 Yk 與原始變量與原始變量 Xi 的相關(guān)系數(shù)為的相關(guān)系數(shù)為r(Yk,Xi),稱為因子載荷,或,稱為因子載荷,或者因子負荷量,則有者因子負荷量,則有 (13.1.14)pkieeXYXYX

12、Yriikkiiikkikikikik,2, 1,)var()var(),cov(),(13 在實際應(yīng)用時,為了消除原始變量量綱的影響,通常將數(shù)據(jù)標準化??紤]下面的標準在實際應(yīng)用時,為了消除原始變量量綱的影響,通常將數(shù)據(jù)標準化。考慮下面的標準化變化,令化變化,令 (13.1.15)其中其中 i, ii 分別表示隨機變量分別表示隨機變量 Xi 的期望與方差,則的期望與方差,則 piXZiiiii,2, 1,1)var(,0)(iiZZE14 原始變量的相關(guān)矩陣就是原始變量標準化后的協(xié)方差矩陣,因此,由相關(guān)矩陣求主原始變量的相關(guān)矩陣就是原始變量標準化后的協(xié)方差矩陣,因此,由相關(guān)矩陣求主成分的過程與

13、由協(xié)方差矩陣求主成分的過程是一致的。如果仍然采用(成分的過程與由協(xié)方差矩陣求主成分的過程是一致的。如果仍然采用(i ,ei)表示相)表示相關(guān)矩陣關(guān)矩陣R對應(yīng)的特征值和標準正交特征向量,根據(jù)式(對應(yīng)的特征值和標準正交特征向量,根據(jù)式(13.1.9)有:)有: (13.1.17) 由相關(guān)矩陣求得的主成分仍然滿足性質(zhì)由相關(guān)矩陣求得的主成分仍然滿足性質(zhì)13。性質(zhì)。性質(zhì)3可以進一步表示為:可以進一步表示為: (13.1.18))()(12/1XVeZeiiiYpi,2,1pkieZYrkkiik,2, 1,),(15 在實際工作中,我們通常無法獲得總體的協(xié)方差矩陣在實際工作中,我們通常無法獲得總體的協(xié)方

14、差矩陣 和相關(guān)矩陣和相關(guān)矩陣R。因此,需要采。因此,需要采用樣本數(shù)據(jù)來估計。設(shè)從均值向量為用樣本數(shù)據(jù)來估計。設(shè)從均值向量為 ,協(xié)方差矩陣為,協(xié)方差矩陣為 的的 p 維總體中得到的維總體中得到的 n 個樣本,個樣本,且樣本數(shù)據(jù)矩陣為且樣本數(shù)據(jù)矩陣為 (13.1.19)npnnppnxxxxxxxxx21222211121121),(xxxx16則樣本協(xié)方差矩陣為:則樣本協(xié)方差矩陣為: (13.1.20)其中其中: (13.1.21)樣本相關(guān)矩陣為:樣本相關(guān)矩陣為: (13.1.22) 樣本協(xié)方差矩陣樣本協(xié)方差矩陣 S 是總體協(xié)方差矩陣是總體協(xié)方差矩陣 的無偏估計量,樣本相關(guān)矩陣的無偏估計量,樣本

15、相關(guān)矩陣 是總體相關(guān)矩陣是總體相關(guān)矩陣 R 的估計量。的估計量。ppijnkkksn)()(111xxxxSjkjnkikiijnkkiipxxxxnspixnxxxx1121)(11,2, 11),(x,)(ppijrRjjiiijijsssr R17 由于采用相關(guān)矩陣和協(xié)方差矩陣求解主成分的過程基本一致,因此本節(jié)僅介紹基于樣由于采用相關(guān)矩陣和協(xié)方差矩陣求解主成分的過程基本一致,因此本節(jié)僅介紹基于樣本相關(guān)矩陣求解主成分的過程。設(shè)樣本相關(guān)矩陣本相關(guān)矩陣求解主成分的過程。設(shè)樣本相關(guān)矩陣 的特征值為的特征值為 ,且,且與特征值相對應(yīng)的標準正交特征向量為與特征值相對應(yīng)的標準正交特征向量為 ,根據(jù)式(

16、,根據(jù)式(13.1.17)第)第 i 個樣本主成分個樣本主成分可表示為:可表示為: (13.1.23)而且而且 (13.1.24) (13.1.25) Rp,21021ppeee,21pipiieeexxxxeyii2211pi,2,1pkikik,2,1,0),cov(yyipii,2,1,)var(iy18且由式(且由式(13.1.16)和性質(zhì))和性質(zhì)2可得可得 (13.1.26) 則第則第i個樣本主成分的貢獻度為個樣本主成分的貢獻度為 ,前,前m個樣本主成份的累計貢獻度為個樣本主成份的累計貢獻度為 另外另外 (13.1.27)piiipiisp11iikkiiksexyr),(pipmi

17、i/119 主成分分析的目的之一是減少變量的個數(shù),但是對于應(yīng)保留多少個主成分沒有確切的主成分分析的目的之一是減少變量的個數(shù),但是對于應(yīng)保留多少個主成分沒有確切的回答。通常需要綜合考慮樣本總方差的量、特征值的相對大小以及各成分對現(xiàn)實的闡述?;卮?。通常需要綜合考慮樣本總方差的量、特征值的相對大小以及各成分對現(xiàn)實的闡述。一般所取一般所取 m 使得累積貢獻率達到使得累積貢獻率達到85%以上為宜。以上為宜。 另一個比較常用的可視的方法是碎石圖,首先將特征值另一個比較常用的可視的方法是碎石圖,首先將特征值 按照從大到小的順序進行排按照從大到小的順序進行排列,碎石圖是特征值與相應(yīng)序號列,碎石圖是特征值與相應(yīng)

18、序號i的(的(i, )圖形,其中橫軸表示序號,縱軸表示特征值)圖形,其中橫軸表示序號,縱軸表示特征值 。為了確定主成分的合適個數(shù),選擇碎石圖斜率變化較大的拐彎點,通常在此序號之后的特為了確定主成分的合適個數(shù),選擇碎石圖斜率變化較大的拐彎點,通常在此序號之后的特征值取值比較小,則此序號作為主成分的個數(shù)。例如,圖征值取值比較小,則此序號作為主成分的個數(shù)。例如,圖13.1所示的碎石圖在所示的碎石圖在 i=2 處拐彎,處拐彎,則則 m 選擇選擇2。第三個經(jīng)驗的判斷方法是只保留那些方差大于。第三個經(jīng)驗的判斷方法是只保留那些方差大于1的主成分。的主成分。iii20 本例從一批對景氣變動敏感,有代表的指標中

19、篩選出本例從一批對景氣變動敏感,有代表的指標中篩選出5個反應(yīng)宏觀經(jīng)濟波動的一致指標組:個反應(yīng)宏觀經(jīng)濟波動的一致指標組:工業(yè)增加值增速(工業(yè)增加值增速(iva)、工業(yè)行業(yè)產(chǎn)品銷售收入增速()、工業(yè)行業(yè)產(chǎn)品銷售收入增速(sr)、固定資產(chǎn)投資增速()、固定資產(chǎn)投資增速(if)、發(fā)電)、發(fā)電量增速(量增速(elec)和貨幣供應(yīng)量)和貨幣供應(yīng)量M1增速(增速(m1),樣本區(qū)間從),樣本區(qū)間從1998年年1月月2006年年12月,為了消除月,為了消除季節(jié)性因素和不規(guī)則因素,采用季節(jié)性因素和不規(guī)則因素,采用X-12方法進行季節(jié)調(diào)整。常用的方法是美國商務(wù)部采用的計算方法進行季節(jié)調(diào)整。常用的方法是美國商務(wù)部采用

20、的計算合成指數(shù)合成指數(shù)CI的方法。特別的,本例利用主成分分析降維的思想,提取主成分(的方法。特別的,本例利用主成分分析降維的思想,提取主成分(PCA),并與合),并與合成指數(shù)成指數(shù)CI的結(jié)果進行比較。的結(jié)果進行比較。21 本節(jié)以例本節(jié)以例13.1的數(shù)據(jù)為例,介紹的數(shù)據(jù)為例,介紹EViews軟件中主成分分析的實現(xiàn)過程。首先將所軟件中主成分分析的實現(xiàn)過程。首先將所涉及的變量建成一個組涉及的變量建成一個組(g1),選擇組菜單的,選擇組菜單的View/Principal Components.,出現(xiàn)如圖,出現(xiàn)如圖13.6所示的窗口。在窗口中有兩個切換鈕:第一個鈕標著所示的窗口。在窗口中有兩個切換鈕:第

21、一個鈕標著Components,第二個鈕標著,第二個鈕標著Calculation,控制著組中各序列離差矩陣的計算和估計。默認的,控制著組中各序列離差矩陣的計算和估計。默認的,EViews完成主成分完成主成分分析使用普通的(分析使用普通的(Pearson)相關(guān)矩陣,也可以在這個菜單下重新設(shè)定主成分的計算。)相關(guān)矩陣,也可以在這個菜單下重新設(shè)定主成分的計算。 22 Components按鈕用于設(shè)定顯示主成分和保存方差的特征值和特征向量。在按鈕用于設(shè)定顯示主成分和保存方差的特征值和特征向量。在Display對話框中可以以表的形式顯示特征值和特征向量,或者按照特征值的大小以線對話框中可以以表的形式顯示

22、特征值和特征向量,或者按照特征值的大小以線性圖的形式顯示,或者是載荷、得分的散點圖,或者兩個都顯示(性圖的形式顯示,或者是載荷、得分的散點圖,或者兩個都顯示(biplot)。選擇不同)。選擇不同的顯示方式,對話框中其余的內(nèi)容也會發(fā)生相應(yīng)的改變。的顯示方式,對話框中其余的內(nèi)容也會發(fā)生相應(yīng)的改變。232425 表頭描述了觀測值的樣本區(qū)間、計算離差矩陣的方法以及保留成分的個數(shù)(在這個表頭描述了觀測值的樣本區(qū)間、計算離差矩陣的方法以及保留成分的個數(shù)(在這個例子中顯示了所有的例子中顯示了所有的5個主成分)。個主成分)。 表的第一部分概括了特征值(表的第一部分概括了特征值(Value)、相應(yīng)特征值與后一項

23、的差()、相應(yīng)特征值與后一項的差(Difference)、)、對總方差的累積解釋比例(對總方差的累積解釋比例(Cumulative Proportion)等等。由于上述結(jié)果的計算采用相)等等。由于上述結(jié)果的計算采用相關(guān)矩陣,所以關(guān)矩陣,所以5個特征值之和等于個特征值之和等于5。第一個成分占總方差的。第一個成分占總方差的72.94%,第二個成分占總方,第二個成分占總方差的差的19.22%。前兩個成分占總方差的。前兩個成分占總方差的92.16%。 表的第二部分描述了線性組合的系數(shù),第一個主成分(標為表的第二部分描述了線性組合的系數(shù),第一個主成分(標為“PC1”)大約等于所有)大約等于所有5個一致指

24、標的線性組合,它可以解釋為一般的經(jīng)濟景氣指數(shù)。個一致指標的線性組合,它可以解釋為一般的經(jīng)濟景氣指數(shù)。 輸出的第三部分表示計算的相關(guān)矩陣。輸出的第三部分表示計算的相關(guān)矩陣。 26第第1主成分主成分第第2主成分主成分第第3主成分主成分 第第4主成分主成分 第第5主成分主成分特特征征向向量量固定資產(chǎn)投資增速(固定資產(chǎn)投資增速(if)0.449-0.3670.6960.2000.374工業(yè)增加值增速(工業(yè)增加值增速(iva)0.510-0.153-0.0780.312-0.783貨幣供應(yīng)量增速(貨幣供應(yīng)量增速(m1r)0.2040.9130.2850.2080.009產(chǎn)品銷售收入增速(產(chǎn)品銷售收入增速

25、(sr)0.4900.023-0.6540.2930.496發(fā)電量增速(發(fā)電量增速(elec)0.5080.088-0.020-0.857-0.026特特 征征 值值3.6030.9880.2700.0870.051貢貢 獻獻 率率0.7210.1970.0540.0180.01累積貢獻率累積貢獻率0.7210.9180.9720.9901.000 27 由表由表13.1可以看出,第可以看出,第1主成分的貢獻率為主成分的貢獻率為72.1%,已能較好地反映,已能較好地反映5個一致指標的總個一致指標的總體變動情況,而且根據(jù)它們的特征值可以發(fā)現(xiàn)第體變動情況,而且根據(jù)它們的特征值可以發(fā)現(xiàn)第2個特征值開

26、始明顯變小個特征值開始明顯變小(小于小于1),碎石圖,碎石圖出現(xiàn)明顯的拐彎,同時為了討論方便,僅選擇出現(xiàn)明顯的拐彎,同時為了討論方便,僅選擇m=1,提取第一個主成分反映經(jīng)濟變動。表,提取第一個主成分反映經(jīng)濟變動。表13.1中已經(jīng)給出對應(yīng)的特征向量,根據(jù)式(中已經(jīng)給出對應(yīng)的特征向量,根據(jù)式(13.1.23)可以得到對應(yīng)的主成分序列。)可以得到對應(yīng)的主成分序列。 28 如果在主對話框的如果在主對話框的Display部分選擇部分選擇Eigenvalues plots,則顯示按順序排列的特征值的線性,則顯示按順序排列的特征值的線性圖(碎石圖)。在對話框的下面將發(fā)生改變,可以選擇顯示特征值(碎石圖)、特

27、征值的差、圖(碎石圖)。在對話框的下面將發(fā)生改變,可以選擇顯示特征值(碎石圖)、特征值的差、方差累積貢獻率其中之一,或是全部。如圖方差累積貢獻率其中之一,或是全部。如圖13.7所示可以選擇任意的復選框。默認的所示可以選擇任意的復選框。默認的EViews僅顯示特征值排序的碎石圖。僅顯示特征值排序的碎石圖。2930 變量載荷圖(變量載荷圖(Variable loadings plot)給出對應(yīng)主成分的變量載荷系數(shù),從圖中可以看)給出對應(yīng)主成分的變量載荷系數(shù),從圖中可以看出如何根據(jù)原始變量合成新的主成分;成分得分圖(出如何根據(jù)原始變量合成新的主成分;成分得分圖(Component scores pl

28、ot)顯示對應(yīng)于樣)顯示對應(yīng)于樣本區(qū)間內(nèi)的觀測值成分的得分值;本區(qū)間內(nèi)的觀測值成分的得分值;biplot (Biplots (scores & loadings)則表示在一個圖中同時則表示在一個圖中同時顯示載荷系數(shù)和得分值。顯示載荷系數(shù)和得分值。 3132 在在Type下拉菜單中選擇使用相關(guān)下拉菜單中選擇使用相關(guān)(Correlation)還是協(xié)方差還是協(xié)方差(Covariance)矩陣。在矩陣。在Method下拉下拉菜單中選擇計算方法:菜單中選擇計算方法:Ordinary, Ordinary (uncentered), Spearman rank-order or Kendalls t

29、au-a, or Kendalls tau-b。在該對話框中,還可以設(shè)定計算使用的觀測值樣本。在該對話框中,還可以設(shè)定計算使用的觀測值樣本。 33 如果想保存主成分得分序列,直接從組(如果想保存主成分得分序列,直接從組(Group)菜單中選擇)菜單中選擇Proc/Make Principal Components.,則出現(xiàn)圖,則出現(xiàn)圖13.9所示的對話框。所示的對話框。34 第一個選項是第一個選項是Scaling,用于選擇得分序列和載荷計算的權(quán)重。有,用于選擇得分序列和載荷計算的權(quán)重。有4個選項:個選項: Normalize loadings,Normalize scores,Symmetri

30、c weights和和User loading weight,默認的,默認的Normalize loadings,表示標準化載荷,使得所有觀測值得分對特征值有標準的比例;選擇,表示標準化載荷,使得所有觀測值得分對特征值有標準的比例;選擇Normalize scores,所有變量標準化為,所有變量標準化為1;選擇;選擇Symmetric weights,將會有對稱的權(quán)重;選擇,將會有對稱的權(quán)重;選擇User loading weight,可以用戶自己定義權(quán)重。,可以用戶自己定義權(quán)重。 然后需要輸入得分序列的名稱,在例然后需要輸入得分序列的名稱,在例13.1中,我們輸入第一主成分的名字中,我們輸入

31、第一主成分的名字“PAC1”,用于保存第一個主成分。也可以根據(jù)需要保存對應(yīng)得分的載荷、特征值和特征向量。用于保存第一個主成分。也可以根據(jù)需要保存對應(yīng)得分的載荷、特征值和特征向量。35 圖圖13.2中的實線給出了由主成分分析的第一主成分表示的一致景氣指數(shù)(中的實線給出了由主成分分析的第一主成分表示的一致景氣指數(shù)(PCA),虛線),虛線給出的是由國際上常用的美國商務(wù)部計算合成指數(shù)的方法給出的一致合成指數(shù)(給出的是由國際上常用的美國商務(wù)部計算合成指數(shù)的方法給出的一致合成指數(shù)(CI),可以),可以發(fā)現(xiàn)二者的變化趨勢和轉(zhuǎn)折點幾乎完全相同,只是波動的幅度略有差異。進一步表明:發(fā)現(xiàn)二者的變化趨勢和轉(zhuǎn)折點幾乎

32、完全相同,只是波動的幅度略有差異。進一步表明:PCA指數(shù)不僅能夠反映景氣波動的變化趨勢和峰谷的轉(zhuǎn)折點,而且還能反映波動的幅度。指數(shù)不僅能夠反映景氣波動的變化趨勢和峰谷的轉(zhuǎn)折點,而且還能反映波動的幅度。 36 因子分析(因子分析(factor analysis,簡稱,簡稱FA)是主成分分析的推廣,相對于主成分分析,因)是主成分分析的推廣,相對于主成分分析,因子分析更側(cè)重于解釋被觀測變量之間的相關(guān)關(guān)系或協(xié)方差之間的結(jié)構(gòu)。因子分析的思想子分析更側(cè)重于解釋被觀測變量之間的相關(guān)關(guān)系或協(xié)方差之間的結(jié)構(gòu)。因子分析的思想源于源于1904年查爾斯年查爾斯斯皮爾曼(斯皮爾曼(Charles Spearman)對學

33、生考試成績的研究。研究多指標)對學生考試成績的研究。研究多指標問題時常常會發(fā)現(xiàn),這些指標相關(guān)性形成的背景原因是各種各樣的,其中共同的原因稱問題時常常會發(fā)現(xiàn),這些指標相關(guān)性形成的背景原因是各種各樣的,其中共同的原因稱為公共因子;每一個變量也含有其特定的原因,成為特定(特殊)因子。因子分析的實為公共因子;每一個變量也含有其特定的原因,成為特定(特殊)因子。因子分析的實質(zhì)就是用幾個潛在的但不能觀察的互不相關(guān)的隨機變量去描述許多變量之間的相關(guān)關(guān)系質(zhì)就是用幾個潛在的但不能觀察的互不相關(guān)的隨機變量去描述許多變量之間的相關(guān)關(guān)系(或者協(xié)方差關(guān)系),這些隨機變量被稱為因子。為了使得這些因子能很好的替代原始(或者

34、協(xié)方差關(guān)系),這些隨機變量被稱為因子。為了使得這些因子能很好的替代原始數(shù)據(jù),需要對這些因子給出合理的解釋。同時為了使用這些因子,還需要對提取結(jié)果進數(shù)據(jù),需要對這些因子給出合理的解釋。同時為了使用這些因子,還需要對提取結(jié)果進行評價。行評價。 37 因此,可以簡單將因子分析的目標概括為以下幾方面:因此,可以簡單將因子分析的目標概括為以下幾方面: (1)首先考慮是否存在較少的不相關(guān)的隨機變量可用于描述原始變量之間的關(guān)系;)首先考慮是否存在較少的不相關(guān)的隨機變量可用于描述原始變量之間的關(guān)系; (2)如果存在公共因子,那么究竟應(yīng)該選擇幾個;)如果存在公共因子,那么究竟應(yīng)該選擇幾個; (3)對提取的公共因

35、子的含義進行解釋;)對提取的公共因子的含義進行解釋; (4)評價每一個原始變量與公共因子之間的關(guān)系;)評價每一個原始變量與公共因子之間的關(guān)系; (5)可以將這些公共因子用于其他的統(tǒng)計分析。)可以將這些公共因子用于其他的統(tǒng)計分析。 本節(jié)將從這幾個角度給出詳細的介紹。需要注意的是因子分析從一系列高度相關(guān)的原始變量本節(jié)將從這幾個角度給出詳細的介紹。需要注意的是因子分析從一系列高度相關(guān)的原始變量矩陣矩陣X=(X1, X2 , , Xp) 中提取少數(shù)幾個不相關(guān)的因子,所以如果原始變量之間不相關(guān)則沒有必要中提取少數(shù)幾個不相關(guān)的因子,所以如果原始變量之間不相關(guān)則沒有必要進行因子分析。在實際研究和應(yīng)用中,為了

36、消除觀察值之間由于量綱的差異而造成的影響,需要進行因子分析。在實際研究和應(yīng)用中,為了消除觀察值之間由于量綱的差異而造成的影響,需要將觀測值按照式(將觀測值按照式(13.1.15)進行標準化處理。本節(jié)的討論都是基于標準化后的序列,為了方便,)進行標準化處理。本節(jié)的討論都是基于標準化后的序列,為了方便,把標準化后的隨機變量矩陣仍記為把標準化后的隨機變量矩陣仍記為Z = (Z1, Z 2, , Zp) 。 38 假如對某一問題的研究涉及假如對某一問題的研究涉及 p 個指標,且這個指標,且這 p 個指標之間存在較強的相關(guān)性,則基本的個指標之間存在較強的相關(guān)性,則基本的因子模型可以表示為因子模型可以表示

37、為 (13.2.1)稱式(稱式(13.2.1)中)中F1, F2, , Fm為公共因子,為公共因子, 1, 2, , p 表示特殊因子,其中包含了隨機誤差,表示特殊因子,其中包含了隨機誤差, i 只與第只與第 i 個變量個變量 Zi 有關(guān),有關(guān), lij 稱為第稱為第 i 個變量個變量 Zi 在第在第 j 個因子個因子 Fj 上的載荷(因子載荷),由上的載荷(因子載荷),由其構(gòu)成的矩陣其構(gòu)成的矩陣 L 稱為因子載荷矩陣。稱為因子載荷矩陣。pmpmpppmmmmFlFlFlZFlFlFlZFlFlFlZ221122222121211212111139 式(式(13.2.1)進一步可以表示為下面的

38、矩陣形式)進一步可以表示為下面的矩陣形式 (13.2.2)其中,其中,F(xiàn) = (F1, F2 , , Fm) ; = ( 1, 2 , , p) 。注意式(。注意式(13.2.1)中的)中的F1, F2 , , Fm 是不可是不可觀測的隨機變量,因此,必須對隨機變量觀測的隨機變量,因此,必須對隨機變量 F 和和 做一些假定,使得模型具有特定的且能驗做一些假定,使得模型具有特定的且能驗證的協(xié)方差結(jié)構(gòu)。證的協(xié)方差結(jié)構(gòu)。 LFZ40假設(shè)假設(shè) (13.2.3) (13.2.4)且且 F 與與 獨立,即獨立,即 (13.2.5)滿足式(滿足式(13.2.3)式()式(13.2.5)假定的模型()假定的模

39、型(13.2.1)(或()(或(13.2.2)稱為正交因子模)稱為正交因子模型。型。 IFFFF0F)(),cov(,)(EEpE000000)(),cov(21,)(0 E0FF,)()cov(E41 假定隨機變量假定隨機變量Z的協(xié)方差矩陣為的協(xié)方差矩陣為,則有,則有 (13.2.6) (13.2.7)LFFFLFLFFZFZ)()()()(),cov(EEEELLFLLFLFFLLFLFLFLFLFLFLFLFZZZZ)()()()()()()()()(),cov(EEEEEEEE42 由式(由式(13.2.7)可得)可得 (13.2.8) 由于假定由于假定 Zi 和和 Fj 都是方差為都

40、是方差為1的隨機變量,因此的隨機變量,因此 lij 即為變量即為變量 Zi 與因子與因子Fj 的相關(guān)系數(shù)。的相關(guān)系數(shù)。ijjijmjjijjimjjijjilFFFlFFlFZ),cov(),cov(),cov(),cov(1143 由式(由式(13.2.6)可得)可得令令 則有則有 (13.2.9)其中其中 hi2 反映了公共因子對反映了公共因子對 Zi 方差的貢獻,稱為共性方差,或者變量共同度。方差的貢獻,稱為共性方差,或者變量共同度。 i 稱為特殊方稱為特殊方差,或者剩余方差。差,或者剩余方差。 iimiiilllZ22221)var(21222221imjijimiihllll1)va

41、r(2iiihZ44 式(式(13.2.9)表明,)表明, hi2 接近接近1時,時, i 接近接近 0,說明,說明 Zi 包含的幾乎全部信息都可以被公包含的幾乎全部信息都可以被公因子解釋;當因子解釋;當 hi2 接近接近 0 時,表明公共因子對時,表明公共因子對 的影響不大,主要由特殊因子描述。因此,的影響不大,主要由特殊因子描述。因此, hi2 也反映了變量也反映了變量 Zi 對公共因子的依賴程度。與此類似,矩陣對公共因子的依賴程度。與此類似,矩陣 L 的第的第 j 列元素反映了第列元素反映了第 j 個個因子因子 Fj 對所有變量對所有變量 Z 的影響,記為的影響,記為 (13.2.10)

42、稱為公共因子稱為公共因子Fj 對原始變量向量對原始變量向量 Z 的方差貢獻,是衡量公共因子相對重要性的一個尺度,的方差貢獻,是衡量公共因子相對重要性的一個尺度,其值越大反映其值越大反映 Fj 對原始變量向量對原始變量向量 Z 的方差貢獻也越大。的方差貢獻也越大。piijjlg12245 因子分析的首要步驟是先確定因子載荷,或估計得到因子載荷矩陣因子分析的首要步驟是先確定因子載荷,或估計得到因子載荷矩陣L,注意在式,注意在式(13.2.1)和式()和式(13.2.2)中的)中的F1, F2, , Fm是不可觀測的隨機變量,因此因子載荷矩陣是不可觀測的隨機變量,因此因子載荷矩陣L的估計方法都比較復

43、雜,常用的方法有極大似然法、主成分法、迭代主成分方法、最的估計方法都比較復雜,常用的方法有極大似然法、主成分法、迭代主成分方法、最小二乘法、小二乘法、 因子提取法等。因子提取法等。4646 如果假設(shè)公共因子如果假設(shè)公共因子 F 和特殊因子和特殊因子 服從正態(tài)分布,即服從正態(tài)分布,即F Nm(0, I), Np(0, ),X1, X2, , Xp 的均值為的均值為 = ( 1, 2 , , p) ,則觀測值,則觀測值 X1, X2, , Xp 為來自正態(tài)總體為來自正態(tài)總體 Np( , ) 的樣本,可以采用極大似然法估計因子載荷矩陣和特殊方差,似然函數(shù)是的樣本,可以采用極大似然法估計因子載荷矩陣和

44、特殊方差,似然函數(shù)是 和和 的的函數(shù)函數(shù) L( , )。 由于由于 ,因此似然函數(shù)可以更清楚地表示為,因此似然函數(shù)可以更清楚地表示為L( , L, ),記,記( , L, )的估計量為 ,則有 (13.2.11)LL)(,L,),(max),(LLLL47 用主成分法確定因子載荷,就是對隨機變量進行主成分分析,把前面幾個主成分用主成分法確定因子載荷,就是對隨機變量進行主成分分析,把前面幾個主成分作為原始公共因子。其具體過程如下,設(shè)有作為原始公共因子。其具體過程如下,設(shè)有 p 個變量個變量 Z = (Z1, Z2 , , Zp) ,可以求得從,可以求得從大到小排序的大到小排序的 p 個主成分個主

45、成分Y1,Y2,Yp,根據(jù),根據(jù)13.1節(jié)的內(nèi)容可知,原始變量與主成分節(jié)的內(nèi)容可知,原始變量與主成分之間存在如下的關(guān)系:之間存在如下的關(guān)系: (13.2.13)ppppppppZZZYYY212122221112112148 由于由于A =( 1, , , p) = (e1, e2, , ep) 為正交矩陣,則有為正交矩陣,則有 (13.2.14)如果在式(如果在式(13.2.13)中僅取前)中僅取前m個主成分,把其余的個主成分,把其余的 p-m 個主成分用特殊因子個主成分用特殊因子 i 代替,則式代替,則式(13.2.13)可以表示為)可以表示為 (13.2.15)式(式(13.2.15)與

46、式()與式(13.2.1)的形式一致,)的形式一致,Yi 表示主成分,因此相互獨立。表示主成分,因此相互獨立。 YAZpmmppppmmmmYYYZYYYZYYYZ221122222112211221111149 為了使為了使 Yi 符合式(符合式(13.2.3)假設(shè)的公共因子,需要將主成分)假設(shè)的公共因子,需要將主成分Yi 的方差轉(zhuǎn)變?yōu)榈姆讲钷D(zhuǎn)變?yōu)?。由。由13.1節(jié)節(jié)的介紹可知,主成分方差為特征根的介紹可知,主成分方差為特征根 i,只需要將,只需要將 Yi 除以標準差除以標準差 即可,令即可,令, (13.2.16)則式(則式(13.2.15)轉(zhuǎn)變?yōu)椋海┺D(zhuǎn)變?yōu)椋?(13.2.17) 式(式

47、(13.2.15)已與式()已與式(13.2.1)不僅在形式上一致,而且完全符合式()不僅在形式上一致,而且完全符合式(13.2.3)式)式(13.2.5)的假設(shè)。由此就得到因子載荷矩陣和一組初始公共因子。)的假設(shè)。由此就得到因子載荷矩陣和一組初始公共因子。 iiiiYF/jiiijlpmpmpppmmmmFlFlFlZFlFlFlZFlFlFlZ221122222121211212111150 迭代主成分方法也叫主因子法,或主軸因子方法迭代主成分方法也叫主因子法,或主軸因子方法,是對主成分法的一種修正。首先對原是對主成分法的一種修正。首先對原始變量進行標準化處理,其相關(guān)矩陣與協(xié)方差矩陣一致,

48、使其因子模型滿足式(始變量進行標準化處理,其相關(guān)矩陣與協(xié)方差矩陣一致,使其因子模型滿足式(13.2.1),根),根據(jù)式(據(jù)式(13.2.6)有)有 (13.2.18)令令 (13.2.19)稱稱R*為調(diào)整相關(guān)矩陣,或約相關(guān)矩陣。不妨設(shè)特殊因子為調(diào)整相關(guān)矩陣,或約相關(guān)矩陣。不妨設(shè)特殊因子 i 的方差的初始估計為的方差的初始估計為 i*,則有,則有hi*2 = 1- i* ,且相應(yīng)的樣本相關(guān)矩陣為,且相應(yīng)的樣本相關(guān)矩陣為 ,則對應(yīng)的約相關(guān)矩陣為,則對應(yīng)的約相關(guān)矩陣為 (13.2.20)LLRLLRR*2*2122*2121122*1*ppppphrrrhrrrhRRR51 設(shè)設(shè) 的前的前m個特征值

49、依次為個特征值依次為 1* 2* m* 0,相應(yīng)的正交單位特征向量為,相應(yīng)的正交單位特征向量為e1* , e2*, em*,則對應(yīng)的因子載荷矩陣,則對應(yīng)的因子載荷矩陣 L 的解為的解為 (13.2.21)根據(jù)式(根據(jù)式(13.2.21)和式()和式(13.2.18),可以進一步得到特殊因子方差的最終估計量為),可以進一步得到特殊因子方差的最終估計量為 , (13.2.22)如果希望得到擬合程度更好的解,則可以采用迭代的方法,即利用式(如果希望得到擬合程度更好的解,則可以采用迭代的方法,即利用式(13.2.22)得到的特殊)得到的特殊因子方差估計量帶入式(因子方差估計量帶入式(13.2.20)重

50、復上述步驟,直到所求解比較穩(wěn)定為止。)重復上述步驟,直到所求解比較穩(wěn)定為止。*R*2*2*1*1,mmeeeLmjijiilh12211pi,2,152 下面介紹幾種求特殊因子方差和公共因子方差初始估計的幾種常用方法:下面介紹幾種求特殊因子方差和公共因子方差初始估計的幾種常用方法: (squared multiple correlations,簡稱,簡稱SMC)方法)方法 SMC是比較常用的一種方法,令是比較常用的一種方法,令 ,其中,其中rii是是 的第的第i個對角元素,此時個對角元素,此時公共因子方差的估計值為公共因子方差的估計值為 它表示它表示 Xi 與其他與其他 p-1 個解釋變量之間

51、的復相關(guān)系數(shù)。個解釋變量之間的復相關(guān)系數(shù)。 最大相關(guān)系數(shù)方法是用第最大相關(guān)系數(shù)方法是用第 i 個變量個變量 Xi 與其他變量相關(guān)系數(shù)絕對值的最大值來估計,即與其他變量相關(guān)系數(shù)絕對值的最大值來估計,即令令 ,其中,其中 rij 表示第表示第 i 個變量個變量 Xi 與第與第 j 個變量個變量 Xj 的相關(guān)系數(shù)。的相關(guān)系數(shù)。iiir/1*1Riiiirh/111*2ijjiirh max253 該方法使用相關(guān)矩陣(或協(xié)方差矩陣)對角線元素的固定比例該方法使用相關(guān)矩陣(或協(xié)方差矩陣)對角線元素的固定比例 。特殊的可以取。特殊的可以取 =1,此時結(jié)果等同于主成分求解得到的結(jié)果。此時結(jié)果等同于主成分求解

52、得到的結(jié)果。 (partitioned covariance,簡稱,簡稱PACE) 由于第由于第3種方法種方法PACE的估計量是非迭代的,因此,比較適合為迭代估計方法提供初值。的估計量是非迭代的,因此,比較適合為迭代估計方法提供初值。 特殊的直接取特殊的直接取 ,則,則 i*=0,此時得到的,此時得到的 也是一個主成分解。也是一個主成分解。12*ihL54 上述求解過程中重要的是如何確定公因子數(shù)目上述求解過程中重要的是如何確定公因子數(shù)目m,這是因子分析中最重要的一步。本,這是因子分析中最重要的一步。本小節(jié)將列出其中幾種常用的方法小節(jié)將列出其中幾種常用的方法 (Kaiser-Guttman Mi

53、nimum Eigenvalue) Kaiser-Guttman規(guī)則也叫做規(guī)則也叫做“特征值大于特征值大于1”方法,是最常用的一種方法。只需要計方法,是最常用的一種方法。只需要計算離差矩陣(相關(guān)矩陣、協(xié)方差矩陣)的特征值,特征值超過平均值的個數(shù)作為因子個數(shù)。算離差矩陣(相關(guān)矩陣、協(xié)方差矩陣)的特征值,特征值超過平均值的個數(shù)作為因子個數(shù)。特別地,對于相關(guān)矩陣,特征值的均值為特別地,對于相關(guān)矩陣,特征值的均值為1,所以通常取特征值大于,所以通常取特征值大于1的數(shù)作為公因子數(shù)。的數(shù)作為公因子數(shù)。55(Fraction of Total Variance) 選擇公因子個數(shù)選擇公因子個數(shù)m使得前使得前m

54、個特征值的和超過公因子總方差的某一門限值。這種方法多個特征值的和超過公因子總方差的某一門限值。這種方法多用于主成分分析方法,比較典型的是這些成分構(gòu)成總方差的用于主成分分析方法,比較典型的是這些成分構(gòu)成總方差的95%(Jackson, 1993)。)。(Minimum Average Partial) Velicer (1976) 提出的最小平均偏相關(guān)提出的最小平均偏相關(guān)(簡稱簡稱MAP)方法原理是:給定方法原理是:給定m個成分(個成分(m = 0,1,p-1),計算偏相關(guān)系數(shù)平方的平均值,應(yīng)保留因子的個數(shù)是使得平均值最小化的),計算偏相關(guān)系數(shù)平方的平均值,應(yīng)保留因子的個數(shù)是使得平均值最小化的個

55、數(shù)個數(shù)56(Broken Stick) 分割線段模型的基本原理是:首先,計算離差矩陣中第分割線段模型的基本原理是:首先,計算離差矩陣中第j個最大特征值對方差的貢獻個最大特征值對方差的貢獻度,然后計算從分割線段分布得到的相應(yīng)的期望值度,然后計算從分割線段分布得到的相應(yīng)的期望值 。當前者超過后者時,所對應(yīng)的。當前者超過后者時,所對應(yīng)的j即為即為應(yīng)該保留的因子個數(shù)(應(yīng)該保留的因子個數(shù)(Jackson, 1993)。)。(Parallel Analysis) 平行分析模擬使用的數(shù)據(jù)與原始數(shù)據(jù)有著相同方差和觀測值個數(shù),是由隨機生成器平行分析模擬使用的數(shù)據(jù)與原始數(shù)據(jù)有著相同方差和觀測值個數(shù),是由隨機生成器

56、生成的獨立隨機變量數(shù)據(jù)集。計算模擬數(shù)據(jù)的生成的獨立隨機變量數(shù)據(jù)集。計算模擬數(shù)據(jù)的Pearson協(xié)方差和相關(guān)矩陣及其特征值。只協(xié)方差和相關(guān)矩陣及其特征值。只要原始數(shù)據(jù)的特征值超過模擬數(shù)據(jù)的對應(yīng)值,相應(yīng)的個數(shù)將作為保留因子數(shù)要原始數(shù)據(jù)的特征值超過模擬數(shù)據(jù)的對應(yīng)值,相應(yīng)的個數(shù)將作為保留因子數(shù)57 采用極大似然估計模型時,假設(shè)公共因子和特殊因子均服從正態(tài)分布,而正態(tài)采用極大似然估計模型時,假設(shè)公共因子和特殊因子均服從正態(tài)分布,而正態(tài)分布的假定,可以幫助我們構(gòu)造模型充分性的檢驗。設(shè)提取分布的假定,可以幫助我們構(gòu)造模型充分性的檢驗。設(shè)提取m個公共因子的模型成個公共因子的模型成立,則檢驗立,則檢驗m個公共因

57、子的充分性等價于檢驗個公共因子的充分性等價于檢驗 (13.2.27) 對應(yīng)的備擇假設(shè)對應(yīng)的備擇假設(shè) H1 為為 是任意其他的正定矩陣。是任意其他的正定矩陣。LL:0H58 在原假設(shè)成立的條件下可以構(gòu)造下面的似然比統(tǒng)計量在原假設(shè)成立的條件下可以構(gòu)造下面的似然比統(tǒng)計量 (13.2.28)其中其中 Sn 表示協(xié)方差矩陣的極大似然估計;表示協(xié)方差矩陣的極大似然估計; ,其中,其中 和和 分別表示分別表示 L 和和 的極大似然估計量,而的極大似然估計量,而 是是 的極大似然估計量。式(的極大似然估計量。式(13.2.28)的統(tǒng)計量服從)的統(tǒng)計量服從 2分分布。布。 特別的,特別的,Bartlett在在1

58、954年證明了年證明了-2ln 抽樣分布的抽樣分布的 2近似可以用多重因子(近似可以用多重因子(n-1- (2p+4m+5)/6)代替式()代替式(13.2.28)中的)中的n。nnSlnln2LLLLLLL59 利用利用Bartlett修正,只要修正,只要n和和n- p大,若大,若 (13.2.29) 則在顯著性水平則在顯著性水平 下拒絕原假設(shè)下拒絕原假設(shè) H0,認為,認為 m 個因子是不充分的。式(個因子是不充分的。式(13.2.29)表)表示的示的 2統(tǒng)計量也稱為統(tǒng)計量也稱為Bartlett 2統(tǒng)計量。由于式(統(tǒng)計量。由于式(13.2.29)中的自由度必須大于)中的自由度必須大于0,進一

59、,進一步化簡可以得到步化簡可以得到 (13.2.30)在選擇在選擇 m 時,必須根據(jù)上述方法進行判斷模型的充分性。時,必須根據(jù)上述方法進行判斷模型的充分性。2/ )(ln)6/ )542(1(22mpmpmpnnSLL)1812(21ppm60 曾有學者研究了紐約票股交易所的曾有學者研究了紐約票股交易所的5只股票(阿萊德化學(只股票(阿萊德化學(allied)、杜邦)、杜邦(dupont)、聯(lián)合碳化物聯(lián)合碳化物(union)、埃克森、埃克森(exxon)和德士古和德士古(texaco))從)從1975年年1月到月到1976年年12月期間月期間周回報率之間的關(guān)系(數(shù)據(jù)見本章附錄)。周回報率定義為

60、(本周五收盤價周回報率之間的關(guān)系(數(shù)據(jù)見本章附錄)。周回報率定義為(本周五收盤價-上周五收上周五收盤價)盤價)/上周五收盤價,如有拆股或支付股息時進行相應(yīng)調(diào)整。連續(xù)上周五收盤價,如有拆股或支付股息時進行相應(yīng)調(diào)整。連續(xù)100周的觀測值表周的觀測值表現(xiàn)出獨立同分布,但是各股之間的回報率受總體經(jīng)濟狀況的影響,也存在相關(guān)關(guān)系?,F(xiàn)出獨立同分布,但是各股之間的回報率受總體經(jīng)濟狀況的影響,也存在相關(guān)關(guān)系。表表13.2給出各指標的相關(guān)矩陣。給出各指標的相關(guān)矩陣。61allieddupontunionexxontexacoallied1.000.580.510.390.46dupont0.581.000.600.390

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論