




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
*應用統(tǒng)計應
用
統(tǒng)
計
學
AppliedStatistics*應用應用統(tǒng)計學
AppliedStatisti*如果你要到裁縫店定做一件上衣,需要測量很多尺寸,譬如身長、袖長、胸圍、腰圍、肩寬、肩厚等。但服裝廠要生產一批新型服裝,卻不可能完全按照每個人的這些尺寸來對型號進行劃分,而是把各個方面進行高度概括,用少數(shù)幾個指標作為分類的型號,簡單明了的反映不同人群的體態(tài)特征。日常生活中經常遇到包含很多變量的數(shù)據(jù),比如各個地區(qū)的若干經濟指標數(shù)據(jù),上市公司財務報表公布的多項財務數(shù)據(jù)等等。這些數(shù)據(jù)中的變量雖然很多,但往往相互之間都有著一定的關聯(lián),這使得只要找出少數(shù)幾個“代表”就可以對復雜的信息進行比較完整的描述了。主成分分析和因子分析便是實現(xiàn)這一過程的兩種方法。*如果你要到裁縫店定做一件上衣,需要測量很多尺寸,譬如身長、*第8章用少數(shù)變量代表多個變量8.1
主成分分析8.2因子分析*第8章用少數(shù)變量代表多個變量8.1主成分分*在研究實際問題時,往往需要收集多個變量。但這樣會使多個變量間存在較強的相關關系,即這些變量間存在較多的信息重復,直接利用它們進行分析,不但模型復雜,還會因為變量間存在多重共線性而引起較大的誤差。為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來較多的舊變量,同時要求這些新變量盡可能反映原變量的信息。主成分分析和因子分子正是解決這類問題的有效方法。它們能夠提取信息,使變量簡化降維,從而使問題更加簡單直觀。主成分分析和因子分析
(PrincipalComponentAnalysis&FactorAnalysis)*在研究實際問題時,往往需要收集多個變量。但這樣會使多個變量*8.1主成分分析
8.1.1主成分分析的基本思想是什么?
8.1.2如何選擇主成分?
8.1.3怎樣解釋主成分?
第8章用少數(shù)變量代表多個變量*8.1主成分分析第8章用少數(shù)變量代表多個變*8.1.1主成分分析的基本思想是什么?8.1主成分分析*8.1.1主成分分析的基本思想是什么?8.1主成*主成分的概念由KarlPearson在1901年提出考察多個變量間相關性的一種多元統(tǒng)計方法研究如何通過少數(shù)幾個主成分來解釋多個變量間的內部結構。即從原始變量中導出少數(shù)幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關。主成分分析的目的:數(shù)據(jù)的壓縮;數(shù)據(jù)的解釋它常被用來尋找判斷事物或現(xiàn)象的綜合指標,并對綜合指標所包含的信息進行適當?shù)慕忉?。什么是主成分分析?/p>
(PrincipalComponentAnalysis)*主成分的概念由KarlPearson在1901年提出什么*【例8.1】表8-1是北京市某高中50名學生的六門課程測試成績數(shù)據(jù)
乍一看,很難從這六門課程的測試得分來評價這50名學生的成績優(yōu)劣,也很難分析這些學生的成績分布特征。要解決這樣的問題,自然希望能把這一數(shù)據(jù)中包含的六個變量概括成一兩個綜合變量。那么這一做法是否可行呢?提煉出來的少數(shù)變量能夠代表原數(shù)據(jù)的多少信息?如何解釋它們呢?我們首先來了解一下主成分分析的基本思想。對于例8.1中的數(shù)據(jù),每一個學生的觀測值都包含了六個變量,所以表示在坐標系中每一個觀測值就是六維空間中的一個點,每一維就代表一個變量。把六個變量概括成一兩個綜合變量,實質上就是一個降維的過程。主成分分析的基本思想是什么?表8-1北京市某高中學生六門課程測試成績數(shù)據(jù)*【例8.1】表8-1是北京市某高中50名學生的六門課程測試*對于存在線性相關的兩個變量,直接進行分析可能由于多重共線性而無法得出正確結論。如何對這兩個變量所攜帶的信息(在統(tǒng)計上信息往往是指數(shù)據(jù)的變異)進行濃縮處理?分別用橫軸和縱軸表示兩個變量,每個觀測值就是二維坐標系中的一個點,所有的數(shù)據(jù)點大致散布成一個橢圓形,那么這個橢圓有一個長軸和一個短軸,我們稱之為主軸,主軸之間是相互垂直的。主成分分析的基本思想是什么?
(以兩個變量為例)顯然,短軸方向上,數(shù)據(jù)點之間的差異較??;長軸方向上,數(shù)據(jù)變化則較大。如果原坐標系中的橫軸和縱軸能夠分別與橢圓的長短軸平行,那么相對來說,長軸所代表的變量就描述了數(shù)據(jù)的主要變化,短軸所代表的變量則描述了數(shù)據(jù)的次要變化。*對于存在線性相關的兩個變量,直接進行分析可能由于多重共線性*現(xiàn)在沿橢圓的長軸設定一個新的坐標系,則新產生的兩個變量和原始變量之間存在明顯的數(shù)學換算關系。但這兩個變量彼此不相關,且信息量的分布顯然不同。長軸變量攜帶了大部分數(shù)據(jù)變異的信息,而短軸變量只攜帶了一小部分變異信息。橢圓的長軸和短軸相差越大時,說明長軸方向所代表的變量包含原始信息越多,那么用這個新變量來代替原始的兩個變量(即忽略包含少數(shù)信息的短軸變量)也就越合理,從而二維數(shù)據(jù)就可以降低為一維數(shù)據(jù)。但現(xiàn)實數(shù)據(jù)往往并不滿足這樣的條件,這就需要把原始數(shù)據(jù)構成的坐標系進行旋轉,產生一個新的坐標系,使得新坐標系的橫軸和縱軸與橢圓的長短軸平行,實質上也就是把原數(shù)據(jù)中的兩個變量變換成兩個新的變量。主成分分析的基本思想是什么?*現(xiàn)在沿橢圓的長軸設定一個新的坐標系,則新產生的兩個變量和原*主成分分析的基本思想就是把原始數(shù)據(jù)構成的橢圓的主軸找出來,再用代表絕大部分信息的那個軸(也就是長軸)作為代替原始變量的新變量。多維變量降維過程類似。只要把原始數(shù)據(jù)散布的高維橢球的各個主軸找出來,選擇最長的幾個軸作為新變量,主成分分析就基本完成了。作為橢圓(或橢球)的主軸,它們之間是相互垂直的,在代數(shù)上,這些新變量是原始變量的線性組合,叫作主成分(principalcomponent)。原始數(shù)據(jù)中有幾個變量,它們構成的橢球就有幾個主軸,也就意味著最終可以找到幾個主成分。主成分分析的基本思想是什么?*主成分分析的基本思想就是把原始數(shù)據(jù)構成的橢圓的主軸找出來,*降維的目的,是選擇越少的主成分來代表原先的變量效果越好。根據(jù)主成分分析的思想,選擇的標準則是要求被選中的主成分所對應的主軸的長度之和能夠占所有主軸長度總和的大部分。至于占到多少才足夠具有代表性,并沒有一個硬性的說法。在實際中,如果數(shù)據(jù)中包含的變量之間相關性很差,降維也就很難實現(xiàn),因為不相關的變量顯然無法找到一個很好的共同的代表。所以具體選幾個主成分,要視實際情況而定。有些文獻建議,所選的主軸總長度占所有主軸長度之和的大約85%即可,其實,這只是一個大體的說法,具體選幾個,要看實際情況而定。主成分分析的基本思想是什么?*降維的目的,是選擇越少的主成分來代表原先的變量效果越好。主*數(shù)學上的處理是將p個指標作線性組合,作為新的綜合指標。如果第一個線性組合,即第一個綜合指標記為F1。自然希望F1中更多地反映原來指標的信息。這里的“信息”是用F1的方差Var(F1)來表示。Var(F1)越大,表示F1包含的信息越多。在所有的線性組合中,所選的第1個主成分應該是方差最大的。如果第1個主成分不足以代表原來p個指標的信息,再考慮選擇第2個線性組合,即第2個主成分F2。依此類推,可以選出第3個,第4個,…,第p個主成分。這些主成分間互不相關,且方差遞減。主成分分析的數(shù)學模型*數(shù)學上的處理是將p個指標作線性組合,作為新的綜合指標。主成*對原來的p個指標進行標準化,以消除變量在水平和量綱上的影響。根據(jù)標準化后的數(shù)據(jù)矩陣求出協(xié)方差矩陣求出協(xié)方差矩陣的特征根和特征向量確定主成分,并對各主成分所包含的信息給予適當?shù)慕忉?。主成分分析的步驟*對原來的p個指標進行標準化,以消除變量在水平和量綱上的影響*8.1.2如何選擇主成分?8.1主成分分析*8.1.2如何選擇主成分?8.1主成分分析*用SPSS實現(xiàn)主成分分析第1步:選擇【分析】下拉菜單,并選擇【降維-因子分析
】選項進入主對話框;第2步:在主對話框中將原始數(shù)據(jù)中的所有變量選入【變量】;第3步:點擊【抽取】,在【輸出】下選擇【碎石圖】,點擊【繼續(xù)】回到主對話框;第4步:點擊【旋轉】,在【輸出】下選擇【載荷圖】,點擊【繼續(xù)】回到主對話框,點擊【確定】。
用SPSS對例8.1實現(xiàn)主成分分析*用SPSS實現(xiàn)主成分分析第1步:選擇【分析】下拉菜單,并選*如何選擇主成分?解:例8.1中的數(shù)據(jù)主成分分析的SPSS輸出結果如下表解釋的總方差成份初始特征值提取平方和載入合計方差的%累積%合計方差的%累積%13.72962.14662.1463.72962.14662.14621.20620.09682.2421.20620.09682.2423.4036.72488.9664.3255.41494.3805.2043.39597.7756.1342.225100.000提取方法:主成份分析。*如何選擇主成分?解:例8.1中的數(shù)據(jù)主成分分析的SPSS輸*表中的“初始特征根”對應的就是關于主成分的信息。“初始特征根”下面的第一列“合計”即原始數(shù)據(jù)構成的高維橢球的六個主軸的長度,數(shù)學上又稱之為特征值。特征根可以看作是主成分影響力度的指標,代表引入該主成分后可以解釋平均原始變量的信息。如果特征根小于1,說明該主成分的解釋力度還不如直接引入一個原始變量的平均解釋力度大。因此可以用特征根大于1作為納入標準。第二列“方差的%”則是每個主軸長度占所有主軸長度總和(也就是所有特征值的總和,又叫總方差)的百分比。表明該主成分的方差占全部總方差的比重(也稱為主成分的方差貢獻率)。第三列“方差%”分別對應的就是由大到小排列的前若干個主軸長度之和占所有主軸長度總和的累積百分比(累計貢獻率)。如何選擇主成分?*表中的“初始特征根”對應的就是關于主成分的信息。如何選擇主*最長的主軸(即第一主成分)長度為3.729,它占六個主軸長度總和的62.164%;第二長的主軸(即第二主成分)長度為1.206,占所有主軸長度總和的20.096%。二者的長度之和累積起來則占到了所有主軸長度總和的82.242%。后面四個主軸的長度在所有主軸長度總和中所占的比例相對較小,從而對代表原先六個變量的貢獻越來越少。因此在這里我們采用SPSS輸出結果中所建議的(表中最右側三列),對例8.1的數(shù)據(jù)選擇頭兩個主成分。如何選擇主成分?*最長的主軸(即第一主成分)長度為3.729,它占六個主軸長*SPSS還提供了一個更為直觀的圖形工具來幫助選擇主成分,即碎石圖(ScreePlot)從碎石圖中可以直觀的看到例8.1中六個主軸長度變化的趨勢。實踐中,通常結合具體情況,選擇碎石圖中變化趨勢出現(xiàn)拐點的前幾個主成分作為原先變量的代表,在該例中選擇前兩個主成分即可。如何選擇主成分?*SPSS還提供了一個更為直觀的圖形工具來幫助選擇主成分,即*8.1.3怎樣解釋主成分?8.1主成分分析*8.1.3怎樣解釋主成分?8.1主成分分析*尋找主成分的過程實質上就是尋找橢球主軸的過程,而這些主軸所代表的新變量在代數(shù)上是原始變量的線性組合(坐標旋轉)。SPSS同樣可以自動輸出關于這些組合的計算結果。下表即例8.1的主成分載荷矩陣。怎樣解釋主成分?成份矩陣a成份12數(shù)學-.778.430物理-.580.682化學-.784.318語文.893.312歷史.826.406英語.833.438提取方法:主成份。a.已提取了2個成份。*尋找主成分的過程實質上就是尋找橢球主軸的過程,而這些主軸所*輸出結果“成分矩陣”中的每一列分別給出了所選擇的每一個主成分作為原始變量線性組合的系數(shù)。如果我們分別用表示原始數(shù)據(jù)中的六門課程成績,而用表示六個主成分,那么根據(jù)表中給出的結果,我們選擇的頭兩個主成分與原先六個變量的關系如下:怎樣解釋主成分?*輸出結果“成分矩陣”中的每一列分別給出了所選擇的每一個主成*主成分對應原始變量的每一個系數(shù)實質上就是主成分與原先每一個變量之間的線性相關系數(shù),稱為主成分載荷(Loading)。理論上而言,相關系數(shù)(絕對值)越大,說明主成分與該變量之間的線性相關關系越強,從而主成分對該變量的代表性也就越大。例8.1中提取的第一主成分與原先六個變量之間的相關系數(shù)都較大(與“物理”的相關系數(shù)相對偏低),說明它可以充分的解釋原先的所有變量。而第二主成分只與原始數(shù)據(jù)中的“物理”有較大的相關關系,與其他變量的相關系數(shù)均較小,這可能是由于“物理”這門課程與其他課程性質上較大的區(qū)別所導致的。
怎樣解釋主成分?*主成分對應原始變量的每一個系數(shù)實質上就是主成分與原先每一個*對于提取兩個主成分的情形,SPSS還提供了一張二維圖來直觀顯示它們對原始變量的解釋情況圖中把原先的每一個變量與提取的兩個主成分之間的相關系數(shù)分別作為坐標系中兩個方向的坐標值,這樣每一個變量對應的主成分載荷就對應坐標系中的一個點,因此人們把這種圖形稱為載荷圖(LoadingPlot)怎樣解釋主成分?*對于提取兩個主成分的情形,SPSS還提供了一張二維圖來直觀*實際中,主成分分析的一個重要應用則在于利用主成分與原始變量之間的線性關系,可以根據(jù)每一個觀測對象各個變量的原始取值,計算出其所對應的各個主成分的值。這樣便可以按照少數(shù)幾個主成分的數(shù)值,簡單明了的分析研究對象的狀況,從而解決對包含多個復雜變量的數(shù)據(jù)進行排序、評價等問題。比如例8.1,我們就可以把每個學生的六門課程測試成績的數(shù)據(jù)轉換成兩個主成分的值,然后再按照它們的大小對各個學生的成績進行比較。怎樣解釋主成分?*實際中,主成分分析的一個重要應用則在于利用主成分與原始變量*案例分析
中國上市公司財務績效綜合評價
1、案例背景上市公司的財務績效是指上市公司在一定期間的盈利能力、資產質量、經營增長等方面的有關信息。了解了不同上市公司的財務績效,有利于投資者等信息使用者據(jù)以評價企業(yè)盈利能力、預測企業(yè)成長潛力、進而做出更加準確的相關經濟決策。*案例分析
中國上市公司財務績效綜合評價1、案例背景*案例分析2、案例分析指標設定與數(shù)據(jù)來源(1)指標設定??冃гu價要依靠財務指標,而財務指標企業(yè)總結和評價財務狀況和經營成果的相對指標。因此我們選擇了對于上市公司來說具有意義的指標:每股收益(x1)、每股營業(yè)利潤(x2)、每股息稅前利潤(x3)、每股未分配利潤(x4)、資產報酬率(x5)和資產凈利率(x6)\銷售凈利率(x7)、營業(yè)利潤率(x8);成本費用率(x9)
(2)案例數(shù)據(jù)*案例分析2、案例分析指標設定與數(shù)據(jù)來源*案例分析3、案例擬解決的問題試建立上市公司經營績效評價模型,并對選取的樣本上市公司進行財務績效。4、案例分析要求通過本案例,使學生掌握以下內容:(1)主成分的基本思想。(2)主成分在實際應用中的主要作用。(3)由協(xié)方差矩陣和相關矩陣求主成分有什么不同。(4)能夠用SPSS軟件進行主成分分析。(5)理解主成分命名的依據(jù)。*案例分析3、案例擬解決的問題*8.2因子分析
8.2.1什么是因子分析?
8.2.2怎樣解釋因子分析結果?
8.2.3幾點說明第8章用少數(shù)變量代表多個變量*8.2因子分析第8章用少數(shù)變量代表多個變量*8.2.1什么是因子分析?8.2因子分析*8.2.1什么是因子分析?8.2因子分析*因子分析和主成分分析有很多相似之處,它們的目的是一致的,都是要將具有一定關聯(lián)的多個變量進行高度概括,尋找合適的少數(shù)變量來代表原先的所有變量。尤其在計算機上實現(xiàn)時,兩種方法所要耗費的時間并沒有太大差異,除了可能有一兩個選項不同之外,它們的輸出結果所包含的內容十分類似。因此,人們往往對二者不加區(qū)分。實質上,主成分分析可以看作是因子分析的一個特例,因子分析是主成分分析的推廣和發(fā)展,二者最直觀的區(qū)別就在于變量和主成分/因子個數(shù)的一致性上。主成分分析的基本思想是要尋找高維橢球的所有主軸,因此,原始數(shù)據(jù)包含了多少個變量,就有多少個主成分,人們對于主成分的選擇是依據(jù)最終的分析結果來確定的。而因子分析則需要事先確定要找?guī)讉€成分,也就是所謂的因子(Factor),因子個數(shù)從一開始可能就遠少于原始變量的個數(shù)。
什么是因子分析?*因子分析和主成分分析有很多相似之處,它們的目的是一致的,都*因子分析是由CharlesSpearman在1904年提出的,他被公認為因子分析之父。因子分析在某種程度上可以被看成是主成分分析的推廣和擴展。因子分析對問題的研究更深入,它是將具有錯綜復雜關系的變量綜合為少數(shù)的幾個因子,以再現(xiàn)原始變量與因子之間的相互關系,探討多個能夠直接測量、并具有一定相關性的實測指標是如何受少數(shù)幾個獨立因子所支配的,同時根據(jù)不同因子還可以對變量進行分類。因子分析是多元統(tǒng)計中處理降維的一種統(tǒng)計方法。什么是因子分析?
(FactorAnalysis)*因子分析是由CharlesSpearman在1904年提*原始變量和因子個數(shù)的不一致,使得不僅在數(shù)學模型上,而且在實際求解過程中,因子分析和主成分分析都有著一定的區(qū)別,計算上因子分析更為復雜。因子分析可能存在的一個優(yōu)點是:在對主成分和原始變量之間的關系進行描述時,如果主成分的直觀意義比較模糊不易解釋,主成分分析沒有更好的改進方法;因子分析則額外提供了“因子旋轉(factorrotation)”這樣一個步驟,可以使分析結果盡可能達到易于解釋且更為合理的目的。什么是因子分析?
(FactorAnalysis)*原始變量和因子個數(shù)的不一致,使得不僅在數(shù)學模型上,而且在實*8.2.2怎樣解釋因子分析結果?8.2因子分析*8.2.2怎樣解釋因子分析結果?8.2因子分析*用SPSS實現(xiàn)因子分析第1步:選擇【分析】下拉菜單,并選擇【降維-因子分析】選項進入主對話框;第2步:在主對話框中將原始數(shù)據(jù)中的所有變量選入【變量】;第3步:點擊【抽取】,在【方法】下選擇一種方法,在【輸出】下選擇
【碎石圖】,在【抽取】下可以選擇按照特征值大小選因子,也可以選定因子的個數(shù),點擊【繼續(xù)】回到主對話框;第4步:點擊【旋轉】,在【方法】下選擇一種旋轉方法,在【輸出】下選擇【旋轉解】和【載荷圖】,點擊【繼續(xù)】回到主對話框;第5步:點擊【得分】,并選擇【輸出因子得分系數(shù)矩陣
】,點擊【確定】
用SPSS對例8.1實現(xiàn)因子分析*用SPSS實現(xiàn)因子分析第1步:選擇【分析】下拉菜單,并選擇*Principalcomponents(主成分法):這是默認選項(多數(shù)情況下不用更改)。通過主成分分析的思想提取公因子,它假設變量是因子的線性組合。UnweightLeastSquare(不加權最小平方法):該方法使實際的相關矩陣和再生的相關矩陣之差的平方和達到最小。GeneralizedLeastSquare(加權最小平方法):用變量值進行加權,該方法也是使實際的相關矩陣和再生的相關矩陣之差的平方和達到最小。MaximumLikelihood(最大似然法):該方法不要求數(shù)據(jù)服從正態(tài)分布,在樣本量較大時使用較好。PrincipalAxisFactoring(主軸因子法):該方法從原始變量的相關性出發(fā),使得變量間的相關程度盡可能地被公因子解釋。提取公因子的方法
(SPSS)*Principalcomponents(主成分法):這是*SPSS提供5種旋轉方法,其中最常用的是Varimax(方差最大正交旋轉)和Promax。Varimax(方差最大正交旋轉):這是最常用的旋轉方法。使各因子保持正交狀態(tài),但盡量使各因子的方差達到最大,即相對的載荷平方和達到最大,從而方便對因子的解釋。Quartimax(四次方最大正交旋轉):該方法傾向于減少和每個變量有關的因子數(shù),從而簡化對原變量的解釋。Equamax(平方最大正交旋轉):該方法介于方差最大正交旋轉和四次方最大正交旋轉之間。DirectOblimin(斜交旋轉):該方法需要事先指定一個因子映像的自相關范圍。Promax:該方法在方差最大正交旋轉的基礎上進行斜交旋轉因子旋轉的方法
(SPSS)*SPSS提供5種旋轉方法,其中最常用的是Varimax(方*例8.1數(shù)據(jù)的因子分析。在SPSS中,因子分析與主成分分析類似,也可以根據(jù)各個特征值的大小來選擇因子,也可以繪制直觀的碎石圖來幫助判斷,標準也是類似的。不同的是,因子分析可以通過“因子旋轉”這一步驟得到下表的旋轉后的因子載荷矩陣。怎樣解釋因子分析結果?旋轉成份矩陣a
成份12
數(shù)學-.341.821
物理-.028.895
化學-.415.737
語文.893-.312
歷史.899-.196
英語.924-.176
提取方法:主成份。旋轉法:具有Kaiser標準化的正交旋轉法。
a.旋轉在3次迭代后收斂。
*例8.1數(shù)據(jù)的因子分析。在SPSS中,因子分析與主成分分析*在上表的輸出結果中,每一個數(shù)值同樣代表了所選擇的因子和原先的每一個變量之間的相關系數(shù),因此稱之為因子載荷(factorloading)。這個表也就描述了原先的六個變量與兩個因子的關系,但有所不同的是,具體的關系表達式改變了。仍以表示原始數(shù)據(jù)中的六門課程成績,而用表示兩個因子,根據(jù)上面的輸出結果,因子和這些原始變量之間的關系為:
怎樣解釋因子分析結果?*在上表的輸出結果中,每一個數(shù)值同樣代表了所選擇的因子和原先*這里因子寫在了方程的右邊,而原始變量寫在了方程的左邊,與主成分分析中主成分載荷矩陣給出的表達式恰好相反。但兩種分析方法下得到的系數(shù)均是各個成分(因子)與各個原始變量之間的線性相關系數(shù),所以系數(shù)的絕對值大小都說明了成分(因子)對原始變量的解釋程度。因子分析得到的兩個因子的旋轉后因子載荷表現(xiàn)出了較為明顯的特征。第一個因子和“語文”、“歷史”、“英語”三門課程成績相關關系最強,且均為正值,與其他三門課程成績的關系較弱;第二個因子則恰好相反,它與“數(shù)學”、“物理”、“化學”三門課程成績的相關關系最強,也均為正值。
相對于前面的主成分分析,這樣的結果似乎能夠使人們更容易結合實際,對兩個因子的直觀意義進行合理說明,即可以給第一個因子取名為“文科因子”,第二個因子取名為“理科因子”。
怎樣解釋因子分析結果?*這里因子寫在了方程的右邊,而原始變量寫在了方程的左邊,與主*該矩陣給出了每個因子作為所有原始變量線性組合的系數(shù)。根據(jù)這些系數(shù)便可以計算每個學生對應的第一個因子和第二個因子的取值,我們把它們稱為因子得分(factorscore)。有了因子得分,我們就可以對每個學生分別按照“文科因子”水平和“理科因子”水平進行評價和排序。
怎樣解釋因子分析結果?成份得分系數(shù)矩陣
成份
12數(shù)學.059.409
物理.231.539
化學.000.337
語文.349.054
歷史.383.126
英語.401.145
提取方法:主成份。旋轉法:具有Kaiser標準化的正交旋轉法。構成得分。
*該矩陣給出了每個因子作為所有原始變量線性組合的系數(shù)。根據(jù)這*樣本量要足夠大。一般而言,要求樣本量至少是原始變量總數(shù)的5倍以上。如果要得到比較理想的結果,則應該在10倍以上。此外,樣本總量也應足夠大,理論要求應該在100以上。各原始變量間應該具有相關性。如果變量獨立,則無法提取公共因子,因子分析也就沒有意義了。因子分析中各公因子應該具有實際意義。因子分析的注意事項*樣本量要足夠大。一般而言,要求樣本量至少是原始變量總數(shù)的5*8.2.3幾點說明8.2因子分析*8.2.3幾點說明8.2因子分析*作為多元分析中處理降維的兩種統(tǒng)計方法,無論是主成分分析還是因子分析,我們已經知道,只有當原始數(shù)據(jù)中的變量之間具有較強的相關關系時,降維的效果才會明顯,試圖用少數(shù)幾個變量代表多個變量的操作才是可行的。對于主成分和因子的選擇標準也應基于定量分析的結果,結合具體情況予以確定。而選出的主成分或因子雖然都可以表示成原始變量的線性組合,并且人們總是希望能夠根據(jù)它們之間的關系特征對主成分或因子進行命名,但結果并不會總是那么清晰。即使得到了滿意的主成分或因子,在運用它們對實際問題進行評價、排序等分析時,仍然要保持高度謹慎。幾點說明*作為多元分析中處理降維的兩種統(tǒng)計方法,無論是主成分分析還是*案例討論1、案例背景20世紀90年代以來,中國城鎮(zhèn)居民的消費水平和消費結構發(fā)生了很大的變化,具體表現(xiàn)為:城鎮(zhèn)居民的消費水平有了較大幅度的提高;食品消費仍占有很大比重,但恩格爾系數(shù)下降;發(fā)展性和享受性消費比重提高;服務性消費的需求不斷上升;城鎮(zhèn)居民家庭的教育投入增長迅速,文化消費增長卻依然緩慢,比重過小等等。消費作為經濟活動中的一環(huán),是實現(xiàn)經濟健康平穩(wěn)發(fā)展的關鍵,而消費結構作為消費的具體內容,它的合理與否,又是消費的關鍵問題。因而,正確把握城鎮(zhèn)居民消費結構的現(xiàn)狀及地域間差異具有重要的現(xiàn)實意義。*案例討論1、案例背景*案例討論2、案例分析指標設定與數(shù)據(jù)來源(1)指標設定。本案例引2013年《中國統(tǒng)計年鑒》的八項城鎮(zhèn)居民家庭人均消費支出數(shù)據(jù)進行分析,包括:食品(X1)、衣著(X2)、家庭設備用品及服務(X3)、醫(yī)療保?。╔4)、交通通訊(X5)、文教娛樂及服務(X6)、居?。╔7)、雜項商品及服務(X8),應用因子分析和聚類分析方法對2012年中國各地區(qū)消費結構差異性和相似性進行統(tǒng)計分析。(2)數(shù)據(jù)來源我們選取的指標數(shù)據(jù)全部來源2013年《中國統(tǒng)計年鑒》,總計個體案例數(shù)量31,有效樣本案例數(shù)量31,對31個省市自治區(qū)進行因子分析和聚類分析。*案例討論2、案例分析指標設定與數(shù)據(jù)來源*案例討論3、案例分析要求通過本案例,使學生掌握以下內容:(1)因子分析和聚類分析的基本思想。(2)因子分析在實際問題分析中的主要作用。(3)數(shù)量掌握因子分析的具體操作,能夠讀懂分析結果的含義,并能依據(jù)分析結果對因子分析效果進行評價(4)能夠用SPSS軟件進行主成分分析。(5)能夠靈活運用因子分析方法進行實際數(shù)據(jù)的分析。(6)利用因子得分對個案進行聚類。*案例討論3、案例分析要求消除隱患,確保安全,保障穩(wěn)定,促進發(fā)展。11月-2211月-22Monday,November7,2022人民消防人民辦,辦好消防為人民。01:38:3601:38:3601:3811/7/20221:38:36AM做好安全工作,樹立企業(yè)形象。11月-2201:38:3601:38Nov-2207-Nov-22絆人的樁不在高,違章的事不在小。01:38:3601:38:3601:38Monday,November7,2022人人保安全,家家笑開顏。11月-2211月-2201:38:3601:38:36November7,2022每項振作求質量,產品質量有保障。2022年11月7日1:38上午11月-2211月-22人人有專職,工人有程序,檢查有標準,做好留證據(jù)。07十一月20221:38:36上午01:38:3611月-22由前至后一條拉,從上到下一條心。十一月221:38上午11月-2201:38November7,2022創(chuàng)名牌、奪優(yōu)質,全廠員工齊努力。2022/11/71:38:3601:38:3607November2022質量放松,勞而無功.安全發(fā)展,國泰民安。1:38:36上午1:38上午01:38:3611月-22讀安全書,做安全人。體系有效運行,銷售蒸蒸日上。11月-2211月-2201:3801:38:3601:38:36Nov-22同心協(xié)力,提高品質。2022/11/71:38:36Monday,November7,2022質量是制造出來的,而不是檢驗出來的。11月-222022/11/71:38:3611月-22謝謝大家!消除隱患,確保安全,保障穩(wěn)定,促進發(fā)展。11月-2211月-*應用統(tǒng)計應
用
統(tǒng)
計
學
AppliedStatistics*應用應用統(tǒng)計學
AppliedStatisti*如果你要到裁縫店定做一件上衣,需要測量很多尺寸,譬如身長、袖長、胸圍、腰圍、肩寬、肩厚等。但服裝廠要生產一批新型服裝,卻不可能完全按照每個人的這些尺寸來對型號進行劃分,而是把各個方面進行高度概括,用少數(shù)幾個指標作為分類的型號,簡單明了的反映不同人群的體態(tài)特征。日常生活中經常遇到包含很多變量的數(shù)據(jù),比如各個地區(qū)的若干經濟指標數(shù)據(jù),上市公司財務報表公布的多項財務數(shù)據(jù)等等。這些數(shù)據(jù)中的變量雖然很多,但往往相互之間都有著一定的關聯(lián),這使得只要找出少數(shù)幾個“代表”就可以對復雜的信息進行比較完整的描述了。主成分分析和因子分析便是實現(xiàn)這一過程的兩種方法。*如果你要到裁縫店定做一件上衣,需要測量很多尺寸,譬如身長、*第8章用少數(shù)變量代表多個變量8.1
主成分分析8.2因子分析*第8章用少數(shù)變量代表多個變量8.1主成分分*在研究實際問題時,往往需要收集多個變量。但這樣會使多個變量間存在較強的相關關系,即這些變量間存在較多的信息重復,直接利用它們進行分析,不但模型復雜,還會因為變量間存在多重共線性而引起較大的誤差。為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來較多的舊變量,同時要求這些新變量盡可能反映原變量的信息。主成分分析和因子分子正是解決這類問題的有效方法。它們能夠提取信息,使變量簡化降維,從而使問題更加簡單直觀。主成分分析和因子分析
(PrincipalComponentAnalysis&FactorAnalysis)*在研究實際問題時,往往需要收集多個變量。但這樣會使多個變量*8.1主成分分析
8.1.1主成分分析的基本思想是什么?
8.1.2如何選擇主成分?
8.1.3怎樣解釋主成分?
第8章用少數(shù)變量代表多個變量*8.1主成分分析第8章用少數(shù)變量代表多個變*8.1.1主成分分析的基本思想是什么?8.1主成分分析*8.1.1主成分分析的基本思想是什么?8.1主成*主成分的概念由KarlPearson在1901年提出考察多個變量間相關性的一種多元統(tǒng)計方法研究如何通過少數(shù)幾個主成分來解釋多個變量間的內部結構。即從原始變量中導出少數(shù)幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關。主成分分析的目的:數(shù)據(jù)的壓縮;數(shù)據(jù)的解釋它常被用來尋找判斷事物或現(xiàn)象的綜合指標,并對綜合指標所包含的信息進行適當?shù)慕忉?。什么是主成分分析?/p>
(PrincipalComponentAnalysis)*主成分的概念由KarlPearson在1901年提出什么*【例8.1】表8-1是北京市某高中50名學生的六門課程測試成績數(shù)據(jù)
乍一看,很難從這六門課程的測試得分來評價這50名學生的成績優(yōu)劣,也很難分析這些學生的成績分布特征。要解決這樣的問題,自然希望能把這一數(shù)據(jù)中包含的六個變量概括成一兩個綜合變量。那么這一做法是否可行呢?提煉出來的少數(shù)變量能夠代表原數(shù)據(jù)的多少信息?如何解釋它們呢?我們首先來了解一下主成分分析的基本思想。對于例8.1中的數(shù)據(jù),每一個學生的觀測值都包含了六個變量,所以表示在坐標系中每一個觀測值就是六維空間中的一個點,每一維就代表一個變量。把六個變量概括成一兩個綜合變量,實質上就是一個降維的過程。主成分分析的基本思想是什么?表8-1北京市某高中學生六門課程測試成績數(shù)據(jù)*【例8.1】表8-1是北京市某高中50名學生的六門課程測試*對于存在線性相關的兩個變量,直接進行分析可能由于多重共線性而無法得出正確結論。如何對這兩個變量所攜帶的信息(在統(tǒng)計上信息往往是指數(shù)據(jù)的變異)進行濃縮處理?分別用橫軸和縱軸表示兩個變量,每個觀測值就是二維坐標系中的一個點,所有的數(shù)據(jù)點大致散布成一個橢圓形,那么這個橢圓有一個長軸和一個短軸,我們稱之為主軸,主軸之間是相互垂直的。主成分分析的基本思想是什么?
(以兩個變量為例)顯然,短軸方向上,數(shù)據(jù)點之間的差異較??;長軸方向上,數(shù)據(jù)變化則較大。如果原坐標系中的橫軸和縱軸能夠分別與橢圓的長短軸平行,那么相對來說,長軸所代表的變量就描述了數(shù)據(jù)的主要變化,短軸所代表的變量則描述了數(shù)據(jù)的次要變化。*對于存在線性相關的兩個變量,直接進行分析可能由于多重共線性*現(xiàn)在沿橢圓的長軸設定一個新的坐標系,則新產生的兩個變量和原始變量之間存在明顯的數(shù)學換算關系。但這兩個變量彼此不相關,且信息量的分布顯然不同。長軸變量攜帶了大部分數(shù)據(jù)變異的信息,而短軸變量只攜帶了一小部分變異信息。橢圓的長軸和短軸相差越大時,說明長軸方向所代表的變量包含原始信息越多,那么用這個新變量來代替原始的兩個變量(即忽略包含少數(shù)信息的短軸變量)也就越合理,從而二維數(shù)據(jù)就可以降低為一維數(shù)據(jù)。但現(xiàn)實數(shù)據(jù)往往并不滿足這樣的條件,這就需要把原始數(shù)據(jù)構成的坐標系進行旋轉,產生一個新的坐標系,使得新坐標系的橫軸和縱軸與橢圓的長短軸平行,實質上也就是把原數(shù)據(jù)中的兩個變量變換成兩個新的變量。主成分分析的基本思想是什么?*現(xiàn)在沿橢圓的長軸設定一個新的坐標系,則新產生的兩個變量和原*主成分分析的基本思想就是把原始數(shù)據(jù)構成的橢圓的主軸找出來,再用代表絕大部分信息的那個軸(也就是長軸)作為代替原始變量的新變量。多維變量降維過程類似。只要把原始數(shù)據(jù)散布的高維橢球的各個主軸找出來,選擇最長的幾個軸作為新變量,主成分分析就基本完成了。作為橢圓(或橢球)的主軸,它們之間是相互垂直的,在代數(shù)上,這些新變量是原始變量的線性組合,叫作主成分(principalcomponent)。原始數(shù)據(jù)中有幾個變量,它們構成的橢球就有幾個主軸,也就意味著最終可以找到幾個主成分。主成分分析的基本思想是什么?*主成分分析的基本思想就是把原始數(shù)據(jù)構成的橢圓的主軸找出來,*降維的目的,是選擇越少的主成分來代表原先的變量效果越好。根據(jù)主成分分析的思想,選擇的標準則是要求被選中的主成分所對應的主軸的長度之和能夠占所有主軸長度總和的大部分。至于占到多少才足夠具有代表性,并沒有一個硬性的說法。在實際中,如果數(shù)據(jù)中包含的變量之間相關性很差,降維也就很難實現(xiàn),因為不相關的變量顯然無法找到一個很好的共同的代表。所以具體選幾個主成分,要視實際情況而定。有些文獻建議,所選的主軸總長度占所有主軸長度之和的大約85%即可,其實,這只是一個大體的說法,具體選幾個,要看實際情況而定。主成分分析的基本思想是什么?*降維的目的,是選擇越少的主成分來代表原先的變量效果越好。主*數(shù)學上的處理是將p個指標作線性組合,作為新的綜合指標。如果第一個線性組合,即第一個綜合指標記為F1。自然希望F1中更多地反映原來指標的信息。這里的“信息”是用F1的方差Var(F1)來表示。Var(F1)越大,表示F1包含的信息越多。在所有的線性組合中,所選的第1個主成分應該是方差最大的。如果第1個主成分不足以代表原來p個指標的信息,再考慮選擇第2個線性組合,即第2個主成分F2。依此類推,可以選出第3個,第4個,…,第p個主成分。這些主成分間互不相關,且方差遞減。主成分分析的數(shù)學模型*數(shù)學上的處理是將p個指標作線性組合,作為新的綜合指標。主成*對原來的p個指標進行標準化,以消除變量在水平和量綱上的影響。根據(jù)標準化后的數(shù)據(jù)矩陣求出協(xié)方差矩陣求出協(xié)方差矩陣的特征根和特征向量確定主成分,并對各主成分所包含的信息給予適當?shù)慕忉?。主成分分析的步驟*對原來的p個指標進行標準化,以消除變量在水平和量綱上的影響*8.1.2如何選擇主成分?8.1主成分分析*8.1.2如何選擇主成分?8.1主成分分析*用SPSS實現(xiàn)主成分分析第1步:選擇【分析】下拉菜單,并選擇【降維-因子分析
】選項進入主對話框;第2步:在主對話框中將原始數(shù)據(jù)中的所有變量選入【變量】;第3步:點擊【抽取】,在【輸出】下選擇【碎石圖】,點擊【繼續(xù)】回到主對話框;第4步:點擊【旋轉】,在【輸出】下選擇【載荷圖】,點擊【繼續(xù)】回到主對話框,點擊【確定】。
用SPSS對例8.1實現(xiàn)主成分分析*用SPSS實現(xiàn)主成分分析第1步:選擇【分析】下拉菜單,并選*如何選擇主成分?解:例8.1中的數(shù)據(jù)主成分分析的SPSS輸出結果如下表解釋的總方差成份初始特征值提取平方和載入合計方差的%累積%合計方差的%累積%13.72962.14662.1463.72962.14662.14621.20620.09682.2421.20620.09682.2423.4036.72488.9664.3255.41494.3805.2043.39597.7756.1342.225100.000提取方法:主成份分析。*如何選擇主成分?解:例8.1中的數(shù)據(jù)主成分分析的SPSS輸*表中的“初始特征根”對應的就是關于主成分的信息?!俺跏继卣鞲毕旅娴牡谝涣小昂嫌嫛奔丛紨?shù)據(jù)構成的高維橢球的六個主軸的長度,數(shù)學上又稱之為特征值。特征根可以看作是主成分影響力度的指標,代表引入該主成分后可以解釋平均原始變量的信息。如果特征根小于1,說明該主成分的解釋力度還不如直接引入一個原始變量的平均解釋力度大。因此可以用特征根大于1作為納入標準。第二列“方差的%”則是每個主軸長度占所有主軸長度總和(也就是所有特征值的總和,又叫總方差)的百分比。表明該主成分的方差占全部總方差的比重(也稱為主成分的方差貢獻率)。第三列“方差%”分別對應的就是由大到小排列的前若干個主軸長度之和占所有主軸長度總和的累積百分比(累計貢獻率)。如何選擇主成分?*表中的“初始特征根”對應的就是關于主成分的信息。如何選擇主*最長的主軸(即第一主成分)長度為3.729,它占六個主軸長度總和的62.164%;第二長的主軸(即第二主成分)長度為1.206,占所有主軸長度總和的20.096%。二者的長度之和累積起來則占到了所有主軸長度總和的82.242%。后面四個主軸的長度在所有主軸長度總和中所占的比例相對較小,從而對代表原先六個變量的貢獻越來越少。因此在這里我們采用SPSS輸出結果中所建議的(表中最右側三列),對例8.1的數(shù)據(jù)選擇頭兩個主成分。如何選擇主成分?*最長的主軸(即第一主成分)長度為3.729,它占六個主軸長*SPSS還提供了一個更為直觀的圖形工具來幫助選擇主成分,即碎石圖(ScreePlot)從碎石圖中可以直觀的看到例8.1中六個主軸長度變化的趨勢。實踐中,通常結合具體情況,選擇碎石圖中變化趨勢出現(xiàn)拐點的前幾個主成分作為原先變量的代表,在該例中選擇前兩個主成分即可。如何選擇主成分?*SPSS還提供了一個更為直觀的圖形工具來幫助選擇主成分,即*8.1.3怎樣解釋主成分?8.1主成分分析*8.1.3怎樣解釋主成分?8.1主成分分析*尋找主成分的過程實質上就是尋找橢球主軸的過程,而這些主軸所代表的新變量在代數(shù)上是原始變量的線性組合(坐標旋轉)。SPSS同樣可以自動輸出關于這些組合的計算結果。下表即例8.1的主成分載荷矩陣。怎樣解釋主成分?成份矩陣a成份12數(shù)學-.778.430物理-.580.682化學-.784.318語文.893.312歷史.826.406英語.833.438提取方法:主成份。a.已提取了2個成份。*尋找主成分的過程實質上就是尋找橢球主軸的過程,而這些主軸所*輸出結果“成分矩陣”中的每一列分別給出了所選擇的每一個主成分作為原始變量線性組合的系數(shù)。如果我們分別用表示原始數(shù)據(jù)中的六門課程成績,而用表示六個主成分,那么根據(jù)表中給出的結果,我們選擇的頭兩個主成分與原先六個變量的關系如下:怎樣解釋主成分?*輸出結果“成分矩陣”中的每一列分別給出了所選擇的每一個主成*主成分對應原始變量的每一個系數(shù)實質上就是主成分與原先每一個變量之間的線性相關系數(shù),稱為主成分載荷(Loading)。理論上而言,相關系數(shù)(絕對值)越大,說明主成分與該變量之間的線性相關關系越強,從而主成分對該變量的代表性也就越大。例8.1中提取的第一主成分與原先六個變量之間的相關系數(shù)都較大(與“物理”的相關系數(shù)相對偏低),說明它可以充分的解釋原先的所有變量。而第二主成分只與原始數(shù)據(jù)中的“物理”有較大的相關關系,與其他變量的相關系數(shù)均較小,這可能是由于“物理”這門課程與其他課程性質上較大的區(qū)別所導致的。
怎樣解釋主成分?*主成分對應原始變量的每一個系數(shù)實質上就是主成分與原先每一個*對于提取兩個主成分的情形,SPSS還提供了一張二維圖來直觀顯示它們對原始變量的解釋情況圖中把原先的每一個變量與提取的兩個主成分之間的相關系數(shù)分別作為坐標系中兩個方向的坐標值,這樣每一個變量對應的主成分載荷就對應坐標系中的一個點,因此人們把這種圖形稱為載荷圖(LoadingPlot)怎樣解釋主成分?*對于提取兩個主成分的情形,SPSS還提供了一張二維圖來直觀*實際中,主成分分析的一個重要應用則在于利用主成分與原始變量之間的線性關系,可以根據(jù)每一個觀測對象各個變量的原始取值,計算出其所對應的各個主成分的值。這樣便可以按照少數(shù)幾個主成分的數(shù)值,簡單明了的分析研究對象的狀況,從而解決對包含多個復雜變量的數(shù)據(jù)進行排序、評價等問題。比如例8.1,我們就可以把每個學生的六門課程測試成績的數(shù)據(jù)轉換成兩個主成分的值,然后再按照它們的大小對各個學生的成績進行比較。怎樣解釋主成分?*實際中,主成分分析的一個重要應用則在于利用主成分與原始變量*案例分析
中國上市公司財務績效綜合評價
1、案例背景上市公司的財務績效是指上市公司在一定期間的盈利能力、資產質量、經營增長等方面的有關信息。了解了不同上市公司的財務績效,有利于投資者等信息使用者據(jù)以評價企業(yè)盈利能力、預測企業(yè)成長潛力、進而做出更加準確的相關經濟決策。*案例分析
中國上市公司財務績效綜合評價1、案例背景*案例分析2、案例分析指標設定與數(shù)據(jù)來源(1)指標設定??冃гu價要依靠財務指標,而財務指標企業(yè)總結和評價財務狀況和經營成果的相對指標。因此我們選擇了對于上市公司來說具有意義的指標:每股收益(x1)、每股營業(yè)利潤(x2)、每股息稅前利潤(x3)、每股未分配利潤(x4)、資產報酬率(x5)和資產凈利率(x6)\銷售凈利率(x7)、營業(yè)利潤率(x8);成本費用率(x9)
(2)案例數(shù)據(jù)*案例分析2、案例分析指標設定與數(shù)據(jù)來源*案例分析3、案例擬解決的問題試建立上市公司經營績效評價模型,并對選取的樣本上市公司進行財務績效。4、案例分析要求通過本案例,使學生掌握以下內容:(1)主成分的基本思想。(2)主成分在實際應用中的主要作用。(3)由協(xié)方差矩陣和相關矩陣求主成分有什么不同。(4)能夠用SPSS軟件進行主成分分析。(5)理解主成分命名的依據(jù)。*案例分析3、案例擬解決的問題*8.2因子分析
8.2.1什么是因子分析?
8.2.2怎樣解釋因子分析結果?
8.2.3幾點說明第8章用少數(shù)變量代表多個變量*8.2因子分析第8章用少數(shù)變量代表多個變量*8.2.1什么是因子分析?8.2因子分析*8.2.1什么是因子分析?8.2因子分析*因子分析和主成分分析有很多相似之處,它們的目的是一致的,都是要將具有一定關聯(lián)的多個變量進行高度概括,尋找合適的少數(shù)變量來代表原先的所有變量。尤其在計算機上實現(xiàn)時,兩種方法所要耗費的時間并沒有太大差異,除了可能有一兩個選項不同之外,它們的輸出結果所包含的內容十分類似。因此,人們往往對二者不加區(qū)分。實質上,主成分分析可以看作是因子分析的一個特例,因子分析是主成分分析的推廣和發(fā)展,二者最直觀的區(qū)別就在于變量和主成分/因子個數(shù)的一致性上。主成分分析的基本思想是要尋找高維橢球的所有主軸,因此,原始數(shù)據(jù)包含了多少個變量,就有多少個主成分,人們對于主成分的選擇是依據(jù)最終的分析結果來確定的。而因子分析則需要事先確定要找?guī)讉€成分,也就是所謂的因子(Factor),因子個數(shù)從一開始可能就遠少于原始變量的個數(shù)。
什么是因子分析?*因子分析和主成分分析有很多相似之處,它們的目的是一致的,都*因子分析是由CharlesSpearman在1904年提出的,他被公認為因子分析之父。因子分析在某種程度上可以被看成是主成分分析的推廣和擴展。因子分析對問題的研究更深入,它是將具有錯綜復雜關系的變量綜合為少數(shù)的幾個因子,以再現(xiàn)原始變量與因子之間的相互關系,探討多個能夠直接測量、并具有一定相關性的實測指標是如何受少數(shù)幾個獨立因子所支配的,同時根據(jù)不同因子還可以對變量進行分類。因子分析是多元統(tǒng)計中處理降維的一種統(tǒng)計方法。什么是因子分析?
(FactorAnalysis)*因子分析是由CharlesSpearman在1904年提*原始變量和因子個數(shù)的不一致,使得不僅在數(shù)學模型上,而且在實際求解過程中,因子分析和主成分分析都有著一定的區(qū)別,計算上因子分析更為復雜。因子分析可能存在的一個優(yōu)點是:在對主成分和原始變量之間的關系進行描述時,如果主成分的直觀意義比較模糊不易解釋,主成分分析沒有更好的改進方法;因子分析則額外提供了“因子旋轉(factorrotation)”這樣一個步驟,可以使分析結果盡可能達到易于解釋且更為合理的目的。什么是因子分析?
(FactorAnalysis)*原始變量和因子個數(shù)的不一致,使得不僅在數(shù)學模型上,而且在實*8.2.2怎樣解釋因子分析結果?8.2因子分析*8.2.2怎樣解釋因子分析結果?8.2因子分析*用SPSS實現(xiàn)因子分析第1步:選擇【分析】下拉菜單,并選擇【降維-因子分析】選項進入主對話框;第2步:在主對話框中將原始數(shù)據(jù)中的所有變量選入【變量】;第3步:點擊【抽取】,在【方法】下選擇一種方法,在【輸出】下選擇
【碎石圖】,在【抽取】下可以選擇按照特征值大小選因子,也可以選定因子的個數(shù),點擊【繼續(xù)】回到主對話框;第4步:點擊【旋轉】,在【方法】下選擇一種旋轉方法,在【輸出】下選擇【旋轉解】和【載荷圖】,點擊【繼續(xù)】回到主對話框;第5步:點擊【得分】,并選擇【輸出因子得分系數(shù)矩陣
】,點擊【確定】
用SPSS對例8.1實現(xiàn)因子分析*用SPSS實現(xiàn)因子分析第1步:選擇【分析】下拉菜單,并選擇*Principalcomponents(主成分法):這是默認選項(多數(shù)情況下不用更改)。通過主成分分析的思想提取公因子,它假設變量是因子的線性組合。UnweightLeastSquare(不加權最小平方法):該方法使實際的相關矩陣和再生的相關矩陣之差的平方和達到最小。GeneralizedLeastSquare(加權最小平方法):用變量值進行加權,該方法也是使實際的相關矩陣和再生的相關矩陣之差的平方和達到最小。MaximumLikelihood(最大似然法):該方法不要求數(shù)據(jù)服從正態(tài)分布,在樣本量較大時使用較好。PrincipalAxisFactoring(主軸因子法):該方法從原始變量的相關性出發(fā),使得變量間的相關程度盡可能地被公因子解釋。提取公因子的方法
(SPSS)*Principalcomponents(主成分法):這是*SPSS提供5種旋轉方法,其中最常用的是Varimax(方差最大正交旋轉)和Promax。Varimax(方差最大正交旋轉):這是最常用的旋轉方法。使各因子保持正交狀態(tài),但盡量使各因子的方差達到最大,即相對的載荷平方和達到最大,從而方便對因子的解釋。Quartimax(四次方最大正交旋轉):該方法傾向于減少和每個變量有關的因子數(shù),從而簡化對原變量的解釋。Equamax(平方最大正交旋轉):該方法介于方差最大正交旋轉和四次方最大正交旋轉之間。DirectOblimin(斜交旋轉):該方法需要事先指定一個因子映像的自相關范圍。Promax:該方法在方差最大正交旋轉的基礎上進行斜交旋轉因子旋轉的方法
(SPSS)*SPSS提供5種旋轉方法,其中最常用的是Varimax(方*例8.1數(shù)據(jù)的因子分析。在SPSS中,因子分析與主成分分析類似,也可以根據(jù)各個特征值的大小來選擇因子,也可以繪制直觀的碎石圖來幫助判斷,標準也是類似的。不同的是,因子分析可以通過“因子旋轉”這一步驟得到下表的旋轉后的因子載荷矩陣。怎樣解釋因子分析結果?旋轉成份矩陣a
成份12
數(shù)學-.341.821
物理-.028.895
化學-.415.737
語文.893-.312
歷史.899-.196
英語.924-.176
提取方法:主成份。旋轉法:具有Kaiser標準化的正交旋轉法。
a.旋轉在3次迭代后收斂。
*例8.1數(shù)據(jù)的因子分析。在SPSS中,因子分析與主成分分析*在上表的輸出結果中,每一個數(shù)值同樣代表了所選擇的因子和原先的每一個變量之間的相關系數(shù),因此稱之為因子載荷(factorloading)。這個表也就描述了原先的六個變量與兩個因子的關系,但有所不同的是,具體的關系表達式改變了。仍以表示原始數(shù)據(jù)中的六門課程成績,而用表示兩個因子,根據(jù)上面的輸出結果,因子和這些原始變量之間的關系為:
怎樣解釋因子分析結果?*在上表的輸出結果中,每一個數(shù)值同樣代表了所選擇的因子和原先*這里因子寫在了方程的右邊,而原始變量寫在了方程的左邊,與主成分分析中主成分載荷矩陣給出的表達式恰好相反。但兩種分析方法下得到的系數(shù)均是各個成分(因子)與各個原始變量之間的線性相關系數(shù),所以系數(shù)的絕對值大小都說明了成分(因子)對原始變量的解釋程度。因子分析得到的兩個因子的旋轉后因子載荷表現(xiàn)出了較為明顯的特征。第一個因子和“語文”、“歷史”、“英語”三門課程成績相關關系最強,且均為正值,與其他三門課程成績的關系較弱;第二個因子則恰好相反,它與“數(shù)學”、“物理”、“化學”三門課程成績的相關關系最強,也均為正值。
相對于前面的主成分分析,這樣的結果似乎能夠使人們更容易結合實際,對兩個因子的直觀意義進行合理說明,即可以給第一個因子取名為“文科因子”,第二個因子取名為“理科因子”。
怎樣解釋因子分析結果?*這里因子寫在了方程的右邊,而原始變量寫在了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 服裝設計從靈感到設計的流程
- 2024年7月高級育嬰員測試題與答案(附解析)
- 6月保健按摩師模擬練習題含答案(附解析)
- 航標器材在航道安全保障系統(tǒng)中的應用考核試卷
- 安全用電知識培訓教材
- 《S制度執(zhí)行力》課件
- 道路安全措施施工方案
- 計劃生育與生育政策與人口流動趨勢考核試卷
- 移動通信技術在零售行業(yè)的應用考核試卷
- 四年級孩子性教育指南
- 《大禹治水的故事》課本劇劇本:感受英雄力量領略堅韌精神(6篇)
- 2018年高考英語全國一卷(精校+答案+聽力原文)
- 管道直飲水項目可行性研究報告
- 工程決算書(結算書)模板
- 河北農業(yè)大學現(xiàn)代科技學院《試驗設計與數(shù)據(jù)處理實驗》2023-2024學年第一學期期末試卷
- 零星工程維修 投標方案(技術方案)
- 統(tǒng)編版 高中語文 必修下冊 第六單元《促織》
- 2024年房屋代持協(xié)議書范本
- 2024年北京市中考模擬道德與法治試卷
- TZJATA 0025-2024 水質 總氮測定預制變色酸試劑分光光度法
- 提高護士應用PDA落實患者身份識別準確率 2
評論
0/150
提交評論