




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、本科學(xué)生綜合性、設(shè)計性實驗報告實驗課程名稱 統(tǒng)計分析軟件應(yīng)用 開課學(xué)期 2010 至 2011 學(xué)年 下 學(xué)期 上課時間 2011 年 4 月 25 日 遼寧師范大學(xué)教務(wù)處編印一、實驗方案實驗名稱:主成分分析實驗時間:2011.04.25小組合作:是 否小組成員:1、 實驗?zāi)康模赫莆罩鞒煞址治龅乃枷牒途唧w步驟。掌握SPSS實現(xiàn)主成分分析的具體操作,并對處理結(jié)果做出解釋。2、 實驗設(shè)備與材料:Windows XP;SPSS for Windows13.0等。3、 實驗方法步驟及注意事項操作步驟:(1)打開SPSS軟件,新建一數(shù)據(jù)文件,定義變量:Company(公司名稱)、X1(賠付率)、X2(凈
2、收入與總收入之比)、X3(投資收益率)、X4(再保險率)、X5(總資產(chǎn)報酬率)、X6(兩年保費收入收益率)、X7(保費收入變化率)、X8(流動性比率),這些變量中除了Company為字符串型(String)變量外,其余變量均為數(shù)值型(Numeric)變量。 (2)選擇菜單Analyze=Data Reduction=Factor進(jìn)入Factor Analysis主對話框。選定左邊列表中的變量X1、X2、X3、X4、X5、X6、X7、X8,單擊按鈕使之進(jìn)入Variables列表框。(3)單擊主對話框中的Descriptive按鈕,打開Factor Analysis:Descriptives子對話
3、框,在Statistics欄中選擇Univariate descriptives項要求輸出各變量的均值與標(biāo)準(zhǔn)差,在Correlation Matrix欄內(nèi)選擇Coefficients項要求計算相關(guān)系數(shù)矩陣,單擊Continue按鈕返回Factor Analysis主對話框。(4)單擊主對話框中的Extraction按鈕,打開Factor Analysis:Extraction子對話框。在Method列表中選擇默認(rèn)因子抽取方法Principal Components,在Analyze欄中選擇默認(rèn)的Correlation Matrix項要求從相關(guān)系數(shù)矩陣出發(fā)求解主成分,在Extract欄中選擇默認(rèn)
4、項Eigenvalues over:1,Maximum iteration convagence:選擇25,在Display中選擇Scree plot單擊Continue按鈕返回Factor Analysis主對話框。(5)Rotation和 Scores,均選擇默認(rèn)選項,單擊主對話框OK按鈕,輸出結(jié)果。注意事項:可以看出,主成分分析依賴于原始變量,也只能反映原始變量的信息。所以原始變量的選擇很重要。另外,如果原始變量都本質(zhì)上獨立,那么降維就可能失敗。這是因為很難把很多獨立變量用少數(shù)綜合的變量概括。數(shù)據(jù)越相關(guān),降維效果就越好。在得到分析的結(jié)果時,并不一定會都得到比較清楚的結(jié)果。這與問題的性質(zhì),
5、選取的原始變量以及數(shù)據(jù)的質(zhì)量等都有關(guān)系。(1)由協(xié)方差陣出發(fā)與由相關(guān)陣出發(fā)求解主成分所得結(jié)果不一致時,要恰當(dāng)?shù)倪x取某一種方法;(2)對于度量單位或是取值范圍在同量級的數(shù)據(jù),可直接求協(xié)方差陣;對于度量單位不同的指標(biāo)或是取值范圍彼此差異非常大的指標(biāo),應(yīng)考慮將數(shù)據(jù)標(biāo)準(zhǔn)化,再由協(xié)方差陣求主成分; (3)主成分分析不要求數(shù)據(jù)來源于正態(tài)分布; (4)在選取初始變量進(jìn)入分析時應(yīng)該特別注意原始變量是否存在多重共線性的 問題(最小特征根接近于零,說明存在多重共線性問題); (5)因子分析中各個公共因子之間不相關(guān),特殊因子之間不相關(guān),公共因子和特殊因子之間不相關(guān)。4、 實驗數(shù)據(jù)處理方法:選取了人保、平安、太平洋、
6、大眾、華泰、永安、華安7個保險公司的數(shù)據(jù),指標(biāo)都是正指標(biāo),無需歸一化,SPSS13.0將自動對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理,消除指標(biāo)量綱及數(shù)量級的影響。5、 參考文獻(xiàn):1 盧紋岱.SPSS for Windows統(tǒng)計分析M.電子工程出版社,20062 郭顯光. 如何用SPSS軟件進(jìn)行主成分分析J. 統(tǒng)計與信息論壇,1998, (2)3 何曉群. 現(xiàn)代統(tǒng)計分析方法與應(yīng)用M. 中國人民大學(xué)出版社,19984 余建英、何旭宏. 數(shù)據(jù)統(tǒng)計分析與SPSS應(yīng)用M. 人民郵電出版社,20036、指導(dǎo)老師對實驗設(shè)計方案的意見: 指導(dǎo)老師簽名: 年 月 日 二、實驗報告1、實驗?zāi)康?、設(shè)備與材料、理論依據(jù)、實驗方
7、法步驟見實驗設(shè)計方案2、實驗現(xiàn)象、數(shù)據(jù)及結(jié)果表1描述性統(tǒng)計量表 表2 主成分因子荷載矩陣表表3 相關(guān)系數(shù)矩陣表表4 公因子方差表 圖1 碎石圖 表5 總方差分解表3、對實驗現(xiàn)象、數(shù)據(jù)及觀察結(jié)果的分析與討論:表1是描述統(tǒng)計量表,主要列出了統(tǒng)計量的均值、方差和數(shù)據(jù)個數(shù)。表2是主成分因子荷載矩陣表,系數(shù)表示該因子對變量的影響程度。這里每一列代表一個主成分作為原來變量線性組合的系數(shù)(比例)。比如第一主成分作為賠付率、凈收入與總收入之比、投資收益率、再保險率、總資產(chǎn)報酬率、兩年保費收入收益率、保費收入變化率、流動性比率,這八個原先變量的線性組合,系數(shù)(比例)為0.819、0.926、0.733、-0.0
8、42、0.864、0.562、-0.886、-0.017。如用x1、x2、x3、x4、x5、x6、x7、x8分別表示原先的十個變量,而用y1、y2、y3表示新的變量,那么原先8個變量與第一、第二和第三主成分y1、y2、y3的關(guān)系為:X1= 0.819y1- 0.159y2- 0.517y3X2= 0.926y1+0.271y2+0.250y3X3= 0.733y1- 0.278y2+0.582y3X4=-0.042y1+0.913y2+0.365y3X5= 0.864y1+0.249y2+0.331y3X6= 0.562y1+0.302y2- 0.502y3X7=-0.886y1+0.330y
9、2+0.260y3X8=-0.017y1+0.819y2- 0.456y3相關(guān)系數(shù)(絕對值)越大,主成分對該變量的代表性也越大。表3是相關(guān)系數(shù)矩陣表。 表4是公因子方差表。表5是總方差分解表,這里的Initial Eigenvalues就是這里的八個主軸長度,又稱特征值(數(shù)據(jù)相關(guān)陣的特征值)。頭三個成分特征值累積占了總方差的90.818%。后面的特征值的貢獻(xiàn)越來越少。依據(jù)原則:特征值1,提取了3個公因子(主成分),每個原始變量都可以是8個因子的線性組合,提取3個因子,可以概括原始變量所包含信息的90.818%。這3個公因子(主成分)包含了原指標(biāo)的絕大部分信息,可以代替原來8個變量對保險公司的投
10、資收益進(jìn)行衡量。圖1是碎石圖,特征值的貢獻(xiàn)還可以從碎石圖看出。表6 因子與主成分a1a2a3b1b2b3X10.819-0.159-0.5170.4140-0.1150-0.4310X20.9260.2710.2500.46810.19600.2084X30.733-0.2180.5820.3705-0.15770.4852X4-0.0420.9130.365-0.02120.66030.3043X50.8640.2490.3310.43670.18010.2759X60.5620.302-0.5020.28410.2184-0.4185X7-0.8860.3300.260-0.44780.2
11、3870.2167X8-0.0170.819-0.456-0.00860.5923-0.3801特征值3.9141.9121.439貢獻(xiàn)率48.929%23.898%17.991%累計貢獻(xiàn)率48.929%72.827%90.818%主成分表達(dá)式:b1= 0.819*X1+0.926*X2+0.733*X3-0.042*X4+0.864*X5+0.562*X6-0.866*X7-0.017*X8b2=-0.159*X1+0.271*X2-0.218*X3+0.913*X4-0.249*X5-0.302*X6+0.330*X7+0.819*X8b3=-0.517*X1+0.250*X2+0.582
12、*X3+0.365*X4-0.331*X5-0.502*X6+0.260*X7-0.456*X8表7Y1Y2Y323.597045.8211-51.804613.012663.8449-52.662446.498062.1039-79.1359-35.165072.3593-42.7826179.1660173.5938-281.8318-45.481694.4003-15.3631-60.558271.9628-17.6074Y1= 0.4140*x1+0.4681*x2+0.3705*x3-0.0212*x4+0.4367*x5+0.2841*x6-0.4478*x7-0.0086*x8Y
13、2=-0.1150*x1+0.1960*x2- 0.1577*x3-0.6603*x4+0.1801*x5+0.2184*x6-0.2387*x7-0.5923*x8Y3=-0.4310*x1+0.2084*x2+0.4852*x3+0.3043*x4+0.2759*x5-0.4185*x6+0.2167*x7-0.3801*x8加權(quán):輸出結(jié)果,并從高到低進(jìn)行排序:表81:人保2:平安3:太平洋4:大眾5:華泰6:永安7:華安Z主成分綜合得分NumZ主成分綜合得分Num13.17591:人保78.4452華泰12.15012:平安23.3553太平洋23.3553 3:太平洋13.1759人保
14、-7.61054:大眾12.1501平安78.44525:華泰-2.4579永安-2.45796:永安-7.6105大眾-15.60067:華安-15.6006華安可以如上所述計算主成分得分,還可以通過綜合評價函數(shù)計算綜合得分:綜合評價函數(shù):Z=48.929%*Y1+23.898%*Y2+17.991%*Y34、結(jié)論:表8中,綜合得分出現(xiàn)負(fù)值,這只表明該保險公司的綜合水平處于平均水平之下。由主成分分析的實證結(jié)果,不僅大部分保險公司的排名存在差異,且綜合得分值上存在較大差異,其定量值差異較大,這對于后來的綜合定量定性分析,最終所提出的政策建議等都會產(chǎn)生較大影響。由表8可以看出:華安保險的綜合水平
15、最低,華泰保險的綜合水平最高。由于前三個主成份的貢獻(xiàn)率高達(dá)90.818%,用綜合得分值對各地區(qū)進(jìn)行排序,能從總體上反映各公司之間的差別。5、實驗總結(jié):1)、本次實驗成敗之處及其原因分析:主成分分析是一種通過降維技術(shù)把原來眾多具有一定相關(guān)性的變量化為少數(shù)幾個主成分的統(tǒng)計方法。通常,只要變量之間存在一定的相關(guān)性,前幾個主成分往往就具有較高的累計貢獻(xiàn)率,從而這少數(shù)的幾個主成分就反映原始變量的絕大部分信息,從而達(dá)到較好的降維目的。通過SPSS可以容易進(jìn)行主成分分析,得到數(shù)據(jù)間的主成分,從而可以很好的分析數(shù)據(jù)。2)、本實驗的關(guān)鍵環(huán)節(jié)及改進(jìn)措施:做好本實驗需要把握的關(guān)鍵環(huán)節(jié):通過總方差分析表得到貢獻(xiàn)率大的主成分的特征值,通過主因子荷載表,應(yīng)用compute計算主成分表達(dá)式的,然后加權(quán)計算綜合得分,最后進(jìn)行排序。進(jìn)行綜合得分時,除SPSS軟件外,其他軟件都分別設(shè)有兩種方法的過程命令,使用者可以根據(jù)需要采用其中一種來分析問題,一般不會混淆。而正是因為SPSS沒有直接進(jìn)行主成分分析的命令,才使得那些本身尚未清楚區(qū)分這兩種方法的使用者更加迷惑,不慎便會出現(xiàn)混淆性錯誤。若重做本實驗,為實現(xiàn)預(yù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年張家口市事業(yè)單位招聘筆試真題
- 2024年四川護(hù)理職業(yè)學(xué)院招聘筆試真題
- 2024年嘉興市級機(jī)關(guān)遴選公務(wù)員筆試真題
- 2024年黑龍江省氣象部門招聘 筆試真題
- 無人機(jī)操作安全培訓(xùn)計劃
- 2025年公園衛(wèi)生與安全維護(hù)計劃
- 2025年初中語文校本課程開發(fā)計劃
- 中考三輪主題型默寫訓(xùn)練01
- 25年公司、項目部、各個班組三級安全培訓(xùn)考試試題附參考答案【黃金題型】
- 加建房屋合同標(biāo)準(zhǔn)文本
- 2025中國新型儲能行業(yè)發(fā)展白皮書
- 海南省天一大聯(lián)考2024-2025學(xué)年高三學(xué)業(yè)水平診斷(四)語文試題及答案
- 社會認(rèn)知力測試題及答案
- 肉雞供需合同協(xié)議網(wǎng)頁
- 旅游合同簽署委托協(xié)議
- “條令條例學(xué)習(xí)月”主題授課課件
- 海洋生態(tài)環(huán)境監(jiān)測技術(shù)-全面剖析
- 2024年中國資源循環(huán)集團(tuán)有限公司招聘考試真題
- 防性侵教育男生篇課件
- 隧道全斷面開挖施工方案
- 山東司法警官職業(yè)學(xué)院招聘筆試真題2024
評論
0/150
提交評論