版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多元統(tǒng)計(jì)分析學(xué)院:理學(xué)與信息科學(xué)學(xué)院專業(yè)班級:信息與計(jì)算科學(xué)2012級01班姓名:韓祖良(20125991)*******************2015年6月1日作業(yè)1方差分析三組貧血患者的血紅蛋白濃度(%,X1)及紅細(xì)胞計(jì)數(shù)(萬/mm3,X2)如下表:A組X13.94.23.744.45.22.72.43.65.52.93.3B組X2C組X14.84.75.44.54.64.45.95.54.35.1X2X14.43.72.94.53.34.53.83.7X2210190240170220230160260240180200300270180230245270220290220290310250305240330230195275310要求:1、方差分析的前提條件要求各總體服從正態(tài)分布,請給出正態(tài)分布的檢驗(yàn)結(jié)果,另要求各總體方差齊性,給出方差齊性檢驗(yàn)結(jié)果。2、檢驗(yàn)三組貧血患者的指標(biāo)x1,x2間是否有顯著差異,進(jìn)行多元方差分析。如果有顯著差異,分析三組患者間x1指標(biāo)是否有顯著差異,x2指標(biāo)是否有顯著差異?3、最后進(jìn)行兩兩比較,給出更具體的分析結(jié)果。4.畫出三組患者x1,x2兩指標(biāo)的均值圖。答:1.將所需分析數(shù)據(jù)輸入到SPSS中,首先判斷各總體是否服從正態(tài)分布:對文件進(jìn)行拆分:數(shù)據(jù)拆分文件按組組織輸出確定。然后進(jìn)行正態(tài)性檢驗(yàn):文件描述統(tǒng)計(jì)探索,在繪制對話框中,選擇按因子水平分組和帶檢驗(yàn)的正態(tài)圖,最后單擊確定按鈕。最后得出結(jié)果如圖(1),(2),(3)所示:表(1)由表(1)可以看出,A組的X1指標(biāo)的Sig=0.907,X2的Sig=0.914,在檢驗(yàn)標(biāo)準(zhǔn)為0.05的條件下,接受H0,拒絕H1,故得A組服從正態(tài)分布。表(2)由表(2)可以看出,B組的X1指標(biāo)的Sig=0.406,X2的Sig=0.765,在檢驗(yàn)標(biāo)準(zhǔn)為0.05的條件下,接受H0,拒絕H1,故得B組服從正態(tài)分布。表(3)由表(3)可以看出,C組的X1指標(biāo)的Sig=0.337,X2的Sig=0.839,在檢驗(yàn)標(biāo)準(zhǔn)為0.05的條件下,接受H0,拒絕H1,故得C組服從正態(tài)分布。再檢驗(yàn)各總體是否滿足方差齊性:首先取消文件的拆分,對所有個(gè)案進(jìn)行分析。然后進(jìn)行方差齊性檢驗(yàn):分析一般線性模型多變量,在選項(xiàng)對話框中,選擇方差齊性檢驗(yàn),所得結(jié)果如下:表(4)上表是對協(xié)方差陣相等的檢驗(yàn),由Sig=0.670>0.05,故在顯著性水平為0.05的條件下,接受H0,拒絕H1,即觀測到的因變量的協(xié)方差矩陣在所有組中均相等,可得三組符合方差齊性。2、多元方差分析:分析一般線性模型多變量,在兩兩比較對話框中進(jìn)行兩兩比較檢驗(yàn),假定方差齊性(選擇LSD(L))繼續(xù),最后單擊確定。表(5)上表為多變量檢查表,該表給出了幾個(gè)統(tǒng)計(jì)量,從表中可以看出,Sig的值均為0.01,小于顯著性水平0.05,故拒絕H0,接受H1。即三組不同患者的血紅蛋白濃度和紅細(xì)胞計(jì)數(shù)這兩個(gè)指標(biāo)間均存在顯著差異。下面分別分析三組患者間X1指標(biāo)是否有顯著差異,X2指標(biāo)是否有顯著差異:得到結(jié)果如表(6)所示。表(6)由上表看出,三組患者之間X1指標(biāo)的F=7.302,Sig=0.03,在檢驗(yàn)水平為0.05的條件下,接受H0,拒絕H1,故可以認(rèn)為這三組患者間的X1指標(biāo)無差異;X2指標(biāo)的F=3.915,Sig=0.032,在檢驗(yàn)標(biāo)準(zhǔn)為0.05條件下,差異有統(tǒng)計(jì)學(xué)意義,拒絕H0,接受H1,這說明這三組血紅蛋白濃度和紅細(xì)胞計(jì)數(shù)這兩個(gè)指標(biāo)上均有顯著差異。3、對各組進(jìn)行兩兩比較:通過軟件操作得到如表(7)的比較結(jié)果:表(7)從表中數(shù)據(jù)可以看出:①在X1(血紅濃度蛋白)這個(gè)指標(biāo)上,A組和B組、B組和C組的顯著性水平均小于0.05,故拒絕H0,接受H1。即A組和B組、B組和C組在血紅蛋白濃度這個(gè)指標(biāo)上有顯著性差異,且B組的血紅蛋白濃度顯著高于A、C兩組。②在X2(紅細(xì)胞計(jì)數(shù))這個(gè)指標(biāo)上,A組和C組的顯著性水平為0.014<0.05,故拒絕原假設(shè),即A組和C組在血紅細(xì)胞計(jì)數(shù)指標(biāo)上有顯著差異,且C組的紅細(xì)胞計(jì)數(shù)遠(yuǎn)遠(yuǎn)高于A組。4、畫出三組患者X1,X2兩指標(biāo)的均值圖:在繪制對話框中,添加水平軸gr,得到如下結(jié)果:X1的指標(biāo)圖:圖(1)由上圖可以看出,A組和B組、B組和C組的血紅蛋白濃度有顯著差異,而A組與C組的血紅蛋白濃度大致在同一水平線上,無顯著差別。X2的指標(biāo)圖:圖(2)由上圖可以看出A組與C組的紅細(xì)胞計(jì)數(shù)存在顯著差異,A組和B組、B組和C組的差異相對較小。作業(yè)2聚類分析作業(yè)16種飲料的熱量、咖啡因、鈉及價(jià)格四種指標(biāo)的數(shù)據(jù)見下表:飲料編號1熱量207.20咖啡因3.30鈉15.50價(jià)格2.803.30236.805.9012.90372.2036.70121.7089.10146.7057.6095.90199.0049.8016.6038.507.300.404.104.004.302.200.000.008.004.703.708.202.404.003.503.301.802.101.303.503.701.502.00410.509.205610.209.707813.608.5091011121310.606.306.307.701415160.004.204.700.0013.107.208.302.204.104.20118.80107.00要求:1.用系統(tǒng)聚類法聚類,聚類方法采用組間聯(lián)結(jié)法,距離采用平方歐式距離計(jì)算,不對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,給出樹狀圖和冰柱圖,給出聚合系數(shù)隨分類數(shù)變化曲線圖,并分析聚成幾類比較合適,寫出每一類包含的飲料編號。2.用快速聚類法給出聚類結(jié)果并對結(jié)果進(jìn)行分析,聚類類數(shù)和系統(tǒng)聚類法相同。答:1、系統(tǒng)聚類法:在數(shù)據(jù)編輯窗口的主菜單中選擇分析分類系統(tǒng)聚類,在彈出的系統(tǒng)聚類對話框中,將飲料編號選入標(biāo)注個(gè)案中,將其他變量選入變量框中,在分群單選框中選擇個(gè)案,表示的是進(jìn)行Q型聚類。在輸出復(fù)選框中選擇統(tǒng)計(jì)量和圖。在統(tǒng)計(jì)量對話框中選擇合并進(jìn)程表和相似性矩陣。在繪制對話框下,選擇樹狀圖和冰柱圖(方向垂直),在方法對話框中,聚類方法選擇組間聯(lián)接,區(qū)間為平方Eudidean距離,標(biāo)準(zhǔn)化為全局從0到1,最后得到結(jié)果如下:平均聯(lián)結(jié)(組之間):聚類表階群集組合系數(shù)首次出現(xiàn)階群集下一階群集1群集2群集1群集212345678542618521231513413.13025.97036.4850000001300780020000604091113147381015811121213131414150969.13010111681467125102.630150.330198.375319.778322.540458.7951006.8631435.0761755.6546287.17519406.6849101112131415523210125321樹狀圖:*******************HIERARCHICALCLUSTERANALYSIS*******************DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombineCASE0510152025LabelNum+---------+---------+---------+---------+---------+55-+1516715-+-+16-++-+7---++-----------+66-+|9-+---+3-+|9|3+-------------------------------+44-+||13213-+2-+-+||||88-++-------------+11-+||1112141|12-+-+|14-+|1-+-----------------------------------------------+1010-+聚合系數(shù)圖:由聚合系數(shù)圖趨于平緩,所以聚合成三類比較合適。冰柱圖:根據(jù)冰柱圖聚成三類比較合適。第一類飲料編號7,16,15,5,9,6,3第二類飲料編號14,12,11,8,13,4,2第三類10,12、快速聚類法:在數(shù)據(jù)編輯窗口的主菜單中選擇分析分類K-均值聚類,在彈出的K-均值聚類分析對話框中,將飲料標(biāo)號選入標(biāo)注個(gè)案中,將其他變量選入變量框中,在選項(xiàng)對話框中選擇初始聚類中心和每個(gè)個(gè)案的聚類信息。在保存對話框中選擇聚類成員和與聚類中心的距離,并保存在變量視圖和數(shù)據(jù)視圖中。對輸出結(jié)果進(jìn)行分析:表(1)初始聚類中心聚類123熱量207.20.00107.00咖啡因鈉價(jià)格3.3015.502.804.2013.102.20.008.304.20表(2)迭代歷史記錄a迭代聚類中心內(nèi)的更改1231235.065.000.00029.9624.039.0006.9686.250.000a.由于聚類中心內(nèi)沒有改動或改動較小而達(dá)到收斂。任何中心的最大絕對坐標(biāo)更改為.000。當(dāng)前迭代為3。初始中心間的最小距離為100.522。表(3)聚類成員案例號飲料編號聚類距離123456781234567812323332312222335.0654.58535.3584.99514.38818.31139.39324.23312.0775.06516.99017.5705.39899101112131415161011121314151633.85511.6843.749根據(jù)表(3),可以將飲料分為三類第一類飲料編號1,10第二類飲料編號2,4,8,11,12,13,14第三類飲料編號3,5,6,7,9,15,16表(4)最終聚類中心聚類123熱量203.1033.71107.34咖啡因鈉價(jià)格1.6513.053.154.1610.062.693.498.762.94表(5)表(6)最終聚類中心間的距離聚類12169.431395.87173.644123169.43195.87173.644ANOVA聚類均方誤差dfF均方Sig.df熱量咖啡因鈉24865.3274.91514.569.2142222455.3116.4106.3121.0381313131354.612.000.484.139.816.7672.308.207價(jià)格F檢驗(yàn)應(yīng)僅用于描述性目的,因?yàn)檫x中的聚類將被用來最大化不同聚類中的案例間的差別。觀測到的顯著性水平并未據(jù)此進(jìn)行更正,因此無法將其解釋為是對聚類均值相等這一假設(shè)的檢驗(yàn)。根據(jù)表六最后一列熱量的Sig0.000小于0.05對分類有影響,咖啡因,鈉,價(jià)格的Sig大于0.05,對分類沒有顯著性影響。表(7)每個(gè)聚類中的案例數(shù)聚類12.000237.0007.000有效缺失16.000.000由表(4)表示最終聚類中心,由此可以看出各分類的成分差異,第①類的熱量最高,咖啡因最少,鈉含量高;第②類熱量最低,但咖啡因含量偏高,總體價(jià)格便宜;第③類各成分也適中,價(jià)格也適中。作業(yè)3判別分析作業(yè)----中小企業(yè)的破產(chǎn)模型為研究中小企業(yè)的破產(chǎn)模型,選定4個(gè)經(jīng)濟(jì)指標(biāo):X1總負(fù)債率(現(xiàn)金收益/總負(fù)債)X2收益性指標(biāo)(純收入/總財(cái)產(chǎn))X3短期支付能力(流動資產(chǎn)/流動負(fù)債)X4生產(chǎn)效率性指標(biāo)(流動資產(chǎn)/純銷售額)對17個(gè)破產(chǎn)企業(yè)(1類)和21個(gè)正常運(yùn)行企業(yè)(2類)進(jìn)行調(diào)查,得如下資料總負(fù)債率收益性指標(biāo)短期支付能力生產(chǎn)效率指標(biāo)類別-.45-.56.06-0.07-0.1-0.41-0.310.02-0.09-0.09-0.07-0.30.020-0.230.050.11-0.080.0301.091.511.011.451.560.710.221.312.151.191.881.991.511.681.261.141.272.492.010.450.160.40.260.670.280.180.250.70.660.270.380.420.950.60.170.510.540.531111111111111111122-0.14-0.230.070.01-0.280.150.37-0.080.050.010.12-0.280.510.080.11-0.270.10.020.380.190.320.310.12-0.020.220.170.15-0.10.140.14-0.330.480.560.20.110.050.070.050.050.020.080.070.05-1.01-0.030.07-0.090.090.110.080.140.040.040.013.272.254.244.452.522.052.351.80.550.330.630.690.690.350.40.520.550.580.260.520.470.180.450.322222222222222222222.172.50.462.613.011.244.291.992.922.455.061.500.470.170.580.040.450.140.130.71待判-0.06-0.061.370.4待判進(jìn)行判別分析,要求:1、給出判別變量的顯著性檢驗(yàn)結(jié)果(方差分析表),以及協(xié)方差矩陣是否相等的Box’M檢驗(yàn)結(jié)果。2、給出費(fèi)歇判別函數(shù)的表達(dá)式及對待判樣品的費(fèi)歇判別結(jié)果3、給出貝葉斯判別函數(shù)的表達(dá)式及對待判樣品的貝葉斯判別結(jié)果4、給出分類結(jié)果矩陣,包括交叉驗(yàn)證的結(jié)果5、在第1問中,如果存在不顯著的變量,用逐步判別分析法再次進(jìn)行判別,寫出判別函數(shù)的表達(dá)式,并說明判別效果是否有顯著改善?(對案例進(jìn)行正確分類的百分比是否有提高?)答:1、表(1)組均值的均等性的檢驗(yàn)Wilks的Fdf1df2Sig.LambdaX1X2X3X4.68116.9021.95121.450.030111136363636.000.949.627.999.171.000.864表(1)是對各組均值是否相等的檢驗(yàn),由該表可以看出,在0.05的顯著性水平下,我們不能拒絕收益性指標(biāo)和生產(chǎn)效率指標(biāo)在各組的均值相等的假設(shè),即認(rèn)為除了這兩者外,其余兩個(gè)指標(biāo)在各組的均值是有顯著差異的。因此剔除收益性指標(biāo)和生產(chǎn)效率指標(biāo)這兩個(gè)變量。協(xié)方差矩陣的均等性的箱式檢驗(yàn):表(2)對數(shù)行列式X秩對數(shù)行列式12匯聚的組內(nèi)444-13.596-9.822-10.383打印的行列式的秩和自然對數(shù)是組協(xié)方差矩陣的秩和自然對數(shù)。表(3)檢驗(yàn)結(jié)果箱的M40.184F近似。3.523df1df2Sig.105562.171.000對相等總體協(xié)方差矩陣的零假設(shè)進(jìn)行檢驗(yàn)。上面兩個(gè)表是對各組協(xié)方差矩陣是否相等的Box的M檢驗(yàn),表(2)反映協(xié)方差矩陣的秩和行列式的對數(shù)值。由行列式的值可以看出,協(xié)方差矩陣不是病態(tài)矩陣,表(3)是對個(gè)總體協(xié)方差陣是否相等的統(tǒng)計(jì)檢驗(yàn),由F值及其顯著水平,在0.05的顯著性水平下拒絕H0,即認(rèn)為各總體協(xié)方差陣不相等。2、進(jìn)行費(fèi)歇判別法:分析分類判別分析,將類別放入分組變量中,并定義范圍,其他變量放入自變量中。在統(tǒng)計(jì)量對話框中,描述性選擇均值,函數(shù)系數(shù)選擇Fisher和未標(biāo)準(zhǔn)化,矩陣選擇組內(nèi)相關(guān)。得到以下結(jié)果:表(4)表(5)上兩個(gè)表分析的是典型判別函數(shù),表(4)反應(yīng)判別函數(shù)的特征值、解釋方差的比例和典型相關(guān)系數(shù)。判別函數(shù)解釋了100%的方差。表(5)是對判別函數(shù)的顯著性檢驗(yàn),由Wilks的Lambda檢驗(yàn),認(rèn)為判別函數(shù)在0.05的顯著性水平下是顯著。表(6)表(6)是典型判別式函數(shù)系數(shù),由此可得費(fèi)歇判別函數(shù)的表達(dá)式為:Y=-1.823+2.321*x1+0.777*x3。由于該函數(shù)只有一類,故待判樣品屬于第1類。3、貝葉斯判別法:表(7)表(7)是分類函數(shù)系數(shù),即貝葉斯判別函數(shù)的系數(shù),由此可以得出貝葉斯函數(shù)的表達(dá)式為:Y1=-2.345-4.551*X1+2.181*X2;Y2=-5.352-0.520*X1+3.530*X2。將兩個(gè)待判樣品各自分別代入以上兩個(gè)貝葉斯函數(shù)的表達(dá)式中:對于第1個(gè)待判樣品,有Y11=-2.345-4.551*0.04+2.181*0.71=-0.979;Y21=-5.352-0.520*0.04+3.530*0.71=-2.8665。對于第2個(gè)待判樣品,有Y1=-2.345-4.551*(-0.06)+2.181*1.37=0.916;Y22=-5.352-0.520*(-0.06)+3.530*1.37=-0.485。使待測樣品函數(shù)值最大的那個(gè)類即歸為該類,因此可得,第一個(gè)待測樣品歸為第1類,第二個(gè)待測樣品也歸為第一類。4、給出分類結(jié)果矩陣,包括交叉驗(yàn)證的結(jié)果:表(8)表(8)是分類結(jié)果,從表中可以看出,通過判別函數(shù)預(yù)測,由32個(gè)觀測是分類正確的,其中,類別1中,有15個(gè)觀測值被判對,2個(gè)判錯(cuò)的;類別2中,有17個(gè)觀測值被判對,4個(gè)判錯(cuò)的,從而有32/38=84.2%的原始觀測被判對。在交叉驗(yàn)證中,類別1的17個(gè)觀測值中,有15個(gè)被判對,類別2的21個(gè)觀測值中,有16個(gè)被判對,從而交叉驗(yàn)證有31/38=81.6%的原始觀測被判對。5、由第1問,存在不顯著的變量,所以用逐步判別分析法再次進(jìn)行判別:表(9)表(9)是用逐步判別分析的分類結(jié)果,從表中可以看出,通過判別函數(shù)預(yù)測,由31個(gè)觀測是分類正確的,其中,類別1中,有15個(gè)觀測值被判對,2個(gè)被判錯(cuò);類別2中,有16個(gè)觀測值被判對,5個(gè)被判錯(cuò),從而有31/38=81.6%的原始觀測被判對。在交叉驗(yàn)證中,類別1的17個(gè)觀測值中,有15個(gè)被判對,類別2的21個(gè)觀測值中,有15個(gè)被判對,從而交叉驗(yàn)證有30/38=78.9%的原始觀測被判對。通過表(6)和表(7)的比較,可以看出,用逐步判別分析判別效果并無明顯改善。作業(yè)4因子分析作業(yè):全國30個(gè)省市的8項(xiàng)經(jīng)濟(jì)指標(biāo)如下:省份國內(nèi)生居民消費(fèi)固定資產(chǎn)職工工貨物周消費(fèi)價(jià)商品零工業(yè)產(chǎn)產(chǎn)資轉(zhuǎn)格售值北京1394.8925052720125812501387239718722334519.01345.46704.87290.981446501483947214134491144304145373.9342.82033.3717.3781.71371.7497.4824.8117.3115.2115.2116.9117.5116.1115.2116.1112.6843.43天津920.11110.6582.51河北2849.52山西1092.48115.81234.85115.6116.8697.25419.39內(nèi)蒙832.88250.23387.99320.45435.73遼寧2793.371141840.55吉林1129.2114.2762.47黑龍江2014.53114.31240.37上海2462.57江蘇5155.25浙江3524.79安徽2003.58福建2160.52江西1205.11山東5002.34河南3002.74湖北2391.425343996.4892795943661946095857421151454344468547978250207.41025.5754.4908.3609.3411.71196.61574.4849118.7115.8116.6114.8115.2116.9117.6116.51201131642.9519261434.9522491006.39114.32026.64113.5112.7114.4115.9916.59824.14433.67571.84125423201182474553.97282.8415271229.55114.22207.69114.91367.92116.61220.72103415271408670.35571.68422.61湖南2195.71011.8656.5119115.5843.83廣東5381.7226991639.83114111.61396.35廣西1606.15131418141261942382.59198.35822.54150.8433451055340464544755149738243965493575350795348556232.1902.3301.1310.44.2118.4113.5118.5121.4121.3117.3119116.4111.3554.9764.33海南四川貴州364.1735341171431.81630.07117.2324.72716.655.57云南1206.681261111012081007144513551469118.1114.9117西藏55.9817.87陜西1000.03300.27114.8147.76500.9507600.98468.79105.8甘肅青海寧夏新疆553.35165.31169.75834.57119.8118116.5116.3115.3116.761.661.98121.8339117.1119.7114.4376.95428.76要求:先對數(shù)據(jù)做標(biāo)準(zhǔn)化處理,然后基于標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行以下操作1、給出原始變量的相關(guān)系數(shù)矩陣;2、用主成分法求公因子,給出公因子的方差貢獻(xiàn)度表,公因子的數(shù)目取幾個(gè)合適?說明選取的理由;3、給出因子載荷矩陣,據(jù)之寫出因子分析的數(shù)學(xué)模型,如果公因子的實(shí)際意義不好解釋,請用因子旋轉(zhuǎn)(采用正交旋轉(zhuǎn)中最大方差法)給出旋轉(zhuǎn)后的因子載荷矩陣,然后分析旋轉(zhuǎn)之后的公因子,說明每個(gè)公因子包含的變量,并給各個(gè)公因子賦予實(shí)際含義;(提示:投入產(chǎn)出因子,消費(fèi)能力因子,價(jià)格指數(shù)因子)4、先利用提取的每個(gè)公因子分別對各省市進(jìn)行排名。最后構(gòu)造一個(gè)綜合因子,計(jì)算各省市的綜合因子的分值,并進(jìn)行排序。答:1、輸入數(shù)據(jù),依次選擇分析描述統(tǒng)計(jì)描述,將變量選入右邊變量下面,點(diǎn)選“將標(biāo)準(zhǔn)化得分另存為變量”,點(diǎn)擊確定即可得標(biāo)準(zhǔn)化的數(shù)據(jù)。依次點(diǎn)選分析降維因子分析相關(guān)矩陣下選中系數(shù)及KMO和Bartlett的檢驗(yàn),點(diǎn)繼續(xù),確定,就可得到8個(gè)變量的相關(guān)矩陣如表(1):表(1)相關(guān)矩陣Zscore:Zscore:Zscore:Zscore:Zscore:Zscore:Zscore:Zscore:國內(nèi)生居民消固定資職工工貨物周消費(fèi)價(jià)商品零工業(yè)產(chǎn)產(chǎn)費(fèi)產(chǎn)資轉(zhuǎn)格售值相關(guān)Zscore:國內(nèi)生產(chǎn)1.000.267.951.191.617-.273-.264.874Zscore:居民消費(fèi)Zscore:固定資產(chǎn)Zscore:職工工資Zscore:貨物周轉(zhuǎn)Zscore:消費(fèi)價(jià)格Zscore:商品零售.267.951.191.617-.273-.264.8741.000.426.4261.000.400.718.400-.151.431-.235-.280-.135-.2531.000.763-.593-.359-.539.022.363.792.7181.000-.356-.135-.539.104-.3561.000-.253.022.104-.151-.235-.593.363.431.659-.280-.359.792.763-.125-.1921.0001.000-.192Zscore:.659-.125由表中數(shù)據(jù)可以看出大部分?jǐn)?shù)據(jù)的絕對值都在0.3以上,說明變量間有較強(qiáng)的相關(guān)性。表(2)由上表可以看出,Sig值為0,在標(biāo)準(zhǔn)水平為0.05下,拒絕H0,接受H1,即說明變量間存在相關(guān)性。2、在因子分析窗口點(diǎn)選抽取方法:主成分;分析:相關(guān)性矩陣;輸出:未旋轉(zhuǎn)的因子解,碎石圖;抽?。夯谔卣髦担ㄌ卣髦荡笥?)繼續(xù)確定。輸出結(jié)果如下:表(3)解釋的總方差成份初始特征值合計(jì)提取平方和載入方差的%旋轉(zhuǎn)平方和載入累積%合計(jì)方差的%累積%合計(jì)方差的%累積%123456783.7552.1971.215.402.213.13846.93927.45915.1865.0312.6601.724.81846.93974.39889.58494.61597.27598.99999.8173.7552.1971.21546.93927.45915.18646.93974.39889.5843.2062.2181.74240.07927.72521.78040.07967.80489.584.065.015.183100.000提取方法:主成份分析。上表中第一列為特征值(主成分的方差),第二列為各個(gè)主成分的貢獻(xiàn)率,第三列為累積貢獻(xiàn)率。從表中可以看出,前3個(gè)主成分的累積貢獻(xiàn)率就達(dá)到了89.599%>85%,所以選取主成分個(gè)數(shù)為3.選Y1為第一主成分,Y2為第二主成分,Y3為第三主成分。且這三個(gè)主成分的方差和占全部方差的89.599%。即基本上保留了原來指標(biāo)信息。這樣由原來的8個(gè)指標(biāo)變成了3個(gè)指標(biāo)。圖(1)由上圖看出,成分?jǐn)?shù)為3時(shí),特征值得變化曲線趨于平緩,所以由碎石圖也可大致確定出主成分個(gè)數(shù)為3,與累積貢獻(xiàn)率確定的主成分個(gè)數(shù)一致。3、在因子分析窗口中,選擇旋轉(zhuǎn)輸出:載荷陣。輸出結(jié)果如下:表(5)成份矩陣a成份123Zscore:固定資產(chǎn)Zscore:國內(nèi)生產(chǎn)Zscore:工業(yè)產(chǎn)值Zscore:商品零售Zscore:居民消費(fèi)Zscore:貨物周轉(zhuǎn)Zscore:職工工資Zscore:消費(fèi)價(jià)格.912.885.823-.620.607.486.466-.509.161.384.427.594-.598.738-.722.252.212.121.211.438.271-.275.368.797提取方法:主成分分析法。根據(jù)上表,可得出因子分析的數(shù)學(xué)模型:Y1=0.885*x1+0.607*x2+0.912*x3+0.466*x4+0.486*x5-0.509*x6-0.620*x7+0.823*x8Y2=0.011*x1+0.385*x2+0.128*x3+0.453*x4-0.317*x5+0.179*x6-0.098*x7+0.025*x8Y3=0.046*x1+0.035*x2+0.074*x3+0.099*x4-0.135*x5+0.652*x6+0.463*x7+0.123*x8由上表數(shù)據(jù)第一列可看出,第一主成分與各個(gè)變量之間的相關(guān)性;第二列表明:第二主成分與各個(gè)變量之間的相關(guān)性;第三列表明:第三主成分與各個(gè)變量之間的相關(guān)性??梢缘贸觯篨1,X3,X8主要由第一主成分解釋;X4,X5主要由第二主成分解釋;X6主要由第三主成分解釋;但是X2是由第一主成分還是第三主成分解釋不好確定,X7是由三個(gè)主成分中的哪個(gè)解釋也不好確定。因此,作因子旋轉(zhuǎn)后的因子載荷陣:在因子分析窗口,選擇抽取輸出:旋轉(zhuǎn)的因子解,繼續(xù);旋轉(zhuǎn)方法:最大方差法繼續(xù)確定。得到輸出結(jié)果如下:表(6)旋轉(zhuǎn)成份矩陣a成份123Zscore:國內(nèi)生產(chǎn)Zscore:工業(yè)產(chǎn)值Zscore:固定資產(chǎn)Zscore:貨物周轉(zhuǎn)Zscore:職工工資Zscore:居民消費(fèi)Zscore:消費(fèi)價(jià)格Zscore:商品零售.955.944.871.752.051.217-.135-.103.125.111.352-.505.927.841-.009-.494-.131-.015-.137-.189-.114-.213.969.821提取方法:主成分分析法。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。a.旋轉(zhuǎn)在5次迭代后收斂。根據(jù)因子旋轉(zhuǎn)矩陣,F(xiàn)1里包含的公因子為X1,X8,X3,X5;F2里包含的公因子為X4,X2;F3里包含的公因子為X6,X7。由上表可以看出,X1,X3,X5,X8主要由第一主成分解釋;X2,X4主要由第二個(gè)主成分解釋;X6,X7主要由第三個(gè)主成分解釋。與第一因子關(guān)系密切的變量主要是投入(投資:固定資產(chǎn)投資)與產(chǎn)出(產(chǎn)值:國內(nèi)生產(chǎn)總值、工業(yè)總產(chǎn)值)方面的變量,貨物周轉(zhuǎn)又是投入產(chǎn)出的中介過程,可以命名為投入產(chǎn)出因子;與第二因子關(guān)系密切的都是反映民眾生活水平的變量,可以命名為消費(fèi)能力因子;與第三因子關(guān)系密切的是價(jià)格指數(shù)方面的變量,可以命名為價(jià)格指數(shù)因子(見下表)。表(7)因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東科學(xué)技術(shù)職業(yè)學(xué)院《建筑給水排水》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東酒店管理職業(yè)技術(shù)學(xué)院《社會工作基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東金融學(xué)院《動物微生物與免疫學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東建設(shè)職業(yè)技術(shù)學(xué)院《國際金融管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工業(yè)大學(xué)《道路與橋梁工程實(shí)訓(xùn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東東軟學(xué)院《高級日語(I)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東創(chuàng)新科技職業(yè)學(xué)院《導(dǎo)向信息媒體設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 上海中醫(yī)藥基礎(chǔ)醫(yī)學(xué)免疫學(xué)課件緒論
- 廣東白云學(xué)院《計(jì)算機(jī)繪圖CAD》2023-2024學(xué)年第一學(xué)期期末試卷
- 共青科技職業(yè)學(xué)院《西方音樂史與欣賞Ⅰ》2023-2024學(xué)年第一學(xué)期期末試卷
- 小學(xué)生漫畫獨(dú)立學(xué)習(xí)力
- 燃?xì)庥脩舭惭b檢修工試題庫(含答案)
- 浙美版小學(xué)美術(shù)五年級上冊測試卷
- 以資源換產(chǎn)業(yè)方案
- 2022-2023學(xué)年四川省南充市九年級(上)期末數(shù)學(xué)試卷
- 陜西省重點(diǎn)中學(xué)2022-2023學(xué)年高二上學(xué)期期末考試英語試卷(含答案)
- 安徽省生豬養(yǎng)殖業(yè)低碳發(fā)展模式及技術(shù)經(jīng)濟(jì)效果研究的中期報(bào)告
- 醫(yī)院耗材管理委員會制度
- 二次函數(shù)大單元整體設(shè)計(jì)課件 【大單元教學(xué)】 學(xué)情分析指導(dǎo) 九年級數(shù)學(xué)北師大版下冊
- 風(fēng)管機(jī)空調(diào)安裝施工方案
- pcb多層板退錫工藝的研究進(jìn)展
評論
0/150
提交評論