多元統(tǒng)計分析課程設(shè)計心得_第1頁
多元統(tǒng)計分析課程設(shè)計心得_第2頁
多元統(tǒng)計分析課程設(shè)計心得_第3頁
多元統(tǒng)計分析課程設(shè)計心得_第4頁
多元統(tǒng)計分析課程設(shè)計心得_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多元統(tǒng)計分析》課程設(shè)計指導(dǎo)書一、 課程設(shè)計的目的掌握用統(tǒng)計軟件利用主成分分析的方法對涉及眾多變量的某一問題進(jìn)行分析二、 設(shè)計名稱:用統(tǒng)計軟件利用主成分分析法對涉及進(jìn)行眾多變量的問題進(jìn)行分析三、 設(shè)計要求掌握用統(tǒng)計軟件利用主成分分析的方法對涉及進(jìn)行眾多變量的問題進(jìn)行分析的方法掌握利用SPSS軟件求初始變量的協(xié)方差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量判斷是否存在明顯的多重共線性掌握利用SPSS軟件求得主成分四、 設(shè)計過程1、收集數(shù)據(jù)2、根據(jù)研究問題選取初始分析變量3、求協(xié)方差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量4、判斷是否存在明顯的多重共線性,若存在,則回到第一步5、得到主成分的表達(dá)式并確定主成分的個數(shù),選取主成分6、對主成分進(jìn)行分析得出結(jié)果,完成設(shè)計報告五、設(shè)計細(xì)則1.注意對數(shù)據(jù)的采集,不要過于繁雜,不要過少2.吸取他人的經(jīng)驗,總結(jié)自己的教訓(xùn),有條不紊的進(jìn)行3.上機(jī)前先作好準(zhǔn)備,上機(jī)時積極改進(jìn)方法六、說明

為了培養(yǎng)自己的上機(jī)操作方法,所以我盡量運(yùn)用SPSS軟件上的檢驗方法課程設(shè)計任務(wù)書姓名學(xué)號班級課程名稱多元統(tǒng)計分析課程性質(zhì)專業(yè)課設(shè)計時間2010年6月26日——2009年7月2日設(shè)計名稱用統(tǒng)計軟件利用主成分分析的方法對涉及多個指標(biāo)的問題進(jìn)行分析設(shè)計要求掌握用統(tǒng)計軟件利用主成分分析的方法對涉及進(jìn)行眾多變量的問題進(jìn)行分析的方法掌握利用SPSS軟件求初始變量的協(xié)方差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量判斷是否存在明顯的多重共線性掌握利用SPSS軟件求得主成分設(shè)計思路與設(shè)計過程1、 收集數(shù)據(jù)2、 根據(jù)研究問題選取初始分析變量3、 求協(xié)方差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量4、 判斷是否存在明顯的多重共線性,若存在,則回到第一步5、 得到主成分的表達(dá)式并確定主成分的個數(shù),選取主成分6、 對主成分進(jìn)行分析得出結(jié)果,完成設(shè)計報告計劃與進(jìn)度第一周:星期一?星期三:查資料選定課程設(shè)計數(shù)據(jù)材料星期四?星期五:選中研究方法星期六:1413上機(jī)第二周:星期一?星期五:針對錯誤改進(jìn)星期六:1413上機(jī)星期天:設(shè)計報告任課教師意 見說 明課程設(shè)計報告課程:多元統(tǒng)計分析學(xué)號:姓名:班級:教師:

設(shè)計名稱:用統(tǒng)計軟件利用主成分分析法對涉及進(jìn)行眾多變量的問題進(jìn)行分析設(shè)計內(nèi)容:在企業(yè)經(jīng)濟(jì)效益的評價中,設(shè)計的指標(biāo)往往很多。為了簡化系統(tǒng)結(jié)構(gòu),抓住經(jīng)濟(jì)效益評價中的主要問題,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分。在對我國部分省、市、自治區(qū)獨(dú)立核算的工業(yè)企業(yè)的經(jīng)濟(jì)效益評價中,設(shè)計9項指標(biāo),原始數(shù)據(jù)見下表樣品數(shù)n=28,變量數(shù)p=9100元 每千瓦100固定資產(chǎn)原值實(shí)現(xiàn)值(%)100元固定資產(chǎn)原值實(shí)現(xiàn)利稅(%)資金實(shí)現(xiàn)利稅(%)100元工每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值(元)時電力100元流動資金實(shí)現(xiàn)產(chǎn)值(元)業(yè)總產(chǎn)值實(shí)現(xiàn)利稅(%)100元銷售收入實(shí)現(xiàn)利稅(%)實(shí)現(xiàn)工業(yè)產(chǎn)值(元)全員勞動生產(chǎn)率(元/人.年)北京(1)119.2930.9829.9225.9715.4821783.4121006296.7天津(2)143.9831.5930.2121.9412.2928524.2920254363.1河北(3)94.817.217.9518.149.3711672.0312607322.2山西(4)65.811.0811.0612.1516.848.821.6510166284.7內(nèi)蒙(5)54.799.249.5416.866.278941.87564225.4遼寧(6)94.5121.1222.8322.3511.2814162.3613.386311.7吉林(7)黑龍江80.4913.3613.7616.67.1413062.079400274.1(8)75.8615.8216.6720.8610.3712672.269830267上海(9)187.7945.939.7724.4415.0943464.1131246418.6江蘇(10)205.9627.6522.5813.427.8132024.6923377407.2浙江(11)207.4633.0625.7815.949.2838114.1922054385.5安徽(12)110.7820.720.1218.696.614682.2312578341.1福建(13)江西122.7622.5219.9318.348.3522002.6312164301.2(14)94.9414.714.1815.496.6916692.2410463274.4山東(15)117.5821.9320.8918.659.118202.817829331.1河南(16)85.9817.317.1820.127.6713061.8911247276.5湖北(17)103.9619.518.4818.779.1618292.7515745308.9湖南(18)104.0321.4721.2820.638.7212721.9813161309廣東(19)136.4423.6420.8317.337.8529593.7116259334廣西(20)100.7222.0420.921.889.6717322.1312441296.4四川(21)84.7314.3514.1716.937.9613102.3411703242.5貴州(22)59.0514.4814.3524.538.0910681.329710206.7云南(23)73.7221.9122.729.729.3814471.9412517295.8陜西(24)78.0213.1312.5716.839.1917312.0811369220.3甘肅(25)59.6214.0716.2423.5911.349261.1313084246.8青海(26)51.668.328.2616.117.0510551.319246176.49寧夏(27)52.958.258.8215.576.588341.1210406245.4新疆(28)60.2911.2613.1418.688.3910412.910983266

設(shè)計目的與要求:掌握用統(tǒng)計軟件利用主成分分析的方法對涉及眾多變量的某一問題進(jìn)行分析設(shè)計環(huán)境或器材、原理與說明:機(jī)房spss軟件設(shè)x=(X,,X)是一個p維隨機(jī)向量,有二階矩存在,記p=E(x),E=D(x)。1p考慮它的線性變換:=ax—=ax—aX+aX+11111212—a!x—aX+aX+<22121222???—ax—aX+aX+Jp p 1p1 2p2??易見… … …Var(Y)—Var(arx)—aEa,Cov(Y,Y)—CovQx,arx)—ijij+aXp1 p+aXp2p(5.1)+aX?pppa'Ea,i—1,,卩 (5-2)ij假如我們希望用Y來代替原來的p個變量X, ,X,這就要求Y盡可能地反映原來p個1 1 ???p 1變量的信息,這里“信息”用什么來表達(dá)?最經(jīng)典的方法是用Y的方差來表達(dá)。Var(Y)越大,11???表示Y包含的信息越多。由(5.2)可以看出,對a必須有某種限制,否則可使Var(Y,111常用的限制是a'a—1,i—1, ,p (5.3)ii故我們希望在約束(5.3)下找a,使得Var(Y)—a'Ea達(dá)到極大,Y就稱為第一主成分。如11111果一個主成分不足以代表原p個變量,可再考慮采用Y2,為了最有效地代表原變量的信息,Y已有的信息就不需要出現(xiàn)在Y中,用數(shù)學(xué)語言來講,就是12Cov(Y,Y)—0 (5.4)12于是,求Y就是在約束(5.3)和(5.4)下求a,使Var(Y)達(dá)到極大,所求的Y稱為第二主成2222分。類似地,我們可以定義第三主成分、第四主成分、…。一般地講,x的第i個主成分Y—a'xii是指:在約束aa—1,i—1,,piiCov(Y,Y)—Cov(a'x,ax)—0(k<i)ik ik

下求a,使得Var(Y.)=a'Ea達(dá)到極大。i令九>1iii>九>0表示刀-D(x)的特征根,t, ,t為相應(yīng)的單位特征向量。若特征p 1 p根有重根,對應(yīng)于這個特征根的特征向量組成一個RP的子空間,子空間的維數(shù)等于重根的??? ???次數(shù)。在子空間中任取一組正交的坐標(biāo)系,這個坐標(biāo)系的單位向量就可用來作為它的特征向量。顯然,這時特征向量的取法不唯一,有無窮多種取法,在下面的討論中,我們總假定已選定的某一種取法。設(shè)計過程(步驟)或程序代碼:1、將原始數(shù)據(jù)標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化的數(shù)據(jù)見下表0.4235231.3384051.5902821.6875562.2396340.4819710.9547461.2603710.0480.9951991.4096491.6314530.6672281.0658731.1887581.8553941.1338441.200-0.14352-0.271-0.10906-0.29487-0.00854-0.57821-0.45763-0.152790.49-0.81499-0.98577-1.08721-1.811432.740046-1.79273-0.84655-0.56349-0.15-1.06992-1.20067-1.303-0.61894-1.14919-0.86449-0.69303-1.00129-1.18-0.150240.1868270.5837370.7710330.694243-0.3171-0.11989-2.27170.308-0.47486-0.71949-0.7039-0.68477-0.82907-0.43245-0.4167-0.69238-0.34-0.58206-0.43218-0.290780.393790.359408-0.47334-0.22224-0.62003-0.462.0095833.0809562.9886561.3001862.0961332.7554331.6711712.9832842.1622.4302940.9494850.548246-1.48989-0.582541.5557832.264781.6592991.9642.4650251.5813351.002539-0.85187-0.041662.1944081.7530481.43671.5880.2264810.1377740.199007-0.15562-1.02776-0.26257-0.25294-0.157670.8180.5038680.3503370.172033-0.24423-0.383850.5050410.156444-0.227320.126-0.14028-0.56298-0.64428-0.9658-0.99465-0.05179-0.24271-0.51352-0.330.3839290.2814290.308322-0.16574-0.107890.1065570.3304330.725830.645-0.34774-0.25932-0.218380.206435-0.63406-0.43245-0.60092-0.38161-0.300.068569-0.00238-0.03382-0.13536-0.085810.1159940.279260.375190.2600.070190.2277050.3636890.335558-0.24771-0.4681-0.50881-0.059580.2620.8206170.4811450.299804-0.49995-0.567831.3009631.2617850.4616730.695-0.006450.2942770.3097410.6520370.1018430.014276-0.35529-0.180720.043-0.37669-0.60386-0.6457-0.60122-0.52735-0.42825-0.14036-0.30489-0.89-0.97128-0.58868-0.620141.322972-0.47952-0.68202-1.18429-0.64022-1.51-0.631610.2790930.5652822.636993-0.00486-0.28459-0.54975-0.167930.033-0.53205-0.74635-0.87284-0.62654-0.074770.013227-0.40646-0.36109-1.27-0.95809-0.63656-0.351821.084980.71632-0.83093-1.37875-0.07253-0.81-1.14239-1.30812-1.48472-0.80883-0.86219-0.69566-1.19453-0.71829-2.03-1.11252-1.3163-1.40522-0.94555-1.03512-0.92741-1.38899-0.52311-0.84-0.94257-0.96475-0.79192-0.15815-0.36913-0.710340.432779-0.42603-0.482、將以上數(shù)據(jù)導(dǎo)入spss軟件,依次點(diǎn)擊分析一降維一因子分析點(diǎn)擊按鈕,在彈出的對話框中,在中選擇。回到原對話框點(diǎn)擊右側(cè)的確定。即可得到以下輸出結(jié)果

TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%16.15068.33268.3326.15068.33268.33221.47316.36584.6981.47316.36584.6983.6977.74992.4474.3183.53195.9785.1902.11298.0906.1161.28999.3797.029.32499.7038.024.27099.9739.002.027100.000ExtractionMethod:PrincipalComponentAnalysis.由輸出結(jié)果看到前面兩個主成分yl,y2的方差和占全部方差的比例為84.7%。我們就選取y1為第一主成分,y2為第二主成分。且這兩個主成分占全部方差的84.7%,即基本上保留了原來指標(biāo)的信息,這樣由原來的9個指標(biāo)轉(zhuǎn)化為2個新的指標(biāo),起到了降維的作用2、spss軟件得到主成分系數(shù)矩陣如下:ComponentMatrixaComponent12X1.931-.315X2.976.163X3.931.322X4.232.863X5.433.596X6.923-.200X7.897-.274X8.871-.064X9.899-.154Undefinederror#11401-Cannotopentextfile"D:\ProgramFiles\SPSSInc\Statistics17\lang\en\spss.ea.2componentsextracted.3、由以上結(jié)果得到前兩個主成分的線性組合為y1=0.931x1+0.976x2+0.931x30.232x4+0.433x5+0.923x6+0.897x7+0.871x8+0.899x9y2=-0.315x1+0.163x2+0.322x3+0.863x4+0.596x5-0.2x6-0.274x7-0.064x8-0.154x94、對所選主成分做經(jīng)濟(jì)解釋:第一主成分的線性組合中除了100元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅和100元銷售收入實(shí)現(xiàn)利稅外,其余變量的系數(shù)相當(dāng)所以第一主成分可以看成是xl,x2,x3,x6,x7,x8,x9的綜合變量??梢越忉尀榈谝恢鞒煞址从沉斯I(yè)生產(chǎn)中投入的資金、勞動力所產(chǎn)生的效果,他是投入和產(chǎn)出之比。第一主成分所占信息總量為68.3%,在我國目前的工業(yè)企業(yè)中,經(jīng)濟(jì)效益首先反映在投入與產(chǎn)出之比上,其中固定資產(chǎn)所產(chǎn)生的經(jīng)濟(jì)效益更大一些。第二主成分是把工業(yè)生產(chǎn)中所得產(chǎn)量(即工業(yè)總產(chǎn)值和銷售收入)與局部量(即利稅)進(jìn)行比較,反映了產(chǎn)出對國家所做的貢獻(xiàn)。這樣,在抓企業(yè)經(jīng)濟(jì)效益活動中,就應(yīng)注重投入與產(chǎn)出之比和產(chǎn)出對國家所做的貢獻(xiàn),抓住了這兩個方面,經(jīng)濟(jì)效益一定會提高5、通常為了分析各樣品在主成分所反映的經(jīng)濟(jì)意義方面的情況,還將標(biāo)準(zhǔn)化后的原始數(shù)據(jù)代入主成分表達(dá)式計算各樣品的主成分得分6.992.949.270.65-1.21-0.12-5.010.47-7.38-0.89-1.041.54-4.00-0.98-2.580.8417.451.679.78-3.4110.83-2.210.18-0.731.27-0.63-2.95-1.522.44-0.44-2.550.120.88-0.36-0.110.474.51-1.60

0.34-3.50-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論