多遠(yuǎn)統(tǒng)計(jì)分析課程設(shè)計(jì)_第1頁
多遠(yuǎn)統(tǒng)計(jì)分析課程設(shè)計(jì)_第2頁
多遠(yuǎn)統(tǒng)計(jì)分析課程設(shè)計(jì)_第3頁
多遠(yuǎn)統(tǒng)計(jì)分析課程設(shè)計(jì)_第4頁
多遠(yuǎn)統(tǒng)計(jì)分析課程設(shè)計(jì)_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

對(duì)我國(guó)區(qū)域經(jīng)濟(jì)發(fā)展水平的分析第第頁1.引言隨著中國(guó)經(jīng)濟(jì)的發(fā)展和社會(huì)的進(jìn)步,人民的生活水平日益提高,城鎮(zhèn)居民的生活水平更是上了一個(gè)大臺(tái)階.由于改革開放以來,城鎮(zhèn)的投資的加大和企業(yè)的增加,近年來各地城鎮(zhèn)家庭收入逐年遞增。城鎮(zhèn)家庭的收入增加,必然會(huì)導(dǎo)致家庭消費(fèi)支出總額的增加和家庭消費(fèi)支出結(jié)構(gòu)的變化。從最近幾年的統(tǒng)計(jì)數(shù)據(jù)可以看出:城鎮(zhèn)地區(qū)對(duì)吃穿等基本生活資料的消費(fèi)呈下降趨勢(shì),而對(duì)于文化教育及醫(yī)療保健的支出消費(fèi)逐年遞增。從城鎮(zhèn)家庭收支的變化情況可以看出整個(gè)國(guó)家的經(jīng)濟(jì)增長(zhǎng)狀況,以小見大,為決策提供一定的依據(jù)。聚類和判別都是分類學(xué)的基本方法,而分類學(xué)是人類認(rèn)識(shí)世界的基礎(chǔ)學(xué)科。平時(shí)我們對(duì)事物的認(rèn)識(shí)都需要對(duì)其進(jìn)行分類。為了研究現(xiàn)階段的全國(guó)經(jīng)濟(jì)發(fā)展各時(shí)間段的差異,我們需要對(duì)時(shí)期的經(jīng)濟(jì)指標(biāo)進(jìn)行分類,以便更好的做出下一步的經(jīng)濟(jì)策略。聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類。判別分析則先根據(jù)已知的類別的事物的性質(zhì),利用某種技術(shù)建立函數(shù)式,然后對(duì)未知類型的新事物進(jìn)行判斷,將其歸為已知的類別中。聚類分析事先并不知道對(duì)象的類別的面貌,甚至連共有幾個(gè)類別也不確定。判別分析事先知道已知的對(duì)象的類別和類別數(shù)。本文以2010年國(guó)家統(tǒng)計(jì)年鑒上公布的全國(guó)各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出(2009年)作為數(shù)據(jù)源,將聚類分析和判別分析的原理運(yùn)用到各個(gè)時(shí)期經(jīng)濟(jì)發(fā)展水平分類的研究上,對(duì)此問題進(jìn)行統(tǒng)計(jì)分析。2.模型的建立和聚類分析本文采用《中國(guó)統(tǒng)計(jì)年鑒(2010)》中的“中國(guó)各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出(2009年)”的七項(xiàng)數(shù)據(jù),即:食品、衣著、居住、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通和通信、教育文化娛樂服務(wù),運(yùn)用SPSS19采用聚類分析方法,對(duì)全國(guó)城鎮(zhèn)居民的消費(fèi)結(jié)構(gòu)進(jìn)行了地區(qū)差異的分析。表1.1中國(guó)各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出(單位:元)地區(qū)食品衣著居住家庭設(shè)備用品及服務(wù)醫(yī)療保健交通和通信教育文化娛樂服務(wù)全國(guó)4478.541284.201228.91786.94856.411682.571472.76北京5936.111795.681290.221225.681389.452767.852654.98天津5404.531362.561505.70911.921273.381968.371740.85河北3250.771190.191142.83628.49971.291151.15982.21山西3071.931162.001319.45563.82789.921095.771070.60內(nèi)蒙古3772.631857.191246.21797.77992.731557.031504.36吉林3637.321419.121394.94543.691120.441305.451028.06黑龍江3397.411403.721026.77547.87978.79922.77956.85上海7344.831593.081913.221365.391002.143498.653138.98江蘇4773.671297.951148.85923.32808.371721.871968.03浙江5604.721614.661485.90828.96984.623290.632295.32安徽4051.401080.061219.83589.73716.871013.381225.36福建5336.361171.881394.91859.06591.501993.771504.96江西3881.561053.01935.44761.85550.251145.161066.94山東3954.341548.751280.04885.04885.161719.681332.97河南3272.751270.741004.37684.79875.521033.991048.14湖北4160.511210.32999.49759.24694.61953.691208.46湖南4174.551146.251074.69798.40784.661233.821207.72廣西4129.55855.601021.11754.79538.171598.681111.13四川4391.731178.38973.02679.16648.311416.491150.73貴州3755.611012.14747.57589.35535.43983.131146.35云南4460.581102.14943.67393.22708.781587.19798.69西藏4581.601086.42689.76356.86352.311062.83465.84陜西3988.571209.961018.23683.51863.361071.481430.22甘肅3359.301169.70801.21559.06746.77894.351025.47青海3548.851043.40790.50505.32701.37975.91889.32寧夏3432.231260.581128.12636.88921.861363.631075.88新疆3386.331357.05856.78552.50684.011198.65855.53參考表1.1中全國(guó)城鎮(zhèn)居民平均每人全年消費(fèi)性支出的數(shù)據(jù),將我國(guó)經(jīng)濟(jì)發(fā)展區(qū)域劃分為3類,即經(jīng)濟(jì)一般發(fā)達(dá)地區(qū)、比較發(fā)達(dá)地區(qū)、發(fā)達(dá)地區(qū)。在應(yīng)用SPSS軟件采用系統(tǒng)聚類方法進(jìn)行聚類時(shí),將聚類數(shù)定義為3,運(yùn)行SPSS軟件,輸出結(jié)果如下:表1.2案例處理摘要(a)案例有效缺失合計(jì)N百分比N百分比N百分比27100.0%0.0%27100.0%a.平方Euclidean距離已使用上表是樣品的處理概要,從中可以看出27個(gè)樣品的數(shù)據(jù)全都有效,均用于系統(tǒng)聚類分析過程。表1.3系統(tǒng)聚類過程表階群集組合系數(shù)首次出現(xiàn)階群集下一階群集1群集2群集1群集21923.3230052511.4520053816.61400114714.681009559.69721861519.703001071220.826001485101.050501397211.07040121015181.2186019118131.2923014127171.338901513451.4490815148121.8221171715471.9101312171625262.342002117482.457151418184243.08717019194153.446181022206225.16200222125276.9891602522467.14519202523239.0250024241212.236023262542512.437222126261446.99524250上表是樣品的凝聚進(jìn)度,從中可以看出系統(tǒng)聚類分析過程中的每一步。由于有27個(gè)樣品,所以總共進(jìn)行了26步,并在每一步中給出了凝聚過程中兩類之間的相關(guān)系數(shù)。階(Stage)表示聚類的先后順序群集組合(ClusterCombined)表示在某步中合并的個(gè)案,合并后用第一項(xiàng)的個(gè)案號(hào)表示生成的新類。系數(shù)(Coefficients)為相似系數(shù)。據(jù)聚類分析的基本原理,個(gè)案之間的親密程度最高即相似系數(shù)最接近于1,最先合并。因此該列中的系數(shù)與第一列的聚類步驟相對(duì)應(yīng),系數(shù)從小到大。首次出現(xiàn)的階聚集(StageClusterFirstAppears)表示新類首次出現(xiàn)的步驟。對(duì)應(yīng)于各聚類步驟參與合并的兩項(xiàng)中,如果有一個(gè)是新生成的類,則在對(duì)應(yīng)的列中顯示出該新類在哪一步中第一次生成。下一階(NextStage)為新類下一次出現(xiàn)的步驟,表示對(duì)應(yīng)步驟生成的新類將在第幾步與其它個(gè)案或新類合并。表1.4群集成員案例群集案例群集1:北京115:內(nèi)蒙古32:上海116:寧夏33:浙江117:青海34:福建218:山東35:江蘇219:山西36:天津220:陜西37:貴州321:四川38:河北322:西藏39:河南323:新疆310:黑龍江324:云南311:湖北325:安徽312:湖南326:甘肅313:吉林327:廣西314:江西3上表表明聚類成員,給出了每一個(gè)樣品為所分三類中哪一類的成員,即系統(tǒng)聚類分析的最終結(jié)果。表1.5分類的樹狀表聚類分析結(jié)論:對(duì)聚類結(jié)果的類別間距離進(jìn)行方差分析,方差分析表明,類別間距離差異的概率值均<0.1,即聚類效果好。這樣,原有27類(即原有的27個(gè)省區(qū)分組)聚合成3類,第一類含有3個(gè)地區(qū),第二類含3有個(gè)地區(qū),第三類含有21個(gè)地區(qū)??偨Y(jié)得出:第一類:3個(gè)地區(qū)北京市、浙江省、上海市;第二類:3個(gè)地區(qū)天津市、福建省、江蘇省;第三類:21個(gè)地區(qū)河南省、甘肅省等其它地區(qū)。這與我們直觀上得出的結(jié)論并比較吻合,第一類的北京為中國(guó)政治經(jīng)濟(jì)文化中心,浙江和上海為沿海經(jīng)濟(jì)迅速發(fā)展區(qū),地處經(jīng)濟(jì)發(fā)達(dá)地區(qū);第二類的天津市、福建和江蘇省也都屬于經(jīng)濟(jì)較發(fā)達(dá)地區(qū),故經(jīng)濟(jì)入選較為發(fā)達(dá)類型;而第三類的河南省、甘肅省等其它地區(qū)則同屬于經(jīng)濟(jì)一般發(fā)達(dá)類型。這個(gè)結(jié)果從一個(gè)側(cè)面反映出了我國(guó)經(jīng)濟(jì)發(fā)展的水平和結(jié)構(gòu)。經(jīng)濟(jì)水平有了較大的提高,但經(jīng)濟(jì)重心仍然集中在幾個(gè)發(fā)達(dá)的主要省市,如北京、上海等。中國(guó)實(shí)行改革開放政策以來.經(jīng)濟(jì)有了突飛猛進(jìn)的增長(zhǎng).特別是城鎮(zhèn)經(jīng)濟(jì)的迅速發(fā)展,但經(jīng)濟(jì)發(fā)展不平衡的問題也一直伴隨著.3.模型的判別分析根據(jù)聚類分析的結(jié)果,將各地區(qū)共分為3類,編號(hào)分別為1,2和3。在SPSS中添加新的一列資源分類來表示類別,將這27個(gè)已分類的地區(qū)作為“訓(xùn)練樣本”,用7組預(yù)測(cè)變量來建立判別準(zhǔn)則來對(duì)27個(gè)地區(qū)進(jìn)行判別分析;同時(shí)根據(jù)所建立的判別準(zhǔn)則判別遼寧、廣東、海南、重慶4個(gè)省區(qū),即“待判樣本”屬于哪一類經(jīng)濟(jì)發(fā)展區(qū)域;原始數(shù)據(jù)如下表2.1所示:表2.1分類后的數(shù)據(jù)序號(hào)地區(qū)食品衣著居住家庭設(shè)備醫(yī)療保健交通通信教育文化聚類1北京4560.521442.42977.471322.362173.262514.761212.8912上海5248.951026.87877.59762.922332.832431.741435.7213浙江4393.401383.63615.45852.272492.011946.151229.2514福建3854.26784.71525.65513.611232.701321.331233.4925江蘇3462.66886.82647.52600.691203.451467.36997.5326天津3680.22864.89634.391049.331092.871452.171368.2027安徽3091.28869.55336.99441.42788.25869.23694.1738甘肅2408.37854.00403.80562.74703.071034.42716.3539廣西2857.40477.67360.62401.06785.01850.90826.86310貴州2649.02832.74446.53329.77775.07938.37627.23311河北2492.26849.58460.27737.43875.43827.72864.92312河南2215.32919.31431.02520.57762.08847.12737.00313黑龍江2215.68971.44319.37634.30665.01843.94755.32314湖北2868.39877.01401.22517.19763.14997.74752.56315湖南2850.94868.23513.63632.52965.091182.18871.70316吉林2457.21907.61318.65671.44815.02890.22984.95317江西2636.93725.72451.32357.03600.16894.58742.93318內(nèi)蒙古2323.551168.93464.55555.00928.481052.65802.26319寧夏2444.98874.39480.70578.75774.57846.72890.97320青海2366.42724.96420.31542.93753.07793.72653.04321山東2711.651091.22526.29624.061175.571201.97838.17322山西2252.501016.69441.82589.97825.181007.92830.38323陜西2588.91768.47478.58612.30824.461280.14746.59324四川2838.22754.93505.83449.871009.35976.33728.43325西藏3107.90734.83211.10221.70694.21359.34612.67326新疆2386.97953.03364.11472.35765.72819.72698.66327云南3102.46745.08335.14600.081076.93754.69585.35328廣東6225.221064.331814.001052.57925.622979.882168.88待判別29海南4507.81581.661000.32585.72604.151548.76961.95待判別30遼寧4680.851338.841293.00607.511018.441493.171283.68待判別31重慶4576.231503.491120.601043.06982.731189.031351.90待判別3.1SPSS軟件分析后的結(jié)果如下:表2.2特征值函數(shù)特征值方差的%累積%正則相關(guān)性123.382a95.595.5.97921.099a4.5100.0.724分析中使用了前2個(gè)典型判別式函數(shù)。從表中可以看出SPSS給出了兩個(gè)判別函數(shù),它們的特征值分別為23.382和1.099。因?yàn)楹瘮?shù)1的特征值(即組間平方和與組內(nèi)平方和之比值,即B0/E0)最大,且貢獻(xiàn)率為95.5%(>85%),說明所選擇的典型變量互不相關(guān),可以對(duì)樣本進(jìn)行距離判別;函數(shù)1的正則相關(guān)性(是組間平方和與總平方和之比的平方根)接近1,說明組間差異較大;所以函數(shù)1最具判別力。表2.3Wilks的Lambda函數(shù)檢驗(yàn)Wilks的Lambda卡方dfSig.1到2.02082.63814.0002.47615.5686.016函數(shù)檢驗(yàn)的零假設(shè)是各組變量均值相等。Lambda接近0表示組均值不同,接近1表示組均值沒有不同。lambda的卡方轉(zhuǎn)換(Chi-square)用于確定其顯著性,由表中數(shù)據(jù)可知具有顯著性(sig.<0.01)。表2.4典型判別式函數(shù)系數(shù)函數(shù)12食品.002.002衣著.003.000家庭設(shè)備-.001.006醫(yī)療保健.000.000交通和通信.003-.004教育文化.002-.003居住.002.007(常量)-15.968-6.337非標(biāo)準(zhǔn)化系數(shù)上表是根據(jù)7組預(yù)測(cè)變量建立的兩個(gè)典則判別函數(shù)的各個(gè)變量的系數(shù),通過這個(gè)系數(shù)可以得到Fisher得分。表2.5組質(zhì)心處的函數(shù)AverageLinkage(BetweenGroups)函數(shù)12發(fā)達(dá)12.051-.994較發(fā)達(dá)3.0442.716一般-2.156-.246在組均值處評(píng)估的非標(biāo)準(zhǔn)化典型判別式函數(shù)上表給出了每個(gè)典則判別函數(shù)在每一組(類)中的質(zhì)心,結(jié)合判別函數(shù)1和判別函數(shù)2可以對(duì)訓(xùn)練樣本進(jìn)行判別分析,將訓(xùn)練樣本的變量帶入函數(shù),得到的值與哪一組質(zhì)心最接近,則判斷就屬于此組,經(jīng)過SPSS軟件計(jì)算,如圖2.1所示:圖2.1所有組的散點(diǎn)圖根據(jù)表2.4所建立的2個(gè)典則判別函數(shù),把這兩個(gè)函數(shù)當(dāng)成該觀測(cè)值的坐標(biāo),這樣表2.1中的31個(gè)觀測(cè)值(包括4個(gè)“待判樣本”)就是二維平面上的31個(gè)點(diǎn);它們的點(diǎn)位投影到二維空間之后,再根據(jù)各點(diǎn)的位置遠(yuǎn)近算出具體的判別公式,進(jìn)行距離判別。3.2采用Fisher判別,分類統(tǒng)計(jì)量為:表2.6組的先驗(yàn)概率AverageLinkage(BetweenGroups)先驗(yàn)用于分析的案例未加權(quán)的已加權(quán)的發(fā)達(dá).11133.000較發(fā)達(dá).11133.000一般.7782121.000合計(jì)1.0002727.000上表是每一類的先驗(yàn)概率是根據(jù)組的大小進(jìn)行計(jì)算所得。表2.7分類函數(shù)系數(shù)AverageLinkage(BetweenGroups)發(fā)達(dá)較發(fā)達(dá)一般食品.094.080.064衣著.150.128.114家庭設(shè)備.052.080.067醫(yī)療保健.001-.003-.003交通和通信.038-.008-.013教育文化.002-.023-.024居住.089.097.065(常量)-448.251-263.140-153.414上表為每類的分類函數(shù)系數(shù),即Fisher線形判別函數(shù)。該表給出了三個(gè)線性分類函數(shù)的系數(shù)。通過將一個(gè)新的樣品的各個(gè)指標(biāo)(變量)代入這些函數(shù),經(jīng)計(jì)算,就可以得到分別代表三類的三個(gè)值,哪個(gè)值最大,該樣品就屬于相應(yīng)的那一類;也就是說,將該樣品判定屬于該類。各類Fisher線形判別函數(shù)為:F1=-448.251+0.094·食品+0.150·衣著+0.052·家庭設(shè)備+0.001·醫(yī)療保健+0.038·交通和通信+0.002·教育文化+0.089·居住;F2=-263.140+0.080·食品+0.128·衣著+0.080·家庭設(shè)備-0.003·醫(yī)療保健-0.008·交通和通信-0.023·教育文化+0.097·居?。籉3=-153.414+0.064·食品+0.114·衣著+0.067·家庭設(shè)備-0.003·醫(yī)療保健-0.013·交通和通信-0.024·教育文化+0.065·居住?,F(xiàn)由所建立的Fisher線形判別函數(shù)可以直接對(duì)27個(gè)訓(xùn)練樣本和4個(gè)待判樣本進(jìn)行判別歸類,同時(shí)可以得到回報(bào)率和判別得分,最終結(jié)果如表2.8、表2.9所示:表2.8判別結(jié)果案例數(shù)目實(shí)際組最高組判別式得分預(yù)測(cè)組P(D>d|G=g)P(G=g|D=d)到質(zhì)心的平方Mahalanobis距離函數(shù)1函數(shù)2pdf初始133.71821.000.662-1.364-.063233.66321.000.823-2.908-.754333.63321.000.915-2.672.560433.78721.000.479-2.636-.746533.73321.000.620-2.176.541633.52021.0001.308-3.283-.443733.48621.0001.441-3.323-.528833.81421.000.411-1.614.095933.22921.0002.952-.481.1371033.61021.000.988-1.861.7031133.25021.0002.772-3.348.9171233.63621.000.905-1.376-.7901333.31621.0002.303-2.5361.2241433.25421.0002.742-3.721-.7881533.02421.0007.444.432-1.1081633.99021.000.019-2.257-.3421733.67221.000.795-1.874-1.0921833.68521.000.758-1.349-.5721933.53321.0001.258-2.990.5042033.67921.000.775-2.892-.7312133.14121.0003.915-1.055-1.8902222.91921.000.1683.4142.8932322.1762.9993.4752.376.9762422.28221.0002.5343.3424.2802511.94221.000.11911.709-.9592611.14221.0003.90412.975.7522711.17321.0003.51311.470-2.77628(廣東)未分組的1.02721.0007.2599.478-1.79129(海南)未分組的3.64821.000.868-1.468-.87330(遼寧)未分組的3.08921.0004.843-.8551.52931(重慶)未分組的2.2192.9973.0381.8251.470表2.9分類結(jié)果aAverageLinkage(BetweenGroups)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論