信息統(tǒng)計分析期末論文_第1頁
信息統(tǒng)計分析期末論文_第2頁
信息統(tǒng)計分析期末論文_第3頁
信息統(tǒng)計分析期末論文_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

..信息統(tǒng)計論文論題:分地區(qū)農村居民消費支出__吳文潔__A01214035專業(yè):12信息與計算科學分地區(qū)農村居民消費支出—SAS和MATLAB的相關應用摘要:近年來,各類真人秀節(jié)目紛紛到農村取景,這讓我們了解到農村的現(xiàn)狀。關于拉近城鄉(xiāng)距離,首先要從經濟方面著手。農村居民消費十分準確的反映了這一經濟狀況。消費、投資和凈出口被譽為拉動經濟增長的"三駕馬車",在這三駕馬車中,消費的作用是最主要的,因為無論是發(fā)達國家還是發(fā)展中國家,消費在一國的國內生產總值中所占的份額均最大。已有研究表明,中國居民消費率大大低于國際水平,其主因是中國農村消費市場疲軟。因此,擴大內需其實重點是要擴大農村居民消費需求。特別是在全球金融危機仍然蔓延的時候,提高農村居民的消費需求顯得尤為重要。利用SAS軟件對我國各分地區(qū)農村居民消費情況進行分析,進一步了解消費情況,做出重要的決策。關鍵字:消費支出聚類分析正文:擴大國內需求,最大潛力在農村;實現(xiàn)經濟平穩(wěn)較快發(fā)展,基礎支撐在農業(yè);保障和改善民生,重點難點在農民。擴大消費尤其是擴大居民消費,無疑是中國。經濟在今后相當長時期內最重要的命題之一。在中國,居民消費占GDP的比重低且不斷降低,一個非常重要的原因就在于占總人口50%以上的農村居民消費嚴重滯后。如果農村居民消費能伴隨農民收入增長而快速增長,消費占GDP的比重將穩(wěn)步提升,國民經濟發(fā)展必將具備更堅實的微觀基礎。因此有必要對各地農村居民的綜合消費水平做個評價,以其為今后的經濟發(fā)展提供參考。各個地區(qū)的農村居民的消費指標主要是衣食住行支出、家庭設備及用品支出、交通通信、文教娛樂、醫(yī)療保健和其他支出等。本文通過利用SAS軟件對我國31個省市消費指標進行了分析,提出了各地區(qū)的差異及相關的評價。全國31個省、自治區(qū)、直轄市附近的農村居民各消費支出作為樣本,設x1為食品支出,x2為衣著支出、x3為居住支出、x4為家庭設備及用品支出、x5為交通通信支出、x6為文教娛樂支出、x7為醫(yī)療保健支出、x8為其他商品支出。相關數(shù)據(jù)來源于中國統(tǒng)計年鑒〔2013,該表格見附件1.xls。分析方法理論的介紹聚類分析實質上是尋找一種能客觀反映元素之間親疏關系的統(tǒng)計量,然后根據(jù)這種統(tǒng)計量把元素分成若干類。常用的聚類統(tǒng)計量有距離系數(shù)和相似系數(shù)兩類。距離系數(shù)一般用于對樣品分類,而相似系數(shù)一般用于對變量聚類。距離的定義很多,如馬氏距離、明考斯基距離、蘭氏距離、切比雪夫距離以及常見的歐氏距離等。相似系數(shù)有相關系數(shù)、夾角余弦、列聯(lián)系數(shù)等。下面以樣品聚類為例介紹系統(tǒng)聚類法。1.系統(tǒng)聚類法的基本思想:設有n個樣品,每個樣品測得m項指標〔見表7-1。系統(tǒng)聚類方法的基本思想是:首先定義樣品間的距離〔或相似系數(shù)和類與類之間的距離。一開始將n個樣品各自自成一類,這時類間的距離與樣品間的距離是等價的;然后將距離最近的兩類合并,并計算新類與其他類的類間距離,再按最小距離準則并類。這樣每次減少一類,直到所有的樣品都并成一類為止。這個并類過程可以用譜系聚類圖形象地表達出來。2.數(shù)據(jù)變換為了便于比較或消除量綱的影響,在作聚類之前常常首先要對數(shù)據(jù)進行變換。變換的方法有中心化變換、標準化變換、極差標準化變換、極差正規(guī)化變換、對數(shù)變換等。最常用的標準化變換為:其中j=1,2,…,m。變換后的數(shù)據(jù),每個變量的樣本均值為0,標準差為1,而且標準化變換后的數(shù)據(jù){}與變量的量綱無關。聚類方法分為以下幾種:重心法:重心法<CentroidMethod>用兩個類重心<均值>之間的〔平方歐氏距離定義類間距離。最長距離法:用最長距離法<CompleteMethod>用兩類觀測間最遠一對觀測的距離定義類間距離。最短距離法:最短距離法<SingleLinkage>用兩類觀測間最近一對觀測的距離定義類間距離。對不同地區(qū)人均消費水平進行聚類分析1.使用最短距離法和最長距離法對不同地區(qū)居民消費情況做聚類分析,程序見附件1.m31個地區(qū)農民消費情況聚類分析圖不同聚類方法分組情況如下所示:最短距離法聚類的結果:group11=3〔XX4〔XX5〔XX6〔XX7〔XX8〔XX12〔XX13〔XX14〔XX15〔XX16〔XX17〔XX18〔XX19〔XX20〔廣西21〔XX22〔XX23<XX>24〔XX25〔XX26〔XX27〔XX28〔XX29〔XX30〔XX31〔新疆group12=2〔天津10〔XX11 〔XXgroup13= 1 〔北京group14=9〔上海最長距離法聚類的結果:group21=26〔XXgroup22=3〔XX4〔XX5〔XX6〔XX7〔XX8〔XX12〔XX14〔XX15〔XX16〔XX17〔XX18〔XX20〔廣西21〔XX22〔XX23〔XX24〔XX25〔XX27〔XX28〔XX29〔XX30〔XX31〔新疆group23=1〔北京9〔上海group24=2〔天津10111319〔XX結果分析:從聚類結果可以看出,第一類地區(qū)主要在西部,發(fā)展較為緩慢,農村居民的消費水平較低;第二類主要集中在中東部地區(qū),經濟發(fā)展中等,農村居民的消費水平中等;第三類主要集中在直轄市或是沿海城市,發(fā)展較快,農村居民的消費水平較高;第四類主要集中在北京,上海這樣的大都市,發(fā)展較為迅速,農村居民的消費水平最高。2.x1-x8這些指標作變量聚類分析。由于數(shù)據(jù)較多,首先將表中的數(shù)據(jù)生成SAS數(shù)據(jù)集data222,然后利用VARCLUS進行分析。程序如下:procvarclusdata=data222;varx1-x8;run;procvarcluscentroid;varx1-x8;run;procvarclushimaxc=4;varx1-x8;run;quit;輸出結果如下:31個地區(qū),8個變量。這是利用重心分量法思想進行主成分聚類的第一步,把8個變量聚成一類,能解釋的偏差為6.40502,比例為0.80061類分為兩類,能解釋的總偏差為6.391489,比例為0.7989以上輸出的是每個指標與類成分之間的相關系數(shù)的平方,1-R**2比越小,說明分配越合理。以上輸出是從標準化變量預測類成分的標準回歸系數(shù),若設Cluster1、Cluster2分別為第一類和第二類,用C1和C2表示,即:C1=0.179130x1+0.176200x2+0.175463x4+0.179547x5+0.184311x6+0.187812x8C2=0.533222x3+0.533222x7類結構相當于因子分析中的因子模型,即每個標準化變量可以表示成全部類成分的線性組合。如:x1=0.916724C1+0.743139C2,以此可以寫出其他標準化變量。類內相關就是類成分之間的相關系數(shù)。此時已達到隱含的停止分裂的臨界值,停止分裂。聚成三類和聚成兩類分析方法類似。聚成4類是1-R**比的值比聚成兩類和三類的值要小,因此要分成4類比較合適。3.結論:綜合生活常識,發(fā)現(xiàn)8個變量分成四類比較合適,即第一類x2衣著,x5交通通信,x6文教娛樂,x8其他,這是與生活服務支出有關的變量;第二類x3居??;第三類x1食品,x4家庭設備及用品,這是居民基本生活消費變量;第四類x7醫(yī)療保健。小結:通過對不同地區(qū)的農民消費水平額聚類分析及不同消費因素之間的聚類分析,得出:國家在刺激中東部地區(qū),沿海等大城市發(fā)展的同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論