《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第1頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第2頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第3頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第4頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計分析與SPSS的應用(第五版)》(薛薇)課后練習答案第10章SPSS的聚類分析1、根據(jù)“高校科研研究?sav”數(shù)據(jù),利用層次聚類分析對各省市的高??蒲星闆r進行層次聚類分析。要求:根據(jù)凝聚狀態(tài)表利用碎石圖對聚類類數(shù)進行研究。繪制聚類樹形圖,說明哪些省市聚在一起。繪制各類的科研指標的均值對比圖。利用方差分析方法分析各類在哪些科研指標上存在顯著差異。采用歐氏距離,組間平均鏈鎖法利用凝聚狀態(tài)表中的組間距離和對應的組數(shù),回歸散點圖,得到碎石圖。大約聚成4類步驟:分析T分類T系統(tǒng)聚類一按如下方式設置……結果:凝聚計劃階段組合的集群系數(shù)首次出現(xiàn)階段集群下一個階段集群1集群2集群1集群212630328.18900222629638.295107320251053.42300544121209.922001558201505.03503668161760.170509724261831.926021087111929.89100119582302.02406221024312487.209702211272709.88708161222282897.1060019136232916.55100171410193280.7520025154213491.585402116234229.37511021176134612.42313020189185377.25300251914225622.41501224206155933.5181702321246827.276161526225247930.765910242324252627282930659292212714106175929475.4982002614959.70422192819623.05018142724042.66921232832829.4662502948360.85426242991313.530282730293834.5030290將系數(shù)復制下來后,在EXCEL中建立工作表。選中數(shù)據(jù)列,點擊“插入”菜單T拆線圖碎石圖:由圖可知,北京自成一類,江蘇、廣東、上海、湖南、湖北聚成一類。其他略。-確定。接下來,添加一個變量CLU4_1,其值為類別值。(1、2、3、4),再數(shù)據(jù)-匯總T設置均值對比,依據(jù)聚類解,利用分類匯總,計算各個聚類變量的均值-確定。方差分析結果:分析T比較均值T單因素ANOVAT設置......T確定ANOVA平方和df均方F顯著性投入人年數(shù)組之間59778341.196319926113.73226.428.000組內20357294858總計80135635.35530投入高級職稱的人年數(shù)組之間16485966.82035495322.27334.553.000組內4294074783總計20780040.96830投入科研事業(yè)費(百元)組之間132451401880.8344150467293.324.318.00084628組內136133442.473675602946.794274總計136127004827.67730課題總數(shù)組之間16470536.56435490178.85532.181.000組內4606273.43627170602.720總計21076810.00030專著數(shù)組之間7203690.38532401230.12861.327.000組內1057167.8092739154.363論文數(shù)獲獎數(shù)總計8260858.19430組之間219675698.219373225232.74017.693.000組內111743385.717274138643.915總計331419083.93530組之間169882.049356627.3503.619.026組內422436.7902715645.807總計592318.83930不同組在各個聚類變量上的均值均存在顯著差異。2、試說明當變量存在數(shù)量級上的差異,進行層次聚類分析時為什么要對數(shù)據(jù)進行標準化處理?因為數(shù)量級將對距離產(chǎn)生較大影響,并影響最終聚類結果。3、試說明變量之間的高度相關性是否會對層次聚類分析結果造成影響?為什么?會。如果所選變量之間存在較強的線性關系,能夠相互替代,在計算距離時同類變量將重復“貢獻”,占有較高權重,而使最終的聚類結果偏向該類變量。4、試說明K-Mean聚類分析的基本步驟。K-Means聚類分析步驟:確定聚類數(shù)目K--確定K個初始類中心點--根據(jù)距離最近原則進行分類--重新確定K個類中心點--判斷是否已經(jīng)滿足終止條件。是一個反復迭代的分類過程。在聚類過程中,樣本所屬的類會不斷調整,直至達到最終穩(wěn)定為止。5、收集到我國2007年各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費支出數(shù)據(jù),數(shù)據(jù)文件名為“消費結構.sav”,變量包括:地區(qū)、消費性支出總額、食品、衣著、居住、家庭設備用品及服務、醫(yī)療保健、交通和通信、教育文化娛樂服務、醫(yī)療保健、雜項商品和服務支出。若采用層次聚類法(個體間距離定義為平方歐氏距離,類間距離定義為組間平均鏈鎖距離),繪制的碎石圖如下:(1) 依據(jù)上圖,數(shù)據(jù)聚成幾類較為恰當?(2) 試采用K-MEANS聚類方法,從類內相似性和類間差異性角度分析將數(shù)據(jù)聚成幾類較為恰當。1)聚成3類較為恰當。注:碎石圖可按第9章第1題方式繪制,也可按如下方式繪制。步驟:分析T降維T因子分析T導入全部變量到變量框中(地區(qū)變量除外)T抽?。哼x中碎石圖T繼續(xù)T確定。得到:(可以看出,分成3類恰當)(2)用K-MEANS聚類方法進行分類,比較分類數(shù)為2、3、4時的差別。步驟:分析T分類TK-平均聚類T地區(qū)變量導入到標注個案,其他變量全部導入到變量框中T聚類數(shù)填29選項:選中初始聚類中心和ANOVAT繼續(xù)T確定。得到:ANOVA聚類錯誤F顯著性均方df均方df食品13927902.9671246753.7792956.445.000衣著278718.565137555.425297.422.011居住667583.436131940.7642920.901.000家庭設備用品及服務411657.258114558.0412928.277.000醫(yī)療保健325304.302134400.296299.456.005交通和通信10285607.457157486.40029178.922.000教育文化娛樂服務5226361.465169080.9332975.656.000雜項商品和服務248312.93116496.5502938.222.000僅當出于描述目的時才應該使用F檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設的檢驗。每個聚舉中的個案數(shù)量聚類14.000227.000有效31.000缺失.000將上圖中的聚類數(shù)修改為3,則得到:ANOVA聚類錯誤F顯著性均方df均方df食品8311754.5092159294.7702852.178.000衣著100878.509241645.317282.422.107居住565811.147216508.6902834.274.000家庭設備用品及服務237257.836212833.0272818.488.000醫(yī)療保健198689.996233054.746286.011.007

交通和通信4709934.064290458.7482852.067.000教育文化娛樂服務2676015.304267059.9262839.905.000雜項商品和服務150742.66624829.5552831.213.000僅當出于描述目的時才應該使用F檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設的檢驗。每個聚類中的個案數(shù)量聚類11.000225.00035.000有效31.000缺失.000將上圖中的聚類數(shù)修改為4,則得到:ANOVA聚類錯誤F顯著性均方df均方df食品6461251.597362963.25127102.619.000衣著135334.013335623.106273.799.022居住237725.271332618.140277.288.001家庭設備用品及服務142250.914315077.322279.435.000醫(yī)療保健111992.289336553.186273.064.045交通和通信3596731.324343056.2632783.536.000教育文化娛樂服務1812882.568366335.5862727.329.000雜項商品和服務97486.29135342.7412718.246.000僅當出于描述目的時才應該使用F檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設的檢驗。每個聚類中的個案數(shù)量聚類11.00023.000315.000412.000有效31.000缺失.000從3個ANOVA表可以■出,分為2類時,P-值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論