多個(gè)總體距離判別法_第1頁
多個(gè)總體距離判別法_第2頁
多個(gè)總體距離判別法_第3頁
多個(gè)總體距離判別法_第4頁
多個(gè)總體距離判別法_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGE多個(gè)總體距離判別法及其應(yīng)用課程名:年級(jí):專業(yè):姓名:學(xué)號(hào):目錄TOC\h\z\t"大標(biāo)題,1,小標(biāo)題,2,小標(biāo)題3,2"一、 摘要 1二、 引言 1三、 原理 13.1 定義 13.2 思想 13.3 判別分析過程 1四、 具體應(yīng)用 34.1 判別分析在醫(yī)學(xué)上的應(yīng)用 34.2 距離判別法在居民生活水平方面的應(yīng)用 94.3 判別分析軟件的使用 12五、 參考文獻(xiàn) 14六、 附錄 15PAGE17摘要近年來隨著信息化社會(huì)的進(jìn)行,數(shù)據(jù)分析對(duì)我們來說日趨重要,為了對(duì)數(shù)據(jù)的分類進(jìn)行判別,本文介紹了數(shù)據(jù)分類判別的一種方法:距離判別法。本文從多個(gè)總體距離判別法理論出發(fā)并結(jié)合例題詳細(xì)介紹了多個(gè)總體距離判別法的在醫(yī)學(xué)領(lǐng)域以及居民生活水平方面的應(yīng)用,同時(shí)也簡單介紹了spss軟件一般判別法的具體操作。關(guān)鍵詞:距離判別法判別分析一般判別分析引言隨著科技的發(fā)展,判別分析在經(jīng)濟(jì),醫(yī)學(xué)等很多領(lǐng)域以及氣候分類,農(nóng)業(yè)區(qū)劃,土地類型劃分等有著重要的應(yīng)用,本文從多個(gè)總體距離判別分析理論出發(fā),介紹了多個(gè)總體距離判別法在醫(yī)學(xué)以及人民生活方面的應(yīng)用,并介紹了spss一般判別分析的應(yīng)用。原理定義距離判別法:距離判別分析方法是判別樣品所屬類別的一應(yīng)用性很強(qiáng)的多因素決方法,其中包括兩個(gè)樣本總體距離判別法,多個(gè)樣本距離判別法。多個(gè)總體距離判別法:多個(gè)總體距離判別法是距離判別法的一種,是兩個(gè)總體距離判別法的推廣,具有多個(gè)總體,將待測樣本歸為多個(gè)樣本中的一類。思想計(jì)算待測樣本與各總體之間的距離,將待測樣本歸為與其距離最進(jìn)的一類。判別分析過程對(duì)于k個(gè)總體,假設(shè)其均值分別為:,協(xié)方差陣分別為:,(其中i=1,2,…k),待測樣本為,其中為樣本的p個(gè)檢測指標(biāo),假設(shè)的均值為,協(xié)方差為,判斷屬于哪個(gè)總體。步驟:從,k個(gè)總體中,取n個(gè)樣本,分別記為總體樣本,再結(jié)合上面p個(gè)指標(biāo),這k個(gè)樣本可以表述如下:第j個(gè)總體樣本(j=1,2…k)變量指標(biāo)樣本………均值…(1)當(dāng)待測樣本與各總體樣本的均值相等時(shí),即=……==;則相應(yīng)的判別函數(shù)為:(其中i,j=1,2…k,表示X與的馬氏距離);判斷準(zhǔn)則:如果對(duì)所有i≠j有成立,則,若存在i和j使得成立,則待判。當(dāng)各樣本總體的均值和協(xié)方差陣未知時(shí),可以從中抽取,i=1,2…k;則和的無偏估計(jì)可以表示為:(i=1,2…,k)(其中n=1+2+……+n,)(2)當(dāng)各樣本總體樣本的均值不相等時(shí),相應(yīng)的判別函數(shù)為:判別準(zhǔn)則:若對(duì)所有i≠j有則,若存在i和j使得成立,則待判。具體應(yīng)用判別分析在醫(yī)學(xué)上的應(yīng)用為了研究某地區(qū)人口死亡狀況,已按某種方法將15個(gè)已知樣品分為三類(如下表所示),指標(biāo)及原始數(shù)據(jù)見下表,試建立判別函數(shù)并判定另外4個(gè)待判樣品分別屬于哪類。:0歲死亡率:1歲死亡率:10歲死亡率:55歲死亡率:80歲死亡率:平均預(yù)期壽命組別序號(hào)第一組134.167.441.127.8795.1969.30233.066.341.086.7794.0869.70332.269.241.048.9797.3068.80440.1713.451.4313.88101.2066.20550.0623.032.8323.74112.5263.30第二組133.246.241.1822.90160.0165.40232.224.221.0620.70124.7068.70341.1510.082.3232.84172.0665.85453.0425.744.0634.87152.0363.50538.0311.206.0727.84146.3266.80第三組134.035.410.075.2090.1069.50232.113.020.093.1485.1570.80344.1215.121.0815.15103.1264.80454.1725.032.1125.15110.1463.70528.072.010.073.0281.2268.30待判樣品150.226.661.0822.54170.6065.20234.647.331.117.7895.1669.30333.426.221.1222.95160.3168.30444.0215.361.0716.45105.3064.20我們假設(shè)兩樣本的協(xié)方差相等;本題中變兩個(gè)數(shù)p=6,三類總體各有5個(gè)樣本,故n1=n2=n3=5;利用Matlab軟件并結(jié)合Excel表格進(jìn)行下列計(jì)算(具體計(jì)算見附錄)計(jì)算各組的樣本的均值為:=(37.9411.901.5012.25100.06 67.46)'=(39.5411.502.94 27.83 151.02 66.05)'=(38.50 10.12 0.68 10.33 93.95 67.42)'計(jì)算樣本協(xié)方差:222.23 197.45 22.06 204.82 216.83 -78.73197.45 184.16 19.95 189.14 202.76 -72.48222.23 197.45 22.06 204.82 216.83 -78.73197.45 184.16 19.95 189.14 202.76 -72.4822.06 19.95 2.31 20.64 22.12 -7.70204.82 189.14 20.64 194.65 208.18 -74.58216.83 202.76 22.12 208.18 223.65 -79.32-78.73 -72.48 -7.70 -74.58 -79.32 29.09=280.39 276.83 34.25 186.34 190.63 -51.18276.83 285.55 38.83 170.97 130.24 -52.13280.39 276.83 34.25 186.34 190.63 -51.18276.83 285.55 38.83 170.97 130.24 -52.1334.25 38.83 18.07 26.89 7.03 -4.22186.34 170.97 26.89 149.80 255.81 -34.64190.63 130.24 7.03 255.81 1239.35 -85.90-51.18 -52.13 -4.22 -34.64 -85.90 14.55=446.73 412.75 37.52 404.44 511.45 -113.09412.75 385.67 35.33 379.56 471.10 -109.50446.73 412.75 37.52 404.44 511.45 -113.09412.75 385.67 35.33 379.56 471.10 -109.5037.52 35.33 3.30 34.95 42.13 -10.17404.44 379.56 34.95 374.31 460.21 -109.16511.45 471.10 42.13 460.21 600.52 -133.21-113.09 -109.50 -10.17 -109.16 -133.21 37.23=從而949.35 887.03 93.83 795.6 918.91 -243949.35 887.03 93.83 795.6 918.91 -243887.03 855.38 94.11 739.67 804.1 -234.1193.83 94.11 23.68 82.48 71.28 -22.09795.6 739.67 82.48 718.76 924.2 -218.38918.91 804.1 71.28 924.2 2063.52 -298.43-243 -234.11-22.09-218.38-298.4380.87S=S1+S2+S3=79.11 73.92 7.82 66.30 76.58 -20.2573.92 71.28 7.84 61.64 67.01 -19.517.82 7.84 1.97 6.87 5.94 -1.8466.30 61.64 6.87 59.90 77.02 -18.2076.58 67.01 5.94 77.02 171.96 -24.8779.11 73.92 7.82 66.30 76.58 -20.2573.92 71.28 7.84 61.64 67.01 -19.517.82 7.84 1.97 6.87 5.94 -1.8466.30 61.64 6.87 59.90 77.02 -18.2076.58 67.01 5.94 77.02 171.96 -24.87-20.25 -19.51 -1.84 -18.20 -24.87 6.740.85 -0.73 0.39 -0.37 -0.02 -0.50-0.73 0.84 -0.42 0.12 0.05 0.620.85 -0.73 0.39 -0.37 -0.02 -0.50-0.73 0.84 -0.42 0.12 0.05 0.620.39 -0.42 1.18 -0.29 0.01 -0.47-0.37 0.12 -0.29 0.48 -0.05 0.30-0.02 0.05 0.01 -0.05 0.02 0.05-0.50 0.62 -0.47 0.30 0.05 1.35=求判別函數(shù),解線性方程組,得3.62 -1.42 0.69 -3.69 -0.28 -3.83-2.28 2.12 -0.50 0.84 0.15 1.97-3.62 1.42 -0.69 3.69 0.28 3.83-5.90 3.53 -1.19 4.53 0.43 5.792.28 -2.12 0.50 -0.84 -0.15 -1.975.90 -3.53 1.19 -4.53 -0.43 -5.79=從而可以求得===3.62 -1.42 0.69 -3.69 -0.28 -3.83-2.28 2.12 -0.50 0.84 0.15 1.97-3.62 1.42 -0.69 3.69 0.28 3.83-5.90 3.53 -1.19 4.53 0.43 5.792.28 -2.12 0.50 -0.84 -0.15 -1.975.90 -3.53 1.19 -4.53 -0.43 -5.79239.52-92.56-239.52-332.0892.56332.08=+對(duì)已知樣本的回判:將題目中表格中個(gè)數(shù)據(jù)代入上述方程組中可得:從上表中可知判對(duì)率為100%。對(duì)待測樣本進(jìn)行判斷,通過EXcel表格計(jì)算的下表從表格中可以看出待判樣本1屬于第3組,待判樣本2屬于第1組,帶判樣本3屬于第2組,帶判樣本4屬于第3組。距離判別法在居民生活水平方面的應(yīng)用數(shù)據(jù)來源及說明:本例的數(shù)據(jù)來源于國家統(tǒng)計(jì)局網(wǎng)站,選擇了全國20省市進(jìn)行分析,數(shù)據(jù)為我國2010年城鎮(zhèn)生活的6項(xiàng)重要指標(biāo),包括食品,衣著,燃料,住房及生活用品和文化生活。由于數(shù)據(jù)未進(jìn)行分類,故先對(duì)其進(jìn)行聚類分析,我們選擇前21個(gè)省市利用spss進(jìn)行K-均值聚類分析,為后面計(jì)算方便,將其分成3類,結(jié)果如下:建立表格如下:本例中變兩個(gè)數(shù)為p=6;第一類有9個(gè)樣本,第二類有8個(gè)樣本,第三類有4個(gè)樣本,即n1=9,n2=8,n3=4;三類地區(qū)個(gè)變量的均值:=(107.7521.168.6412.49 16.823.80)';=(142.9824.3014.4517.0420.41 5.13)';=(141.6633.1913.30 38.1235.904.07)';168.06 8.87 16.67 17.02 -2.12 4.138.87 14.74 -0.52 2.58 10.28 -0.8216.67 -0.52 8.27 -0.62 -0.23 0.9117.02 2.58 -0.62 36.38 2.02 1.20168.06 8.87 16.67 17.02 -2.12 4.138.87 14.74 -0.52 2.58 10.28 -0.8216.67 -0.52 8.27 -0.62 -0.23 0.9117.02 2.58 -0.62 36.38 2.02 1.20-2.12 10.28 -0.23 2.02 16.24 -2.314.13 -0.82 0.91 1.20 -2.31 1.220.01 -0.01 -0.02 0.00 0.01 -0.01-0.01 0.14 0.04 0.00 -0.11 -0.10-0.02 0.04 0.18 0.02 -0.05 -0.150.00 0.00 0.02 0.03 -0.02 -0.060.01 -0.11 -0.05 -0.02 0.17 0.28-0.01 -0.10 -0.15 -0.06 0.28 1.47求判別函數(shù):35.8372.0835.8372.08-35.8336.25-72.08-36.25-0.18 0.20 -0.21 0.01 -0.56 -1.27-0.13 0.40 -0.14 -0.51 -1.68 -2.110.18 -0.20 0.21 -0.01 0.56 1.270.05 0.20 0.07 -0.53 -1.13 -0.840.13 -0.40 0.14 0.51 1.68 2.11-0.05 -0.20 -0.07 0.53 1.13 0.84-0.18 0.20 -0.21 0.01 -0.56 -1.27-0.13 0.40 -0.14 -0.51 -1.68 -2.110.18 -0.20 0.21 -0.01 0.56 1.270.05 0.20 0.07 -0.53 -1.13 -0.840.13 -0.40 0.14 0.51 1.68 2.11-0.05 -0.20 -0.07 0.53 1.13 0.8435.8335.8372.08-35.8336.25-72.08-36.25+對(duì)已知樣本進(jìn)行回判:根據(jù)判別準(zhǔn)則,并計(jì)算可的下表從上表中可知回判率為100%;故可對(duì)帶判樣本進(jìn)行判別分析。對(duì)待判樣本進(jìn)行判別歸類,計(jì)算結(jié)果如下從表中可以看出新疆屬于第一組,湖南和黑龍江屬于第二組,江蘇屬于第三組。判別分析軟件的使用從上面的兩個(gè)例子中可發(fā)現(xiàn),對(duì)于3個(gè)樣本的距離判別分析計(jì)算量很大,如果對(duì)于更多的樣本的情況,計(jì)算將非常復(fù)雜,下面我們以例二為例簡單介紹使用spss進(jìn)行一般判別分析將數(shù)據(jù)輸入spss數(shù)據(jù)視圖中。一般判別分析spss操作選擇菜單分析→分類→判別,出現(xiàn)下圖(1),本例中將類別選入分組變量中,并定義其變量范圍為1到3(下圖(2)),將食品,衣著等其他變量選入自變量中,再按需要選擇其他統(tǒng)計(jì)量和分類等,本題中這些選項(xiàng)選擇默認(rèn),在單擊保存,并勾選預(yù)測組成員(下圖(3)).(1)(2)(3)單擊確認(rèn)就可得到本題的結(jié)果。結(jié)果分析:我們可以從數(shù)據(jù)視圖中看到分類的結(jié)果:(即表格中最后一列)Wilks的Lambda檢驗(yàn)結(jié)果可以用于檢驗(yàn)各個(gè)判別函數(shù)有無統(tǒng)計(jì)學(xué)上的顯著意義,由于本例中兩個(gè)sig均小于0.05,說明判別函數(shù)的作用都是顯著的。從結(jié)果中還可以得到標(biāo)準(zhǔn)化函數(shù)的系數(shù)。如下表所示其余的結(jié)果在這里不再詳述,有興趣的讀者可以參閱《spss統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》(謝龍漢尚濤)。參考文獻(xiàn)[1]王靜龍,梁小筠定性數(shù)據(jù)統(tǒng)計(jì)分析北京:中國統(tǒng)計(jì)出版社,2008.7[2]任雪松,于秀林多元統(tǒng)計(jì)分析北京:中國統(tǒng)計(jì)出版社,2010.12[3]謝龍漢,尚濤spss統(tǒng)計(jì)分析與數(shù)據(jù)挖掘北京:電子工業(yè)出版社,2012.1[4]袁志發(fā)多元統(tǒng)計(jì)分析北京:科學(xué)出版社,2009.7[5]朱建平應(yīng)用多元統(tǒng)計(jì)分析北京:科學(xué)出版社,2012.6附錄均值計(jì)算如下表:的計(jì)算計(jì)算:系數(shù)矩陣a以及常數(shù)b求解的matlab程序:clear,clcA1=[-3.782-4.46-0.38-4.376-4.8681.84;-4.882-5.56-0.42-5.476-5.9782.24;-5.682-2.66-0.46-3.276-2.7581.34;2.2281.55-0.071.6341.142-1.26;12.11811.131.3311.49412.462-4.16]';S1=A1*A1';A2=[-6.296-5.256-1.758-4.938.986-0.65;-7.316-7.276-1.878-7.13-26.3242.65;1.614-1.416-0.6185.0121.036-0.2;13.50414.2441.1227.041.006-2.55;-1.506-0.2963.1320.01-4.7040.75]';S2=A2*A2';A3=[-4.47-4.708-0.614-5.132-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論