畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型_第1頁(yè)
畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型_第2頁(yè)
畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型_第3頁(yè)
畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型_第4頁(yè)
畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/1畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型基于Fisher判別準(zhǔn)則的胃病分類模型摘要本文就胃癌患者、萎縮性胃炎患者以及非胃病患者的分類問(wèn)題,綜合運(yùn)用系統(tǒng)聚類和Fisher判別的方法建立了基于四個(gè)指標(biāo)的分類判別模型。

針對(duì)問(wèn)題一,模型采用系統(tǒng)聚類和Fisher判別的方法,根據(jù)題中已知類型的三個(gè)樣本13,14,15,將混淆的12個(gè)樣本1~12區(qū)別開(kāi)來(lái),并且使得樣本13,14,15在三個(gè)類別中。

使用SPSS軟件求得分類結(jié)果,胃癌患者:

1,2,4,5,13;萎縮性胃炎患者:

3,7,10,11,12,14;非胃病患者:

6,8,9,15。

針對(duì)問(wèn)題二,本題基于問(wèn)題一的分類情況,采用Fisher判別的方法,確定三個(gè)樣本16,17,18的類別。

使用SPSS軟件求得判別結(jié)果,第16號(hào)樣本和第18號(hào)樣本屬于第二類,即萎縮性胃病患者;第17號(hào)樣本屬于第三類,即非胃病患者。

最后對(duì)模型的優(yōu)缺點(diǎn)進(jìn)行分析,提出了改進(jìn)方案。

關(guān)鍵詞系統(tǒng)聚類;Fisher判別;SPSS軟件;判別模型1.問(wèn)題的重述胃癌患者易誤診為萎縮性胃炎患者以及非胃病患者。

進(jìn)行胃癌的鑒別主要是通過(guò)化驗(yàn)4項(xiàng)生化指標(biāo):

血清銅藍(lán)蛋白(X1)、藍(lán)色反應(yīng)(X2)、尿吲哚乙酸(X3)、中性硫化物(X4)。

本來(lái)從胃癌患者、萎縮性胃炎患者以及非胃病患者中一共抽取了12人進(jìn)行指標(biāo)化驗(yàn),但是由于醫(yī)護(hù)人員的疏忽,將化驗(yàn)結(jié)果搞混了。

現(xiàn)有以前對(duì)胃癌患者、萎縮性胃炎患者以及非胃病患者化驗(yàn)的結(jié)果各一例,依次為(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化驗(yàn)結(jié)果見(jiàn)附件表十。

醫(yī)學(xué)上一般根據(jù)臨床的經(jīng)驗(yàn)認(rèn)為,患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的,現(xiàn)需建立一種判別準(zhǔn)則,把上述混淆的結(jié)果區(qū)分開(kāi)來(lái),再將三個(gè)病人的化驗(yàn)指標(biāo)如下:

(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),區(qū)分他們各屬于哪一類人群。

2.模型假設(shè)和符號(hào)說(shuō)明2.1.模型的假設(shè)(1)患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的;(2)被檢測(cè)的人員沒(méi)有其它任何疾病;(3)四項(xiàng)生化指標(biāo)無(wú)關(guān)聯(lián)。

2.2符號(hào)使用說(shuō)明(不打編號(hào))(1)1X:

血清銅藍(lán)蛋白;(2)2X:

藍(lán)色反應(yīng);(3)3X:

尿吲哚乙酸;(4)4X:

中性硫化物(5)1~12:

表示未知分類樣本,即被混淆的樣本;(6)13~15:

表示已知分類樣本;(7)16~18:

表示待判的樣本;(8)1a、2a、3a:

分別表示使用特征值1時(shí)胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(9)1b、2b、3b:

分別表示使用特征值2時(shí)胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(10)12c、23c:

分別表示用特征值1時(shí)第一類與第二類,第二類與第三類之間的分界點(diǎn)。

(11)12d、23d:

分別表示用特征值2時(shí)第一類與第二類,第二類與第三類之間的分界點(diǎn)。

(13)1n、2n、3n:

分別表示第一類、第二類和第三類的個(gè)數(shù);(16))(ijx、)(ijx:

分別表示第i個(gè)指標(biāo)第j個(gè)樣本的數(shù)據(jù)和標(biāo)準(zhǔn)化后的數(shù)據(jù);(17))(ix:

表示15個(gè)樣本值的第i個(gè)指標(biāo)的樣本均值;(18))(is:

表示15個(gè)樣本值的第i個(gè)指標(biāo)的樣本標(biāo)準(zhǔn)差;(19)jj、:

分別表示Fisher判別時(shí)使用1、2為標(biāo)準(zhǔn)化的函數(shù)系數(shù);3.問(wèn)題的分析2.1問(wèn)題一的分析本問(wèn)題要求解的是將混淆的12組樣本判別其類型。

由于患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的,首先想到的是運(yùn)用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進(jìn)行判別。

但是此時(shí)卻無(wú)法將已知類別的三組樣本分開(kāi)。

所以最重要的是將已知類別的樣本分開(kāi)。

于是將12組未知類別的樣本和3組已知類別的樣本一起運(yùn)用系統(tǒng)聚類,將與13號(hào)樣本為一類的作為第一類,與14號(hào)樣本為一類的作為第二類,與15號(hào)樣本為一類的作為第三類。

第一步,先將其聚成兩類。

若未將三類中的一類分開(kāi),重復(fù)第一步操作,直至有一個(gè)樣本分開(kāi)。

第二步,對(duì)剩下的兩個(gè)樣本所在類聚成兩類,若未將這兩個(gè)樣本分開(kāi)。

重復(fù)第二步,直至將這兩個(gè)樣本分開(kāi)。

第三步,此時(shí)將還未知類別的樣本進(jìn)行Fisher判別。

2.2問(wèn)題二的分析本問(wèn)題基于問(wèn)題一的聚類結(jié)果,運(yùn)用Fisher判別的方法,利用SPSS軟件得到其判別結(jié)果。

4.模型的建立與求解4.1問(wèn)題一的解決方案及模型(多用幾種方法)(模型要有名字)本問(wèn)題要求的是將混淆的12組未知類別的樣本區(qū)別開(kāi)來(lái)。

由于患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的,首先想到的是運(yùn)用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進(jìn)行判別。

但是此時(shí)卻無(wú)法將已知類別的三組樣本分開(kāi)。

于是將已知類別的三組樣本看成三類,再聚類得到與其類似的樣本。

第一階段:

標(biāo)準(zhǔn)化。

分析數(shù)據(jù)的量級(jí)和量綱,知該15個(gè)樣本的數(shù)據(jù)最大相差510,則說(shuō)明相差較大,則需要對(duì)其進(jìn)行標(biāo)準(zhǔn)化:

(可寫在模型的準(zhǔn)備里面,我們用什么對(duì)其進(jìn)行標(biāo)準(zhǔn)化))()()(jiiijisxxx=(1)第二階段:

系統(tǒng)聚類。

利用標(biāo)準(zhǔn)化后的數(shù)據(jù),用歐式距離求得兩點(diǎn)間的距離,再找最小的距離,將其聚類為一組:

=i==412)(),(minikijjkxxdkiD15,...,2,1=,kj且kj(2)第三階段:

Fisher判別。

將給定的指標(biāo)代入式(3)進(jìn)行求解,將得到的y與式(4)、式(5)進(jìn)行比較,判別出其類型;若不能判別,再用2的系數(shù)進(jìn)行判別。

(凡是公式都要提行)4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)(流程圖)4.1.1問(wèn)題一的求解(表格的兩端不封口,居中,美觀,再表達(dá)一下)(1)第一步,標(biāo)準(zhǔn)化(見(jiàn)下表)。

表一:

標(biāo)準(zhǔn)化表人X1X2X3X4ZX1ZX2ZX3ZX412451340.10.41.598070.2407060.2681562.51490322001670.120.270.6697591.8084660.6512371.26386731701500.070.080.0508851.000832-0.30646-0.5645741001670.20.14-1.393151.8084662.1835580.01283152551250.070.141.804362-0.18686-0.306460.01283161301000.060.12-0.77428-1.37456-0.498-0.1796471201330.10.26-0.980570.1931990.2681561.16763481601000.050.1-0.15541-1.37456-0.68954-0.372191851150.050.190.360322-0.66194-0.689540.493999101701250.060.040.050885-0.18686-0.498-0.9495111651420.050.03-0.052260.620769-0.68954-1.04574121001170.070.02-1.39315-0.56693-0.30646-1.14197132281340.20.111.2473750.2407062.183558-0.27587141501170.070.06-0.3617-0.56693-0.30646-0.75704151351080.020.12-0.67113-0.9945-1.26417-0.17964(2)第二步,聚類。

對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行系統(tǒng)聚類,在SPSS中將其分為兩類。

表二:

第一次系統(tǒng)聚類人X1X2X3X4ZX1ZX2ZX3ZX4CLU2_112451340.10.41.598070.2407060.2681562.514903122001670.120.270.6697591.8084660.6512371.263867131701500.070.080.0508851.000832-0.30646-0.56457241001670.20.14-1.393151.8084662.1835580.012831152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964271201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94952111651420.050.03-0.052260.620769-0.68954-1.045742121001170.070.02-1.39315-0.56693-0.30646-1.141972132281340.20.111.2473750.2407062.183558-0.275871141501170.070.06-0.3617-0.56693-0.30646-0.757042151351080.020.12-0.67113-0.9945-1.26417-0.179642(3)第三步,將表二中屬于第一類的樣本移出,再進(jìn)行系統(tǒng)聚類。

表三:

第二次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(4)第四步,將表三中的第五個(gè)樣本移出,再進(jìn)行系統(tǒng)聚類。

表四:

第三次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(5)將表四中的第七個(gè)樣本移出,再進(jìn)行系統(tǒng)聚類。

表五:

第四次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179642(6)此時(shí)已將13、14、15號(hào)樣本完全分開(kāi),但是在分開(kāi)過(guò)程中,將5、7號(hào)樣本移出,最后再對(duì)5、7號(hào)樣本進(jìn)行Fisher判別:

表六:

第五次系統(tǒng)聚類12451340.10.41.598070.2407060.2681562.5149031122001670.120.270.6697591.8084660.6512371.2638671131701500.070.080.0508851.000832-0.30646-0.564572241001670.20.14-1.393151.8084662.1835580.0128311152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.179643371201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.37213391851150.050.190.360322-0.66194-0.689540.49399933101701250.060.040.050885-0.18686-0.498-0.949522111651420.050.03-0.052260.620769-0.68954-1.0457422121001170.070.02-1.39315-0.56693-0.30646-1.1419722132281340.20.111.2473750.2407062.183558-0.2758711141501170.070.06-0.3617-0.56693-0.30646-0.7570422151351080.020.12-0.67113-0.9945-1.26417-0.179643所以屬于胃癌患者的有1,2,4,7,13;屬于萎縮性胃炎患者的有:

3,5,10,11,12,14;屬于非胃病患者的有:

6,8,9,15。

問(wèn)題二的解決方案及模型第三階段:

Fisher判別。

將給定的指標(biāo)代入式(3)進(jìn)行求解,將得到的y與式(4)、式(5)進(jìn)行比較,判別出其類型;若不能判別,再用2的系數(shù)進(jìn)行判別。

4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)問(wèn)題二的求解表七:

未標(biāo)準(zhǔn)化的函數(shù)系數(shù)(可以不要)CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035Unstandardizedcoefficients

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論