基于bayes判別法的胃病鑒別_第1頁
基于bayes判別法的胃病鑒別_第2頁
基于bayes判別法的胃病鑒別_第3頁
基于bayes判別法的胃病鑒別_第4頁
基于bayes判別法的胃病鑒別_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于bayes判別準(zhǔn)則的胃病分類模型 摘要(針對什么問題,采用了什么方法原理,建立了什么模型,得到了什么結(jié)果,10分,3/4最合適)本文解決的問題是如何根據(jù)被檢驗者的各項生化指標(biāo),建立合理的判別準(zhǔn)則,將被混淆的12個樣本結(jié)果區(qū)分開來,并且判別胃病的類別。在合理的假設(shè)下,利用系統(tǒng)聚類原理,將所給的12組數(shù)據(jù)進(jìn)行分類,計算分類后患胃癌、萎縮性胃炎、非胃病的概率分別為、,再利用bayes判別函數(shù)求出待測樣本的的得分,判別待測樣本的所屬類型。 針對問題一,首先利用spss軟件對樣本a、b、c(題中已給定類別的三組)數(shù)據(jù)進(jìn)行系統(tǒng)聚類。再利用bayes判別模型,由分類后數(shù)據(jù)求出判別函數(shù),帶入樣本的指標(biāo)計算

2、得分,判別出混淆的12個樣本的所屬類型。 針對問題二,由問題一得出的判別準(zhǔn)則,把待判數(shù)據(jù)x、y、z帶入判別函數(shù),得出x、y為胃炎患者,z為非胃病患者。本文最后將被混淆的12個樣本區(qū)分開來,并且判別就診者中有兩個胃炎患者,另一個是非胃病患者,文章的末尾給出模型的評價及模型的改進(jìn)方向。關(guān)鍵詞:系統(tǒng)聚類;bayes函數(shù)判別法;spss統(tǒng)計1問題重述胃癌患者易誤診為萎縮性胃炎患者以及非胃病患者。進(jìn)行胃癌的鑒別主要是通過化驗4項生化指標(biāo):血清銅藍(lán)蛋白(x1)、藍(lán)色反應(yīng)(x2)、尿吲哚乙酸(x3)、中性硫化物(x4)。本來從胃癌患者、萎縮性胃炎患者以及非胃病患者中一共抽取了12人進(jìn)行指標(biāo)化驗,但是由于醫(yī)護(hù)

3、人員的疏忽,將化驗結(jié)果搞混了?,F(xiàn)有以前對胃癌患者、萎縮性胃炎患者以及非胃病患者化驗的結(jié)果各一例,依次為(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化驗結(jié)果見附件醫(yī)學(xué)上一般根據(jù)臨床的經(jīng)驗認(rèn)為,患同一種病的人所表現(xiàn)出來的特征往往是相似的。現(xiàn)在需要解決兩個問題(1.)建立一種判別準(zhǔn)則,把上述混淆的結(jié)果區(qū)分開來。(2).再給你三個病人的化驗指標(biāo)如下:(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),試區(qū)分他們各屬于哪一類人群。2問題分析:題中有三個已知

4、樣本,一個胃癌患者、一個萎縮性胃炎患者、一個非胃病患者,但是樣本量太小,為得到一個可靠的標(biāo)準(zhǔn),首先對混淆的十五個樣本聚類,然后用聚類后得到的樣本建立判別準(zhǔn)則。第一步:利用系統(tǒng)聚類的方法,將13、14、15三個已知樣本加入到十二個混淆樣本中進(jìn)行聚類,聚成三類得到一個較大樣本的,成為待判三個樣本的判別標(biāo)準(zhǔn)。第二步:,由第一步得到的判別標(biāo)準(zhǔn),利用bayes判別法判斷這三個待判病人(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14)。分別屬于哪一類3模型假設(shè):(要合理,要與模型相關(guān),不要無中生有)假設(shè)1:被檢測的人員除本題研究的疾病相關(guān)

5、外無任何疾病。假設(shè)2:被檢測的人員種族,血緣之間沒有任何關(guān)聯(lián)。假設(shè)3:被檢驗的四項生化指標(biāo)兩兩之間無關(guān)聯(lián)。 4符號說明:(一定要做兩次說明,在模型建立的時候還要做一次說明,要讓閱卷老師看起來方便)為第i個函數(shù)(i=1、2、3)為第i個方程第j個指標(biāo)前的系數(shù)(i=1、2、3;j=1、2、3、4)為第i個方程的常數(shù)項(i=1、2、3)為胃病的樣本(i=1、2、3),其中1為胃癌,2為胃炎,3為非胃病為兩兩樣品間的距離()5 模型建立(一般模型的建立與求解是寫在一起的,占4060分)5.1模型一利用系統(tǒng)聚類的方法處理數(shù)據(jù)(交代所采用的方法的原理)由于各指標(biāo)的單位和數(shù)量級差異較大,應(yīng)先將所有數(shù)據(jù)標(biāo)準(zhǔn)化

6、。定義為不同指標(biāo),為待測數(shù)據(jù)序號,公式如下: (1)先把12個混淆樣本和三個已知樣本單獨(dú)視為一類,即分成15類,算出每兩類間的距離共個距離,定義兩兩樣品間的距離為, 其中我們采用歐氏距離計算。定義分別表示不同的類別,(1、2、3、4)表示維數(shù)。則為: (2)然后根據(jù)距離最小的原則,依次選出一對分類對象,并成新類。如果其中一個分類對象已歸于一類,則把另一個也歸入該類;如果一對分類對象正好屬于已歸的兩類,則把這兩類并為一類。每一次歸并,都劃去該對象所在的列與列序相同的行。經(jīng)過14次就可以把全部分類對象歸為一類,這樣就可以得到譜系聚類圖。對于新類與當(dāng)前類的距離,我們需先重新確定新類的重心,再用重心坐

7、標(biāo)算歐氏距離即可。假設(shè)將類和合并成新類。則的重心為: (3)聚類的過程如下:各自確定一個聚點(diǎn)計算兩兩類之間的距離,將距離最近的聚成一類重新確定聚點(diǎn)分類是否合理分類結(jié)束修改模型yesno經(jīng)過數(shù)據(jù)處理后我們就得到了一個已知類型的樣本,其中13、14、15分別屬于一類。5.2模型二經(jīng)過模型一處理后我們就得到了一個已知類型的樣本,其中13、14、15分別屬于一類,在模型一的求解過程中可以得到胃癌患者、胃炎患者、非胃病患者的發(fā)生的概率分別為、,利用bayes判別法就可以建立三個判別函數(shù),根據(jù)判別函數(shù),將待測數(shù)據(jù)標(biāo)準(zhǔn)化后帶入判別函數(shù),計算得分,得到樣本發(fā)生的后驗概率,就可以判別出待測樣品的類型。貝葉斯公式

8、: (4)我們用byes判別法,確定三個類的判別函數(shù)這一組的分類函數(shù)是=+這組的分類函數(shù)是 (5)=+這組的分類函數(shù)是=+根據(jù)這三個函數(shù)我們可以計算出待判的三個樣本的得分。 取max(,)=,得出待判樣本屬于第i類。6模型求解(表格兩邊不封口,表名用五號字體,字不如表,表不如圖) 我們將混淆的十二個樣本與已知的三個樣本作為一個有十五個數(shù)據(jù)整體,進(jìn)行多次快速聚類,將已知的三個樣本分別標(biāo)號13、14、15。當(dāng)我們把數(shù)據(jù)分成三類時,我們發(fā)現(xiàn)我們并不能將14、15,明確的區(qū)分開來,于是我們采用先聚兩類,聚類結(jié)果如表1: 表1(第一次聚類的結(jié)果)從表1中我們看到胃癌患者從中分離出來,有1、2、5、13,

9、共四個樣本,畫出散點(diǎn)圖(圖1),看到胃癌患者離其他兩類的距離較遠(yuǎn)。 圖1(典型判別函數(shù)的散點(diǎn)圖)于是可以將四個樣本從中分離出來后,進(jìn)行二次聚類。結(jié)果如表2;表21(去掉胃癌樣本后的第一次聚類結(jié)果) 表2 2(去掉胃癌樣本后的第二次聚類結(jié)果) 表21、表22是經(jīng)過這兩次分類后依然無法將14、15分開,說明5、7這兩個樣本影響了我們的正常分類,將聚類的模型稍作修改即我們先將它們?nèi)サ?,在做聚類得到?如下: 表3(去掉兩個特殊樣本后將胃炎與非胃病患者分開的結(jié)果)表3說明14、15已經(jīng)被分開在兩個不同的類別中。 此時我們已經(jīng)將三個已知的樣本成功的分在了不同的類別當(dāng)中,這是以這十五個樣本作為判別標(biāo)準(zhǔn),建

10、立bayes判別函數(shù),判別5、7這兩個特殊樣本。表4(利用bayes判別法判別5、7的結(jié)果)我們看到加入前面的數(shù)據(jù)后利用beyes判別法可以將5、7判別出來、于是利用聚類我們就得到了一個新的、樣本容量更大的判別準(zhǔn)則。利用得出樣本分類結(jié)果,我們可以建立相應(yīng)的模型,得到判別準(zhǔn)則,判斷出待測樣本的類型。 bayes判別函數(shù)系數(shù)患病類型胃炎非胃病胃癌x1.176.144.170x2.741.568.567x3-113.130-91.85040.401x4-88.350-63.595-52.272常數(shù)項-57.759-35.843-56.166利用spss軟件求解出三個beyes判別函數(shù)的系數(shù),在上圖中

11、讀出相應(yīng)的系數(shù),帶入模型,得到如下判別函數(shù)這一組的分類函數(shù)是=0.176+0.741-113.130-88.350-57.759這組的分類函數(shù)是=0.144+0.568-91.850-63.595-35.843這組的分類函數(shù)是=0.170+0.567+40.401-52.272-56.166解出三個判別函數(shù)后,將待判樣本帶入判斷,得到如下表5結(jié)果:表5(待測樣本的分類結(jié)果)從表5的結(jié)果我們看到,根據(jù)判別函數(shù),判別出待判的三個樣本中,有兩個胃炎患者,另一個是非胃病患者,而沒有胃癌患者。7模型分析與檢驗:7.1模型的優(yōu)點(diǎn)采用beyes判別函數(shù)得到的結(jié)果與先驗相比,準(zhǔn)確率達(dá)到了92.3%,說明函數(shù)判別的準(zhǔn)確率很高,模型是合7.2模型的缺點(diǎn)(判別法有與生俱來的缺點(diǎn),要找到他的原理的相關(guān)的書籍,把東西說明白)7.3模型的改進(jìn)參考文獻(xiàn):(格式是,作者,書名,出版社,連標(biāo)點(diǎn)符號都不能錯)【1】數(shù)學(xué)建模章紹輝 科學(xué)出版社;【2】概率論與數(shù)理統(tǒng)計萬星火 科學(xué)出版社;【3】spss統(tǒng)計分析盧紋岱 電子工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論