




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1/1畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型基于Fisher判別準(zhǔn)則的胃病分類模型摘要本文就胃癌患者、萎縮性胃炎患者以及非胃病患者的分類問題,綜合運(yùn)用系統(tǒng)聚類和Fisher判別的方法建立了基于四個(gè)指標(biāo)的分類判別模型。
針對(duì)問題一,模型采用系統(tǒng)聚類和Fisher判別的方法,根據(jù)題中已知類型的三個(gè)樣本13,14,15,將混淆的12個(gè)樣本1~12區(qū)別開來,并且使得樣本13,14,15在三個(gè)類別中。
使用SPSS軟件求得分類結(jié)果,胃癌患者:
1,2,4,5,13;萎縮性胃炎患者:
3,7,10,11,12,14;非胃病患者:
6,8,9,15。
針對(duì)問題二,本題基于問題一的分類情況,采用Fisher判別的方法,確定三個(gè)樣本16,17,18的類別。
使用SPSS軟件求得判別結(jié)果,第16號(hào)樣本和第18號(hào)樣本屬于第二類,即萎縮性胃病患者;第17號(hào)樣本屬于第三類,即非胃病患者。
最后對(duì)模型的優(yōu)缺點(diǎn)進(jìn)行分析,提出了改進(jìn)方案。
關(guān)鍵詞系統(tǒng)聚類;Fisher判別;SPSS軟件;判別模型1.問題的重述胃癌患者易誤診為萎縮性胃炎患者以及非胃病患者。
進(jìn)行胃癌的鑒別主要是通過化驗(yàn)4項(xiàng)生化指標(biāo):
血清銅藍(lán)蛋白(X1)、藍(lán)色反應(yīng)(X2)、尿吲哚乙酸(X3)、中性硫化物(X4)。
本來從胃癌患者、萎縮性胃炎患者以及非胃病患者中一共抽取了12人進(jìn)行指標(biāo)化驗(yàn),但是由于醫(yī)護(hù)人員的疏忽,將化驗(yàn)結(jié)果搞混了。
現(xiàn)有以前對(duì)胃癌患者、萎縮性胃炎患者以及非胃病患者化驗(yàn)的結(jié)果各一例,依次為(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化驗(yàn)結(jié)果見附件表十。
醫(yī)學(xué)上一般根據(jù)臨床的經(jīng)驗(yàn)認(rèn)為,患同一種病的人所表現(xiàn)出來的特征往往是相似的,現(xiàn)需建立一種判別準(zhǔn)則,把上述混淆的結(jié)果區(qū)分開來,再將三個(gè)病人的化驗(yàn)指標(biāo)如下:
(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),區(qū)分他們各屬于哪一類人群。
2.模型假設(shè)和符號(hào)說明2.1.模型的假設(shè)(1)患同一種病的人所表現(xiàn)出來的特征往往是相似的;(2)被檢測(cè)的人員沒有其它任何疾??;(3)四項(xiàng)生化指標(biāo)無關(guān)聯(lián)。
2.2符號(hào)使用說明(不打編號(hào))(1)1X:
血清銅藍(lán)蛋白;(2)2X:
藍(lán)色反應(yīng);(3)3X:
尿吲哚乙酸;(4)4X:
中性硫化物(5)1~12:
表示未知分類樣本,即被混淆的樣本;(6)13~15:
表示已知分類樣本;(7)16~18:
表示待判的樣本;(8)1a、2a、3a:
分別表示使用特征值1時(shí)胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(9)1b、2b、3b:
分別表示使用特征值2時(shí)胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(10)12c、23c:
分別表示用特征值1時(shí)第一類與第二類,第二類與第三類之間的分界點(diǎn)。
(11)12d、23d:
分別表示用特征值2時(shí)第一類與第二類,第二類與第三類之間的分界點(diǎn)。
(13)1n、2n、3n:
分別表示第一類、第二類和第三類的個(gè)數(shù);(16))(ijx、)(ijx:
分別表示第i個(gè)指標(biāo)第j個(gè)樣本的數(shù)據(jù)和標(biāo)準(zhǔn)化后的數(shù)據(jù);(17))(ix:
表示15個(gè)樣本值的第i個(gè)指標(biāo)的樣本均值;(18))(is:
表示15個(gè)樣本值的第i個(gè)指標(biāo)的樣本標(biāo)準(zhǔn)差;(19)jj、:
分別表示Fisher判別時(shí)使用1、2為標(biāo)準(zhǔn)化的函數(shù)系數(shù);3.問題的分析2.1問題一的分析本問題要求解的是將混淆的12組樣本判別其類型。
由于患同一種病的人所表現(xiàn)出來的特征往往是相似的,首先想到的是運(yùn)用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進(jìn)行判別。
但是此時(shí)卻無法將已知類別的三組樣本分開。
所以最重要的是將已知類別的樣本分開。
于是將12組未知類別的樣本和3組已知類別的樣本一起運(yùn)用系統(tǒng)聚類,將與13號(hào)樣本為一類的作為第一類,與14號(hào)樣本為一類的作為第二類,與15號(hào)樣本為一類的作為第三類。
第一步,先將其聚成兩類。
若未將三類中的一類分開,重復(fù)第一步操作,直至有一個(gè)樣本分開。
第二步,對(duì)剩下的兩個(gè)樣本所在類聚成兩類,若未將這兩個(gè)樣本分開。
重復(fù)第二步,直至將這兩個(gè)樣本分開。
第三步,此時(shí)將還未知類別的樣本進(jìn)行Fisher判別。
2.2問題二的分析本問題基于問題一的聚類結(jié)果,運(yùn)用Fisher判別的方法,利用SPSS軟件得到其判別結(jié)果。
4.模型的建立與求解4.1問題一的解決方案及模型(多用幾種方法)(模型要有名字)本問題要求的是將混淆的12組未知類別的樣本區(qū)別開來。
由于患同一種病的人所表現(xiàn)出來的特征往往是相似的,首先想到的是運(yùn)用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進(jìn)行判別。
但是此時(shí)卻無法將已知類別的三組樣本分開。
于是將已知類別的三組樣本看成三類,再聚類得到與其類似的樣本。
第一階段:
標(biāo)準(zhǔn)化。
分析數(shù)據(jù)的量級(jí)和量綱,知該15個(gè)樣本的數(shù)據(jù)最大相差510,則說明相差較大,則需要對(duì)其進(jìn)行標(biāo)準(zhǔn)化:
(可寫在模型的準(zhǔn)備里面,我們用什么對(duì)其進(jìn)行標(biāo)準(zhǔn)化))()()(jiiijisxxx=(1)第二階段:
系統(tǒng)聚類。
利用標(biāo)準(zhǔn)化后的數(shù)據(jù),用歐式距離求得兩點(diǎn)間的距離,再找最小的距離,將其聚類為一組:
=i==412)(),(minikijjkxxdkiD15,...,2,1=,kj且kj(2)第三階段:
Fisher判別。
將給定的指標(biāo)代入式(3)進(jìn)行求解,將得到的y與式(4)、式(5)進(jìn)行比較,判別出其類型;若不能判別,再用2的系數(shù)進(jìn)行判別。
(凡是公式都要提行)4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)(流程圖)4.1.1問題一的求解(表格的兩端不封口,居中,美觀,再表達(dá)一下)(1)第一步,標(biāo)準(zhǔn)化(見下表)。
表一:
標(biāo)準(zhǔn)化表人X1X2X3X4ZX1ZX2ZX3ZX412451340.10.41.598070.2407060.2681562.51490322001670.120.270.6697591.8084660.6512371.26386731701500.070.080.0508851.000832-0.30646-0.5645741001670.20.14-1.393151.8084662.1835580.01283152551250.070.141.804362-0.18686-0.306460.01283161301000.060.12-0.77428-1.37456-0.498-0.1796471201330.10.26-0.980570.1931990.2681561.16763481601000.050.1-0.15541-1.37456-0.68954-0.372191851150.050.190.360322-0.66194-0.689540.493999101701250.060.040.050885-0.18686-0.498-0.9495111651420.050.03-0.052260.620769-0.68954-1.04574121001170.070.02-1.39315-0.56693-0.30646-1.14197132281340.20.111.2473750.2407062.183558-0.27587141501170.070.06-0.3617-0.56693-0.30646-0.75704151351080.020.12-0.67113-0.9945-1.26417-0.17964(2)第二步,聚類。
對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行系統(tǒng)聚類,在SPSS中將其分為兩類。
表二:
第一次系統(tǒng)聚類人X1X2X3X4ZX1ZX2ZX3ZX4CLU2_112451340.10.41.598070.2407060.2681562.514903122001670.120.270.6697591.8084660.6512371.263867131701500.070.080.0508851.000832-0.30646-0.56457241001670.20.14-1.393151.8084662.1835580.012831152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964271201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94952111651420.050.03-0.052260.620769-0.68954-1.045742121001170.070.02-1.39315-0.56693-0.30646-1.141972132281340.20.111.2473750.2407062.183558-0.275871141501170.070.06-0.3617-0.56693-0.30646-0.757042151351080.020.12-0.67113-0.9945-1.26417-0.179642(3)第三步,將表二中屬于第一類的樣本移出,再進(jìn)行系統(tǒng)聚類。
表三:
第二次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(4)第四步,將表三中的第五個(gè)樣本移出,再進(jìn)行系統(tǒng)聚類。
表四:
第三次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(5)將表四中的第七個(gè)樣本移出,再進(jìn)行系統(tǒng)聚類。
表五:
第四次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179642(6)此時(shí)已將13、14、15號(hào)樣本完全分開,但是在分開過程中,將5、7號(hào)樣本移出,最后再對(duì)5、7號(hào)樣本進(jìn)行Fisher判別:
表六:
第五次系統(tǒng)聚類12451340.10.41.598070.2407060.2681562.5149031122001670.120.270.6697591.8084660.6512371.2638671131701500.070.080.0508851.000832-0.30646-0.564572241001670.20.14-1.393151.8084662.1835580.0128311152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.179643371201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.37213391851150.050.190.360322-0.66194-0.689540.49399933101701250.060.040.050885-0.18686-0.498-0.949522111651420.050.03-0.052260.620769-0.68954-1.0457422121001170.070.02-1.39315-0.56693-0.30646-1.1419722132281340.20.111.2473750.2407062.183558-0.2758711141501170.070.06-0.3617-0.56693-0.30646-0.7570422151351080.020.12-0.67113-0.9945-1.26417-0.179643所以屬于胃癌患者的有1,2,4,7,13;屬于萎縮性胃炎患者的有:
3,5,10,11,12,14;屬于非胃病患者的有:
6,8,9,15。
問題二的解決方案及模型第三階段:
Fisher判別。
將給定的指標(biāo)代入式(3)進(jìn)行求解,將得到的y與式(4)、式(5)進(jìn)行比較,判別出其類型;若不能判別,再用2的系數(shù)進(jìn)行判別。
4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)問題二的求解表七:
未標(biāo)準(zhǔn)化的函數(shù)系數(shù)(可以不要)CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035Unstandardizedcoefficients
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 證券質(zhì)押典當(dāng)業(yè)務(wù)合同書
- 工業(yè)廠房租賃安全合同范本
- 銷售合同專業(yè)模板
- 機(jī)電安裝工程合同標(biāo)準(zhǔn)格式
- 房地產(chǎn)開發(fā)合同糾紛案例分析
- 兼職臨時(shí)工雇傭合同
- 農(nóng)村合作社租賃合同糾紛解決策略
- 煤炭購(gòu)銷長(zhǎng)期合同范本參考
- 年度合作協(xié)議范文:標(biāo)識(shí)標(biāo)牌制作合同
- 綠化養(yǎng)護(hù)合同模板
- 2024天津工業(yè)職業(yè)學(xué)院教師招聘考試筆試試題
- QCT1067.5-2023汽車電線束和電器設(shè)備用連接器第5部分:設(shè)備連接器(插座)的型式和尺寸
- 合金固態(tài)相變?nèi)捉虒W(xué)課件
- 《研學(xué)旅行課程設(shè)計(jì)》課件-1研學(xué)課程資源選擇
- 《醫(yī)學(xué)心理學(xué)》教案
- 海綿城市建設(shè)技術(shù)標(biāo)準(zhǔn) DG-TJ08-2298-2019
- 跟著名著《小王子》學(xué)高考英語讀后續(xù)寫絕佳的續(xù)寫清單-高中英語作文復(fù)習(xí)專項(xiàng)
- 產(chǎn)教融合大學(xué)科技園建設(shè)項(xiàng)目實(shí)施方案
- 交通法律與交通事故處理培訓(xùn)課程與法律解析
- 廣西版四年級(jí)下冊(cè)美術(shù)教案
- 《換熱器及換熱原理》課件
評(píng)論
0/150
提交評(píng)論