版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1/1畢業(yè)論文:基于Fisher判別準(zhǔn)則的胃病分類模型基于Fisher判別準(zhǔn)則的胃病分類模型摘要本文就胃癌患者、萎縮性胃炎患者以及非胃病患者的分類問(wèn)題,綜合運(yùn)用系統(tǒng)聚類和Fisher判別的方法建立了基于四個(gè)指標(biāo)的分類判別模型。
針對(duì)問(wèn)題一,模型采用系統(tǒng)聚類和Fisher判別的方法,根據(jù)題中已知類型的三個(gè)樣本13,14,15,將混淆的12個(gè)樣本1~12區(qū)別開(kāi)來(lái),并且使得樣本13,14,15在三個(gè)類別中。
使用SPSS軟件求得分類結(jié)果,胃癌患者:
1,2,4,5,13;萎縮性胃炎患者:
3,7,10,11,12,14;非胃病患者:
6,8,9,15。
針對(duì)問(wèn)題二,本題基于問(wèn)題一的分類情況,采用Fisher判別的方法,確定三個(gè)樣本16,17,18的類別。
使用SPSS軟件求得判別結(jié)果,第16號(hào)樣本和第18號(hào)樣本屬于第二類,即萎縮性胃病患者;第17號(hào)樣本屬于第三類,即非胃病患者。
最后對(duì)模型的優(yōu)缺點(diǎn)進(jìn)行分析,提出了改進(jìn)方案。
關(guān)鍵詞系統(tǒng)聚類;Fisher判別;SPSS軟件;判別模型1.問(wèn)題的重述胃癌患者易誤診為萎縮性胃炎患者以及非胃病患者。
進(jìn)行胃癌的鑒別主要是通過(guò)化驗(yàn)4項(xiàng)生化指標(biāo):
血清銅藍(lán)蛋白(X1)、藍(lán)色反應(yīng)(X2)、尿吲哚乙酸(X3)、中性硫化物(X4)。
本來(lái)從胃癌患者、萎縮性胃炎患者以及非胃病患者中一共抽取了12人進(jìn)行指標(biāo)化驗(yàn),但是由于醫(yī)護(hù)人員的疏忽,將化驗(yàn)結(jié)果搞混了。
現(xiàn)有以前對(duì)胃癌患者、萎縮性胃炎患者以及非胃病患者化驗(yàn)的結(jié)果各一例,依次為(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化驗(yàn)結(jié)果見(jiàn)附件表十。
醫(yī)學(xué)上一般根據(jù)臨床的經(jīng)驗(yàn)認(rèn)為,患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的,現(xiàn)需建立一種判別準(zhǔn)則,把上述混淆的結(jié)果區(qū)分開(kāi)來(lái),再將三個(gè)病人的化驗(yàn)指標(biāo)如下:
(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),區(qū)分他們各屬于哪一類人群。
2.模型假設(shè)和符號(hào)說(shuō)明2.1.模型的假設(shè)(1)患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的;(2)被檢測(cè)的人員沒(méi)有其它任何疾病;(3)四項(xiàng)生化指標(biāo)無(wú)關(guān)聯(lián)。
2.2符號(hào)使用說(shuō)明(不打編號(hào))(1)1X:
血清銅藍(lán)蛋白;(2)2X:
藍(lán)色反應(yīng);(3)3X:
尿吲哚乙酸;(4)4X:
中性硫化物(5)1~12:
表示未知分類樣本,即被混淆的樣本;(6)13~15:
表示已知分類樣本;(7)16~18:
表示待判的樣本;(8)1a、2a、3a:
分別表示使用特征值1時(shí)胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(9)1b、2b、3b:
分別表示使用特征值2時(shí)胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(10)12c、23c:
分別表示用特征值1時(shí)第一類與第二類,第二類與第三類之間的分界點(diǎn)。
(11)12d、23d:
分別表示用特征值2時(shí)第一類與第二類,第二類與第三類之間的分界點(diǎn)。
(13)1n、2n、3n:
分別表示第一類、第二類和第三類的個(gè)數(shù);(16))(ijx、)(ijx:
分別表示第i個(gè)指標(biāo)第j個(gè)樣本的數(shù)據(jù)和標(biāo)準(zhǔn)化后的數(shù)據(jù);(17))(ix:
表示15個(gè)樣本值的第i個(gè)指標(biāo)的樣本均值;(18))(is:
表示15個(gè)樣本值的第i個(gè)指標(biāo)的樣本標(biāo)準(zhǔn)差;(19)jj、:
分別表示Fisher判別時(shí)使用1、2為標(biāo)準(zhǔn)化的函數(shù)系數(shù);3.問(wèn)題的分析2.1問(wèn)題一的分析本問(wèn)題要求解的是將混淆的12組樣本判別其類型。
由于患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的,首先想到的是運(yùn)用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進(jìn)行判別。
但是此時(shí)卻無(wú)法將已知類別的三組樣本分開(kāi)。
所以最重要的是將已知類別的樣本分開(kāi)。
于是將12組未知類別的樣本和3組已知類別的樣本一起運(yùn)用系統(tǒng)聚類,將與13號(hào)樣本為一類的作為第一類,與14號(hào)樣本為一類的作為第二類,與15號(hào)樣本為一類的作為第三類。
第一步,先將其聚成兩類。
若未將三類中的一類分開(kāi),重復(fù)第一步操作,直至有一個(gè)樣本分開(kāi)。
第二步,對(duì)剩下的兩個(gè)樣本所在類聚成兩類,若未將這兩個(gè)樣本分開(kāi)。
重復(fù)第二步,直至將這兩個(gè)樣本分開(kāi)。
第三步,此時(shí)將還未知類別的樣本進(jìn)行Fisher判別。
2.2問(wèn)題二的分析本問(wèn)題基于問(wèn)題一的聚類結(jié)果,運(yùn)用Fisher判別的方法,利用SPSS軟件得到其判別結(jié)果。
4.模型的建立與求解4.1問(wèn)題一的解決方案及模型(多用幾種方法)(模型要有名字)本問(wèn)題要求的是將混淆的12組未知類別的樣本區(qū)別開(kāi)來(lái)。
由于患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的,首先想到的是運(yùn)用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進(jìn)行判別。
但是此時(shí)卻無(wú)法將已知類別的三組樣本分開(kāi)。
于是將已知類別的三組樣本看成三類,再聚類得到與其類似的樣本。
第一階段:
標(biāo)準(zhǔn)化。
分析數(shù)據(jù)的量級(jí)和量綱,知該15個(gè)樣本的數(shù)據(jù)最大相差510,則說(shuō)明相差較大,則需要對(duì)其進(jìn)行標(biāo)準(zhǔn)化:
(可寫在模型的準(zhǔn)備里面,我們用什么對(duì)其進(jìn)行標(biāo)準(zhǔn)化))()()(jiiijisxxx=(1)第二階段:
系統(tǒng)聚類。
利用標(biāo)準(zhǔn)化后的數(shù)據(jù),用歐式距離求得兩點(diǎn)間的距離,再找最小的距離,將其聚類為一組:
=i==412)(),(minikijjkxxdkiD15,...,2,1=,kj且kj(2)第三階段:
Fisher判別。
將給定的指標(biāo)代入式(3)進(jìn)行求解,將得到的y與式(4)、式(5)進(jìn)行比較,判別出其類型;若不能判別,再用2的系數(shù)進(jìn)行判別。
(凡是公式都要提行)4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)(流程圖)4.1.1問(wèn)題一的求解(表格的兩端不封口,居中,美觀,再表達(dá)一下)(1)第一步,標(biāo)準(zhǔn)化(見(jiàn)下表)。
表一:
標(biāo)準(zhǔn)化表人X1X2X3X4ZX1ZX2ZX3ZX412451340.10.41.598070.2407060.2681562.51490322001670.120.270.6697591.8084660.6512371.26386731701500.070.080.0508851.000832-0.30646-0.5645741001670.20.14-1.393151.8084662.1835580.01283152551250.070.141.804362-0.18686-0.306460.01283161301000.060.12-0.77428-1.37456-0.498-0.1796471201330.10.26-0.980570.1931990.2681561.16763481601000.050.1-0.15541-1.37456-0.68954-0.372191851150.050.190.360322-0.66194-0.689540.493999101701250.060.040.050885-0.18686-0.498-0.9495111651420.050.03-0.052260.620769-0.68954-1.04574121001170.070.02-1.39315-0.56693-0.30646-1.14197132281340.20.111.2473750.2407062.183558-0.27587141501170.070.06-0.3617-0.56693-0.30646-0.75704151351080.020.12-0.67113-0.9945-1.26417-0.17964(2)第二步,聚類。
對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行系統(tǒng)聚類,在SPSS中將其分為兩類。
表二:
第一次系統(tǒng)聚類人X1X2X3X4ZX1ZX2ZX3ZX4CLU2_112451340.10.41.598070.2407060.2681562.514903122001670.120.270.6697591.8084660.6512371.263867131701500.070.080.0508851.000832-0.30646-0.56457241001670.20.14-1.393151.8084662.1835580.012831152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964271201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94952111651420.050.03-0.052260.620769-0.68954-1.045742121001170.070.02-1.39315-0.56693-0.30646-1.141972132281340.20.111.2473750.2407062.183558-0.275871141501170.070.06-0.3617-0.56693-0.30646-0.757042151351080.020.12-0.67113-0.9945-1.26417-0.179642(3)第三步,將表二中屬于第一類的樣本移出,再進(jìn)行系統(tǒng)聚類。
表三:
第二次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(4)第四步,將表三中的第五個(gè)樣本移出,再進(jìn)行系統(tǒng)聚類。
表四:
第三次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(5)將表四中的第七個(gè)樣本移出,再進(jìn)行系統(tǒng)聚類。
表五:
第四次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179642(6)此時(shí)已將13、14、15號(hào)樣本完全分開(kāi),但是在分開(kāi)過(guò)程中,將5、7號(hào)樣本移出,最后再對(duì)5、7號(hào)樣本進(jìn)行Fisher判別:
表六:
第五次系統(tǒng)聚類12451340.10.41.598070.2407060.2681562.5149031122001670.120.270.6697591.8084660.6512371.2638671131701500.070.080.0508851.000832-0.30646-0.564572241001670.20.14-1.393151.8084662.1835580.0128311152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.179643371201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.37213391851150.050.190.360322-0.66194-0.689540.49399933101701250.060.040.050885-0.18686-0.498-0.949522111651420.050.03-0.052260.620769-0.68954-1.0457422121001170.070.02-1.39315-0.56693-0.30646-1.1419722132281340.20.111.2473750.2407062.183558-0.2758711141501170.070.06-0.3617-0.56693-0.30646-0.7570422151351080.020.12-0.67113-0.9945-1.26417-0.179643所以屬于胃癌患者的有1,2,4,7,13;屬于萎縮性胃炎患者的有:
3,5,10,11,12,14;屬于非胃病患者的有:
6,8,9,15。
問(wèn)題二的解決方案及模型第三階段:
Fisher判別。
將給定的指標(biāo)代入式(3)進(jìn)行求解,將得到的y與式(4)、式(5)進(jìn)行比較,判別出其類型;若不能判別,再用2的系數(shù)進(jìn)行判別。
4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)問(wèn)題二的求解表七:
未標(biāo)準(zhǔn)化的函數(shù)系數(shù)(可以不要)CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035Unstandardizedcoefficients
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年建材市場(chǎng)商鋪?zhàn)赓U及品牌展示合同2篇
- 二零二五版A4一頁(yè)紙環(huán)保印刷定制合同2篇
- 二零二五年度活動(dòng)板房租賃合同(含消防設(shè)施及安全檢查)3篇
- 二零二五版城市綠化帶基站場(chǎng)地租賃與景觀融合合同3篇
- 二零二五版辦公室能源管理合同3篇
- 二零二五年度高性能1號(hào)不銹鋼駁接爪批量采購(gòu)供貨合同2篇
- 二零二五版企業(yè)清算注銷及員工安置及補(bǔ)償及債務(wù)清理合同3篇
- 二零二五版金融資產(chǎn)抵押交易合同范本3篇
- 二零二五版古建筑修復(fù)工程勞務(wù)承包施工合同2篇
- 二零二五版鋼材現(xiàn)貨及期貨交易合同示范文本3篇
- 輪式智能移動(dòng)操作機(jī)器人技術(shù)與應(yīng)用-基于ROS的Python編程 課件 第4章 機(jī)器人運(yùn)動(dòng)應(yīng)用實(shí)例
- 2024質(zhì)量管理理解、評(píng)價(jià)和改進(jìn)組織的質(zhì)量文化指南
- 手指外傷后護(hù)理查房
- 油氣回收相關(guān)理論知識(shí)考試試題及答案
- 我能作業(yè)更細(xì)心(課件)-小學(xué)生主題班會(huì)二年級(jí)
- 2023年湖北省武漢市高考數(shù)學(xué)一模試卷及答案解析
- 城市軌道交通的網(wǎng)絡(luò)安全與數(shù)據(jù)保護(hù)
- 英國(guó)足球文化課件
- 《行政職業(yè)能力測(cè)驗(yàn)》2023年公務(wù)員考試新疆維吾爾新疆生產(chǎn)建設(shè)兵團(tuán)可克達(dá)拉市預(yù)測(cè)試題含解析
- 醫(yī)院投訴案例分析及處理要點(diǎn)
- 燙傷的安全知識(shí)講座
評(píng)論
0/150
提交評(píng)論