版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十六章觀察對(duì)象的分類分析方法---------判別分析(DiscriminantAnalysis)1主要有判別分析和聚類分析判別分析:事物的分類是清楚的,目的是通過已知分類建立判別函數(shù),預(yù)測新的觀察對(duì)象所屬類別。聚類分析:事物分類不清楚,分幾類不清楚,目的希望將事物進(jìn)行分類(探索性研究)。事物分類的統(tǒng)計(jì)方法:2
判別分析(discriminantanalysis)是在已知分為哪若干類的前提下,通過現(xiàn)有數(shù)據(jù)建立判別方程(函數(shù)),根據(jù)對(duì)象若干個(gè)指標(biāo)的觀測結(jié)果判定其應(yīng)屬于哪一類的多元統(tǒng)計(jì)學(xué)方法。常用的判別分析的方法有Bayes判別、Fisher判別、非參數(shù)判別、最大似然判別等。當(dāng)事先并不知道觀察對(duì)象應(yīng)分為哪若干類別時(shí),采用聚類分析方法進(jìn)行分類。一、判別分析的基本概念3二、醫(yī)學(xué)中的分類問題:1.疾病診斷例:用電感耦合等離子體發(fā)射光譜法測定肺癌患者和健康人尿液中的鉻、鐵、錳、鋁、鎘、銅、鋅、鎳,用原子熒光光譜法測定硒。對(duì)肺癌患者和健康人尿液中9種微量元素進(jìn)行判別分析,為肺癌的早期診斷提供科學(xué)依據(jù)。----陳丹丹等.對(duì)肺癌患者和健康人尿液中9種微量元素的判別分析.藥物分析雜志.2009,29(6).5預(yù)測病人的預(yù)后(好或差),提出早期治療方法,降低嚴(yán)重后果。例如根據(jù)新生兒出生后1分鐘阿氏評(píng)分(X1)、窒息復(fù)蘇時(shí)間(X2)、驚厥持續(xù)天數(shù)(X3)、急性期CT改變(X4)及治療3天后原始反射情況(X5)判別新生兒缺血缺氧性腦病的預(yù)后(腦性癱瘓、嚴(yán)重智能低下、正常)。2.疾病的預(yù)測6用途:通過數(shù)據(jù)建立判別方程,對(duì)研究事物進(jìn)行分類和預(yù)測。對(duì)資料要求:要求建立方程的觀察對(duì)象分類(y)已經(jīng)明確(用金標(biāo)準(zhǔn)確定),收集建模對(duì)象(訓(xùn)練樣本)的m個(gè)變量(x)建立判別方程。三、判別分析的特點(diǎn)7五、判別分析方法的基本步驟1.建立判別函數(shù)(方程)
2.規(guī)定判別(分類)準(zhǔn)則
判別新個(gè)體為某類3.評(píng)價(jià)判別方程的效果9主要用于定量數(shù)據(jù)的兩類或多類判別.Bayes判別的思想:基于Bayes準(zhǔn)則,假定已知各類出現(xiàn)的先驗(yàn)概率P(Yk),且各類變量近似服從多元正態(tài)分布,獲得Bayes判別函數(shù)。計(jì)算各個(gè)體出現(xiàn)的后驗(yàn)概率進(jìn)行判別。
第一節(jié)Bayes判別10一、分析步驟1.篩選判別指標(biāo)選擇其中相互獨(dú)立的部分指標(biāo)建立判別函數(shù).在建立判別函數(shù)之前,要先進(jìn)行逐步判別分析,篩選出主要的判別指標(biāo),然后再對(duì)主要的判別指標(biāo)作判別分析.SAS中的STEPDISC過程用來篩選判別指標(biāo),用Wilks’Lambda統(tǒng)計(jì)量及對(duì)應(yīng)P值來衡量.11協(xié)方差分析:將對(duì)應(yīng)變量Y有線性影響但未加控制或難以控制的定量變量X看做協(xié)變量,把X化為相等后比較各組Y的修正均數(shù),是線性回歸與方差分析結(jié)合起來的一種統(tǒng)計(jì)分析方法。模型中無任何變量時(shí)即為方差分析。132.建立Bayes判別函數(shù)已知判別對(duì)象分為g類,有m個(gè)判別指標(biāo)Xj(j=1,2,…,m),要求各類的m個(gè)判別指標(biāo)均近似服從多元正態(tài)分布。當(dāng)各類的協(xié)方差矩陣相等時(shí),計(jì)算合并協(xié)方差矩陣,表示判別指標(biāo)Xi、Xj的合并協(xié)方差,按公式(16-1)計(jì)算。14表示第k類中變量Xi、Xj的均數(shù);nk為第k類的例數(shù)15計(jì)算為第k類(k=1,2,…,g)出現(xiàn)的先驗(yàn)概率,當(dāng)不知道各類的先驗(yàn)概率時(shí),一般取等概率1/g,也可取頻率(當(dāng)樣本較大且無選擇性偏倚)。17建立線性Bayes判別函數(shù):(j=0,12,…,m;k=1,2,…,g)為需要估計(jì)的參數(shù),用SAS的DISCRIM過程可得到這些參數(shù)的估計(jì)值。18當(dāng)各類的協(xié)方差陣不等時(shí),應(yīng)計(jì)算非線性二次型Bayes判別函數(shù),在SAS的DISCRIM過程名后加選項(xiàng)POOL=TEST,SAS先經(jīng)過檢驗(yàn),若各類的協(xié)方差陣滿足齊性,則合并且給出線性Bayes判別函數(shù);若各類的協(xié)方差陣不滿足齊性,則不合并,且自動(dòng)用非線性二次型Bayes判別函數(shù)取代線性Bayes判別函數(shù)。19二、應(yīng)用實(shí)例例16-1腦中風(fēng)是急診醫(yī)學(xué)中較為常見的嚴(yán)重疾病,一般分為腦出血和腦缺血兩類,對(duì)中風(fēng)類型的早期正確診斷具有十分重要的臨床意義。目前,醫(yī)生臨床分類診斷的正確率只有70%左右;以頭顱CT和核磁共振檢查診斷較為可靠,但其價(jià)格昂貴;且因CT和核磁共振檢查需搬動(dòng)病人,易加重病情;尤其是CT和核磁共振檢查對(duì)早期腦缺血常出現(xiàn)假陰性。我們收集了某醫(yī)院近年78例腦中風(fēng)病人的數(shù)據(jù)見表16-2,判別指標(biāo)與分類變量(以頭顱CT和核磁共振檢查診斷為依據(jù))見表16-1。21表16-1腦中風(fēng)病人判別指標(biāo)與分類變量變量意義賦值(單位)變量意義賦值(單位)X1性別男=1,女=2X13感覺障礙有=1,無=2X2年齡歲X14發(fā)病狀態(tài)激動(dòng)=1,運(yùn)動(dòng)=2,一般情況=3,睡眠或安靜=4X3收縮壓kpaX15起病方式急性=1,慢性=2X4舒張壓kpaX16Babinski癥陽性=1,陰性=2X5惡心,嘔吐有=1,無=2X17風(fēng)心病史有=1,無=2X6意識(shí)清醒=1,嗜睡=2,昏迷=3X18心臟雜音有=1,無=2X7瞳孔大小等大=1,不等大=2X19全血粘度/高切mpa?sX8針尖樣瞳孔有=1,無=2X20全血粘度/低切mpa?sX9對(duì)光反射存在=1,不存在=2X21血槳粘度mpa?sX10語言障礙有=1,無=2X22血沉毫米/小時(shí)X11頸項(xiàng)強(qiáng)直有=1,無=2X23血球壓積%X12癱瘓有=1,無=2g分類變量腦出血=1,腦缺血=222表16-2某醫(yī)院近年78例腦中風(fēng)病人判別指標(biāo)與分類變量數(shù)據(jù)序號(hào)X1X2X3X4X5X6X7X8X9X10X11X12X13X14117220102112112122217118121212112123327020121312112122415421152312111124---------------------------------------------------------------------------------------------------------------------------------------76172201021121121227717118121212112123782702012131211212223三、SAS程序及結(jié)果解釋1.逐步判別分析SAS程序datastepdiscli16_1;inputX1-X23g@@;cards;1722010211211212212225.6719.4931.87542321………2702012131211212211226.0408.0562.00040351;procstepdisc/*調(diào)用逐步判別分析過程stepdisc*/sle=0.2sls=0.2;/*選入、剔除變量的概率臨界值均定為0.2*/classg;varX1-X23;run;25datadiscrimli16_1;inputX1-X23g@@;cards;1722010211211212212225.6719.4931.87542321………2702012131211212211226.0408.0562.00040351;procdiscrim/*調(diào)用SAS判別分析過程discrim*/distance/*計(jì)算兩類別平方距離*/manova/*對(duì)判別效能作假設(shè)檢驗(yàn)*/listerr;/*列出判錯(cuò)的樣本信息*/classg;varx9x6x17x16x21x13x10x4x7x15x12x5x3;run;2.Bayes判別分析SAS程序26datali16_1;inputx1-x23g@@;cards;1722010211211212212225.6719.4931.87542321………270
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 通訊網(wǎng)絡(luò)服務(wù)員工作總結(jié)
- 二零二五年度全國少兒藝術(shù)夏令營參與合同3篇
- 二零二五年度基礎(chǔ)設(shè)施建設(shè)投資合作協(xié)議范本3篇
- 二零二五年度個(gè)人生物質(zhì)能利用合同范本4篇
- 二零二五版投標(biāo)承諾書:太陽能光伏發(fā)電設(shè)備采購合同3篇
- 放假安全教育課教案
- 2025版物流園區(qū)轉(zhuǎn)包合作協(xié)議合同范本3篇
- 二零二五版物業(yè)小區(qū)居民生活繳費(fèi)代理服務(wù)協(xié)議3篇
- 二零二五版私人別墅買賣中介服務(wù)合同3篇
- 個(gè)人擔(dān)保合同范本(2025年度升級(jí)版)
- 人教版(2024)七年級(jí)上冊英語期中復(fù)習(xí)單項(xiàng)選擇100題(含答案)
- 2024年胡麻油市場前景分析:全球胡麻油市場規(guī)模達(dá)到了25.55億美元
- 《 西門塔爾牛臉數(shù)據(jù)集的研究》范文
- 八年級(jí)上冊 第三單元 11《簡愛》公開課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 中小商業(yè)銀行數(shù)字化轉(zhuǎn)型現(xiàn)狀及對(duì)策研究
- 親子非暴力溝通培訓(xùn)講座
- 保險(xiǎn)投訴處理流程培訓(xùn)
- JJG 707-2014扭矩扳子行業(yè)標(biāo)準(zhǔn)
- 2025財(cái)年美國國防預(yù)算概覽-美國國防部(英)
- 2024年江西省南昌市中考一模數(shù)學(xué)試題(含答案)
- 《采暖空調(diào)節(jié)能技術(shù)》課件
評(píng)論
0/150
提交評(píng)論