第8章 判別分析ppt課件_第1頁
第8章 判別分析ppt課件_第2頁
第8章 判別分析ppt課件_第3頁
第8章 判別分析ppt課件_第4頁
第8章 判別分析ppt課件_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通第八章第八章 判別分析判別分析l 判別分析簡介l 普通判別分析l 典型判別分析l 逐漸判別分析SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通一、判別分析簡介一、判別分析簡介 判別分析是一種運(yùn)用性很強(qiáng)的統(tǒng)計(jì)方法。它通常是根據(jù)已有的數(shù)據(jù)資料,來建立一種判別方法,然后再來判別一個新的樣品歸屬于哪一類。 例如,醫(yī)院擁有以往就診的各種病人的資料,包括他們的心率、血壓、體溫、化驗(yàn)?zāi)康牡群芏鄶?shù)據(jù)。如今有一個新的病人來醫(yī)院就診,對他也丈量了相關(guān)的目的數(shù)據(jù),要判別他患有哪一種病,這就屬于一個判別歸類的問題。又如,在礦產(chǎn)勘探中積累了豐富

2、的地質(zhì)資料,如今某地域新采到了一個巖石標(biāo)本,要從它的根本特征判別該地域有無礦產(chǎn),是貧礦還是富礦,那么也需求進(jìn)展判別分析。SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通二、普通判別分析二、普通判別分析1、間隔、間隔 判別法判別法 間隔 判別法是經(jīng)過計(jì)算間隔 函數(shù)來進(jìn)展判別,即樣品與哪個總體之間的間隔 最近,那么判別它屬于哪個總體。如何衡量樣品與總體間的這種籠統(tǒng)的間隔 ?我們普通利用馬氏間隔 來描畫。 SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通二、普通判別分析二、普通判別分析2、Bayes判別法判別法 前一節(jié)引見間隔 判別法非常簡便適用,但是也存在一些缺陷。例如

3、,間隔 判別法沒有思索到關(guān)于總體的先驗(yàn)概率,而且沒有思索能夠出現(xiàn)錯判而帶來的損失。Bayes判別法正是為了抑制這些缺陷而提出來的一種判別方法。 Bayes判別法是基于Bayes統(tǒng)計(jì)的思想,即假定事先對所研討的對象有一定的了解,并經(jīng)過先驗(yàn)概率分布來進(jìn)展描畫,當(dāng)抽取樣本后,用樣本來修正先驗(yàn)概率分布,并得到后驗(yàn)概率分布,然后根據(jù)后驗(yàn)概率分布進(jìn)展各種統(tǒng)計(jì)推斷。 Bayes判別法首先計(jì)算給定樣品屬于各個總體的條件概率,然后比較這些概率值的大小,將樣品判歸于條件概率最大的總體。 SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通普通判別分析普通判別分析DISCRIM過程過程PROC DISCR

4、IM DATA=數(shù)據(jù)集名 ; CLASS 分類變量名; VAR 變量名列表; PRIORS 概率值; BY 分組變量名;RUN;SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通普通判別分析普通判別分析DISCRIM過程過程SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通普通判別分析普通判別分析DISCRIM過程過程SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通二、普通判別分析二、普通判別分析3、DISCRIM過程過程語句闡明: 1PROC語句用于規(guī)定開場運(yùn)轉(zhuǎn)DISCRIM過程并指定要分析的數(shù)據(jù)集名。選項(xiàng)有: TESTDATA=數(shù)據(jù)集名指定需求進(jìn)展分類

5、的觀測組成的數(shù)據(jù)集。該數(shù)據(jù)集中定量變量的稱號必需和DATA=數(shù)據(jù)集中的定量變量的稱號相匹配。 METHOD=選項(xiàng)規(guī)定進(jìn)展分類的方法。 LIST規(guī)定對每個觀測顯示重新分類的結(jié)果。 TESTLIST規(guī)定顯示TESTDATA=數(shù)據(jù)集中觀測的分類結(jié)果。 SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通二、普通判別分析二、普通判別分析3、DISCRIM過程過程 2CLASS語句用于規(guī)定分類變量,可以是數(shù)值型變量也可以是字符型變量。分類變量的不同取值那么代表了不同的類別。 3VAR語句用于規(guī)定要分析的定量變量。假設(shè)不運(yùn)用此語句,那么默許分析數(shù)據(jù)集中一切的數(shù)值型變量。 4PRIORS語句用于規(guī)

6、定各類別的先驗(yàn)概率。 5BY語句規(guī)定了分組變量,它使得BY過程對分組內(nèi)進(jìn)展處置。在運(yùn)用BY語句前,應(yīng)對數(shù)據(jù)集按照分組變量進(jìn)展排序。SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通三、典型判別分析三、典型判別分析1、Fisher判別法判別法 典型判別分析采用了與主成分分析和典型相關(guān)分析類似的降維技術(shù),以找到能最好概括類別區(qū)分的變量的線性組合。降維時要求同一類中的區(qū)別盡能夠小,而不同類間的區(qū)別盡能夠大。 SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通典型判別分析典型判別分析CANDISC過程過程PROC CANDISC DATA=數(shù)據(jù)集名 ; CLASS 分類變量名;

7、 VAR 變量名列表; BY 分組變量名;RUN;SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通典型判別分析典型判別分析CANDISC過程過程SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通典型判別分析典型判別分析CANDISC過程過程SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通典型判別分析典型判別分析DISCRIM過程過程PROC DISCRIM DATA=典型變量數(shù)據(jù)集; CLASS 分類變量名; VAR 典型變量名;RUN;SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通四、逐漸判別分析四、逐漸判別分析1、根本原理、根本原理

8、逐漸判別分析調(diào)查了p維目的即p個變量對總體的區(qū)分才干能否顯著,對判別分類不起作用的變量那么予以刪除,優(yōu)化了判別的效果。 逐漸判別的根本思想與我們在上一章引見的逐漸回歸類似:在建立判別函數(shù)時逐個引入變量,每一步選擇都一個判別才干最顯著的變量進(jìn)入判別函數(shù),同時對已有的變量也進(jìn)展檢驗(yàn),將不顯著的變量剔除。直到在可選的變量中,既沒有變量被選入也沒有變量被刪除為止。這樣在最后得到的判別函數(shù)中,一切變量都是顯著的。經(jīng)過運(yùn)用逐漸判別法,提高了判別樣品的才干,也加強(qiáng)了判別函數(shù)的穩(wěn)定性。 SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通STEPDISC過程過程PROC STEPDISC DATA=

9、數(shù)據(jù)集名 ; CLASS 分類變量名; VAR 變量名列表; BY 分組變量;RUN;逐漸判別分析逐漸判別分析SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通STEPDISC過程過程逐漸判別分析逐漸判別分析SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通STEPDISC過程過程逐漸判別分析逐漸判別分析SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通STEPDISC過程過程逐漸判別分析逐漸判別分析SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到精通2、STEPDISC過程過程語句闡明: 1PROC語句用于規(guī)定運(yùn)轉(zhuǎn)STEPDISC過程,并指定要分析的數(shù)據(jù)集名。選項(xiàng)有: METHOD=選項(xiàng)規(guī)定對判別函數(shù)中的變量進(jìn)展選擇的方法。 2CLASS語句用于規(guī)定分類變量,可以是數(shù)值型變量也可以是字符型變量。分類變量的不同取值那么代表了不同的類別。 3VAR語句用于規(guī)定要挑選的定量變量。假設(shè)不運(yùn)用此語句,那么默許挑選數(shù)據(jù)集中一切的數(shù)值型變量。 4BY語句規(guī)定了分組變量,它使得BY過程對分組內(nèi)進(jìn)展處置。在運(yùn)用BY語句前,應(yīng)對數(shù)據(jù)集按照分組變量進(jìn)展排序。 四、逐漸判別分析四、逐漸判別分析SAS 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門到精通從入門到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論