




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2022/10/31多元統(tǒng)計(jì)分析2022/10/32第四章 判別分析 4.1 判別分析的基本思想 4.2 距離判別4.3 Bayes判別 4.4 Fisher判別 4.5 逐步判別 4.8 判別分析應(yīng)用的幾個(gè)例子 2022/10/33第四章 判別分析 回歸模型普及性的基礎(chǔ)在于用它去預(yù)測和解釋度量(metric)變量。但是對于非度量(nonmetric)變量,多元回歸不適合解決此類問題。 本章介紹的判別分析來解決被解釋變量是非度量變量的情形。在這種情況下,人們對于預(yù)測和解釋影響一個(gè)對象所屬類別的關(guān)系感興趣,比如為什么某人是或者不是消費(fèi)者,一家公司成功還是破產(chǎn)等。 第四章 判別分析 判別分析在主要
2、目的是識別一個(gè)個(gè)體所屬類別的情況下有著廣泛的應(yīng)用。 潛在的應(yīng)用包括預(yù)測新產(chǎn)品的成功或失敗、決定一個(gè)學(xué)生是否被錄取、按職業(yè)興趣對學(xué)生分組、確定某人信用風(fēng)險(xiǎn)的種類、或者預(yù)測一個(gè)公司是否成功。在每種情況下,將對象進(jìn)行分組,并且要求使用這兩種方法中的一種可以通過人們選擇的解釋變量來預(yù)測或者解釋每個(gè)對象的所屬類別。2022/10/342022/10/354.1 判別分析的基本思想 有時(shí)會(huì)遇到包含屬性被解釋變量和幾個(gè)度量解釋變量的問題,這時(shí)需要選擇一種合適的分析方法。比如,我們希望區(qū)分好和差的信用風(fēng)險(xiǎn)。如果有信用風(fēng)險(xiǎn)的度量指標(biāo),就可以使用多元回歸。但我們可能僅能判斷某人是在好的或者差的一類,這就不是多元回
3、歸分析所要求的度量類型。 當(dāng)被解釋變量是屬性變量而解釋變量是度量變量時(shí),判別分析是合適的統(tǒng)計(jì)分析方法,2022/10/364.1 判別分析的基本思想 判別分析能夠解決兩組或者更多組的情況。 當(dāng)包含兩組時(shí),稱作兩組判別分析。當(dāng)包含三組或者三組以上時(shí),稱作多組判別分析(Multiple discriminant analysis)。 判別分析最基本的要求是,分組類型在兩組以上;在第一階段工作是每組案例的規(guī)模必須至少在一個(gè)以上。解釋變量必須是可測量的,才能夠計(jì)算其平均值和方差,使其能合理地應(yīng)用于統(tǒng)計(jì)函數(shù),2022/10/374.1 判別分析的基本思想 與其他多元統(tǒng)計(jì)模型類似,判別分析有其假設(shè)條件:
4、判別分析的假設(shè)之一,是每一個(gè)判別變量(解釋變量)不能是其他判別變量的線性組合。即不存在多重共線性問題。 判別分析的假設(shè)之二,是各組變量的協(xié)方差矩陣相等。判別分析最簡單和最常用的形式是采用線性判別函數(shù),它們是判別變量的簡單線性組合。在各組協(xié)方差矩陣相等的假設(shè)條件下,可以使用很簡單的公式來計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)。 2022/10/384.1 判別分析的基本思想 判別分析的假設(shè)之三,是各判別變量之間具有多元正態(tài)分布,即每個(gè)變量對于所有其他變量的固定值有正態(tài)分布。在這種條件下可以精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。當(dāng)違背該假設(shè)時(shí),計(jì)算的概率將非常不準(zhǔn)確。4.2 距離判別 4.2.1 兩總體情況
5、 2022/10/3104.2 距離判別 4.2.1 兩總體情況 2022/10/3114.2 距離判別 這個(gè)準(zhǔn)則的數(shù)學(xué)模型可作如下描述:4.2.1 兩總體情況 2022/10/3124.2 距離判別 4.2.1 兩總體情況 2022/10/3134.2 距離判別 4.2.1 兩總體情況 2022/10/3144.2 距離判別 于是,判別規(guī)則可表示為:2022/10/3154.2 距離判別 2022/10/3164.2 距離判別 4.2.2 多總體情況1. 協(xié)差陣相同。 2022/10/3174.2 距離判別 2022/10/3184.2 距離判別 2. 協(xié)差陣不相同2022/10/3194.
6、2 距離判別 2022/10/3204.2 距離判別 已知蠓蟲類別的數(shù)據(jù)Af觸角1.241.361.381.381.381.41.481.541.56翼長1.721.741.641.821.91.71.821.822.08Apf觸角1.141.181.21.261.281.3翼長1.781.961.862.02.01.96未知類別的三個(gè)樣本數(shù)據(jù):(1.28,1.8)、(1.28,1.84)、(1.4,2.04)2022/10/3224.3 Bayes判別 2022/10/3234.3 Bayes判別 2022/10/3244.3 Bayes判別 2022/10/3254.4 Fisher判別
7、4.4 Fisher判別 并未要求總體分布類型工作原理就是對原數(shù)據(jù)系統(tǒng)進(jìn)行坐標(biāo)變換,尋求能夠?qū)⒖傮w盡可能分開的方向.2022/10/3284.4 Fisher判別 2022/10/3294.4 Fisher判別 希望尋找a使得SSG盡可能大而SSE盡可能小,即:2022/10/3304.4 Fisher判別 2022/10/331 在有些問題中,僅用一個(gè)線性判別函數(shù)不能很好地區(qū)別各個(gè)總體,可取 2對應(yīng)的特征向量l2,建立第二個(gè)判別函數(shù)l2x。如還不夠,可建立第三個(gè)線性判別函數(shù),依此類推。4.4 Fisher判別 2022/10/3324.4 Fisher判別 2022/10/3334.5 逐步
8、判別 在多元回歸中熟知,變量選擇的好壞直接影響回歸的效果,而在判別分析中也有類似的問題。 如果在某個(gè)判別問題中,將其中最主要的指標(biāo)忽略了,由此建立的判別函數(shù)其效果一定不好。 但是在許多問題中,事先并不十分清楚哪些指標(biāo)是主要的,這時(shí),是否將有關(guān)的指標(biāo)盡量收集加入計(jì)算才好呢? 理論和實(shí)踐證明,指標(biāo)太多了,不僅帶來大量的計(jì)算,同時(shí)許多對判別無作用的指標(biāo)反而會(huì)干擾了我們的視線。因此適當(dāng)篩選變量的問題就成為一個(gè)很重要的事情。 凡具有篩選變量能力的判別方法統(tǒng)稱為逐步判別法。 和通常的判別分析一樣,逐步判別也有許多不同的原則,從而產(chǎn)生各種方法。有關(guān)逐步判別法的理論基礎(chǔ)詳見1所討論指標(biāo)的附加信息檢驗(yàn)。2022
9、/10/3344.5 逐步判別 2022/10/335逐步判別的原則:4.5 逐步判別 2022/10/3364.5 逐步判別 2022/10/337()這時(shí)既不能選進(jìn)新變量,又不能剔除已選進(jìn)的變量,將已選中的變量建立判別函數(shù)。4.5 逐步判別 2022/10/3384.6 判別分析應(yīng)用的幾個(gè)例子 判別分析的邏輯步驟框圖如下:2022/10/339下面用SPSS軟件中的Discriminant模塊來實(shí)現(xiàn)判別分析4.6 判別分析應(yīng)用的幾個(gè)例子 2022/10/3404.6 判別分析應(yīng)用的幾個(gè)例子 2022/10/3412022/10/3434.8 判別分析應(yīng)用的幾個(gè)例子 例4.3 為了研究2005年全國各地區(qū)國有及國有控股工業(yè)企業(yè)的經(jīng)營狀況,按標(biāo)準(zhǔn)化歐氏平方距離
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國塑料燒杯市場分析及競爭策略研究報(bào)告
- 2025━2030年玉堂富貴圖行業(yè)深度研究報(bào)告
- 2025-2035年全球及中國淡味啤酒行業(yè)市場發(fā)展現(xiàn)狀及發(fā)展前景研究報(bào)告
- 2025年微伽重力儀合作協(xié)議書
- 2025年CDMA蜂窩移動(dòng)通信系統(tǒng)項(xiàng)目發(fā)展計(jì)劃
- 2025年快速搜索定位儀項(xiàng)目合作計(jì)劃書
- 藥學(xué)護(hù)理培訓(xùn)課件
- 近視眼預(yù)防教案
- 硝酸鍶企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 便利店日用品零售企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報(bào)告
- 食品安全自查、從業(yè)人員健康管理、進(jìn)貨查驗(yàn)記錄、食品安全事故處置保證食品安全規(guī)章制度
- 車站信號自動(dòng)控制課件:進(jìn)站信號機(jī)點(diǎn)燈電路
- 瀝青基材料在石油化工設(shè)備熱絕緣中的開發(fā)
- 2024屆中考語文第一輪復(fù)習(xí)《綜合性學(xué)習(xí)》教學(xué)課件
- 2024湖南株洲市天元區(qū)面向社會(huì)招聘社區(qū)專職工作者筆試歷年典型考題及考點(diǎn)剖析附答案帶詳解
- 煤層底板采動(dòng)破裂深度壓水
- 新人教小學(xué)數(shù)學(xué)六年級下冊《成數(shù)》示范課教學(xué)課件
- JTS-304-2019水運(yùn)工程水工建筑物檢測與評估技術(shù)規(guī)范
- 巖土工程領(lǐng)域的前沿技術(shù)與未來發(fā)展
- CAR-T細(xì)胞療法行業(yè)營銷策略方案
- 四年級美術(shù)測國測復(fù)習(xí)題答案
評論
0/150
提交評論