版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2022/10/31多元統(tǒng)計(jì)分析2022/10/32第四章 判別分析 4.1 判別分析的基本思想 4.2 距離判別4.3 Bayes判別 4.4 Fisher判別 4.5 逐步判別 4.8 判別分析應(yīng)用的幾個(gè)例子 2022/10/33第四章 判別分析 回歸模型普及性的基礎(chǔ)在于用它去預(yù)測(cè)和解釋度量(metric)變量。但是對(duì)于非度量(nonmetric)變量,多元回歸不適合解決此類(lèi)問(wèn)題。 本章介紹的判別分析來(lái)解決被解釋變量是非度量變量的情形。在這種情況下,人們對(duì)于預(yù)測(cè)和解釋影響一個(gè)對(duì)象所屬類(lèi)別的關(guān)系感興趣,比如為什么某人是或者不是消費(fèi)者,一家公司成功還是破產(chǎn)等。 第四章 判別分析 判別分析在主要
2、目的是識(shí)別一個(gè)個(gè)體所屬類(lèi)別的情況下有著廣泛的應(yīng)用。 潛在的應(yīng)用包括預(yù)測(cè)新產(chǎn)品的成功或失敗、決定一個(gè)學(xué)生是否被錄取、按職業(yè)興趣對(duì)學(xué)生分組、確定某人信用風(fēng)險(xiǎn)的種類(lèi)、或者預(yù)測(cè)一個(gè)公司是否成功。在每種情況下,將對(duì)象進(jìn)行分組,并且要求使用這兩種方法中的一種可以通過(guò)人們選擇的解釋變量來(lái)預(yù)測(cè)或者解釋每個(gè)對(duì)象的所屬類(lèi)別。2022/10/342022/10/354.1 判別分析的基本思想 有時(shí)會(huì)遇到包含屬性被解釋變量和幾個(gè)度量解釋變量的問(wèn)題,這時(shí)需要選擇一種合適的分析方法。比如,我們希望區(qū)分好和差的信用風(fēng)險(xiǎn)。如果有信用風(fēng)險(xiǎn)的度量指標(biāo),就可以使用多元回歸。但我們可能僅能判斷某人是在好的或者差的一類(lèi),這就不是多元回
3、歸分析所要求的度量類(lèi)型。 當(dāng)被解釋變量是屬性變量而解釋變量是度量變量時(shí),判別分析是合適的統(tǒng)計(jì)分析方法,2022/10/364.1 判別分析的基本思想 判別分析能夠解決兩組或者更多組的情況。 當(dāng)包含兩組時(shí),稱(chēng)作兩組判別分析。當(dāng)包含三組或者三組以上時(shí),稱(chēng)作多組判別分析(Multiple discriminant analysis)。 判別分析最基本的要求是,分組類(lèi)型在兩組以上;在第一階段工作是每組案例的規(guī)模必須至少在一個(gè)以上。解釋變量必須是可測(cè)量的,才能夠計(jì)算其平均值和方差,使其能合理地應(yīng)用于統(tǒng)計(jì)函數(shù),2022/10/374.1 判別分析的基本思想 與其他多元統(tǒng)計(jì)模型類(lèi)似,判別分析有其假設(shè)條件:
4、判別分析的假設(shè)之一,是每一個(gè)判別變量(解釋變量)不能是其他判別變量的線性組合。即不存在多重共線性問(wèn)題。 判別分析的假設(shè)之二,是各組變量的協(xié)方差矩陣相等。判別分析最簡(jiǎn)單和最常用的形式是采用線性判別函數(shù),它們是判別變量的簡(jiǎn)單線性組合。在各組協(xié)方差矩陣相等的假設(shè)條件下,可以使用很簡(jiǎn)單的公式來(lái)計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)。 2022/10/384.1 判別分析的基本思想 判別分析的假設(shè)之三,是各判別變量之間具有多元正態(tài)分布,即每個(gè)變量對(duì)于所有其他變量的固定值有正態(tài)分布。在這種條件下可以精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。當(dāng)違背該假設(shè)時(shí),計(jì)算的概率將非常不準(zhǔn)確。4.2 距離判別 4.2.1 兩總體情況
5、 2022/10/3104.2 距離判別 4.2.1 兩總體情況 2022/10/3114.2 距離判別 這個(gè)準(zhǔn)則的數(shù)學(xué)模型可作如下描述:4.2.1 兩總體情況 2022/10/3124.2 距離判別 4.2.1 兩總體情況 2022/10/3134.2 距離判別 4.2.1 兩總體情況 2022/10/3144.2 距離判別 于是,判別規(guī)則可表示為:2022/10/3154.2 距離判別 2022/10/3164.2 距離判別 4.2.2 多總體情況1. 協(xié)差陣相同。 2022/10/3174.2 距離判別 2022/10/3184.2 距離判別 2. 協(xié)差陣不相同2022/10/3194.
6、2 距離判別 2022/10/3204.2 距離判別 已知蠓蟲(chóng)類(lèi)別的數(shù)據(jù)Af觸角1.241.361.381.381.381.41.481.541.56翼長(zhǎng)1.721.741.641.821.91.71.821.822.08Apf觸角1.141.181.21.261.281.3翼長(zhǎng)1.781.961.862.02.01.96未知類(lèi)別的三個(gè)樣本數(shù)據(jù):(1.28,1.8)、(1.28,1.84)、(1.4,2.04)2022/10/3224.3 Bayes判別 2022/10/3234.3 Bayes判別 2022/10/3244.3 Bayes判別 2022/10/3254.4 Fisher判別
7、4.4 Fisher判別 并未要求總體分布類(lèi)型工作原理就是對(duì)原數(shù)據(jù)系統(tǒng)進(jìn)行坐標(biāo)變換,尋求能夠?qū)⒖傮w盡可能分開(kāi)的方向.2022/10/3284.4 Fisher判別 2022/10/3294.4 Fisher判別 希望尋找a使得SSG盡可能大而SSE盡可能小,即:2022/10/3304.4 Fisher判別 2022/10/331 在有些問(wèn)題中,僅用一個(gè)線性判別函數(shù)不能很好地區(qū)別各個(gè)總體,可取 2對(duì)應(yīng)的特征向量l2,建立第二個(gè)判別函數(shù)l2x。如還不夠,可建立第三個(gè)線性判別函數(shù),依此類(lèi)推。4.4 Fisher判別 2022/10/3324.4 Fisher判別 2022/10/3334.5 逐步
8、判別 在多元回歸中熟知,變量選擇的好壞直接影響回歸的效果,而在判別分析中也有類(lèi)似的問(wèn)題。 如果在某個(gè)判別問(wèn)題中,將其中最主要的指標(biāo)忽略了,由此建立的判別函數(shù)其效果一定不好。 但是在許多問(wèn)題中,事先并不十分清楚哪些指標(biāo)是主要的,這時(shí),是否將有關(guān)的指標(biāo)盡量收集加入計(jì)算才好呢? 理論和實(shí)踐證明,指標(biāo)太多了,不僅帶來(lái)大量的計(jì)算,同時(shí)許多對(duì)判別無(wú)作用的指標(biāo)反而會(huì)干擾了我們的視線。因此適當(dāng)篩選變量的問(wèn)題就成為一個(gè)很重要的事情。 凡具有篩選變量能力的判別方法統(tǒng)稱(chēng)為逐步判別法。 和通常的判別分析一樣,逐步判別也有許多不同的原則,從而產(chǎn)生各種方法。有關(guān)逐步判別法的理論基礎(chǔ)詳見(jiàn)1所討論指標(biāo)的附加信息檢驗(yàn)。2022
9、/10/3344.5 逐步判別 2022/10/335逐步判別的原則:4.5 逐步判別 2022/10/3364.5 逐步判別 2022/10/337()這時(shí)既不能選進(jìn)新變量,又不能剔除已選進(jìn)的變量,將已選中的變量建立判別函數(shù)。4.5 逐步判別 2022/10/3384.6 判別分析應(yīng)用的幾個(gè)例子 判別分析的邏輯步驟框圖如下:2022/10/339下面用SPSS軟件中的Discriminant模塊來(lái)實(shí)現(xiàn)判別分析4.6 判別分析應(yīng)用的幾個(gè)例子 2022/10/3404.6 判別分析應(yīng)用的幾個(gè)例子 2022/10/3412022/10/3434.8 判別分析應(yīng)用的幾個(gè)例子 例4.3 為了研究2005年全國(guó)各地區(qū)國(guó)有及國(guó)有控股工業(yè)企業(yè)的經(jīng)營(yíng)狀況,按標(biāo)準(zhǔn)化歐氏平方距離
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024蘇州二手房買(mǎi)賣(mài)合同協(xié)議范本:房屋交易保障及售后服務(wù)協(xié)議3篇
- 2025年度廠區(qū)綠化養(yǎng)護(hù)與生態(tài)景觀提升合同3篇
- 2025年度360借條合同多(信用評(píng)級(jí)合作版)3篇
- 2025年度油氣田廢棄井修復(fù)打井合同范本4篇
- 2025年度文化創(chuàng)意產(chǎn)業(yè)出資協(xié)議合同模板3篇
- 2024美團(tuán)外賣(mài)配送配送員配送區(qū)域合作伙伴服務(wù)標(biāo)準(zhǔn)合同3篇
- 2024網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估及防護(hù)服務(wù)合同
- 2025年度圖書(shū)檔案庫(kù)房智能化儲(chǔ)藏系統(tǒng)合同4篇
- 2025年度智能車(chē)場(chǎng)租賃服務(wù)合同(新能源汽車(chē)版)4篇
- 2025年度電磁兼容性實(shí)驗(yàn)室設(shè)備采購(gòu)合同2篇
- 《C語(yǔ)言從入門(mén)到精通》培訓(xùn)教程課件
- 2023年中國(guó)半導(dǎo)體行業(yè)薪酬及股權(quán)激勵(lì)白皮書(shū)
- 2024年Minitab全面培訓(xùn)教程
- 社區(qū)電動(dòng)車(chē)棚新(擴(kuò))建及修建充電車(chē)棚施工方案(純方案-)
- 項(xiàng)目推進(jìn)與成果交付情況總結(jié)與評(píng)估
- 鐵路項(xiàng)目征地拆遷工作體會(huì)課件
- 醫(yī)院死亡報(bào)告年終分析報(bào)告
- 建設(shè)用地報(bào)批服務(wù)投標(biāo)方案(技術(shù)方案)
- 工會(huì)工作人年度考核個(gè)人總結(jié)
- 上海民辦楊浦實(shí)驗(yàn)學(xué)校初一新生分班(摸底)語(yǔ)文考試模擬試卷(10套試卷帶答案解析)
- 機(jī)器人論文3000字范文
評(píng)論
0/150
提交評(píng)論