




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
模式識別導論四第1頁,共57頁,2023年,2月20日,星期五對x再觀察:有細胞光密度特征,有類條件概率密度:P(x/ω?)?=1,2,…。如圖所示利用貝葉斯公式:通過對細胞的再觀察,就可以把先驗概率轉(zhuǎn)化為后驗概率,利用后驗概率可對未知細胞x進行識別。第四章貝葉斯決策理論§4-1Bayes分類器—最優(yōu)分類器、最佳分類器一、兩類問題例如:細胞識別問題ω1正常細胞,ω2異常細胞某地區(qū),經(jīng)大量統(tǒng)計獲先驗概率P(ω1),P(ω2)。若取該地區(qū)某人細胞x屬何種細胞
,只能由先驗概率決定。第2頁,共57頁,2023年,2月20日,星期五設N個樣本分為兩類ω1,ω2。每個樣本抽出n個特征,
x=(x1,
x2,
x3,…,
xn)T通過對細胞的再觀察,就可以把先驗概率轉(zhuǎn)化為后驗概率,利用后驗概率可對未知細胞x進行識別。1、判別函數(shù):若已知先驗概率P(ω1),P(ω2),類條件概率密度P(x/ω1),
P(x/ω2)。則可得貝葉斯判別函數(shù)四種形式
:第3頁,共57頁,2023年,2月20日,星期五2、決策規(guī)則:第4頁,共57頁,2023年,2月20日,星期五
3、決策面方程:
x為一維時,決策面為一點,x為二維時決策面為曲線,x為三維時,決策面為曲面,x大于三維時決策面為超曲面。例:某地區(qū)細胞識別;P(ω1)=0.9,P(ω2)=0.1未知細胞x,先從類條件概率密度分布曲線上查到:解:該細胞屬于正常細胞還是異常細胞,先計算后驗概率:P(x/ω1)=0.2,
P(x/ω2)=0.4第5頁,共57頁,2023年,2月20日,星期五g(x)閾值單元4、分類器設計:第6頁,共57頁,2023年,2月20日,星期五二、多類情況:ω?=(ω1,ω2,…,ωm),x=(x1,x2,…,xn)
1.判別函數(shù):M類有M個判別函數(shù)g1(x),g2(x),…,gm(x).每個判別函數(shù)有上面的四種形式。2.決策規(guī)則:另一種形式:3、決策面方程:4、分類器設計:g1(x)Maxg(x)g2(x)gn(x)第7頁,共57頁,2023年,2月20日,星期五§4-2正態(tài)分布決策理論
一、正態(tài)分布判別函數(shù)
1、為什么采用正態(tài)分布:
a、正態(tài)分布在物理上是合理的、廣泛的。
b、正態(tài)分布數(shù)學上簡單,N(μ,σ2)只有均值和方差兩個參數(shù)。2、單變量正態(tài)分布:第8頁,共57頁,2023年,2月20日,星期五3、(多變量)多維正態(tài)分布(1)函數(shù)形式:第9頁,共57頁,2023年,2月20日,星期五(2)、性質(zhì):
①、μ與∑對分布起決定作用P(χ)=N(μ,∑),μ由n個分量組成,∑由n(n+1)/2元素組成?!喽嗑S正態(tài)分布由n+n(n+1)/2個參數(shù)組成。
②、等密度點的軌跡是一個超橢球面。區(qū)域中心由μ決定,區(qū)域形狀由∑決定。③、不相關性等價于獨立性。若xi與xj互不相關,則xi與xj一定獨立。④、線性變換的正態(tài)性Y=AX,A為線性變換矩陣。若X為正態(tài)分布,則Y也是正態(tài)分布。⑤、線性組合的正態(tài)性。第10頁,共57頁,2023年,2月20日,星期五判別函數(shù):類條件概率密度用正態(tài)來表示:二、最小錯誤率(Bayes)分類器:從最小錯誤率這個角度來分析Bayes分類器
1.第一種情況:各個特征統(tǒng)計獨立,且同方差情況。(最簡單情況)決策面方程:第11頁,共57頁,2023年,2月20日,星期五
判別函數(shù):最小距離分類器:未知x與μi相減,找最近的μi把x歸類如果M類先驗概率相等:第12頁,共57頁,2023年,2月20日,星期五第13頁,共57頁,2023年,2月20日,星期五討論:第14頁,共57頁,2023年,2月20日,星期五未知x,把x與各類均值相減,把x歸于最近一類。最小距離分類器。2、第二種情況:Σi=
Σ相等,即各類協(xié)方差相等。第15頁,共57頁,2023年,2月20日,星期五第16頁,共57頁,2023年,2月20日,星期五討論:針對ω1,ω2二類情況,如圖:第17頁,共57頁,2023年,2月20日,星期五3、第三種情況(一般情況):Σ?為任意,各類協(xié)方差矩陣不等,二次項xT
Σ?x與i有關。所以判別函數(shù)為二次型函數(shù)。第18頁,共57頁,2023年,2月20日,星期五第19頁,共57頁,2023年,2月20日,星期五§4-3關于分類器的錯誤率分析
1、一般錯誤率分析:第20頁,共57頁,2023年,2月20日,星期五2、正態(tài)分布最小錯誤率(在正態(tài)分布情況下求最小錯誤率)第21頁,共57頁,2023年,2月20日,星期五第22頁,共57頁,2023年,2月20日,星期五§4-4最小風險Bayes分類器假定要判斷某人是正常(ω1)還是肺病患者(ω2),于是在判斷中可能出現(xiàn)以下情況:第一類,判對(正?!?λ11
;第二類,判錯(正常→肺病)λ21
;第三類,判對(肺病→肺病)λ22;第四類,判錯(肺病→正常)λ12
。在判斷時,除了能做出“是”ωi類或“不是”ωi類的動作以外,還可以做出“拒識”的動作。為了更好地研究最小風險分類器,我們先說明幾個概念:第23頁,共57頁,2023年,2月20日,星期五在整個特征空間中定義期望風險,期望風險:行動αi:表示把模式x判決為ωi類的一次動作。損耗函數(shù)λii=λ(αi/ωi)表示模式X本來屬于ωi類而錯判為ωi所受損失。因為這是正確判決,故損失最小。損耗函數(shù)λij=λ(αi/ωj)表示模式X本來屬于ωj類錯判為ωi所受損失。因為這是錯誤判決,故損失最大。風險R(期望損失):對未知x采取一個判決行動α(x)所付出的代價(損耗)條件風險(也叫條件期望損失):第24頁,共57頁,2023年,2月20日,星期五條件風險只反映對某x取值的決策行動αi所帶來的風險。期望風險則反映在整個特征空間不同的x取值的決策行動所帶來的平均風險。最小風險Bayes決策規(guī)則:第25頁,共57頁,2023年,2月20日,星期五二類問題:把x歸于ω1時風險:把x歸于ω2時風險:第26頁,共57頁,2023年,2月20日,星期五第27頁,共57頁,2023年,2月20日,星期五§4-5Bayes分類的算法(假定各類樣本服從正態(tài)分布)1.輸入類數(shù)M;特征數(shù)n,待分樣本數(shù)m.2.輸入訓練樣本數(shù)N和訓練集資料矩陣X(N×n)。并計算有關參數(shù)。3.計算矩陣y中各類的后驗概率。4.若按最小錯誤率原則分類,則可根據(jù)3的結果判定y中各類樣本的類別。5.若按最小風險原則分類,則輸入各值,并計算y中各樣本屬于各類時的風險并判定各樣本類別。第28頁,共57頁,2023年,2月20日,星期五例1、有訓練集資料矩陣如下表所示,現(xiàn)已知,N=9、N1=5、N2=4、n=2、M=2,試問,X=(0,0)T應屬于哪一類?解1、假定二類協(xié)方差矩陣不等(∑1≠∑2)則均值:訓練樣本號k123451234特征x1特征x2110-1-1
010-1
01110-1-2-2-2類別ω1
ω
2第29頁,共57頁,2023年,2月20日,星期五第30頁,共57頁,2023年,2月20日,星期五第31頁,共57頁,2023年,2月20日,星期五解2、假定兩類協(xié)方差矩陣相等∑=∑1+∑2第32頁,共57頁,2023年,2月20日,星期五訓練樣本號k123123123特征x1012-2-1-201-1特征x210-110-1-1-2-2類別ω1ω2ω3解1、假定三類協(xié)方差不等;例2:有訓練集資料矩陣如下表所示,現(xiàn)已知,N=9、N1=N2=3、n=2、M=3,試問,未知樣本X=(0,0)T應屬于哪一類?第33頁,共57頁,2023年,2月20日,星期五第34頁,共57頁,2023年,2月20日,星期五可得三類分界線如圖所示:第35頁,共57頁,2023年,2月20日,星期五解2、設三類協(xié)方差矩陣相等第36頁,共57頁,2023年,2月20日,星期五可得三類分界線如圖所示:第37頁,共57頁,2023年,2月20日,星期五作業(yè):①在下列條件下,求待定樣本x=(2,0)T的類別,畫出分界線,編程上機。1、二類協(xié)方差相等,2、二類協(xié)方差不等。訓練樣本號k123123特征x1112-1-1-2特征x210-110-1類別ω1ω2第38頁,共57頁,2023年,2月20日,星期五作業(yè):②有訓練集資料矩陣如下表所示,現(xiàn)已知,N=9、N1=N2=N3=3、n=2、M=3,試問,X=(-2,2)T應屬于哪一類?要求:用兩種解法a、三類協(xié)方差不等;b、三類協(xié)方差相等。編程上機,畫出三類的分界線。訓練樣本號k123123123特征x1021-1-2-2001特征x201010-1-2-1-2類別ω1ω2ω3第39頁,共57頁,2023年,2月20日,星期五§4-6在一類錯誤率固定使另一類錯誤率最小的判別準則(聶曼-皮爾遜判決neyman-pearson)第40頁,共57頁,2023年,2月20日,星期五第41頁,共57頁,2023年,2月20日,星期五例:兩類的模式分布為二維正態(tài)協(xié)方差矩陣為單位矩陣∑1=∑2=I,設ε2=0.09求聶曼皮爾遜準則T.解:第42頁,共57頁,2023年,2月20日,星期五第43頁,共57頁,2023年,2月20日,星期五所以此時聶曼——皮爾遜分類器的分界線為:由圖可知為保證ε2足夠小,邊界應向ω1一側靠,則ε1↑T與ε2的關系表如右:T421??ε20.040.090.160.250.38第44頁,共57頁,2023年,2月20日,星期五§4-7最大最小判別準則:前邊的討論都是假定先驗概率不變,現(xiàn)在討論在P(ωi)變化時如何使最大可能風險最小,先驗概率P(ω1)與風險R間的變化關系如下:第45頁,共57頁,2023年,2月20日,星期五第46頁,共57頁,2023年,2月20日,星期五這樣,就得出最小風險與先驗概率的關系曲線,如圖所示:討論:第47頁,共57頁,2023年,2月20日,星期五上式證明,所選的判別邊界,使兩類的概率相等:這時可使最大可能的風險為最小,這時先驗概率變化,其風險不變第48頁,共57頁,2023年,2月20日,星期五§4-8決策樹—多峰情況Bayes分類器只能適用于樣本分布呈單峰情況,對多峰情況則不行。若用決策樹,可進行如下步驟分類整個分類過程可用右圖的樹表示:1、基本概念(1)決策樹:二叉樹。每個節(jié)點都是兩類分類器。例如;節(jié)點a上的決策規(guī)則為:(2)代價(損失)矩陣定義節(jié)點L的代價為:第49頁,共57頁,2023年,2月20日,星期五2、決策樹的構造在構造決策樹時,需要考慮以下問題:1)、如何判斷一節(jié)點是否為葉子。如右圖表示,假定A、B、C、D、E、F各包含50個樣本,并有以下的代價矩陣對于節(jié)點a,可以作出以下兩個決策之一:決策1,a不再分割決策2,a分為兩類決策1的代價為A1(a)=Ca─節(jié)點a的代價決策2的代價為A2(a)=α(Cb+Cc)─節(jié)點b,c的代價和其中,α為一經(jīng)驗因子,用以防止無限分割下去第50頁,共57頁,2023年,2月20日,星期五只要經(jīng)驗因子α≤2.25,便有A2(a)≤A1(a),因此取決策2的代價較小,故應把α分為兩類。一般地決策代價為:2)、選擇節(jié)點的分割方式:
a、根據(jù)經(jīng)驗確定。例如,全部樣本分為三類,其代價矩陣為第51頁,共57頁,2023年,2月20日,星期五b、根據(jù)對樣本分布的了解試探確定。如右圖所示,將a劃分為b,c的方式有兩種c、根據(jù)聚類結果來劃分。3)、如何確定各節(jié)點分類器。原則:①、分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江管道防腐工程施工方案
- 山東道路亮化工程施工方案
- 中微子通信的暗網(wǎng)SEO監(jiān)測系統(tǒng)構建?
- 2025年大班繪畫標準教案快樂元旦假期反思
- 2025年幼兒園《我的好媽媽》標準教案
- 公開招聘專業(yè)技術人員報名登記表
- 電子廠新員工培訓計劃
- 編外招聘衛(wèi)生專業(yè)技術人員報名表
- 2025至2030年中國尼龍板數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國圓形結晶器銅套數(shù)據(jù)監(jiān)測研究報告
- Project項目管理(從菜鳥到實戰(zhàn)高手)
- 食品加工機械與設備操作技能測試考核試卷
- SNT 1961.11-2013 出口食品過敏原成分檢測 第11部分:實時熒光PCR方法檢測麩質(zhì)成分
- 排洪渠施工施工方法
- 冀教版數(shù)學七年級上下冊知識點總結
- 第六章 圍手術期護理課件
- 2024廣東省深圳市寶安區(qū)中考初三二模英語試題及答案
- 中考字音字形練習題(含答案)-字音字形專項訓練
- 音響設備出租行業(yè)競爭分析及發(fā)展前景預測報告
- DB63-T 2313-2024 三江源國家公園生態(tài)監(jiān)測指標
- 2024年湖南高速鐵路職業(yè)技術學院單招職業(yè)適應性測試題庫及答案1套
評論
0/150
提交評論