模式識別考試_第1頁
模式識別考試_第2頁
模式識別考試_第3頁
模式識別考試_第4頁
模式識別考試_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、簡答題1。什么是模式與模式識別模式識別:模式識別是研究用計算機來實現(xiàn)人類模式識別能力的一門學科。模式:模式是一些供模仿用的、完美無缺的標本。模式識別系統(tǒng)的組成信息獲取,預處理,特征提取和選取,分類器設計,分類決策3。什么是后驗概率?系統(tǒng)在某個具體的模式樣本X條件下位于某種類型的概率。確定線性分類器的主要步驟采集訓練樣本,構成訓練樣本集。樣本應該具有典型性確定一個準則J=J(w,x),能反映分類器性能,且存在權值w*使得分類器性能最優(yōu)設計求解w的最優(yōu)算法,得到解向量w*樣本集推斷總體概率分布的方法?參數(shù)估計監(jiān)督參數(shù)估計:樣本所屬類別及類條件總體概率密度函數(shù)的形式已知,某些參數(shù)未知非監(jiān)督參數(shù)估計:

2、已知總體概率密度函數(shù)形式但未知樣本類別,要推斷某些參數(shù)非參數(shù)估計:已知樣本類別,未知總體概率密度函數(shù)形式,要求直接推斷概率密度函數(shù)本身近鄰法的主要思想作為一種分段線性判別函數(shù)的極端情況,將各類中全部樣本都作為代表點,這樣的決策方法就是近鄰法的基本思想。什么是K近鄰法?他是最近鄰法的推廣,取未知樣本x的k個近鄰,看這k個近鄰中多數(shù)屬于哪一類,就把x歸為哪一類.8監(jiān)督學習和非監(jiān)督學習的區(qū)別監(jiān)督學習的用途明確,就是對樣本進行分類.訓練樣本集給出不同類別的實例,從這些實例中找出區(qū)分不同類樣本的方法,劃定決策面非監(jiān)督學習的用途更廣泛,用來分析數(shù)據(jù)的內在規(guī)律,如聚類分析,主分量分析,數(shù)據(jù)擬合什么是誤差平法

3、和準則對于一個給定的聚類,均值向量是最能代表聚類中所有樣本的一個向量,也稱其為聚類中心.一個好的聚類方法應能使集合中的所有向量與這個均值向量的誤差的長度平方和最小.10。分級聚類算法有兩種基本思路聚合法:把所有樣本各自看為一類,逐級聚合成一類。基本思路是根據(jù)類間相似性大小逐級聚合,每級只把相似性最大的兩類聚合成一類,最終把所有樣本聚合為一類。分解法:把所有樣本看做一類,逐級分解為每個樣本一類。11。特征抽取和選擇的區(qū)別在一定意義上特征抽取和特征選擇都是要達到特征降維的目的,只是所實現(xiàn)的途徑不同。特征抽取是通過變換的方法組合原始高維特征,獲得一組低維的新特征,而特征選擇是根據(jù)專家的經(jīng)驗知識或根據(jù)

4、某種評價準則來挑選出那些對分類最有影響力的特征,并未形成新的特征。最優(yōu)搜索算法最優(yōu)搜索算法:至今能得到最優(yōu)解的唯一快速算法是“分支定界”算法.屬于自上而下的算法,具有回溯功能。算法核心是通過合理組合搜索過程,避免一些重復計算。關鍵是利用2了判據(jù)的單調性.13。統(tǒng)計學習理論的核心問題經(jīng)驗風險最小化原則下統(tǒng)計學習一致性的條件在這些條件下關于統(tǒng)計學習方法推廣性的界的結論在這些界的基礎上建立的小樣本歸納推理原則實現(xiàn)這些新的原則的實際方法14.什么是支持向量機?在統(tǒng)計學習理論基礎上發(fā)展出的識別方法,在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出其優(yōu)勢。問答題1.描述貝葉斯公式及其主要作用.P(X,=P(

5、X|P)=P|X)P(X)兩個事物X與w聯(lián)合出現(xiàn)的概率稱為聯(lián)合概率。利用該公式可以計算后驗概率。2.利用最大似然估計方法對單變量正態(tài)分布函數(shù)來估計其均值卩和方差02。0=01,02101=A,02=6,p(x|0)二1,expv2kqL)=n1,expi=1J226lnL=ln(2兀)-ln622Bi-A)i=1奇lnLlnLQ02工丄(i=10工x.n0i1Li=1n/=+202i01)=0命工C-01)=02i=1八01202=0i=1=1工ni=1x.=1工(x.A)ni=1i請詳細寫出感知器訓練算法步驟.設訓練樣本集X=X,X2,.,xn,其中xk屬于wi或者Wj,且xk的類別是已知的

6、。為了確定加權向量W*,執(zhí)行下面的訓練算法給定初始值:置k=0,權向量w(k)為任意值,可選常數(shù)OVcWl輸入樣本xmx1,x2,.,xn,計算判決函數(shù)值g(xm)=wT(k)xm按如下規(guī)則修改權向量若xmWW|,且g(xm)0,則w(k+1)=w(k)%令k=k+1,返回第二步,直到w對所有樣本穩(wěn)定不變,結束4.請詳細寫出Fisher算法實現(xiàn)步驟。在兩類問題中,設分別屬于wi與Wj的樣本數(shù)為n1與n2,n=n1+n2令yk=wTxk(k=l,2,.,n),由子集X1與X2映射后的兩個子集為Y1與丫2。使Y與丫2最容易區(qū)分開的w方向正好是分類超平面的法線方向。定義Fisher準則函數(shù)。使得JF

7、最大的解w*就是最佳解向量以上工作是將d維空間的樣本映射到了一維樣本集,這個一維空間的方向是相對于Fisher準則為最好的。我們還需要解決分類問題。將d維分類問題轉化為一維分類問題后,只需要確定一個閾值點,將投影點與閾值點比較,就可以做出決策。什么是兩分剪輯近鄰法與壓縮近鄰法。將原始樣本隨機分為兩個集合:預測集T和參考集R,來自預測集和參考集的樣本分別完成考試和參考任務,相互獨立。對預測集T中的所有樣本,利用參考集采用近鄰法對其進行分類決策,如果決策結果與實際類別不同,則從預測集中刪除該樣本,最后得到經(jīng)過剪輯的考試樣本集TE。利用考試樣本集TE,采用最近鄰法對測試樣本進行分類決策.剪輯近鄰的結

8、果只是去掉了兩類邊界附近的樣本,而靠近兩類中心的樣本幾乎沒有被去掉。在剪輯的基礎上,再去掉一部分這樣的樣本,有助于進一步縮短計算時間和降低存儲要求。這類方法叫作壓縮近鄰法。請詳細介紹初始聚類中心的選擇方法。任取前c個樣本點作為初始聚類中心憑經(jīng)驗選擇將全部數(shù)據(jù)隨機分為c類,計算其重心,將重心作為聚類中心密度法選擇代表點(具有統(tǒng)計特性)從c1類劃分中產(chǎn)生c類劃分問題的初始聚類中心請描述K均值聚類算法.給定允許誤差,令t=1初始化聚類中心wi(t),i=1,2,.,c修正dij,修正聚類中心wi(t+1)計算誤差E或者Jef)如果E,則算法結束;否則t=t+l,轉步驟38.什么是離散K-L變換以及離

9、散有限KL展開。一個非周期性隨機過程不能用具有互不相關的隨機傅立葉系數(shù)的傅立葉級數(shù)表示,但是可以用具有互不相關系數(shù)的正交函數(shù)的級數(shù)展開oKL展開式就是這樣一種展開方法。設X是一個n維的隨機向量,它可以用下式展開X二a申jj=0aj=10二9,9)12nJl,i=jij=仁0,i豐j9.必考:針對某個識別對象設計自己的模式識別系統(tǒng),并敘述各步驟主要工作。指紋識別技術舉例指紋圖像的提?。ǐ@取數(shù)字圖像)圖像的預處理(濾波、去噪、二值化、增強)指紋特征分析(分析哪些特征可以表示指紋)指紋特征提取(從圖像中提取特征)特征的識別(采用分類方法進行類別判斷)計算題狀態(tài)損失、決策W1W2ai0.52a241o

10、01、在圖像識別中,假定有灌木和坦克2種類型,它們的先驗概率分別是0.7和0o3,損失函數(shù)如下表所示。其中,類型w1和w2分別表示灌木和坦克,判決a1=w1,a2=w2.現(xiàn)在做了2次實驗,獲得2個樣本的類概率密度如下P(xIo)二0.20.51P(xIo)=0.60.32(1)試用最小錯誤率貝葉斯準則判決2個樣本各屬于哪一類?坦克、灌木。(2)試用最小風險決策規(guī)則判決2個樣本各屬于哪一類?灌木、灌木。答:(1)最小錯誤率貝葉斯準則第一個樣本:P(1p(xI)P()Ix)=1+fp(xI)P()jjj=10.2*0.70.2*0.7+0.6*0.314=0.437532P(Ix)=1-P(Ix)

11、=1-0.4375=0.562521P(Ix)P(Ix)=xew,決策為坦克212第二個樣本:(wI)P(xI)P()P(Ix)=1+fP(xIw)P(w)jjj=10.5*0.70.5*0.7+0.3*0.3449P(wIx)=1-P(wIx)沁1-0.795=0.205=-2144P(wIx)PIx)nxew,決策為灌木21(2)最小風險決策規(guī)則九=0.5九=2九=4九=1.011122122第一個樣本R(aIx)=昱九P(wIx)=XP(wIx)+九P(wIx)11jj111122j=1=0.5*0.4375+2*0.5625=1.35375R(aIx)=fXP(wIx)=XP(wIx)

12、+XP(wIx)22jj211222j=1=4*0.4375+1.0*0.5625=2.3175R(aIx)R(aIx)nxew,決策為灌木121第二個樣本R(aIx)=fXP(wIx)=XP(wIx)+XP(wIx)11jj111122j=1=0.5*0.795+2*0.205=0.8075R(aIx)=fXP(wIx)=XP(wIx)+XP(wIx)22jj211222j=1=4*0.795+1.0*0.205=3.385R(aIx)R(aIx)nxew,決策為灌木1212、給出二維樣本數(shù)據(jù)(-1,1),(2,2),(1,1),(2,2),試用KL變換作一維數(shù)據(jù)壓縮。答:數(shù)據(jù)壓縮結果:0,

13、2、邁,0,-2、遼1.樣本的均值向量為:自相關矩陣1丿11)+1.5、2.5丿丿-1)+2(2-2)r2.5J.5求特征值與特征向量九-2.5-1.5-1.5九2.5=4,九2特征向量(標準)分別是:X=1,X2=2丿2丿取更大的特征值所對應的特征向量X為變換矩陣1將原樣本變換成一維樣本(分別用Xt左乘以每原數(shù)據(jù)樣本),得d苧*(-2)-#*(-2)TOC o 1-5 h z_1_2V2v2&22-二+丄*2+二*22(222、22.203、已知兩類的數(shù)據(jù):r:(1,0),(2,0),(1,1);2:(1,0),(0,1),(-1,1),試求該組數(shù)據(jù)的類內與類間散布矩陣.答:1).取均值向量

14、s=y(x1-m)(x-m)t二11-1、2丿211T121Ty(x-m)(x-m)T22_12_T211T_1_33_33J_33_2呻23).計算S與SwbS二S+Sw121(21、1(21、1(40、+3廠12丿312丿-304丿S=(m-m)(m-m)tb1212(63-13丿3丿9J61丿iym二xiNi7(41、T(22、m二,m二1133丿2133丿2).分別計算兩個類與均值向量的距離平方和4、已知歐氏二維空間中兩類9個訓練樣本w1:(-1,0)T,(-2,0)T,(2,1)T,(2,-1)Tw2:(1,1)T,(2,0)t,(1,1)t,(2,1)t,(2,2)T,試分別用最近鄰法和K近鄰法求測試樣本(0,0)T的分類,取K=5,7。答:最近鄰法:最近鄰為(一1,0)t分類為w1K近鄰法:K=5:5個近鄰為1類的(1,0)t,(-2,0)t,2類的(1,1)t,(2,0)t,(1,1)t分類為w2K=7:1)若近鄰為1類的(-1,0)T,(2,0)T,(-2,1)T,(2,1)T,2類的(1,1)T,(2,0)T,(1,1)T,則分類為w12)若近鄰為1類的(一1,0)T,(-2,0)t,(-2,1)t或(-2,1)t兩個之一,2類的(1,1)t,(2,0)t,(1,-1)t,(2,1)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論