版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、標準文案大全一、填空與選擇填空(本題答案寫在此試卷上,30分)1、 模式識別系統(tǒng)的基本構成單元包括:模式采集 、特征提取與選擇和 模式分類。2、 統(tǒng)計模式識別中描述模式的方法一般使用特真矢量 ;句法模式識別中模式描述方法一般有串樹、網(wǎng)。3、聚類分析算法屬于(1);判別域代數(shù)界面方程法屬于(3)。(1)無監(jiān)督分類 (2)有監(jiān)督分類(3)統(tǒng)計模式識別方法(4)句法模式識別方法4、若描述模式的特征量為0-1二值特征量,則一般采用(4)進行相似性度量。(1)距離測度(2)模糊測度(3)相似測度(4)匹配測度5、下列函數(shù)可以作為聚類分析中的準則函數(shù)的有(1)( 3)( 4)(1)八恥態(tài)(2)"
2、隔矇j-i 1-13 = 2 (函-兩(函-m) 二6、 Fisher線性判別函數(shù)的求解過程是將N維特征矢量投影在(2) 中進行。(1) 二維空間(2) 維空間(3) N-1維空間7、 下列判別域界面方程法中只適用于線性可分情況的算法有(1);線性可分、不可分都適用的有(3)(1)感知器算法(2) H-K算法(3)積累位勢函數(shù)法8、下列四元組中滿足文法定義的有(1)( 2)( 4)(1)( A,B,0, 1,A >01, A0 A1 ,A-. 1 A0 , B-.BA , B )0, A)(2)( A, 0, 1, A >0, A; 0 A,A)(3)( S, a,b, S 00
3、S, S11 S, S-00,S > 11,S)(4)(A, 0, 1, A >01, A > 0A1, A >1 A0,A)9、 影響層次聚類算法結果的主要因素有(計算模式距離的測度、(聚類準則、類間距離門限、預定的類別數(shù)目)。10、歐式距離具有(1、2);馬式距離具有(1、2、3、4)。(1)平移不變性(2)旋轉不變性(3)尺度縮放不變性(4)不受量綱影響的特性11、線性判別函數(shù)的正負和數(shù)值大小的幾何意義是( 正(負)表示樣本點位于判別界面法向量指向的正(負)半空間中;絕對值正比于樣本點到判別界面的距離。)。12、感知器算法 1。(1)只適用于線性可分的情況;(2
4、)線性可分、不可分都適用。13、 積累勢函數(shù)法較之于 H-K算法的優(yōu)點是(該方法可用于非線性可分情況(也可用于線性可分情況);K (x= H «kK(x,Xk )位勢函數(shù)K(x,x k)與積累位勢函數(shù) K(x)的關系為(Xk.x)。14、 在統(tǒng)計模式分類問題中,聶曼 -皮爾遜判決準則主要用于(某一種判決錯誤較另一種判決錯誤更為重要)情況;最小最大判決準則主要用于(先驗概率未知的)情況。15、 “特征個數(shù)越多越有利于分類”這種說法正確嗎?(錯誤)。特征選擇的主要目的是(從n個特征中選出最有利于分類的的m個特征(m<r),以降低特征維數(shù))。一般在(可分性判據(jù)對特征個數(shù)具有單調(diào)性)和
5、(Cnm>>n )的條件下,可以使用分支定界法以減少計算量。16、散度Jij越大,說明國i類模式與 類模式的分布(差別越大);當oi類模式與 類模式的分 布相同時,Jij= ( 0 )。17、 已知有限狀態(tài)自動機 Af=(',Q,、,qO, F),、=0,1 ; Q=qO, q1 ;,:、(qO , 0)= q1,(q0, 1)= q1,(q1 ,0)=q0,、(q1,1)=q0 ; q0=q0; F=q0?,F(xiàn)有輸入字符串:(a) 00011101011, (b) 1100110011 , (c) 101100111000, (d)0010011,試問,用 Af對上述字符串
6、進行分類的結果為(3 1:a,d;32:b,c)。18、 影響聚類算法結果的主要因素有(_)。已知類別的樣本質(zhì)量;分類準則;特征選取;模式相似性測度。19、 模式識別中,馬式距離較之于歐式距離的優(yōu)點是(_)。平移不變性;旋轉不變性;尺度不變性;考慮了模式的分布。20、 基于二次準則函數(shù)的H-K算法較之于感知器算法的優(yōu)點是(_)??梢耘袆e問題是否線性可分;其解完全適用于非線性可分的情況;其解的適應性更好;計算量小。21、 影響基本C均值算法的主要因素有( )。樣本輸入順序;模式相似性測度;聚類準則;初始類心的選取。22、 位勢函數(shù)法的積累勢函數(shù)K(x)的作用相當于Bayes判決中的(_)。先驗概
7、率;后驗概率;類概率密度;類概率密度與先驗概率的乘積。23、 在統(tǒng)計模式分類問題中,當先驗概率未知時,可以使用(_)。最小損失準則;最小最大損失準則;最小誤判概率準則;N-P判決。24、在(_)情況下,用分支定界法做特征選擇計算量相對較少。Cnd>>n, (n為原特征個數(shù),d為要選出的特征個數(shù));樣本較多;選用的可分性判據(jù) J對特征 數(shù)目單調(diào)不減;選用的可分性判據(jù)J具有可加性。25、25、26、26、27、27、28、28、29、29、30、30、散度Jd是根據(jù)(_)構造的可分性判據(jù)。先驗概率;后驗概率;類概率密度;信息熵;幾何距離。似然函數(shù)的概型已知且為單峰,則可用(_)估計該似
8、然函數(shù)。矩估計;最大似然估計; Bayes估計;Bayes學習;Parzen窗法。Kn近鄰元法較之Parzen窗法的優(yōu)點是(一_)。所需樣本數(shù)較少;穩(wěn)定性較好;分辨率較高;連續(xù)性較好。從分類的角度講,用 DKLT做特征提取主要利用了 DKLT的性質(zhì):(_)。變換產(chǎn)生的新分量正交或不相關;以部分新的分量表示原矢量均方誤差最?。皇棺儞Q后的矢量能量更趨集中;一般,剪輯k-NN最近鄰方法在(_)的情況下效果較好。樣本數(shù)較大;樣本數(shù)較?。粯颖境蕡F狀分布;樣本呈鏈狀分布。如果以特征向量的相關系數(shù)作為模式相似性測度,則影響聚類算法結果的主要因素有(_)。已知類別樣本質(zhì)量;分類準則;特征選取;量綱。(15分)
9、簡答及證明題(1)影響聚類結果的主要因素有那些?(2)證明馬氏距離是平移不變的、非奇異線性變換不變的。答:(1 )分類準則,模式相似性測度,特征量的選擇,量綱。(2)證明:d2 (耳咼)=(呂-f(x3 - Xy)(2分)(2分)(1分)(8分)說明線性判別函數(shù)的正負和數(shù)值大小在分類中的意義并證明之。(1)(4分)d(R的絕對值卩閃|正比于亍到超平面d(刃=0的距離心式(1-1)的分子為判別函 (寸值,上式表明,國 的值0口丿正比于亍到超平面d(R =。的距離£,一個特征矢量代入判別 舌所得值的絕對值越大表明該特征點距判別界面越遠。(4分)判別函數(shù)值的正負表示出特征點位于哪個半空間中
10、,或者換句話說,表示特征點位于界面的哪一側。四、(12分,每問4分)在目標識別中,假定有農(nóng)田和裝甲車兩種類型,類型*和類型2分別代表農(nóng)田和裝甲車,它們的先驗概率分別為0.8和0.2,損失函數(shù)如表1所示?,F(xiàn)在做了三次試驗,獲得三個樣本的類概率密度如下:0.3 , 0.1 , 0.6P(刃®): 0.7 , 0.8 , 0.3(1)試用貝葉斯最小誤判概率準則判決三個樣本各屬于哪一個類型;(2)假定只考慮前兩種判決,試用貝葉斯最小風險準則判決三個樣本各屬于哪一類;(3)把拒絕判決考慮在內(nèi),重新考核三次試驗的結果。表1判決損失類型X©1®2«1145111P(他
11、).?_3解:由題可知: 必01) = 07屮闖二03, 麗方,方,戶區(qū)丨碼)_ 1 P(西1耳)F(花觀)8,P(巧)(1)( 4分)根據(jù)貝葉斯最小誤判概率準則知:Pg |昭)P臨)戶陽遇)P(碼)P(再|(zhì) q) P(曲)二 G n -1-,則可以任判; 二,則判為二;I匚 7 ,則判為;1;戸(他)(血不)_0.3(51).4(2)(4分)由題可知: P(如臨-血)07(4-1)7戸(可佝)三4 則-.l,判為匚;戶區(qū)丨碼)弋4_,判為二;-1 -,判為 T;(3) (4分)對于兩類問題,對于樣本:,假設已知,有斑丐| X)= 2© |碼)P(碼| X)+ 2(丐|碼)尸(碼|
12、R =_ 昭 I昭)P(x!碼)0©) + 2(吟I碼)F(x I碼)尸(角)%)則對于第一個樣本,R|滬晉公©lx)二箸用隔|滬等豐.1 1' . 1 ,則拒判;R協(xié)|滬鐵曲也二舉應堡|滬豹 . .1.-,則拒判;R0IZ譽I強(對滬就鳳碣IR二第1,拒判。五、1.監(jiān)督學習與非監(jiān)督學習的區(qū)別:監(jiān)督學習方法用來對數(shù)據(jù)實現(xiàn)分類, 分類規(guī)則通過訓練獲得。 該訓練集由帶分類號的數(shù)據(jù)集組成,因此監(jiān)督學習方法的訓練過程是離線的。非監(jiān)督學習方法不需要單獨的離線訓練過程,也沒有帶分類號(標號)的訓練數(shù)據(jù)集,一般用來對數(shù)據(jù)集進行分析,如聚類,確定其分布的主分量等。(實例:道路圖)就
13、道路圖像的分割而言,監(jiān)督學習方法則先在訓練用圖像中獲取道路象素與非道路象素集,進行分類器設計,然后用所設計的分類器對道路圖像進行分割。以實現(xiàn)使用非監(jiān)督學習方法, 則依據(jù)道路路面象素與非道路象素之間的聚類分析進行聚類運算,道路圖像的分割。2. 線性分類器三種最優(yōu)準則:Fisher準則:根據(jù)兩類樣本一般類內(nèi)密集 ,類間分離的特點,尋找線性分類器最佳的法線向 量方向,使兩類樣本在該方向上的投影滿足類內(nèi)盡可能密集,類間盡可能分開。該種度量通過類內(nèi)離散矩陣Sw和類間離散矩陣 Sb實現(xiàn)。感知準則函數(shù):準則函數(shù)以使錯分類樣本到分界面距離之和最小為原則。其優(yōu)點是通過錯分類樣本提供的信息對分類器函數(shù)進行修正,這
14、種準則是人工神經(jīng)元網(wǎng)絡多層感知器的基礎。支持向量機:基本思想是在兩類線性可分條件下,所設計的分類器界面使兩類之間的間隔為最大,它的基本出發(fā)點是使期望泛化風險盡可能小。一、試說明Mahalanobis距離平方的定義,到某點的 Mahalanobis距離平方為常數(shù)的軌跡的幾何 意義,它與歐氏距離的區(qū)別與聯(lián)系。答:Mahalanobis 距離的平方定義為:(“)二(-11)叩(-11)其中x, u為兩個數(shù)據(jù),匚 是一個正定對稱矩陣(一般為協(xié)方差矩陣)。根據(jù)定義,距某一點的Mahalanobis距離相等點的軌跡是超橢球,如果是單位矩陣X, 則Mahalanobis距離就是通常的歐氏距離。二、試說明用監(jiān)
15、督學習與非監(jiān)督學習兩種方法對道路圖像中道路區(qū)域的劃分的基本做法,以說明 這兩種學習方法的定義與它們間的區(qū)別。答:監(jiān)督學習方法用來對數(shù)據(jù)實現(xiàn)分類,分類規(guī)則通過訓練獲得。該訓練集由帶分類號的數(shù)據(jù)集組成,因此監(jiān)督學習方法的訓練過程是離線的。非監(jiān)督學習方法不需要單獨的離線訓練過程,也沒有帶分類號(標號)的訓練數(shù)據(jù)集,一般用來對數(shù)據(jù)集進行分析,如聚類,確定其分布的主分量等。 就道路圖像的分割而言, 監(jiān)督學習方法則先在訓練用圖像中獲取道路象素與非道路象素集,進行分類器設計,然后用所設計的分類器對道路圖像進行分割。使用非監(jiān)督學習方法, 則依據(jù)道路路面象素與非道路象素之間的聚類分析進行聚類運算,以實現(xiàn)道路圖像
16、的分割。三、試述動態(tài)聚類與分級聚類這兩種方法的原理與不同。答:動態(tài)聚類是指對當前聚類通過迭代運算改善聚類;分級聚類則是將樣本個體,按相似度標準合并,隨著相似度要求的降低實現(xiàn)合并。四、試說明以下問題求解是基于監(jiān)督學習或是非監(jiān)督學習:1. 求數(shù)據(jù)集的主分量2.漢字識別3.自組織特征映射4. CT圖像的分割答:1、求數(shù)據(jù)集的主分量是非監(jiān)督學習方法;2、漢字識別對待識別字符加上相應類別號一一有監(jiān)督學習方法;3、自組織特征映射一一將高維數(shù)組按保留近似度向低維映射一一非監(jiān)督學習;4、CT圖像分割一一按數(shù)據(jù)自然分布聚類一一非監(jiān)督學習方法;五、試列舉線性分類器中最著名的三種最佳準則以及它們各自的原理。答:線性
17、分類器三種最優(yōu)準則:Fisher準則:根據(jù)兩類樣本一般類內(nèi)密集 ,類間分離的特點,尋找線性分類器最佳的法線向量方向,使兩類樣本在該方向上的投影滿足類內(nèi)盡可能密集,類間盡可能分開。該種度量通過類內(nèi)離散矩陣Sw和類間離散矩陣Sb實現(xiàn)。感知準則函數(shù):準則函數(shù)以使錯分類樣本到分界面距離之和最小為原則。其優(yōu)點是通過錯分類樣本提供的信息對分類器函數(shù)進行修正,這種準則是人工神經(jīng)元網(wǎng)絡多層感知器的基礎。支持向量機:基本思想是在兩類線性可分條件下,所設計的分類器界面使兩類之間的間隔為最大,它的基本出發(fā)點是使期望泛化風險盡可能小。十、對一副道路圖像,希望把道路部分劃分出來,可以采用以下兩種方法:1. 在該圖像中分
18、別在道路部分與非道路部分畫出一個窗口,把在這兩個窗口中的象素數(shù)據(jù)作為訓練集,用Fisher準則方法求得分類器參數(shù),再用該分類器對整幅圖進行分類。2 將整幅圖的每個象素的屬性記錄在一張數(shù)據(jù)表中,然后用某種方法將這些數(shù)據(jù)按它們的自然分標準文案布狀況劃分成兩類。因此每個象素就分別得到相應的類別號,從而實現(xiàn)了道路圖像的分割。試問以上兩種方法哪一種是監(jiān)督學習,哪個是非監(jiān)督學習?答:第一種方法中標記了兩類樣本的標號,需要人手工干預訓練過程,屬于監(jiān)督學習方法;第二種方法只是依照數(shù)據(jù)的自然分布,把它們劃分成兩類,屬于非監(jiān)督學習方法。十三、試分析五種常用決策規(guī)則思想方法的異同。答、五種常用決策是:1. 基于最小
19、錯誤率的貝葉斯決策,利用概率論中的貝葉斯公式,得出使得錯誤率最小的分類規(guī)則。2. 基于最小風險的貝葉斯決策,引入了損失函數(shù),得出使決策風險最小的分類。當在0 1損失函數(shù)條件下,基于最小風險的貝葉斯決策變成基于最小錯誤率的貝葉斯決策。3. 在限定一類錯誤率條件下使另一類錯誤率最小的兩類別決策。4. 最大最小決策:類先驗概率未知,考察先驗概率變化對錯誤率的影響,找出使最小貝葉斯奉獻 最大的先驗概率,以這種最壞情況設計分類器。5. 序貫分類方法,除了考慮分類造成的損失外,還考慮特征獲取造成的代價,先用一部分特征分類,然后逐步加入性特征以減少分類損失,同時平衡總的損失,以求得最有效益。十四、假設在某個
20、地區(qū)細胞識別中正常( w)和異常(wO兩類先驗概率分別為 P(wi)=0.9 , P(W2)=0.1 , 現(xiàn)有一待識別的細胞,其觀察值為x,從類條件概率密度分布曲線上查得P(x wj =0.2 ,P(x.w2) =0.4,并且已知 5 =0,,12 = 6, 21 =1 ,,22 = 0試對該細胞x用一下兩種方法進行分類:1.基于最小錯誤率的貝葉斯決策;2.基于最小風險的貝葉斯決策;請分析兩種結果的異同及原因。解:利用貝葉斯公式分別計算出3及呼的后驗槪率*81 K0,2X0, 9 + 0. 4X0- 1I、 心心尸仙)0.2X0. 9P(氣扒畑182根據(jù)貝葉斯決策規(guī)則式(花2人有PS Jt)-
21、0818>P(<Wilx) = 0U82 所以合理的決聶是把斗歸類于正常狀態(tài)。牌:已知條件為(x|w1)=O- 3,31= 11尸伽=0” 1 p(x |馬)=O 4 人 ij £根攜1紂訃篁結果可知后臉概率為 叫|"=仏兀=0P(ws|jt)=0r 162再計算出無件風險t£<«1 |x)=另丄if (叫|幻=九戸他|寓L 032>-iRS: x = 1 尸(個1 |工)=)» 81R由于RUix)>RU-x)即決策為砂的條種鳳險小于抉策為卿的條件鳳險,因此我們釆取決策行動歟,即判斷待識 別的細胞工為氣類一異常細
22、胞,將1與2柑對比,其分類給果IE好相反,這是因為這里影響決策結果的因索又多了一孑- 即-損失舄而且繭類錯像決策所造成的損失相差很懸殊因此“損失'就起了主導作用.十五、有線性判別函數(shù),為什么還要引進非線性判別函數(shù)?分析由“線性判別函數(shù)”向“非線性判別函數(shù)”推廣的思想和方法。答:實際中有很多模式識別問題并不是線性可分的,這時就需要采用非線性分類器, 比如當兩類樣本分不具有多峰性質(zhì)并互相交錯時, 簡單的線性判別函數(shù)往往會帶來較大的分類錯誤。這時,樹分類器作為一種分段線性分類器,常常能有效地應用于這種情況。十六、1.什么是特征選擇? 2.什么是Fisher線性判別?答:1.特征選擇就是從一組
23、特征中挑選出一些最有效的特征以達到降低特征空間維數(shù)的目的。2. Fisher線性判別:可以考慮把 d維空間的樣本投影到一條直線上,形成一維空間,即把維數(shù)壓縮到一維,這在數(shù)學上容易辦到,然而,即使樣本在d維空間里形成若干緊湊的互相分得開的集群,如果把它們投影到一條任意的直線上,也可能使得幾類樣本混在一起而變得無法識別。但是在一般情況下,總可以找到某個方向,使得在這個方向的直線上,樣本的投影能分開得最好。問題是如何根據(jù)實際情況 找到這條最好的、最易于分類的投影線,這就是Fisher算法所要解決的基本問題。十七、寫出兩類和多類情況下最小風險貝葉斯決策判別函數(shù)和決策面方程。兩類別問題:判別函數(shù)gi(x) = A11p(w1|x) + A12p(w2|x) gzfe) = AtpCoJilx) + A22p(c
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 兼職人員勞務合同協(xié)議
- 購物中心、商場商鋪租賃合同
- 臨時勞動合同書樣本
- 烏魯木齊買賣合同范本
- 個人借款購房合同范本
- 中藥材購銷合作合同版模板
- 個人與公司租車合同協(xié)議書示例
- 京石高速改擴建臨時用地租賃合同
- 個人分期還款合同模板版
- 產(chǎn)品分銷合作框架合同2025
- 2025江蘇南京市金陵飯店股份限公司招聘高頻重點提升(共500題)附帶答案詳解
- 公共政策分析 課件匯 陳振明 第0-9章 導論、緒論:政策科學的“研究綱領”- 政策監(jiān)控
- 2025年牛津譯林版英語七年級下冊全冊單元重點知識點與語法匯編
- 《小學作文指導》課件
- 小學六年級數(shù)學方程應用題100道及答案解析
- 2025新譯林版英語七年級下單詞表
- 海洋工程設備保溫保冷方案
- 梅毒的診斷與治療課件
- 工程倫理第二講工程中的風險、安全與責任課件
- 高中數(shù)學《橢圓》方程典型例題20例(含標準答案)
- 中山大學孫逸仙紀念醫(yī)院醫(yī)用耗材試用登記表【模板】
評論
0/150
提交評論