模式識(shí)別報(bào)告_第1頁(yè)
模式識(shí)別報(bào)告_第2頁(yè)
模式識(shí)別報(bào)告_第3頁(yè)
模式識(shí)別報(bào)告_第4頁(yè)
模式識(shí)別報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一、模式識(shí)別概論在信息的處理過(guò)程中,首先需要解決的就是信息的分類問(wèn)題。按 “物以類聚”的自然規(guī)律,將大容量的信息分門別類,各種類別的信 息分別歸集在一起,然后找出它們內(nèi)部的規(guī)律,以及它們相互之間的 規(guī)律,然后按規(guī)律建立模型,進(jìn)行生產(chǎn)過(guò)程的操作和控制,這樣才能 達(dá)到事半功倍的效果。對(duì)具體的個(gè)別事物進(jìn)行觀測(cè)所得到的具有時(shí)間和空間分布的信 息稱為模式,而把模式所屬的類別或同一類中模式的總體稱為模式類。 人們?yōu)榱苏莆湛陀^事物,按事物相似的程度組成類別。模式識(shí)別的作 用和目的就在于對(duì)某一具體事物時(shí)將其準(zhǔn)確地歸入某一類別。模式識(shí) 別系統(tǒng)都由兩個(gè)過(guò)程所組成,即設(shè)計(jì)和實(shí)現(xiàn)。設(shè)計(jì)是指用一定數(shù)量的 樣本進(jìn)行分類器

2、的設(shè)計(jì)。實(shí)現(xiàn)是指用所設(shè)計(jì)的分類器對(duì)待識(shí)別的樣本 進(jìn)行分類決策。模式識(shí)別系統(tǒng)主要由4個(gè)部分組成:數(shù)據(jù)獲取,預(yù)處 理,特征提取和選擇,分類決策。分類決策就是在特征空間中用統(tǒng)計(jì)方法把被識(shí)別對(duì)象歸為某一 類別?;咀鞣ㄊ窃跇颖居?xùn)練集基礎(chǔ)上確定某個(gè)判決規(guī)則,使按這種 判決規(guī)則對(duì)被識(shí)別對(duì)象進(jìn)行分類所造成的錯(cuò)誤識(shí)別率最小或引起的 損失最小。二、模式識(shí)別的方法模式分類是模式識(shí)別的主要內(nèi)容,即將某個(gè)模式分到某個(gè)模式類中。在這個(gè)過(guò)程中首先需要建立樣本庫(kù),然后根據(jù)樣本庫(kù)建立判別函 數(shù),這一過(guò)程由機(jī)器來(lái)實(shí)現(xiàn),成為學(xué)習(xí)過(guò)程。然后對(duì)一個(gè)未知的新對(duì) 象分析它的特征,并根據(jù)判別函數(shù)決定它屬于哪一類。模式分類是一 種監(jiān)督學(xué)習(xí)的

3、方法??捎糜谀J椒诸惖姆椒ㄓ泻芏啵?jīng)典的方法有:統(tǒng)計(jì)模式識(shí)別統(tǒng)計(jì)模式識(shí)別方法是受數(shù)學(xué)中的決策理論啟發(fā)而產(chǎn)生的一種識(shí) 別方法。其基本思想是將特征提取階段得到的特征向量定義在一個(gè)特 征空間中,這個(gè)空間包含了所有的特征矢量。不同的特征向量,或者 說(shuō)不同類別的對(duì)象,都對(duì)應(yīng)于此空間中的一點(diǎn)。在分類階段,則利用 統(tǒng)計(jì)決策的原理對(duì)特征空間進(jìn)行劃分,從而達(dá)到識(shí)別不同特征對(duì)象的 目的。統(tǒng)計(jì)識(shí)別中應(yīng)用的統(tǒng)計(jì)決策分類理論相對(duì)比較成熟,研究的重 點(diǎn)是特征提取。這類方法中常用的方法有貝葉斯分類、線性分類、非 線性分類和聚類分析。這類方法的優(yōu)點(diǎn)是比較成熟,能考慮干擾噪聲等影響,識(shí)別模式 基元能力強(qiáng)。但是該方法對(duì)結(jié)構(gòu)復(fù)雜的

4、模式抽取特征困難,不能反映 模式的結(jié)構(gòu)特征,難以描述結(jié)構(gòu)的性質(zhì)。難以從整體角度考慮識(shí)別問(wèn) 題。句法結(jié)構(gòu)模式識(shí)別句法識(shí)別是對(duì)統(tǒng)計(jì)識(shí)別方法的補(bǔ)充。統(tǒng)計(jì)方法用數(shù)值來(lái)描述圖像 的特征,句法方法則是用符號(hào)來(lái)描述圖像特征的。它模仿了語(yǔ)言學(xué) 中句法的層次結(jié)構(gòu),采用分層描述的方法,把復(fù)雜圖像分解為單層 或多層的簡(jiǎn)單子圖像,主要突出了識(shí)別對(duì)象的結(jié)構(gòu)信息。圖像識(shí)別是 從統(tǒng)計(jì)方法發(fā)展起來(lái)的,而句法方法擴(kuò)大了識(shí)別的能力,使其不僅 限于對(duì)象物的分類,而且還用于景物的分析與物體結(jié)構(gòu)的識(shí)別。這類 方法中常用的方法有自動(dòng)機(jī)技術(shù)、CYK剖析算法、Early算法和轉(zhuǎn)移圖 法。該類方法識(shí)別方便,可以從簡(jiǎn)單的基元開(kāi)始,由簡(jiǎn)至繁。能反

5、映 模式的結(jié)構(gòu)特征,能描述模式的性質(zhì)。對(duì)圖形的畸變抗干擾能力較強(qiáng)。 但是該方法當(dāng)存在干擾和噪聲時(shí),抽取特征基元困難,且易失誤。模糊模式識(shí)別模糊模式識(shí)別的理論基礎(chǔ)是模糊數(shù)學(xué)。它根據(jù)人辨識(shí)事物的思維 邏輯,吸取人腦的識(shí)別特點(diǎn),將計(jì)算機(jī)中常用的二值邏輯轉(zhuǎn)向連續(xù)邏 輯。模糊識(shí)別的結(jié)果是用被識(shí)別對(duì)象隸屬于某一類別的程度即隸屬度 來(lái)表示的,一個(gè)對(duì)象可以在某種程度上屬于某一類別,而在另一種程 度上屬于另一類別。一般常規(guī)識(shí)別方法則要求一個(gè)對(duì)象只能屬于某一 類別?;谀:碚摰淖R(shí)別方法有:最大隸屬原則識(shí)別法、擇近原 則識(shí)別法和模糊聚類法。該方法由于隸屬度函數(shù)作為樣本與模板間相似程度的度量,能反 映整體的與主體

6、的特征,從而允許樣本有相當(dāng)程度的干擾與畸變。但 是該方法準(zhǔn)確合理的隸屬度函數(shù)往往難以建立,故限制了它的應(yīng)用。(1)貝葉斯分類貝葉斯判別的核心問(wèn)題是:樣本為特征向量X時(shí),它屬于哪一類 可能性有多大。如能確定屬于各個(gè)類別的百分比(概率),分類決策就 有了依據(jù)。貝葉斯分類有最大后驗(yàn)概率判決準(zhǔn)則和最小風(fēng)險(xiǎn)貝葉斯判 決準(zhǔn)則。最大后驗(yàn)概率判決準(zhǔn)則如果P(31|x)P(32|x),則判決X屬于3 1;如果P(1|x)P(2|x),則判決X屬于32;如果P(31|x)二P(32|x),則判決x屬于31或?qū)儆?/這種決策稱為最大后驗(yàn)概率判決準(zhǔn)則,也稱為貝葉斯(Bayes)判 決準(zhǔn)則。假設(shè)已知P(3j)和p(x|

7、3(i=1, 2,,m),最大后驗(yàn)概 率判決準(zhǔn)則就是把樣本x歸入后驗(yàn)概率最大的類別中,也就是P( I x) = max P(w I x)jie1,2,m則 xE3.。由于已知P(i )和p(x|3因此需要找到P(3x )與它們之間 的關(guān)系。假設(shè)特征變量為X,由Bayes公式p (x I )P 皿)iip (x)若 p(x I )P0 ) = max p(xI )P( ),則 xE3 ;J Jie1,2, m在最大后驗(yàn)概率判決準(zhǔn)則中,xE3.的決策區(qū)域?yàn)?x I 心)也,i = 1,2,.,m,i 豐 j p (x I 巴)P ( ?J最大后驗(yàn)概率判決準(zhǔn)則的一個(gè)優(yōu)良性質(zhì)就是使平均錯(cuò)誤概率達(dá)到 最

8、小。因此,最大后驗(yàn)概率判決準(zhǔn)則又稱為最小錯(cuò)誤概率判決準(zhǔn)則。最小風(fēng)險(xiǎn)貝葉斯判決準(zhǔn)則基于最小風(fēng)險(xiǎn)的貝葉斯決策的基本思路是給每一種決策規(guī)定一 個(gè)損失值(或代價(jià)),將其作為因錯(cuò)誤決策而導(dǎo)致的損失的度量。決策ai:將樣本x的類別判為第j類。損失函數(shù)X(aj,wi):對(duì)真實(shí)類別為第i類的樣本采取決策氣 所帶來(lái)的損失。條件風(fēng)險(xiǎn)當(dāng)樣本x的真實(shí)類別未知時(shí),決策*的條件風(fēng)險(xiǎn)是對(duì)x為所有可 能的真實(shí)類別條件下將樣本判為第j類的代價(jià)求平均,即R (a I x) = 人(a 0 ) P 皿 I x)i=1最小風(fēng)險(xiǎn)貝葉斯判決準(zhǔn)則:R (a I x) = min R (a I x)則判決xGw,其中r(a Ix) = 人(

9、a ,)P(Ix)。Ji=1J線性分類線性判別函數(shù)的形式如下:g (x) = wT x + w0即 g (x) = w T x + w = wx + w X HF w X + W = 0。 其中 w = (w , w,w )t ,0112 2d d 012dx =(氣,., Xd)T。其幾何意義為d維歐幾里德空間中的一個(gè)超平面。線性分類器設(shè)計(jì)的關(guān)鍵在于確定權(quán)向量w和閾值權(quán)w0。對(duì)于兩類分類問(wèn)題,線性判決函數(shù)的幾何意義在于利用一個(gè)超平面實(shí)現(xiàn)對(duì)特征空間Rd的劃分。即w t (x - x ) = 0其中w指向R1, R1中的點(diǎn)在H的正側(cè)。R2中的點(diǎn)在H的負(fù)側(cè)。如下圖所示:R1,- w . X1-x2

10、 /R2匕一一OH:g(x)=0超平面示意圖g(x)是x到超平面距離的一種代數(shù)距離。該距離有符號(hào),當(dāng)符號(hào) 為正時(shí),表明x對(duì)應(yīng)的點(diǎn)在超平面的正側(cè),反之在負(fù)側(cè)。對(duì)于多類分類問(wèn)題,利用線性判別函數(shù)設(shè)計(jì)多類分類器??梢园?n個(gè)類問(wèn)題化簡(jiǎn)為n-1個(gè)問(wèn)題,其中第i個(gè)問(wèn)題可以用線性判別函數(shù) 把屬于七類的點(diǎn)與不屬于wi的點(diǎn)區(qū)分。最麻煩的方法是用c (c-1) /2個(gè)線性判別函數(shù)把樣本分為c個(gè)類別,每個(gè)判別函數(shù)只針對(duì)兩個(gè) 類進(jìn)行分類。定義c個(gè)判別函數(shù)g (x) = WTX + w如果對(duì)于一切j。i,存在g,(X) gj(x),則把x歸于Wi類。如果 g, (X) = gj (X)則拒絕決策。線性判別函數(shù)設(shè)計(jì)的一

11、般步驟:選擇樣本集z=x1,x2,,xN。樣本集中的樣本來(lái)自兩類且類 別已知。確定一個(gè)準(zhǔn)則函數(shù)J,要求滿足以下兩個(gè)條件:J是樣本集、w和w的函數(shù);J的值反映分類器性能,它的極值對(duì)應(yīng)于“最好”的決策。用最優(yōu)化技術(shù)求解準(zhǔn)則函數(shù),得到極值點(diǎn)對(duì)應(yīng)的w*和w*。常見(jiàn)的線性判斷準(zhǔn)則有最小距離判別,歐幾里德線性判別,馬氏 距離線性判別,F(xiàn)isher線性判別。Fisher線性判別Fisher線性判決的基本思想是尋找一個(gè)最好的投影方向,當(dāng)特征 向量x從d維空間映射到這個(gè)方向上時(shí),兩類能最好地分開(kāi)。即向量 W的方向選擇應(yīng)能使兩類樣本投影的均值之差盡可能大些,而使類內(nèi) 樣本的離散程度盡可能小。這就是Fisher準(zhǔn)則

12、函數(shù)的基本思路。尋 找最好的投影方向,在數(shù)學(xué)上就表現(xiàn)為尋找最好的變換方向w*。Fisher線性判決函數(shù)為J(w)=(PP )2S1 + 52分子反映了映射后兩類中心的距離平方,該值越大,類間可分性越 好;分母反映了兩類的類內(nèi)離散度,其值越小越好;從總體上來(lái)講,JF(w)的值越大越好。在這種可分性評(píng)價(jià)標(biāo)準(zhǔn)下,使JF(w)達(dá)到最大值 的w即為最佳投影方向。將J (w)化成w的顯示格式,故Fisher線性判決函數(shù)化為Fw t S wJ (w) =bFwtS ww求J(w)的極大值點(diǎn)Fw * = S-1(汽p 2)利用w*,將樣本x往該方向上投影,可得y = (w *)t x在投影空間內(nèi)的決策準(zhǔn)則為:

13、若yy0,則xE3,否則xe o20歐幾里德線性判別任意特征向量x和一個(gè)代表點(diǎn)之間的歐幾里德平方距離可以用 下面的公式描述d2(x) =11 x- m 11= (x- m )(x- m ) = xv - m x- xm + m mkkkkkk k k選擇d2( x )使得最小化的類wk也就是mk將包含mk的項(xiàng)放到一起我們 得到d2(x) = -2(m x一 0.5m m ) + xx假設(shè)類別數(shù)c=2,那么類之間對(duì)應(yīng)的決策邊界為d2(x) = d2(x)即12mx 一 0.5 II m II2 = m x 一 0.5 II m II2n (m 一 m )x 一 0.5(m + m ) = 011

14、221212最后得到一個(gè)關(guān)于x的線性等式它表示了一個(gè)垂直于(m1 -m2)并且 通過(guò)均值點(diǎn)的中心點(diǎn)0.5(m1 + m的超平面。它是一個(gè)劃分W1和的的線性 判別。馬氏距離線性判別馬氏距離是歐幾里德距離尺度的一個(gè)推廣它非常適合于解決協(xié)方 差不相等以及特征之間相互聯(lián)系的情況假設(shè)所有的類別具有一個(gè)相 同的協(xié)方差矩陣C這表明各類特征向量的分布就有一個(gè)相似的超橢圓 形狀,根據(jù)歐幾里德平方距離得d2(x) = (x一m )C-1(x一m )再次根據(jù)mk進(jìn)行合并,得到d2(x) = -2(CTm )x - 0.5m CTm + xCtx 決策函數(shù)為:g (x) = W x + w其中, w = C-im ;

15、 w = -0.5m C-im得到一個(gè)超平面形式的線性判別函數(shù)它通過(guò)連接均值點(diǎn)線段的中 點(diǎn)和前面一節(jié)得到的結(jié)果的唯一不同就是如今劃分類W|和類Wj的超 平面是和向量C-i(m -m )相互正交。(3)非線性分類線性分類器的分界面是一個(gè)超平面。當(dāng)類與類之間不能用任何 一個(gè)超平面實(shí)現(xiàn)劃分時(shí),類間的分界面應(yīng)是一個(gè)超曲面??紤]到曲線 可以由多個(gè)線段近似表達(dá),曲面可以由多個(gè)平面逼近,因此,也可以 用多個(gè)超平面近似表達(dá)超曲面,分段線性分類器正是基于這種思路而 設(shè)計(jì)的一種分類器。分段線性距離分類器中最小距離分類器,其判決函數(shù)為llx 叩2 llx V2 = x :1I 2即 |x - vjl2 -| |x

16、- V J|2 0 n x -:1,這時(shí)類間的決策面為I 2|x V2 = I|x V 21|2它是兩類均值點(diǎn)連線的垂直平分面。H1H2兩類非線性可分時(shí)可用多段超平面分開(kāi)(4)神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是由大量的人工神經(jīng)元廣泛互連而成的網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò) 信息處理包括學(xué)習(xí)和執(zhí)行兩個(gè)階段。學(xué)習(xí)階段也稱為訓(xùn)練階段:給定訓(xùn)練樣本集,按一定的學(xué)習(xí) 規(guī)則調(diào)整權(quán)系數(shù),使某種代價(jià)函數(shù)達(dá)到最小,也就是使權(quán)系數(shù)收斂 到最優(yōu)值。執(zhí)行階段:利用學(xué)習(xí)階段得到的連接權(quán)系數(shù),對(duì)輸入信息進(jìn)行 處理,并產(chǎn)生相應(yīng)的輸出。BP網(wǎng)絡(luò)是采用誤差反向傳播算法的多層前饋網(wǎng)絡(luò)其學(xué)習(xí)規(guī)則采 用梯度下降算法。在網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中,把輸出層節(jié)點(diǎn)的期望輸出(目標(biāo)

17、輸出)與實(shí)際輸出(計(jì)算輸出)的均方誤差,逐層向輸入層反向傳播,分 配給各連接節(jié)點(diǎn),并計(jì)算出各連接節(jié)點(diǎn)的參考誤差,在此基礎(chǔ)上調(diào)整 各連接權(quán)值,使得網(wǎng)絡(luò)的期望輸出與實(shí)際輸出的均方誤差達(dá)到最小。逐個(gè)處理的BP算法訓(xùn)練步驟如下:初始化。根據(jù)實(shí)際問(wèn)題,設(shè)計(jì)網(wǎng)絡(luò)連接結(jié)。輸入一個(gè)樣本,用現(xiàn)有的權(quán)值計(jì)算網(wǎng)絡(luò)中各神經(jīng)元的實(shí)際輸出。U E 弋 E)計(jì)算局部誤差(i)pk(i=1,2,,l, l+1),l為隱含層的個(gè)數(shù)。計(jì)算權(quán)值變化量A W(i)(i=1,2,,l,l+1),并更新相應(yīng)的權(quán)值。P,k輸入另一樣本,轉(zhuǎn)步驟。把訓(xùn)練集中所有樣本都加到網(wǎng)絡(luò)上, 直到網(wǎng)絡(luò)收斂且均方誤差小于給定的閾值訓(xùn)練結(jié)束。此時(shí),固定權(quán)值,

18、 網(wǎng)絡(luò)就構(gòu)成了一個(gè)模式分類器。三、應(yīng)用實(shí)例以車牌識(shí)別為例,說(shuō)明模式識(shí)別的應(yīng)用。車牌的識(shí)別的過(guò)程如下圖所示:時(shí)集玦實(shí)果橫字像數(shù)用車牌分判特征提取數(shù)據(jù)傳送常見(jiàn)的車牌拍攝圖如下所示:該車尸口所在省的簡(jiǎn)和 車牌超過(guò)了藪字的容量國(guó)為福建璀用字毋表示I字狩 使用 白色英文字母中的I和O一般避而不用,以免和數(shù)字中的1和0混淆。車牌大小為440*140mm。漢字字體為黑體,數(shù)字和字母字體為國(guó)家公 安部門開(kāi)發(fā)的特殊字體。車牌識(shí)別預(yù)處理字符分割2.字符細(xì)化特征空間向量的選擇由于車牌中字母和數(shù)字都有特定的字體,且作為汽車的“身份證”,車牌制作過(guò)程嚴(yán)謹(jǐn),相同字符形態(tài)區(qū)別不大,他們的差異性和共同點(diǎn)都很明顯?;谏瞎?jié)描述

19、的設(shè)計(jì)準(zhǔn)則,綜合考慮了提取特征的 編程復(fù)雜度和特征對(duì)不同字符的區(qū)分度,本系統(tǒng)分別從字符的形態(tài)、 結(jié)構(gòu)、筆畫特點(diǎn)出發(fā),采用了 4個(gè)類別共10個(gè)特征值作為判斷的矢 量依據(jù)(特征提取時(shí)均以細(xì)化后圖像為基礎(chǔ))。字符的重心判斷:字符重心位于上方/下方,分別計(jì)算字符上下半?yún)^(qū)的像素?cái)?shù)目, 如果其差值在一個(gè)固定的小范圍內(nèi)(試驗(yàn)得出此差值在0-20像素內(nèi) 為最佳),則該特征值記為2,上方偏多記為1,下方偏多記為3;字符重心位于左方/右方,分別計(jì)算字符左右半?yún)^(qū)的像素?cái)?shù)目, 如果其差值在一個(gè)固定的小范圍內(nèi)(試驗(yàn)得出此差值在0-20像素內(nèi) 為最佳),則該特征值記為2,左方偏多記為1,右方偏多記為3。特定位置的掃描線特征:圖像垂直1/3處掃描線穿越的線條數(shù)目;圖像垂直1/2處掃描線穿越的線條數(shù)目;圖像垂直2/3處掃描線穿越的線條數(shù)目;圖像水平1/3處掃描線穿越的線條數(shù)目;圖像水平2/3處掃描線穿越的線條數(shù)目;筆畫特征:字符中“豎”的數(shù)目,計(jì)算圖像在水平方向上的投影,投影點(diǎn) 的像素?cái)?shù)目累加值超過(guò)1/3圖像高度且無(wú)超過(guò)5像素的中斷,記為 “豎”的數(shù)目加1;字符中“橫”的數(shù)目,計(jì)算圖像在垂直方向上的投影,投影點(diǎn) 的像素?cái)?shù)目累加值超過(guò)1/3圖像寬度且

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論