




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、現(xiàn)代模式識(shí)別是在 20 世紀(jì) 40 年代電子計(jì)算機(jī)發(fā)明以后逐漸發(fā)展起來(lái)的。 在更早的時(shí)候,已有用光學(xué)和機(jī)械手段實(shí)現(xiàn)模式識(shí)別的例子,如在 1929 年 GustavTauschek 就在德國(guó)獲得了光學(xué)字符識(shí)別專利。作為統(tǒng)計(jì)模式識(shí)別基礎(chǔ)的多元統(tǒng)計(jì)分析和鑒別分析也在電子計(jì)算機(jī)出現(xiàn)之前提出來(lái)了。1957 年 IBM 的 C.K.Chow 將統(tǒng)計(jì)決策方法用于字符識(shí)別。然而,“模式識(shí)別”這個(gè)詞被廣泛使用并形成一個(gè)領(lǐng)域是在 20 世紀(jì) 60 年代以后。模式識(shí)別問(wèn)題指的是對(duì)一系列過(guò)程或事件的分類與描述,具有某些相類似的性質(zhì)的過(guò)程或事件就分為一類。目前模式識(shí)別問(wèn)題一般可以應(yīng)用以下 4 種方法進(jìn)行分析處理:統(tǒng)計(jì)模
2、式識(shí)別方法、句法模式識(shí)別、人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別、模糊模式識(shí)別。模式識(shí)別已經(jīng)在天氣預(yù)報(bào)、衛(wèi)星航空?qǐng)D片解釋、工業(yè)產(chǎn)品檢測(cè)、字符識(shí)別、語(yǔ)音識(shí)別、指紋識(shí)別、醫(yī)學(xué)圖像分析等許多方面得到了成功的應(yīng)用。所有這些應(yīng)用都是和問(wèn)題的性質(zhì)密切不可分的,至今還沒(méi)有發(fā)展成統(tǒng)一的、有效的可應(yīng)用于所有的模式識(shí)別的理論。當(dāng)前的一種普遍看法是不存在對(duì)所有的模式識(shí)別問(wèn)題都使用的單一模型和解決識(shí)別問(wèn)題的單一技術(shù),我們現(xiàn)在擁有的是一個(gè)工具袋,我們所要做的是結(jié)合具體問(wèn)題把統(tǒng)計(jì)的和句法(結(jié)構(gòu))的識(shí)別方法結(jié)合起來(lái),把統(tǒng)計(jì)模式識(shí)別或句法模式識(shí)別與人工智能中的啟發(fā)式搜索結(jié)合起來(lái),把人工神經(jīng)元網(wǎng)絡(luò)與各種以有技術(shù)以及人工智能中的專家系統(tǒng),不確定方
3、法結(jié)合起來(lái),深入掌握各種工具的效能和應(yīng)用的可能性,互相取長(zhǎng)補(bǔ)短,開(kāi)創(chuàng)模式識(shí)別應(yīng)用的新局面。2.3圖像模式識(shí)別2.3.1圖像模式識(shí)別的基本概念圖像在人類的感知中扮演著非常重要的角色,人類隨時(shí)隨處都要接觸圖像。據(jù)統(tǒng)計(jì),在人類接受的信息中,視覺(jué)信息占了 70%以上,也就是常說(shuō)的“百聞不如一見(jiàn)” 。在許多場(chǎng)合,圖像所傳遞的信息比其他任何形式的信息更加豐富和真切。隨著數(shù)字圖像技術(shù)的發(fā)展和實(shí)際應(yīng)用的需要,出現(xiàn)了另一類問(wèn)題,就是不要求其結(jié)果輸出是一幅完整的圖像,而是將經(jīng)過(guò)圖像處理后的圖像,再經(jīng)過(guò)分割和描述提取有效的特征,進(jìn)而加以判決分類,這就是近 20 年來(lái)發(fā)展起來(lái)的一門新興技術(shù)科學(xué)圖像識(shí)別。它以研究某些對(duì)
4、象或過(guò)程的分類與描述為主要內(nèi)容,以研制能夠自動(dòng)處理某些信息的機(jī)器視覺(jué)系統(tǒng),代替?zhèn)鹘y(tǒng)的人工完成分類和辨識(shí)的任務(wù)為目的。例如要從遙感圖像中分割出各種農(nóng)作物、森林資源和礦產(chǎn)資源等;根據(jù)醫(yī)學(xué)圖片分析發(fā)生病變的細(xì)胞形狀和顏色判斷是否發(fā)生癌變;從氣象觀測(cè)數(shù)據(jù)或氣象衛(wèi)星照片準(zhǔn)確預(yù)報(bào)天氣;交通管理系統(tǒng)中應(yīng)用車牌自動(dòng)識(shí)別技術(shù)管理車輛等。因此,在當(dāng)今社會(huì),圖像識(shí)別技術(shù)已經(jīng)在各個(gè)領(lǐng)域發(fā)揮著極其重要的作用。圖像識(shí)別,簡(jiǎn)單地說(shuō),就是要把一種研究對(duì)象,根據(jù)其某些特征進(jìn)行識(shí)別并分類。例如要識(shí)別寫在卡片上的數(shù)字,判斷它是 0,1,2,9 中的哪個(gè)數(shù)字,就是將數(shù)字圖像分成 10 類的問(wèn)題,因此可以認(rèn)為,對(duì)數(shù)字圖像進(jìn)行區(qū)別分類其
5、實(shí)質(zhì)就是對(duì)圖像進(jìn)行模式識(shí)別。這種識(shí)別早已存在人們的生活實(shí)踐中。然而,隨著實(shí)踐活動(dòng)的擴(kuò)大、深入和社會(huì)化的需要,人們不僅需要識(shí)別分類數(shù)很多的事物,而且被識(shí)別的對(duì)象內(nèi)容也越來(lái)越復(fù)雜。特別是由于科學(xué)技術(shù)水平的提高,使得各種不同的研究對(duì)象“圖像化”或“數(shù)字化” ,可采用某種技術(shù)把考察的對(duì)象轉(zhuǎn)換成圖片、波形圖以及若干數(shù)據(jù),這些數(shù)據(jù)就可以代表所研究的對(duì)象。但是對(duì)于模式識(shí)別來(lái)說(shuō),無(wú)論是數(shù)據(jù)、信號(hào)還是平面圖像或立體景物都是除掉它們的物理內(nèi)容而找出它們的共性,把具有同一共性的歸為一類,而具有另一種共性者歸為另一類。圖像模式識(shí)別是用機(jī)器對(duì)文字、 圖像、 圖片和景物等模式信息加以處理和識(shí)別,用以解決計(jì)算機(jī)與外部環(huán)境直
6、接通信這一重要問(wèn)題。其目的就是研制采用某種儀器或設(shè)備,自動(dòng)處理某些信息,代替人完成分類和辨識(shí)的任務(wù),并且能夠快速而準(zhǔn)確地進(jìn)行圖形識(shí)別。一般來(lái)說(shuō),一個(gè)圖像識(shí)別由圖像預(yù)處理、圖像特征提取和圖像模式分類三個(gè)主要部分組成。前期處理一般是指把圖像進(jìn)行平滑、增強(qiáng)、恢復(fù)、邊緣檢測(cè)和分割等操作,其目的是把輸入圖像簡(jiǎn)化為分段模式。特征提取是指在滿足分類識(shí)別正確率要求的條件下,提取圖像的主要特征,并按某種準(zhǔn)則盡量選用對(duì)正確分類識(shí)別作用大得特征,使得用較少的特征就能完成分類識(shí)別任務(wù)。圖像模式分類是最重要的一部分,它是依據(jù)所提取的特征,將前一部分的特征向量空間映射到類型空間,把相應(yīng)圖像歸屬已知的一類模式。2.3.2圖
7、像模式識(shí)別的基本方法一個(gè)圖像識(shí)別系統(tǒng)主要由三個(gè)環(huán)節(jié)組成: 圖像數(shù)據(jù)獲取, 數(shù)據(jù)加工和處理、 抽取特征,判斷分類等,如圖 2-2 所示。圖 2-2 圖像識(shí)別系統(tǒng)框圖下面簡(jiǎn)單對(duì)這幾個(gè)環(huán)節(jié)作以說(shuō)明:1、數(shù)據(jù)獲取 來(lái)自現(xiàn)實(shí)的模擬數(shù)據(jù),如圖片、照片、圖像和景物等由一個(gè)傳感器(如掃描儀、傳真機(jī)、數(shù)字?jǐn)z像機(jī)、數(shù)碼相機(jī))傳入,然后被轉(zhuǎn)換成適合計(jì)算機(jī)處理的形式,即將物理量變成一組測(cè)量值。2、 數(shù)據(jù)處理 數(shù)據(jù)處理包括預(yù)處理、 特征抽象和特征選擇。 預(yù)處理技術(shù)包括各種圖像處理技術(shù),其目的是改善圖像質(zhì)量,清楚圖像中的噪聲,減輕或消除因傳感器與傳輸介質(zhì)本身不完善而引起的退化現(xiàn)象,便于機(jī)器分析處理等。特征抽取就是從圖像中
8、提取一組反映圖像特性的基本元素或數(shù)字值。特征選擇則是從已經(jīng)抽取的特征中選擇能夠更好地完成分類識(shí)別任務(wù)的特征來(lái)表示原圖像。3、 判別分類 判別分類就是采用一定的準(zhǔn)則或機(jī)制建立分類規(guī)則, 并用它們對(duì)未知圖像模式進(jìn)行分類識(shí)別。用于解決圖像識(shí)別的方法概括起來(lái)可分為統(tǒng)計(jì)模式識(shí)別、 結(jié)構(gòu)模式識(shí)別、模糊圖像識(shí)別和智能模式識(shí)別 (主要是人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別) 4 類, 前兩類方法有久遠(yuǎn)的歷史,發(fā)展較為成熟,對(duì)解決相應(yīng)領(lǐng)域中的模式識(shí)別問(wèn)題均有明顯的效果,是模式識(shí)別分類的經(jīng)典與基礎(chǔ)性技術(shù)。 20 世紀(jì) 80 年代新興的人工神經(jīng)網(wǎng)絡(luò),作以一種廣義的智能模式識(shí)別法,更以嶄新的姿態(tài),以其全局相關(guān)的特色,在模式識(shí)別領(lǐng)域取
9、得了許多傳統(tǒng)方法所難達(dá)到的成就,下面分別作以介紹:1、統(tǒng)計(jì)圖像識(shí)別:統(tǒng)計(jì)圖像識(shí)別是以概率理論為基礎(chǔ)的,模式用特征向量描述,找出決策函數(shù)進(jìn)行模式?jīng)Q策分類。其基本思想是:無(wú)論輸入的對(duì)象是什么,它都表示為一個(gè)數(shù)組。這數(shù)組不是任意的,而是適當(dāng)選擇的、對(duì)原始數(shù)據(jù)進(jìn)行各種測(cè)量的結(jié)果。統(tǒng)計(jì)圖像識(shí)別的大致過(guò)程如圖 2-3 所示。圖 2-3統(tǒng)計(jì)圖像識(shí)別系統(tǒng)結(jié)構(gòu)圖圖中的上半部分是識(shí)別部分, 即對(duì)未知類別的圖像進(jìn)行分類; 下半部分是分析部分,即由已知類別的訓(xùn)練樣本求出判別函數(shù)及判別規(guī)則,進(jìn)而用來(lái)對(duì)未知類別的圖像進(jìn)行分類??驁D右下角部分是自適應(yīng)處理部分,當(dāng)用訓(xùn)練樣本根據(jù)某些規(guī)則求出一些判別規(guī)則后,再對(duì)這些訓(xùn)練樣本逐個(gè)
10、進(jìn)行檢測(cè),觀察是否有誤差。這樣不斷改進(jìn)判別規(guī)則,直到滿足條件為止。2、結(jié)構(gòu)圖像識(shí)別:結(jié)構(gòu)模式識(shí)別是按模式本身的結(jié)構(gòu)和結(jié)構(gòu)關(guān)系對(duì)物體進(jìn)行識(shí)別的方法。由于它是將現(xiàn)代自然語(yǔ)言分析的形式語(yǔ)言理論(句子分解為各種詞類,如名詞、動(dòng)詞、副詞等)用于模式識(shí)別,所以又稱為句法模式識(shí)別。其基本思想是:一個(gè)復(fù)雜的模式可以由一個(gè)簡(jiǎn)單的模式遞歸地描述。換言之,對(duì)于每個(gè)復(fù)雜的模式,可以用一些較簡(jiǎn)單的子模式來(lái)描述,而每一個(gè)比較簡(jiǎn)單的子模式再用一些更為簡(jiǎn)單的子模式來(lái)描述,最后用一些最簡(jiǎn)單的模式基元來(lái)表示。句法模式識(shí)別框圖如圖 2-4 所示。圖中的上半部分是識(shí)別階段, 即對(duì)未知類別的樣本進(jìn)行句法分析并輸出分類結(jié)果,同時(shí)輸出待識(shí)
11、別樣本的結(jié)構(gòu)描述;下半部分是分析階段,用一些已知結(jié)構(gòu)信息的模式樣本構(gòu)造出一些文法規(guī)則,以便用這些文法對(duì)描述未知模式的句子進(jìn)行句法分析。圖 2-4 句法模式識(shí)別系統(tǒng)結(jié)構(gòu)圖3、模糊模式識(shí)別:模糊模式識(shí)別是模糊集理論在模式識(shí)別中的應(yīng)用。人對(duì)客觀事物的認(rèn)識(shí)帶有模糊性,如通常所說(shuō)的高矮、胖瘦,青年、老年,溫和和劇烈等都帶有模糊性的語(yǔ)言,人類利用這些模糊語(yǔ)言進(jìn)行交流,并通過(guò)大腦分析和決策。模糊數(shù)學(xué)就是研究如何利用模糊信息對(duì)確定事物進(jìn)行定量分析。因此,將模糊集理論用于模式識(shí)別系統(tǒng),利用模糊信息進(jìn)行模式?jīng)Q策分析,使計(jì)算機(jī)帶有接近人類的智能,這是非常重要的研究課題。模糊識(shí)別的主要方法有最大隸屬原則識(shí)別法、接近原
12、則識(shí)別法和模糊聚類分析法。4、人工神經(jīng)網(wǎng)絡(luò)圖像模式識(shí)別:人工神經(jīng)網(wǎng)絡(luò)的研究起源于對(duì)生物神經(jīng)系統(tǒng)的研究。人工神經(jīng)網(wǎng)絡(luò)區(qū)別于其他識(shí)別方法的最大特點(diǎn)是它對(duì)待識(shí)別的對(duì)象不要求有太多的分析與了解,具有一定的智能化處理的特點(diǎn)。神經(jīng)網(wǎng)絡(luò)分類器是一種智能化模式識(shí)別系統(tǒng),雖然神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)和實(shí)現(xiàn)依賴與經(jīng)驗(yàn),泛化性能不能確保最優(yōu),但是它可以增強(qiáng)系統(tǒng)的學(xué)習(xí)能力、自適應(yīng)能力和容錯(cuò)性,具有很強(qiáng)的發(fā)展應(yīng)用前景。神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用按處理數(shù)據(jù)類型大致可以分為兩類:一類是基于圖像像素?cái)?shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法;另一類是基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法即特征空間的聚類識(shí)別算法?;趫D像像素?cái)?shù)據(jù)的神經(jīng)網(wǎng)絡(luò)識(shí)別技術(shù),是用高維的原始圖像
13、數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。目前很多神經(jīng)網(wǎng)絡(luò)算法是基于像素進(jìn)行圖像識(shí)別的,其圖像識(shí)別的流程圖如圖 2-5所示。圖 2-5 基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)圖像識(shí)別流程圖基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)是用圖像的特征數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。此類技術(shù)中,神經(jīng)網(wǎng)絡(luò)作為特征聚類器,有很多的神經(jīng)網(wǎng)絡(luò)別研究人員運(yùn)用,如 BP 神經(jīng)網(wǎng)絡(luò)、模糊神經(jīng)網(wǎng)絡(luò)、Hopfield 神經(jīng)網(wǎng)絡(luò)、RAM 自適應(yīng)神經(jīng)網(wǎng)絡(luò)、SOFM 神經(jīng)網(wǎng)絡(luò)、細(xì)胞神經(jīng)網(wǎng)絡(luò)等。其圖像識(shí)別的流程圖如圖 2-6所示。此類技術(shù)實(shí)際上是傳統(tǒng)方法與神經(jīng)網(wǎng)絡(luò)技術(shù)的結(jié)合,它利用人的經(jīng)驗(yàn)來(lái)獲取模式特征以及神經(jīng)網(wǎng)絡(luò)分類能力來(lái)識(shí)別目標(biāo)函數(shù)。其圖像識(shí)別的關(guān)鍵是圖
14、像的特征提取必須反映整個(gè)圖像的特征。圖 2-6基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)圖像識(shí)別流程圖 第三章 各類算法的比較3.1 基于模板匹配的模式識(shí)別分類算法3.1.1 模板匹配的基本概念模板就是一幅已知的小圖像。模板匹配就是在一幅大圖像中搜尋目標(biāo),已知該圖中有要找的目標(biāo),且該目標(biāo)同模板有相同的尺寸、方向和圖像,通過(guò)一定的算法可以在圖中找到目標(biāo),確定其坐標(biāo)位置。以8位圖像(其 1 個(gè)像素由 1 個(gè)字節(jié)描述)為例,模板T( H W個(gè)像素)疊放在被搜索圖S( mn個(gè)像素)上平移,模板覆蓋被搜索圖的那塊區(qū)域叫子圖Sij。i,j為子圖左上角在被搜索圖S上的坐標(biāo)。搜索范圍是:1 i W M 1 j H N 通過(guò)比
15、較T和Sij的相似性,完成模板匹配過(guò)程。注意:圖像的數(shù)據(jù)是從下到上、從左到右排列的。已知原始圖像S(H, W)和模板T(m, n)如下圖所示: 被搜索圖 模板可以用下式衡量T和Sij相似性:當(dāng)模板和子圖完全一樣時(shí),相關(guān)系數(shù)R( i, j ) = 1。在被搜索圖S中完成全部搜索后,找出R的最大值Rmax( im, jm ),其對(duì)應(yīng)的子圖Simjm即為匹配目標(biāo)。顯然,用這種公式做圖像匹配計(jì)算量大、速度較慢。另一種算法是衡量T和Sij的誤差,其公式為:E( i, j )為最小值處即為匹配目標(biāo)。為提高計(jì)算速度,取一個(gè)誤差閾值E0,當(dāng)E( i, j ) E0時(shí)就停止該點(diǎn)的計(jì)算,繼續(xù)下一點(diǎn)計(jì)算。3.1.2
16、模板匹配算法的matlab實(shí)現(xiàn)用matlab實(shí)現(xiàn)模版匹配的源程序如下:clear all;close all;clc;img=imread(lena.jpg);imshow(img);img=double(img);mask=double(imcrop();m n=size(img);H W=size(mask);if mod(H,2)=1 H=H+1;endif mod(W,2)=1 W=W+1;endmask=imresize(mask,H W);HH=floor(H/2);WW=floor(W/2);imgn=zeros(m+2*HH+1,n+2*WW+1);imgn(HH+1:m+HH
17、,WW+1:n+WW)=img;imgn(1:HH,WW+1:n+WW)=img(1:HH,1:n); imgn(1:m+HH,n+WW+1:n+2*WW+1)=imgn(1:m+HH,n:n+WW);imgn(m+HH+1:m+2*HH+1,WW+1:n+2*WW+1)=imgn(m:m+HH,WW+1:n+2*WW+1);imgn(1:m+2*HH+1,1:WW)=imgn(1:m+2*HH+1,WW+1:2*WW);re=imgn;for i=HH+1:m+HH for j=WW+1:n+WW tmp=imgn(i-HH:i+HH,j-WW:j+WW); re(i,j)=sum(sum(
18、tmp-mask).2); %最小平方差 endendfigure;re=mat2gray(re(HH+1:m+HH,WW+1:n+WW);imshow(1-re);結(jié)果如下:圖中高亮部分為眼睛所在不部位:3.2基于貝葉斯算法的圖像模式識(shí)別分類設(shè)計(jì)3.2.1貝葉斯算法簡(jiǎn)介模式識(shí)別分類問(wèn)題是對(duì)待識(shí)別的對(duì)象提取觀測(cè)值,然后根據(jù)觀測(cè)值進(jìn)行分類。首先建立識(shí)別對(duì)象的訓(xùn)練集,其中每點(diǎn)的類別已知 ,根據(jù)這些條件,建立判別函數(shù),通過(guò)現(xiàn)有的樣品估計(jì)判別函數(shù)中的參數(shù),然后用此判別函數(shù)去對(duì)類別未知的樣品進(jìn)行判定 。 3.2.1.1貝葉斯法則貝葉斯法則是對(duì)主觀判斷的一種修正方法 ,是指當(dāng)樣本足夠多時(shí) ,樣本概率與總體
19、概率近似 。一般情況下,事件A在事件B的條件下的概率,與事件 B 在事件A條件下的概率不相等 ,然而,這兩者是有確定關(guān)系的,貝葉斯法則就是這種關(guān)系的描述 。3.2.1.2 貝葉斯決策貝葉斯法則只是一種方法 ,是從大的方向上講,要將它細(xì)化又可以分為許多的具體實(shí)施的決 策。如果統(tǒng)計(jì)知識(shí)完整 ,貝葉斯決策理論是一種最優(yōu)分類器。貝葉斯分類器是分類錯(cuò)誤概率最小或者是平均風(fēng)險(xiǎn)最小的分類器。其設(shè)計(jì)方法屬 于一種基本的統(tǒng)計(jì)分類方法。3.2.1.3基于最小錯(cuò)誤概率的貝葉斯決策若每個(gè)樣品屬于w1,w2類中的 一類,已知兩類的先驗(yàn)概率分別p(w1),P(w2),兩類的類別密 度函 數(shù)為 P ( Xw1 ),P( X
20、w2)。則任給一x,判斷x的類別 。由貝葉斯公式可知 由全概率公式 可知:其中M為類別數(shù)。對(duì)于兩類問(wèn)題 , 所以用后驗(yàn)概率來(lái)判別3.2.2圖像分類識(shí)別系統(tǒng)實(shí)現(xiàn)3.2.2.1HSV顏色空間HSV顏色空間比較其它的顏色空間更適合人的視覺(jué)特性 。其中包含色調(diào) H(Hue)、飽和度 S(Saturation)和亮度 V(Value)。色調(diào) H表示表示光的顏色 ,飽和度S表示光的濃度,亮度v表示光的明暗程度 。在基于內(nèi)容的圖像檢索中,應(yīng)用這種顏色空 間模型會(huì)更適合用戶的視覺(jué)判斷 。3.2.2.2顏色空間的量化根據(jù)人 的視覺(jué)分辨能力的分 析 ,顏色大致劃分為如下9種 :紅、黃 、綠、青、藍(lán)、紫、黑、灰和白
21、,依據(jù)這九種顏色就可以大致描述一幅圖像。因此,可以根據(jù)這九種顏色來(lái)大致確定圖像的主顏色特征 。3.2.2.3 分塊主色的實(shí)現(xiàn)本文對(duì)圖像二維空間進(jìn)行 4 * 4 的劃分。對(duì)其中每一個(gè)分塊 ,統(tǒng)計(jì)出像素最多的那種顏色作為主色 ,建立圖像的顏色特征向量。分塊主色法是統(tǒng)計(jì) 圖像每個(gè)分塊主色來(lái)突出顏 色的空間關(guān)系 ,適用于主題位置相對(duì)固定的分類問(wèn)題 ,對(duì)于變化較大的圖像效果會(huì)明顯減弱。3.2.2.4主 要MATLAB程序函數(shù)名:bayesleasterror( )參數(shù):sample :待識(shí)別圖像特征返回值 :Y:待識(shí)別圖像所屬類別函數(shù)功能 : 最小錯(cuò)誤概率的貝葉斯分類器function y = baye
22、sleasterror(sample)clc ;load templet pattern ;對(duì)圖像庫(kù)和待測(cè)圖像進(jìn)行主成分分析pcapat,pcasamp=pcaprO(sample);temp=0;for i =1:2pattern(i).feature=pcapat(:,temp+1:temp+pattern(i).num) ;temp=temp+pattern(i).num;ends_cov=;s_inv= ;s_det= ;for i=l:2s_cov(i)dat=cov(pattern(i).feature) ; 求個(gè)類別的協(xié)方差矩 陣s_inv(i).dat=inv(s_cov(i)
23、.dat) ; 求協(xié)方差矩 陣的逆矩陣一s_det(i)=det(s_cov(i).dat) ; 求協(xié)方差矩陣的行列式endsuml=0;p= ;for i=1:2sum1=sum1+pattern(i).num ; 求圖像庫(kù)樣 品總數(shù)endfor i=1:2p(i)=pattern(i).numsum1 ; 求類別 的先驗(yàn)概率endh=; mean_sap =;for i=1:2mean_sap(i).dat=mean(pattern(i).feature) ; 求每類圖像 的特征值end 計(jì)算最大的判別函數(shù) for i=1:2h(i)=(pcasamp-mean_sap(i).dat)*S
24、_inv(i).dat*(pcasamp-mean_sap(i).dat)*(-0.5)+log(p(i)+log(abs(s_det(i)*(-0.5);endmaxval maxpos=max(h);y=maxpos;基于神經(jīng)網(wǎng)絡(luò)的圖像模式識(shí)別分類算法:神經(jīng)網(wǎng)絡(luò)的基本概念傳統(tǒng)的圖像識(shí)別技術(shù)是基于文本的檢索技術(shù),它依靠人工對(duì)圖像進(jìn)行手工注解,然后根據(jù)關(guān)鍵字對(duì)圖像進(jìn)行識(shí)別。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)是在現(xiàn)代神經(jīng)生物學(xué)研究基礎(chǔ)上提出的模擬生物過(guò)程以反映人腦某些特性的計(jì)算結(jié)構(gòu)。它不是人腦神經(jīng)系統(tǒng)的真實(shí)描寫,而只是它的某種抽象、簡(jiǎn)化和模擬。神經(jīng)元及其
25、突觸是神經(jīng)網(wǎng)絡(luò)的基本器件。因此,模擬生物神經(jīng)網(wǎng)絡(luò)應(yīng)首先模擬生物神經(jīng)元。在人工神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元常被稱為“處理單元” 。有時(shí)從網(wǎng)絡(luò)的觀點(diǎn)出發(fā)常把它稱為“節(jié)點(diǎn)” 。人工神經(jīng)元是對(duì)生物神經(jīng)元的一種形式化描述,它對(duì)生物神經(jīng)元的信息處理過(guò)程進(jìn)行抽象,并用數(shù)學(xué)語(yǔ)言予以描述;對(duì)生物神經(jīng)元的結(jié)構(gòu)和功能進(jìn)行模擬,并用模型予以表達(dá)。為了模擬生物神經(jīng)元,一個(gè)簡(jiǎn)化的人工神經(jīng)元如圖 3-1 所示。該神經(jīng)元是一個(gè)多輸入單輸出的非線性元件,其輸入輸出關(guān)系可描述為:圖 3-1 人工神經(jīng)元模型人工神經(jīng)元模型可以看成是由三個(gè)基本要素組成:1、 一組連接權(quán) (對(duì)應(yīng)于生物神經(jīng)元的突觸), 連接強(qiáng)度由各連接上的權(quán)值表示,權(quán)值為正表示激
26、勵(lì),為負(fù)值表示抑制。2、一個(gè)求和單元,用于求取各輸入信息的加權(quán)和(線性組合)。3、一個(gè)非線性激勵(lì)函數(shù),起非線性映射作用并限制神經(jīng)元輸出幅度在一定的范圍之內(nèi)。此外還有一個(gè)閾值。閾值也被看作是一個(gè)輸入分量,也就是閾值也是一個(gè)權(quán)值。在網(wǎng)絡(luò)的設(shè)計(jì)中,偏差起著重要的作用,它使得激活函數(shù)的圖形可以左右移動(dòng)而增加了解決問(wèn)題的可能性。通常所說(shuō)的人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),主要指它的連接方式。人工神經(jīng)網(wǎng)絡(luò)模型主要考慮網(wǎng)絡(luò)連接的拓?fù)浣Y(jié)構(gòu)、神經(jīng)元的特征、學(xué)習(xí)規(guī)則等。目前,已有近40種神經(jīng)網(wǎng)絡(luò)模型,其中有反傳網(wǎng)絡(luò)、感知器、自組織映射、Hopfield網(wǎng)絡(luò)、波耳茲曼機(jī)、適應(yīng)諧振理論等。根據(jù)連接的拓?fù)浣Y(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)模型可以分為:前
27、饋型神經(jīng)網(wǎng)絡(luò)和反饋型網(wǎng)絡(luò)。其中典型的前饋型神經(jīng)網(wǎng)絡(luò)如BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),RBF(Radical Basis Function)神經(jīng)網(wǎng)絡(luò)。下面舉例說(shuō)明基于BP神經(jīng)網(wǎng)絡(luò)的圖像模式識(shí)別。基于BP神經(jīng)網(wǎng)絡(luò)的圖像模式識(shí)別實(shí)現(xiàn)BP 神經(jīng)網(wǎng)絡(luò)是一種典型的前饋神經(jīng)網(wǎng)絡(luò),其神經(jīng)元的傳遞函數(shù)是 S 型函數(shù),輸出量為 0 到 1 之間的連續(xù)量,它可以實(shí)現(xiàn)從輸入到輸出的任意非線性映射。由于權(quán)值的調(diào)整采用反向傳播(Back Propagation)學(xué)習(xí)算法,因此也常稱其為 BP網(wǎng)絡(luò)。B P網(wǎng)絡(luò)結(jié)構(gòu)圖如下:其算法步驟描述如下:( 1 )設(shè)置變量和參數(shù), 其 中包括訓(xùn)練樣本, 權(quán)值矩陣, 學(xué)習(xí)
28、速率。( 2) 初始化, 輸入樣本, 提供訓(xùn)練模式, 訓(xùn)練網(wǎng)絡(luò), 直到滿足學(xué)習(xí)要求。(3) 前向傳播過(guò)程: 對(duì)給定訓(xùn)練模 式輸入, 計(jì)算網(wǎng)絡(luò)的輸出模式, 并與期望模式比較, 若有誤差,則執(zhí)行( 4 ); 否則, 返回 ( 2 )。(4) 后向傳播過(guò)程: a . 計(jì)算同一層單元的誤差; b . 修正權(quán)值和閾值; c . 返回 ( 2) 。下例為基于 BP 神經(jīng)網(wǎng)絡(luò)的英文字母識(shí)別方法能實(shí)現(xiàn)對(duì) 26 個(gè)英文字母的識(shí)別,其matlab程序如下:clear;close all;clc;alphabet,targets=prprob;R,Q=size(alphabet);S2,Q=size(targets
29、);S1=10;P=alphabet;net=newff(minmax(P),S1,S2,logsig logsig,traingdx);net.LW2,1=net.LW2,1*0.01;net.b2=net.b2*0.01;T=targets;net.performFcn=sse;net.trainParam.goal=0.1;net.trainParam.show=20;net.trainParam.epochs=5000;net.trainParam.mc=0.95;net,tr=train(net,P,T);netn=net;netn.trainParam.goal=0.6;netn.
30、trainParam.epochs=300;T=targets targets targets targets;for pass=1:10; P=alphabet,alphabet,. (alphabet+randn(R,Q)*0.1),. (alphabet+randn(R,Q)*0.2); netn,tr=train(netn,P,T);endnetn.trainParam.goal=0.1;netn.trainParam.epochs=500;netn.trainParam.show=5;P=alphabet;T=targets;netn,tr=train(netn,P,T);noise
31、_percent=0.2;for k=1:26 noisyChar=alphabet(:,k)+randn(35,1)*noise_percent; subplot(6,9,k+floor(k/9.5)*9); plotchar(noisyChar); de_noisyChar=sim(net,noisyChar); de_noisyChar=compet(de_noisyChar); answer=find(de_noisyChar=1); subplot(6,9,k+floor(k/9.5)*9+9); plotchar(alphabet(:,answer);endset(gcf,Posi
32、tion,10,60,900,700, color,w)運(yùn)算結(jié)果如下:成功識(shí)別有噪聲實(shí)驗(yàn)結(jié)果表明,基于 BP 神經(jīng)網(wǎng)絡(luò)的英文字母識(shí)別方法能實(shí)現(xiàn)對(duì) 26 個(gè)英文字母的準(zhǔn)確、快速識(shí)別,并具有較強(qiáng)的抗干擾能力。2基于貝葉斯算法的圖像模式識(shí)別分類設(shè)計(jì)2.1貝葉斯算法簡(jiǎn)介模式識(shí)別分類問(wèn)題是對(duì)待識(shí)別的對(duì)象提取觀測(cè)值,然后根據(jù)觀測(cè)值進(jìn)行分類。首先建立識(shí)別對(duì)象的訓(xùn)練集,其中每點(diǎn)的類別已知 ,根據(jù)這些條件,建立判別函數(shù),通過(guò)現(xiàn)有的樣品估計(jì)判別函數(shù)中的參數(shù),然后用此判別函數(shù)去對(duì)類別未知的樣品進(jìn)行判定 。2.1.1貝葉斯法則貝葉斯法則是對(duì)主觀判斷的一種修正方法 ,是指當(dāng)樣本足夠多時(shí) ,樣本概率與總體概率近似 。一般
33、情況下,事件A在事件B的條件下的概率,與事件 B 在事件A條件下的概率不相等 ,然而,這兩者是有確定關(guān)系的,貝葉斯法則就是這種關(guān)系的描述 。2.1. 2 貝葉斯決策貝葉斯法則只是一種方法 ,是從大的方向上講,要將它細(xì)化又可以分為許多的具體實(shí)施的決 策。如果統(tǒng)計(jì)知識(shí)完整 ,貝葉斯決策理論是一種最優(yōu)分類器。貝葉斯分類器是分類錯(cuò)誤概率最小或者是平均風(fēng)險(xiǎn)最小的分類器。其設(shè)計(jì)方法屬 于一種基本的統(tǒng)計(jì)分類方法。2.1.3基于最小錯(cuò)誤概率的貝葉斯決策若每個(gè)樣品屬于w1,w2類中的 一類,已知兩類的先驗(yàn)概率分別p(w1),P(w2),兩類的類別密 度函 數(shù)為 P ( Xw1 ),P( Xw2)。則任給一x,判斷x的類別 。由貝葉斯公式可知 由全概率公式 可知:其中M為類別數(shù)。對(duì)于兩類問(wèn)題 , 所以用后驗(yàn)概率來(lái)判別22圖像分類識(shí)別系統(tǒng)實(shí)現(xiàn)2.2 .1 HSV顏色空間HSV顏色空間比較其它的顏色空間更適合人的視覺(jué)特性 。其中包含色調(diào) H(Hue)、飽和度 S(Saturation)和亮度 V(Value)。色調(diào) H表示表示光的顏色 ,飽和度S表示光的濃度,亮度v表示光的明暗程度 。在基于內(nèi)容的圖像檢索中,應(yīng)用這種顏色空 間模型會(huì)更適
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版七年級(jí)英語(yǔ)下冊(cè)教學(xué)工作計(jì)劃(及進(jìn)度表)
- 2025年湖北省中考化學(xué)模擬試卷(附答案)
- 2021年上海高考語(yǔ)文真題卷(附答案)
- 藝術(shù)品交易居間服務(wù)協(xié)議
- 二零二五年度北京市危險(xiǎn)品倉(cāng)儲(chǔ)安全評(píng)價(jià)合同范本
- 展覽館裝修合同參考模板
- 中醫(yī)護(hù)理學(xué)(第5版)課件 第二章藏象
- 特殊作業(yè)施工方案
- 餐飲業(yè)可行性分析報(bào)告
- 農(nóng)業(yè)小鎮(zhèn)規(guī)劃
- 2023年高考真題全國(guó)乙卷物理試卷
- 運(yùn)梁車培訓(xùn)教材
- 節(jié)后復(fù)工復(fù)產(chǎn)安全教育培訓(xùn)資料
- 2023年全國(guó)高考體育單招考試英語(yǔ)卷試題真題(含答案詳解)
- 軸承基礎(chǔ)知識(shí)測(cè)試
- 《體驗(yàn)微視頻拍攝樂(lè)趣》第一課時(shí)初中七年級(jí)勞動(dòng)教育課件
- 主水管改造合同范例
- 《電工技術(shù)》課件-戴維南定理
- 力與運(yùn)動(dòng)的關(guān)系(專題訓(xùn)練)【三大題型】(原卷版)-八年級(jí)物理下冊(cè)
- DB4205T70-2024 既有住宅加裝電梯技術(shù)規(guī)范
- 耳穴壓豆治療便秘
評(píng)論
0/150
提交評(píng)論