版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、現(xiàn)代模式識別是在 20 世紀 40 年代電子計算機發(fā)明以后逐漸發(fā)展起來的。 在更早的時候,已有用光學和機械手段實現(xiàn)模式識別的例子,如在 1929 年 GustavTauschek 就在德國獲得了光學字符識別專利。作為統(tǒng)計模式識別基礎的多元統(tǒng)計分析和鑒別分析也在電子計算機出現(xiàn)之前提出來了。1957 年 IBM 的 C.K.Chow 將統(tǒng)計決策方法用于字符識別。然而,“模式識別”這個詞被廣泛使用并形成一個領域是在 20 世紀 60 年代以后。模式識別問題指的是對一系列過程或事件的分類與描述,具有某些相類似的性質(zhì)的過程或事件就分為一類。目前模式識別問題一般可以應用以下 4 種方法進行分析處理:統(tǒng)計模
2、式識別方法、句法模式識別、人工神經(jīng)網(wǎng)絡模式識別、模糊模式識別。模式識別已經(jīng)在天氣預報、衛(wèi)星航空圖片解釋、工業(yè)產(chǎn)品檢測、字符識別、語音識別、指紋識別、醫(yī)學圖像分析等許多方面得到了成功的應用。所有這些應用都是和問題的性質(zhì)密切不可分的,至今還沒有發(fā)展成統(tǒng)一的、有效的可應用于所有的模式識別的理論。當前的一種普遍看法是不存在對所有的模式識別問題都使用的單一模型和解決識別問題的單一技術,我們現(xiàn)在擁有的是一個工具袋,我們所要做的是結(jié)合具體問題把統(tǒng)計的和句法(結(jié)構(gòu))的識別方法結(jié)合起來,把統(tǒng)計模式識別或句法模式識別與人工智能中的啟發(fā)式搜索結(jié)合起來,把人工神經(jīng)元網(wǎng)絡與各種以有技術以及人工智能中的專家系統(tǒng),不確定方
3、法結(jié)合起來,深入掌握各種工具的效能和應用的可能性,互相取長補短,開創(chuàng)模式識別應用的新局面。2.3圖像模式識別2.3.1圖像模式識別的基本概念圖像在人類的感知中扮演著非常重要的角色,人類隨時隨處都要接觸圖像。據(jù)統(tǒng)計,在人類接受的信息中,視覺信息占了 70%以上,也就是常說的“百聞不如一見” 。在許多場合,圖像所傳遞的信息比其他任何形式的信息更加豐富和真切。隨著數(shù)字圖像技術的發(fā)展和實際應用的需要,出現(xiàn)了另一類問題,就是不要求其結(jié)果輸出是一幅完整的圖像,而是將經(jīng)過圖像處理后的圖像,再經(jīng)過分割和描述提取有效的特征,進而加以判決分類,這就是近 20 年來發(fā)展起來的一門新興技術科學圖像識別。它以研究某些對
4、象或過程的分類與描述為主要內(nèi)容,以研制能夠自動處理某些信息的機器視覺系統(tǒng),代替?zhèn)鹘y(tǒng)的人工完成分類和辨識的任務為目的。例如要從遙感圖像中分割出各種農(nóng)作物、森林資源和礦產(chǎn)資源等;根據(jù)醫(yī)學圖片分析發(fā)生病變的細胞形狀和顏色判斷是否發(fā)生癌變;從氣象觀測數(shù)據(jù)或氣象衛(wèi)星照片準確預報天氣;交通管理系統(tǒng)中應用車牌自動識別技術管理車輛等。因此,在當今社會,圖像識別技術已經(jīng)在各個領域發(fā)揮著極其重要的作用。圖像識別,簡單地說,就是要把一種研究對象,根據(jù)其某些特征進行識別并分類。例如要識別寫在卡片上的數(shù)字,判斷它是 0,1,2,9 中的哪個數(shù)字,就是將數(shù)字圖像分成 10 類的問題,因此可以認為,對數(shù)字圖像進行區(qū)別分類其
5、實質(zhì)就是對圖像進行模式識別。這種識別早已存在人們的生活實踐中。然而,隨著實踐活動的擴大、深入和社會化的需要,人們不僅需要識別分類數(shù)很多的事物,而且被識別的對象內(nèi)容也越來越復雜。特別是由于科學技術水平的提高,使得各種不同的研究對象“圖像化”或“數(shù)字化” ,可采用某種技術把考察的對象轉(zhuǎn)換成圖片、波形圖以及若干數(shù)據(jù),這些數(shù)據(jù)就可以代表所研究的對象。但是對于模式識別來說,無論是數(shù)據(jù)、信號還是平面圖像或立體景物都是除掉它們的物理內(nèi)容而找出它們的共性,把具有同一共性的歸為一類,而具有另一種共性者歸為另一類。圖像模式識別是用機器對文字、 圖像、 圖片和景物等模式信息加以處理和識別,用以解決計算機與外部環(huán)境直
6、接通信這一重要問題。其目的就是研制采用某種儀器或設備,自動處理某些信息,代替人完成分類和辨識的任務,并且能夠快速而準確地進行圖形識別。一般來說,一個圖像識別由圖像預處理、圖像特征提取和圖像模式分類三個主要部分組成。前期處理一般是指把圖像進行平滑、增強、恢復、邊緣檢測和分割等操作,其目的是把輸入圖像簡化為分段模式。特征提取是指在滿足分類識別正確率要求的條件下,提取圖像的主要特征,并按某種準則盡量選用對正確分類識別作用大得特征,使得用較少的特征就能完成分類識別任務。圖像模式分類是最重要的一部分,它是依據(jù)所提取的特征,將前一部分的特征向量空間映射到類型空間,把相應圖像歸屬已知的一類模式。2.3.2圖
7、像模式識別的基本方法一個圖像識別系統(tǒng)主要由三個環(huán)節(jié)組成: 圖像數(shù)據(jù)獲取, 數(shù)據(jù)加工和處理、 抽取特征,判斷分類等,如圖 2-2 所示。圖 2-2 圖像識別系統(tǒng)框圖下面簡單對這幾個環(huán)節(jié)作以說明:1、數(shù)據(jù)獲取 來自現(xiàn)實的模擬數(shù)據(jù),如圖片、照片、圖像和景物等由一個傳感器(如掃描儀、傳真機、數(shù)字攝像機、數(shù)碼相機)傳入,然后被轉(zhuǎn)換成適合計算機處理的形式,即將物理量變成一組測量值。2、 數(shù)據(jù)處理 數(shù)據(jù)處理包括預處理、 特征抽象和特征選擇。 預處理技術包括各種圖像處理技術,其目的是改善圖像質(zhì)量,清楚圖像中的噪聲,減輕或消除因傳感器與傳輸介質(zhì)本身不完善而引起的退化現(xiàn)象,便于機器分析處理等。特征抽取就是從圖像中
8、提取一組反映圖像特性的基本元素或數(shù)字值。特征選擇則是從已經(jīng)抽取的特征中選擇能夠更好地完成分類識別任務的特征來表示原圖像。3、 判別分類 判別分類就是采用一定的準則或機制建立分類規(guī)則, 并用它們對未知圖像模式進行分類識別。用于解決圖像識別的方法概括起來可分為統(tǒng)計模式識別、 結(jié)構(gòu)模式識別、模糊圖像識別和智能模式識別 (主要是人工神經(jīng)網(wǎng)絡模式識別) 4 類, 前兩類方法有久遠的歷史,發(fā)展較為成熟,對解決相應領域中的模式識別問題均有明顯的效果,是模式識別分類的經(jīng)典與基礎性技術。 20 世紀 80 年代新興的人工神經(jīng)網(wǎng)絡,作以一種廣義的智能模式識別法,更以嶄新的姿態(tài),以其全局相關的特色,在模式識別領域取
9、得了許多傳統(tǒng)方法所難達到的成就,下面分別作以介紹:1、統(tǒng)計圖像識別:統(tǒng)計圖像識別是以概率理論為基礎的,模式用特征向量描述,找出決策函數(shù)進行模式?jīng)Q策分類。其基本思想是:無論輸入的對象是什么,它都表示為一個數(shù)組。這數(shù)組不是任意的,而是適當選擇的、對原始數(shù)據(jù)進行各種測量的結(jié)果。統(tǒng)計圖像識別的大致過程如圖 2-3 所示。圖 2-3統(tǒng)計圖像識別系統(tǒng)結(jié)構(gòu)圖圖中的上半部分是識別部分, 即對未知類別的圖像進行分類; 下半部分是分析部分,即由已知類別的訓練樣本求出判別函數(shù)及判別規(guī)則,進而用來對未知類別的圖像進行分類。框圖右下角部分是自適應處理部分,當用訓練樣本根據(jù)某些規(guī)則求出一些判別規(guī)則后,再對這些訓練樣本逐個
10、進行檢測,觀察是否有誤差。這樣不斷改進判別規(guī)則,直到滿足條件為止。2、結(jié)構(gòu)圖像識別:結(jié)構(gòu)模式識別是按模式本身的結(jié)構(gòu)和結(jié)構(gòu)關系對物體進行識別的方法。由于它是將現(xiàn)代自然語言分析的形式語言理論(句子分解為各種詞類,如名詞、動詞、副詞等)用于模式識別,所以又稱為句法模式識別。其基本思想是:一個復雜的模式可以由一個簡單的模式遞歸地描述。換言之,對于每個復雜的模式,可以用一些較簡單的子模式來描述,而每一個比較簡單的子模式再用一些更為簡單的子模式來描述,最后用一些最簡單的模式基元來表示。句法模式識別框圖如圖 2-4 所示。圖中的上半部分是識別階段, 即對未知類別的樣本進行句法分析并輸出分類結(jié)果,同時輸出待識
11、別樣本的結(jié)構(gòu)描述;下半部分是分析階段,用一些已知結(jié)構(gòu)信息的模式樣本構(gòu)造出一些文法規(guī)則,以便用這些文法對描述未知模式的句子進行句法分析。圖 2-4 句法模式識別系統(tǒng)結(jié)構(gòu)圖3、模糊模式識別:模糊模式識別是模糊集理論在模式識別中的應用。人對客觀事物的認識帶有模糊性,如通常所說的高矮、胖瘦,青年、老年,溫和和劇烈等都帶有模糊性的語言,人類利用這些模糊語言進行交流,并通過大腦分析和決策。模糊數(shù)學就是研究如何利用模糊信息對確定事物進行定量分析。因此,將模糊集理論用于模式識別系統(tǒng),利用模糊信息進行模式?jīng)Q策分析,使計算機帶有接近人類的智能,這是非常重要的研究課題。模糊識別的主要方法有最大隸屬原則識別法、接近原
12、則識別法和模糊聚類分析法。4、人工神經(jīng)網(wǎng)絡圖像模式識別:人工神經(jīng)網(wǎng)絡的研究起源于對生物神經(jīng)系統(tǒng)的研究。人工神經(jīng)網(wǎng)絡區(qū)別于其他識別方法的最大特點是它對待識別的對象不要求有太多的分析與了解,具有一定的智能化處理的特點。神經(jīng)網(wǎng)絡分類器是一種智能化模式識別系統(tǒng),雖然神經(jīng)網(wǎng)絡的設計和實現(xiàn)依賴與經(jīng)驗,泛化性能不能確保最優(yōu),但是它可以增強系統(tǒng)的學習能力、自適應能力和容錯性,具有很強的發(fā)展應用前景。神經(jīng)網(wǎng)絡在圖像識別中的應用按處理數(shù)據(jù)類型大致可以分為兩類:一類是基于圖像像素數(shù)據(jù)的神經(jīng)網(wǎng)絡算法;另一類是基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡算法即特征空間的聚類識別算法?;趫D像像素數(shù)據(jù)的神經(jīng)網(wǎng)絡識別技術,是用高維的原始圖像
13、數(shù)據(jù)作為神經(jīng)網(wǎng)絡的訓練樣本。目前很多神經(jīng)網(wǎng)絡算法是基于像素進行圖像識別的,其圖像識別的流程圖如圖 2-5所示。圖 2-5 基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡圖像識別流程圖基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡的圖像識別技術是用圖像的特征數(shù)據(jù)作為神經(jīng)網(wǎng)絡的訓練樣本。此類技術中,神經(jīng)網(wǎng)絡作為特征聚類器,有很多的神經(jīng)網(wǎng)絡別研究人員運用,如 BP 神經(jīng)網(wǎng)絡、模糊神經(jīng)網(wǎng)絡、Hopfield 神經(jīng)網(wǎng)絡、RAM 自適應神經(jīng)網(wǎng)絡、SOFM 神經(jīng)網(wǎng)絡、細胞神經(jīng)網(wǎng)絡等。其圖像識別的流程圖如圖 2-6所示。此類技術實際上是傳統(tǒng)方法與神經(jīng)網(wǎng)絡技術的結(jié)合,它利用人的經(jīng)驗來獲取模式特征以及神經(jīng)網(wǎng)絡分類能力來識別目標函數(shù)。其圖像識別的關鍵是圖
14、像的特征提取必須反映整個圖像的特征。圖 2-6基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡圖像識別流程圖 第三章 各類算法的比較3.1 基于模板匹配的模式識別分類算法3.1.1 模板匹配的基本概念模板就是一幅已知的小圖像。模板匹配就是在一幅大圖像中搜尋目標,已知該圖中有要找的目標,且該目標同模板有相同的尺寸、方向和圖像,通過一定的算法可以在圖中找到目標,確定其坐標位置。以8位圖像(其 1 個像素由 1 個字節(jié)描述)為例,模板T( H W個像素)疊放在被搜索圖S( mn個像素)上平移,模板覆蓋被搜索圖的那塊區(qū)域叫子圖Sij。i,j為子圖左上角在被搜索圖S上的坐標。搜索范圍是:1 i W M 1 j H N 通過比
15、較T和Sij的相似性,完成模板匹配過程。注意:圖像的數(shù)據(jù)是從下到上、從左到右排列的。已知原始圖像S(H, W)和模板T(m, n)如下圖所示: 被搜索圖 模板可以用下式衡量T和Sij相似性:當模板和子圖完全一樣時,相關系數(shù)R( i, j ) = 1。在被搜索圖S中完成全部搜索后,找出R的最大值Rmax( im, jm ),其對應的子圖Simjm即為匹配目標。顯然,用這種公式做圖像匹配計算量大、速度較慢。另一種算法是衡量T和Sij的誤差,其公式為:E( i, j )為最小值處即為匹配目標。為提高計算速度,取一個誤差閾值E0,當E( i, j ) E0時就停止該點的計算,繼續(xù)下一點計算。3.1.2
16、模板匹配算法的matlab實現(xiàn)用matlab實現(xiàn)模版匹配的源程序如下:clear all;close all;clc;img=imread(lena.jpg);imshow(img);img=double(img);mask=double(imcrop();m n=size(img);H W=size(mask);if mod(H,2)=1 H=H+1;endif mod(W,2)=1 W=W+1;endmask=imresize(mask,H W);HH=floor(H/2);WW=floor(W/2);imgn=zeros(m+2*HH+1,n+2*WW+1);imgn(HH+1:m+HH
17、,WW+1:n+WW)=img;imgn(1:HH,WW+1:n+WW)=img(1:HH,1:n); imgn(1:m+HH,n+WW+1:n+2*WW+1)=imgn(1:m+HH,n:n+WW);imgn(m+HH+1:m+2*HH+1,WW+1:n+2*WW+1)=imgn(m:m+HH,WW+1:n+2*WW+1);imgn(1:m+2*HH+1,1:WW)=imgn(1:m+2*HH+1,WW+1:2*WW);re=imgn;for i=HH+1:m+HH for j=WW+1:n+WW tmp=imgn(i-HH:i+HH,j-WW:j+WW); re(i,j)=sum(sum(
18、tmp-mask).2); %最小平方差 endendfigure;re=mat2gray(re(HH+1:m+HH,WW+1:n+WW);imshow(1-re);結(jié)果如下:圖中高亮部分為眼睛所在不部位:3.2基于貝葉斯算法的圖像模式識別分類設計3.2.1貝葉斯算法簡介模式識別分類問題是對待識別的對象提取觀測值,然后根據(jù)觀測值進行分類。首先建立識別對象的訓練集,其中每點的類別已知 ,根據(jù)這些條件,建立判別函數(shù),通過現(xiàn)有的樣品估計判別函數(shù)中的參數(shù),然后用此判別函數(shù)去對類別未知的樣品進行判定 。 3.2.1.1貝葉斯法則貝葉斯法則是對主觀判斷的一種修正方法 ,是指當樣本足夠多時 ,樣本概率與總體
19、概率近似 。一般情況下,事件A在事件B的條件下的概率,與事件 B 在事件A條件下的概率不相等 ,然而,這兩者是有確定關系的,貝葉斯法則就是這種關系的描述 。3.2.1.2 貝葉斯決策貝葉斯法則只是一種方法 ,是從大的方向上講,要將它細化又可以分為許多的具體實施的決 策。如果統(tǒng)計知識完整 ,貝葉斯決策理論是一種最優(yōu)分類器。貝葉斯分類器是分類錯誤概率最小或者是平均風險最小的分類器。其設計方法屬 于一種基本的統(tǒng)計分類方法。3.2.1.3基于最小錯誤概率的貝葉斯決策若每個樣品屬于w1,w2類中的 一類,已知兩類的先驗概率分別p(w1),P(w2),兩類的類別密 度函 數(shù)為 P ( Xw1 ),P( X
20、w2)。則任給一x,判斷x的類別 。由貝葉斯公式可知 由全概率公式 可知:其中M為類別數(shù)。對于兩類問題 , 所以用后驗概率來判別3.2.2圖像分類識別系統(tǒng)實現(xiàn)3.2.2.1HSV顏色空間HSV顏色空間比較其它的顏色空間更適合人的視覺特性 。其中包含色調(diào) H(Hue)、飽和度 S(Saturation)和亮度 V(Value)。色調(diào) H表示表示光的顏色 ,飽和度S表示光的濃度,亮度v表示光的明暗程度 。在基于內(nèi)容的圖像檢索中,應用這種顏色空 間模型會更適合用戶的視覺判斷 。3.2.2.2顏色空間的量化根據(jù)人 的視覺分辨能力的分 析 ,顏色大致劃分為如下9種 :紅、黃 、綠、青、藍、紫、黑、灰和白
21、,依據(jù)這九種顏色就可以大致描述一幅圖像。因此,可以根據(jù)這九種顏色來大致確定圖像的主顏色特征 。3.2.2.3 分塊主色的實現(xiàn)本文對圖像二維空間進行 4 * 4 的劃分。對其中每一個分塊 ,統(tǒng)計出像素最多的那種顏色作為主色 ,建立圖像的顏色特征向量。分塊主色法是統(tǒng)計 圖像每個分塊主色來突出顏 色的空間關系 ,適用于主題位置相對固定的分類問題 ,對于變化較大的圖像效果會明顯減弱。3.2.2.4主 要MATLAB程序函數(shù)名:bayesleasterror( )參數(shù):sample :待識別圖像特征返回值 :Y:待識別圖像所屬類別函數(shù)功能 : 最小錯誤概率的貝葉斯分類器function y = baye
22、sleasterror(sample)clc ;load templet pattern ;對圖像庫和待測圖像進行主成分分析pcapat,pcasamp=pcaprO(sample);temp=0;for i =1:2pattern(i).feature=pcapat(:,temp+1:temp+pattern(i).num) ;temp=temp+pattern(i).num;ends_cov=;s_inv= ;s_det= ;for i=l:2s_cov(i)dat=cov(pattern(i).feature) ; 求個類別的協(xié)方差矩 陣s_inv(i).dat=inv(s_cov(i)
23、.dat) ; 求協(xié)方差矩 陣的逆矩陣一s_det(i)=det(s_cov(i).dat) ; 求協(xié)方差矩陣的行列式endsuml=0;p= ;for i=1:2sum1=sum1+pattern(i).num ; 求圖像庫樣 品總數(shù)endfor i=1:2p(i)=pattern(i).numsum1 ; 求類別 的先驗概率endh=; mean_sap =;for i=1:2mean_sap(i).dat=mean(pattern(i).feature) ; 求每類圖像 的特征值end 計算最大的判別函數(shù) for i=1:2h(i)=(pcasamp-mean_sap(i).dat)*S
24、_inv(i).dat*(pcasamp-mean_sap(i).dat)*(-0.5)+log(p(i)+log(abs(s_det(i)*(-0.5);endmaxval maxpos=max(h);y=maxpos;基于神經(jīng)網(wǎng)絡的圖像模式識別分類算法:神經(jīng)網(wǎng)絡的基本概念傳統(tǒng)的圖像識別技術是基于文本的檢索技術,它依靠人工對圖像進行手工注解,然后根據(jù)關鍵字對圖像進行識別。人工神經(jīng)網(wǎng)絡(Artificial Neural Networks,ANN)是在現(xiàn)代神經(jīng)生物學研究基礎上提出的模擬生物過程以反映人腦某些特性的計算結(jié)構(gòu)。它不是人腦神經(jīng)系統(tǒng)的真實描寫,而只是它的某種抽象、簡化和模擬。神經(jīng)元及其
25、突觸是神經(jīng)網(wǎng)絡的基本器件。因此,模擬生物神經(jīng)網(wǎng)絡應首先模擬生物神經(jīng)元。在人工神經(jīng)網(wǎng)絡中,神經(jīng)元常被稱為“處理單元” 。有時從網(wǎng)絡的觀點出發(fā)常把它稱為“節(jié)點” 。人工神經(jīng)元是對生物神經(jīng)元的一種形式化描述,它對生物神經(jīng)元的信息處理過程進行抽象,并用數(shù)學語言予以描述;對生物神經(jīng)元的結(jié)構(gòu)和功能進行模擬,并用模型予以表達。為了模擬生物神經(jīng)元,一個簡化的人工神經(jīng)元如圖 3-1 所示。該神經(jīng)元是一個多輸入單輸出的非線性元件,其輸入輸出關系可描述為:圖 3-1 人工神經(jīng)元模型人工神經(jīng)元模型可以看成是由三個基本要素組成:1、 一組連接權 (對應于生物神經(jīng)元的突觸), 連接強度由各連接上的權值表示,權值為正表示激
26、勵,為負值表示抑制。2、一個求和單元,用于求取各輸入信息的加權和(線性組合)。3、一個非線性激勵函數(shù),起非線性映射作用并限制神經(jīng)元輸出幅度在一定的范圍之內(nèi)。此外還有一個閾值。閾值也被看作是一個輸入分量,也就是閾值也是一個權值。在網(wǎng)絡的設計中,偏差起著重要的作用,它使得激活函數(shù)的圖形可以左右移動而增加了解決問題的可能性。通常所說的人工神經(jīng)網(wǎng)絡結(jié)構(gòu),主要指它的連接方式。人工神經(jīng)網(wǎng)絡模型主要考慮網(wǎng)絡連接的拓撲結(jié)構(gòu)、神經(jīng)元的特征、學習規(guī)則等。目前,已有近40種神經(jīng)網(wǎng)絡模型,其中有反傳網(wǎng)絡、感知器、自組織映射、Hopfield網(wǎng)絡、波耳茲曼機、適應諧振理論等。根據(jù)連接的拓撲結(jié)構(gòu),神經(jīng)網(wǎng)絡模型可以分為:前
27、饋型神經(jīng)網(wǎng)絡和反饋型網(wǎng)絡。其中典型的前饋型神經(jīng)網(wǎng)絡如BP(Back Propagation)神經(jīng)網(wǎng)絡,RBF(Radical Basis Function)神經(jīng)網(wǎng)絡。下面舉例說明基于BP神經(jīng)網(wǎng)絡的圖像模式識別?;贐P神經(jīng)網(wǎng)絡的圖像模式識別實現(xiàn)BP 神經(jīng)網(wǎng)絡是一種典型的前饋神經(jīng)網(wǎng)絡,其神經(jīng)元的傳遞函數(shù)是 S 型函數(shù),輸出量為 0 到 1 之間的連續(xù)量,它可以實現(xiàn)從輸入到輸出的任意非線性映射。由于權值的調(diào)整采用反向傳播(Back Propagation)學習算法,因此也常稱其為 BP網(wǎng)絡。B P網(wǎng)絡結(jié)構(gòu)圖如下:其算法步驟描述如下:( 1 )設置變量和參數(shù), 其 中包括訓練樣本, 權值矩陣, 學習
28、速率。( 2) 初始化, 輸入樣本, 提供訓練模式, 訓練網(wǎng)絡, 直到滿足學習要求。(3) 前向傳播過程: 對給定訓練模 式輸入, 計算網(wǎng)絡的輸出模式, 并與期望模式比較, 若有誤差,則執(zhí)行( 4 ); 否則, 返回 ( 2 )。(4) 后向傳播過程: a . 計算同一層單元的誤差; b . 修正權值和閾值; c . 返回 ( 2) 。下例為基于 BP 神經(jīng)網(wǎng)絡的英文字母識別方法能實現(xiàn)對 26 個英文字母的識別,其matlab程序如下:clear;close all;clc;alphabet,targets=prprob;R,Q=size(alphabet);S2,Q=size(targets
29、);S1=10;P=alphabet;net=newff(minmax(P),S1,S2,logsig logsig,traingdx);net.LW2,1=net.LW2,1*0.01;net.b2=net.b2*0.01;T=targets;net.performFcn=sse;net.trainParam.goal=0.1;net.trainParam.show=20;net.trainParam.epochs=5000;net.trainParam.mc=0.95;net,tr=train(net,P,T);netn=net;netn.trainParam.goal=0.6;netn.
30、trainParam.epochs=300;T=targets targets targets targets;for pass=1:10; P=alphabet,alphabet,. (alphabet+randn(R,Q)*0.1),. (alphabet+randn(R,Q)*0.2); netn,tr=train(netn,P,T);endnetn.trainParam.goal=0.1;netn.trainParam.epochs=500;netn.trainParam.show=5;P=alphabet;T=targets;netn,tr=train(netn,P,T);noise
31、_percent=0.2;for k=1:26 noisyChar=alphabet(:,k)+randn(35,1)*noise_percent; subplot(6,9,k+floor(k/9.5)*9); plotchar(noisyChar); de_noisyChar=sim(net,noisyChar); de_noisyChar=compet(de_noisyChar); answer=find(de_noisyChar=1); subplot(6,9,k+floor(k/9.5)*9+9); plotchar(alphabet(:,answer);endset(gcf,Posi
32、tion,10,60,900,700, color,w)運算結(jié)果如下:成功識別有噪聲實驗結(jié)果表明,基于 BP 神經(jīng)網(wǎng)絡的英文字母識別方法能實現(xiàn)對 26 個英文字母的準確、快速識別,并具有較強的抗干擾能力。2基于貝葉斯算法的圖像模式識別分類設計2.1貝葉斯算法簡介模式識別分類問題是對待識別的對象提取觀測值,然后根據(jù)觀測值進行分類。首先建立識別對象的訓練集,其中每點的類別已知 ,根據(jù)這些條件,建立判別函數(shù),通過現(xiàn)有的樣品估計判別函數(shù)中的參數(shù),然后用此判別函數(shù)去對類別未知的樣品進行判定 。2.1.1貝葉斯法則貝葉斯法則是對主觀判斷的一種修正方法 ,是指當樣本足夠多時 ,樣本概率與總體概率近似 。一般
33、情況下,事件A在事件B的條件下的概率,與事件 B 在事件A條件下的概率不相等 ,然而,這兩者是有確定關系的,貝葉斯法則就是這種關系的描述 。2.1. 2 貝葉斯決策貝葉斯法則只是一種方法 ,是從大的方向上講,要將它細化又可以分為許多的具體實施的決 策。如果統(tǒng)計知識完整 ,貝葉斯決策理論是一種最優(yōu)分類器。貝葉斯分類器是分類錯誤概率最小或者是平均風險最小的分類器。其設計方法屬 于一種基本的統(tǒng)計分類方法。2.1.3基于最小錯誤概率的貝葉斯決策若每個樣品屬于w1,w2類中的 一類,已知兩類的先驗概率分別p(w1),P(w2),兩類的類別密 度函 數(shù)為 P ( Xw1 ),P( Xw2)。則任給一x,判斷x的類別 。由貝葉斯公式可知 由全概率公式 可知:其中M為類別數(shù)。對于兩類問題 , 所以用后驗概率來判別22圖像分類識別系統(tǒng)實現(xiàn)2.2 .1 HSV顏色空間HSV顏色空間比較其它的顏色空間更適合人的視覺特性 。其中包含色調(diào) H(Hue)、飽和度 S(Saturation)和亮度 V(Value)。色調(diào) H表示表示光的顏色 ,飽和度S表示光的濃度,亮度v表示光的明暗程度 。在基于內(nèi)容的圖像檢索中,應用這種顏色空 間模型會更適
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 年春節(jié)放假通知
- 幽默婚禮致辭(15篇)
- 海水的運動+導學案 高一上學期+地理+人教版(2019)必修一
- 論歐龍馬滴劑治療小兒慢性鼻竇炎的療效研究
- 二零二五年度企業(yè)形象宣傳品定制采購協(xié)議書3篇
- 育齡期女性乳腺癌患者生育憂慮的混合研究
- 二零二五版新型城鎮(zhèn)化建設項目物業(yè)管理合同范本3篇
- 三自由度波浪補償風電過橋裝置系統(tǒng)研究
- 2023-2024學年高一秋學期期末語文模擬測試(二)試題講評課件 上課課件
- 復雜環(huán)境下的智能挖掘機目標檢測研究
- 禮盒業(yè)務銷售方案
- 術后肺炎預防和控制專家共識解讀課件
- 二十屆三中全會精神學習試題及答案(100題)
- 中石化高級職稱英語考試
- 小學五年級英語閱讀理解(帶答案)
- 2024二十屆三中全會知識競賽題庫及答案
- 仁愛版初中英語單詞(按字母順序排版)
- 2024年全國統(tǒng)一考試高考新課標Ⅱ卷語文+數(shù)學+英語試題(真題+答案)
- 2024年全國甲卷高考化學真題試題(原卷版+含解析)
- 小學一年級拼音天天練
- 新概念英語第二冊考評試卷含答案(第49-56課)
評論
0/150
提交評論