基于ga作特征模板的人臉特征快速提取_第1頁
基于ga作特征模板的人臉特征快速提取_第2頁
基于ga作特征模板的人臉特征快速提取_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于ga作特征模板的人臉特征快速提取

1基于gabo變換的人臉識別哈爾哈和德爾曼最初將高等動物扁平層的簡單細胞接受場和gaor函數聯(lián)系起來。大量基于簡單細胞接受場的實驗表明,圖像在視覺皮層的表示存在空域和空頻域分量,并且可以將一副圖像分解為局部對稱和反對稱的基函數表示,Gabor函數正是這種基信號的良好近似。二維Gabor函數可以看作二維高斯函數被某空間頻率調制的情況,在空域和空頻域都具有解析性,且可以達到空域和空頻域分辨率的下限,即:?u??v??x??y=1/(16π2),一個二維Gabor函數具有較多的變量,如空間位置、空頻分量、方向分量、帶寬、占空比等,這些量的選取視具體問題而定,一般都依賴于生物實驗的結果。Gabor變換的一個應用是用于圖像的表征。但由于Gabor函數本身并不能構成正交基,因此不能簡單地做內積。Bastiaans提出一種輔助函數法,可以彌補基函數不正交造成的混迭。Porat將其推廣到二維,但其計算量大,并且基函數的選擇須滿足一定的條件,并且不適合不完備的基。Daugman用一個三層神經網絡,兩層權重固定,一層權重可調整,依最小二乘方準則來尋找一組基函數的最佳展開系數。這種神經網絡的方法并不要求Gabor基函數完備,其基函數的選取在空頻域遵循log-polar模式,這也得到生物學上的驗證,但同樣需要大量的訓練時間。通過旋轉、平移、尺度變化形成的Gabor函數族,可稱為Gabor小波,它雖然不能構成正交基,但在特定參數下可構成緊框架,這樣一副圖像可由下式近似表征:為框架界。由于Gabor函數的生物特征,所以可用于特征提取和模式識別。這種情況下,我們不關心它是否可以最大限度地表征一副圖像,只關心在Gabor變換下,圖像的特征是否容易提取,是否更加顯著化,或者特征表征的有效數據量是否有所下降。Lades應用Gabor變換進行人臉識別取得了良好的效果,對于128×128的人臉圖像,采用5個采樣頻點,8個極化方向的Gabor小波與圖像卷積,在7×10的采樣網格上提取特征,則特征向量維數達到2800維。特征點通過隨機優(yōu)化達到最佳匹配,對圖像的幾何變化不敏感,因此可以提高識別率,并且圖像不需要歸一化預處理,這是其他識別算法如PCA,所不可比擬的。人眼是人臉圖像中最重要的特征,大多數的模式識別算法都需要精確地定位臉部特征,因此,人眼定位在人臉識別中具有重要的意義。只要人眼被精確定位,則臉部其他特征,如眉、鼻、嘴等,可由潛在的分布關系比較準確地定位。人臉可以較好地歸一化,預處理的效果也更明顯,同時也可提高識別速度和降低識別算法的復雜度。本文就是利用Gabor變換建立人眼模板,通過快速匹配尋優(yōu)算法來定位人眼。第一部分為引言,第二部分為圖像處理,第三部分為多分辯定位算法,第四部分為實驗結果,第五部分給出結論。2不同采樣方向的微織構擬合一個2DGabor函數是一個高斯包絡的平面波,式(1)比較普遍地用于特征提取中:ψ(kr,rr)=σkr22expuf8ecuf8ecuf8eduf8eb-kr22σrr22uf8f7uf8f7uf8f8uf8f6?uf8efuf8efuf8f0uf8eeekir·rr-e-σ22uf8fauf8fauf8fbuf8f9(1)是平面波波矢量,其模值控制了高斯包絡的寬度。σ是與小波頻率帶寬有關的常數,當帶寬?ω=1octave時,σ≈π;?ω=15.octave時,σ≈.25;?ω=2octave時,σ≈.196。項消除了直流分量(如均勻光照)的影響。在空頻域上,以半octave采樣為例,采樣模式取5個不同頻帶的小波,;每個小波都有6個不同的方向,即φ=πj/6,j=0,1,……5。幾種采樣策略如圖1所示。由于Gabor函數是復函數,它具有一個很好的性質,假定圖像表示為I(rr),則有即卷積濾波的結果就是Gabor基展開系數,它是復數,為了減輕運算的復雜性,對人眼定位來說僅采用其模值。實驗中采用的模板是3×3網格,如圖2所示。則整個特征矢量的維數為30×9=270維,相對于識別所采用的特征矢量維數已大大降低,因此可以顯著地提高尋優(yōu)速度。正如彈性圖匹配(ElasticGraphMatching)一樣,在人眼定位中仍然采用全局尋優(yōu)的策略,只是不需要第二步變形匹配操作,它的尋優(yōu)勢能函數為一個比較重要的問題是左眼模板是不是常定位在右眼上?這可以從圖3中看出,全局搜索的勢能最小點十分明顯,并不存在一個十分接近它的另外的最小點,也就是說,左眼模板總是能定位在左眼上,同樣,右眼模板也總是能定位在右眼上。但是在尋優(yōu)的路徑上,確實存在一些另外的極小值點。如果采用梯度下降法進行快速搜索的話,則有可能陷入局部極小值。一個改進的考慮是在可能的局部極小值處進行強制跳轉(即結合coarse-to-fine和fine-to-coarse),問題是難以確定跳轉的次數及步長,只能根據經歷的局部極小值,選取最小值記錄下來,如果有別的更小的點,則以新位置代替之,最終可以很好地定位。如果實驗的數據庫比較大的話,則額外花費的時間也是可觀的。4抗起眼位置檢測一個恰當的人眼定位的數據庫是很難選擇的,這不但決定于研究問題的側重點,也決定于數據庫本身,因為它影響到實驗結論是否具有普遍性。本實驗采用的是Manchester人臉庫的圖像,具有表情、頭部位置、傾側、背景干擾、眼鏡等變化。定位策略是,先建立不同分辨率的幾組模板,對其中之一進行由低分辨率到高分辨率的金字塔尋優(yōu),凡是正確定位的(以眼球上下左右兩個像素為準),在下一組模板尋優(yōu)以前篩選出去,如此遍歷各組模板。雙眼定位的結果示例于圖6。實驗在左眼、右眼和雙眼上針對不同組數模板得到的檢測率如圖7??梢钥闯?在僅有4組模板的情況下,雙眼正確檢測率可達90%以上,單眼可達95%左右。在增加模板組數的情況下,對雙眼定位進一步研究,結果如圖8。可見在經歷了初始幾組模板檢測率提高很快以后,再增加模板,改善的效果不大,對于左眼定位位置的一組統(tǒng)計數據如表1,可以看出和圖3,4,5表明的一致,即左眼模板一般仍定位于左眼,定位于右眼的只寥寥幾個,還不如錯誤定位于嘴上的多。一個有意思的看法是嘴與眼具有某些相似性,這實際上可以由Gabor小波的性質得到解釋,對方向敏感的Gabor小波,顯然對于同是垂直梯度變化比較大的嘴和眼都有較大的展開系數,這就造成匹配時模值比較具有一定的相似性。5人臉資特征提取基于Gabor濾波器的圖像表征、壓縮和模式識別的研究比較多。但考慮到基于Gabor變換的識別算法對預處理要求不高,但運算時間延長。故而可以利用它來進行人臉面部特征的定位提取,這不但是大多數識別算法所必須的,也與高等動物的視覺特性有一致性,并能在一定程度上提高運算速度。作者還將這種定位算法應用于Yale人臉,在一組模板下,對于66個人臉,正確定位52個,檢測率為78.8%。一般來說,基于Gabor變換的人眼定位對于光照強度比較敏感,尤其是側面光。對于帶眼鏡且光照變化大的情況尤其差。但對于一定的尺度、旋轉、表情等都具有良好的魯棒性。3低分辨率圖像在實踐中,可以采用多分辯分析解決這個問題,具體地說,就是通過高斯金字塔法建立一組不同分辨率的人臉圖像,最高分辨率的就是原始圖像,令為金字塔第0層,下一個分辨率的圖像就是上一級分辨率圖像的低通濾波輸出,頻帶為上一級的一半,為金字塔第1層,依次類推。每一個分辨率水平的圖像都需要經過預定義的一組Gabor濾波器濾波以提取特征,同時,每個分辨率水

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論