人臉識別主要算法原理_第1頁
人臉識別主要算法原理_第2頁
人臉識別主要算法原理_第3頁
人臉識別主要算法原理_第4頁
人臉識別主要算法原理_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上人臉識別主要算法原理主流的技術(shù)基本上可以歸結(jié)為三類,即:基于幾何特征的方法、基于模板的方法和基于模型的方法。1. 基于幾何特征的方法是最早、最傳統(tǒng)的方法,通常需要和其他結(jié)合才能有比較好的效果;2. 基于模板的方法可以分為基于相關(guān)匹配的方法、特征臉方法、線性判別分析方法、奇異值分解方法、神經(jīng)網(wǎng)絡(luò)方法、動態(tài)連接匹配方法等。3. 基于模型的方法則有基于隱馬爾柯夫模型,主動形狀模型和主動外觀模型的方法等。1. 基于幾何特征的方法人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成,正因為這些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個人臉千差萬

2、別,因此對這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以做為人臉識別的重要特征。幾何特征最早是用于人臉側(cè)面輪廓的描述與識別,首先根據(jù)側(cè)面輪廓曲線確定若干顯著點,并由這些顯著點導(dǎo)出一組用于識別的特征度量如距離、角度等。Jia 等由正面灰度圖中線附近的積分投影模擬側(cè)面輪廓圖是一種很有新意的方法。  采用幾何特征進(jìn)行正面人臉識別一般是通過提取人眼、口、鼻等重要特征點的位置和眼睛等重要器官的幾何形狀作為分類特征,但Roder對幾何特征提取的精確性進(jìn)行了實驗性的研究,結(jié)果不容樂觀??勺冃文0宸梢砸暈閹缀翁卣鞣椒ǖ囊环N改進(jìn),其基本思想是 :設(shè)計一個參數(shù)可調(diào)的器官模型&#

3、160;(即可變形模板),定義一個能量函數(shù),通過調(diào)整模型參數(shù)使能量函數(shù)最小化,此時的模型參數(shù)即做為該器官的幾何特征。  這種方法思想很好,但是存在兩個問題,一是能量函數(shù)中各種代價的加權(quán)系數(shù)只能由經(jīng)驗確定,難以推廣,二是能量函數(shù)優(yōu)化過程十分耗時,難以實際應(yīng)用。 基于參數(shù)的人臉表示可以實現(xiàn)對人臉顯著特征的一個高效描述,但它需要大量的前處理和精細(xì)的參數(shù)選擇。同時,采用一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系,忽略了局部細(xì)微特征,造成部分信息的丟失,更適合于做粗分類,而且目前已有的特征點檢測技術(shù)在精確率上還遠(yuǎn)不能滿足要求,計算量也較大。 2. 局部

4、特征分析方法(Local Face Analysis)  主元子空間的表示是緊湊的,特征維數(shù)大大降低,但它是非局部化的,其核函數(shù)的支集擴(kuò)展在整個坐標(biāo)空間中,同時它是非拓?fù)涞模硞€軸投影后臨近的點與原圖像空間中點的臨近性沒有任何關(guān)系,而局部性和拓?fù)湫詫δJ椒治龊头指钍抢硐氲奶匦裕坪踹@更符合神經(jīng)信息處理的機(jī)制,因此尋找具有這種特性的表達(dá)十分重要?;谶@種考慮,Atick提出基于局部特征的人臉特征提取與識別方法。這種方法在實際應(yīng)用取得了很好的效果,它構(gòu)成了FaceIt人臉識別軟件的基礎(chǔ)。3. 特征臉方法(Eigenface或PCA)特征臉方法是90

5、年代初期由Turk和Pentland提出的目前最流行的算法之一,具有簡單有效的特點, 也稱為基于主成分分析(principal component analysis,簡稱PCA)的人臉識別方法。  特征子臉技術(shù)的基本思想是:從統(tǒng)計的觀點,尋找人臉圖像分布的基本元素,即人臉圖像樣本集協(xié)方差矩陣的特征向量,以此近似地表征人臉圖像。這些特征向量稱為特征臉(Eigenface)。實際上,特征臉反映了隱含在人臉樣本集合內(nèi)部的信息和人臉的結(jié)構(gòu)關(guān)系。將眼睛、面頰、下頜的樣本集協(xié)方差矩陣的特征向量稱為特征眼、特征頜和特征唇,統(tǒng)稱特征子臉。特征子臉在相應(yīng)的圖像空

6、間中生成子空間,稱為子臉空間。計算出圖像窗口在子臉空間的投影距離,若窗口圖像滿足閾值比較條件,則判斷其為人臉。   基于特征分析的方法,也就是將人臉基準(zhǔn)點的相對比率和其它描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識別特征向量,這種基于整體臉的識別不僅保留了人臉部件之間的拓?fù)潢P(guān)系,而且也保留了各部件本身的信息,而基于部件的識別則是通過提取出局部輪廓信息及灰度信息來設(shè)計具體識別算法。現(xiàn)在Eigenface(PCA)算法已經(jīng)與經(jīng)典的模板匹配算法一起成為測試人臉識別系統(tǒng)性能的基準(zhǔn)算法;而自1991年特征臉技術(shù)誕生以來,研究者對其進(jìn)行了各種各樣的實驗和理論分析,F(xiàn)ERE

7、T'96測試結(jié)果也表明,改進(jìn)的特征臉?biāo)惴ㄊ侵髁鞯娜四樧R別技術(shù),也是具有最好性能的識別方法之一。    該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實際為“局部人體特征分析”和“圖形/神經(jīng)識別算法?!边@種算法是利用人體面部各器官及特征部位的方法。如對應(yīng)幾何關(guān)系多數(shù)據(jù)形成識別參數(shù)與中所有的原始參數(shù)進(jìn)行比較、判斷與確認(rèn)。Turk和Pentland提出特征臉的方法,它根據(jù)一組人臉訓(xùn)練圖像構(gòu)造主元子空間,由于主元具有臉的形狀,也稱為特征臉 

8、; ,識別時將測試  圖像投影到主元子空間上,得到一組投影系數(shù),和各個已知人的人臉圖像比較進(jìn)行識別。Pentland等報告了相當(dāng)好的結(jié)果,在 200個人的 3000幅圖像中得到 95%的正確識別率,在數(shù)據(jù)庫上對 150幅正面人臉象只有一個誤識別。但系統(tǒng)在進(jìn)行特征臉方法之前需要作大量預(yù)處理工作如歸一化等。  在傳統(tǒng)特征臉的基礎(chǔ)上,研究者注意到特征值大的特征向量 (即特征臉 )并不一定是分類性能好的方向,據(jù)此發(fā)展了多種特征 (子空間 )選擇方法,如Peng的雙子空間方法

9、、Weng的線性歧義分析方法、Belhumeur的FisherFace方法等。事實上,特征臉方法是一種顯式主元分析人臉建模,一些線性自聯(lián)想、線性壓縮型網(wǎng)則為隱式的主元分析方法,它們都是把人臉表示為一些向量的加權(quán)和,這些向量是訓(xùn)練集叉積陣的主特征向量,Valentin對此作了詳細(xì)討論??傊?,特征臉方法是一種簡單、快速、實用的基于變換系數(shù)特征的算法,但由于它在本質(zhì)上依賴于訓(xùn)練集和測試集圖像的灰度相關(guān)性,而且要求測試圖像與訓(xùn)練集比較像,所以它有著很大的局限性。基于KL 變換的特征方法基本原理:  KL變換是圖象壓縮中的一種最優(yōu)正交變換,人們將它用于統(tǒng)計特征提取,從而形成

10、了子空間法模式識別的基礎(chǔ),若將KL變換用于人臉識別,則需假設(shè)人臉處于低維線性空間,且不同人臉具有可分性,由于高維圖象空間KL變換后可得到一組新的正交基,因此可通過保留部分正交基,以生成低維人臉空間,而低維空間的基則是通過分析人臉訓(xùn)練樣本集的統(tǒng)計特性來獲得,KL變換的生成矩陣可以是訓(xùn)練樣本集的總體散布矩陣,也可以是訓(xùn)練樣本集的類間散布矩陣,即可采用同一人的數(shù)張圖象的平均來進(jìn)行訓(xùn)練,這樣可在一定程度上消除光線等的干擾,且計算量也得到減少,而識別率不會下降。4. 基于彈性模型的方法   等人針對畸變不變性的物體識別提出了動態(tài)鏈接模型 (),將物體用稀

11、疏圖形來描述 (見下圖),其頂點用局部能量譜的多尺度描述來標(biāo)記,邊則表示拓?fù)溥B接關(guān)系并用幾何距離來標(biāo)記,然后應(yīng)用塑性圖形匹配技術(shù)來尋找最近的已知圖形。等人在此基礎(chǔ)上作了改進(jìn),用圖像庫做實驗,用 300幅人臉圖像和另外 300幅圖像作比較,準(zhǔn)確率達(dá)到 97.3%。此方法的缺點是計算量非常巨大 。  Nastar將人臉圖像 ( ) (,)建模為可變形的 3網(wǎng)格表面 (,(,) ) (如下圖所示 ),從而將人臉匹配問題轉(zhuǎn)化為可變形曲面的彈性匹配問題。利

12、用有限元分析的方法進(jìn)行曲面變形,并根據(jù)變形的情況判斷兩張圖片是否為同一個人。這種方法的特點在于將空間 (,)和灰度(,)放在了一個 3空間中同時考慮,實驗表明識別結(jié)果明顯優(yōu)于特征臉方法。  Lanitis等提出靈活表現(xiàn)模型方法,通過自動定位人臉的顯著特征點將人臉編碼為 83個模型參數(shù),并利用辨別分析的方法進(jìn)行基于形狀信息的人臉識別。彈性圖匹配技術(shù)是一種基于幾何特征和對灰度分布信息進(jìn)行小波紋理分析相結(jié)合的識別算法,由于該算法較好的利用了人臉的結(jié)構(gòu)和灰度分布信息,而且還具有自動精確定位面部特征點的功能,因而具有良好的識別效果,適應(yīng)性強(qiáng)識別率較高,該

13、技術(shù)在FERET測試中若干指標(biāo)名列前茅,其缺點是時間復(fù)雜度高,速度較慢,實現(xiàn)復(fù)雜。5. 神經(jīng)網(wǎng)絡(luò)方法(Neural Networks)人工神經(jīng)網(wǎng)絡(luò)是一種非線性動力學(xué)系統(tǒng),具有良好的自組織、自適應(yīng)能力。目前神經(jīng)網(wǎng)絡(luò)方法在人臉識別中的研究方興未艾。Valentin提出一種方法,首先提取人臉的 50個主元,然后用自相關(guān)神經(jīng)網(wǎng)絡(luò)將它映射到 5維空間中,再用一個普通的多層感知器進(jìn)行判別,對一些簡單的測試圖像效果較好;Intrator等提出了一種混合型神經(jīng)網(wǎng)絡(luò)來進(jìn)行人臉識別,其中非監(jiān)督神經(jīng)網(wǎng)絡(luò)用于特征提取,而監(jiān)督神經(jīng)網(wǎng)絡(luò)用于分類。Lee等將人臉的特點用六條規(guī)則描述,

14、然后根據(jù)這六條規(guī)則進(jìn)行五官的定位,將五官之間的幾何距離輸入模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行識別,效果較一般的基于歐氏距離的方法有較大改善,Laurence等采用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人臉識別,由于卷積神經(jīng)網(wǎng)絡(luò)中集成了相鄰像素之間的相關(guān)性知識,從而在一定程度上獲得了對圖像平移、旋轉(zhuǎn)和局部變形的不變性,因此得到非常理想的識別結(jié)果,Lin等提出了基于概率決策的神經(jīng)網(wǎng)絡(luò)方法 (PDBNN),其主要思想是采用虛擬 (正反例 )樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí),從而得到較為理想的概率估計結(jié)果,并采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu) (OCON)加快網(wǎng)絡(luò)的學(xué)習(xí)。這種方法在人臉檢測、人臉定位和人臉識別的各個步驟

15、上都得到了較好的應(yīng)用,其它研究還有 :Dai等提出用Hopfield網(wǎng)絡(luò)進(jìn)行低分辨率人臉聯(lián)想與識別,Gutta等提出將RBF與樹型分類器結(jié)合起來進(jìn)行人臉識別的混合分類器模型,Phillips等人將MatchingPursuit濾波器用于人臉識別,國內(nèi)則采用統(tǒng)計學(xué)習(xí)理論中的支撐向量機(jī)進(jìn)行人臉分類。  神經(jīng)網(wǎng)絡(luò)方法在人臉識別上的應(yīng)用比起前述幾類方法來有一定的優(yōu)勢,因為對人臉識別的許多規(guī)律或規(guī)則進(jìn)行顯性的描述是相當(dāng)困難的,而神經(jīng)網(wǎng)絡(luò)方法則可以通過學(xué)習(xí)的過程獲得對這些規(guī)律和規(guī)則的隱性表達(dá),它的適應(yīng)性更強(qiáng),一般也比較容易實現(xiàn)。因此人工神經(jīng)網(wǎng)絡(luò)識別速度快,但識別率低 

16、;。而神經(jīng)網(wǎng)絡(luò)方法通常需要將人臉作為一個一維向量輸入,因此輸入節(jié)點龐大,其識別重要的一個目標(biāo)就是降維處理。   PCA的算法描述:利用主元分析法 (即 Principle Component Analysis,簡稱 PCA)進(jìn)行識別是由 Anderson和 Kohonen提出的。由于 PCA在將高維向量向低維向量轉(zhuǎn)化時,使低維向量各分量的方差最大,且各分量互不相關(guān),因此可以達(dá)到最優(yōu)的特征抽取。6. 其它方法:除了以上幾種方法,還有其它若干思路和方法,包括一下一些:1) 隱馬爾

17、可夫模型方法(Hidden Markov Model)2) Gabor 小波變換+圖形匹配(1)精確抽取面部特征點以及基于Gabor引擎的匹配算法,具有較好的準(zhǔn)確性,能夠排除由于面部姿態(tài)、表情、發(fā)型、眼鏡、照明環(huán)境等帶來的變化。(2)Gabor濾波器將Gaussian網(wǎng)絡(luò)函數(shù)限制為一個平面波的形狀,并且在濾波器設(shè)計中有優(yōu)先方位和頻率的選擇,表現(xiàn)為對線條邊緣反應(yīng)敏感。(3)但該算法的識別速度很慢,只適合于錄象資料的回放識別,對于現(xiàn)場的適應(yīng)性很差。3) 人臉等密度線分析匹配方法(1) 多重模板匹配方法該方法是在庫中存貯若干標(biāo)準(zhǔn)面像模板或面

18、像器官模板,在進(jìn)行比對時,將采樣面像所有象素與庫中所有模板采用歸一化相關(guān)量度量進(jìn)行匹配。(2) 線性判別分析方法(Linear Discriminant Analysis,LDA)(3)本征臉法  本征臉法將圖像看做矩陣 ,計算本征值和對應(yīng)的本征向量作為代數(shù)特征進(jìn)行識別 ,具有無需提取眼嘴鼻等幾何特征的優(yōu)點 ,但在單樣本時識別率不高 ,且在人臉模式數(shù)較大時計算量大 (4) 特定人臉子空間(FSS)算法該技術(shù)來源于但在本質(zhì)上區(qū)別于傳統(tǒng)的"特征臉"人臉識別方法。"特征臉"方法中所有人共有一個人臉子空間,而該方法則為每一個體人臉建立一個該個體對象所私有的人臉子空間,從而不但能夠更好的描述不同個體人臉之間的差異性,而且最大可能地擯棄了對識別不利的類內(nèi)差異性和噪聲,因而比傳統(tǒng)的"特征臉?biāo)惴?quot

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論