人臉識別研究的背景目的意義現(xiàn)狀以及重點難點_第1頁
人臉識別研究的背景目的意義現(xiàn)狀以及重點難點_第2頁
人臉識別研究的背景目的意義現(xiàn)狀以及重點難點_第3頁
人臉識別研究的背景目的意義現(xiàn)狀以及重點難點_第4頁
人臉識別研究的背景目的意義現(xiàn)狀以及重點難點_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、人臉識別研究的背景目的意義現(xiàn)狀以及重點難點1 研究背景12 研究目的意義21)證件驗證22)刑偵破案23)入口控制24)信息安全25)視頻監(jiān)控33 國內(nèi)外研究現(xiàn)狀33.1 基于幾何特征的人臉識別43.2 基于子空間分析的人臉識別41)主元分析(PCA)方法42)線性鑒別分析(LDA)方法53)保局投影(LPP)方法63.3 基于彈性圖匹配的人臉識別64 人臉識別主要內(nèi)容與技術困難71 研究背景 生物特征識別技術是利用人體生物特征進行身份認證的一種技術。生物特征是人的內(nèi)在屬性,具有很強的自身穩(wěn)定性和個體差異性,因此是身份驗證的理想依據(jù)。生物特征識別系統(tǒng)對生物特征進行特征提取并組成特征模板,當人們

2、應用該識別系統(tǒng)進行身份認證時,識別系統(tǒng)提取其特征并與數(shù)據(jù)庫中的特征模板進行比對,以確定是否匹配,從而決定接受或拒絕該人。一般來說,人類的身份識別方式分為三類:1)特征物品:包括各種證件,如身份證、學生證和護照等;2)特殊知識:包括各種密匙如(密碼、口令等)和暗號等;3)人類生物特征:包括各種人類的生理和行為特征,如人臉、指紋、掌紋、虹膜、聲音等。前兩類特征識別方法屬于傳統(tǒng)意義上的身份識別技術,有著方便、快捷的特點。但這些特征識別方法致命的缺點是安全性差、易偽造竊取。相比較而言,人體生物特征由于其穩(wěn)定性和獨特性,成為最理想的身份識別特征。相比于其他生物特征,基于人臉面部特征的識別具有主動性、非侵

3、犯性和用戶友好性等許多優(yōu)點,它是一種更方便直接、更友好、更容易被人們接受的識別方法。與此同時,人臉自身存在著諸如表情、姿態(tài)、光照強度變化以及飾物影響等,都會使人臉識別方法的的效果及穩(wěn)定性受到很大的影響。在過去的幾十年中,研究者們主要致力于從人臉識別算法的角度來提高生物特征識別的精度。時至今日,很多生物識別技術(如:指紋識別、人臉識別、聲音識別、虹膜識別等)都具有了很高的識別精度且有相對較好的用戶友好性。2 研究目的意義人臉識別是當前人工智能和模式識別的研究熱點,它是近20年來才發(fā)展起來的,20世紀90年代后更成為科研熱點。最初的應用源于公安部門關于罪犯照片的存檔管理和刑偵破案,隨著科學技術的發(fā)

4、展和社會的進步,進行快速、有效、自動的人臉識別的技術要求日益迫切。不僅如此,目前該技術在國家公共安全、社會安全及商業(yè)等領域都有很多應用,主要有:1)證件驗證在許多場合,證件驗證是檢驗某個人身份的一種常用手段,而身份證、駕駛執(zhí)照以及其他很多證件上都有照片,那么這項工作就可以交給機器完成,用以實現(xiàn)自動化智能管理。 2)刑偵破案當公安刑偵部門未獲得罪犯的照片時,我們可以根據(jù)目擊證人的描述,先由專業(yè)人員描出犯罪嫌疑人的肖像草圖,然后用計算機合成出大概的人臉圖像,再將此圖像和數(shù)據(jù)庫里的大量圖像進行比對,找到犯罪嫌疑人。這樣不僅節(jié)省了人力物力,更讓犯罪嫌疑人難逃法網(wǎng)。 3)入口控制在機場、港口等許多出入境

5、關口,由于人力有限,我們需要對關鍵出入口進行視頻監(jiān)控,一旦發(fā)現(xiàn)恐怖分子或違規(guī)人員進入視頻監(jiān)控范圍,保安人員馬上可以采取行動進行抓捕或阻止。4)信息安全由于科技的進步,犯罪分子偽造技術越來越高明,假身份證、假護照泛濫。即使是在在電子商務領域,黑客破譯計算機口令也比較容易,這給社會治安,商業(yè)機密帶來挑戰(zhàn)。所以,把有著獨立、唯一性和穩(wěn)定性的人臉生物特征作為密碼口令,使得犯罪分子難以偽造和攻擊,也使得國家安全部門、軍方等系統(tǒng)更加安全可靠。5)視頻監(jiān)控在許多銀行、公司、公共場所等處都裝有視頻監(jiān)視系統(tǒng)。當出現(xiàn)異常的時候需要對采集到的圖像進行具體分析,就要用到人臉的檢測、跟蹤和識別技術。此外,人臉識別技術在

6、醫(yī)學、通道控制和小區(qū)、人機交互等領域也具有廣闊的應用前景。在學術研究領域,人臉識別的研究涉及到圖像處理、模式識別、神經(jīng)網(wǎng)絡、計算機視覺、人工智能、生理學、心理學及認知科學等多方面的知識。對人臉識別的深入研究不僅可以促進這些基礎研究的發(fā)展與交叉,而且有助于新的研究方向的產(chǎn)生,具有重要的學術價值。由此可見,人臉識別技術的研究具有極大的社會意義,甚至可能形成一個巨大的、對人類生產(chǎn)生活產(chǎn)生深遠影響的產(chǎn)業(yè)。3 國內(nèi)外研究現(xiàn)狀人臉識別技術誕生于二十世界六十年代,但主要局限于收集和分析人臉面部特征(雙眼距離,臉頰寬度等)。七十至八十年代,有了進一步研究。但都是基于小型的圖像樣本集(人臉的唯一性、嬰兒感知人臉

7、、識別倒轉(zhuǎn)人臉圖像、人腦在人臉感知中的作用)。進入九十年代后,人臉識別得到了巨大的發(fā)展(特征臉(Eigenfaces)、Fisher臉(Fisherfaces)5以及彈性圖匹配(EGM)等人臉識別算法; FaceIt,Viisage system,TrueFace等人臉識別軟件。FERET項目是本階段一個重要的事件,在1994年,1995年和1996年的3次人臉識別評測,極大的促進了這些算法的改進和實用化)。近十年以來,人臉識別已經(jīng)發(fā)展成為最熱門的生物特征識別技術(基于幾何特征的人臉識別、基于子空間的人臉識別、基于彈性圖匹配的人臉識別;Geroghiades等人提出的基于光照錐模型的多姿態(tài)、多

8、光照條件人臉識別方法,應用于以支持向量機為代表的統(tǒng)計學習理論)。 目前,很多國家展開了有關人臉識別的研究,主要有美國(美國的卡耐基梅隆大學(CMU)機器人研究所、麻省理工學院(MIT)媒體實驗室和人工智能實驗室)、歐洲(英國的Surey大學視覺語音和信號處理研究中心、法國的INRIA研究所,芬蘭的赫爾辛基大學CIS研究所、瑞士IDIAP研究所)、日本(ART研究所)等。另外,基于AdaBoost的人臉識別算法、基于彩色信息的方法、基于形狀分析的方法以及多模態(tài)信息融合方法也有大量研究與實驗。國內(nèi)于二十世紀九十年代開始對人臉識別進行研究(中國科學院自動化所李子青近紅外的人臉識別;中國科學院計算所高

9、文教授研究小組;清華大學自動化系張長水教授,電子系蘇光大教授,丁曉青教授等;南京理工大學楊靖宇教授研究小組;中山大學馮國燦教授、賴建煌教授;浙江大學吳朝輝教授研究小組;南京大學周志華教授研究小組等)。近十年來,人臉識別已經(jīng)發(fā)展成為一種最熱門的生物特征識別技術。在FERET工程的基礎上,美國國防部每隔兩年都要對大量的人臉識別算法和系統(tǒng)進行測試。到目前為止已經(jīng)完成了FRVT2000、FRVT2002、FRGC和FRVT2006共四次測試,對人臉識別技術的發(fā)展成熟起到了極大的推動作用。為了提高人臉識別系統(tǒng)的魯棒性,研究者們在改進已有人臉識別算法性能的同時提出了新的基于三維(3D)模型的人臉識別方法,

10、進一步擴大了人臉識別的研究范圍。至今,涌現(xiàn)出的人臉識別算法已數(shù)不勝數(shù),概括起來,這些方法可以分為以下四大類:1)基于幾何特征的人臉識別;2)基于子空間的人臉識別;3)基于彈性圖匹配的人臉識別;下面我們分別介紹各類人臉識別方法在國內(nèi)的研究進展及研究狀況,并著重介紹本文主要研究的子空間人臉識別方法。3.1 基于幾何特征的人臉識別采用幾何特征進行人臉識別,首先必須自動提取人臉的幾何特征。常用的方法有灰度的水平或垂直投影、基于邊緣的特征提取等。由于人臉器官的關鍵點在進行水平或垂直投影后對應著投影圖的波峰或波谷,因此可以用來確定臉部主要器官的位置。這種方法雖然簡單,但是精度較差?;趲缀翁卣鞯淖R別方法,

11、其存在的主要問題在于沒有形成一個統(tǒng)一的優(yōu)秀的特征提取標準。在描述人臉的時候,受到表情、光照、姿態(tài)的影響比較大,無法準確地描述人臉特征。盡管如此,基于幾何特征的方法在處理人臉表情分析時,仍是一個最有效的依據(jù)。同時,目前已經(jīng)提出了很多改進的特征提取的算法,使得人臉幾何特征的提取越來越趨于合理。3.2 基于子空間分析的人臉識別子空間分析的思想就是根據(jù)一定的性能目標來尋找一線性或非線性的空間變換,把原始信號數(shù)據(jù)壓縮到一個低維子空間,使數(shù)據(jù)在子空間中的分布更加緊湊,提供了更好的數(shù)據(jù)描述手段,另外計算的復雜度也大大降低?;谧涌臻g的方法主要包括:PCA方法、LDA方法和LPP方法。1)主元分析(PCA)方

12、法主元分析的思想來源于K一L變換,目的是通過線性變換尋找一組最優(yōu)的標準正交向量基,通過它們的線性組合來重建原始樣本,并使得重建后的新樣本與原始樣本之間的均方誤差最小。PCA的兩大優(yōu)點是:一是消除了模式樣本之間的相關性;二是實現(xiàn)了模式樣本的維數(shù)壓縮。PCA方法通常采用訓練樣本協(xié)方差矩陣的特征向量系作為展開基(即K-L坐標軸),若干個最大特征值所對應的特征向量被稱為主元(或主成分),模式樣本在這些主元上線性投影后,所得的投影系數(shù)就是主元特征。原模式樣本可以表示為這些主元與投影系數(shù)乘積的代數(shù)和。識別時,只需將測試圖像投影到主元子空間上,得到一組投影系數(shù),再將測試圖像的投影系數(shù)與訓練圖像的投影系數(shù)作比

13、較,就能確定哪一幅訓練圖像與測試圖像最接近。特征臉(Eigenface)方法由Truk和Pentland提出,是PCA方法在人臉識別上早期的成功應用之一。Moghaddam等人根據(jù)主元分解后的兩個正交的子空間的特征,提出基于主元分析的貝葉斯框架。Liu等人提出結合主元分析的概率推理模型,假設在主元子空間中每類的類條件概率服從正態(tài)分布。為了減少PCA方法的運算量,Yang和zliang對PCA方法進行了分析,提出了一種稱作二維主元分析 (2DPCA)的人臉識別方法。2DPCA方法可以直接在二維圖像矩陣上進行處理,而不需要事先將圖像矩陣轉(zhuǎn)換為一維向量,從而避免了龐大的計算量,解決了PCA方法在計算

14、復雜性上的困擾。2)線性鑒別分析(LDA)方法盡管PCA方法在最小均方差意義下給出了模式樣本的最優(yōu)表示,但由于它是以所有樣本的最優(yōu)重建為目的,因此對描述不同類樣本之間的差異而言,不一定是最優(yōu)的描述,即用PCA來描述人臉識別的特征是不充分的。線性鑒別分析不同于主元分析,它是以樣本的可分性為目標,尋找一組線性變換使每類的類內(nèi)離散度最小、類間的離散度最大,因此從理論上說,比較適合于模式識別問題。經(jīng)典的線性鑒別分析中使用的是Fish準則函數(shù),所以線性鑒別分析又被稱為Fish線性鑒別分析 (Fisher LDA,F(xiàn)DA)。FDA方法的基本思想是:選擇使得Fisher準則函數(shù)達到極大值的向量作為最優(yōu)投影方

15、向,使得模式樣本在該方向上投影后,達到最大的類間離散度和最小的類內(nèi)離散度。在Fisher思想的基礎上,Wilks、Duda與Hart分別提出了鑒別向量集的概念,即尋找一組鑒別向量構成子空間,以原始樣本在該子空間內(nèi)的投影向量作為鑒別特征用于識別,此即經(jīng)典的Fisher線性判別分析(Fisher LDA,F(xiàn)LDA)方法,F(xiàn)LDA的目的就是要求解使Fisher準則函數(shù)值達到最大的向量。然而,在人臉等圖像識別問題中處理的樣本通常是高維的有限樣本,即小樣本問題(Small Sample Size Problem)。由于在實際問題中難以找到足夠多的訓練樣本來保證類內(nèi)散布矩陣的可逆性,因此求解FLDA的廣義

16、特征方程存在奇異問題。隨后,為解決此類問題,Chen等提出零空間線性判別分析(NLDA)的方法,此方法保存了保局類內(nèi)散布零空間中的有效鑒別信息,優(yōu)化了提取的人臉特征。有效提高了人臉識別的精度,但NLDA的缺點是計算復雜耗時,實際應用中很難達到實時處理。線性子空間方法本質(zhì)上都是基于線性變換的特征提取方法,抽取得到的都是線性特征,對于人臉識別中存在的絕大多數(shù)復雜的非線性分類問題,其結果有時不能令人滿意,因此,尋找有效的非線性方法就成了迫切的問題。3)保局投影(LPP)方法盡管PCA與LDA在人臉識別的特征降維方面已經(jīng)取得了一定成果,但對于極可能分布于低維非線性流行上的人臉樣本來說,他們很難提取圖像

17、空間的本質(zhì)特征。因此,He和Niyogi提出了保局投影(LPP)方法,該方法通過利用線性運算求解廣義特征值的問題有效地描述了數(shù)據(jù)的非線性結構。LPP的目標函數(shù)是使得訓練樣本投影后的局部散布最小化,然而由于此目標函數(shù)不能保證經(jīng)LPP的投影空間投影后得到的特征向量能適用于模式分類,所以其分類性能是比較弱的。為改善LPP分類性能較弱的問題,我們研究了利用弱學習方法融合多個弱分類器進行人臉識別是一種增強分類性能的有效方法(如:隨機子空間方法(Random Subspace)、Bagging和Boosting)。解決了在小樣本集上建立分類器有偏的現(xiàn)象,提高了識別性能。我們將在后面的章節(jié)中以LPP為基礎,

18、結合Bagging方法對人臉特征提取與識別進行研究。3.3 基于彈性圖匹配的人臉識別人臉和其他的3D物體一樣,會由于視點的不同而呈現(xiàn)不同的形狀。此外,人臉還是非剛性的,面部表情的變化同樣會改變?nèi)四樀男螤睢km然基于彈性圖匹配的方法對于有姿態(tài)和表情變化的人臉識別問題有很好的識別效果,但是此方法并沒有考慮人臉圖像的尺度變化以及圖像在平面內(nèi)的旋轉(zhuǎn)。在實際環(huán)境中,通過補償?shù)姆绞綄崿F(xiàn)人臉大小、位置、光照變化等的標準化往往比較困難,這將導致基于彈性圖匹配的人臉識別方法的性能大幅下降。總體來說,基于彈性圖匹配的人臉識別方法充分考慮了人臉圖像的局部細節(jié)特征,保留了人臉的空間分布信息,對于人臉識別,尤其是受控條件

19、下的正面人臉認證具有很好的效果。而該方法的缺點主要是計算量大,難以達到實時處理。 將提取人臉幾何特征應用于人臉識別雖然是一種有效的分析依據(jù),但實際應用中,受到表情、光照、姿態(tài)的影響比較大,描述人臉特征時精度較差;而彈性圖匹配的方法在實際應用中面臨同樣的問題,盡管其在正面人臉識別中具有不錯的效果,但其仍暴露了耗時、實效性不強的缺點。針對二者,基于子空間方法有著一定優(yōu)勢,我們研究了子空間的一些主要方法,并作為本文實驗的主要途徑。4 人臉識別主要內(nèi)容與技術困難人臉識別是一個視覺模式識別問題,它利用攝像機將隨光照、姿態(tài)、表情等環(huán)境因素和人自身因素的變化而變化的三維人臉轉(zhuǎn)變?yōu)槎S人臉圖像進行識別。一般地,自動人臉識別系統(tǒng)由人臉檢測、人臉校正、特征提取和特征匹配四個模塊構成。首先,人臉檢測模塊對攝像機圖像中潛在的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論