基于人臉識別的門禁系統(tǒng)設(shè)計與實現(xiàn)_第1頁
基于人臉識別的門禁系統(tǒng)設(shè)計與實現(xiàn)_第2頁
基于人臉識別的門禁系統(tǒng)設(shè)計與實現(xiàn)_第3頁
基于人臉識別的門禁系統(tǒng)設(shè)計與實現(xiàn)_第4頁
基于人臉識別的門禁系統(tǒng)設(shè)計與實現(xiàn)_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上基于人臉識別的門禁系統(tǒng)設(shè)計與實現(xiàn)The Study of Face Recognition and Applications in the Venues Access Control System摘要伴隨著世界經(jīng)濟的飛速發(fā)展,在現(xiàn)代社會當(dāng)中,對于企業(yè)相關(guān)知識產(chǎn)權(quán)的保護一直是企業(yè)關(guān)注的重點。但是,由于在日常的經(jīng)濟活動當(dāng)中,企業(yè)內(nèi)部常常有非內(nèi)部人員進入到企業(yè)當(dāng)中,因此,如何通過一定的方法限定其活動區(qū)域就成為企業(yè)保護自身核心競爭力安全的重要方法。而隨著現(xiàn)代生物技術(shù)產(chǎn)業(yè)的飛速發(fā)展以及其與計算機領(lǐng)域聯(lián)系的日益緊密,通過生物學(xué)與計算機相結(jié)合的方法成為許多門禁系統(tǒng)研究的熱門方向。作

2、為一種特殊的生物識別方法,人臉識別系統(tǒng)相比于其他的識別系統(tǒng)而言具有特異性強、識別誤差小、使用方便以及普適性優(yōu)良等特點在許多行業(yè)當(dāng)中得到了廣泛的研究與應(yīng)用。自從上世紀六十年代Chan&Bledsoe提出利用人臉特征進行身份識別與鑒定以來,人臉識別技術(shù)得到了長足的發(fā)展,并出現(xiàn)了一些典型算法與系統(tǒng)。但是,在實際的應(yīng)用過程當(dāng)中,由于實驗的條件與現(xiàn)實環(huán)境當(dāng)中的條件存在較大的差異,因此,實驗中所取得的數(shù)據(jù)在現(xiàn)實生活當(dāng)中并不能完全的重復(fù)出來,因此,有多的測試性能良好的識別方式在實際的應(yīng)用過程當(dāng)中的效果并不明顯。相關(guān)的研究表明,早諸多影響因素當(dāng)中,對于人臉識別影響最為顯著的因素主要有采集以及識別過程當(dāng)

3、中的光線強度、識別對象的表情以及年齡等、信息采集與應(yīng)用過程當(dāng)中采集對象的姿態(tài)等。因此要研究出實用的、大眾可接受的人臉識別系統(tǒng)還有很多工作要做。本文是在現(xiàn)有人臉識別技術(shù)的基礎(chǔ)上,重點探討了影響人臉識別性能的幾個方面。本論文的主要工作如下:(1)研究了人臉特征點的精確定位方法,介紹了常用的人眼定位方法,指出了這些方法的不足,并提出了一種聯(lián)合的人眼睛精確定位算法,并測試、分析了該算法定位效果。(2)總結(jié)了人臉識別中現(xiàn)有的光照問題解決方法,利用小波技術(shù)分析了光照、表情等變化對人臉圖像低頻信息的影響。提出了一種基于小波重建的人臉去光照方法,并分析和比較了該算法處理受光照、表情影響人臉圖像的識別效果。(3

4、)分析了現(xiàn)階段比較典型的人臉圖像的特征提取方法,指出了各個算法的優(yōu)點和不足之處,提出了一種新提取人臉圖像中有利于識別的全局信息和局部結(jié)構(gòu)信息的獨立源特征的方法。并在公開數(shù)據(jù)庫上進行了測試比較與分析。(4)設(shè)計并實現(xiàn)了一個模塊化的人臉識別算法仿真與開發(fā)平臺,并詳細地介紹了各個模塊應(yīng)用的算法與工作流程。結(jié)合人臉識別技術(shù)在大型場館門禁系統(tǒng)中的應(yīng)用,給出了一種基于集群計算機工作模式的門禁系統(tǒng),并引入了Intel的MMXSSE技術(shù)的系統(tǒng)并行加速算法。(5)介紹了人臉識別門禁系統(tǒng)在2008年好運北京測試賽以及29屆北京奧運會場館門禁系統(tǒng)中的應(yīng)用,給出了系統(tǒng)測試性能,并進行了分析。本論文的研究成果不但在魯棒

5、人臉識別技術(shù)上有一定的參考意義,而且對系統(tǒng)的高速實時運行有一定的借鑒意義,所提出的算法部分已成功地應(yīng)用在2008年好運北京測試賽、29屆北京奧運會以及殘奧會場館門禁系統(tǒng)中。關(guān)鍵詞:人臉識別;人臉檢測;特征點精確定位;特征提取;門禁系統(tǒng);并行加速處理第一章 緒論1.1 研究背景與意義門禁系統(tǒng)從字面上理解,就是對于出入口通道權(quán)限的管理或者是限制,是從傳統(tǒng)的機械鎖上逐漸發(fā)展而來的。安全管理是企業(yè)的生存之本,出入口的安全及管理問題對于每個企業(yè)來說更是重中之重。在日常工作中,安全管控最常使用的方法就是對于員工及來訪人員的監(jiān)管,隨著企業(yè)的做大做強,員工的數(shù)量增多,來訪人流的加劇,或者說企業(yè)內(nèi)部對于員工的限

6、制,某些區(qū)域需要特定的身份才可以進入,某些區(qū)域或許就不讓員工進入,如何解決這些方面的問題,就成了企業(yè)急需解決的問題。門禁系統(tǒng)是解決以上問題的主要辦法,現(xiàn)在市場上的門禁系統(tǒng)基本是上使用密碼、接觸式IC卡,非接觸的射頻卡或者指紋認證來解決。但是密碼被遺忘、卡被盜、指紋被盜的案例屢見不鮮,同時隨著人員的增多,這種可以離開人這個本體的物理特征,對于安全管理來說本身就是一個巨大的漏洞。生物識別的出現(xiàn)能夠很好的解決物理特征脫離個體而存在的問題。隨著快速生活的到來,社會各方面都在致力于研究各種辦法來解決快速識別個人身份的問題。如同目前已被廣泛使用的指紋、DNA、虹膜、氣味及聲紋等生物特征,人臉識別是一種新興

7、的,同時又是一種最為古老的識別方式,因為人與生俱來就具有人臉識別的能力,自上個世紀六十年代起,人們開始對使用機械進行人臉識別進行了研究,作為生物特征比對方式的一種,人臉特征具有唯一性。然而相較于其他的身份鑒定方式,人臉識別具有更友好的采集方式,更快速的對比效率,更低廉的使用成本。目前,人臉識別技術(shù)已經(jīng)被廣泛的應(yīng)用到各個行業(yè)內(nèi),如公安追蹤,海關(guān)邊檢及社會重點區(qū)域監(jiān)控等,接下來人臉識別將走進商業(yè),慢慢的改變我們的生活模式。人臉是相對于其他比對手段來說,是隨身攜帶,長久不變的,人臉的采集具有隱蔽性、非接觸性相比其他的身份認證具有很好的友好性,同時人臉識別又是可以避免因使用照片、蠟像等手段騙取密碼獲取

8、權(quán)限的有效手段。目前,國內(nèi)安防監(jiān)控技術(shù)已經(jīng)遍布各處,但大多應(yīng)用在大型公共場合,例如火車站、碼頭、機場。2008北京奧運會和上海世博會也用到了相應(yīng)的人臉識別技術(shù)。隨著科技的興起,物聯(lián)網(wǎng)的日益發(fā)達,我國家庭安防也步入起步階段,日后也將會成為網(wǎng)絡(luò)智能家庭業(yè)務(wù)的組成部分。1.2 人臉識別的門禁系統(tǒng)研究現(xiàn)狀人臉識別系統(tǒng)的開發(fā)可以追述到二十世紀初Galton在Nature雜志發(fā)表的兩篇關(guān)于利用人臉進行身份識別的文章,其標(biāo)志著人臉識別系統(tǒng)開始被人們所意識到,這為后來人臉識別系統(tǒng)額應(yīng)用開創(chuàng)了方向。自從人臉識別系統(tǒng)被人們意識到之后,其自身顯著的優(yōu)勢逐漸引起許多相關(guān)學(xué)者研究的極大興趣,在這當(dāng)中尤以六十年代作為分水

9、嶺,從那時起,許多研究人員將大量的經(jīng)歷投入到人臉識別系統(tǒng)的研究與開發(fā)當(dāng)中,也正是在這個時期,人臉識別系統(tǒng)得到了第一次的飛躍式發(fā)展。通過對于相關(guān)文獻的研讀,目前,在人臉識別系統(tǒng)的研究領(lǐng)域,將人臉識別的發(fā)展歷程大體上分為三個主要的發(fā)展階段:第一階段(1964年一1990年),這一階段主要是人臉識別系統(tǒng)研究的起步階段,其主要的研究方向是將人臉識別作為一個一般性的模式識別問題來研究,所采用的主要技術(shù)方案是基于人臉幾何結(jié)構(gòu)特征(Geometri。featurebased)的方法,這集中體現(xiàn)在人們對于剪影(Profile)的研究上,人們對面部剪影曲線的結(jié)構(gòu)特征提取與分析方面進行了大量研究,人工神經(jīng)網(wǎng)絡(luò)也一

10、度被研究人員用于人臉識別的問題中??傮w而言,這一階段是人臉識別研究的初級階段,因此,其主要的貢獻在于對于后續(xù)的人臉識別系統(tǒng)的發(fā)展奠定一定的基礎(chǔ)并積累一定的理論以及實踐的經(jīng)驗,所以在這一時期非常重要的成果不是很多,也基本沒有獲得實際應(yīng)用。第二階段(1991年一1997年),盡管從時間跨度上來看,這一階段僅僅只有7年的時間,相對于第一階段而言時間較為短暫,但是,其所取得的的成果卻是非常豐碩的:在這一時期,相關(guān)的理論工作取得了巨大的成績,有許多人臉識別的算法的一出現(xiàn),并且得以在實際的生活當(dāng)中得以應(yīng)用,二者其中最為著名的就是美國軍方的FERET(FacEREcognitionteehn010Test)

11、,其對當(dāng)時公認的較有前途的相關(guān)算法進行了一系列的測試并取得了巨大的成功;在商業(yè)化運作方面,第二階段時期出現(xiàn)了許多與人臉識別系統(tǒng)相關(guān)的公司,這當(dāng)中最為著名的就是VisionicS(現(xiàn)為Identix)的Facelt系統(tǒng)等,其在測試當(dāng)中以優(yōu)異的表現(xiàn)給當(dāng)時的人們留下來深刻的印象,同時也是的當(dāng)時的研究者以及相關(guān)商業(yè)公司對于人臉識別的廣闊研究領(lǐng)域以及商業(yè)市場產(chǎn)生量強烈的渴求。在技術(shù)上,麻省理工學(xué)院媒體實驗室的Turk和Pentland提出的“Eigenface”方法無疑是這一時期內(nèi)最負盛名的人臉識別方法,由于這一算法對人臉識別系統(tǒng)的研究具有極高的理論價值一次,其被許多后續(xù)的人臉識別系統(tǒng)以及相關(guān)的算法采用

12、甚至復(fù)制。在這之后,麻省理工學(xué)院Al實驗室的Bruneili和Poggi對于當(dāng)時備受關(guān)注的兩種識別系統(tǒng)亦或者說是識別算法即基于結(jié)構(gòu)特征的方法與基于模板匹配方法進行了詳細的比對與研究,并對其某些性能進行了詳細的比對,結(jié)果發(fā)現(xiàn):在諸多評判標(biāo)準(zhǔn)當(dāng)中,模板匹配的方法均優(yōu)于基于結(jié)構(gòu)特征的方法。而這一結(jié)論在很大程度上對當(dāng)時的研究方向進行了重新的規(guī)劃與引導(dǎo),也就是在此時,先前基于純粹的基于結(jié)構(gòu)特征的人臉識別方法研究被大多數(shù)人所拋棄,而模板匹配的方法受到許多研究人員的追捧,這在很大程度上促進了基于表觀(Appearance一based)的線性子空間建模和基于統(tǒng)計模式識別技術(shù)的人臉識別方法的發(fā)展?,F(xiàn)在Eigen

13、face已經(jīng)成為人臉識別的性能測試基準(zhǔn)算法之一。這一時期的另一個重要技術(shù)是由Belhumeur等提出的Fisherface人臉識別方法。這一方法的主要特點在于,其第一次將主成分分析(prineipalCo ,onent alysis,PeA, Eigenface)應(yīng)用于人臉識別的研究當(dāng)中,并對熱臉識別過程中的圖像表觀特征進行降維然后再通過線性判別分析(Linear Discriminant Analysis ,LDA)的方法變換降維后的主成分以期獲得“盡量大的類間散度和盡量小的類內(nèi)散度”,由于該技術(shù)對于人臉識別系統(tǒng)具有較強的人別功能,因此在后續(xù)的研究當(dāng)中,許多相關(guān)的研究學(xué)者對其進行了細致的研究

14、與改進最終使得該技術(shù)成為當(dāng)時甚至是目前均較為流行的主流的人臉識別技術(shù)之一。隨著相關(guān)計算機技術(shù)的飛速發(fā)展,目前有許多新的人臉識別技術(shù)得已產(chǎn)生,例如近年來產(chǎn)生的零空間法子空間判別模型,增強判別模型,直接的LDA判別方法,以及近期的一些基于核學(xué)習(xí)的改進方法等等,這些相關(guān)的人臉識別技術(shù)以及相關(guān)的算法為人臉識別的現(xiàn)實應(yīng)用提供了強大的技術(shù)以及理論支持。后來Mrr以及 Moghaddam則在Eigenface的基礎(chǔ)上,通過對Eigenface的分析與研究,具有針對性的提出了一種新的人臉識別技術(shù)與算法及貝葉斯概率估計的人臉識別方法。其具體的試驗程序為,通過特定的方法即“作差法”將待測對象與采取圖片的近似比較程

15、度轉(zhuǎn)換成為一種分類比較的簡單問題,也就是將兩幅圖片進行一種相似性比對,而相互比對的比較主要通過類內(nèi)差與類間差進行評判,在實際的比較過程當(dāng)中,類內(nèi)差和類間差數(shù)據(jù)都要首先通過主成分分析(PCA)技術(shù)進行降維,計算兩個類別的類條件概率密度,最后通過貝葉斯決策(最大似然或者最大后驗概率)的方法來進行人臉識別。在后續(xù)廣泛應(yīng)用的彈性圖匹配技術(shù)(ElasticGraPhMatching,EGM)也是在這一時期被提出來的,其主要的研究以及應(yīng)用思路就是通過不同的屬性來對識別對象進行準(zhǔn)確的分類與評判:在實際的采集儀以及應(yīng)用過程送給您當(dāng)中,相關(guān)屬性圖片當(dāng)中的頂點上的關(guān)鍵部位意味著識別對面那個的最為重要的特征部位,其

16、屬性為相應(yīng)特征點處的多分辨率、多方向局部特征Gabor6s,82胭變換特征,稱為介才;邊的屬性則為不同特征點之間的幾何關(guān)系。在實際的應(yīng)用過程當(dāng)中,對于采集到的相關(guān)實驗對象的臉部圖像,系統(tǒng)會更具預(yù)設(shè)的不同人臉面部區(qū)分程度較為明顯的特征部位進行識別與區(qū)分,也就是說可以通過彈性圖匹配對某些預(yù)先定義人臉識別過程當(dāng)中的某些關(guān)鍵特征點進行預(yù)先識別,同時提取它們的介才特征,得到輸入圖像的屬性圖。最后通過計算其與己知人臉屬性圖的相似度來完成識別過程。相比去其他的人臉識別系統(tǒng)以計算法而言,這種識別方法的優(yōu)點是將以前的局部識別與現(xiàn)有的全部識別相互融合,即具有了局部識別精確度高的特點,也同時具有了全部識別準(zhǔn)確定強不

17、易遺漏的特性,因此其被大多數(shù)的人臉識別算法所采用。隨著相關(guān)技術(shù)的不斷發(fā)展與更行,近幾年來有許多相關(guān)的新技術(shù)對該算法以及程序進行了更新與提升,使其的識別性本能更加強大與準(zhǔn)確。二十世紀初,洛克菲勒大學(xué)(助ckefelleruniversity)的Atiek等人通過對以前的人臉識別技術(shù)的優(yōu)缺點的研究提出了一種新的人臉識別技術(shù),即局部特征分析方法(Local Feature Analysis ,LFA)。相比于以前的人臉識別技術(shù)而言,該方法在本質(zhì)上是一種基于統(tǒng)計的低維對象描述方法,與只能提取全局特征而不能保留局部拓撲結(jié)構(gòu)的PCA技術(shù)相比,LFA在全局PCA描述的基礎(chǔ)上提取的特征是局部的,并能夠同時保留

18、全局拓撲信息,從而具有更佳的描述和判別能力。在人臉識別系統(tǒng)當(dāng)中,由于全局識別與局部識別各自均具有明顯的優(yōu)勢,因此,局部識別與整體識別在人臉識別技術(shù)的應(yīng)用當(dāng)中均占有重要的地位,也正是基于這一原因,其均稱為目前人臉識別研究的主要方向。在人臉識別技術(shù)實際的應(yīng)用過程當(dāng)中,相關(guān)均是產(chǎn)業(yè)對人臉識別技術(shù)的發(fā)展產(chǎn)生量巨大的推進作用,在這當(dāng)中尤以由美國國防部反毒品技術(shù)發(fā)展計劃辦公室資助的FERET項目最為著名。最初,美國政府為了加強對于敏感軍事單位以及軍事技術(shù)的保密工作,想開發(fā)一種能夠為安全、情報和執(zhí)法部門使用的自動人臉識別技術(shù),其主要的組成部分為龐大的人臉識別庫以及具有特異性的人臉識別算法。在這兩部分當(dāng)中,人

19、臉識別庫又可以被分為兩部分,其中一部分的人臉數(shù)據(jù)庫用于日常的實驗研究,即用于對新的算法以及人臉識別系統(tǒng)進行測試,另一部分人臉識別系統(tǒng)的采集對象為美國相關(guān)均是部門的從業(yè)人員,該部分數(shù)據(jù)庫也是人臉識別系統(tǒng)以及相關(guān)算法的真正使用者。最初的實驗當(dāng)中, FERET于1997年通過各種途徑采集到了19999個人的14,126幅圖像,在這一數(shù)據(jù)庫當(dāng)中包含了同一個人不同時間段、不同表情以及不同姿勢的圖片,因此可以說,所采集到的圖像具有廣適性,進而排除了實驗過程當(dāng)中的特殊性現(xiàn)象。該項目包括三部分內(nèi)容:資助若干項人臉識別研究、創(chuàng)建FERET人臉圖像數(shù)據(jù)庫、組織FERET人臉識別性能評測。通過將所得的人臉識別的算法

20、以及程序應(yīng)用于得到的人臉圖像數(shù)據(jù)庫當(dāng)中,進而對所得的相關(guān)算法以及系統(tǒng)進行測試,從而達到了對于相關(guān)算法以及系統(tǒng)的改進與升級,同時給出了人臉識別的進一步發(fā)展方向:光照、姿態(tài)等非理想采集條件下的人臉識別問題。1.2.1 人臉識別的研究現(xiàn)狀人臉識別技術(shù)在國外已經(jīng)得到了長足的發(fā)展,其作為一種新的生物技術(shù)在相關(guān)領(lǐng)域當(dāng)中的發(fā)展也已經(jīng)經(jīng)歷的半個多世紀的發(fā)展歷程,在這已發(fā)展過程當(dāng)中,主要可以將其大體劃分為三個主要的階段:第一階段:機械式識別階段。這一階段的主要特征是通過人臉的幾何特征來對檢測人員進行評價,而其中的評判方法與最終的評判結(jié)果并不是由計算機自助完成的額而是由實驗人員進行人為的評價,因此,從根本上說該方

21、法并不是真正的自助識別。第二階段:人機交互式識別階段。與前一階段相比,這一階段的主要特征是大量商業(yè)化人臉識別系統(tǒng)的出現(xiàn)。在這一時期,大量的商業(yè)企業(yè)以及國家將大量的人力物力財力投入到人臉識別系統(tǒng)當(dāng)中,這當(dāng)中由其以美國的均是企業(yè)貢獻最大。在這一時期出現(xiàn)許多的不同的人臉識別算法,其中最為著名的是基于表征空間及統(tǒng)計學(xué)的算法。第三階段:相比于上兩個階段,這一階段最主要的特征是自動化識別系統(tǒng)。隨著相關(guān)生物技術(shù)以及計算機技術(shù)的飛速發(fā)展,人臉識別系統(tǒng)的自動化程度越來越高,相關(guān)算法的準(zhǔn)確程度也越來越高,這些均在一定程度上促進了人臉識別系統(tǒng)自動化識別準(zhǔn)確性的提高以及自動化程度的提升。并且在這一階段,具有劃時代意義

22、的3D模糊人臉識別系統(tǒng)得到了開發(fā)與初步的應(yīng)用,這極大地提升了人臉識別系統(tǒng)自動化的準(zhǔn)確性與特異性。存在問題:盡管目前人臉識別技術(shù)經(jīng)歷了經(jīng)半個世紀的發(fā)展,在這當(dāng)中也取得了巨大的成績,但是,目前的人臉識別技術(shù)距離人們的目標(biāo)還存在著一定的差距。相比于人類大腦的人臉識別能力而言,盡管不同的人面部特征存在著較大的差異性,但是通過計算機系統(tǒng)對人臉進行識別還是存在著許多實現(xiàn)難題。與計算機的人臉識別相比,人類可以通過多種感官對不同的人進行識別,這包括長相、說話語氣、言談舉止等等。在實際的應(yīng)用過程當(dāng)中,相比于人類的一般人臉的辨識可以用單個感官完成,也可以是多感官相配合來存儲和檢索人臉,而計算機人臉識別并不能利用上

23、述的標(biāo)準(zhǔn)對人臉進行識別,其職能通過相關(guān)的由相關(guān)圖像經(jīng)過研究人員的定義來將實驗對象的對象轉(zhuǎn)換成為相關(guān)的數(shù)據(jù)進而對不同的人臉進行識別與區(qū)分,而在實際的應(yīng)用過程當(dāng)中,這種視覺數(shù)據(jù)往往還受到各種因素的干擾影響。用計算機識別人臉的困難主要表現(xiàn)在:人臉表情豐富;人臉隨年齡增長而變化;人臉?biāo)蓤D像受光照、成像角度及成像距離等影響;而且從二維圖象重建三維人臉是病態(tài)較詳細地列出了影響人臉識別效果的主要因素,如圖1.2所示。圖1.2影響人臉識別因素Fig1.2Impaetfaetorsoffacereeognition除了上述的影響計算機人臉識別的硬件因素以外,計算機的人臉識別還面臨著人類自身臉部識別的難題。由于

24、人類對于面部不同部位的認識程度不同,不能夠從面部大量的數(shù)據(jù)當(dāng)中篩選出具有代表性的獨特的特征來對人臉識別系統(tǒng)的相關(guān)算法進行評價,因此,計算機的人臉識別面臨著評價標(biāo)注不唯一的窘境。對于人類視覺系統(tǒng)的研究表明,人類視覺系統(tǒng)不是單一的系統(tǒng),其是由許多的不同層次的視同構(gòu)成,通過不同的層次將外界的視覺圖像反映到人類的大腦當(dāng)中,進而呈現(xiàn)出不同的圖像。相關(guān)的生理學(xué)實驗的研究結(jié)果表明,人眼視網(wǎng)膜上存在著不同層次的視覺細胞,其大體可以分為低層次和高層次的細胞,在這些相關(guān)的細胞當(dāng)中,低層次的細胞對空間的響應(yīng)和小波變換的結(jié)果相似;而高層次的細胞則依據(jù)一群低層次細胞的響應(yīng),而作出具體的線、面乃至物體模式的響應(yīng),以此為依

25、據(jù)進行判別。相比于單獨的計算機人臉識別系統(tǒng)而言,計算機系統(tǒng)只能夠?qū)τ趦H僅依靠一張圖像進行識別,可想而知要想獲得準(zhǔn)確性極高的識別率這當(dāng)中涉及到許多的不同的知識系統(tǒng),主要包括圖象處理、計算機視覺、模式識別以及神經(jīng)網(wǎng)絡(luò)等學(xué)科,要從圖像中提取那些適合于分類并且不受光照等影響的特征則困難得多。目前對于已知人臉數(shù)據(jù)庫規(guī)模在1000人左右、成像條件理想、用戶比較配合的場合,目前最好的人臉識別系統(tǒng)的性能己經(jīng)達到了90%以上,并已經(jīng)在限定范圍內(nèi)得到了一些應(yīng)用。但這并不意味著人臉識別己經(jīng)是一個被解決了的成熟技術(shù)問題,相反,人臉識別研究目前仍舊面臨諸多挑戰(zhàn)性的問題, 客觀地說,在很多應(yīng)用條件下,最好的識別系統(tǒng)的識別

26、率也往往達不到50%。影響人臉識別效果的因素很多,其中主要集中在以下幾個部分:1、復(fù)雜背景中的人臉檢測與定位隨著科技的不斷發(fā)展,目前的人臉識別系統(tǒng)可以在一定程度上滿足某些單位在門禁系統(tǒng)中的應(yīng)用,但是,其大規(guī)模的實際應(yīng)用任然面臨著許多的難題,這些難題極大地限制了人臉識別系統(tǒng)的應(yīng)用。例如,由于圖像采集的環(huán)境與被檢測人員每次檢測的環(huán)境并不相同、系統(tǒng)收錄的檢測者檢測時姿勢與被檢測時可能有所差異,這些問題均限制了人臉檢測的進一步應(yīng)用。2、魯棒、準(zhǔn)確的特征點定位問題作為人臉檢測系統(tǒng)最為重要的組成部分,面部檢測的準(zhǔn)確程度在很大程度上決定著人臉檢測系統(tǒng)以及相關(guān)算法的準(zhǔn)確性。但是,就目前的人臉檢測系統(tǒng)而言,其在

27、面部識別方面并不能做到精確的人別,其實別的程度在一定程度上與被識別這所處的環(huán)境例如外界光線的強弱等存在著一定的關(guān)聯(lián)性,因此,時常會導(dǎo)致檢測環(huán)節(jié)出現(xiàn)錯誤,這也是人臉檢測急需解決的重要議題。3、識別算法的泛化能力和自適應(yīng)學(xué)習(xí)問題作為目前公認的較為準(zhǔn)確的人臉識別的主要方法,統(tǒng)計和學(xué)習(xí)已經(jīng)成為相關(guān)研究者研究的主要方向,而在這兩種方法當(dāng)中,對于大數(shù)據(jù)的采集與研究均是其關(guān)注的焦點問題。因此,如何能夠采集到大量的數(shù)據(jù),如何能夠在最大限度的將不同人之間面部的特征進行精確的區(qū)分是目前上述兩個方向研究的重要議題。但是,在實際的研究當(dāng)中,如此大量數(shù)據(jù)的獲取與精密分析并不容易做到,這導(dǎo)致了相關(guān)研究學(xué)者并不能通過對于大

28、數(shù)據(jù)的分析,從大量的實驗對象當(dāng)中找出具有針對性的特征。4、光照變化問題,尤其是室外光照變化就目前人臉識別系統(tǒng)的應(yīng)用而言,其絕大部分是應(yīng)用于不同的門禁系統(tǒng)當(dāng)中,而相比于室內(nèi)的光線條件而言,門禁系統(tǒng)所處的環(huán)境較為開放,這導(dǎo)致了其所處的同一地域在不同時間段的光線強度存在著較大的差異。而在實際的應(yīng)用當(dāng)中,由于采集使用者圖像的光線強度不可能隨著室外環(huán)境光線強度的變化而變化,這導(dǎo)致了,實驗者在應(yīng)用的過程觀念當(dāng)中,其面部不同區(qū)域反射的光強并不相同,這些均會對人臉識別系統(tǒng)的判斷造成一定的誤差。5、姿態(tài)不變的人臉識別算法與光照問題類似,姿態(tài)問題也是目前的人臉識別系統(tǒng)實用化的一個巨大障礙。通過對目前現(xiàn)有的人臉識別

29、系統(tǒng)的調(diào)查研究我們發(fā)現(xiàn),目前的人臉識別系統(tǒng)對于正面識別的接受程度較高,但是對于側(cè)面亦或者是半側(cè)面人臉的識別能力相對較差,而在實際的應(yīng)用國產(chǎn)當(dāng)中,實驗者的姿勢不可能與采集圖像時完全相同,這就有可能導(dǎo)致細心識別的錯誤。6、墨鏡、帽子等飾物遮擋問題對不能要求用戶配合的場景,例如全自動的安全監(jiān)控,被識別的對象往往帶有墨鏡、帽子等飾物,使得面部被遮擋,從而造成信號數(shù)據(jù)的缺失,如何較好解決該問題也是值得關(guān)注的方向之一。7、大規(guī)模人臉庫的識別問題隨著經(jīng)濟的發(fā)展,人臉識別的相關(guān)數(shù)據(jù)庫也呈現(xiàn)出爆發(fā)式增長的趨勢,這就產(chǎn)生量一個極為嚴重的問題,如何將采集到的,人臉識別數(shù)據(jù)庫當(dāng)中的才及對象的圖像進行準(zhǔn)確的區(qū)分。如果不

30、能夠在數(shù)據(jù)庫當(dāng)中對其進行細致準(zhǔn)確的區(qū)分,那么在實際的應(yīng)用過程當(dāng)中會對其準(zhǔn)確度的判斷產(chǎn)生干擾。1.3 本文的研究內(nèi)容及框架為了完成基于人臉識別的門禁系統(tǒng),需重點進行如下研究:(1)實現(xiàn)門禁系統(tǒng)基于級聯(lián)神經(jīng)網(wǎng)絡(luò)的人臉檢測,基于Daubechies4算法的人臉圖像預(yù)處理、基于PCA算法的人臉比對識別。(2)實現(xiàn)門禁系統(tǒng)對于員工及訪客的比對、控制、授權(quán)及記錄。(3)實現(xiàn)門禁系統(tǒng)可視化日志的生成。(4)構(gòu)建數(shù)據(jù)庫模型。(5)構(gòu)建安全體系,防止門禁系統(tǒng)中的服務(wù)器被人為添加基礎(chǔ)樣本。1.4 本章小結(jié)本章的主要內(nèi)容是通過對于相關(guān)文獻的研讀,對目前人臉識別系統(tǒng)的發(fā)展現(xiàn)狀進行初步的總結(jié)與研究,并對其現(xiàn)存的問題進行

31、初步的探討。隨著經(jīng)濟的發(fā)展,各行各業(yè)對于其核心技術(shù)的保護的關(guān)注程度逐漸加大,因此,對于不同區(qū)域的管制程度也逐步加大;另一方面,不同單位以及機構(gòu)為處于安全的目的,對于非本區(qū)域的人員的活動方位進行一定程度的限定。傳統(tǒng)的門鎖形式已經(jīng)不能夠滿足人們對于相關(guān)信息以及其他隱私的保護要求,而人臉識別系統(tǒng)與存在了幾百年的門鎖制度相比較而言具有巨大的優(yōu)勢,其獨特的專一性能夠在很大程度上保護相關(guān)人員的各種利益的安全,這些均在很大程度上促進了人臉識別系統(tǒng)在門禁系統(tǒng)當(dāng)中的運用與發(fā)展。各章節(jié)的安排作以介紹:第二章:通過對相關(guān)文獻的研讀,我們對目前現(xiàn)有的人臉識別檢測技術(shù)進行了初步的總結(jié),目前,人臉識別的主要檢測方法分為以

32、下幾大類,分別是基于知識的人臉檢測方法;基于特征不變的人臉檢測方法;基于模板匹配的人臉檢測方法以及基于表觀的人臉檢測方法等,并對目前各種檢測方法當(dāng)中所涉及到的不同的計算方法進行了細致的歸納與總結(jié),通過對不同檢測方法以及不同算法的總結(jié)與比較,找出其各自的優(yōu)缺點并在此基礎(chǔ)之上對其的主要優(yōu)缺點進行了初步的總結(jié)。第三章:對人臉識別體統(tǒng)的圖像預(yù)處理進行了初步的探討與研究,分別從人臉灰度、圖像灰度以及濾波去噪等方面對目前人臉識別系統(tǒng)當(dāng)中的人臉圖像處理進行了初步的探討與研究。第四章:對目前的門禁系統(tǒng)的設(shè)計與人臉識別系統(tǒng)在其中的應(yīng)用進行了細致的研究,分別從目前門禁系統(tǒng)需求的分析、門及系統(tǒng)的設(shè)計與人臉識別在門禁

33、系統(tǒng)當(dāng)中的應(yīng)用等方面對目前門禁系統(tǒng)中人臉識別系統(tǒng)進行了闡述。第五章:通過對全文的總結(jié)以及對于相關(guān)文獻的研讀,在本課題中,將會對如何實現(xiàn)人臉識別的門禁系統(tǒng)進行研究,尤其是對人臉快速檢測、采集、比對進行深入研究。采用級聯(lián)神經(jīng)網(wǎng)絡(luò)、Daubechies4及PCA相結(jié)合的方法使用戶可以方便快捷的使用,達到控制門禁的開關(guān),及對于非授權(quán)人員的報警,使得門禁系統(tǒng)更加安全、快捷、可靠。第二章 人臉識別技術(shù)概述2.1 概述通常意義上的人臉檢測是在一定的條件下,通過將目前的檢測對象與已經(jīng)存在的數(shù)據(jù)庫中的所有圖像進行比對,并從中找出與之完全對應(yīng)的人臉圖片,進而達到一定的識別效果。人臉識別的基礎(chǔ)是建議一套完善的人臉識

34、別數(shù)據(jù)庫,并將其與人臉檢測系統(tǒng)相互配合,因此,一種完善的人臉檢測數(shù)據(jù)庫以及人臉檢測方法對于人臉檢測的實現(xiàn)具有重要的現(xiàn)實意義。而人臉識別數(shù)據(jù)庫以及人臉檢測方法之間存在一定的先后關(guān)系即人臉檢測的準(zhǔn)確程度在很大程度上決定了人臉識別數(shù)據(jù)庫的準(zhǔn)確程度,這主要是因為,人臉識別數(shù)據(jù)庫當(dāng)中的相關(guān)數(shù)據(jù)也是通過人臉檢測手段將其輸入到喜愛那個管的數(shù)據(jù)庫當(dāng)中的。實際應(yīng)用中的人臉識別(或辨認)、人臉追蹤以及人臉定位等都與人臉檢測密切相關(guān)。人臉識別的目的是檢驗輸入圖像中的個體的身份,而人臉追蹤方法是實時地、連續(xù)地估計在圖像序列中的人臉的位置和可能的方向。在人臉識別算法與程序當(dāng)中,對于人臉上相關(guān)部位的準(zhǔn)確定位以及相關(guān)特征的

35、準(zhǔn)確輸入對于后續(xù)人臉檢測的準(zhǔn)確度具有決定性的意義。在實際的人臉檢測當(dāng)中,由于同一人在不同階段的情緒不可能完全相同,這也導(dǎo)致了其面部表情存在著一定的差異性,這些均對人臉檢測在門禁系統(tǒng)當(dāng)中的應(yīng)用以及人臉檢測系統(tǒng)準(zhǔn)確度造成了不同程度的影響。在這一章當(dāng)中,我們通過對于相關(guān)文獻的研讀,對目前常用的人臉檢測方法進行了細致的分析,并對目前的人臉檢測的喜愛那個管算法進行了初步的闡述與說明,以期為后續(xù)的實驗奠定一定的理論基礎(chǔ)。2.2 人臉檢測方法概述(基于Haar特征提取的人臉檢測)Yang等將人臉檢測定義為:在實際的應(yīng)用過程當(dāng)中,對于隨機給定的一張亦或者是一組圖像,人臉檢測系統(tǒng)可以迅速準(zhǔn)確的對其進行判斷,并評

36、價其是否存在于一致的數(shù)據(jù)庫當(dāng)中,如果存在,則返回其位置和空間分布?;谶@一概念,我們可以將人臉檢測粗略的分為靜態(tài)與動態(tài)兩部分:所謂的靜止靜態(tài)部分指的是,在精致的狀態(tài)下,對人臉進行判斷,并評價其是否存在人臉;動態(tài)指的是可以通過某些視頻圖像,對其中存在的人臉進行初步的判斷,并進行一定程度的跟蹤。除此之外,還可以根據(jù)人臉檢測所處理圖像的不同進行分類:分別為基于彩色圖像的人臉檢測以及基于灰度圖像的人臉檢測。對于基于灰度圖像的人臉檢測,目前存在的方法主要可分為三類:基于表象(aPPelce一based)的方法,基于特征(feature一based)的方法和基于模板(temPlate一based)的方法。

37、對于基于彩色圖像的人臉檢測方法,由于其能夠提供更豐富的信息,因此,可以采用有別于灰度圖像的處理方法,利用彩色圖像的自身特性進行人臉檢測,例如膚色模型等。通過對于相關(guān)文獻的研讀,我們發(fā)現(xiàn)就目前而言,人臉檢測主要可以分為兩大類其分別是基于統(tǒng)計的方法以及基于知識的人臉檢測方法?;谥R規(guī)則人臉檢測手段主要是根據(jù)現(xiàn)有的有關(guān)人臉局部或者是全部結(jié)構(gòu)的特征的概述進行整體上的歸納與總結(jié),進而提出相應(yīng)的有關(guān)于人臉結(jié)構(gòu)特征的算法,并以此為基礎(chǔ)進行評判,例如,人臉結(jié)構(gòu)學(xué)指出,人的臉部構(gòu)造存在著對稱性分布的特點,但是,不同的人其臉部的之間的距離來對人臉進行識別。但是,這種方法的局限性在于,其智能應(yīng)用與采集原始照片清晰

38、的圖像當(dāng)中,并且由于采集的光線會產(chǎn)生一定人臉的結(jié)構(gòu)特性轉(zhuǎn)換為規(guī)則。因此,這會在一定程度上導(dǎo)致測量結(jié)果的誤差臉圖像看作一個高維矢量。最初的模板匹配方法的主要原理是將搜集到的人臉圖像與被采集人的人臉圖像進行比對,找到其相似度,通過相似度高低對人臉進行識別?;诮y(tǒng)計的方法哦超過年當(dāng)中由于將統(tǒng)計學(xué)的知識應(yīng)用于人臉識別系統(tǒng)當(dāng)中,因此,其對于正面人臉識別的準(zhǔn)確度相對較高,能夠很好地對目標(biāo)進行準(zhǔn)確的評判,但是,在實驗的過程當(dāng)中,由于被實驗者姿勢、所處環(huán)境光線等的不均勻變化或?qū)е聦嶒灲Y(jié)果出現(xiàn)較大的偏差,而這種偏差在一定程度上會使得準(zhǔn)確率會相應(yīng)的降低,從而出現(xiàn)漏檢或者誤檢。下面將對幾種常用的方法作簡要地介紹。2

39、.2.1 基于知識的人臉檢測方法該種方法是建立在一定的統(tǒng)計學(xué)的基礎(chǔ)之上,即通過對大量的人臉結(jié)構(gòu)的詳細比對從中找出特征最為明顯,并且最易區(qū)分的部位進行目不表評判。在實際的試驗以及數(shù)據(jù)采集過程當(dāng)中,相關(guān)送研究者發(fā)現(xiàn),不同的人其面部器官的分布并不是完全一樣的,并且這種分布呈現(xiàn)出一定的統(tǒng)計學(xué)規(guī)律,例如,人的眼睛總是大體的均勻分布在鼻梁的兩側(cè);人的嘴也是基本上以鼻梁為中心呈現(xiàn)出兩側(cè)的對稱分布等等。在這種情況下,我們可以通過對人臉上不同器官之間分布的差異性以及不同人臉不器官分布的特殊性對人臉進行一IDing策劃高難度的識別。在實驗當(dāng)中,當(dāng)被檢測對象的臉部特征與數(shù)據(jù)庫當(dāng)中錄入的臉部特征存在較高的匹配程度的時

40、候,我們可以認為被檢測者與實驗數(shù)據(jù)庫當(dāng)中錄入的人員為同一人,否則則判定非同一人。馬賽克圖像(moasciimgae)是一種簡單的圖像多分辨率表示方法。Yang和Hunag26采用分層次的基于知識的方法進行人臉檢測,他們建立了一個基于知識的三層檢測系統(tǒng)。第一層針對4X4的馬賽克圖像塊(quartet),根據(jù)相應(yīng)的知識規(guī)則尋找人臉候選區(qū)域;第二層針對8x8的馬賽克圖像塊(Octet),也是根據(jù)知識規(guī)則從各候選區(qū)域中確定人臉區(qū)域;第三層在人臉區(qū)域內(nèi),采用改進的邊緣檢測算法進一步確定眼、嘴等器官的位置。Kotorpuolos和Pitas等卿 將方形塊擴展為矩形塊,提出了一種改進算法。2.2.2 基于特

41、征不變的人臉檢測方法人臉特征定位的基本思路就是通過一定的技術(shù)手段,將每個人的臉部特征進行精確的定位,然后錄入到計算機系統(tǒng)當(dāng)中,在比對的時候,只需要將上述錄入的特征與待檢測的人臉圖像與之比對,而在這些特征當(dāng)中,臉部的各個器官的大小比例以及各個器官之間的間距往往成為一些評判的重要標(biāo)準(zhǔn)。人臉特征點定位可以為人臉識別、人臉跟蹤、姿態(tài)表情分析等研究工作提供相應(yīng)基礎(chǔ)數(shù)據(jù),因此特征點定位的準(zhǔn)確與否直接關(guān)系到后續(xù)算法的可靠性。例如在人臉識別算法中,人臉圖像尺寸的歸一化通常是特征提取的準(zhǔn)備工作,而歸一化算法的實現(xiàn)就是依賴于人臉特征點定位的結(jié)果。另外一些算法如表情分析等則直接需要各個器官的相對位置及形狀或?qū)θ四樀?/p>

42、局部區(qū)域的特征直接加以分析,而這也與人臉特征點定位是否準(zhǔn)確息息相關(guān)。研究就表明,眼睛位置定位不精確會極大的降低后續(xù)的分類識別算法性能,而且特征點定位遠不是一個已經(jīng)解決的問題,尤其需要注意在非理想成像條件下的特征點定位問題。為了開發(fā)出實用的人臉識別系統(tǒng),必須對面部關(guān)鍵特征點的定位問題進行進一步的研究。在眾多的人臉特征點定位當(dāng)中,眼睛的精確定位在人臉識別研究中扮演著極其重要的角色,因而眼睛的精確定位技術(shù)一直是研究的重點。下面先簡要介紹目前應(yīng)用較廣的眼睛定位算法,然后詳細地介紹本文提出的一種適應(yīng)性強的眼睛精確定位算法。2.2.3 基于模板匹配的人臉檢測方法所謂基于模板(tempalet一based)

43、的方法,是指從構(gòu)造人臉或某個面部器官的模板(模型)出發(fā),通過各種模板搜索與匹配算法,結(jié)合對于模板參數(shù)的調(diào)整,達到檢測和定位的目的。早期的嘗試skaai,Nagao和Fujibayashi檢測照片中的前視人臉。他們使用了眼睛、鼻子、嘴巴和臉部輪廓的多個子模板進行人臉建模。首先將待檢子圖像與輪廓模板匹配以確定人臉的候選位置,然后在候選的人臉位置將其與各子模板進行匹配,完成人臉檢測。Yullie等人提出了基于變形模板的方法,用于人臉特征的抽取。變形模板是由一個根據(jù)被測物體形狀而設(shè)定的參數(shù)化的可調(diào)模板和與之相應(yīng)的能量函數(shù)所構(gòu)成,能量函數(shù)要根據(jù)圖像的灰度信息、被測物體輪廓等先驗知識來設(shè)計。當(dāng)用變形模板進

44、行人臉檢測時,首先,將模板在待測圖像中移動,并動態(tài)地調(diào)整其參數(shù),計算能量函數(shù)。當(dāng)能量函數(shù)到達最小值時,根據(jù)其位置和參數(shù)所決定的可調(diào)模板形狀應(yīng)該達到與人臉形狀的最佳擬合,這樣就檢測到了一幅人臉?;钴S輪廓模型法是一條在外部約束力作用下的能量最小化樣條曲線,亦稱蛇形法(snkaesmethod)。它通過迭代的方法可以不斷修正,逐步趨近圖像中的線條或邊緣。Hunag和Cben采用活躍輪廓模型法(activeocnoturmodelmethod)完成了頭部輪廓、眉毛及鼻孔的檢測39,401。人臉檢測是一個艱巨而有趣的問題,目前所提出來的方法很多,一些比較有效的人臉檢測系統(tǒng)并不只是采用上述分類中的某一種方

45、法,而是將多種方法有機地結(jié)合起來,最大限度地利用從圖像本身得到的信息以及從大量樣本(包括正例和反例)得到的信息,并充分結(jié)合先驗知識,共同實現(xiàn)人臉檢測。2.2.4 基于表觀的人臉檢測方法色度學(xué)理論認為,任何顏色可以有紅(R)、綠(G)、藍(B)三種基本顏色按不同比例混合得到。根據(jù)計算機色彩理論,對每一種顏色而言,在計算機中有不同的表達方式,這樣就形成了各種不同的色彩系統(tǒng),即色彩空間,其作用是在某些標(biāo)準(zhǔn)下用通??梢越邮艿姆绞胶喕室?guī)范。本質(zhì)上色彩模型是坐標(biāo)系統(tǒng)和子空間的規(guī)范,位于系統(tǒng)中的每種顏色都有單獨的點來表示。目前所用的大多數(shù)色彩模型都是面向硬件的或者面向應(yīng)用的,如在數(shù)字圖像處理中,最通用的

46、面向硬件的模型是RGB模型,而CMY(青、深紅、藍)、CMYK(青、深紅、黃、黑)模型則是針對彩色打印機的,HIS(色度、飽和度、亮度)模型則更符合人描述和解釋顏色的方式,其它常用的的色彩空間還有YCbCr、YIQ、刊v等44。通過研究發(fā)現(xiàn),各種不同膚色的人臉差別主要在于亮度而不是色度的區(qū)區(qū)別上。如黑人和白人的膚色,其色度聚類是相同的。由于在彩色圖像中,人臉膚色對姿態(tài)變化不敏感,并且彩色信息特征易于提取,在周圍環(huán)境較為單調(diào)或者與膚色相差較為明顯的情況下,利用膚色特征可以很快的摒棄大量的背景,從而將更多的計算集中在可能存在人臉的區(qū)域上。近年來,關(guān)于膚色模型的研究己經(jīng)取得很大的進展,并且有很多比較

47、成熟的皮膚檢測器得到了較好的應(yīng)用。如D.Chai和KN.Ngan在文獻44中提出的膚色檢測器,是判別在YCrCb彩色空I旬中,像素取值范圍為C二133,173,Cb=【77,127的點為皮膚。通過該檢測器的得到的皮膚檢測效果如圖2.3所示:圖2.4是文獻45用膚色模型檢測色人臉圖像。該文的方法是先將圖像在YPbP:顏色空間進行表示,然后應(yīng)用二維高斯混合模型(BidimensionalGaussianmixturemodel)來判決每個像素是否為皮膚,并采用區(qū)域增長的方式來得到人臉區(qū)域,如下: 文獻46則直接針對人臉膚色特點,采用鑒別分析模型將RGB空間分解為適合膚色理解的顏色空間,測試表明該方

48、法得到的顏色空間更有利于膚色的檢測。2.3 人臉識別方法概述(基于PCA(特征臉)的人臉識別算法)PCA方法最早被TurkM和PentlandA36用于人臉識別的研究,取得了不錯的效果。由于其在降維和特征提取方面的有效性,在人臉識別領(lǐng)域得到了廣泛的應(yīng)用。P以方法的基本原理是:利用K一L變換抽取人臉的主要成分,構(gòu)成特征臉空間,識別時將測試圖像投影到此空間,得到一組投影系數(shù),通過與各個人臉圖像比較進行識別。2.3.1 基于幾何特征的人臉識別算法基于幾何特征的方法3主要思路是:采用臉型特征、人臉五官的局部形狀特征、五官間的幾何關(guān)系等幾何特征所構(gòu)成的向量來表示人臉,然后用這些向量作為人臉分類依據(jù)。該類

49、方法具有簡單、實現(xiàn)有效、識別速度快等優(yōu)點。缺點是太依賴于幾何特征的準(zhǔn)確提取,受到各種外界因素的影響時,難以穩(wěn)定精確地在人臉圖像中提取有利于分類的幾何特征,因而識別性能較低,該類方法的應(yīng)用受到了很大的限制。2.3.2 基于PCA(特征臉)的人臉識別算法以K一L變換為基礎(chǔ)的P以人臉識別方法是統(tǒng)計最優(yōu)的,它使得壓縮前后的均方誤差最小,且變換后的低維空間有很好的分辨能力。但PCA方法也存在著缺陷。首先,作為一種圖像的統(tǒng)計方法,圖像中的所有象素被賦予了同等的地位,可是角度、光照、尺寸及表情等干擾會導(dǎo)致識別率急劇下降,因此較好的識別算法都對人臉進行了矯正預(yù)處理,且只考慮裸臉。其次,人臉在人臉空間的分布近似

50、高斯分布,且普通人臉位于均值附近,而特殊人臉則位于分布邊緣,因此,越普通的人臉越難識別。雖然特征臉方法抓住了人群的統(tǒng)計特性,但好的表達能力不等于好的區(qū)分能力??傊?有效的特征臉識別方法需要做大量預(yù)處理,以減少干擾。如何表達并去除表情因素對識別的影響則是識別的另一個關(guān)鍵問題。據(jù)此,近年來發(fā)展了很多對pCA的改進方法,ZnPeA(Two一dimensi。nalPrincipalComponentAnalysis,ZDpeA)就是其中的一種。4.4.1ZDPCA的基本思想假設(shè)一個大小為m又。的圖像X,令投影空間U任R”xP,其中每列為正交向量,且n全p。將圖像矩陣X投影到U將產(chǎn)生一個mxp的投影矩陣

51、y二萬U。在ZDPCA中,用投影矩陣y的總離散度作為準(zhǔn)則函數(shù)J(U)來衡量投影空間U的優(yōu)劣:J(U)=tr(s) (4-27)其中:SU是投影矩陣Y的協(xié)方差矩陣,tr(SU)是SU的跡,且SU=UTE x-E(x)x-E(x) U (4-28)圖像的協(xié)方差矩陣G定義為:G=Ex-E(x)Tx-E(x) (4-29)G是一個n×n的非負正定矩陣。假設(shè)有M幅測試樣本圖xi=(i=12,M)平均圖像矩陣u=1/M *xi由此可知,使得J(U)最大的U中每列向量是圖像協(xié)方差矩陣G的r個非零特征值對應(yīng)的特征向量,一般選擇前面p個特征向量來構(gòu)成特征空間U= (U1U2U3UP)=arg maxJ

52、(U)2.3.3 基于線性判別的人臉識別算法近年來,基于線性回歸人臉識別方法不斷受到關(guān)注,>等57提出來一種基于線性回歸的人臉識別方法,該方法通過形成一個線性表示模型,將一個待測試圖像表示成一個特定類的線性組合,再通過最小二乘方法求解該線性組合的系數(shù),最后根據(jù)所求的系數(shù)重構(gòu)誤差進行分類。本章將對基于最小二乘的線性回歸模型在人臉識別中的應(yīng)用進行研宄。4.1基本的線性表示模型考慮一個標(biāo)準(zhǔn)的線性模型:Y = X + (4-1)其中Y是一n×1維響應(yīng)向量,X=(x1,x2,x3,xp)是一個n×p維的設(shè)計矩陣, =Y-X是一個n維的向量,稱為殘差, 是一個p×1維的

53、未知表示系數(shù),需要被估計。在現(xiàn)實應(yīng)用中,表示系數(shù)冷是我們要求得的未知量,e也是未知的,對于這樣一個線性方程而言,我們無法在這樣兩個變量未知的情況下去求另一個變量。但我們都期待這樣一個事實:在現(xiàn)實的應(yīng)用當(dāng)中,希望表示誤差越小越好,并且最好是誤差值的分布滿足某一特定的規(guī)律?;谶@樣一種考慮,通常研究過程中都假設(shè)e是一個獨立同分布的隨機變量,因此,便可以利用概率估計來進行處理。用P表示概率函數(shù),可以得到式(4-1)的似然估計函數(shù):P(Y) = flpiY-Xf3) (4-2)換成對數(shù)形式為:1() = log P,(Y) = logp(F XP)(4-3)上面問題對于變量的極大似然(Maximum

54、Likelihood,ML)估計為:max i=1Plogp(Y - X) (4-4)Byod在凸優(yōu)化一書中指出,如果密度函數(shù)的對數(shù)函數(shù)是凹函數(shù),那么上述的優(yōu)化問題就是凸優(yōu)化問題,對于懲罰函數(shù)-logp便有如下的近似懲罰形式:min (1)+ (2) +(p)s.t = Y-Xß (4-5)此處RR叫做殘差懲罰函數(shù),假設(shè)是一個凸函數(shù),式(4-5)便是一個凸優(yōu)化問題,值得一提的是,在很多情況下,懲罰函數(shù)$是非負且對稱的。于是我們可以將式子(4-4)轉(zhuǎn)換為一個凸優(yōu)化問題:假設(shè)e是滿足均值為零,方差為CT2的隨機變量,分布函數(shù)為:上面式(4-3)中的極大似然估計可以表示成:m = -i)l

55、og(2na') -y- XpI (4-6)因此上面的最大似然估計問題便轉(zhuǎn)化成了最小二乘問題對比線性表示模型是最小二乘(Least Square,LS),它的基本思想是求,使得殘差s平方和達到最小,其定義為:從上面的分析可以看出,這種基于最小二乘的線性回歸問題的求解從本質(zhì)上講是假設(shè)了殘差變量的分布才成立的。2.3.4 基于支持向量機的人臉識別算法VaPnik于20世紀六、七十年代創(chuàng)立統(tǒng)計學(xué)習(xí)理論。這是一門研究基于經(jīng)驗數(shù)據(jù)的機器學(xué)習(xí)理論的科學(xué),它的發(fā)展和成熟既豐富了現(xiàn)代數(shù)理統(tǒng)計學(xué)的內(nèi)容與成果,又在具體工程領(lǐng)域找到了廣泛的應(yīng)用。支持向量機建立在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原則基礎(chǔ)

56、之_匕根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳平衡點,以獲得最好的推廣能力。支持向量機算法不同于傳統(tǒng)的統(tǒng)計方法,實現(xiàn)了從訓(xùn)練樣本到預(yù)測樣本的“轉(zhuǎn)導(dǎo)推理”。支持向量機尋求現(xiàn)有信息下的最優(yōu)解,有效地避免了過學(xué)習(xí)現(xiàn)象的產(chǎn)生;最終轉(zhuǎn)化為一個二次尋優(yōu)問題,所得是全局最優(yōu)解,避免了在神經(jīng)網(wǎng)絡(luò)方法中無法避免的局部極值問題:引入核技術(shù),將實際問題通過非線性變換映射到高維的特征空間,通過在高維特征空間中的線性判決來實現(xiàn)輸入數(shù)據(jù)空間的非線性判決,解決了樣本維數(shù)問題,實現(xiàn)了算法復(fù)雜度與樣本維數(shù)解相關(guān)。支持向量機是針對兩類分類問題建立的,而實際的人臉識別問題屬于多類分類問題。對于多類分類問題,主要有兩種

57、解決思路,一種是在標(biāo)準(zhǔn)支持向量機的基礎(chǔ)上推廣其二次優(yōu)化問題,使支持向量機本身成為解決多類分類問題的多類分類器,但往往這樣的優(yōu)化問題復(fù)雜度會大幅上升,當(dāng)樣本數(shù)量相對較大時,其時間復(fù)雜度也隨之上升,同時準(zhǔn)確率卻隨之下降;另一種思路則是將多類分類問題轉(zhuǎn)化為多個二值分類問題,如一對一、一對多方法及其改進方法等,通過實現(xiàn)這些分類算法來解決實際的人臉識別問題?!耙粚σ弧狈诸愃惴ǎ喝鐖D4一2所示,在一對一分類算法中,算法通過求解多個目標(biāo)函數(shù),構(gòu)建多個分類超平面,每一步都將任意兩類樣本分開。對于N類分類問題,這種算法需要N(N一1)/2個支持向量機分類器。訓(xùn)練時,每個分類器僅需兩類訓(xùn)練樣本參與,即正樣本和負樣

58、本,對不同的分類器同一訓(xùn)練樣本需要標(biāo)注不同的類別。判決時,將待測樣本輸入到所有的分類器,需要做N(N一l)/2次分類判決,由分類器投票來確定待測樣本的類別。此類算法具有較高的分類精度,但隨著樣本類別的增加,樣本的訓(xùn)練和待測樣本的判決復(fù)雜度呈非線性增長,因此,此類算法未能在實際應(yīng)用得到廣泛應(yīng)用。2.“一對多”分類算法與一對一分類算法類似的是,一對多分類算法分類時每一步也考慮所有樣本,對每個分類器同一訓(xùn)練樣本也具有不同的類別標(biāo)注。不同的是,一對多分類算法,訓(xùn)練時需要所有樣本參與,屬于該類的為正樣本,其余為負樣本;在分類時,每一步都將其中的一類樣本和其他的所有樣本分開。對于N類分類問題,只需要N個分類器;判決時,需要將待測樣本輸入到N個分類器,由分類器輸出值來確定待測樣本的類別。此類算法分類器較少,分類速度較快,但其存在樣本數(shù)集偏移現(xiàn)象,并且在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論