人臉識別文獻綜述解讀_第1頁
人臉識別文獻綜述解讀_第2頁
人臉識別文獻綜述解讀_第3頁
人臉識別文獻綜述解讀_第4頁
人臉識別文獻綜述解讀_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

文獻綜述1引言在計算機視覺和模式識別領域,人臉識別技術(shù)(FaceRecognitionTechnology,簡稱FRT)是極具挑戰(zhàn)性課題之一。近年來,伴隨相關技術(shù)飛速發(fā)展和實際需求日益增加,它已逐步引發(fā)越來越多研究人員關注。人臉識別在許多領域有實際和潛在應用,在諸如證件檢驗、銀行系統(tǒng)、軍隊安全、安全檢驗等方面都有相當寬廣應用前景。人臉識別技術(shù)用于司法領域,作為輔助伎倆,進行身份驗證,罪犯識別等;用于商業(yè)領域,如銀行信用卡身份識別、安全識別系統(tǒng)等等。正是因為人臉識別有著寬廣應用前景,它才越來越成為當前模式識別和人工智能領域一個研究熱點。即使人類能夠毫不費勁識別出人臉及其表情,不過人臉機器自動識別依然是一個高難度課題。它牽涉到模式識別、圖像處理及生理、心理等方面很多知識。與指紋、視網(wǎng)膜、虹膜、基因、聲音等其余人體生物特征識別系統(tǒng)相比,人臉識別系統(tǒng)愈加友好、直接,使用者也沒有心理障礙。而且經(jīng)過人臉表情/姿態(tài)分析,還能取得其余識別系統(tǒng)難以取得一些信息。自感人臉識別能夠表述為:對給定場景靜態(tài)或視頻序列圖像,利用人臉數(shù)據(jù)庫驗證、比對或指認校驗場景中存在人像,同時能夠利用其余間接信息,比如人種、年紀、性別、面部表情、語音等,以減小搜索范圍提升識別效率。自上世紀90年代以來,人臉識別研究得到了長足發(fā)展,國內(nèi)外許多著名理工大學及TT企業(yè)都成立了專門人臉識別研究組,相關研究綜述見文件[1-3]。本文對近年來自感人臉識別研究進行了綜述,分別從人臉識別包括理論,人臉檢測與定位相關算法及人臉識別關鍵算法等方面進行了分類整理,并對具備經(jīng)典意義方法進行了較為詳盡分析對比。另外,本文還分析介紹了當前人臉識別優(yōu)勢與困難。2人臉識別相關理論圖像是人們出生以來體驗最豐富最主要部分,圖像能夠以各種各樣形式出現(xiàn),我們只有意識到不一樣種類圖像區(qū)分,才能愈加好了解圖像。要建立一套完整人臉識別系統(tǒng)(FaceRecognetionSystem,簡稱FRS),必定要綜合利用以下幾大學科領域知識:2.1數(shù)字圖像處理技術(shù)數(shù)字圖像處理又稱為計算機圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理過程,數(shù)字圖像處理最早出現(xiàn)于20世紀50年代,當初電子計算機己經(jīng)發(fā)展到一定水平,人們開始利用計算機來處理圖形和圖像信息。數(shù)字圖像處理作為一門學科大約形成于20世紀60年代早期。與人類對視覺機理研究歷史相比,數(shù)字圖像處理是一門相對年輕學科,但在其短短歷史中,它卻以不一樣程度成功使用于幾乎全部與成像關于領域?,F(xiàn)在,數(shù)字圖像處理技術(shù)己被廣泛應用于辦公自動化、工業(yè)機器人、地理數(shù)據(jù)處理、醫(yī)學數(shù)據(jù)處理、地球資源遙感、交互式計算機輔助設計等領域,尤其在機器視覺應用系統(tǒng)中成為關鍵技術(shù)之一。通常圖像都是模擬圖像,對于模擬圖像只能采取模擬處理方式進行處理,計算機不能接收和處理模擬信號,只有將連續(xù)模擬信號變換為離散數(shù)字信號,或者說將模擬圖像變換為數(shù)字圖像才能接收。數(shù)字圖像處理就是對給定數(shù)字圖像進行一些變換過程。對含有噪聲圖像,要除去噪聲、濾去干擾,提升信噪比;對信息微弱圖像要進行灰度變換等增強處理;對已經(jīng)退化含糊圖像要進行各種復原處理;對失真圖像要進行幾何校正等變換。除此之外,圖像合成,圖像邊緣提取與分割,圖像編碼、壓縮與傳輸,圖像分析等技術(shù)也屬于圖像處理內(nèi)容。由此可見,圖像處理就是為了達成改進圖像質(zhì)量,將圖像變換成便于人們觀察和適于機器識別目標[4]。2.2神經(jīng)網(wǎng)絡人工神經(jīng)網(wǎng)絡是一門以對大腦生理研究結(jié)果為基礎,以用機器模擬大腦一些生理與機制,實現(xiàn)某方面功效為目標學科[6]。研究神經(jīng)網(wǎng)絡,尤其是神經(jīng)學習機理,對認識和促進人本身發(fā)展有特殊意義。神經(jīng)網(wǎng)絡有許多具備非線性映射能力神經(jīng)元組成,神經(jīng)元之間經(jīng)過權(quán)系數(shù)連接。網(wǎng)絡信息分布式就存在連接系數(shù)中,使網(wǎng)絡具備很高容錯性和魯棒性。神經(jīng)網(wǎng)絡技術(shù)已經(jīng)被有效地用到組合優(yōu)化、圖像處理、模式識別、自動控制等方面?;谏窠?jīng)網(wǎng)絡技術(shù)人臉識別方法是人臉識別研究領域中一大主要分支。2.3模式識別模式識別[7],就是經(jīng)過計算機用數(shù)學技術(shù)方法來研究模式自動處理和判讀。這門學科使用計算機方法實現(xiàn)人模式識別能力,即對各種事物或現(xiàn)象進行分析、描述、判別和識別。在人臉識別中,假如是個人識別,則每一個人就是一個模式,預先存在數(shù)據(jù)庫里圖像就是樣本;假如是性別識別、種族識別或年紀識別,則不一樣性別、種族或年紀就組成一個模式;假如是表情識別,則不一樣表情就是一個模式。人臉識別重在討論個人識別,人臉識別最終目標就是利用人臉圖像確定待識別人到底與數(shù)據(jù)庫里哪個人是同一個人,這是一個“是誰”問題;或要判斷這個人與庫里某個人是不是同一個人,這是一個“認識或不認識”問題。圖像識別是指對視覺圖像目標按其物理特征進行分類,屬于模式識別范圍。圖像識別系統(tǒng)基本結(jié)構(gòu)如圖1所表示。圖像預處理圖像預處理分類決議結(jié)果圖像特征提取輸入圖像圖1圖像識別系統(tǒng)基本結(jié)構(gòu)2.4計算機視覺在客觀世界中,人類經(jīng)過視覺識別文字和周圍環(huán)境,感知外界信息。人們75%信息量都來自視覺,所以讓計算機或機器人具備視覺,是人工智能主要步驟,也是人類多年以來夢想。在信號處理理論與高性能計算機出現(xiàn)后,這種希望正在逐步實現(xiàn)。用計算機實現(xiàn)對視覺信息處理形成了一門新興學科——計算機視覺。計算機視覺是一門用計算機來實現(xiàn)人視覺功效,實現(xiàn)客觀三維世界識別學科。計算機視覺最終目標是模擬人類視覺能力,了解并解釋周圍世界,其研究一個關鍵內(nèi)容是圖像識別。3人臉檢測與定位人臉檢測與定位是自感人臉識別系統(tǒng)首先需要處理關鍵問題,也即檢測圖像中是否有些人臉存在,若有,則將其從背景中分割出來并確定其在圖像中位置。在一些能夠控制拍攝條件場所,如警察拍攝罪犯照片時將人臉限定在標尺內(nèi),此時人臉定位因為己經(jīng)具備了人臉位置先驗知識而相對比較簡單;證件照(身份證、護照等)因為背景相對簡單,定位也比較輕易。但在通常情況實際應用中,人臉在圖像中位置預先未能得知,人臉檢測與定位將受到以下原因制約:(1)人臉在圖像中位置、角度和尺度不一樣以及光照改變;(2)發(fā)型、眼鏡、胡須以及人臉表情改變等;(3)圖像中噪聲影響。所以從某種程度上說,人臉檢測與定位甚至比人臉模式識別更為關鍵。按照人臉檢測技術(shù)發(fā)展歷程,本文依據(jù)采取主要技術(shù)方法將人臉檢測分為以下四種類型:基于特征檢測方法、基于膚色檢測方法、基于模板匹配方法、基于外觀統(tǒng)計學習方法。3.1基于特征檢測方法基于特征人臉檢測方法依據(jù)人臉面部幾何特征、紋理特征、膚色特征進行人臉和非人臉判別,見下表:表1基于特征人臉檢測與關鍵特征定位算法人臉特征主要算法主要參考文件邊緣、輪廓邊緣檢測算子;橢圓擬合等[8,9]器官特征形態(tài)學運算;自適應域值;局部特征檢測;模板匹配;概率決議等[10,11]紋理特征(膚色、頭發(fā)、胡須等)灰度共生矩陣(二階紋理統(tǒng)計特征);神經(jīng)網(wǎng)絡分類器;自組織映射網(wǎng)絡等[12,13]3.2基于膚色檢測方法利用人臉膚色信息進行人臉檢測曾經(jīng)一度成為人臉檢測領域研究熱點,涌現(xiàn)了大量學術(shù)文件,Lee等[14]最早利用人臉膚色信息進行人臉定位;Saber[15]利用膚色、人臉形狀及幾何對稱信息實現(xiàn)人臉檢測和面部特征抽??;Jones[16]利用大量樣本圖像對膚色檢測問題進行了分析,并建立了人臉膚色統(tǒng)計模型用于人臉檢測,收到了很好檢測效果;Terrillon[17]使用高斯模型和混合高斯模型在不一樣色度空間建立膚色模型進行人臉檢測,并進行了對比分析,結(jié)果發(fā)覺混合高斯模型比通常高斯模型具備愈加好泛化能力;Hadid[18]基于Skin-Locus建立膚色模型,提取彩色人臉區(qū)域?qū)崿F(xiàn)人臉檢測,但需要在固定成像參數(shù)下才確保有良好性能,魯棒性有待提升;Martinkauppi[19]對Skin-Locus理論進行了細致分析,發(fā)覺人臉膚色在各種光照條件下能夠用兩個二次或者數(shù)次多項式進行擬合;Comanieiu[20]采取Mean-Shift算法進行局部搜索實現(xiàn)人臉檢測與跟蹤,該算法提升了人臉檢測速度,對遮擋和光照魯棒性很好,但對于復雜背景和多個人臉目標檢測不夠魯棒;Hsu[21]采取光照賠償方法克服光照問題,從一定程度上處理了偏色、復雜背景和多人臉目標檢測問題,對人臉位置、尺度、旋轉(zhuǎn)、姿態(tài)和表情等改變具備很好魯棒性;Sobottka和Pitas[22]結(jié)合膚色(HSV)和人臉形狀信息來定位人臉和進行面部特征提?。籘errillon[23]等利用高斯模型對膚色象素進行聚類,并采取神經(jīng)網(wǎng)絡對二值圖像幾何距進行學習實現(xiàn)人臉檢測;Garcia和Tziritas[24]采取量化膚色區(qū)域合并結(jié)合小波分析實現(xiàn)人臉檢測??傉f來,基于膚色檢測方法魯棒性提升依賴于膚色模型質(zhì)量,在背景相對簡單情況下能夠取得良好檢測效果;但在復雜背景中,尤其是背景中存在較多類膚色區(qū)域時,檢測質(zhì)量將急劇下降。而且,膚色模型在不一樣人種之間會存在較大差異,因而極難建立一個通用性很強人臉膚色統(tǒng)計模型。所以,基于膚色檢測人臉檢測方法應用受到一定限制。3.3基于模板匹配方法基于模板匹配方法首先需要人工定義一組標準或參數(shù)化人臉模式(通常為正面),稱之為模板。對于給定輸入圖像,經(jīng)過計算其與標準模板相關系數(shù)并依攝影關系數(shù)判斷是否為人臉,詳見表2。這種人臉檢測方法實現(xiàn)簡單,不過因為人臉尺度、姿態(tài)和形狀不確定性,基于模板人臉檢測方法通常達不到很高準確率。表2基于模板匹配人臉檢測方法模板種類主要算法主要參考文件固定模板人臉子模板(眼睛、鼻子)梯度圖像;相關匹配等[25,26]人臉形狀模板邊緣檢測;相關匹配等[27,28]分塊百分比模板[29]重心模板Laplancian邊緣檢測;相關匹配等[30]變形模板彈性模型能量函數(shù)度量[31]Snakes能量函數(shù)度量[32]PDM模型ASM搜索[33]3.4基于統(tǒng)計學習方法與上述方法不一樣,基于統(tǒng)計學習方法主要采取大量人臉與非人臉樣本對檢測分類器進行訓練,將人臉檢測轉(zhuǎn)化為二類模式分類問題。Propp等人是最早采取神經(jīng)網(wǎng)絡[34]進行人臉檢測學者之一,他們經(jīng)過結(jié)構(gòu)一個4層(兩個隱藏層)神經(jīng)網(wǎng)絡實現(xiàn)人臉檢測,但沒有相關檢測性能報道;后人在他們基礎上經(jīng)過優(yōu)化神經(jīng)網(wǎng)絡結(jié)構(gòu)提出了時延神經(jīng)網(wǎng)絡(TDNN),自組織映射神經(jīng)網(wǎng)絡(SOM)、卷積神經(jīng)網(wǎng)絡(CNN)、概率決議神經(jīng)網(wǎng)絡(PDBNN)。Feraud等人經(jīng)過結(jié)構(gòu)自協(xié)商神經(jīng)網(wǎng)絡(SNNN)[35]進行非線性主元分析,能夠檢測正面到左右60度旋轉(zhuǎn)人臉,他們方法日后被Listen和Multrak采取。Sung、Rowley、Lin&Kung等[36]采取K-mean聚類算法在特征空間建立“人臉”和“非人臉”族,采取自舉(bootstrap)方法首先建立一個僅使用人臉樣本和少許非人臉樣本訓練初始神經(jīng)網(wǎng)絡分類器對一組圖像進行訓練,將誤檢非人臉樣本加入非人臉樣本庫;然后訓練新分類器,如此不停迭代,直到搜集到足夠多非人臉樣本,這種方法日后被許多學者所采取。Carleson、Yang等[37]人提出SNoW(SparseNetworkofWinnows)學習方法,對檢測不一樣特征、表情、姿態(tài)和光照條件下人臉收到了很好效果。其實質(zhì)就是采取Winnow算法進行權(quán)值更新稀疏神經(jīng)網(wǎng)絡;H.Schneiderman[38]提出基于后驗概率估量方法,先對樣本進行小波變換,然后對這些特征進行統(tǒng)計,經(jīng)過統(tǒng)計計算訓練樣本直方圖求得人臉與非人臉概率分布實現(xiàn)人臉檢測。不一樣于傳統(tǒng)基于經(jīng)驗風險最小化分類器,如貝葉斯分類器、神經(jīng)網(wǎng)絡分類器等,支持向量機分類器(SVM)以基于結(jié)構(gòu)風險最小化原理最小化泛化誤差,經(jīng)過結(jié)構(gòu)最優(yōu)分類超平面實現(xiàn)模式分類。在這一領域,Osuna等人最早提出采取SVM分類器進行人臉檢測,并提出了針對大規(guī)模數(shù)據(jù)集SVM訓練算法。試驗結(jié)果顯示基于SVM人臉檢測速度比早先Sung等人提出神經(jīng)網(wǎng)絡人臉檢測快足足30倍。Nefian[39]等人采取隱馬爾可夫模型(HiddenMarkovModels簡稱HMM)檢測人臉。HMM是一個雙重隨機過程,采取節(jié)點表示狀態(tài),有向邊表示狀態(tài)之間轉(zhuǎn)移。所以適合描述信號統(tǒng)計特征。Nefian等經(jīng)過檢測區(qū)域中每個子區(qū)域,采取K-L變換系數(shù)作為觀察矢量,經(jīng)過B-W和維特比算法取得HMM模型參數(shù),依據(jù)區(qū)域觀察序列輸出概率判決是否為人臉。3.5AdaBoost算法訓練器康柏研究院Viola[40]在國際計算機學術(shù)年會上發(fā)表論文標志著人臉檢測技術(shù)開始走向?qū)嵱?。他們?jīng)過綜合AdaBoost[41,42,43]和Cascade算法實現(xiàn)了實時人臉檢測,使得人臉檢測開始邁向?qū)嵱没缆贰6沂状我肓恕胺e分圖像”(IntegalImage)概念,大大加緊了檢測過程中特征計算速度。利用Adaboost學習算法提升一個簡單分類器(弱分類器)性能,理論上最終形成強分類器訓練錯誤率靠近零,而且推廣性好。Viola在他試驗中定義了180000種矩形特征,經(jīng)過試驗選擇一小部分特征形成一個有效分類器。繼Viola等提出用于人臉檢測AdaBoost算法之后,許多學者對他們算法進行了繼承和發(fā)展。首先,Lienlxart等人提出了新旋轉(zhuǎn)Haar-Like特征,能夠用于旋轉(zhuǎn)人臉快速檢測,同時提出了一些其余Boosting法:如DiscreteAdaBoost,RealAdaBoost,GentleAdaBoost等。Froba在AdaBoost算法基礎上提出了基于灰度圖像正面和平面內(nèi)旋轉(zhuǎn)人臉實時檢測系統(tǒng),在EOM(EdgeOrientationMatching)基礎上進行擴展,引入SNoW算法進行校驗,得到一個更為魯棒系統(tǒng)。國內(nèi)李子清在AdaBoost算法基礎上提出了FloatBoost算法,實現(xiàn)多視角人臉檢測,經(jīng)過從粗到精、從簡單到復雜金字塔型人臉檢測;與傳統(tǒng)Adaboost算法相比,能在提升人臉檢測速度同時提升檢測精度。Liu提出了基于Kullback-LeiblerBoosting(KLB)算法分類器,處理了傳統(tǒng)AdaBoost算法存在弱分類器最優(yōu)組合以及最優(yōu)分類器和特征選擇問題。Viola本人也對AdaBoost算法進行了改進,提出了不對稱AdaBoost算法,用于快速圖像檢索和人臉檢測??傉f來,基于Boosting和Cascade算法系統(tǒng)在速度方面具備很大優(yōu)越性,經(jīng)過Haar-Like特征訓練一些弱分類器,再組合成一個強分類器。怎樣在提升檢測精度同時不降低檢測速度,能夠從以下方面綜合考慮:采取更優(yōu)特征描述方法,綜合AdaBoost和強分類器。3.6多個方法結(jié)合人臉檢測與精準定位是一個頗具挑戰(zhàn)性研究課題,一些效果很好人臉檢測系統(tǒng)并不只是采取上述某種方法,而是將多個方法有機地融合。主流方法大多是基于統(tǒng)計學習,所以受學習樣本影響較大,不一樣本集合對算法性能也有一定影響。復雜背景中正面人臉檢測已經(jīng)有了比很好結(jié)果,多姿態(tài)人臉檢測依然是現(xiàn)在研究重點,即使取得了一些進展,但怎樣利用人臉深度信息處理姿態(tài)和光照問題還有待深入研究。4人臉識別方法識他人臉主要依據(jù)那些在不一樣個體之間存在較大差異而對于同一個人則比較穩(wěn)定特征。詳細特征形式隨識別方法不一樣而不一樣。早期研究較多靜態(tài)人臉識別方法有基于幾何特征人臉識別方法和基于相關匹配人臉識別方法。現(xiàn)在,靜止圖像人臉識別方法主要有三個研究方向:一是基于統(tǒng)計識別方法,包含特征臉(Eigenface)方法[44]和隱馬爾科夫模型(HiddenMarkovModel)[45]方法;二是基于連接機制識別方法,包含通常神經(jīng)網(wǎng)絡方法[46]和彈性圖匹配[47](ElasticGraphMatching)方法;三是其余一些綜合方法或處理非二維灰度圖像方法。4.1基于幾何特征人臉識別方法常采取幾何特征[48]有些人臉五官如眼睛、鼻子、嘴巴等局部形狀特征,臉型特征以及五官在臉上分布幾何特征。提取特征時往往要用到人臉結(jié)構(gòu)一些先驗知識。在這種基于幾何特征識別中,識別總歸為特征矢量之間匹配,基于歐氏距離判決是最慣用識別方法。識別所采取幾何特征是以人臉器官形狀和幾何關系為基礎特征矢量,其分量通常包含人臉指定兩點間歐式距離、曲率、角度等。基于幾何特征識別方法具備以下優(yōu)點:符合人類識他人臉機理,易于了解;對每幅圖像只需存放一個特征矢量,存放量小;對光照改變不太敏感。這種方法一樣存在以下問題:從圖像中抽取穩(wěn)定特征比較困難,尤其是特征受到遮擋時這種情況更為顯著;對強烈表情改變和姿態(tài)改變魯棒性較差;通常幾何特征只描述了部件基本形狀與結(jié)構(gòu)關系,忽略了局部細微特征,造成部分信息丟失,更適合于粗分類。4.2基于模板匹配人臉識別方法模板匹配法[49][50]是一個經(jīng)典模式識別方法,這種方法大多是用歸一化相互關直接計算兩幅圖像之間匹配程度。因為這種方法要求兩幅圖像上目標要有相同尺度取向和光照條件,所以預處理要做尺度歸一化和灰度歸一化工作。最簡單人臉模板是將人臉看成一個橢圓,檢測人臉也就是檢測圖像中橢圓。另一個方法是將人臉用一組獨立小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。但這些模板取得必須利用各個特征輪廓,而傳統(tǒng)基于邊緣提取方法極難取得較高連續(xù)邊緣。即使取得了可靠度高邊緣,也極難從中自動提取所需特征量。為此,用彈性模板方法提取特征顯示出其獨到優(yōu)越性。彈性模板由一組依照特征形狀先驗知識設計可調(diào)參數(shù)所定義。為了求出這組參數(shù),需要利用圖像邊緣、峰值、谷值和強度信息及特征形狀先驗知識設計適宜能量函數(shù)。參數(shù)向能量減小方向調(diào)整,當能量達成最小時,這組參數(shù)對應模板形狀最符合特征形狀。4.3特征臉方法特征臉(Eigenface)[51]方法是從主成份分析(PrincipalComponentAnalysis,PCA)[53]導出一個人臉識別和描述技術(shù)。PCA實質(zhì)上是K-L展開網(wǎng)絡遞推實現(xiàn),K-L變換是圖像壓縮中一個最優(yōu)正交變換,其生成矩陣通常為訓練樣本總體散布矩陣。特征臉方法就是將包含人臉圖像區(qū)域看作是一個隨機向量,所以能夠采取K-L變換取得其正交K-L基底,對應其中較大特征值基底具備與人臉相同形狀,所以又稱之為特征臉。利用這些基底線性組合能夠描述、表示和迫近人臉圖像,所以能夠進行人臉識別和合成。識別過程就是將人臉圖像映射到由特征臉張成子空間上,比較其與已知人臉在特征臉空間中位置。近年來,據(jù)此發(fā)展了多個對特征臉改進方法,如雙子空間法、相形歧義分析方法、Fisher臉方法等。另首先,Albert等將PCA與人臉拓撲關系結(jié)合起來提出TPCA(topologicalprincipalcomponentanalysis)方法,識別率較單一PCA類方法有所提升。另外,與K-L變換思想比較靠近,但不是從統(tǒng)計角度出發(fā)。另一個變換是奇異值分解(SVD)方法,即將圖像矩陣奇異值作為模式特征矢量。4.4隱馬爾科夫模型隱馬爾科夫模型(HiddenMarkovModel,HMM)[52]是用于描述信號統(tǒng)計特征一組統(tǒng)計模型。HMM使用馬爾科夫鏈來模擬信號統(tǒng)計特征改變,而這種改變又是間接地經(jīng)過觀察序列來描述,所以,隱馬爾科夫過程是一個雙重隨機過程。在HMM中,節(jié)點表示狀態(tài),有向邊表示狀態(tài)之間轉(zhuǎn)移,一個狀態(tài)能夠具備特征空間中任意特征,對同一特征,不一樣狀態(tài)表現(xiàn)出這一特征概率不一樣。因為HMM是一個統(tǒng)計模型,對于同一特征序列,可能會對應于許多狀態(tài)序列,特征序列與狀態(tài)序列之間對應關系是非確定。這種模型對于狀態(tài)序列來說是隱,故稱為隱馬爾科夫模型。HMM有三個主要問題:評定、估量及解碼。我們關心是前兩個問題,評定用于處理識別問題,通常采取比較有效“向前-向后”法;估量用來產(chǎn)生用于識別各個單元HMM,采取Baum-Welch方法。4.5基于神經(jīng)網(wǎng)絡方法利用神經(jīng)網(wǎng)絡,人們就不需要為人臉識別清楚地定義特征。Kohonen將自組織映射(self-organizingmap,縮寫SOM)網(wǎng)絡應用于人臉回顧。即使當輸入圖像帶有強烈噪聲或有部分丟失,準確回顧能力依然能夠取得。Lawrenceetal.[53]使用了一個混合神經(jīng)網(wǎng)絡系統(tǒng),主要包含了一個改進五層SOM網(wǎng)絡和CNN網(wǎng)絡(Convolutionalneuralnetworks),其中CNN具備局部權(quán)值共享拓撲結(jié)構(gòu)。這種結(jié)構(gòu)與基于接收區(qū)域(receptivefields)生物網(wǎng)絡有更多相同點,而且提升了對局部變形忍耐性。多層感知機神經(jīng)網(wǎng)絡(Multi-layerperceptronneuralnetworks)和徑向基函數(shù)網(wǎng)絡(radialbasisfunctionnetworks)也已經(jīng)被用于人臉識別。4.6彈性匹配方法彈性圖匹配方法[54][55]是一個基于動態(tài)鏈接結(jié)構(gòu)(DynamicLinkArchitecture,DLA)方法。它將人臉用格狀稀疏圖表示,圖中節(jié)點用圖像位置Gabor小波分解得到特征向量標識,圖邊用連接節(jié)點距離向量標識。匹配時,首先尋找與輸入圖像最相同模型圖,再對圖中每個節(jié)點位置進行最好匹配,這么產(chǎn)生一個變形圖,其節(jié)點迫近模型圖對應點位置。Wiskott等人使用彈性圖匹配方法,以FERET圖像庫做試驗,準確率達成97.3%。彈性圖匹配方法對光照、位移、旋轉(zhuǎn)及尺度改變都不敏感,是一個優(yōu)于特征臉方法人臉識別方法。此方法主要缺點是對每個存放人臉需計算其模型圖,計算量大,存放量大。為此,Wiskott在原有方法基礎上提出聚束圖匹配,部分克服了這些缺點。在聚束圖中,全部節(jié)點都已經(jīng)定位在對應目標上。對于大量數(shù)據(jù)庫,這么能夠大大降低識別時間,另外,利用聚束圖還能夠匹配不一樣人最相同特征。所以能夠取得關于未知人性別、胡須和眼鏡等相關信息。Lee等提出了一個基于彈性圖動態(tài)鏈接模型方法,既取得較高識別速度,也取得了較理想識別率,在一定程度上克服了以往方法總是在速度與識別率之間進行折中缺點。4.7其它人臉識別方法以上幾個經(jīng)典人臉識別方法,每種方法各有其優(yōu)缺點,所以能夠把多個方法綜合起來,或同時利用不一樣種類特征。要從大量人臉數(shù)據(jù)庫中進行識別,單靠擴展單一個類特征數(shù)目是不夠,而要擴展與原特征集正交其它種類特征。Jia等在正面人臉幾何特征基礎上,將側(cè)面輪廓特征、眼睛形狀特征以及人臉輪廓特征也加入特征矢量,取得了較采取單一正面人臉幾何特征為特征矢量方法更高識別率。Lai等結(jié)合小波變換與傅立葉變換提出與平移、縮放、平面內(nèi)旋轉(zhuǎn)無關光譜臉人臉表征方法?,F(xiàn)在人臉識別研究對象基本上都是針對二維灰度圖像,除此之外,還有深度人臉圖像識別和紅外人臉圖像識別方法。深度圖像包含了人臉深度信息,Gordon針對深度圖像提出了一個基于模板用圖像數(shù)據(jù)曲率作描述子識別方法。他使用一個旋轉(zhuǎn)激光掃描系統(tǒng)取得人臉深度圖像,取得曲面數(shù)據(jù)以柱坐標形式存放,然后依照曲面上各點法向最大和最小曲率振幅和相位值定位眼睛、鼻子和兩側(cè)臉部區(qū)域紅外人臉圖像(也叫溫譜圖)對每個人來說都是唯一。所以能夠利用溫譜圖識他人臉。另外在黑暗中也能捕捉紅外光,所以用紅外人臉圖像在黑暗中也能進行識別。對于多CCD攝像機系統(tǒng),能夠得到多視點人臉圖像,從而能夠取得人臉立體模型,含有三維信息特征能有效處理人臉在光照偽裝或年紀改變等情況下識別問題。5人臉識別系統(tǒng)優(yōu)勢與關鍵技術(shù)難題人臉是三維非剛性體,利用人臉生物特征自感人臉識別系統(tǒng)與基于其余人體生物特征識別系統(tǒng)相比,既具備其獨特優(yōu)勢,也存在一些困難。5.1人臉識別優(yōu)勢自感人臉識別技術(shù)優(yōu)勢主要表現(xiàn)在:(1)非接觸式數(shù)據(jù)采集人臉圖像能夠經(jīng)過標準視頻或熱成像技術(shù)非接觸式采集,因而不會對用戶造成生理上傷害,具備非直接侵犯性。(2)可隱蔽性強用于捕捉人臉圖像成像設備能夠隱蔽安裝,尤其適合處理重大安全問題、罪犯監(jiān)控、過濾敏感人物(間諜、恐怖分子)及實施抓捕,是其它基于指紋、虹膜、視網(wǎng)膜、掌紋等生物特征識別技術(shù)所無法比擬。(3)方便、快捷及便于事后追蹤自感人臉識別系統(tǒng)經(jīng)過非接觸方式捕捉人臉圖像,因而無需用戶過多干預。且能夠在事件發(fā)生同時統(tǒng)計當事人面像,從而確保系統(tǒng)具備良好事后追蹤能力。(4)可交互性強人類能夠輕而易舉地識別不一樣個體在不一樣時期不一樣狀態(tài)下人臉,而指紋、虹膜、視網(wǎng)膜等其余生物特征常人極難識別。所以與授權(quán)用戶交互和主動配合能夠從很大程度上提升人臉識別系統(tǒng)可靠性和可用性。5.2人臉識別系統(tǒng)若干關鍵技術(shù)問題現(xiàn)所研究一些人臉識別系統(tǒng)大多在約束環(huán)境下工作,假如注冊原型圖像和系統(tǒng)工作條件基本一致而且用戶主動配合,尚能夠達成令人滿意效果。但真正實用人臉識別系統(tǒng)需要在大規(guī)模人臉庫、工作環(huán)境非可控和用戶不配合(罪犯監(jiān)控與搜捕)等非約束環(huán)境下工作,即使經(jīng)過采取圖像預處理技術(shù)(亮度均衡和姿態(tài)學習等)能從一定程度上得以賠償,但大光照和姿態(tài)改變依然使得系統(tǒng)穩(wěn)定性急劇下降,即使是現(xiàn)在性能最好人臉識別商業(yè)系統(tǒng)識別率也不到80%而誤識率卻高達10%以上,基本無法滿足實際應用需求。FERET和FRVTS對人臉識別關鍵算法評測最少揭示了面臨兩個主要挑戰(zhàn):光照和姿態(tài)改變。另外,人臉局部遮擋、人臉老化、成像設備差異、化裝、飾物等原因影響在非約束、非合作(如視頻監(jiān)控)環(huán)境下是不可防止?,F(xiàn)有許多算法因為種種原因未能應用于人臉識別,最少沒有在大型人臉庫上進行實際測試。而且,上述問題往往在實際應用中共同出現(xiàn),這深入增加了人臉識別難度。下面就人臉識別系統(tǒng)所面臨五個主要技術(shù)挑戰(zhàn)分別加以分析:(1)光照改變光照改變,尤其在室外環(huán)境下,是基于2D人臉圖像人臉識別關鍵算法碰到最為棘手問題。因為光照造成人臉圖像改變甚至超出不一樣個體之間差異,進而改變?nèi)四槇D像在特征子空間分布,致使基于圖像比正確識別算法性能急劇下降。即使人們提出了一些應對光照改變處理方案,如啟發(fā)式拋棄主元方法、基于朗伯光照模型3D光照子空間、光照錐、人臉3D模型合成虛擬圖像等等。但大多都是基于理想條件和經(jīng)驗數(shù)據(jù)獲取人臉模型,因而極難走向?qū)嵱?。面向?qū)嶋H應用環(huán)境光照改變問題依然有待于深入研究。(2)姿態(tài)改變?nèi)四樧藨B(tài)改變和光照改變一樣,是實用人臉識別系統(tǒng)真正走向應用所面臨巨大障礙。即使能獲取人臉全部不一樣視角、不一樣光照和表情下樣本圖像,但這將造成人臉特征數(shù)據(jù)庫急劇膨脹和人臉識別關鍵算法時間復雜度和空間復雜度急劇上升。現(xiàn)在多數(shù)人臉識別關鍵算法在正面人臉情況下識別性能尚能接收,不過實際應用中輸入人臉圖像難以確??偸菧收嫒四槇D像。所以,怎樣提升人臉關鍵特征定位算法性能,據(jù)此估量待識他人臉圖像姿態(tài)并進行人臉姿態(tài)校正是現(xiàn)在人臉識別系統(tǒng)急需處理且極具挑戰(zhàn)性研究課題。(3)人臉圖像獲取質(zhì)量現(xiàn)在大多數(shù)人臉識別關鍵算法都是基于圖像質(zhì)量較高人臉庫測試結(jié)果,因而取得了較高識別率。但實用人臉識別系統(tǒng)往往會要求對低質(zhì)量人臉圖像進行識別,如視頻監(jiān)控、信息安全和門禁系統(tǒng)尤其是罪犯搜捕等應用場所獲取人臉圖像質(zhì)量低下,因而對人臉關鍵特征定位、特征抽取及人臉識別關鍵算法性能產(chǎn)生嚴重影響。主要存在以下三個特點:(1)視頻流質(zhì)量不高。視頻流通常都是室外(或室內(nèi)但光照條件差)而且用戶非合作狀態(tài)下獲取,因而人臉圖像光照和姿態(tài)存在很大隨機性;(2)全自動安全監(jiān)控系統(tǒng)。被監(jiān)控對象往往會存在局部遮擋和偽裝(墨鏡、帽子)情況,從而造成面部特征甚至是關鍵特征(眼睛)丟失,怎樣很好地處理這類問題也很值得我們關注;(3)人臉圖像小。因為受到捕捉條件限制(如成像距離等),人臉圖像通常都

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論