人臉識別——信號與信息處理前沿_第1頁
人臉識別——信號與信息處理前沿_第2頁
人臉識別——信號與信息處理前沿_第3頁
人臉識別——信號與信息處理前沿_第4頁
人臉識別——信號與信息處理前沿_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、論文題目:人臉識別算法綜述學(xué)院:電子與信息工程學(xué)院專業(yè):電子信息工程姓名:王鑫海學(xué)號:20071305054學(xué)科:信號與信息處理前沿學(xué)科老師:周曉彥二0一0年十月二十日信號與信息處理前沿課程論文 信號與信息處理前沿課程論文 人臉識別算法總述王鑫海20071305054南京信息工程大學(xué)電子信息工程摘要:人臉識別是人工智能領(lǐng)域的一個研究熱點(diǎn),是一種基于信息處理的模式識別。本文首先對人臉識別中的常用算法進(jìn)行了分類綜述,并分析了人臉識別工程中存在的困難,然后展望了人臉識別技術(shù)今后的發(fā)展和研究方向。關(guān)鍵詞:人臉識別;特征提?。惶卣髂?;算法1引言廣義的人臉識別實(shí)際包括構(gòu)建人臉識別系統(tǒng)的一系列相關(guān)技術(shù),包括

2、人臉圖像采集、人臉定位、人臉識別預(yù)處理、身份確認(rèn)以及身份查找等;而狹義的人臉識別特指通過人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。人臉識別技術(shù)6,即是利用計(jì)算機(jī)技術(shù)對輸入的靜態(tài)圖像或者視頻流序列中的圖像提取有效的識別特征,并以此辨明身份的一門技術(shù)。它涉及到模式識別、圖形圖像處理、計(jì)算機(jī)視覺、生理學(xué)、心理學(xué)以及認(rèn)知學(xué)等諸多學(xué)科的知識,并與基于其它生物特征的身份鑒別方法以及計(jì)算機(jī)人機(jī)感知交互的研究領(lǐng)域都有密切聯(lián)系。首先需要進(jìn)行人臉檢測與定位,判斷其是否存在人臉并明確人臉圖像位置。其次依據(jù)歸一化后人臉圖像信息,對每個人臉圖像進(jìn)行特征提取,找出其所蘊(yùn)涵的個性化特征。最后將其與已知的人臉進(jìn)行對比,從而識

3、別每個人臉的身份。早在上世紀(jì)六、七十年代,人臉識別技術(shù)就引起了研究者的濃厚興趣;進(jìn)入九十年代之后,由于高速度高性能的計(jì)算機(jī)的出現(xiàn),人臉識別技術(shù)取得了重大進(jìn)展。而自美國“9.11”事件以后,人臉識別在信息安全領(lǐng)域的作用逐漸顯現(xiàn)出來,人臉識別技術(shù)得到了前所未有的重視。國內(nèi)外對于人臉識別的研究發(fā)展,技術(shù)趨勢分別經(jīng)歷了三個階段:機(jī)械式的識別階段、機(jī)器自動識別初級階段、機(jī)器自動識別高級階段。第一階段為機(jī)械式的識別階段,是以Betillon,Allen和Parke為代表,主要研究人臉識別所需要的面部特征。該階段的識別依賴于人的操作,需要利用操作員的某些先驗(yàn)知識來進(jìn)行。在Bertillon的系統(tǒng)中,用一個簡

4、單的語句與數(shù)據(jù)庫中某一張臉相聯(lián)系,同與指紋分析相結(jié)合,提供了一個較強(qiáng)的識別系統(tǒng);為了提高識別率,Allen為待識別設(shè)計(jì)了一種有效和逼真的摹寫;Parke則用計(jì)算機(jī)實(shí)現(xiàn)了這一想法,并產(chǎn)生了較高質(zhì)量的人臉灰度圖模型。這一階段工作的特點(diǎn)是識別過程全部依賴于操作人員,顯然這不是一種可以完成自動識別的系統(tǒng)。第二階段為人機(jī)交互式初級階段,主要是采用機(jī)器自動識別的手段進(jìn)行識別。代表性工作有:Goldstino,Hannon和Leks用幾何特征參數(shù)來表示人臉正面圖像,他們采用21維特征向量表示人臉面部特征,并設(shè)計(jì)了基于這一特征表示法的識別系統(tǒng);Kaya和Kobayashi則采用了統(tǒng)計(jì)識別方法,用歐氏距離來表征

5、人臉特征,如嘴唇與鼻之間的距離,嘴唇的高度等;更進(jìn)一步地,.T.Kanad(M.Ngao)設(shè)計(jì)了一個高速且有一定知識導(dǎo)引的半自動回溯識別系統(tǒng),創(chuàng)造性地運(yùn)用積分投影法從單幅圖像上計(jì)算出一組臉部特征參數(shù),再利用模式分類技術(shù)與標(biāo)準(zhǔn)人臉相匹配,Kanad的系統(tǒng)實(shí)現(xiàn)了快速、實(shí)時的處理,是一個很大的進(jìn)步。這個階段需要利用操作員的某些先驗(yàn)知識,仍然擺脫不了人的干預(yù)。第三階段為機(jī)器自動識別高級階段,是真正向?qū)嵱没l(fā)展的機(jī)器識別階段,這一階段識別率和自動化程度得到了提高。隨著計(jì)算機(jī)的大型化、高速化和人臉識別的方法的發(fā)展,人們已提出了許多成熟、高效的方法,很多產(chǎn)品已用于實(shí)際應(yīng)用。目前世界上的商用識別系統(tǒng)主要有Id

6、netix(原Visionics)公司的“FaceIt”系統(tǒng),Viisage公司的“FacelD”系統(tǒng),Cognitec公司的“FaceVACS系統(tǒng)以及HumanScan公司的“BioID”系統(tǒng)例如:證件和各人臉識別技術(shù)在國家重要機(jī)關(guān)及社會安防領(lǐng)域具有廣泛而特殊的用途。類金融卡持有人的身份驗(yàn)證、公安系統(tǒng)的視覺監(jiān)控等。同其它人體生物特征(如:指紋、掌紋、虹膜、語音等)識別技術(shù)相比,人臉識別技術(shù)的隱蔽性最好,是當(dāng)今國際反恐安防最重視的科技手段和攻關(guān)目標(biāo)之一。此外,人臉識別技術(shù)還可用于多媒體數(shù)據(jù)庫的視頻檢索,以及多媒體制作等方面。近幾年,隨著計(jì)算機(jī)硬件和軟件技術(shù)的發(fā)展,基于人臉識別技術(shù)的表情信息提取

7、也成為可能,它可以用于改進(jìn)人機(jī)交互方式,從而產(chǎn)生更加人性化、智能化的計(jì)算機(jī)系統(tǒng)。人臉識別技術(shù)的發(fā)展正是受到商業(yè)應(yīng)用需求的推動,以及相關(guān)技術(shù)的發(fā)展而得到空前的重視,成為圖像識別和理解領(lǐng)域中的研究熱點(diǎn)。雖然人類具有很強(qiáng)的檢測和識別人臉的能力,但是要建造一個高性能的自動人臉識別系統(tǒng)卻是一個極其復(fù)雜的課題.人臉識別的性能受到人臉內(nèi)在生理變化和外界環(huán)境變化的影響較大,這使得該課題極富挑戰(zhàn)性.視覺是一種復(fù)雜的信息處理任務(wù),它的研究涉及計(jì)算機(jī)技術(shù)和心理/神經(jīng)生物科學(xué),早期的理論框架由D.Maar于20世紀(jì)80年代初期提出,他把視覺信息處理劃分為三個不同層次來描述:計(jì)算理論;算法;實(shí)現(xiàn)機(jī)制。近幾年的研究表明,

8、人類視覺數(shù)據(jù)處理是多層次的過程,其中最低層的視覺過程(視網(wǎng)膜功能)起信息轉(zhuǎn)儲作用,即將大量圖像數(shù)據(jù)轉(zhuǎn)換成較為抽象的信息,這一任務(wù)由視網(wǎng)膜中的兩類細(xì)胞完成:低層次的細(xì)胞對空間的響應(yīng)與小波變換作用類似,高層次的細(xì)胞則依據(jù)低層次細(xì)胞的響應(yīng),而作出具體的線、面乃至物體模式的響應(yīng)。這表明在視覺處理過程中,神經(jīng)元并不是隨便地不可靠地把視覺圖像的光照強(qiáng)度轉(zhuǎn)手投射到感覺中樞,它們可以檢測模式單元,區(qū)分物體的深度,排除無關(guān)的變化因素,并組成一個使人感興趣的層次結(jié)構(gòu)。人臉識別不僅有著以上普通視覺過程的特點(diǎn),而且具有以下獨(dú)特之處:針對人臉識別,大腦中存在一個專門的處理過程。經(jīng)過長期的研究,人們發(fā)現(xiàn)大腦對人臉形狀有著

9、特殊的興趣;不同的局部特征作用對識別的貢獻(xiàn)也不同。研究也表明,頭發(fā)、人臉輪廓、眼睛以及嘴巴對識別和記憶有著重要影響,鼻子的作用則不是很重要。通常來講人臉的上部比下部對識別作用更大些;不同空間頻率上信息的作用不同。低頻信息代表了整體的描述,高頻信息包含了局部的細(xì)節(jié)。對于性別的判斷,僅利用低頻信息就足夠了,但對身份識別沒有高頻信息就無法完成;光照對視覺的影響。有實(shí)驗(yàn)表明,從人臉底部打光會導(dǎo)致識別困難;動態(tài)信息比靜態(tài)信息更利于識別。研究發(fā)現(xiàn),對熟悉的人臉,人類的識別能力在動態(tài)場景中要高于靜態(tài)場景;面部表情的分析與人臉識別并行處理。通過對腦部受損的病人研究表明,表情的分析與識別雖有聯(lián)系,但是總體來說是

10、分開處理的。2人臉識別常用算法一般總的來說可以分為兩種,一種是基于先驗(yàn)信息,一種是基于訓(xùn)練樣本。早在20世紀(jì)60年代,人臉識別就引起了廣大研究者的注意,上個世紀(jì)90年代以來,隨著社會對人臉識別系統(tǒng)的迫切需求,人臉識別研究再次成為熱門課題.當(dāng)前世界各國有許多機(jī)構(gòu)都在從事這方面的研究,并受到軍方、警方以及許多大公司的高度重視和資助一般來說,人臉識別系統(tǒng)包括圖像攝取、人臉定位、圖像預(yù)處理、以及人臉識別(身份確認(rèn)或者身份查找)。系統(tǒng)輸入一般是一張或者一系列含有未確定身份的人臉圖像,以及人臉數(shù)據(jù)庫中的若干已知身份的人臉圖象或者相應(yīng)的編碼,而其輸出則是一系列相似度得分,表明待識別的人臉的身份。目前常見的人

11、臉識別基本算法可分為以下幾類:基于幾何特征的人臉識別、基于子空間分析的人臉識別、基于彈性圖匹配的人臉識別、基于神經(jīng)網(wǎng)絡(luò)的人臉識別和基于隱馬爾可夫模型的人臉識別等.靜態(tài)人臉識別系統(tǒng)主要有三個步驟:人臉的檢測和定位、人臉的特征提取和人臉識別,在這些步驟之前還應(yīng)有預(yù)處理這一步,即對采集到的圖像先進(jìn)行預(yù)處理,以達(dá)到位置校準(zhǔn)和灰度歸一的目的,然后尋找人臉,如果有則確定人臉的位置并提取人臉,然后提取人臉特征,最后根據(jù)提取的特征進(jìn)行識別。下面對人臉識別中的常用算法進(jìn)行介紹。2.1基于幾何特征的人臉識別在眾多的人臉識別方法中,基于幾何特征的方法是最早被用于人臉識別的.這類識別方法將人臉用一個幾何特征矢量來表示

12、,用模式識別中的層次聚類的思想設(shè)計(jì)分類器達(dá)到識別目的。其基本原理是:人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成,正因?yàn)檫@些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每張人臉千差萬別。識別所用的幾何特征是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包括人臉指定兩點(diǎn)間的歐式距離、曲率、角度等等。在這種基于幾何特征的識別中,不同特征的相似性度量主要依賴于特征矢量的匹配情況進(jìn)行判決?;诩咸卣鞯淖R別方法的優(yōu)點(diǎn)有符合人類的習(xí)慣,易于理解,對光照變化不是很敏感,具有一定的抗干擾能力。從圖像中抽取穩(wěn)定的特征比較困難,當(dāng)有遮擋時會出現(xiàn)誤提?。划?dāng)面部表情變化很大,或者姿態(tài)變化很大時,魯棒性魯棒性,是

13、指控制系統(tǒng)在一定(結(jié)構(gòu),大?。┑膮?shù)攝動下,維持某些性能的特性。較差;幾何特征模型的準(zhǔn)則過于簡單,一般的幾何特征只描述了器官的基本形狀與結(jié)構(gòu)關(guān)系,忽略了細(xì)節(jié)特征,會使部分信息丟失。2.2基于特征子空間分析的人臉識別(主成分分析法PCA特征臉方法7是人臉識別技術(shù)中的一種典型方法,又稱為主成分分析法(PCA。SIROVICH和KIRBY首先采用PCA算法來表示人臉。它根據(jù)一組人臉訓(xùn)練樣本構(gòu)造主特征向量空間,即特征子空間(特征臉),這些特征向量是由圖像的生成矩陣的主特征值所對應(yīng)的特征向量組成,這些主特征向量所占的能量是總能量的90%(般取這個數(shù))以上,其余的小能量向量被剔除。生成矩陣可以是圖像的協(xié)方

14、差矩陣、總類內(nèi)離散度矩陣等等。這個子空間是降維的,維數(shù)比原數(shù)據(jù)空間要小得多,任何一幅待識別人臉圖像都可以向此特征空間投影并獲得一組坐標(biāo)系數(shù),這組系數(shù)表明了該圖像在子空間中的位置,從而可以作為人臉識別的依據(jù)。任何一幅人臉圖像都可以表示為這組特征向量的線性組合,其加權(quán)系數(shù)(圖像向空間投影得到的系數(shù))稱為該圖像的代數(shù)特征。識別的時候,將待識別的圖像投影到這個特征子空間,將得到的投影系數(shù)與各個已知人臉圖像的系數(shù)進(jìn)行比較,通過一定的準(zhǔn)則,例如k-近鄰法,取未知樣本的k個近鄰,看這k個近鄰中多數(shù)屬于哪一類,就把待識別的圖像歸入哪一類。特征臉方法比較簡單易懂,得到了廣泛的使用,但單獨(dú)使用的計(jì)算量較大,所以P

15、CA經(jīng)常與其它方法配合使用,例如小波變換小波變換:以某些特殊函數(shù)為基將數(shù)據(jù)過程或數(shù)據(jù)系列變換為級數(shù)系列以發(fā)現(xiàn)它的類似頻譜的特征,從而實(shí)現(xiàn)數(shù)據(jù)處理。與PCA的結(jié)合,使PCA的降維效果得到改善。與PCA不同,線性判別分析(LDA)是以樣本的可分性為目標(biāo)的,其基本思想是尋找一個投影方向,使訓(xùn)練樣本投影到該方向時類內(nèi)離散度最小而類間離散度最大不過,LDA只有在訓(xùn)練集樣本數(shù)較多時,性能才優(yōu)于PCA完整的PCA主成成分分析法進(jìn)行人臉識別的應(yīng)用包括幾個步驟1:1)人臉圖像預(yù)處理;2)讀入人臉庫,訓(xùn)練形成特征子空間;3)把訓(xùn)練圖像和測試圖像投影到上一步驟中得到的子空間上;4)選擇一定的距離函數(shù)進(jìn)行識別。2.2

16、.1人臉圖像的預(yù)處理直接用特征臉識別人臉圖像有一定的局限性,要想讓系統(tǒng)準(zhǔn)確地識別人臉必須保證2個條件:1)待識別圖像中人臉尺寸接近特征臉中人臉尺寸;2)待識別人臉圖像必須為正面人臉圖像,當(dāng)待識別圖像不滿足此條件時,誤識率很高。所以預(yù)處理需要進(jìn)行剪切人臉和旋轉(zhuǎn)人臉。歸一化人臉庫后,將庫中的每人選擇一定數(shù)量的圖像構(gòu)成訓(xùn)練集,其余構(gòu)成測試集。設(shè)歸一化后的圖像是nxm,按列相連就構(gòu)成N=nxm維矢量,可視為N維空間中的一個點(diǎn),可以通過K2L變換用一個低維子空間描述這個圖像。實(shí)踐表明,人類在識別物體時,主要依靠的是圖像的相位譜信息,高階統(tǒng)計(jì)量對圖像識別來說非常有用獨(dú)立分量分析(ICA)不但考慮了訓(xùn)練樣本

17、的一階和二階統(tǒng)計(jì)信息,還考慮了高階統(tǒng)計(jì)信息,其基本思想是通過線性變換,從訓(xùn)練樣本中找到一組互相獨(dú)立的基(獨(dú)立分量),并以此來描述樣本數(shù)據(jù).前面提到的PCA方法實(shí)際上是在二階統(tǒng)計(jì)量上的去相關(guān),而ICA則是在所有階統(tǒng)計(jì)量上的去相關(guān),從而使信號的二階統(tǒng)計(jì)量和高階統(tǒng)計(jì)量都得到了有效利用,ICA方法可以看成是PCA方法的泛化,在人臉識別中有廣泛的應(yīng)用在基于線性子空間的人臉識別中,實(shí)際上是把人臉圖像中存在的表情、姿態(tài)及光照等復(fù)雜的變化進(jìn)行了線性簡化,因此不可能得到人臉充分的描述.而非線性子空間方法則是利用核方法來實(shí)現(xiàn)人臉識別該方法的基本思想是,在進(jìn)行分類等數(shù)據(jù)處理時,對于線性不可分樣本,首先通過一個非線性

18、映射將原空間樣本映射到高維特征空間(也稱核空間)中,使核空間中的樣本變得線性可分,或者近似線性可分,然后在核空間中用線性方法對其進(jìn)行分類處理,從而實(shí)現(xiàn)相對于原空間來說非線性的處理,在計(jì)算上并不需要明確計(jì)算非線性變換,只需要通過一個核函數(shù)來計(jì)算在核空間中兩兩向量間的內(nèi)積即可.目前已應(yīng)用于人臉識別中的非線性子空間方法有核主分量分析、核Fisher判別分析和核獨(dú)立分量分析等.2.3基于模板匹配的人臉識別模板匹配有靜態(tài)匹配和彈性匹配兩種,首先介紹一下靜態(tài)匹配。靜態(tài)模板匹配方法:設(shè)計(jì)一個庫,其中存儲了已知人臉的若干模板,這些模板可以是整張人臉的灰度圖像,可以是各生理特征區(qū)域的灰度圖像,還可以是經(jīng)某種變換

19、的人臉圖像。待識別的圖像經(jīng)過相同的變換后,還要進(jìn)行尺度歸一化和灰度歸一化的處理,得到與庫中的圖像大小、取向和光照條件均相同的圖像。然后計(jì)算待識別圖像和庫中圖像的匹配度,與哪一類的匹配度最好,就將待識別圖像判為哪一類。靜態(tài)模板匹配存在的問題:因?yàn)閹焓枪潭ǖ?,如果人臉表情變化較大,或者有新的模式出現(xiàn),那么這個模板就不適用了,也就是說靜態(tài)模板匹配方法不靈活。彈性圖匹配(EGM)3的理論基礎(chǔ)是圖匹配彈性模板匹配是根據(jù)待測人臉特征的先驗(yàn)知識,定義一個特征參數(shù)模型,這些參數(shù)反映相對應(yīng)特征形狀的可變部分。為了得到這些參數(shù),用圖來描述人臉,根據(jù)圖像的邊緣、峰值、谷值和強(qiáng)度信息及特征形狀的先驗(yàn)知識設(shè)計(jì)合適的能量

20、函數(shù)。我們要求的參數(shù)就是使能量函數(shù)取極小值時的參數(shù)。圖像的頂點(diǎn)表示人臉的局部特征點(diǎn),邊則表示面部特征之間的拓?fù)滏溄雨P(guān)系.匹配測度同時考慮頂點(diǎn)和邊之間的距離,是一種考慮到識別目標(biāo)局部特征點(diǎn)之間拓?fù)浣Y(jié)構(gòu)的局部特征匹配方法,典型的算法有Lades等提出的利用動態(tài)鏈接結(jié)構(gòu)(DLA)來進(jìn)行人臉識別的算法:人臉由一組用邊鏈接的節(jié)點(diǎn)構(gòu)成,節(jié)點(diǎn)對應(yīng)于面部特定的特征點(diǎn),被稱為基準(zhǔn)點(diǎn);邊由節(jié)點(diǎn)間的距離來表示,節(jié)點(diǎn)由包含局部灰度分布信息的特征向量表示;人臉圖像之間的相似度由所對應(yīng)的彈性圖之間的相似度來衡量。這種算法的優(yōu)點(diǎn)是顯然的,它比靜態(tài)模板匹配法要靈活,魯棒性要強(qiáng)一些,但是也有缺點(diǎn):對參數(shù)的初值依賴度高,容易陷入

21、局部最??;計(jì)算時間長?;趶椥詧D匹配的人臉識別方法考慮到了人臉的局部細(xì)節(jié),保留了人臉的空間分布信息;而且在一定程度上可以忽略人臉從三維到二維投影引起的變形,但是,該方法在提取人臉特征時,本質(zhì)上是將幾個不同頻段的信息捆綁成一個單一的向量,所以很難提取人臉的顯著特征,且計(jì)算量較大.2.4基于神經(jīng)網(wǎng)絡(luò)的人臉識別基于神經(jīng)網(wǎng)絡(luò)的人臉識別方法就是利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和分類能力對人臉進(jìn)行特征提取與識別.Lawrenee等采用卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行人臉識別,由于卷積神經(jīng)網(wǎng)絡(luò)中集成了相鄰像素之間的相關(guān)性知識,從而在一定程度上獲得了對圖像平移、旋轉(zhuǎn)和局部變形的不變性,因此得到非常理想的識別結(jié)果.Lin等采用正反例樣

22、本進(jìn)行強(qiáng)化學(xué)習(xí),從而得到較為理想的概率估計(jì)結(jié)果,并采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu)加快網(wǎng)絡(luò)的學(xué)習(xí)速度,這種方法在人臉檢測、人臉定位和人臉識別的各個步驟上都得到了較好的應(yīng)用.Meng等先用PCA技術(shù)對人臉樣本進(jìn)行降維處理,然后利用LDA技術(shù)提取判別特征,最后用RBF神經(jīng)網(wǎng)絡(luò)分類判決,實(shí)驗(yàn)結(jié)果表明該方法具有較高的學(xué)習(xí)效率和識別性能.神經(jīng)網(wǎng)絡(luò)是以并行方式處理信息,存儲方式是分布式的,如果能用硬件實(shí)現(xiàn),那么將能顯著提高速度。神經(jīng)網(wǎng)絡(luò)把模型的統(tǒng)計(jì)特征隱含在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)中,對于人臉這類復(fù)雜的、難以顯示描述的模型,基于神經(jīng)網(wǎng)絡(luò)的方法具有獨(dú)特優(yōu)勢,神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)功能非常強(qiáng)大,盡管對人臉識別的許多規(guī)律和規(guī)則進(jìn)行顯

23、性的描述非常困難,但是神經(jīng)網(wǎng)絡(luò)可以通過反復(fù)學(xué)習(xí)的過程獲得對這些規(guī)則的隱性表達(dá),因此神經(jīng)網(wǎng)絡(luò)的魯棒性比較好在提取人臉特征后進(jìn)行分類識別時具有一定的優(yōu)勢。然而直接采用神經(jīng)網(wǎng)絡(luò)提取特征的方法一般需要龐大的輸入節(jié)點(diǎn),因此在訓(xùn)練時參數(shù)繁多,實(shí)現(xiàn)起來比較困難.2.5基于隱馬爾可夫模型的人臉識別在人臉識別中,人臉應(yīng)當(dāng)作為一個整體來描述,不僅要包括人臉各個器官的數(shù)值特征,還應(yīng)當(dāng)包括各個器官的不同表象和相互關(guān)聯(lián)而隱馬爾可夫模型(HMM)提供了解決這一問題的方法,按照這種模型,觀測到的特征被看成是另一組不可觀測“狀態(tài)”產(chǎn)生的一系列實(shí)現(xiàn).因而可以將不同的人用不同的HMM參數(shù)來表征,而同一個人由于姿態(tài)和表情變化產(chǎn)生的

24、多個觀測序列可以通過同一個HMM模型來表征.Samaria最早提出了關(guān)于人臉的HMM模型,其用一個矩形窗從上到下對人臉圖像進(jìn)行采樣,將窗內(nèi)的像素點(diǎn)排列成向量,用灰度值作為觀測向量.Nefian提出利用二維離散余弦變換來提取特征作為觀測向量,減少了參數(shù)存儲量.Othman等提出了低復(fù)雜度的二維HMM模型,更好地描述了人臉各個器官之間的關(guān)聯(lián),具有很高的識別率.基于HMM的人臉識別方法能夠允許人臉有表情變化和較大幅度的頭部轉(zhuǎn)動,具有較高的識別率,但在提取特征和訓(xùn)練模型參數(shù)時需要較大的運(yùn)算量.3結(jié)束語人臉識別技術(shù)是一項(xiàng)既有科學(xué)研究價值,又有廣泛應(yīng)用前景的研究課題。大量研究人員幾十年的研究取得了豐碩的研究成果,在某些限定條件下自動

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論