人臉識別文檔

上傳人：w*** IP屬地：天津上傳時間：2022-08-06 格式：DOCX 頁數(shù)：28 大?。?32.35KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩23頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、第1章引言人臉識別技術(shù)的應用與難點人臉是自然界存在的一種特殊的、復雜的視覺模式，它包含著極其豐富的信息。首先，人臉具有一定的不變性和唯一性，人臉識別是人類在進行身份確認時使用的最為普遍的一種方式，其次，人臉圖像還能提供一個人的性別、年齡、種族等有關(guān)信息。人類在人臉識別中所表現(xiàn)出來的能力是令人驚異的，但是讓計算機能夠識別人臉，卻是非常困難的問題。迄今為止，人臉識別的認知過程和內(nèi)在機理仍然是一個未解之謎，如何實現(xiàn)一個自動的人臉識別系統(tǒng)仍然是一個懸而未決的難題。從上個世紀六十年代以來，隨著計算機和電子技術(shù)的迅猛發(fā)展，人們開始利用計算機視覺和模式識別等技術(shù)對人臉識別進行研究。近年來，

2、隨著相關(guān)技術(shù)的不斷發(fā)展和實際需求的日益增加，人臉識別已經(jīng)引起了越來越多的關(guān)注，成為了信息處理和人工智能等領(lǐng)域研究的熱點之一，新的研究成果和實用系統(tǒng)也不斷涌現(xiàn)。人臉識別技術(shù)的廣泛應用一項技術(shù)的問世和發(fā)展與人類的迫切需求是密切相關(guān)的，飛速發(fā)展的社會經(jīng) 濟和科學技術(shù)使得人類對安全（包括人身安全、隱私保護等）的認識越來越重視。人臉識別的一個重要應用就是人類的身份識別。一般來說，人類的身份識別方式分為三類：a.特殊物品，包括各種證件和憑證，如身份證、駕駛執(zhí)照、房門鑰匙、印章等；b.特殊知識，包括各種密碼、口令和暗號等；c.人類生物特征，包括各種人類的生理和行為特征，如人臉、指紋、手形、

3、掌紋、虹膜、DNA簽名、語音等。前兩類識別方式屬于傳統(tǒng)的身份識別技術(shù)，其特點是方便、快捷，但致命的缺點是安全性差、易偽造、易竊取。特殊物品可能被丟失、偷盜和復制，特殊知識容易被遺忘、混淆和泄露。相比較而言，由于生物特征是人的內(nèi)在屬性，具有很強的自身穩(wěn)定性和個體差異性，因此生物特征是身份識別的最理想依據(jù)。基于以上相對獨特的生物特征，結(jié)合計算機技術(shù)，發(fā)展了眾多的基于人類生物特征的身份識別技術(shù)，如NDAM別技術(shù)、指紋識別技術(shù)、虹膜識別技術(shù)、語音識別技術(shù)和人臉識別技術(shù)等。表1-1為各種生物識別技術(shù)的綜合比較。表1-1各種生物特征識別技術(shù)的綜合比較生物特征唯一性永久性.可接受性人臉中高指

4、紋高低手寫幾何形狀中申虹膜高中行為把征中高語訐中低高山鍵動作申中中簽石中低高生物識別技術(shù)在上個世紀己經(jīng)有了一定的發(fā)展，其中指紋識別技術(shù)己經(jīng)趨近成熟，但人臉識別技術(shù)的研究目前還處于起步階段。指紋、虹膜、掌紋等識別技術(shù)都需要被識別者的配合，有的識別技術(shù)還需要添置復雜昂貴的設備。人臉識別則可以用已有的照片或是攝像頭遠距離捕捉圖像，無須特殊的采集設備，系統(tǒng)的成本低。并且自動人臉識別可以在當事人毫無察覺的情況下即完成身份確認識別工作，這對反恐怖活動等有非常重大的意義。由于人臉識別技術(shù)具有如此之多的優(yōu)勢，因此它的應用前景非常廣闊，已成為最具潛力的生物特征識別技術(shù)之一。本文將人臉識別技術(shù)的各

5、種應用及其特點總結(jié)在表1-2中。表1-2人臉識別技術(shù)的應用特直灌點護照，咒聯(lián)，信知F-沱*第枷.苒制工里存；常制輪背景；比峨射腦沿用鹿不存在同一的氣將降；忙相原F填樣的庫.碟沮詫Xt安奎巾 AffVfh變型結(jié)盾的人口控制一秋有生于一強的照片；密博飛修專；背果不費慳剌規(guī)的監(jiān)控在苴擄的叫Mi 也半尺寸比軸??；康流娟兜飾僮高；IEW既lt收基,用不受枚劇F要事實時鞭闔.MMKWHt一辜粵定理論崎究W值嘉可航肉加以圖像及比轆差才希受聒中脂里:通武日擊京王建人獵量目擊青蠢小麗L相似理不科定；-隊用年人險JU建人拄理論新究也依鹿；色溝瞳耳配星學方面前知識:計算得出品化的人虺理論算登的使高；必撕詈有

6、相應的樣本；_人臉識別最初的應用源于公安部門關(guān)于罪犯照片的存檔管理和刑偵破案。現(xiàn) 在該技術(shù)在安全系統(tǒng)、商業(yè)領(lǐng)域和日常生活中都有很多應用，主要有以下幾類應用：.刑偵破案。當公安部門獲得罪犯的照片后，可以利用人臉識別技術(shù)，在存儲罪犯照片的數(shù)據(jù)庫中找出最相像的人作為嫌疑犯，極大的節(jié)省了破案的時間和人力物力。還有一種應用就是根據(jù)目擊證人的描述，先由專業(yè)人員畫出草圖，然后用此圖到庫里去找嫌疑犯。罪犯數(shù)據(jù)庫往往很大，由幾千幅圖像組成。如果這項搜索工作由人工完成，不僅效率低，而且容易出錯，因為人在看了上百幅人臉圖像后，記憶力會下降，而由計算機來完成則不會出現(xiàn)此問題。.證件驗證。身份證、駕駛

7、執(zhí)照以及其他很多證件上都有照片；現(xiàn)在這些證件多由人工驗證完成。如果應用人臉識別技術(shù)，這項工作就可以交給機計算機完成，從而實現(xiàn)自動化及智能管理。當前普遍使用的另一類證件是用符號或者條形碼標記的，比如信用卡。這類卡的安全性比較低，可能遺失、被竊取，使用場合（比如自動提款機）的安全性也比較差。如果在這類卡上加上人臉的特征信息，則會大大改善其安全性能。.入口控制。需要入口控制的范圍很廣，它可以是重要人物居住的住所、保存重要信息的單位，只要人類覺得安全性比較重要的地點都可以進行入口控制，比較常用的檢查手段是核查證件。人員出入頻繁時，保安人員再三檢查證件是很麻煩的，而且證件安全性也不高。

8、在一些保密要求非常嚴格的部門，除了證件外，已經(jīng)使用了生物特征識別手段，如指紋識別、掌紋識別、虹膜識別和語音識別等。人臉識別與這些技術(shù)相比，具有直接、方便和友好的特點。當前計算機系統(tǒng)的安全管理也備受重視，通常使用由字符和數(shù)字組成的口令（Password）進行使用者的身份驗證，但口令可能被遺忘，或被破解，如果將人臉作為口令，則既方便又安全。.視頻監(jiān)控。在銀行、公司、公共場所等處設有24小時的視頻監(jiān)控，如何對視頻圖像進行篩選分析，就需要用到人臉檢測、跟蹤和識別技術(shù)。除了以上應用外，人臉識別技術(shù)還可以用于視頻會議、機器人的智能化研究等方面。尤其從美國9.11事件后，人的身份識別問題更是提升

9、到了國家安全的角度，如何利用人臉信息迅速確定一個人的身份成了各個國家重點研究的技術(shù)。1.1.2人臉識別技術(shù)的難點雖然人類可以毫不困難地根據(jù)人臉來辨別一個人，但是利用計算機進行完全自動的人臉識別，仍存在許多困難。人臉模式的差異性使得人臉識別成為一個非常困難的問題，表現(xiàn)在以下方面：.人臉表情復雜，人臉具有多樣的變化能力，人的臉上分布著五十多塊面部肌肉，這些肌肉的運動導致不同面部表情的出現(xiàn)，會造成人臉特征的顯著改變；.人臉隨年齡而改變，隨著年齡的增長，皺紋的出現(xiàn)和面部肌肉的松弛使得人臉的結(jié)構(gòu)和紋理都將發(fā)生改變；.人臉有易變化的附加物，例如改變發(fā)型，蓄留胡須或者佩戴帽子和眼鏡等飾物；.人

10、臉特征遮掩，人臉全部、部分遮掩將會造成錯誤識別；.人臉圖像的畸變，由于光照、視角、攝取角度不同，可能會造成圖像的灰度畸變、角度旋轉(zhuǎn)等，降低了圖像質(zhì)量，增大了識別難度。所以很難從有限張人臉圖像中提取出反映人臉內(nèi)在的、本質(zhì)的特征。另外人臉識別還涉及模式識別、圖像處理、計算機視覺、生理學和心理學等學科領(lǐng)域。這諸多因素使得人臉識別至今仍是一個有待深入研究，極富挑戰(zhàn)性的課題。同時一個成功的、具有商用價值的快速的人臉識別系統(tǒng)將會給社會帶來極大的影響。人臉識別技術(shù)的發(fā)展與現(xiàn)狀人臉識別的研究可以追溯到20世紀60年代末，最早的研究見于文獻。Bledsoe 以人臉特征點的間距、比率等參數(shù)為特征，建成了一個

11、半自動的人臉識別系統(tǒng)。人臉識別的發(fā)展大致經(jīng)過了三個階段，其中伴隨發(fā)展了多樣的人臉識別技術(shù)。人臉識別技術(shù)發(fā)展的三個階段第一階段一非自動識別階段：主要研究如何提取人臉識別所需的特征。通過簡單的語句描述人臉數(shù)據(jù)庫成為待識別人臉設計逼真的摹寫來提高面部識別率。這是需要手工干預的階段。此階段以 Bertillon 、Allen和Parke為代表。在 Bertillon 系統(tǒng)中，用了一個簡單的語句與數(shù)據(jù)庫中的某一張臉相聯(lián)系，同時與指紋識別相結(jié)合，提供了一個較強的識別系統(tǒng)。為了提高面部識別率，Allen為待識別人臉設計了一種有效逼真的摹寫，Parke則用計算機實現(xiàn)了這一想法，并且產(chǎn)生了較高質(zhì)量的人臉

12、灰度圖模型。在此階段，識別過程全部依賴于操作人員，所以不是一種自動識別的系統(tǒng)。第二階段一人機交互階段：這一階段雖然實現(xiàn)了一定的自動化，但還需要操作員的某些先驗知識，仍然不是一個完全自動的識別系統(tǒng)。此階段的代表性工作有:Goldstion、Harmon和Lesk等人用幾何特征參數(shù)來表示人臉正面圖像。他們采用21維特征矢量表示人臉面部特征，并設計了基于這一表示法的識別系統(tǒng)。 Kaya和Kobayashi則采用了統(tǒng)計識別的方法，用歐氏距離來表示人臉特征，例如嘴和鼻子之間的距離，嘴唇的高度，兩眼之間的距離等。更進一步的，T.Kanad 設計了快速且有一定知識引導的半自動回溯識別系統(tǒng)，創(chuàng)造性

13、的運用積分投影法從單幅圖像上計算出一組臉部特征參數(shù)，再利用模式分類技術(shù)與標準人臉相匹配。 Kanad的系統(tǒng)實現(xiàn)了快速、實時的處理，是一個很大的進步?？偟膩碚f，上述方法都需要利用操作員的某些先驗知識，始終擺脫不了人的干預。第三階段一自動識別階段：這一階段真正實現(xiàn)了機器自動識別，產(chǎn)生了眾多人臉識別方法，出現(xiàn)了多種機器全自動識別系統(tǒng)。近十余年來，隨著高速度、高性能計算機的發(fā)展，人臉識別方法有了較大的突破，提出了多種機器全自動識別系統(tǒng)。近年來，人臉識別技術(shù)研究也非?；钴S，除了基于KL變換的特征臉方法與奇異值特征為代表的代數(shù)特征方法取得了發(fā)展外，人工神經(jīng)網(wǎng)絡、隱馬爾可夫模型小波變換等也在人

14、臉識別研究中得到了廣泛的應用，而且出現(xiàn)了不少人臉識別的新方法。本文將在1.3節(jié)介紹人臉識別的主要內(nèi)容與方法。國內(nèi)外發(fā)展現(xiàn)狀目前，國外對人臉識別問題的研究比較多，其中比較著名的有MTI、CMUCornell和Rockfeller等，MPE麗準組織也已經(jīng)建立了專門的人臉識別草案小組。國際上發(fā)表的相關(guān)論文數(shù)量也大幅度增長，EIEE的著名國際會議，如EIEEInternational Conference on Automatic Face and Gesture Recognition、International Conference on Image Processing 、Conference

15、 on Computer Vision and Pattern Recognition 等，每年都有大量關(guān)于人臉識別的論文。截至2005年3月，EIEE/IEE全文數(shù)據(jù)庫中U錄的關(guān)于“ face ”的文章8916篇，其中有關(guān)“face recognition ”的3280篇，約占36.8%,并且每年的文獻呈急劇上升趨勢。同樣在工程索引El中，至2005年3月，共有81657篇有關(guān)“face” 的文獻，數(shù)目是驚人的，并且 2000年后快速增長。國內(nèi)對人臉識別領(lǐng)域的研究起步較國外晚，但近十年來呈現(xiàn)飛速發(fā)展，據(jù)中國期刊網(wǎng)統(tǒng)計，1996年至2005年3月，有關(guān)“人臉”的文獻1467篇，其中人臉

16、識別領(lǐng)域的文章494篇，并且再近幾年獲得快速增長，也預示人臉識別領(lǐng)域得到快速發(fā)展。目前國內(nèi)大部分高校有人從事人臉識別相關(guān)的研究，其中技術(shù)比較先進的有中科院自動化所、清華大學、浙江大學等。人臉識別的主要方法自動人臉識別技術(shù)（AFR）就是利用計算機技術(shù)，根據(jù)數(shù)據(jù)庫的人臉圖像，分析提取出有效的識別信息，用來“辨認”身份的技術(shù)。人臉識別技術(shù)的研究始于六十年代末七十年代初，其研究領(lǐng)域涉及圖像處理、計算機視覺、模式識別、計算機智能等領(lǐng)域，是伴隨著現(xiàn)代化計算機技術(shù)、數(shù)據(jù)庫技術(shù)發(fā)展起來的綜合交叉學科。 1.3.1人臉識別的視覺機理近幾年的研究表明，人類視覺數(shù)據(jù)處理是多層次的過程，其中最低層的視覺過

17、程（視網(wǎng)膜功能）起到信息轉(zhuǎn)儲作用，即將大量圖像數(shù)據(jù)轉(zhuǎn)換為較為抽象的信息，這一任務由視網(wǎng)膜中的兩類細胞完成：低層次的細胞對空間的響應與小波變換作用類似，高層次的細胞則依據(jù)低層次細胞的響應，而作出具體的線、面乃至物體模式的響應。這表明在視覺處理過程中，神經(jīng)元并不是隨便的、不可靠的把視覺圖像的光照強度投射到感覺中樞，它們可以檢測模式單元，區(qū)分物體的深度，排除無關(guān)的變化因素，并組成一個令人感興趣的層次結(jié)構(gòu)。人臉識別不僅有著以上普通視覺過程的特點，而且具有以下獨特之處。.人臉識別是大腦中一個特有的過程。針對人臉識別，大腦中存在一個專門的處理過程；.在人臉感知與識別過程中，局部特征與整體特征均起作

18、用。若存在明顯的局部特征，整體特征將不起作用；.不同的局部特征作用對識別的貢獻也不同。在正面人臉圖像中，頭發(fā)、人臉輪廓、眼睛以及嘴巴對識別和記憶有著重要影響，鼻子的作用則不是很重要。但在側(cè)面人臉識別中，鼻子對特征點的匹配很有作用。通常來講人臉的上部比下部對識別作用更大些；.不同空間頻率上信息的作用不同。低頻信息代表了整體的描述，高頻信息包含了局部的細節(jié)。對于性別的判斷，僅利用低頻信息就足夠了，對于身份識別沒有高頻信息就無法完成；.光照對視覺有影響。有實驗表明，從人臉底部打光會導致識別困難；.動態(tài)信息比靜態(tài)信息更利于識別。研究還發(fā)現(xiàn)，對熟悉的人臉，人類的識別能力在動態(tài)場景中要高于

19、靜態(tài)場景；.十歲以下的兒童識別人臉較多的采用顯著特征，而較少的使用整體分析；.不同的種族。性別的人臉識別的難易程度不同，這可能因為不同類型的人臉圖像具有不同的特征；.面部表情的分析與人臉識別并行處理。通過對腦部受損的病人研究表明，表情的分析與識別雖有聯(lián)系，但總體來說是分開處理的。人臉識別是一種復雜的信息處理任務，它的研究涉及計算機技術(shù)、心理學和神經(jīng)生理學。視覺機理、心理學和神經(jīng)生理學的研究結(jié)果無疑將非常有益于人臉識別技術(shù)的發(fā)展，這些結(jié)論對于設計有效的識別方法起到了一定啟發(fā)作用。但除少數(shù)文獻外24,機器識別人臉的研究還是獨立于心理學和神經(jīng)生理學的研究的。1.3.2人臉識別系統(tǒng)的組成在人臉

20、識別技術(shù)發(fā)展的幾十年中，研究者們提出了多種多樣的人臉識別方法，但大部分的人臉識別系統(tǒng)主要由三部分組成：圖像預處理、特征提取和人臉的分類識別。一個完整的自動人臉識別系統(tǒng)還包括人臉檢測定位和數(shù)據(jù)庫的組織等模塊，如圖1-1 o其中人臉檢測和人臉識別是整個自動人臉識別系統(tǒng)中非常重要的兩個技術(shù)環(huán)節(jié)，并且相對獨立。下面分別介紹這兩個環(huán)節(jié)。圖1-1人臉識別系統(tǒng)框圖人臉檢測與定位檢測圖像中是否有人臉，若有，將其從背景中分割出來，并確定其在圖像中的位置。在某些可以控制拍攝條件的場合，如警察拍罪犯照片時將人臉限定在標尺內(nèi)，此時人臉的定位很簡單。證件照背景簡單，定位也比較容易。在另一些情況下，人臉在圖

21、像中的位置預先是未知的，比如在復雜背景下拍攝的照片，這時人臉的檢測與定位將受以下因素的影響：.人臉在圖像中的位置、角度、不固定尺寸以及光照的影響；.發(fā)型、眼鏡、胡須以及人臉的表情變化等；.圖像中的噪聲等。特征提取與人臉識別特征提取之前一般需要做幾何歸一化和灰度歸一化的工作。前者是指根據(jù)人臉定位結(jié)果將圖像中的人臉變化到同一位置和大?。?后者是指對圖像進行光照補償?shù)忍幚恚钥朔庹兆兓挠绊?，光照補償能夠一定程度的克服光照變化的影響而提高識別率。提取出待識別的人臉特征之后，即可進行特征匹配。這個過程是一對多或者一對一的匹配過程，前者是確定輸入圖像為圖像庫中的哪一個人（即人臉識別），

22、后者是驗證輸入圖像的人的身份是否屬實（即人臉驗證）。以上兩個環(huán)節(jié)的獨立性很強。在許多特定場合下人臉的檢測與定位相對比較容易，因此“特征提取與人臉識別環(huán)節(jié)”得到了更廣泛和深入的研究。近幾年隨著人們越來越關(guān)心各種復雜的情形下的人臉自動識別系統(tǒng)以及多功能感知研究的興起，人臉檢測與定位才作為一個獨立的模式識別問題得到了較多的重視。本文主要研究人臉的特征提取與分類識別的問題。1.3.3主要的人臉識別方法人臉識別技術(shù)作為模式識別領(lǐng)域的一個研究熱點，每年都有許多相應的研究成果發(fā)表，并且涌現(xiàn)出各種各樣的識別方法，可以說信息處理領(lǐng)域的各種新方法的研究和算法的改進都嘗試在人臉識別中得到應用。文獻對近十年

23、來人臉識別領(lǐng) 域取得的成果進行了總結(jié)。人臉識別方法的分類，根據(jù)研究角度的不同，可以有不同的分類方法，這是研究人臉識別方法首先遇到的問題。本文在深入研究國內(nèi) 外人臉識別技術(shù)的發(fā)展和研究成果的同時，將已有的不同的分類方法做一個比較，目的是希望能從不同角度認識人臉識別問題，在較全面的了解各種方法優(yōu)缺點的基礎(chǔ)上，給本文的人臉識別方法提供研究方向。根據(jù)輸入圖像中人臉的角度，人臉識別技術(shù)可分為基于正面、側(cè)面、傾斜人臉圖像的人臉識別。由于實際情況的要求，對人臉正面模式的研究最多，這也是本文的研究內(nèi)容。根據(jù)圖像來源的不同，人臉識別技術(shù)可分為兩大類：靜態(tài)人臉識別和動態(tài)人臉識別。靜態(tài)人臉識別，即

24、人臉來源為穩(wěn)定的二維圖像如照片。如果人臉的來源是一段視頻圖像，則人臉識別就屬于動態(tài)人臉識別。在頭部運動和表情變化狀態(tài) 下的人臉識別都可以看作動態(tài)人臉識別，如視頻監(jiān)視中的人臉識別。動態(tài)人臉識別具有更大的難度：首先，視頻輸出的圖像質(zhì)量較差：其次，背景較復雜，目前對動態(tài)人臉識別的研究還局限于簡單背景，較少人物的情況，對靜態(tài)人臉識別的研究比較多。本文的研究也是基于靜止圖像的。根據(jù)人臉識別技術(shù)的發(fā)展歷史，人臉識別方法大致可分為基于幾何特征的人臉識別方法、基于模板匹配的人臉識別方法和基于模型的人臉識別方法。a.基于幾何特征的人臉識別方法這是人臉識別技術(shù)發(fā)展中，應用最早的方法。該方法是通過提取人

25、臉的幾何特征，包括人臉部件的歸一化的點間距離、比率以及人臉的一些特征點，如眼角、嘴角、鼻尖等部位所構(gòu)成的二維拓撲結(jié)構(gòu)進行識別的方法。所構(gòu)造的幾何特征既要清晰區(qū)分不同對象人臉的差異，又要對光照背景條件不敏感，常規(guī)的幾何特征量很難滿足這些要求。因此該方法識別效果不理想。b.基于模板匹配的人臉識別方法基于模板匹配的方法，主要是利用計算模板和圖像灰度的自相關(guān)性來實現(xiàn)識別功能。一般基于人臉的全局特征，利用人臉模板和相關(guān)參數(shù)如灰度的相關(guān)性來進行檢測和識別的。Berto在中將基于幾何模型的人臉識別方法和模板匹配進行了全面比較后，得出結(jié)論：前者具有識別速度快和內(nèi)存要求小的優(yōu)點，但在識別率上后

26、者要優(yōu)于前者。增加幾何特征對于基于幾何特征的人臉識別方法只能輕微的提高識別率，因為要提高幾何特征的提取質(zhì)量本身就十分困難，而且隨著圖像質(zhì)量的下降和人臉遮擋的引入，基于幾何特征的人臉識別效果會大幅下降。總之，認為模板匹配法要優(yōu)于幾何特征法。c.基于模型的人臉識別方法通過統(tǒng)計分析和匹配學習找出人臉和非人臉，以及不同人臉之間的聯(lián)系。該方法包括特征臉法（Eigenface）、神經(jīng)網(wǎng)絡方法（NN）、隱馬爾可夫模型方法（HMM）和支持向量機（SVM污方法。和模板匹配的方法相比，基于模型方法的模板是通過樣本學習獲得，而非人為設定。所以該方法，從原理上更為先進合理，實驗中也表現(xiàn)出更好的識別效果。根據(jù)

27、人臉表征方式（即特征提取）的不同，還可以將人臉識別技術(shù)分為三大類：基于幾何特征的識別方法、基于代數(shù)特征的識別方法和基于連接機制的識別方法。a.基于幾何特征的人臉識別方法該方法在上文中已有闡述，它將人臉用一個幾何特征矢量表示，用模式識別中層次聚類的思想設計分類器達到識別目的。該方法的困難在于沒有形成一個統(tǒng) 一的、優(yōu)秀的特征提取標準。由于人面部的模式千變?nèi)f化，即使是同一個人的面部圖像，由于時間、光照、攝影機角度等不同，也很難用一個統(tǒng)一的模式來表達，造成了特征提取的困難。不過，由于現(xiàn)在各種優(yōu)秀特征提取算法（如動態(tài)模板、活動輪廓等）的提出，使得人臉的幾何特征描述越來越充分。而且在表情分析方

28、面，人臉的幾何特征仍然是最有力的判據(jù)。b.基于代數(shù)特征的人臉識別方法這類識別法仍然是將人臉用特征矢量表示，只不過用的是代數(shù)特征矢量。該方法在實際應用中取得了一定的成功。由于代數(shù)特征矢量（即人臉圖像向各種人臉子空間的投影）具有一定的穩(wěn)定性，識別系統(tǒng)對不同的傾斜角度，乃至不同的表情均有一定的魯棒性。所以，也說明了這種方法對表情的描述不夠充分，難以用于表情分析。c.基于連接機制的人臉識別方法這類識別法將人臉直接用灰度圖（二維矩陣）表征，利用了神經(jīng)網(wǎng)絡（Neural Network, NN）的學習能力及分類能力。這種方法的優(yōu)勢在于保存了人臉圖像中的紋理信息及細微的形狀信息，同時避免了較為復雜的特征

29、提取工作。而且，由于圖像被整體輸入，符合格氏塔（Gestalt）心理學中對人類識別能力的解釋。與前兩種識別方法相比，基于連接機制的識別法具有以下明顯不同：信息處理方式是并行而非串行；編碼存儲方式是分布式。但由于原始灰度圖像數(shù)據(jù)量十分龐大，因此神經(jīng)元數(shù)目通常很多，訓練時間很長。另外，完全基于神經(jīng)網(wǎng)絡的識別法在現(xiàn)有的計算機系統(tǒng)（馮一諾伊曼結(jié)構(gòu)）上也有其內(nèi)在的局限性。神經(jīng)網(wǎng)絡雖然有較強的歸納能力，但當樣本數(shù)目大量增加時，其性能可能會嚴重下降。本文根據(jù)人臉表征方法與特征綜合方式的不同，認為將人臉識別方法分為基于幾何特征的方法、基于模板匹配的方法和基于統(tǒng)計學習的方法，比較合適。此分類方法即符合

30、人臉識別技術(shù)發(fā)展的歷史，又將人臉特征提取與分類識別有機的結(jié)合在一起。識別人臉主要依據(jù)那些在不同個體之間存在較大差異，而對于同一個人比較穩(wěn)定的特征，具體的特征形式和綜合方式（分類方式）的不同決定了識別方法的不同。圖1-2列出了主要的人臉特征與綜合方法。早期靜態(tài)人臉識別方法研究較多的是基于幾何特征的方法和基于模板匹配方法。目前，靜止圖像的人臉識別方法主要是基于樣本通過統(tǒng)計學習識別人臉的方法，主要研究方向有：基于代數(shù)特征的識別方法，包括特征臉（Eigenface）方法和隱馬爾可夫模型（HMM方法; 基于連接機制的識別方法，包括一般的神經(jīng)網(wǎng)絡方法和彈性圖匹配（ElasticGraph Mat

31、ching）方法，以及以上方法的一些綜合方法?；诮y(tǒng)計學習的方法屬于基于整體的研究方法，它主要考慮了模式的整體屬性。因為基于整體的人臉識別不僅保留了人臉部件的拓撲關(guān)系，而且也保留了各部件本身的信息。文獻認為基于整個人臉的分析要優(yōu)于基于部件的分析，理由是前者保留了更多信息。對于基于整個人臉的識別而言，由于把整個人臉圖像作為模式，那么光照、視角以及人臉尺寸會對人臉識別有很大的影響，因此如何能夠有效的去掉這些干擾就尤為關(guān)鍵。神經(jīng)網(wǎng)絡的方法在人臉識別上有其獨到的優(yōu)勢，即它避免了復雜的特征提取工作，可以通過學習的過程獲得其它方法難以實現(xiàn)的關(guān)于人臉識別的規(guī)律和規(guī)則的隱性表達。但是NN方法通

32、常需要將人臉作為一個一維向量輸入，因此輸入節(jié)點龐大，降維就顯得尤為重要。根據(jù)文獻對于自組織神經(jīng)網(wǎng)絡方法的分析，認為可采用自組織神經(jīng)網(wǎng)絡的P個節(jié)點來表達原始的N個輸入（P Yale和部分FERETM僉數(shù)據(jù)庫進行測試。第2章基于隱馬爾可夫模型的人臉識別方法引言隱馬爾可夫模型(Hidden Markov Models , HMM),起源于二十世紀六十年代后期，屬于信號統(tǒng)計理論模型，能夠很好的處理隨機時序數(shù)據(jù)的識別與檢測。PCA與ICA 作為統(tǒng)計理論的信號處理技術(shù)，目的是將觀察到的數(shù)據(jù)進行某種線性變換，從而用低維的子空間參數(shù)描述高維的數(shù)據(jù)特征。隱馬爾可夫模型是將隨機時序數(shù)據(jù)的統(tǒng)計特性，用一個

33、模型的參數(shù)來描述，模型參數(shù)通過訓練樣本的統(tǒng)計學習獲得。HMM最早應用在語音識別中，若將時序序列看成應用對象的特征序列，HMM也可以應用到其他領(lǐng)域，如音頻處理、手寫體識別、圖像與視覺處理等，參考 Olivier 所寫的 “ Ten years of HMMs”。根據(jù)人臉由上至下各個區(qū)域具有自然不變的順序，這一穩(wěn)定的相似共性，個人特征僅表現(xiàn)在上述組成部分的形狀及其相互連接關(guān)系不同，即可用一個一維 HMM(1D-HMM)表示人臉。進一步研究表明人臉水平方向從左至右也具有相對穩(wěn) 定的空間結(jié)構(gòu)，因此可將沿垂直方向劃分的狀態(tài)分別擴充為一個1D-HMM,共同組成了一個P2D-HMM。該模型可以更加精確的描述

34、和定義具體人臉的個人特征，是較好的描述和識別人臉的數(shù)學模型。采用P2D-HMM進行人臉識別時，精確度增加了很多，識別率提高了，訓練和識別的復雜度也增加了很多，所以考慮繼續(xù)改善其模型結(jié)構(gòu)。支持向量機(Support Vector Mahcines, SVM)源于統(tǒng)計學習理論，它使用結(jié)構(gòu)風險最小化(SRM)原理構(gòu) 造決策超平面使每一類數(shù)據(jù)之間的分類間隔最大。所以本文使用SVM取代高斯分布函數(shù)或者狀態(tài)映射矩陣建立與 HMM的混合模型，每個人臉器官通過 VSM 進行識別，混合模型的總體結(jié)構(gòu)僅相當于一個1D-HMM,減少了訓練識別的時問，但獲得了與P2D-HMM相當?shù)淖R別精度。本章首先介紹了 HMM是

35、如何由Markov鏈發(fā)展而來的，并且介紹了二者的區(qū)別和MHM的基本理論，包括HMM的模型和HMM中涉及的三大問題；其次介紹了基于HMM人臉識別方法的基本原理和系統(tǒng)概況；然后分別介紹了基于1D-HMM 的人臉識別方法、基于P2D-HMM的人臉識別方法以及基于ICA特征和SVM/HMM的人臉識別方法，本章最后比較了不同模型的識別性能。隱馬爾可夫模型的理論基礎(chǔ)隱馬爾可夫模型屬于信號統(tǒng)計理論模型，能夠很好的處理隨機時序數(shù)據(jù)的識別與預測。HMM是由馬爾可夫鏈(Markov鏈)發(fā)展而來的。馬爾可夫鏈馬爾可夫鏈是馬爾可夫隨機過程的特殊情況，即 Markov鏈是狀態(tài)和時間參數(shù)都離散的Markov過程。

36、從數(shù)學上，可以給出如下定義：隨機序列Xn,在任一時刻n,它可以處在狀態(tài)9i,也，On,且它在m+k 時刻所處的狀態(tài)為qm+k的概率，只與它在m時刻的狀態(tài)qm有關(guān)，而與m時刻以前它所處狀態(tài)無關(guān)，既有：=鵬/47陽名I =焉_,M(2-2)(4-1)其中，qi,q2, ,qm, , qm+i C (9i,也，,(N)。則稱Xn為Markov鏈，并且稱巴(科加+儲= P(g=&凡=4), GIJEN,風片為正整數(shù)(2-3)為k步轉(zhuǎn)移概率，當pij(m , m+k)與m無關(guān)時，稱這個Markov鏈為齊次Markov 鏈，此時匕(加+卜)=以k), 1 4M網(wǎng)發(fā)為正整數(shù)(2-4)以后若無特別中明，Ma

37、rkov鏈就是指齊次Markov鏈。當k=1時，Pij(1)稱為一步轉(zhuǎn)移概率，簡稱為轉(zhuǎn)移概率，記為 aj,所有轉(zhuǎn)移概率aij, 14, j6可以構(gòu)成一個轉(zhuǎn)移矩陣，即(2-5)且有工%土 1，,川(2-6)由于k步轉(zhuǎn)移概率Pij(k)可由轉(zhuǎn)移概率aij得到，因此，描述 Markov鏈的最重要參數(shù)就是轉(zhuǎn)移概率矩陣Ao但A矩陣還決定不了初始分布，即由 A求不出q1=Q 的概率，這樣，完全描述 Markov鏈，除A矩陣外，還必須引入初始概率矢量 n=(兀1,小)，其中=尸(劣=6), 1 4 i W N.(2-7)顯然有No 也的）（立%/49）.Q必（2-9）P2D-HMM可看作是1D-HM

38、M的擴充，即在1D-HMM的每個狀態(tài)中嵌入一個1D-HMM ,該狀態(tài)被改稱為超狀態(tài)。P2D-HMM由N, A, n, A參數(shù)組成，簡寫為兄=n, a, n, R。各參數(shù)的含義如下：? N,表示垂直方向超狀態(tài)的個數(shù)；? A=aKJ,其中14, j不，表示超狀態(tài)轉(zhuǎn)移概率矩陣；?E=xj,其中1司6,表示超狀態(tài)的初始概率分布；?A斜，其中1可不，表示嵌入每個超狀態(tài)的ID-HMM ,每個J都具有一標準的1D-HMM所必需的參數(shù)；? NJ,表示狀態(tài)個數(shù)；?Aj=aKjJ,其中1本, HNJ,表示狀態(tài)轉(zhuǎn)移概率矩陣；?BJ=bij,其中146J,表示輸出概率函數(shù)；?n=Ttij,其中1W6J,表示初始

39、狀態(tài)概率分布。已知模型入，觀察序列O=O11, OTrTs, QY為垂直方向的所以可能狀態(tài)，Qxj 為超狀態(tài)j對應的水平方向的所以可能狀態(tài)，聯(lián)合概率的計算如下式：尸叩曲明”)Qy-2(2-10)即其中，6E隱馬爾可夫模型中的三大問題欲使所建立的隱馬爾可夫模型能解決實際問題，以下三個問題必須加以解決：問題1 ：己知觀察序列o和模型號n, a, b, n ,如何計算由此模型產(chǎn)生此觀察序列的概率PO| J?問題2:己知觀察序列O和模型盡N, A, B, n,如何確定一個合理的狀態(tài)序列，使其能最佳的產(chǎn)生 O,即如何選擇最佳的狀態(tài)序列 Q=q1，q2, , , qT?問題3:如何根據(jù)觀察序列不

40、斷修正模型參數(shù) A, B, n,使PO| %最大？問題1實質(zhì)上是一個模型評估問題，因為 PO| 反映了觀察序列與模型吻合的程度。在模式識別中，可以通過計算、比較PO| ,從多個模型參數(shù)中選擇出與觀察序列匹配的最好的那個模型，這也是HMM用于模式識別的原理所在。為了解決這個問題，前人已研究出了 “前向一后向算法(Forward-Backward Algorithm)。問題2的關(guān)鍵在于選用怎樣的最佳準則來決定狀態(tài)的轉(zhuǎn)移。一種可能的最佳準則是選擇X態(tài)qi,使它們在各t時刻都是最可能的狀態(tài)，即q： = arg max尸Q = f |。,訓.必金(2-11)有時存在這樣的問題：如出現(xiàn)不允許的

41、轉(zhuǎn)移，即aj=0,那么，對這些i和j所得到的狀態(tài)序列就是不可能狀態(tài)序列。也就是說，上式得到的解只是在每個時刻決定一個最可能的狀態(tài)，而沒有考慮整體結(jié)構(gòu)，相鄰時間的狀態(tài)和觀察序列的長度等問題。針對這個缺點要求人們研究一種在最佳狀態(tài)序列基礎(chǔ)上的整體約束的最佳準則，并用此準則找出一條最好的狀態(tài)序列。目前，解決這個問題的最好方案是Vietbri 算法。問題3實質(zhì)上就是如何訓練模型，估計、優(yōu)化模型參數(shù)的問題。這個問題在三個問題中最難，因為沒有解析法可用來求解最大似然模型，所以只能使用疊代法（如:Baum Welch算法）或使用最佳梯度法。在2.4和2.5節(jié)中，本文將以不同HMM的人臉識別方法為

42、例具體介紹“前向一后向算法”、Vitebri算法和Baum-Welch算法在模式識別中的具體應用，有關(guān)以上三種算法的詳細內(nèi)容可以參考文獻60。隱馬爾可夫模型的類型根據(jù)觀測值的取值不同，HMM可分為離散的和連續(xù)的。本文 2.2.2節(jié)介紹的HMM,如果其觀測值是M個離散可數(shù)的觀察值中的一個，則稱之為離散HMM, 某個狀態(tài)qj對應的觀察值的統(tǒng)計特性是由一組概率bJK, k=1, , M來描述。連續(xù)的MMH,指觀察值的可能取值只能用一個概率密度函數(shù)bJ（q）表示。根據(jù)狀態(tài)轉(zhuǎn)移的類型不同，HMM可分為遍歷的（Ergodic）和從左到右的（Left-to-right ,又稱從上至下的Top-to-b

43、ottom）。前者表示狀態(tài)轉(zhuǎn)移是任意的，可以到本身和其他所有狀態(tài)，如圖2-1（a）。后者表示狀態(tài)轉(zhuǎn)移只限于本身和下一個狀態(tài)，如圖2-1（b）。人臉由于各個區(qū)域（頭發(fā)、額頭、眼睛、鼻子和嘴巴）具有自然不變的順序，通常采用從左到右型的HMM。（a）圖2-1幾種典型的馬爾可夫鏈示意圖（a）四狀態(tài)遍歷型馬爾可夫鏈（b）四狀態(tài)由左至右型馬爾可夫鏈基于隱馬爾可夫模型的人臉識別方法概述基于HMW臉識別的基本原理根據(jù)人臉由上至下各個區(qū)域（頭發(fā)、額頭、眼睛、鼻子和嘴巴）具有自然不變的順序，個人特征僅表現(xiàn)在上述組成部分的形狀及其相互連接關(guān)系不同，即可用一個1D-HMM表示人臉，如圖2-2（a）。上述人臉

44、5個部分的人臉特征對應 HMM 的狀態(tài)序列，狀態(tài)的出現(xiàn)及其轉(zhuǎn)移可用模型中的概率矩陣描述，提取圖像的象素點亮度值（或其他特征）作為觀測序列。對于既定的人臉，所對應的HMM應當是唯一的。進一步研究表明人臉水平方向從左至右也具有相對穩(wěn)定的空間結(jié)構(gòu)，因此可將沿垂直方向劃分的狀態(tài)分別擴充為一個1D-HMM。垂直方向的狀態(tài)就稱為超狀態(tài)，水平方向嵌入的狀態(tài)就稱為子狀態(tài)，共同組成了一個P2D-HMM ,如圖 2-2(b)圖2-2用HMMt立人臉模型的基本原理圖(a)1D - HM以臉模型 (b)P2D - HMMV臉模型基于HMW臉識別的系統(tǒng)概述基于HMM的人臉識別系統(tǒng)，必須首先選擇HMM的結(jié)構(gòu)(是1D-HM

45、M ,還是 P2D-HMM) 0 HMM的結(jié)構(gòu)不同使得特征提取、模型訓練和識別中基本算法和系統(tǒng)結(jié)構(gòu)都會有所不同，但關(guān)于圖像的預處理和最后的決策方法都是相同的。本文首先介紹對輸入圖像的預處理和決策方法，關(guān)于特征提取、模型訓練的具體算法將在基于1D-HMM和P2D-HMM人臉識別方法時分別介紹。圖2-3為基于HMM 人臉識別系統(tǒng)的原理圖，其中“ Common HMM”代表人臉的普遍結(jié)構(gòu)，由訓練集中所有人臉圖像獲得，它的作用主要有以下兩個方面：一作為各個對象的人臉模型訓練的初始化參數(shù)，可以極大提高收斂速度；二是完成對人臉庫中不存在的新對象(New Sub ject)的拒識(Re ject)。

46、如果輸入的是一幅彩色圖像，比如 RGB顏色模式圖像，預處理階段首先將其轉(zhuǎn)換為YCbCr顏色模型，然后進行膚色初篩，得到人臉的可能區(qū)域，最后歸一化成方塊灰度圖像后，就可以用條狀或塊狀窗進行一定步長的遍歷掃描，提取特征序列了。本文采用層次結(jié)構(gòu)的判決來完成人臉的識別，如圖 2-4。首先通過計算特征序列。在“Common HMM”模型參左ommon下的概率P(O| Common),判別是否人臉。若是，再計算特征序列在各個對象 MHM模型參數(shù)入下的概率P(O|通, 與P(O| Common)比較，判別是否庫中己有對象的人臉，若是，輸出 maxP(O ?) 的對象標號io入屋膚色區(qū)域光揍為第虐隹

47、僚|%捱KVTM的姑構(gòu)化11MM者我|，；除貼RUB 圍mCjtlAJ勢征提取 Ebt和工均值分段Vittrhi算法”苴K+i+HMM W前斯,期t*逅返匚IiMMMl (SnA) | k：iJfmnjnKMM特征槌取VMi 和 M 均值分咫第N個人的人般圖#一星1小A眄艮段圖隊紀2卞人的人居/丈i l特征序列O圖2-3人臉識別系統(tǒng)原理圖一計算戶（0%）一計算汽。同一對象標號，小f門限值若尸（。心一）最無i邪人臉不能識別的人臉圖2.4層次結(jié)構(gòu)的決策原理圖基于一維隱馬爾可夫模型的人臉識別方法上文介紹了用HMM建立人臉模型的基本原理和基于 MHM人臉識別系統(tǒng)的概況，以下介紹關(guān)于基于1D

48、-HMM人臉特征提取、模型訓練的具體算法。特征提取1D-HMM對人臉圖像區(qū)域提取觀察序列，采用條狀窗口從上至下的遍歷掃描，如圖2-5。有文獻采用每個窗口所含象素的灰度值作為觀察向量，維數(shù)太高，且對影響識別的光線、角度等因素敏感。所以本文選取每個窗口的K-L變換（即PCA）系數(shù)作為觀察向量。也可以提取二維離散傅立葉變換（即2D-DCT）系數(shù)作為觀察向量?？紤]到K-L變換系數(shù)是均方誤差意義下的最佳變換，實驗中識別效果比 2D-DCT系數(shù)略好些。所以本文在結(jié)構(gòu)較簡單的 1D-HMM人臉識別中提取CPA 系數(shù)作為觀察向量。而在基于 P2D-HMM人臉識別中，本文提取2D-DCT系數(shù)作為特征向

49、量，主要鑒于與JPGE圖像壓縮標準兼容，且有快速算法。圖2-5條狀窗口對圖像從上至下的遍歷掃面示意圖圖2-6由左至右依次為頭發(fā)，額頭，眼睛，鼻子和嘴對應的典型 KLT系數(shù)條狀窗口掃描得到的象素灰度值，排列成一列向量，維數(shù)為LxX,所有的M個樣本構(gòu)成(LxX)xM的矩陣。求得它的協(xié)方差矩陣和前十個最大的特征根，重新構(gòu) 造特征空間。提取的特征就為掃描窗所含象素灰度值在這個特征空間的投影的系數(shù)。圖2-6就是對應人臉特征區(qū)域(如頭發(fā)、額頭、眼睛、鼻子和嘴)的典型觀察向量。模型訓練掃描整幅圖像得到T個觀察向量，構(gòu)成觀察序列。為了使得觀察序列能與真實的狀態(tài)轉(zhuǎn)移對應起來，還必須對用Viterbi算法和

50、K均值聚類對序列分段。Viterbi 算法用來尋找觀測序列0=(。1, 02, , , ot)對應的最佳狀態(tài)序列Q=(qi, q2, qT),并且計算在最佳狀態(tài)序列條件下的概率。定義變量：4 (7)=max電h尸(/馮&口).(2-12)具體算法如下:a初始化：4(j) =盯4佃).|Ki(/j=Ot ljN(2-13)b.遞推：(2-14),(7)-arg max(2-15)c終止:1 IP麒降(J)，%=期刊及(2-16)d.最佳狀態(tài)序列:d =匕.1(4討卜l = 7TT-2,(2-17)本文將已分段的序列輸入初始化的 HMM ,首先用Forward-Backward算法求得前向概率的

51、和后向概率8(j),再用Buam-welch算法進行反復參數(shù)重估直至收斂，這樣就得到訓練人臉樣本的 HMM。重估過程如下：定義&(i, j)表示在己知觀察序列O和模型人的情況下，t時刻處于狀態(tài)i, t+1時刻處于狀態(tài)j的概率，定T-I -義(i)為給定觀察序列O和模型人的條件下。t時刻處于狀態(tài)i的概率。.2%表示在觀察序列中，從狀態(tài)i出發(fā)的狀態(tài)轉(zhuǎn)移次數(shù)的期望，表示觀察序列中，從狀態(tài)i至”的狀態(tài)轉(zhuǎn)移次數(shù)的期望，可知(2-18)P% 0a/叼* J四(/)(2-19)模型中的三個參數(shù)的重估結(jié)果如下式：久。).i兄%=*)；可產(chǎn)2； 4代人當三普。) !(2-20)然后計算P(O| ),反復重

52、估參數(shù)至收斂，得到訓練樣本的1D-HMM人臉模型分類識別HMM本身就是一個分類器。以ORL人臉庫為例，首先劃分訓練集和測試集，然后將訓練集中的圖像分對象分別訓練，得到每個對象的人臉HMM模型。人臉識別時，測試集中任取一幅圖像，先通過條狀窗掃描獲得觀測序列，即提取的人臉特征，然后用Forward-Backward算法計算待測區(qū)域提取的觀察向量在不同對象的1D-HMM參數(shù)下的概率，實際中一般用 Viterbi算法計算概率，這樣運算速度比較快。最后通過比較概率的大小即可作出決策。分析基于1D-HMM的人臉識別過程，影響識別效果可能有以下因素：狀態(tài)數(shù)N、窗口寬度L,掃描重疊寬度M。文獻國就

53、以上因素對人臉識別性能進行了詳細比較和分析，本文也認為取5個狀態(tài)分別對應人臉的前額、眼睛、鼻子、嘴和下巴，描述和代表人臉的宏觀特征理論是比較合理的，識別性能也最好。并且對于窗口寬度L,只要重疊寬度M足夠大，對識別性能影響不大。重疊寬度大，識別效果好，通常取M=L-1 0本文的識別系統(tǒng)最終選取 N=5、L=8、M=7的掃描方式。基于偽二維隱馬爾可夫模型的人臉識別方法P2D-HMM最早應用在字符識別中，后來證明用它描述二維圖像也是行之有效的。圖2-2所示的拓撲結(jié)構(gòu)說明了用 P2D-HMM建立人臉模型的原理，它和用 1D-HMM人臉模型的區(qū)別在于它不但能表現(xiàn)人臉從上至下的空間結(jié)構(gòu)，還能表現(xiàn)

54、水平方向從左至右的空間結(jié)構(gòu)，表現(xiàn)在HMM結(jié)構(gòu)中使用1D-HMM替代超狀態(tài)的概率分布。同時因為水平方向的狀態(tài)變化僅限于超狀態(tài)內(nèi)，所以分析處理比真正二維的隱馬爾可夫模型(2D-HMM)簡單。文獻【62】中曾對不同狀態(tài)數(shù)的模型人臉識別性能進行了詳細比較和分析。本文選取5個超狀態(tài)分別對應人臉的宏觀特征，每個超狀態(tài)內(nèi)嵌入的狀態(tài)分別提取人臉的局部區(qū)域特征，嵌入狀態(tài)數(shù)取(3 ,6, 6, 6, 3)的結(jié)構(gòu)具有較好的識別精度，如圖 2-2(b)。圖2-7塊狀窗對圖像從左到右、從上至下的遍歷掃描示意圖X為圖像的水平像素點總數(shù)；Y為圖像的垂直像素點總數(shù)；M為從上到下遍歷掃描的步長；Q為從左到右遍歷掃描的步一長

55、；L為從上至下掃描的塊狀窗口在垂直方向的長度；P為從上至下掃描的塊狀窗口在水平方向的長度；T為遍歷掃描的窗口數(shù)；為了更好的提取人臉的二維空間特征，P2D-HMM觀察序列采用塊狀窗遍歷掃描方法，如圖2-7o在人臉圖像和可能含人臉的待檢測區(qū)域，用含象素點數(shù)為 PxL 的掃描窗從左到右、由上至下滑動，獲取觀察圖像塊。相鄰窗口在垂直方向和水平方向分別有M行、Q列重疊。如果直接取采樣窗內(nèi)的象素點灰度值構(gòu)造觀察向量，同樣存在維數(shù)太大，易受噪聲干擾的缺點。本文選取 8x82D-DCT變換，得到8x8的2D-DCT系數(shù)。DCT變換如下式：的掃描窗，做IEK ID(2尸十l卜開Te-用三角窗取DCT系數(shù)矩陣

56、的前15個系數(shù)，就得到了一個觀察向量(2.21)若采用16x16的掃描窗，得到的識別效果與 8x8相近，但是8x8的掃描窗與JEPG標準兼容，觀察向量維數(shù)少。這樣提取DCT系數(shù)作為觀察向量，對JPEG壓縮的人臉圖像可以直接在壓縮域進行識別，無需解壓，如圖 2-8。JPEG人臉圖獴_ HufSna加肝應鼠化器修西立算法|川松第_ _ 小 I. L HMM 】4 2 .HMMN圖2-8壓縮域上人臉識別示意圖本文訓練時采用75%的重疊掃描，M=8, Q=6o識別時，重疊掃描為零，直接使用壓縮域的參數(shù)，獲得較好的識別效果，這與前人所研究所討論的相符。訓練基于P2D-HMM的人臉模型和訓練

57、1D-HMM的人臉模型類似，用塊狀窗遍歷掃描得到觀察序列后，對觀察序列進行 V讓erbi分段，Buam-Welch算法重估參數(shù)。由于P2D-HMM在每個超狀態(tài)中嵌入了一個1D-HMM ,所以具體算法有所不同?；贗以特征和SMV/1翎以的人臉識別方法采用P2D-HMM進行人臉識別時，精確度增加了很多，識別率最高可達100%, （基于ORL人臉庫）。但是因為它將16-30個子狀態(tài)嵌入到45個超狀態(tài)中，訓練和識別的復雜度也增加了很多。將 SVM引入HMM,建立SVM/HMM的混合人臉識別模型可以簡化P2D-HMM的結(jié)構(gòu)，同時保證識別精度不變。SVM源于統(tǒng)計學習理論，它使用結(jié)構(gòu)風險最小化（S

58、RM）原理構(gòu)造決策超平面使每一類數(shù)據(jù)之間的分類間隔最大。與HMM和ANN相比，SVM具有以下優(yōu)勢：訓練過程中，分類模型自動構(gòu)造，不需要事先指定；SVM可以在小樣本訓練前提下完成;采用SRM原理，SVM訓練的結(jié)果使其識別的實際風險小，而非僅僅經(jīng) 驗風險小。SVM/HMM的混合模型最早使用在語音識別中。我們將 SVM/HMM 應用于人臉識別，用SVM的輸出取代高斯分布函數(shù)或者狀態(tài)映射矩陣（離散碼本）建立與HMM的混合模型。每個人臉器官通過 SVM進行分類，混合模型相當于一個1D-HMM。所以在保證識別率的前提下，SVM/HMM模型較簡練，減少了分析識別的時間。由于ICA提取的人臉特征與

59、PCA相比更能反映人臉的本質(zhì)特征，本文提取人臉器官ICA特征作為SVM分類器的輸入。用ICA提取訓練樣本的高維特征的前提，必須使得樣本的維數(shù)相等，樣本個數(shù)大于樣本的維數(shù)。我們將ORL人臉庫中的400幅分辨率為90 x112象素點的人臉圖像歸整50 x60像寬度的人臉區(qū)域，按照 14、8、10、18個象素寬度分別提取下巴（含嘴巴）、鼻子、眼睛、前額區(qū)域。再將區(qū)域歸整為25x30大小圖像塊，再展開成 750維的矢量。400幅人臉生成 F=1600 x750的人臉器官空間。對該空間進行 ICA,就可以得到人臉器官的 36 個人臉器官基，組成人臉器官基空間。人臉器宮矢量x在人臉器官基空間上的投影即為所提取人臉器官的ICA特征?；赟VM/HMM的人臉識別模型的條狀窗掃描和訓練與 ID-HMM模型相似，見圖2-5。經(jīng)過預處理的圖像經(jīng)過條狀窗掃描， V讓erbi和k均值分段、區(qū)域歸整、工以特征提取后，輸入SVM分類器。SVM最初只解決二類模式識別問題，本文采用二叉樹結(jié)構(gòu)解決SVM多類模式識別的問題。SVM的輸出為特征矢量與待識別器官支持向量之間的距離。將距離轉(zhuǎn)換成概率輸出，就完成了用 S

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人臉識別文檔

文檔簡介

溫馨提示

最新文檔

評論

人臉識別文檔

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔