人臉識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)_第1頁(yè)
人臉識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)_第2頁(yè)
人臉識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)_第3頁(yè)
人臉識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)_第4頁(yè)
人臉識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩103頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、WORD版本W(wǎng)ORD版本W(wǎng)ORD版本.人臉識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)目錄TOC o 1-5 h z HYPERLINK l bookmark0 第1章緒論1 HYPERLINK l bookmark2 1.1人臉識(shí)別的研究背景和意義1 HYPERLINK l bookmark4 1.1.1研究背景1 HYPERLINK l bookmark6 1.1.2研究意義2 HYPERLINK l bookmark8 1.2國(guó)外人臉識(shí)別技術(shù)研究現(xiàn)狀2 HYPERLINK l bookmark10 1.3本文所做的主要工作及論文容安排31.3.1本文所做的主要工作3 HYPERLINK l bookma

2、rk12 1.3.2論文容安排4 HYPERLINK l bookmark14 第2章人臉識(shí)別技術(shù)的綜述5 HYPERLINK l bookmark16 2.1人臉識(shí)別技術(shù)的基本原理5 HYPERLINK l bookmark18 2.2人臉識(shí)別技術(shù)包含的容5 HYPERLINK l bookmark20 2.2.1人臉檢測(cè)5 HYPERLINK l bookmark22 2.2.2人臉識(shí)別72.2.3人臉圖像的預(yù)處理82.2.4人臉跟蹤定位11 HYPERLINK l bookmark24 2.2.5人臉特征提取12 HYPERLINK l bookmark26 2.3基于Adaboost算

3、法的人臉細(xì)檢測(cè)13 HYPERLINK l bookmark28 Adaboost算法描述13 HYPERLINK l bookmark30 Haar特征與積分圖15 HYPERLINK l bookmark32 2.3.3基于Haar特征的Adaboost算法描述16 HYPERLINK l bookmark38 2.4基于隱馬爾可夫模型的人臉識(shí)別方法17隱馬爾可夫模型介紹17 HYPERLINK l bookmark40 HMM的三個(gè)基本問(wèn)題18 HYPERLINK l bookmark42 HMM人臉模型20隱馬爾可夫模型訓(xùn)練21 HYPERLINK l bookmark46 2.5基于

4、嵌入式隱馬爾可夫模型的人臉識(shí)別方法23嵌入式隱馬爾可夫模型24 HYPERLINK l bookmark50 最佳狀態(tài)鏈的確定25 HYPERLINK l bookmark52 2.5.3概率pG|九)的計(jì)算25 HYPERLINK l bookmark56 EHMM人臉識(shí)另U26 HYPERLINK l bookmark58 EHMM模型訓(xùn)練27 HYPERLINK l bookmark60 2.6人臉識(shí)另的技術(shù)難點(diǎn)與發(fā)展方向28 HYPERLINK l bookmark62 2.6.1技術(shù)難點(diǎn)28 HYPERLINK l bookmark64 2.6.2發(fā)展方向29 HYPERLINK l

5、 bookmark66 3章人臉識(shí)另系統(tǒng)的需求分析301可行性分析30 HYPERLINK l bookmark68 3.1.1技術(shù)可行性30 HYPERLINK l bookmark70 3.1.2操作可行性30 HYPERLINK l bookmark72 2需求分析31 HYPERLINK l bookmark74 3.2.1功能需求分析31 HYPERLINK l bookmark76 3.2.2算法需求分析31 HYPERLINK l bookmark78 第4章系統(tǒng)的方案設(shè)計(jì)和實(shí)現(xiàn)331結(jié)構(gòu)設(shè)計(jì)334.1.1人臉實(shí)時(shí)檢測(cè)跟蹤系統(tǒng)334.1.2人臉識(shí)另系統(tǒng)344.2功能設(shè)計(jì)34人臉實(shí)

6、時(shí)檢測(cè)跟蹤系統(tǒng)設(shè)計(jì)34人臉識(shí)另系統(tǒng)設(shè)計(jì)36 HYPERLINK l bookmark80 4.3人臉實(shí)時(shí)跟蹤系統(tǒng)功能的實(shí)現(xiàn)37 HYPERLINK l bookmark82 VS2010與0penCV庫(kù)簡(jiǎn)介37 HYPERLINK l bookmark84 OpenCV環(huán)境配置38 HYPERLINK l bookmark86 4.3.30penCV中用于圖像處理的函數(shù)38 HYPERLINK l bookmark88 4.3.4基于OpenCV的目標(biāo)檢測(cè)算法394.3.5人臉檢測(cè)跟蹤的核心算法40 HYPERLINK l bookmark90 4人臉識(shí)別系統(tǒng)功能實(shí)現(xiàn)41人臉數(shù)據(jù)庫(kù)簡(jiǎn)介41 H

7、YPERLINK l bookmark92 系統(tǒng)框架42具體的實(shí)驗(yàn)函數(shù)分析44 HYPERLINK l bookmark94 第5章系統(tǒng)的測(cè)試與分析46 HYPERLINK l bookmark96 1人臉實(shí)時(shí)檢測(cè)跟蹤系統(tǒng)46 HYPERLINK l bookmark98 系統(tǒng)測(cè)試46 HYPERLINK l bookmark100 結(jié)果分析47 HYPERLINK l bookmark102 2人臉識(shí)別系統(tǒng)47 HYPERLINK l bookmark104 系統(tǒng)測(cè)試47 HYPERLINK l bookmark106 結(jié)果分析51 HYPERLINK l bookmark108 第6章總結(jié)

8、與展望521總結(jié)526.2展望53 HYPERLINK l bookmark110 參考文獻(xiàn)54 HYPERLINK l bookmark112 附錄56 HYPERLINK l bookmark114 附錄A人臉實(shí)時(shí)檢測(cè)跟蹤算法程序。56 HYPERLINK l bookmark116 附錄B人臉識(shí)別算法程序。60附錄B1人員管理窗口程序60附錄B2參數(shù)設(shè)置窗口程序68附錄B3人臉識(shí)別窗口程序74附錄B4類行為管理程序82附錄B5人臉識(shí)別主程序84 HYPERLINK l bookmark118 致謝106第1章緒論人臉識(shí)別的研究背景和意義1.1.1研究背景早在古埃及時(shí)人們就開(kāi)始通過(guò)人體生物

9、特征的測(cè)量(如人臉、人手等)來(lái)鑒別人的身份,在刑偵領(lǐng)域,人們也早已使用最有效的人體生物特征之一,指紋,來(lái)確定罪犯。隨著計(jì)算機(jī)技術(shù)的出現(xiàn),人們開(kāi)始憑借計(jì)算機(jī)的強(qiáng)大功能來(lái)研究和實(shí)現(xiàn)自動(dòng)的身份鑒別系統(tǒng)。近年來(lái),在美國(guó)、歐洲、香港等許多國(guó)家和地區(qū)的大學(xué)都成立了以人體生物識(shí)別技術(shù)為主要研究方向的實(shí)驗(yàn)室或研究中心,同時(shí)許多公司也相繼先后開(kāi)發(fā)出許多產(chǎn)品,并不斷地推向市場(chǎng),逐步形成一個(gè)新興的、很有希望的產(chǎn)業(yè)。在我國(guó),已經(jīng)涌現(xiàn)出很多專門機(jī)構(gòu)廣泛開(kāi)展人體生物識(shí)別技術(shù)方面的研究工作,有許多研究人員投身到這一新興研究領(lǐng)域,開(kāi)展用于身份鑒別的人臉識(shí)別、話者識(shí)別、聯(lián)機(jī)簽名識(shí)別、指紋識(shí)別等多項(xiàng)研究工作,并取得了一定的成果。

10、目前,用于個(gè)人身份鑒別主要依靠ID卡(如身份證、工作證、儲(chǔ)蓄卡等)、密碼(如進(jìn)入計(jì)算機(jī)系統(tǒng)、取款)等手段,而這些手段存在攜帶不便、密碼被竊等諸多問(wèn)題。例如,信用卡問(wèn)題:美國(guó)每年的信用卡欺詐損失超過(guò)數(shù)百萬(wàn)美金;在失業(yè)救濟(jì)、健康保險(xiǎn)、福利發(fā)放等領(lǐng)域,由于冒別人之名而損失極大;使用偽造證件非法移民等。人們希望有一種更加方便可靠的辦法來(lái)進(jìn)行身份鑒別,生物特征識(shí)別技術(shù)給這一愿望帶來(lái)了實(shí)現(xiàn)的可能,人們可能會(huì)遺忘或丟失他們的卡片或密碼,但絕對(duì)不會(huì)遺忘或者丟失自己的生物特征,如人臉、指紋、虹膜、掌紋等。因此,基于生物特征識(shí)別技術(shù)的個(gè)人身份識(shí)別系統(tǒng)具有更好的安全性、可靠性和有效性,正越來(lái)越受到人們的重視,并開(kāi)始

11、進(jìn)入我們社會(huì)生活的各個(gè)領(lǐng)域,迎接新時(shí)代的挑戰(zhàn)。雖然與指紋識(shí)別技術(shù)、虹膜識(shí)別技術(shù)等相比,人臉識(shí)別技術(shù)更容易受到各種因素的干擾,比如光照、裝扮或者是人的表情等,但是人臉識(shí)別技術(shù)的發(fā)展空間和發(fā)展前景依然是非常巨大的。可以從以下的三個(gè)方面了解人臉識(shí)別技術(shù)的優(yōu)勢(shì)所在:(1)無(wú)侵犯性所謂無(wú)侵犯性是指在使用人臉識(shí)別技術(shù)進(jìn)行識(shí)別的過(guò)程當(dāng)中,不需要被識(shí)別者的主動(dòng)參與、積極配合,從而避免了被識(shí)別者產(chǎn)生反感、拒絕等逆反心理,使得識(shí)別過(guò)程可以有效、迅速的執(zhí)行。(2)自然性好人臉識(shí)別技術(shù)具有良好的自然性。在這里,自然性是指我們使用的人臉識(shí)別技術(shù)是否WORD版本.WORD版本W(wǎng)ORD版本與人類用來(lái)互相識(shí)別區(qū)分的方法相似。

12、在日常生活當(dāng)中,識(shí)別一個(gè)人最簡(jiǎn)單最直接的方法就是識(shí)別他的臉部。(3)性價(jià)比高人臉識(shí)別技術(shù)所需求的硬件設(shè)備,相對(duì)于其他生物特征識(shí)別技術(shù)如指紋識(shí)別技術(shù)較為簡(jiǎn)單,不需要其他特殊的外接設(shè)備,只需要采用高分辨率攝像頭即可。1.1.2研究意義人臉識(shí)別技術(shù)的研究無(wú)論在理論上還是在實(shí)踐中都有很大的意義,它涵蓋了數(shù)字圖像處理、神經(jīng)網(wǎng)絡(luò)、心理學(xué)、生理學(xué)、模式識(shí)別、計(jì)算機(jī)視覺(jué)以及人工智能等各方面的知識(shí)容,對(duì)推動(dòng)各個(gè)學(xué)科領(lǐng)域的發(fā)展具有重要的理論意義。在公安、金融、網(wǎng)絡(luò)安全、物業(yè)管理以及考勤等各種領(lǐng)域也都有著巨大的應(yīng)用價(jià)值。如人臉識(shí)別技術(shù)可以快速地計(jì)算出實(shí)時(shí)采集到臉部數(shù)據(jù)與人臉圖像數(shù)據(jù)庫(kù)中已知人員的臉部數(shù)據(jù)之間的相似度

13、,返回鑒別結(jié)果和相對(duì)應(yīng)的可信度。如應(yīng)用面像捕捉,人臉識(shí)別技術(shù)可以在監(jiān)控圍中跟蹤一個(gè)人并確定他的位置。如在商場(chǎng)、銀行、交易所等和金融相關(guān)場(chǎng)所,加以人臉識(shí)別智能監(jiān)控,排除不法分子的侵入。利用人臉識(shí)別技術(shù),可以進(jìn)行計(jì)算機(jī)的登錄控制,可以進(jìn)行應(yīng)用程序安全使用、數(shù)據(jù)庫(kù)安全訪問(wèn)和文件加密,可以實(shí)現(xiàn)局域網(wǎng)和廣域網(wǎng)的安全控制,可以保護(hù)電子商務(wù)的安全性。如門禁控制,通過(guò)攝像機(jī)動(dòng)態(tài)捕獲人臉,將人臉信息同數(shù)據(jù)庫(kù)中的人臉信息進(jìn)行檢索對(duì)比,只有圖像信息符合的人才可以進(jìn)入,否則拒絕進(jìn)入。在日常生活中,人們識(shí)別周圍的人用的最多的是人臉。由于人臉識(shí)別的非侵犯性,具有直接、友好、方便的特點(diǎn),是人們最容易接受的身份鑒別方式。國(guó)外

14、人臉識(shí)別技術(shù)研究現(xiàn)狀模式識(shí)別技術(shù)5早在上個(gè)世紀(jì)60年代就已經(jīng)有人提出,由于當(dāng)時(shí)計(jì)算機(jī)處理速度的限制,只能從理論上證明是可行的。20世紀(jì)90年代以來(lái),隨著高速度高性能計(jì)算機(jī)的出現(xiàn),人臉識(shí)別方法有了重大突破,進(jìn)入了真正的機(jī)器自動(dòng)識(shí)別階段,人臉識(shí)別研究也得到了前所未有的重視。歐美等各高校都建立了人臉識(shí)別的實(shí)驗(yàn)室,其中著名的大學(xué)包括麻省理工學(xué)院(MIT)、卡基梅隆大學(xué)(CMU)等。在美國(guó)主要有麻神理工學(xué)院等研究實(shí)驗(yàn)室提出的特征人臉對(duì)特征空間的投影來(lái)實(shí)現(xiàn);在法國(guó)已經(jīng)把人臉識(shí)別身份認(rèn)證技術(shù)應(yīng)用到自助取款機(jī)上,在實(shí)際使用時(shí)需要用一臺(tái)3D攝像機(jī),采集人的立體影像來(lái)鑒定身份。目前,美國(guó)許多研究小組相繼投入到人臉

15、識(shí)別方面的研究工作,他們的研究工作得到了美國(guó)軍方、警方和大公司的資助,進(jìn)展迅速。美國(guó)軍方更是在每年組織人臉識(shí)別大賽(FERT),以促進(jìn)人臉識(shí)別的研究。日本sony公司最新推出的數(shù)碼相機(jī)已經(jīng)整合了人臉自動(dòng)識(shí)別功能,在拍照時(shí),可以自動(dòng)檢測(cè)出人臉區(qū)域并進(jìn)行對(duì)焦,并且還具有識(shí)別笑臉的功能,能夠自動(dòng)檢測(cè)出笑臉。2007年3月,美國(guó)NIST報(bào)告了2006年人臉識(shí)別供應(yīng)商評(píng)測(cè)(FRVT2006)結(jié)果,對(duì)控制光照條件下的極高分辨率正面人臉圖像,最小錯(cuò)誤接受率為0.001時(shí),最小錯(cuò)誤拒絕率已達(dá)到0.01,對(duì)高分辨率、低分辨率下的正面人臉圖像的識(shí)別,這個(gè)數(shù)據(jù)也分別達(dá)到了0.與0.。在一定條件,有些技術(shù)甚至超過(guò)了人

16、類的人臉識(shí)別力。國(guó)對(duì)于人臉識(shí)別的研究較之國(guó)外稍晚一些,但是發(fā)展速度很快,同時(shí),國(guó)家對(duì)人臉識(shí)別技術(shù)的研究也給予了高度的重視。九十年代中后期以來(lái),國(guó)眾多研究機(jī)構(gòu)的研究組在國(guó)家自然科學(xué)基金、863計(jì)劃等資助下開(kāi)始對(duì)人臉識(shí)別進(jìn)行了研究。其中,具有代表性的人臉識(shí)別系統(tǒng)有:清華大學(xué)電子系丁曉青教授研究小組開(kāi)發(fā)的THfacelD系統(tǒng);中國(guó)科技大電子科學(xué)與技術(shù)系莊鎮(zhèn)泉教授研究小組開(kāi)發(fā)的人臉識(shí)別考勤系統(tǒng)(KD-Face2.0);中科院計(jì)算所高文研究組開(kāi)發(fā)的GodEye系統(tǒng);清華大學(xué)電子系蘇光大教授研究小組開(kāi)發(fā)的大型人臉綜合識(shí)別系統(tǒng);中科院自動(dòng)化所子青研究小組開(kāi)發(fā)的人臉識(shí)別系統(tǒng)等。2008年,在北京奧運(yùn)會(huì)及殘奧會(huì)

17、開(kāi)閉幕式,使用了由CBSR研制的人臉識(shí)別技術(shù)進(jìn)行實(shí)名制門票查驗(yàn)。在奧運(yùn)會(huì)及殘奧會(huì)開(kāi)閉幕式中,約36萬(wàn)人次經(jīng)過(guò)了人臉識(shí)別系統(tǒng)的驗(yàn)證后進(jìn)入開(kāi)閉幕式現(xiàn)場(chǎng)。為奧運(yùn)會(huì)的安保工作做出了巨大的貢獻(xiàn),該技術(shù)擁有完全獨(dú)立自主的知識(shí)產(chǎn)權(quán),人臉識(shí)別系統(tǒng)的性能優(yōu)良,在國(guó)際上亦處于領(lǐng)先地位。2011年1月,由政府資助開(kāi)發(fā)出了新型的人臉識(shí)別自動(dòng)售貨機(jī),該機(jī)器可以應(yīng)用在某些特殊商品的銷售領(lǐng)域中,如保健產(chǎn)品、面膜、剃須刀等,該人臉識(shí)別自動(dòng)售貨機(jī)可以根據(jù)消費(fèi)者面部的特征向其推薦特定的商品。同時(shí),人臉識(shí)別技術(shù)也可以幫助解決很多社會(huì)問(wèn)題,比如,目前的解救乞討兒童的公益活動(dòng)。其中,以中科院自動(dòng)化所免費(fèi)提供人臉識(shí)別相關(guān)的技術(shù)支持,并與

18、多個(gè)網(wǎng)絡(luò)平臺(tái)合作盡快的付諸于實(shí)踐。本文所做的主要工作及論文容安排1.3.1本文所做的主要工作本文針對(duì)實(shí)時(shí)視頻的人臉檢測(cè)跟蹤與靜態(tài)圖像的人臉識(shí)別展開(kāi)研究,介紹了一種開(kāi)放源代碼的計(jì)算機(jī)視覺(jué)類庫(kù)OpenCV,闡述了該軟件的特點(diǎn)及結(jié)構(gòu),并對(duì)其在VS2010開(kāi)發(fā)環(huán)境下的配置作了詳細(xì)的說(shuō)明,然后提出了一個(gè)基于OpenCV的人臉檢測(cè)算法血和基于隱馬爾可夫模型的人臉識(shí)別方法24。對(duì)人臉識(shí)別技術(shù)做了詳細(xì)綜述,著重討論了人臉識(shí)別過(guò)程中的幾個(gè)關(guān)鍵性問(wèn)題,如圖像預(yù)處理、識(shí)別和檢測(cè)算法等。在分析和借鑒了國(guó)外人臉識(shí)別領(lǐng)域研究成果的基礎(chǔ)上,結(jié)合實(shí)際應(yīng)用的目的,對(duì)人臉識(shí)別關(guān)鍵技術(shù)進(jìn)行了深入研究,主要工作包含以下幾個(gè)方面:(1

19、)介紹了基于人臉識(shí)別的研究背景和意義,總結(jié)了現(xiàn)有的人臉識(shí)別的方法,分析比較了它們的特點(diǎn)以及存在的問(wèn)題。(2)對(duì)人臉檢測(cè)和識(shí)別過(guò)程中的靜態(tài)圖像預(yù)處理技術(shù)和特征提取技術(shù)展開(kāi)討論,重點(diǎn)分析了圖像的灰度變換、直方圖均衡化、邊緣檢測(cè)等問(wèn)題。(3)對(duì)國(guó)外人臉檢測(cè)的Adaboost算法和人臉識(shí)別的隱馬爾可夫算法的研究進(jìn)行了跟蹤,提出了一種基于Adaboost的人臉檢測(cè)算法,和一種基于嵌入式隱馬爾可夫模型的人臉識(shí)別算法,并對(duì)算法進(jìn)行的實(shí)驗(yàn)測(cè)試進(jìn)行分析,實(shí)驗(yàn)結(jié)果表明文章中提出的算法具有較好的人臉檢測(cè)和識(shí)別的準(zhǔn)確率。(4)從應(yīng)用的角度出發(fā),結(jié)合前面兩章的研究成果,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)人臉檢測(cè)跟蹤系統(tǒng)和一個(gè)靜態(tài)人臉圖像

20、識(shí)別的人臉識(shí)別系統(tǒng)?;舅枷胧牵豪梦恼轮刑岢龅牡腁daboost算法先檢測(cè)出候選的人臉區(qū)域,再根據(jù)特定的算法提取出面部的人臉特征,確定并標(biāo)示出人臉的位置;另外利用嵌入式隱馬爾可夫模型算法開(kāi)發(fā)了一個(gè)人臉識(shí)別系統(tǒng)進(jìn)行人臉識(shí)別。文章進(jìn)行了大量的實(shí)驗(yàn)測(cè)試,并對(duì)測(cè)試結(jié)果進(jìn)行了分析。論文容安排針對(duì)研究容,本文的結(jié)構(gòu)安排如下:第一章為緒論,介紹了人臉識(shí)別技術(shù)研究的背景及意義和國(guó)外的研究現(xiàn)狀。第二章為人臉識(shí)別技術(shù)的綜述,分析了人臉識(shí)別的基本原理和方法,重點(diǎn)討論了人臉識(shí)別中的關(guān)鍵算法,指出了現(xiàn)在人臉識(shí)別技術(shù)的研究難點(diǎn)。第三章為人臉識(shí)別系統(tǒng)的需求分析,分析了算法需求和功能需求,為系統(tǒng)的方案設(shè)計(jì)做好準(zhǔn)備。第四章為

21、人臉識(shí)別系統(tǒng)的方案設(shè)計(jì)和實(shí)現(xiàn),給出了系統(tǒng)的總體設(shè)計(jì)方案和各個(gè)功能模塊的設(shè)計(jì),詳細(xì)闡述了整個(gè)系統(tǒng)和各個(gè)模塊的實(shí)現(xiàn)過(guò)程。第五章為人臉識(shí)別系統(tǒng)的系統(tǒng)測(cè)試,闡述了系統(tǒng)的功能測(cè)試和測(cè)試結(jié)果。第六章為總結(jié)與展望,闡述了自己論文的主要成果和仍需要做的改進(jìn)。第2章人臉識(shí)別技術(shù)的綜述人體生物特征識(shí)別技術(shù)是依靠人體的生物特征來(lái)進(jìn)行人的身份驗(yàn)證的一種高科技識(shí)別技術(shù)。而人臉識(shí)別技術(shù)具有比其他生物特征識(shí)別技術(shù)更直觀、簡(jiǎn)便、準(zhǔn)確、可靠及可擴(kuò)展性良好等眾多優(yōu)勢(shì),因而應(yīng)用廣泛。人臉識(shí)別技術(shù)的基本原理人臉識(shí)別技術(shù)是基于人的臉部特征,對(duì)輸入的人臉圖象或者視頻流,首先判斷其是否存在人臉,如果存在人臉,則進(jìn)一步給出每個(gè)臉的位置、大小

22、和各個(gè)主要面部器官的位置信息。并依據(jù)這些信息,進(jìn)一步提取每個(gè)人臉中所蘊(yùn)涵的身份特征,并將其與已知的人臉進(jìn)行對(duì)比,從而識(shí)別每個(gè)人臉的身份。廣義的人臉識(shí)別實(shí)際包括構(gòu)建人臉識(shí)別系統(tǒng)的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識(shí)別預(yù)處理、身份確認(rèn)以及身份查找等;而狹義的人臉識(shí)別特指通過(guò)人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。人臉識(shí)別技術(shù)包含的容2.2.1人臉檢測(cè)人臉檢測(cè)是指在動(dòng)態(tài)的場(chǎng)景與復(fù)雜的背景10中判斷是否存在面像,并分離出這種面像。下面是幾個(gè)主要的人臉檢測(cè)方法:(1)基于知識(shí)的方法:這種方法是基于規(guī)則的人臉檢測(cè)方法,規(guī)則來(lái)源于研究者關(guān)于人臉的先驗(yàn)知識(shí),將典型的人臉形成規(guī)則庫(kù)對(duì)人臉進(jìn)行編碼

23、,通過(guò)面部特征之間的關(guān)系進(jìn)行人臉定位。一般比較容易提出簡(jiǎn)單的規(guī)則來(lái)描述人臉特征和它們的相互關(guān)系,如在一幅圖像中出現(xiàn)的人臉,通常具有互相對(duì)稱的兩只眼睛、一個(gè)鼻子和一嘴。特征之間的相互關(guān)系可以通過(guò)它們的相對(duì)距離和位置來(lái)描述,在輸入圖像中首先提取面部特征,確定基于編碼規(guī)則的人臉候選區(qū)域?;谥R(shí)的方法存在的問(wèn)題是很難將人類知識(shí)轉(zhuǎn)換為明確定義的規(guī)則。如果規(guī)則太詳細(xì)(嚴(yán)格),由于不能通過(guò)所有的規(guī)則可能使得檢測(cè)失?。蝗绻?guī)則太概括(通用),可能會(huì)有較高的錯(cuò)誤接收率。此外,很難將這種方法擴(kuò)展到在不同的位姿下檢測(cè)人臉,因?yàn)榱信e所有的情況是一項(xiàng)很困難的工作。(2)基于特征不變性的方法:在姿態(tài)、視角或光照條件改變

24、的情況下找到存在的結(jié)構(gòu)特征,然后使用這些特征確定人臉。這類方法主要有采用人臉特征檢測(cè)、基于皮膚顏色紋理特征檢測(cè)以及基于多個(gè)特征綜合檢測(cè)。不僅可以從已有的面部特征而且可以從它們的幾何關(guān)系進(jìn)行人臉檢測(cè)。與基于知識(shí)的方法相反,它是尋找人臉的不變特征用于人臉檢測(cè)。人們已經(jīng)提出了許多先檢測(cè)人臉面部特征,后推斷人臉是否存在的方法。一般利用邊緣檢測(cè)器提取面部特征(如眉毛、眼睛、鼻子、嘴和發(fā)際等),根據(jù)提取的特征,建立統(tǒng)計(jì)模型描述特征之間的關(guān)系并確定存在的人臉。這類方法的缺點(diǎn)在于這些特征會(huì)由于照明、噪聲以及遮擋情況被破壞,人臉的特征邊界會(huì)被弱化,在這種情況下很多方法都會(huì)失效;同時(shí)由人臉陰影所形成的邊緣可能對(duì)幾

25、何特征的邊緣帶來(lái)不良影響。(3)基于模版匹配的方法:這類方法首先人工定義或者參數(shù)化的建立一個(gè)函數(shù)來(lái)描述標(biāo)準(zhǔn)人臉模式(通常是正面人臉),然后根據(jù)輸入的人臉和定義的標(biāo)準(zhǔn)人臉的相關(guān)性來(lái)進(jìn)行檢測(cè)。但是實(shí)際上,我們的人臉模式變化太大,人臉模板的構(gòu)建是相當(dāng)難的,如果是固定的模板,很難做出準(zhǔn)確的判斷。也有人提出了帶參變量的曲線函數(shù),即變形模板。變形模板可以根據(jù)人臉模式的變化自適應(yīng)地調(diào)節(jié)匹配模板,提高了模板的適應(yīng)性和檢測(cè)精度。最近提出了多分辨率模版、多比例模版、子模版等方法來(lái)適應(yīng)比例及形狀的變化。基于模板的方法較為直觀,但是固定模板對(duì)位姿、表情和尺度變化敏感;可變形模板雖然對(duì)非剛性模式具有較好的適應(yīng)性,但是可

26、變形模板的選擇和參數(shù)的確定困難,受人臉各種因素的影響比較大,尤其是在圖像背景比較復(fù)雜的情況下,模板匹配魯棒性差,如果待測(cè)圖像中有多個(gè)人臉的話,要實(shí)現(xiàn)圖像中多個(gè)人臉的檢測(cè)特別困難。(4)基于外觀的方法:這類方法主要依賴于統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)理論,對(duì)應(yīng)于模版匹配的預(yù)先定義模版的方法,通過(guò)從樣本圖像學(xué)習(xí)中獲得“模版”進(jìn)行人臉檢測(cè)。通過(guò)將人臉圖像視為一個(gè)高維向量,從而將人臉檢測(cè)問(wèn)題轉(zhuǎn)化為高維空間中分布信號(hào)的檢測(cè)問(wèn)題。通常,基于外觀的方法依靠統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)技術(shù)找到相應(yīng)的人臉和非人臉圖像的特征。學(xué)習(xí)的特征由分布模型或判別函數(shù)形成,同時(shí),由于計(jì)算效率和檢測(cè)有效性的原因通常需要降維。該類方法主要有,特征臉(

27、Eigenfaces)方法:將KL變換21引入了人臉檢測(cè),在人臉識(shí)別中采用的是主元子空間(特征臉),而人臉檢測(cè)利用是次元子空間(特征臉空間的補(bǔ)空間),用待檢測(cè)區(qū)域在次元子空間上的投影能量,也即待檢測(cè)區(qū)域到特征臉子空間的距離作為檢測(cè)統(tǒng)計(jì)量,距離越小,表明越象人臉。神經(jīng)網(wǎng)絡(luò)方法:人臉檢測(cè)可以看作是只有人臉樣本和非人臉樣本兩個(gè)分類的模式識(shí)別問(wèn)題,通過(guò)對(duì)人臉樣本集和非人臉樣本集進(jìn)行學(xué)習(xí)可以產(chǎn)生分類器。由于人臉模式的多樣性和圖像獲取過(guò)程的不確定性,人臉在圖像空間中分布非常復(fù)雜,建立人臉在高維圖像空間的精確分布模型是一件非常困難是工作。建立一個(gè)統(tǒng)計(jì)可靠的估計(jì)不僅需要大量的正例樣本,而且還需要充分多的有效反

28、例樣本。2.2.2人臉識(shí)別人臉識(shí)別的主要任務(wù)不僅包括從照片和圖像序列中識(shí)別某個(gè)人臉圖像,而且還涉及到對(duì)面孔圖像的分析或合成。主要有以下幾種方法:(1)基于面部特征20的方法:將人臉用一個(gè)幾何特征矢量表示,進(jìn)而用模式識(shí)別中的層次聚類思想設(shè)計(jì)分類器對(duì)人臉進(jìn)行識(shí)別。具體的實(shí)現(xiàn)過(guò)程如下:首先檢測(cè)出面部的明顯特征點(diǎn)(通常為眼睛、鼻子、嘴等部位):然后測(cè)量出這些面部特征點(diǎn)之間的距離,并把這些距離作為幾何特征矢量(眼睛、鼻子、嘴的位置和寬度,眉毛的厚度和彎曲程度等都可以作為我們描述一人臉的幾何特征矢量);最后將待測(cè)圖像和訓(xùn)練好的人臉庫(kù)的幾何特征矢量進(jìn)行比較,就可以判斷是否為人臉,如果是人臉,可以找出與已知人

29、臉庫(kù)的最佳匹配人臉。這種方法存在的問(wèn)題有:檢測(cè)率不高,會(huì)受到很多外界條件的影響,尤其對(duì)強(qiáng)烈的表情變化不敏感,穩(wěn)定性較差,如果背景區(qū)域中存在類人臉區(qū)域,則必然導(dǎo)致誤檢。(2)基于統(tǒng)計(jì)特征臉(PCA)19的方法:該方法是基于KL變換的人臉識(shí)別方法,KL變換是圖像壓縮的一種最優(yōu)正交變換。高維的圖像空間經(jīng)過(guò)KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識(shí)別的特征矢量,這就是特征臉?lè)椒ǖ幕舅枷?。這些方法需要較多的訓(xùn)練樣本,而且完全是基于圖像灰度的統(tǒng)計(jì)特性的。(3)基于模板匹配的方法:靜態(tài)模板匹配直接對(duì)

30、兩幅圖像進(jìn)行比較,其中一幅作為模板,而另一幅是被識(shí)別圖像。通過(guò)計(jì)算得出兩幅圖像的特征值,從而比較兩幅圖像的相似程度。在模板匹配方法當(dāng)中,即可以把整臉當(dāng)作一個(gè)模板,也可以把人臉?lè)殖蓭讉€(gè)相互獨(dú)立的小模板,每個(gè)小模板可包含眼部、嘴部、眼眉、鼻子、額頭、臉頰等部位。彈性模板匹配是根據(jù)待檢測(cè)人臉特征的先驗(yàn)的形狀信息(通常利用小波特征)定義一個(gè)參數(shù)描述的形狀模型,該模型的參數(shù)反映了對(duì)應(yīng)特征形狀的可變部分,如位置、大小、角度等,它們最終通過(guò)模型與圖像的邊緣、峰、谷和灰度分布特性的動(dòng)態(tài)交互適應(yīng)來(lái)得以修正。由于模板變形利用了特征區(qū)域的全局信息,因此可以較好地檢測(cè)出相應(yīng)的特征形狀。(4)基于隱馬爾科夫模型的方法:

31、隱馬爾科夫模型(HMM)是用于描述信號(hào)統(tǒng)計(jì)特性的統(tǒng)計(jì)模型?;谌四槒纳系较隆淖蟮接业慕Y(jié)構(gòu)特征,Samaria等首先采用1-DHMM和2-DPseudoHMM用于人臉識(shí)別。基于I-DHMM,Kohir等采用低頻DCT系數(shù)作為觀察矢量獲得了較好的識(shí)別效果。Eickeler等采用2-DPseudoHMM識(shí)別DCT壓縮的JPEG圖像中的人臉圖像。WORD版本.WORD版本W(wǎng)ORD版本(5)基于神經(jīng)網(wǎng)絡(luò)的方法:人工神經(jīng)網(wǎng)絡(luò)方法同人類神經(jīng)功能一樣具有記憶功能,對(duì)于一個(gè)模式的訓(xùn)練樣本比較豐富時(shí),利用神經(jīng)網(wǎng)絡(luò)人臉檢測(cè)方法可以應(yīng)用到處理比較復(fù)雜的檢測(cè)。神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)

32、函數(shù)、局部紋理的二階矩等。神經(jīng)網(wǎng)絡(luò)方法在人臉識(shí)別上比其他類型的方法有其獨(dú)到的優(yōu)勢(shì),它避免了復(fù)雜的特征提取工作,可以通過(guò)學(xué)習(xí)的過(guò)程獲得其他方法難以實(shí)現(xiàn)的關(guān)于人臉識(shí)別的規(guī)律和規(guī)則的隱性表達(dá)。(6)基于支持向量機(jī)的方法:支持向量機(jī)(SVM)主要解決的是一個(gè)2分類問(wèn)題,它的思想是試圖把一個(gè)低維的線性不可分的問(wèn)題轉(zhuǎn)化成一個(gè)高維的線性可分的問(wèn)題。在解決小樣本、非線性及高維模式識(shí)別問(wèn)題中表現(xiàn)出許多特有的優(yōu)勢(shì)。通常的實(shí)驗(yàn)結(jié)果表明SVM有較好的識(shí)別率,但是它需要大量的訓(xùn)練樣本(每類300個(gè)),這在實(shí)際應(yīng)用中往往是不現(xiàn)實(shí)的。而且支持向量機(jī)訓(xùn)練時(shí)間長(zhǎng),方法實(shí)現(xiàn)復(fù)雜,函數(shù)的取法沒(méi)有統(tǒng)一的理論。2.2.3人臉圖像的預(yù)處

33、理通常情況下,我們?cè)诓杉瘓D像時(shí),由于成像設(shè)備、光照條件、被檢測(cè)的人臉狀態(tài)等諸多因素的影響,另外還有噪聲的存在,使得我們得到的初始圖像效果是很差的,對(duì)特征的提取是不利的。因此,對(duì)初始圖像進(jìn)行相應(yīng)的預(yù)處理是很必要的。人臉圖像預(yù)處理的主要目的是消除與人臉圖像無(wú)關(guān)的信息,濾除干擾、噪聲、恢復(fù)真實(shí)有用的信息,最大程度地增強(qiáng)有關(guān)信息和簡(jiǎn)化數(shù)據(jù),從而給后續(xù)的特征抽取、圖像分割、匹配和識(shí)別創(chuàng)造條件,給系統(tǒng)的穩(wěn)定作保障。本文所研究的圖像預(yù)處理主要包括圖像增強(qiáng)與平滑、圖像分割兩個(gè)方面,具體包括:灰度化、圖像二值化、邊緣檢測(cè)、尺度歸一化和直方圖均衡化等。(1)圖像灰度變換為了使實(shí)驗(yàn)擁有比較好的效果,尤其是更加滿足實(shí)

34、際應(yīng)用的要求,文章對(duì)采集到的圖像,首先要進(jìn)行灰度變化,然后才能方便于后續(xù)的處理,適用于Adaboost人臉檢測(cè)算法?;叶茸儞Q18是圖像增強(qiáng)的一種重要手段,屬于空域處理法。它可以使圖像動(dòng)態(tài)圍加大,使圖像的對(duì)比度擴(kuò)展,圖像更加清晰,特征更加明顯。這些特征都更加有利于人臉特征的提取與識(shí)別?;叶茸儞Q的實(shí)質(zhì)就是按一定的規(guī)則修改圖像的每一個(gè)像素的灰度,從而改變圖像灰度的動(dòng)態(tài)圍,灰度變換按照其變換的方法可以分為:線性、分段線性、非線性以及其他的灰度變換。通常實(shí)驗(yàn)中采集到的人臉圖像是彩色圖像。彩色圖像中的像素點(diǎn)是由R(紅色)、G(綠色)、B(藍(lán)色)三種顏色混合而成的,不同含量的RGB混合組成不同的顏色。而灰度

35、圖像是只含有亮度信息,不含有色彩信息,而且是亮度是連續(xù)變化的,灰度圖像的表示是把圖像的亮度值進(jìn)行量化來(lái)表示的?;叶葓D像通常劃分為0255共256個(gè)級(jí)別,0表示全黑(最暗),255表示全白(最亮)。在人臉識(shí)別中,利用彩色圖像,往往會(huì)受到復(fù)雜背景(尤其是膚色)16的影響,存在很多缺陷;而灰度圖像則比較容易處理,不存在復(fù)雜背景的問(wèn)題,而且很多經(jīng)典的人臉檢測(cè)和識(shí)別的算法都是采用灰度圖像來(lái)進(jìn)行的,像本文會(huì)采用的Adaboost人臉檢測(cè)算法。所以,本文首先對(duì)采集的人臉彩色圖像進(jìn)行灰度化。彩色圖像中像素點(diǎn)RGB分量是不相等的,而灰度像素點(diǎn)的RGB分量是相等的。也就是說(shuō)(0,0,0)是全黑色,而(255,25

36、5,255)是全白色,中間的即為灰色?;叶然褪鞘共噬至肯嗟鹊倪^(guò)程。彩色圖像和灰度圖像間的RGB分量之間的對(duì)應(yīng)關(guān)系為_(kāi)R0.2990.5780.114RG=0.2990.5780.114GBgray0.2990.5780.114Bcolor2.1)也就是說(shuō),根據(jù)這公式,我們可以將一幅彩色圖像變換為灰度圖像。直方圖均衡化直方圖均衡化又稱為灰度均衡化18,是通過(guò)某種灰度映射使輸入圖像轉(zhuǎn)化為在每一灰度級(jí)上都有近似相同像素點(diǎn)數(shù)的輸出圖像,使之演變成一幅具有均勻灰度概率分布的新圖像。在經(jīng)過(guò)均衡化處理的圖像中,像素占有盡可能多的灰度級(jí)并且分布均勻。其結(jié)果是擴(kuò)展了像素取值的動(dòng)態(tài)圍,從而達(dá)到了增強(qiáng)圖像整體對(duì)

37、比度的效果,從而部分地消除光照對(duì)灰度圖像影響。直方圖是一種點(diǎn)操作,它逐點(diǎn)改變圖像的灰度值,盡量使各個(gè)灰度級(jí)別都具有相同數(shù)量的像素點(diǎn),使直方圖趨于平衡。若考慮圖像的灰度圍為b,1且連續(xù)。按照?qǐng)D像的概率密度函數(shù)(PDF,歸一化帶單位面積的直方圖)的定義:P(x)=1/A0*H(x)(2.2)其中H(x)為直方圖,A0為圖像的面積,設(shè)轉(zhuǎn)換前圖像的概率密度函數(shù)為Pr(r),轉(zhuǎn)換后圖像的概率密度函數(shù)為Ps(S),轉(zhuǎn)換函數(shù)為s=f(r),由概率論的知識(shí),我們可以得到:drPs(S)=Pr(r)*-ds(2.3)如果想使轉(zhuǎn)換后圖像的概率密度函數(shù)為1(即直方圖是平的),則必須滿足:dsPr(r)=字(2.4)

38、dr等式兩邊積分得:S二f(r)二JrP(u)du二1/AOrH(u)du(2.5)020該轉(zhuǎn)換式被稱為圖像的累積分布函數(shù)。上面的公式是被歸一化后推導(dǎo)的,對(duì)于沒(méi)有歸一化的情況,只要求以最大的灰度值(Dmax,對(duì)于灰度圖就是255)即可,灰度均衡的轉(zhuǎn)換式為:WORD版本D=f(D)=Dmax/Ao*H(u)duBA(2.6)對(duì)于離散圖像轉(zhuǎn)換式為:D二f(D)二Dma處AO*AHBAii=0式中H為第i級(jí)灰度的像素個(gè)數(shù)。i尺度歸一化處理假設(shè)樣本圖像為F(x,y)MxN,圖像的寬度和高度分別為M和N,大小歸一化后為G(x,y)WxH,實(shí)驗(yàn)中人臉樣本取W=92,H=112;使用反向投影和線性插值從原始

39、圖像得到歸一化后的樣本圖像,則輸入圖像與歸一化后圖像之間的對(duì)應(yīng)關(guān)系有:G(x,y)=F(x/r,y/r)xy2.8)其中r和r分別是x和y方向的尺度變換因子:r=N/H,r=M/W;由于xyxyx/r、y/r的取值一般不為整數(shù),故需要根據(jù)附近已知離散點(diǎn)處的值來(lái)估計(jì)F(x/rx,y/r)xyxy的取值,這里采用線性插值法;對(duì)于給定(x,y),令:x/r=x/r,x/r-xTOC o 1-5 h zxxx0y/r=y/r,y/r-yyyy02.9)G(x,y)=F(xo+心,yo+Ay)=F(xo,兒)3+F(xo+1,yo)d-Z2.10)可以得到公式:+F(x,y+1)Ax(1-A)+F(x+

40、1,y+1)(1-Ax)(1-Ay)ooyoo(4)邊緣檢測(cè)圖像邊緣是圖像最基本的特征,邊緣在圖像分析中起著非常重要的作用。所謂邊緣是指圖像局部特征的不連續(xù)性,比如:灰度級(jí)的突變、顏色的突變和紋理結(jié)構(gòu)的突變等。邊緣廣泛存在于目標(biāo)與目標(biāo)、物體與背景、區(qū)域與區(qū)域(包含不同色彩)中之間,它是圖像分割所依賴的重要特征。本文中主要討論Canny算法,Canny邊緣檢測(cè)算法20是由Canny提出的,是一種多尺度邊緣檢測(cè)算子。它是高斯函數(shù)的一階導(dǎo)數(shù),是對(duì)信噪比與定位之乘積的最優(yōu)化逼近算子。其基本思想是先將圖像使用高斯函數(shù)進(jìn)行平滑,然后計(jì)算平滑后圖像的梯度,梯度最大的位置就是物體的邊緣,然后利用非最大值抑制來(lái)

41、處理梯度圖像,以細(xì)化邊緣,最后再利用滯后算法對(duì)圖像進(jìn)行閾值化處理,以檢測(cè)并連接圖像的邊緣。該算法的主要實(shí)現(xiàn)步驟WORD版本.如下:1)用二維高斯濾波模板進(jìn)行卷積運(yùn)算,以消除噪聲;dx二I(x+1,y)2)利用2x2領(lǐng)域一階偏導(dǎo)的差分來(lái)計(jì)算濾波后的數(shù)據(jù)陣列I(x,y)的梯度幅值大小和方向。其中,x方向和y方向的偏導(dǎo)數(shù)分別為:2.11)2.12)2.13)dy二I(x,y+1)-I(x,y-1)/2則梯度的幅值大小為:D二r根據(jù)Harr特征位置參數(shù)求出各弱分類器閥值參數(shù)記錄當(dāng)前最優(yōu)弱分類器及其迭代權(quán)重T個(gè)強(qiáng)分類器圖2.3Adaboost算法訓(xùn)練示意圖Adaboost算法22訓(xùn)練過(guò)程就是挑選最優(yōu)弱分

42、類器,并賦予權(quán)重的過(guò)程。Adaboost算法訓(xùn)練示意圖如圖2.3所示。基于隱馬爾可夫模型的人臉識(shí)別方法一種人臉識(shí)別方法的效果如何,取決于它在多大程度上利用了圖像的原始信息。我們?cè)诳匆粋€(gè)人的時(shí)候,可以明顯地觀察到他面部的各個(gè)器官和臉龐。無(wú)疑地,我們可以利用一組數(shù)值特征來(lái)描述各個(gè)器官包括臉龐,并且利用這種數(shù)值特征來(lái)對(duì)人臉進(jìn)行識(shí)別。但是模式識(shí)別研究的經(jīng)驗(yàn)表明,簡(jiǎn)單地利用一組數(shù)值特征不能滿意地解決人臉識(shí)別問(wèn)題。另一方面,視覺(jué)識(shí)別人臉的機(jī)制是十分微妙的,人們對(duì)此的認(rèn)識(shí)還非常膚淺。我們理解,人臉應(yīng)當(dāng)作為一個(gè)整體來(lái)描述,不僅僅包括各個(gè)器官的數(shù)值特征,還應(yīng)當(dāng)包括各個(gè)器官的不同表象和相互關(guān)聯(lián)。然而,怎樣描述不同

43、表象和相互關(guān)聯(lián)又成了問(wèn)題。隱馬爾可夫模型(HMM)提供了描述復(fù)雜現(xiàn)象的一種可能機(jī)制。按照這種模型,觀測(cè)到的一列特征(例如描述各個(gè)器官和臉龐的一組數(shù)值特征)被看成是另一組不可觀測(cè)的(因此是隱的)“狀態(tài)”產(chǎn)生出的一列實(shí)現(xiàn)。狀態(tài)既然是不可觀測(cè)的,它的個(gè)數(shù)是未知的,但可以假定。選擇狀態(tài)個(gè)數(shù)的多少必須在模型的復(fù)雜性和描述復(fù)雜現(xiàn)象準(zhǔn)確度之間進(jìn)行折衷。在隱馬爾可夫模型中包含了產(chǎn)生觀測(cè)的兩層概率。一層是選擇狀態(tài)的概率。假定有N個(gè)狀態(tài),從當(dāng)前的狀態(tài)出發(fā)選擇下一個(gè)狀態(tài)也有N個(gè)可能性。于是,狀態(tài)選擇概率必須用一個(gè)NxN的狀態(tài)轉(zhuǎn)移矩陣來(lái)描述。另一層是每個(gè)狀態(tài)產(chǎn)生出一種實(shí)現(xiàn)的概率。如果實(shí)現(xiàn)只在一個(gè)離散集合中取值,產(chǎn)生實(shí)

44、現(xiàn)的概率就可用概率分布來(lái)描述。如果實(shí)現(xiàn)取連續(xù)值,產(chǎn)生實(shí)現(xiàn)的概率就應(yīng)該用概率密度函數(shù)來(lái)描述。一個(gè)合理的或好的隱馬爾可夫模型應(yīng)該是這樣的:給定一組觀測(cè)序列,從關(guān)于狀態(tài)的適當(dāng)?shù)囊唤M初始分布出發(fā),能夠產(chǎn)生出一組實(shí)現(xiàn)序列,它非常好地逼近給定的觀測(cè)序列。利用隱馬爾可夫模型對(duì)人臉進(jìn)行描述和識(shí)別,我們就不是孤立地利用各個(gè)器官的數(shù)值特征,而是把這些特征和一個(gè)狀態(tài)轉(zhuǎn)移模型聯(lián)系起來(lái)。2.4.1隱馬爾可夫模型介紹隱馬爾可夫模型21是一種用參數(shù)表示的,用于描述隨機(jī)過(guò)程統(tǒng)計(jì)特性的概率模型。隱馬爾可夫過(guò)程是一個(gè)雙重的隨機(jī)過(guò)程:一個(gè)潛在的過(guò)程稱為“狀態(tài)”,另一個(gè)可觀測(cè)過(guò)程稱為“觀察序列”,觀察序列是由隱含的狀態(tài)過(guò)程決定的。我

45、們以一階離散馬爾可夫過(guò)程為例,介紹隱馬爾可夫模型的組成。(1)N,隱含狀態(tài)數(shù)。S表示隱含狀態(tài),則S=,S。時(shí)亥“t時(shí),模型的狀12N態(tài)用qt表示,1tT,其中T表示觀察序列的長(zhǎng)度(幀數(shù))。V二V,v,.,v12(3)A2)M,是不同觀察符號(hào)的總數(shù)。如果V是所有的觀察符號(hào)集,則有?!?。約束條件為:M,狀態(tài)轉(zhuǎn)移概率分布或轉(zhuǎn)移矩陣,A二0a1,ija二1其中a二Pq二S|qijijttt+1j=1(4)B,觀察概率矩陣或稱為發(fā)射矩陣B=(),其中1jN,1kM,b(k)=Pjj=v|q=S,其中O是在時(shí)刻t的觀測(cè)符號(hào)。tktjt(5)口初始狀態(tài)分布口=.其中兀=pL=S,1iN。使用簡(jiǎn)iitj寫的記

46、法HMM可表示為下面的三參數(shù)形式九=C,B,口)。對(duì)于離散HMM,觀察是有限符號(hào)集中的一個(gè)離散符號(hào);對(duì)于連續(xù)HMM,觀察只能用一個(gè)概率密度函數(shù)來(lái)刻畫。最常用的概率密度函數(shù)模型是一個(gè)混合高斯概率密度函2.18)bC)=丈CbC)jjmjmm=1上式中的M表示混合高斯概率密度函數(shù)混合的數(shù)目,有別于離散型HMM中的觀察符號(hào)總數(shù)“M”。其中混合系數(shù)滿足:SC=1jmm=12.19)氣C)為第j狀態(tài)第m個(gè)分量的單高斯概率密度函數(shù)。2.4.2HMM的三個(gè)基本問(wèn)題建立一個(gè)HMM模型后,主要存在以及需要解決三個(gè)方面的問(wèn)題:(1)估值問(wèn)題。對(duì)于給定的隱馬爾可夫模型參數(shù)九=C,B,口),求觀察值序列,0,.,0)

47、產(chǎn)生概率的模型相似度pG|九)設(shè)產(chǎn)生0的隱狀態(tài)序列12T,X)則由矩陣A,B的定義有:12TpC|九)=工pC,X=工pCIxl九|=SkbG).a1XX兀bXX11X|九)九)b(0)fT-1XTT2.20)在實(shí)踐中,通常采用向前算法(也稱s-pass算法),其定義如下:)=P6,0,.,0,x=q|九)i12tti(2.21)則有:aC)=兀bG)i=0,1,.,N1oiio(2.22)a(l)=b6Pa(l丄tittijj=0(2.23)其中,t=1,2,.,T1,i=0,1,.,N-1??傻玫剑篜(O|九)二aG)T(2.24)i=0(2)解碼問(wèn)題。對(duì)于給定的隱馬爾可夫模型參數(shù)九=Ca

48、,b,口),和觀察值序列o=G,o),在最佳的意義上確定一個(gè)狀態(tài)序列s=C,q,.,口丁)。12T12T求解最優(yōu)的隱狀態(tài)序列通常使用動(dòng)態(tài)編程的方法。該方法不僅考慮到了局部的最優(yōu)解,而且考慮到了前后兩個(gè)狀態(tài)可達(dá)到的制約關(guān)系,這種基于可達(dá)路徑的最優(yōu)算法中最著名的是ViterbiAlgorithm,它的定義如下:d(1)=兀bG),i二0,1,.,N-10ii02.25)8C)=tmax8tab-1iji2.26)其中,t=1,2,.,T-1,i=0,1,.,N1。路徑跟蹤:argmaxj2.27)輸出最優(yōu)解:=argmaxi(2.28)i),t=T一2,T一1,.,0t-1tt2.29)(3)訓(xùn)練

49、問(wèn)題。對(duì)于給定的一個(gè)觀察值序列0二G,。?,.,0丿,確定一個(gè)隱馬爾可夫模型九二G,B,口),使pG|Q最大。解決這個(gè)問(wèn)題,通常采用向前一向后算法(或稱為Baum-Welch算法),但該算法只是能夠得到一個(gè)近似滿意的結(jié)果。向前向后算法是廣義期望最大化算法的一種具體實(shí)現(xiàn),它的核心是通過(guò)遞歸的方式調(diào)整權(quán)重,已得到更好的模型參。這三個(gè)問(wèn)題是隱馬爾可夫模型中最重要的三個(gè)問(wèn)題,這三個(gè)問(wèn)題的解決方法是把隱馬爾可夫模型應(yīng)用到實(shí)際中去的基礎(chǔ)。2.4.3HMM人臉模型人臉圖像受到不同因素的影響而表現(xiàn)出的不同外觀,這些都可以表示為HMM中的一組狀態(tài)序列產(chǎn)生的一系列實(shí)現(xiàn),可以用模型中的概率矩陣15來(lái)描述,如圖2.4

50、所示。訕獺抽佛鼻子嘴巴卜巴alla22a33a44a55圖2.4人臉的HMM模型F.Samaria的HMM人臉模型采用如下一種思想:由于人臉的空間結(jié)構(gòu)具有穩(wěn)定的共性,如自上到下可以直觀的分割成前額、眼睛、鼻子、嘴巴和下巴五個(gè)部分。即使頭部有一些傾斜或偏轉(zhuǎn),它們自上到下的次序也是保持不變的,我們可以將這五個(gè)顯著地人臉特征區(qū)域成為5種狀態(tài)。由于再求狀態(tài)的初始參數(shù)時(shí),我們也是按這種方法進(jìn)行劃分的。因此,由這5個(gè)狀態(tài)產(chǎn)生的序列是我們真正觀察的序列,而且,這五個(gè)狀態(tài)是抽象的,因而也就不具有具體的意義,我們只能通過(guò)觀察序列來(lái)對(duì)它進(jìn)行估計(jì)。本文中采用的特征抽取方法0如圖2.5所示,人臉圖像的寬度為W、高度為

51、H,我們用寬度為W,高度為L(zhǎng)的采樣窗對(duì)圖像在垂直方向上從上至下進(jìn)行采樣,被分成了五個(gè)WxL圖像區(qū)域部分,連續(xù)的兩個(gè)采樣窗之間存在P行的交疊。采樣數(shù)也就是序列的長(zhǎng)度T可以通過(guò)下式計(jì)算出:T=H_i+1L-p2.30)參數(shù)L和P的選擇在很大程度上影響著識(shí)別率。一般情況下,重疊部分越大,識(shí)別率也越高,因?yàn)檫@樣可以得到更長(zhǎng)的觀察序列。根據(jù)Samaria和Nefian的經(jīng)驗(yàn),在P足夠大的情況下(PimageData,false,true);if(frame)/檢測(cè)并且標(biāo)識(shí)人臉detect_and_draw(frame);charc=cvWaitKey(1);if(c=27)break;/按ESC退出cv

52、NamedWindow(Video,CV_WINDOW_AUTOSIZE);cvShowImage(Video,frame);/創(chuàng)建了一個(gè)名為video的窗口顯示圖像(2)圖像預(yù)處理模塊圖像預(yù)處理4就是對(duì)獲取得來(lái)的圖像進(jìn)行適當(dāng)?shù)奶幚?,使它具有的特征能夠在圖像中明顯的表現(xiàn)出來(lái),本文主要使用OpenCV庫(kù)函數(shù)3對(duì)捕捉到的圖像進(jìn)行了縮放、灰度化、直方圖均衡化等預(yù)處理。下面為使用到的圖像處理函數(shù)代碼:cvCvtColor(img,gray,CV_BGR2GRAY);/把輸入的彩色圖像轉(zhuǎn)化為灰度圖像cvResize(gray,small_img,CV_INTER_LINEAR);/圖像大小變換cvEqu

53、alizeHist(small_img,small_img);/灰度圖象直方圖均衡化(3)人臉檢測(cè)模塊OpenCV的人臉檢測(cè)主要是調(diào)用訓(xùn)練好的cascade(Haar分類器)來(lái)進(jìn)行模式匹配。先使用檢測(cè)圖像中目標(biāo)的函數(shù)cvHaarDetectObjects,將圖像灰度化,根據(jù)傳入?yún)?shù)判斷是否進(jìn)行canny邊緣處理(默認(rèn)不使用),再進(jìn)行匹配。匹配后收集找出的匹配塊,過(guò)濾噪聲,計(jì)算相鄰個(gè)數(shù)如果超過(guò)了規(guī)定值(傳入的min_neighbors)就當(dāng)成輸出結(jié)果,否則刪去。匹配循環(huán):將匹配分類器放大scale(傳入值)倍,同時(shí)原圖縮小scale倍,進(jìn)行匹配,直到匹配分類器的大小大于原圖,則返回匹配結(jié)果。匹配

54、的時(shí)候調(diào)用cvRunHaarClassifierCascade來(lái)進(jìn)行匹配,將所有結(jié)果存入CvSeq*Seq(可動(dòng)態(tài)增長(zhǎng)元素序列),將結(jié)果傳給cvHaarDetectObjects。cvRunHaarClassifierCascade函數(shù)整體是根據(jù)傳入的圖像和cascade來(lái)進(jìn)行匹配。并且可以根據(jù)傳入的cascade類型不同(樹型、stump(不完整的樹)或其他的),進(jìn)行不同的匹配方式。函數(shù)cvRunHaarClassifierCascade用于對(duì)單幅圖片的檢測(cè)。在函數(shù)調(diào)用前首先利用cvSetlmagesForHaarClassifierCascade設(shè)定積分圖和合適的比例系數(shù)(窗口尺寸)。當(dāng)分

55、析的矩形框全部通過(guò)級(jí)聯(lián)分類器每一層的時(shí)返回正值則這是一個(gè)候選目標(biāo),否則返回0或負(fù)值。(4)人臉定位模塊函數(shù)cvHaarDetectObjects使用指針對(duì)某目標(biāo)物體(如人臉)訓(xùn)練的級(jí)聯(lián)分類器在圖象中找到包含目標(biāo)物體13的矩形區(qū)域,據(jù)此我們可以畫出圓形標(biāo)出人臉?biāo)谖恢?2。具體代碼如下:for(i=0;itotal:0);i+)/總共有faces-total個(gè)人臉,把他們?nèi)Τ鰜?lái)CvRect*r=(CvRect*)cvGetSeqElem(faces,i);/返回每個(gè)人臉對(duì)應(yīng)的鏈表節(jié)點(diǎn)CvPointcenter;/圓形標(biāo)出WORD版本.WORD版本W(wǎng)ORD版本intradius;center.x=

56、cvRound(r-x+r-width*0.5)*scale);/圓心橫坐標(biāo),注意scale,這里放大center.y=cvRound(r-y+r-height*0.5)*scale);/圓心縱坐標(biāo)radius=cvRound(r-width+r-height)*0.25*scale);/圓半徑cvCircle(img,center,radius,colorsi%8,3,8,0);/用圓圈出目標(biāo)頭像4.2.2人臉識(shí)別系統(tǒng)設(shè)計(jì)根據(jù)系統(tǒng)需要實(shí)現(xiàn)的功能要求,人臉識(shí)別系統(tǒng)的功能劃分框圖如圖4.2所示。其中訓(xùn)練和識(shí)別部分是程序?qū)崿F(xiàn)的核心部分,下面將分別介紹訓(xùn)練和識(shí)別部分的設(shè)計(jì)過(guò)程。圖4.2人臉識(shí)別系統(tǒng)的

57、功能劃分框圖(1)訓(xùn)練部分的設(shè)計(jì)訓(xùn)練部分是指添加人臉數(shù)據(jù)庫(kù)以后,提取人臉特征,生成每人的EHMM模型的過(guò)程。用戶點(diǎn)擊界面按鈕向程序發(fā)出命令,通過(guò)主消息函數(shù)部分程序,系統(tǒng)調(diào)用相應(yīng)的函數(shù)實(shí)現(xiàn)訓(xùn)練功能。添加人臉圖片到人臉庫(kù)以后,點(diǎn)擊訓(xùn)練按鈕,當(dāng)前人的人臉圖像將被訓(xùn)練,得到該人的EHMM模型。訓(xùn)練函數(shù)部分人臉數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)圖片的讀取然后調(diào)用人臉訓(xùn)練核心函數(shù)進(jìn)行訓(xùn)練,得到EHMM模型數(shù)據(jù),為識(shí)別人臉信息提供依據(jù)。(2)識(shí)別部分的設(shè)計(jì)人臉識(shí)別程序主要完成對(duì)待識(shí)別人臉圖像與人臉庫(kù)中圖像的匹配識(shí)別,在程序的設(shè)計(jì)過(guò)程中,識(shí)別程序與用戶的交互同樣通過(guò)主消息函數(shù)來(lái)完成,我們?cè)贛FC的框架類CMainFrame中添加

58、消息響應(yīng)函數(shù),用戶通過(guò)點(diǎn)擊界面上的功能按鈕啟動(dòng)識(shí)別程序,對(duì)各變量進(jìn)行初始化,調(diào)用識(shí)別核心代碼,并將識(shí)別出來(lái)的人的信息顯示出來(lái)。人臉實(shí)時(shí)跟蹤系統(tǒng)功能的實(shí)現(xiàn)本文所設(shè)計(jì)的人臉檢測(cè)跟蹤系統(tǒng)主要是基于VS2010環(huán)境和OpenCV庫(kù)1實(shí)現(xiàn)的。VS2010與OpenCV庫(kù)簡(jiǎn)介VisualStudio是微軟公司推出的開(kāi)發(fā)環(huán)境。是目前最流行的Windows平臺(tái)應(yīng)用程序開(kāi)發(fā)環(huán)境。我用的是其高級(jí)版(Premium),擁有創(chuàng)建可擴(kuò)展、高質(zhì)量程序的完整工具包,相比專業(yè)版增加了數(shù)據(jù)庫(kù)開(kāi)發(fā)、TeamFoundationServer(TFS)、調(diào)試與診斷、MSDN訂閱、程序生命周期管理(ALM)。OpenCV的全稱是:Op

59、enSoureeComputerVisionLibrary,是由Intel公司發(fā)布的開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù)。它是由一系列C函數(shù)和少量的C+類構(gòu)成的,它易用而高效,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺(jué)方面的多種通用算法。OpenCV主要用于對(duì)圖像進(jìn)行一些高級(jí)處理,比如說(shuō)特征檢測(cè)與跟蹤、運(yùn)動(dòng)分析、目標(biāo)分割與識(shí)別以及3D重建等。在用VisualC+開(kāi)發(fā)的項(xiàng)目中,只要正確安裝OpenCV庫(kù),并在自己開(kāi)發(fā)的應(yīng)用程序中正確設(shè)置和OPenCV的連接,就可以直接調(diào)用它的視頻捕獲和圖像處理函數(shù),使用方便、功能強(qiáng)大,且為開(kāi)放式資源。使用OpenCV對(duì)開(kāi)發(fā)者來(lái)說(shuō)幫助最大的是:由于OpenCV的源代碼完全開(kāi)放,所以程序開(kāi)發(fā)者可以仔細(xì)

60、地閱讀很多關(guān)鍵算法的源代碼來(lái)理解圖像處理中很多算法的原理及整個(gè)實(shí)現(xiàn)過(guò)程,這對(duì)于一個(gè)程序開(kāi)發(fā)者來(lái)說(shuō)是非常重要的。OpenCV的出現(xiàn),給學(xué)習(xí)和開(kāi)發(fā)帶來(lái)了極大的方便。在研究和學(xué)習(xí)上,可以有更多的時(shí)間和精力來(lái)研究算法本身,而不是把大量的時(shí)間和精力花費(fèi)在如何編程實(shí)現(xiàn)這個(gè)算法上,降低了系統(tǒng)實(shí)現(xiàn)難度。OpenCV在圖像處理中有類似于MATLAB的封裝功能,比如對(duì)于圖像二值化操作,只需調(diào)用cvCvtColor(src,dst,CV_RGB2YCrCb)個(gè)函數(shù)。在應(yīng)用開(kāi)發(fā)上,OpenCV為開(kāi)發(fā)數(shù)字圖像處理和計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用程序提供了功能完善、使用方便的接口。OpenCV環(huán)境配置本系統(tǒng)采用VS2010環(huán)境編程

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論