基于移動(dòng)窗口的人臉圖像識(shí)別方法研究本科學(xué)位論文_第1頁(yè)
基于移動(dòng)窗口的人臉圖像識(shí)別方法研究本科學(xué)位論文_第2頁(yè)
基于移動(dòng)窗口的人臉圖像識(shí)別方法研究本科學(xué)位論文_第3頁(yè)
基于移動(dòng)窗口的人臉圖像識(shí)別方法研究本科學(xué)位論文_第4頁(yè)
基于移動(dòng)窗口的人臉圖像識(shí)別方法研究本科學(xué)位論文_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

河北大學(xué)2009屆本科生畢業(yè)論文(設(shè)計(jì))PAGE基于移動(dòng)窗口的人臉圖像識(shí)別方法研究摘要人臉識(shí)別是機(jī)器視覺(jué)和模式識(shí)別領(lǐng)域最富有挑戰(zhàn)性的課題之一,同時(shí)也具有廣泛的應(yīng)用意義。目前在基于正面靜態(tài)人臉檢測(cè)與識(shí)別、人臉特征的提取等方面已取得了一些可喜的成果。但是,在較復(fù)雜的環(huán)境下,諸如對(duì)人臉表情的識(shí)別、光照補(bǔ)償與光照模型的建立、多種檢測(cè)數(shù)據(jù)的融合等方面還缺乏著實(shí)有效的方法。本文介紹了移動(dòng)窗口,移動(dòng)窗口廣泛應(yīng)用于圖像處理、模式識(shí)別和數(shù)字信號(hào)處理中,它具有數(shù)據(jù)量大、計(jì)算密集等特點(diǎn)。移動(dòng)窗口針對(duì)圖像的算法的一般描述是:在規(guī)模為W×H的圖像中,按一定規(guī)律移動(dòng)w×h的窗口(W>>w,H>>h),對(duì)窗口內(nèi)像素點(diǎn)的像素值進(jìn)行一系列運(yùn)算,運(yùn)算結(jié)束后窗口向右或向下移動(dòng)一步,直到完成對(duì)整幅圖像的處理。用移動(dòng)窗口可以使圖像邊界的細(xì)節(jié)保持好,處理速度快,從而提高了人臉圖像識(shí)別的準(zhǔn)確率。關(guān)鍵詞:人臉識(shí)別移動(dòng)窗口人臉特征檢測(cè)

ABSTRACTFacerecognitionisthefieldofmachinevisionandpatternrecognition,oneofthemostchallengingissues,butalsothemeaningofawiderangeofapplications.Basedonthepositivestaticinfacedetectionandrecognition,,facialfeatureextraction,suchastherehasbeensomeencouragingresults.However,inmorecomplexcircumstances,suchasfacialexpressionrecognition,compensationandlightilluminationmodel,theintegrationofavarietyoftestdata,etc.isalsoalackofreallyeffectivemethod.Inthispaper,movingwindowiswidelyusedinimageprocessing,patternrecognitionanddigitalsignalprocessing,ithasalargeamountofdata,computing-intensiveandsoon.Movingwindowfortheimageofthegeneraldescriptionofthealgorithmis:intermsofsizeW×Hfortheimage,accordingtoacertainlawofw×hmovingwindow(W>>w,H>>h),onthewindowofthepixelvalueofpixelsaseriesofoperations,operationsaftertheendofthewindowordownasteptotherightuntilthecompletionofthewholeimageprocessing.Movingwindowcanbeusedtomakethedetailsoftheimagebordertomaintainagood,fastprocessingspeed,resultinginimprovedfacialimagerecognitionaccuracy.Keywords:FacerecognitionMovingWindowFacialfeaturedetection

目錄一引言 11.1人臉圖像識(shí)別的研究背景及意義 11.2人臉圖像識(shí)別研究的狀況和進(jìn)展 11.3研究?jī)?nèi)容 21.4論文組織結(jié)構(gòu) 3二人臉圖像識(shí)別技術(shù)及其常用方法 42.1人臉識(shí)別技術(shù) 42.1.1靜態(tài)人臉檢測(cè) 52.1.2動(dòng)態(tài)人臉檢測(cè) 62.2基于整體特征的提取方法 62.3人臉識(shí)別方法 6三基于移動(dòng)窗口的人臉圖像識(shí)別 103.1基本原理 103.2移動(dòng)窗口分類器方法 103.3位平面分解 103.4基于移動(dòng)窗口的人臉識(shí)別流程 11四基于移動(dòng)窗口的人臉識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 134.1方案設(shè)計(jì) 134.2用戶界面設(shè)計(jì) 134.3模塊設(shè)計(jì) 144.4人臉識(shí)別算法的實(shí)現(xiàn) 144.4.1bmp文件結(jié)構(gòu)介紹 144.4.2圖像預(yù)處理 154.4.3圖像大小標(biāo)準(zhǔn)化 174.4.4預(yù)處理算法 17五實(shí)驗(yàn)結(jié)果及分析 195.1運(yùn)行環(huán)境 195.2人臉圖像樣本庫(kù) 195.3測(cè)試結(jié)果 20六總結(jié) 21謝辭 22謝辭 22參考文獻(xiàn) 23PAGE8一引言1.1人臉圖像識(shí)別的研究背景及意義計(jì)算機(jī)人臉識(shí)別技術(shù)是生物特征識(shí)別技術(shù)的一種。目前進(jìn)行身份鑒別所依賴的生物特征主要有兩類,一類是身體特征,一類是行為特征。人臉識(shí)別與其他的身份識(shí)別方法相比較,它的應(yīng)用過(guò)程是非接觸式的、連續(xù)的和實(shí)時(shí)的,因此更加直接、友好,使用者不會(huì)有心理障礙,并且通過(guò)對(duì)人臉的表情和姿勢(shì)進(jìn)行分析,還能獲得其他很多很難獲得的信息,這些優(yōu)勢(shì)使人臉圖像識(shí)別在這么多生物特征識(shí)別技術(shù)中很受重視。近年來(lái),微電子技術(shù)、計(jì)算機(jī)技術(shù)發(fā)展神速,數(shù)字圖象技術(shù)也因此受到影響,進(jìn)而推動(dòng)了人臉圖像識(shí)別的發(fā)展,使得人臉圖像識(shí)別在技術(shù)上與經(jīng)濟(jì)上有了進(jìn)一步的發(fā)展。人臉圖象識(shí)別技術(shù),前景非常廣闊。據(jù)稱,1992年在美國(guó)身份鑒別產(chǎn)品獲60億美元的收益。在美國(guó)、英國(guó)、日本、以色列、印度等國(guó)的大公司,軍警方正加緊這方面的研究工作,我國(guó)的研究工作也已開(kāi)始。當(dāng)前的人臉識(shí)別技術(shù)主要被應(yīng)用到了以下幾個(gè)方面:1、刑偵破案公安部門(mén)在檔案管理系統(tǒng)中存儲(chǔ)了大量嫌疑犯的照片,如果在某種情況下獲得了某一個(gè)嫌疑犯的照片或者他面部的某些特征,就可以從數(shù)據(jù)庫(kù)中進(jìn)行比對(duì)查找,這就對(duì)刑偵破案工作有了貢獻(xiàn),使破案速度更快準(zhǔn)確性更高。2、證件驗(yàn)證在諸如??冢瑱C(jī)場(chǎng),重要考試的考場(chǎng)等人數(shù)繁多的場(chǎng)合,證件驗(yàn)證就成為檢驗(yàn)人們身份的一種常用手段,而身份證,駕駛證等很多帶有照片的證件使用人臉識(shí)別技術(shù),就可以由機(jī)器完成驗(yàn)證識(shí)別工作。3、視頻監(jiān)控在許多大的公司,公共場(chǎng)所等處都設(shè)有視頻監(jiān)控。當(dāng)有異常情況發(fā)生或有陌生人進(jìn)入時(shí),就要采取實(shí)時(shí)跟蹤,監(jiān)控,識(shí)別和報(bào)警等措施。這些都需要對(duì)采集到的圖像進(jìn)行具體分析。此外,人臉識(shí)別技術(shù)在醫(yī)學(xué),檔案管理,人等方面也有著非常重要的作用。1.2人臉圖像識(shí)別研究的狀況和進(jìn)展國(guó)外關(guān)于人臉識(shí)別的研究已經(jīng)有很多年,近期已經(jīng)有一些人臉識(shí)別算法應(yīng)用于商業(yè)產(chǎn)品中,并且得到了應(yīng)用。我國(guó)有關(guān)于人臉自動(dòng)識(shí)別的研究最早始于二十世紀(jì)80年代,主要的研究單位有清華大學(xué),哈爾濱工業(yè)大學(xué),中科院計(jì)算所,中科院自動(dòng)化所,復(fù)旦大學(xué),北京科技大學(xué)等,并都取得了一定的成果。國(guó)內(nèi)的研究工作主要是集中在三大類方法的研究:基于幾何特征的人臉正面自動(dòng)識(shí)別方法、基于代數(shù)特征的人臉正面自動(dòng)識(shí)別方法和基于連接機(jī)制的人臉正面自動(dòng)識(shí)別方法。周激流實(shí)現(xiàn)了具有反饋機(jī)制的人臉正面識(shí)別系統(tǒng),運(yùn)用積分投影法提取面部特征的關(guān)鍵點(diǎn)并用于識(shí)別,獲得了比較滿意的效果。他同時(shí)也嘗試了一些穩(wěn)定的特征提取方法,他對(duì)人臉側(cè)面剪影識(shí)別做了一定的研究,并實(shí)現(xiàn)了正、側(cè)面互相參照的識(shí)別系統(tǒng)。彭輝、張長(zhǎng)水等對(duì)“特征臉”的方法做了進(jìn)一步的發(fā)展,提出采用類間散布矩陣作為產(chǎn)生矩陣,進(jìn)一步降低了產(chǎn)生矩陣的維數(shù),在保持識(shí)別率的情況下,大大降低了運(yùn)算量。程永清,莊永明等對(duì)同類圖像的平均灰度圖進(jìn)行分解得到特征臉空間,每一幅圖像在特征臉空間上的投影作為其代數(shù)特征,然后利用層次判別進(jìn)行分類。張輝,周洪祥,何振亞采用對(duì)稱主元分析神經(jīng)網(wǎng)絡(luò),用去冗余和權(quán)值正交相結(jié)合的方法對(duì)人臉進(jìn)行特征提取和識(shí)別。該方法所用特征數(shù)據(jù)量小,特征提取運(yùn)算量也較小,比較好地實(shí)現(xiàn)了大量人臉樣本的存儲(chǔ)和人臉的快速識(shí)別。北京科技大學(xué)的王志良教授主要研究人工心理,建立了以數(shù)學(xué)公式為基礎(chǔ)的心理學(xué)模型。國(guó)內(nèi)在此方面的研究發(fā)展很快,也有一些工作已經(jīng)或正在轉(zhuǎn)化為商品軟件,在orl標(biāo)準(zhǔn)人臉庫(kù)的實(shí)驗(yàn)結(jié)果表明,在普通的分類器下分別達(dá)到了95.5%和99.4%的識(shí)別率[1]。盡管人臉識(shí)別技術(shù)有著廣闊的應(yīng)用前景,但是就目前而言,人臉識(shí)別的效果并不很好,歸根結(jié)底,影響人臉識(shí)別效果的原因主要有以下的幾個(gè)方面:1、人臉圖像的獲取過(guò)程中由于光照光強(qiáng)的不確定性而造成了圖片清晰度的差異。2、人臉并非來(lái)自同一個(gè)人,每個(gè)人都有著不同的臉部模式和臉部特征。3、不同的人臉又有著千變?nèi)f化的面部表情。正因?yàn)樵谌四樧R(shí)別的過(guò)程中存在著上述的各種各樣的品種繁多的問(wèn)題,因此在實(shí)際的檢測(cè)過(guò)程和識(shí)別過(guò)程當(dāng)中,如果遇到這些因素中的某兩個(gè)或者更多個(gè)疊加到一起的情況,情況就變得更加復(fù)雜。基于幾何特征的識(shí)別方法,其存在的主要問(wèn)題在于沒(méi)有形成一個(gè)統(tǒng)一的,優(yōu)秀的特征提取標(biāo)準(zhǔn)。在描述人臉的時(shí)候受到表情、光照、姿態(tài)的影響比較大,無(wú)法準(zhǔn)確地描述人臉特征。盡管如此,基于幾何特征的方法在處理人臉表情分析時(shí),仍然是一個(gè)最有效的依據(jù)。同時(shí),目前已經(jīng)提出了很多改進(jìn)的特征提取的算法,使得人臉幾何特征的提取越來(lái)越趨于合理,這里面最具代表性的方法就是結(jié)合人臉信息的特征點(diǎn)提取技術(shù)?;诖鷶?shù)特征的識(shí)別方法是目前在實(shí)際應(yīng)用中使用得最多的一類方法,其主要原因是由于代數(shù)特征矢量即人臉圖像在特征空間的投影結(jié)果對(duì)角度,表情等因素都具有一定的穩(wěn)定性。但對(duì)于光照而言,似乎效果并不太明顯。這種代數(shù)的特征識(shí)別方法,無(wú)法應(yīng)用于人臉的表情識(shí)別。從某種意義上來(lái)說(shuō),人臉識(shí)別的各種方法,實(shí)際上就是在尋找一種人臉的描述方式,但是要找到一種能夠不受各種因素影響的描述方式非常地困難,無(wú)論是最早使用的幾何描述方式以及后來(lái)比較常用的代數(shù)描述方式,都不可避免地存在各種干擾。我們只能是在以后的研究中,逐漸去完善人臉的描述方式,使之更加有效,更加準(zhǔn)確。1.3研究?jī)?nèi)容圖像處理在日常生活和科學(xué)研究各個(gè)方面有廣泛應(yīng)用,其中有一類算法有移動(dòng)窗口的特點(diǎn)。即對(duì)圖片里一個(gè)窗口內(nèi)的像素點(diǎn)進(jìn)行處理,處理結(jié)束后將窗口滑動(dòng)到新的位置,再處理,直到處理完整幅圖像。這類算法有著廣泛的應(yīng)用,比如邊緣檢測(cè)。本文就是介紹了這種移動(dòng)窗口,移動(dòng)窗口廣泛應(yīng)用于圖像處理、模式識(shí)別和數(shù)字信號(hào)處理中,它具有數(shù)據(jù)量大、計(jì)算密集等特點(diǎn)。移動(dòng)窗口針對(duì)圖像的算法的一般描述是:在規(guī)模為W×H的圖像中,按一定規(guī)律移動(dòng)w×h的窗口(W>>w,H>>h),對(duì)窗口內(nèi)像素點(diǎn)的像素值進(jìn)行一系列運(yùn)算,運(yùn)算結(jié)束后窗口向右或向下移動(dòng)一步,直到完成對(duì)整幅圖像的處理。用移動(dòng)窗口可以使圖像邊界的細(xì)節(jié)保持好,處理速度快,從而提高了人臉圖像識(shí)別的準(zhǔn)確度。1.4論文組織結(jié)構(gòu)本文在第一部分介紹了人臉識(shí)別研究的背景,意義,研究現(xiàn)狀和研究?jī)?nèi)容,又在第二部分中提到了人臉圖像識(shí)別研究的狀況、進(jìn)展,此外還有人臉識(shí)別技術(shù)的常用方法,重點(diǎn)在第三部分講解了移動(dòng)窗口人臉圖像識(shí)別的基本原理,第四部分介紹了人臉識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),包括方案設(shè)計(jì),界面設(shè)計(jì),數(shù)據(jù)庫(kù)設(shè)計(jì)和模塊設(shè)計(jì)。最后兩部分對(duì)本文稍做了一個(gè)總結(jié)。

二人臉圖像識(shí)別技術(shù)及其常用方法2.1人臉識(shí)別技術(shù)一個(gè)典型的人臉識(shí)別系統(tǒng)都由圖2-1所示的幾個(gè)部分組成:圖2-1典型的人臉識(shí)別系統(tǒng)下面分別闡述各部分的功能和作用:圖像獲取這一部分主要負(fù)責(zé)獲取圖像,但圖像可以有不同的來(lái)源,比如:圖像可能來(lái)自于攝像機(jī),但圖像也可能來(lái)自于掃描儀等設(shè)備,這樣獲得圖像以后人臉識(shí)別程序就自動(dòng)將這幅獲得的圖片經(jīng)過(guò)預(yù)處理轉(zhuǎn)化為可處理的格式。檢測(cè)定位部分則通過(guò)對(duì)之前輸入的圖像進(jìn)行進(jìn)一步的處理分析,判斷該幅圖像中是否存在人臉,若圖像中確實(shí)存在人臉,那么就針對(duì)于這個(gè)人臉做出準(zhǔn)確的定位。但是由于圖像所處的環(huán)境有所不同,你如說(shuō)是靜態(tài)還是動(dòng)態(tài),是彩色的還是黑白的,光線比較強(qiáng)還是光線比較弱等等。正是因?yàn)檫@些因素的存在所以我們?cè)谔幚頃r(shí)也是有所不同的。由此可見(jiàn)這一階段的工作的重要性,因?yàn)樗苯佑绊懙胶竺鏅z測(cè)的準(zhǔn)確程度,失之毫厘,謬以千里,所以在這一階段應(yīng)該格外的認(rèn)真、謹(jǐn)慎。正規(guī)化部分也可以叫做預(yù)處理部分,即將之前抽取的人臉圖像進(jìn)行調(diào)整,使它們的大小和亮度統(tǒng)一。特征提取部分是在前面正規(guī)化后的人臉圖像中按照某種策略抽取特征,而這部分特征就是用來(lái)進(jìn)行識(shí)別的,將原始的臉空間中的數(shù)據(jù)映射到特征空間。因?yàn)樽钤嫉膱D像數(shù)據(jù)量是非常大的,為了分類識(shí)別能夠有效地進(jìn)行,就要對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征。一般把原始數(shù)據(jù)組成的空間叫測(cè)量空間,把分類識(shí)別賴以進(jìn)行的空間叫特征空間,通過(guò)變換,可把在維數(shù)較高的測(cè)量空間中表示的模式變?yōu)樵诰S數(shù)較低的特征空間中表示的模式。在特征空間中的模式通常也叫做一個(gè)樣本,即特征空間中的一個(gè)點(diǎn)。分類器設(shè)計(jì)部分是在后臺(tái)進(jìn)行的,就是訓(xùn)練過(guò)程,此過(guò)程結(jié)束后將生成可用于分類識(shí)別的分類器。事實(shí)上,模式識(shí)別問(wèn)題可以看成一個(gè)分類問(wèn)題,即把待識(shí)別的對(duì)象歸到某一類中。在人像識(shí)別問(wèn)題中,就是把輸入的不同的人像歸入某個(gè)人這一類。這部分的基本做法是在樣本訓(xùn)練集基礎(chǔ)上確定某個(gè)人這一類。在人像識(shí)別問(wèn)題中就是把輸入的不同的人像歸入某個(gè)人這一類。這部分的基本做法是在樣本訓(xùn)練集基礎(chǔ)上確定某個(gè)判決規(guī)則,使按這種判決規(guī)則對(duì)被識(shí)別對(duì)象進(jìn)行分類所造成的錯(cuò)誤識(shí)別率最小或引起的損失最小。分類決策部分就是利用已設(shè)計(jì)好分類器作分類識(shí)別,給出最后的識(shí)別結(jié)果,并做出相應(yīng)的判斷。基礎(chǔ)圖像處理部分包括一些最基本的圖像操作,為檢測(cè)定位部分和正規(guī)化部分提供必要的服務(wù),比如檢測(cè)定位部分常常需要對(duì)圖像進(jìn)行邊緣提取,二值化等操作;正規(guī)化部分常需要進(jìn)行圖像的灰度歸一等操作[2]。人臉識(shí)別技術(shù)的處理流程圖如圖2-2所示:圖2-2典型的人臉識(shí)別流程圖2.1.1靜態(tài)人臉檢測(cè)基于統(tǒng)計(jì)的人臉檢測(cè)方法:1、基于變換的方法:主要思想是將處于高維的原始數(shù)據(jù)空間轉(zhuǎn)換為低維數(shù)據(jù)空間。其中在人臉識(shí)別中利用主元子空間,人臉檢測(cè)則利用的是次元子空間。用待檢測(cè)區(qū)域在次元子空間上投影,即將待檢測(cè)區(qū)域到變換子空間的距離作為檢測(cè)統(tǒng)計(jì)量,距離越小就越像人臉。2、基于神經(jīng)網(wǎng)絡(luò)的方法:主要思想是把人臉檢測(cè)分為非人臉樣本與人臉樣本進(jìn)行模式分類。通過(guò)對(duì)人臉樣本集和非人臉樣本集進(jìn)行學(xué)習(xí)產(chǎn)生分類器。人工神經(jīng)網(wǎng)絡(luò)是目前國(guó)際上廣泛采用的一種方法,更普遍的是基于BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法在人臉檢測(cè)中的應(yīng)用。3、基于概率模型的方法:有兩種實(shí)現(xiàn)思路,一種基于貝葉斯分類器的方法,一種基于后驗(yàn)概率估計(jì)的方法,通常利用貝葉斯原理將后驗(yàn)概率估計(jì)轉(zhuǎn)化為一個(gè)似然度來(lái)求解;另一種概率模型是隱馬爾可夫模型(HMM),它具有健壯的數(shù)學(xué)結(jié)構(gòu)和時(shí)序模式分類能力,常被應(yīng)用于人臉檢測(cè)和人臉識(shí)別。2.1.2動(dòng)態(tài)人臉檢測(cè)動(dòng)態(tài)人臉檢測(cè)的思路可以歸結(jié)為四類。1、基于彩色信息:利用人臉彩色信息,提取人臉特征中相對(duì)固定不變的顏色信息進(jìn)行人臉檢測(cè)。2、基于運(yùn)動(dòng)信息:充分利用運(yùn)動(dòng)連續(xù)性進(jìn)行圖象在連續(xù)幀間的跟蹤。3、基于人臉局部特征的方法:根據(jù)不同的人臉器官特征信息進(jìn)行跟蹤。4、基于參數(shù)模型或模板:獲取目標(biāo)的先驗(yàn)知識(shí)從而建立低價(jià)參數(shù)模型,對(duì)輸入的每一幀圖象通過(guò)移動(dòng)窗口進(jìn)行模型匹配,實(shí)現(xiàn)人臉跟蹤。2.2基于整體特征的提取方法通常情況下,形狀特征有兩類表示方法,一類是輪廓特征,另一類是區(qū)域特征。圖像的輪廓特征主要針對(duì)物體的外邊界,而圖像的區(qū)域特征則關(guān)系到整個(gè)形狀區(qū)域。幾種典型的形狀特征描述方法:1、邊界特征法通過(guò)對(duì)邊界特征的描述獲取圖像的形狀參數(shù)。其中Hough變換檢測(cè)平行直線方法和邊界方向直方圖方法是經(jīng)典方法。Hough變換是利用圖像全局特性而將邊緣像素連接起來(lái)組成區(qū)域封閉邊界的一種方法,其基本思想是點(diǎn)—線的對(duì)偶性;邊界方向直方圖法首先微分圖像求得圖像邊緣,然后,做出關(guān)于邊緣大小和方向的直方圖,通常的方法是構(gòu)造圖像灰度梯度方向矩陣。2、傅里葉形狀描述符法傅里葉形狀描述符基本思想是用物體邊界的傅里葉變換作為形狀描述,利用區(qū)域邊界的封閉性和周期性,將二維轉(zhuǎn)化為一維。3、幾何參數(shù)法形狀的表達(dá)和匹配采用更為簡(jiǎn)單的區(qū)域特征描述方法,例如采用有關(guān)形狀定量測(cè)度如面積、周長(zhǎng)等的形狀參數(shù)法。在其他一些系統(tǒng)中,便是利用圓度、偏心率、主軸方向和代數(shù)不變矩等幾何參數(shù),進(jìn)行基于形狀特征的圖像檢索。4、形狀不變矩法利用目標(biāo)所占區(qū)域的矩作為形狀描述參數(shù)。5、基于小波和相對(duì)矩的形狀特征提取與匹配該方法先用小波變換模極大值得到多尺度邊緣圖像,然后計(jì)算每一尺度的7個(gè)不變矩,再轉(zhuǎn)化為10個(gè)相對(duì)矩,將所有尺度上的相對(duì)矩作為圖像特征向量,從而統(tǒng)一了區(qū)域和封閉、不封閉結(jié)構(gòu)[3]。2.3人臉識(shí)別方法常用的人臉識(shí)別方法主要有基于幾何特征的方法、基于神經(jīng)網(wǎng)絡(luò)的方法,基于模板匹配的方法,特征臉?lè)椒ǎ[馬爾可夫模型的方法和彈性圖匹配方法。下面一一介紹:第一種是基于幾何特征的方法?;诩咸卣鞯姆椒ㄊ亲钤纭⒆顐鹘y(tǒng)的方法,通常需要和其他算法結(jié)合才能有比較好的效果。這種方法首先將人臉表示成一個(gè)幾何特征矢量,用層次類聚思想設(shè)計(jì)分類器,然后繼續(xù)識(shí)別。根據(jù)不同積分投影產(chǎn)生的波的不同狀態(tài)來(lái)得出人臉中各部分的幾何位置關(guān)系。雖然這種方法易于理解,存儲(chǔ)量小,但它一般只注重人臉各部件的關(guān)系而忽略了局部細(xì)微的特征。在這種方法中通常利用一個(gè)函數(shù)進(jìn)行度量,這個(gè)函數(shù)就是特征矢量之間的距離函數(shù)。S=1-×(|Xj-Rj|/Rj)(2-1)其中,Xj表示待識(shí)別特征矢量第j個(gè)分量,Rj表示樣本庫(kù)中的特征矢量第j個(gè)分量。Wj是加權(quán)系數(shù),有這個(gè)公式計(jì)算的結(jié)果與給定的一個(gè)閾值T相比較,如果所得結(jié)果大于閾值T,就說(shuō)明是同一人。第二種是基于神經(jīng)網(wǎng)絡(luò)的方法?;谏窠?jīng)網(wǎng)絡(luò)的方法是以大量神經(jīng)元為節(jié)點(diǎn),實(shí)現(xiàn)單元之間權(quán)值互聯(lián)的拓?fù)浣Y(jié)構(gòu)。主要有三種結(jié)構(gòu):第一種結(jié)構(gòu)是神經(jīng)網(wǎng)絡(luò)對(duì)所有的已知人臉建立;第二種結(jié)構(gòu)是神經(jīng)網(wǎng)絡(luò)為單獨(dú)個(gè)人建立;第三種結(jié)構(gòu)是對(duì)每?jī)蓚€(gè)人建立神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)方法在一定程度上避免了特征提取過(guò)程的復(fù)雜性。第三種是基于模板匹配的方法?;谀0迤ヅ涞姆椒ㄊ怯脙煞鶊D像進(jìn)行比較,看二者的匹配程度,使用歸一化相關(guān)。雖然這種方法要求目標(biāo)圖像要在相同的取向,光照下,預(yù)處理過(guò)程比較復(fù)雜,但它的識(shí)別效果還是優(yōu)于幾何特征法。第四種方法是特征臉?lè)椒?。特征臉?lè)椒ㄊ且环N最常見(jiàn)的識(shí)別方法,它的實(shí)質(zhì)就是抽取代數(shù)特征,即經(jīng)過(guò)數(shù)字變換得到的特征。PCA方法就是一種常用的方法,實(shí)質(zhì)上就是進(jìn)行KL變換得到一組新的正交基。圖2-3人臉表情識(shí)別流程圖

第五種是隱馬爾可夫模型(HiddenMarkovModel)的方法。這種方法提供了描述復(fù)雜現(xiàn)象的一種可能機(jī)制。是一個(gè)雙重隨機(jī)過(guò)程。節(jié)點(diǎn)表示狀態(tài),有相變表示狀態(tài)之間的轉(zhuǎn)移,一個(gè)狀態(tài)可以具有特征空間中的任意特征,對(duì)同一特征,不同狀態(tài)表現(xiàn)出特征的概率不同。圖2-4隱馬爾可夫模型的識(shí)別方法框圖第六種是彈性圖匹配方法。這是一種基于動(dòng)態(tài)鏈接結(jié)構(gòu)的方法。將圖像間的比較轉(zhuǎn)變?yōu)榫W(wǎng)格之間的比較。對(duì)于網(wǎng)格上的每一點(diǎn)抽取特征信息,形成一組特征矢量。并用這些特征矢量來(lái)代表圖像進(jìn)行匹配。一幅藝術(shù)圖片其特征模板圖完成匹配的彈性圖圖2-5彈性圖匹配方法示意[4]在實(shí)際應(yīng)用當(dāng)中除了上述提到的幾種方法以外,LDA(LinearDiscriminantAnalysis)方法即線性判別分析法也是經(jīng)常用到的。這種方法實(shí)際上是對(duì)離散度進(jìn)行的一種運(yùn)算,就是要找到使類間離散度和類內(nèi)離散度比值最大的那一系列特征。因?yàn)轭愰g離散度可以表示成Ai=(ni-n)(ni-n)T,類內(nèi)離散度可以表示為Aw=(x*ni)(x*ni)T,其中Pi是先驗(yàn)概率,ni是Bi的均值,n是所選的所有樣本的均值。所以A=所求出的向量A就是所求的比值最大時(shí)所對(duì)應(yīng)的向量。

三基于移動(dòng)窗口的人臉圖像識(shí)別3.1基本原理圖像處理在日常生活和科學(xué)研究各個(gè)方面有廣泛應(yīng)用,如條碼識(shí)別、電子警察,人臉檢測(cè)。圖像處理應(yīng)用中有一類算法具有移動(dòng)窗口的特點(diǎn),即對(duì)圖片立一個(gè)窗口內(nèi)的像素點(diǎn)進(jìn)行處理,處理結(jié)束后將移動(dòng)窗口移動(dòng)到新的位置,再處理,直到處理完整幅圖像。移動(dòng)窗口廣泛應(yīng)用于圖像處理、模式識(shí)別和數(shù)字信號(hào)處理中,它具有數(shù)據(jù)量大、計(jì)算密集等特點(diǎn)。移動(dòng)窗口針對(duì)圖像的算法的一般描述是:在規(guī)模為W×H的圖像中,按一定規(guī)律移動(dòng)w×h的窗口(W>>w,H>>h),對(duì)窗口內(nèi)像素點(diǎn)的像素值進(jìn)行一系列運(yùn)算,運(yùn)算結(jié)束后窗口向右或向下移動(dòng)一步,直到完成對(duì)整幅圖像的處理。3.2移動(dòng)窗口分類器方法移動(dòng)窗口分類是一種改進(jìn)的確定的正元組分類。在N元組分類器中,是從同一空間模式選擇多個(gè)不同的N元組。從這個(gè)空間里每個(gè)N元組又可以獲得一個(gè)特征點(diǎn)。對(duì)于分類器而言,這個(gè)空間是分配給色彩特征相仿的類的。因此,在訓(xùn)練過(guò)程中,需要計(jì)算不同的點(diǎn)從獨(dú)立的N元組中出現(xiàn)的次數(shù)。為了確保所有類的可能性是同等的,并且所有計(jì)數(shù)都是正常的,因此,每個(gè)類出現(xiàn)的最大概率還是相同的。在移動(dòng)窗口分類器中,窗口比規(guī)定的圖像小,并且從這個(gè)窗口里,只有圖像的一部分是可見(jiàn)的。N元組是與窗口緊密相連的,并且分配數(shù)量,就相當(dāng)于每個(gè)獨(dú)立的類出現(xiàn)的可能性。然后窗口移動(dòng)并且一個(gè)新的區(qū)域從這個(gè)窗口中被劃分得到。因此,該窗口是從左向右自上而下以單一的像素位移步驟移動(dòng)的,直到整個(gè)圖像被覆蓋,并且進(jìn)行了所有不同窗口的分類。決定性的階段是把所有不同類點(diǎn)連接在一塊,相應(yīng)的,對(duì)這個(gè)圖像做一個(gè)類標(biāo)志代表所有的,可以從中獲得進(jìn)一步的信息。3.3位平面分解每個(gè)典型的N元組所需的內(nèi)存空間大小記為一個(gè)單位,以灰度值和空間大小表示??梢院苊黠@的看到這是很大量的灰度值。有幾項(xiàng)措施可以緩解一下對(duì)空間的巨大要求。其一就是使用稀疏矩陣,但這會(huì)降低處理速度。另一種是降低灰度值,雖然256級(jí)很常見(jiàn),但是選擇一個(gè)合適的閾值仍然可以對(duì)圖像進(jìn)行識(shí)別。但是,過(guò)多的減少,可對(duì)信息造成重大損失,這往往會(huì)帶來(lái)不利的影響。位平面分解雖然只介紹了Schwarz的數(shù)據(jù)壓縮手段,但還可以用來(lái)處理N元組所面臨的內(nèi)存空間問(wèn)題。其基本思想是將圖像分解進(jìn)行二值化,這樣也不會(huì)丟失任何載于原始圖像的信息。對(duì)灰度圖像在進(jìn)行二值化,因此不同的灰度圖像就會(huì)由不同的二進(jìn)制代碼表示。因此收集所有二進(jìn)制編碼代表的灰度圖像。3.4基于移動(dòng)窗口的人臉識(shí)別流程基于移動(dòng)窗口的人臉圖像識(shí)別的流程圖如圖3-1所示:圖3-1基于移動(dòng)窗口的人臉圖像識(shí)別的流程圖通過(guò)上圖可知基于移動(dòng)窗口的人臉圖像識(shí)別流程:?jiǎn)?dòng)機(jī)器進(jìn)入人臉識(shí)別系統(tǒng)界面,從文件菜單中打開(kāi)要識(shí)別的圖片,接著將圖片變成灰色,實(shí)現(xiàn)圖片對(duì)比度增強(qiáng),二值化等一系列預(yù)處理,將處理好的人臉圖片進(jìn)行定位,標(biāo)出眼睛、鼻尖和嘴。接著對(duì)完成上述操作的圖片進(jìn)行特征提取,然后點(diǎn)擊“識(shí)別”,顯示結(jié)果,之后退出?;谝苿?dòng)窗口的人臉識(shí)別的過(guò)程可以簡(jiǎn)單描述為:第一步:將待識(shí)別的人臉部的圖像和平均臉的圖像比較,然后將平均臉的圖像減去,這樣就可以得到了一個(gè)差值向量,記為A,并將這個(gè)向量再繼續(xù)進(jìn)行兩次投影變換,并從中得出效果最好的分類特征。第二步:將等待識(shí)別的人臉區(qū)分別與樣本庫(kù)中的人臉比較,找到最相近的,計(jì)算出最小的歐幾里德距離。歐幾里德距離即各維內(nèi)積之和的開(kāi)方,簡(jiǎn)而言之就是兩點(diǎn)之間的直線距離。第三步:首先判斷是否為人臉,這是由分類規(guī)則決定的,如果是人臉并且是數(shù)據(jù)庫(kù)中的人臉,則進(jìn)一步判斷屬于哪一類。

四基于移動(dòng)窗口的人臉識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)4.1方案設(shè)計(jì)系統(tǒng)總體包含的兩個(gè)步驟如圖4-1所示:步驟一:檢測(cè)步驟二:識(shí)別圖4-1人臉圖像識(shí)別系統(tǒng)包含的兩個(gè)步驟4.2用戶界面設(shè)計(jì)用戶界面包括了所有的模塊,如圖4-2所示:圖4-2人臉識(shí)別系統(tǒng)界面4.3模塊設(shè)計(jì)基于移動(dòng)窗口的人臉識(shí)別硬件系統(tǒng)主要包括四個(gè)模塊:圖像采集模塊、圖像處理模塊、算法識(shí)別模塊和數(shù)據(jù)輸出模塊。其中圖像處理模塊中又包括光線補(bǔ)償,灰度變換,對(duì)比度增強(qiáng),二值化等子模塊。對(duì)圖像進(jìn)行灰度變換的過(guò)程實(shí)際上就是把彩色的圖像轉(zhuǎn)化成黑白的。因?yàn)楫?dāng)圖像變成黑白色,臉部的信息就能更明顯的表示出來(lái)。4.4人臉識(shí)別算法的實(shí)現(xiàn)4.4.1bmp文件結(jié)構(gòu)介紹1、顏色表顏色表是用來(lái)說(shuō)明位圖中的顏色的,它包含有很多個(gè)表項(xiàng),每一個(gè)表項(xiàng)是一個(gè)RGBQUAD類型的結(jié)構(gòu),定義一種顏色。RGBQUAD結(jié)構(gòu)的定義如下:typedefstructtagRGBQUAD{BYTErgbBlue;//藍(lán)色的亮度(值范圍為0-255)BYTErgbGreen;//綠色的亮度(值范圍為0-255)BYTErgbRed;//紅色的亮度(值范圍為0-255)BYTErgbReserved;//保留,必須為0}RGBQUAD;顏色表中RGBQUAD結(jié)構(gòu)數(shù)據(jù)的個(gè)數(shù)有biBitCount來(lái)確定:當(dāng)biBitCount=1,4,8時(shí),分別有2,16,256個(gè)表項(xiàng);當(dāng)biBitCount=24時(shí),沒(méi)有顏色表項(xiàng)。位圖信息頭和顏色表組成位圖信息,BITMAPINFO結(jié)構(gòu)定義如下:typedefstructtagBITMAPINFO{BITMAPINFOHEADERbmiHeader;//位圖信息頭RGBQUADbmiColors[1];//顏色表}BITMAPINFO;2、位圖數(shù)據(jù)位圖數(shù)據(jù)記錄了位圖的每一個(gè)像素值,記錄順序是從左到右,掃描行是從下到上。位圖的一個(gè)像素值所占的字節(jié)數(shù):當(dāng)biBitCount=1時(shí),8個(gè)像素占1個(gè)字節(jié);當(dāng)biBitCount=4時(shí),2個(gè)像素占1個(gè)字節(jié);當(dāng)biBitCount=8時(shí),1個(gè)像素占1個(gè)字節(jié);當(dāng)biBitCount=24時(shí),1個(gè)像素占3個(gè)字節(jié);Windows規(guī)定一個(gè)掃描行所占的字節(jié)數(shù)必須是4的倍數(shù)即以long為單位,不足的以0填充,一個(gè)掃描行所占的字節(jié)數(shù)計(jì)算方法:DataSizePerLine=(biWidth*biBitCount+31)/8;//一個(gè)掃描行所占的字節(jié)數(shù)DataSizePerLine=DataSizePerLine/4*4;字節(jié)數(shù)必須是4的倍數(shù)位圖數(shù)據(jù)的大小(不壓縮情況下):DataSize=DataSizePerLine*biHeight[5];4.4.2圖像預(yù)處理//對(duì)圖像進(jìn)行灰度化處理classGrayMatrix{publicstaticvoidgray(Stringsource,Stringresult){try{BufferedImagesrc=ImageIO.read(newFile(source));intwidth=src.getWidth();intheight=src.getHeight();ColorSpacecs=ColorSpace.getInstance(ColorSpace.CS_GRAY);ColorConvertOpop=newColorConvertOp(cs,null);src=op.filter(src,null);getPixArray(src,width,height);ImageIO.write(src,"JPEG",newFile(result));}catch(IOExceptione){e.printStackTrace();}}privatestaticvoidgetPixArray(Imageim,intw,inth){int[]pix=newint[w*h];int[]matrix=newint[w*h];PixelGrabberpg=null;try{pg=newPixelGrabber(im,0,0,w,h,pix,0,w);if(pg.grabPixels()!=true)try{thrownewjava.awt.AWTException("pgerror"+pg.status());}catch(Exceptioneq){eq.printStackTrace();}}catch(Exceptionex){ex.printStackTrace();}GetImageRGB(pix,matrix,h,w);//returnpix;}publicstaticvoidGetImageRGB(int[]ImageSource,int[]ImageDestination,intImageHeight,intImageWidth){ColorModelcolorModel=ColorModel.getRGBdefault();inti,j,k,r,g,b;for(i=0;i<ImageHeight;i++){for(j=0;j<ImageWidth;j++){k=i*ImageHeight+j;r=colorModel.getRed(ImageSource[k]);//g=colorModel.getGreen(ImageSource[k]);//b=colorModel.getBlue(ImageSource[k]);//將R、G值左移,并保存RGB值//ImageDestination[k]=0xFF000000|((r<<16)|(g<<8)|b);ImageDestination[k]=r;}}for(inti1=0;i1<ImageDestination.length;i1++){if(i1%ImageHeight==0)System.out.print("\n");elseSystem.out.print(ImageDestination[i1]+"");}//如果要將彩色圖像轉(zhuǎn)換為灰度圖像,則先使用如下灰度變換公式://intgray=r*0.3+g*0.59+b*0.11;//然后,令r=g=b=gray即可。//讀取黑白圖像灰度值//黑白圖像灰度值的讀取比較簡(jiǎn)單,只需讀取R分量的值://intgray=getRed(intpixel)[6];/***//***@paramargs*/}4.4.3圖像大小標(biāo)準(zhǔn)化由于我們接收到的圖像一般大小不等,尤其是有的人臉照的大,有的人臉照得,這就需要對(duì)人臉的圖像大小進(jìn)行標(biāo)準(zhǔn)化,因此需要對(duì)圖像進(jìn)行放大或者縮小的變換。而在圖像縮放變換中,普遍使用的方法是雙線性插值算法來(lái)進(jìn)行圖像的旋轉(zhuǎn)或者縮放變換[7]。4.4.4預(yù)處理算法人臉識(shí)別過(guò)程當(dāng)中非常重要的一個(gè)環(huán)節(jié)就是預(yù)處理。首先要做的就是輸入圖像。但是通常由于圖像獲取時(shí)所處的環(huán)境不同,比如說(shuō)光照有明有暗,而且設(shè)備性能也有優(yōu)劣之分,另外還存在有噪聲,對(duì)比度等等一系列的因素。加之距離的遠(yuǎn)近,焦距的大小不等等因素又使得人的臉部在整幅圖像中的大小和位置不確定。所以為了獲得大小、位置和質(zhì)量都適中的圖像,就必須對(duì)圖像進(jìn)行預(yù)處理[8]。人臉圖像的預(yù)處理主要包括人臉?lè)稣四槇D像的增強(qiáng),以及歸一化等工作。人臉?lè)稣菫榱说玫饺四樜恢枚苏娜四槇D像;圖像增強(qiáng)是為了改善人臉圖像的質(zhì)量,不僅在視覺(jué)上更加清晰圖像,而且使圖像更利于計(jì)算機(jī)的處理與識(shí)別。歸一化工作的目標(biāo)是取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像。下面簡(jiǎn)單介紹一些預(yù)處理的方法。1、直方圖均衡:直方圖是一種點(diǎn)操作,它逐點(diǎn)改變圖像的灰度值,盡量使各個(gè)灰度級(jí)別都具有相同的數(shù)量的像素點(diǎn),使直方圖趨于平衡。直方圖均衡可以使輸入圖像轉(zhuǎn)換為在每一個(gè)灰度級(jí)上都有相同像素點(diǎn)數(shù)的輸出圖像(即輸出的直方圖是平的)。這對(duì)于圖像比較或分割是十分有用的。設(shè)圖像有N個(gè)灰度級(jí),M個(gè)像素點(diǎn),ha(n)是輸入圖像a(x,y)的直方圖,圖像b(x,y)是輸入圖像直方圖均衡后的輸出2、中值濾波:無(wú)論是直接獲取的灰度圖像,還是由彩色圖像轉(zhuǎn)換得到的灰度圖像,里面都有噪聲的存在,噪聲對(duì)圖像質(zhì)量有很大的影響。進(jìn)行中值濾波不僅可以去除孤點(diǎn)噪聲,而且可以保持圖像的邊緣特性,不會(huì)使圖像產(chǎn)生顯著的模糊,比較適合于實(shí)驗(yàn)中的人臉圖像。中值濾波是一種非線性的信號(hào)處理方法,因此中值濾波器也就是一種非線性的濾波器[9]。中值濾波器最先被應(yīng)用于一維信號(hào)的處理中,后來(lái)被人們引用到二維圖像的處理中來(lái)。中值濾波可以在一定程度上克服線性濾波所帶來(lái)的圖像細(xì)節(jié)模糊,而且它對(duì)濾除脈沖干擾和圖像掃描噪聲非常有效。中值濾波一般采用一個(gè)含有若干個(gè)點(diǎn)的滑動(dòng)窗口,將窗口中各點(diǎn)灰度值的中值來(lái)代替指定點(diǎn)(一般是窗口的中心點(diǎn))的灰度值。如果窗口中有奇數(shù)個(gè)元素,中值取元素按灰度值大小排序后的中間元素灰度值。如果窗口中有偶數(shù)個(gè)元素,中值取元素按灰度值大小排序后,中間兩個(gè)元素灰度的平均值。因?yàn)閳D像為二維信號(hào),中值濾波的窗口形狀和尺寸對(duì)濾波器效果影響很大,不同圖像內(nèi)容和不同應(yīng)用要求往往選用不同的窗口形狀和尺寸。3、歸一化:人臉圖像的歸一化,目的是使不同成像條件(光照強(qiáng)度,方向,距離,姿勢(shì)等)下拍攝的同一個(gè)人的照片具有一致性。人臉歸一化包括兩個(gè)方面的內(nèi)容:一是幾何歸一化,二是灰度歸一化。幾何歸一化也稱為位置校準(zhǔn),它將有助于矯正因成像距離和人臉姿勢(shì)變化造成的尺寸差異和角度傾斜。它的目的在于解決人臉尺度變化和人臉旋轉(zhuǎn)問(wèn)題。具體包括人臉尺度歸一化,平面人臉旋轉(zhuǎn)矯正(歪頭),深度人臉旋轉(zhuǎn)矯正(扭臉)三個(gè)環(huán)節(jié)。嚴(yán)格的深度人臉旋轉(zhuǎn)矯正需要利用人臉的3D模型?;叶葰w一化

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論