人眼識(shí)別系統(tǒng)_第1頁(yè)
人眼識(shí)別系統(tǒng)_第2頁(yè)
人眼識(shí)別系統(tǒng)_第3頁(yè)
人眼識(shí)別系統(tǒng)_第4頁(yè)
人眼識(shí)別系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人眼識(shí)別系統(tǒng)摘要眼睛是人們獲取外界信息最主要的途徑,同時(shí)眼睛在一定程度上反映了包括個(gè)人心理意識(shí)在內(nèi)的豐富信息。現(xiàn)在,眼睛所包含的這些有價(jià)值的信息引起越來越多人的研究,人眼檢測(cè)的成果在現(xiàn)實(shí)生活中也得到廣泛應(yīng)用。如何快速準(zhǔn)確地定位眼睛是研究者關(guān)注的重點(diǎn)。由于在自然條件下獲得的圖像不可避免含有的噪聲,再加上光線、遮蓋物、拍攝角度等,這些為人眼檢測(cè)增大了難度。目前,人們已經(jīng)提出了多種人眼檢測(cè)的方法,例如對(duì)稱變換法、霍夫變換法、特殊光源法、基于統(tǒng)計(jì)的方法、灰度投影法和基于模板的方法等,但是每個(gè)算法在具有自己優(yōu)點(diǎn)同時(shí)又都有一定的局限性。在人臉定位的基礎(chǔ)上,本文使用模版匹配方法,利用模版和測(cè)試圖像的相關(guān)性,判斷測(cè)試圖像中人眼的位置。為了驗(yàn)證算法的可靠性,本文才用多種圖像數(shù)據(jù)庫(kù)進(jìn)行測(cè)試,測(cè)試結(jié)果表明,本文算法對(duì)上述數(shù)據(jù)庫(kù)中的人眼均能夠?qū)崿F(xiàn)定位,且效果良好本文采用MATLAB語言進(jìn)行仿真,實(shí)驗(yàn)結(jié)果達(dá)到了預(yù)定目標(biāo),證明了所研究算法的有效性。關(guān)鍵詞:人眼,定位,模式識(shí)別HumanEyeRecognitionSystemAbstractTheeyesarethemainpaththatmostpeoplegetinformationfromoutside,meanwhiletherichinformationincludingthepersonalmentalconsciousnesstoacertainextentbereflectedbyeyes.Now,thesevaluableinformationcausemorepeople'sresearch,andtheeyedetectionresultsarealsousedwidelyinreallife.Howtolocateeyesfastandaccuratlyandextractcharacteristicsoftheeyesdiscriptionisthefocusoftheresearchers.Fortheimagethatobtainedundernaturalconditionscontainnoiseinevitably,andtheinfluenceofthelight,shelter,shootingangle,alldecreasethedifficultyofeyesdetection.Atthepresenttime,Peoplehaveputforwardavarietyoftheeyedetectionmethods,suchassymmetrytransformmethod,Houghtransformmethod,speciallightsourcemethod,methodbasedonstatistic,grayscaleprojectionmethodandthemethodbasedontemplateandsoon. Onthebasisofresearchonhumaneyerecognition,wepresentedtemplatematchingmethodtorecognizeandlocatehumaneyesbycalculatingcorrelationindexbetweentemplateandtestimages. Inordertoverifythereliabilityofalgorithm,thispaperusingavarietyofimagedatabasefortesting,testresultsshowthatthisalgorithmtothedatabaseareabletorealizelocalizationofhumaneyes,andtheeffectisgood.ThispaperadoptMATLABlanguagetosimulate,experimentalresultachieved.intendedtarget,theeffectivenessofarithmeticinvestigatingwastobeproved.KeyWords:Humaneye,Recognition,PatternRecognition. 目錄一緒論 一緒論眼睛是生物體上十分神奇的器官,他可以感知光線,是人們獲得外界信息最主要的途徑;同時(shí),眼睛包括含心理意識(shí)在內(nèi)的豐富信息。人眼識(shí)別技術(shù)最初是隨著上世紀(jì)六七十年代的模式識(shí)別技術(shù)發(fā)展起來的。如今,人眼識(shí)別已經(jīng)成為計(jì)算機(jī)視覺領(lǐng)域和模式識(shí)別領(lǐng)域的研究熱點(diǎn)。1.1選題目的和意義眼睛所蘊(yùn)含的豐富信息得到了國(guó)內(nèi)外研究者的高度重視和密切關(guān)注,人眼識(shí)別具有廣闊的應(yīng)用前景。人眼識(shí)別的重要應(yīng)用領(lǐng)域之一是身份識(shí)別。所謂生物識(shí)別技術(shù)就是將計(jì)算機(jī)與光學(xué)、聲學(xué)、生物傳感器和生物統(tǒng)計(jì)學(xué)原理等高科技手段密切結(jié)合,利用人體固有的生理特性和行為特征進(jìn)行個(gè)人身份的鑒定,常見的有指紋識(shí)別、掌紋識(shí)別、虹膜識(shí)別、聲音識(shí)別等。但是伴隨科技的發(fā)展,傳統(tǒng)的生物測(cè)定系統(tǒng)經(jīng)常會(huì)被蒙騙,人們通過高精度的復(fù)制(例如指紋或者視網(wǎng)膜)就能成功蒙混過關(guān)。經(jīng)研究,每個(gè)人的眼球運(yùn)動(dòng)方式都具有獨(dú)特的個(gè)人性質(zhì),可以利用它研究出一種難以造假、簡(jiǎn)單的身份鑒別系統(tǒng)。當(dāng)人們觀察計(jì)算機(jī)屏幕上移動(dòng)的圖像時(shí),這種新系統(tǒng)可以跟蹤觀察者眼球的運(yùn)動(dòng)。雖然圖像每次移動(dòng)的方式不同,但是觀察者的眼球運(yùn)動(dòng)包含了“運(yùn)動(dòng)特征”。它可以顯示出運(yùn)動(dòng)軌跡的輕微差異,這種差異是這個(gè)人獨(dú)有的特點(diǎn),從而能夠鑒別這個(gè)人的身份。 人眼識(shí)別還可以應(yīng)用于檢測(cè)駕駛員是否安全駕車。據(jù)我國(guó)公安部提供的一份資料顯示,在2002年一月到2002年十一月這十個(gè)月中,全國(guó)共發(fā)生二十七起重大道路交通事故。其中十九起交通事故的誘發(fā)原因是駕駛員的疲勞駕駛。駕駛員大約90%的信息是通過“看”得到的,駕駛員如果疲勞,他的精神狀態(tài)不好、注意力就會(huì)不集中、應(yīng)變能力不強(qiáng),容易引發(fā)交通事故。由于交通事故往往是司機(jī)駕駛疲勞一段時(shí)間后發(fā)生,中外研究人員一直在尋找一種恰當(dāng)?shù)臋z測(cè)駕駛員在駕車過程中疲勞情況的方法。這種方法通過軟硬件的配合,實(shí)時(shí)采集駕駛員駕駛過程中的數(shù)據(jù)。它采用某一特征量作為衡量駕駛員精神狀態(tài)的指標(biāo),如果駕駛員疲勞系數(shù)高于設(shè)定的閾值,系統(tǒng)就采取包括強(qiáng)行停車在內(nèi)的措施以提高駕車安全系數(shù)。在研究由疲勞引發(fā)的交通事故時(shí),人們發(fā)現(xiàn)駕駛員由于疲勞,其生理行為在事故發(fā)生前就有了變化,研究者們依此已提出了一些具有實(shí)際意義的方法,其中由美國(guó)公路交通安全管理局(NHTSA)和聯(lián)邦公路管理局(FHWA)推薦的、依據(jù)眼睛閉合時(shí)間占某特定時(shí)間的百分率判斷司機(jī)駕駛疲勞程度的方法得到大家的普遍認(rèn)可。在人機(jī)交互領(lǐng)域,通過眼睛運(yùn)動(dòng)進(jìn)行人機(jī)交互成為研究的新熱點(diǎn)。我們可以用眨眼作為鼠標(biāo)的單擊與雙擊的響應(yīng)動(dòng)作,用視線方向的變化模仿鼠標(biāo)的運(yùn)動(dòng),也就是通過檢測(cè)眼球的運(yùn)動(dòng),人可以實(shí)現(xiàn)對(duì)計(jì)算機(jī)的控制;而且我們也可以進(jìn)一步分析瞳孔的描述數(shù)據(jù),得出人的注視點(diǎn),這樣做還可以使計(jì)算機(jī)了解到使用者所關(guān)注的信息,對(duì)使用者關(guān)注的目標(biāo)進(jìn)行特寫,更智能地表現(xiàn)使用者喜好的目標(biāo)。索尼計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室與東京大學(xué)合作開發(fā)的“眼球跟蹤”眼鏡便是這類產(chǎn)品的有益嘗試。由此推廣,人眼也作為心理測(cè)試的重要參考依據(jù)被廣泛使用,測(cè)謊儀并不是通過分析被試者所說語言的邏輯關(guān)系來判斷被試者說的是真話還是假話,而是要檢測(cè)一個(gè)人說話時(shí)的心理反應(yīng)所引起的生理指標(biāo)的變化。因此“測(cè)謊”可以說是一種“心理測(cè)試”。測(cè)謊一般是從脈搏、呼吸和皮膚電阻三個(gè)方面測(cè)定一個(gè)人的生理變化,其中,皮膚電阻最敏感,是測(cè)謊的主要根據(jù),通常情況下就是它揭示了被試者心里的秘密。我國(guó)已有不少城市把測(cè)謊儀引入到公安、司法界。2011年美國(guó)猶他州大學(xué)的科學(xué)家研發(fā)出一款新型的眼球測(cè)謊儀,通過追蹤眼球運(yùn)動(dòng)來判斷被測(cè)試人有沒有說謊。研究人員表示,撒謊比講真話要?jiǎng)谏褓M(fèi)力。如果受試者想說謊,他眼球的瞳孔可能會(huì)放大,而且人的主觀意識(shí)無法控制它的大小變化。因此,可以通過檢測(cè)人說話時(shí)眼球瞳孔大小的變化,判斷此人是否說謊。從身份識(shí)別到輔助駕駛,從人機(jī)交互到心理測(cè)試,人眼識(shí)別的成果正逐漸從實(shí)驗(yàn)室不如人民的正常生活,具有十分突出的應(yīng)用價(jià)值,因此,研究人眼具有非常大的意義。1.2眼睛識(shí)別的應(yīng)用背景與發(fā)展現(xiàn)狀計(jì)算機(jī)視覺是21世紀(jì)里面一個(gè)富有挑戰(zhàn)的領(lǐng)域,它在軍事,制造業(yè),檢驗(yàn),文檔分析,醫(yī)療診斷,交通安全等很多領(lǐng)域都是不可或缺的一部分,同時(shí)隨著計(jì)算機(jī)性能的不斷提高和電子產(chǎn)品的的普及,越來越多的研究人員致力于計(jì)算機(jī)視覺領(lǐng)域的探索和研究;近年來人機(jī)交互以及計(jì)算機(jī)視覺的研究領(lǐng)域中,眼睛是一種重要的信息,眼睛區(qū)域包含了豐富的信息,包括表情、身份、性別等多種信息,眼睛檢測(cè)受到了廣泛的關(guān)注,眼睛的定位可以作為定位人臉圖像的位置、大小和角度的依據(jù),也是視線跟蹤、眼睛狀態(tài)分析以及虹膜識(shí)別的首要工作。發(fā)展接近甚至超越人類視覺的感知系統(tǒng)是計(jì)算機(jī)視覺主要的挑戰(zhàn)。目前的主要研究方法是把圖像信號(hào)進(jìn)行分析,建模,幾何處理并做出決策。眾多科學(xué)家對(duì)眼睛檢測(cè)進(jìn)行了深入的研究,隨著科學(xué)技術(shù)的發(fā)展,眼睛檢測(cè)在人臉分析、疲勞駕駛、人機(jī)交互等方面的作用越來越突出,研究眼睛的檢測(cè)有著十分突出的應(yīng)用價(jià)值。眼睛作為人臉的重要特征,在人臉檢測(cè)和識(shí)別中發(fā)揮著重要作用。眼睛的定位也是視線跟蹤、眼睛狀態(tài)分析以及虹膜識(shí)別的首要工作。同時(shí),眨眼的判定可以設(shè)計(jì)成某些用戶接口,或者應(yīng)用在疲勞檢測(cè),動(dòng)畫合成等領(lǐng)域。許多學(xué)者對(duì)人眼的跟蹤和狀態(tài)識(shí)別進(jìn)行了探索,這個(gè)方向也是近來機(jī)器視覺的研究熱點(diǎn)之一。一方面來自商業(yè)或政府的應(yīng)用需要,另一方面也是長(zhǎng)期相關(guān)技術(shù)的積累加上硬件技術(shù)的成熟,使得很多原來不能實(shí)現(xiàn)的技術(shù)得以大量推廣,很多這方面的課題己經(jīng)達(dá)到了一定的高度。隨著計(jì)算機(jī)技術(shù)的進(jìn)步,以及越來越多的人投入到這個(gè)領(lǐng)域的研究,這方面的研究必將得到一步的發(fā)展。眼睛檢測(cè)算法的研究從很早就開始了,已經(jīng)有了比較成形的想法,但是在算法的普遍性上還存在著不足需要進(jìn)一步研究。視線跟蹤雖然剛剛起步,但是由于它的應(yīng)用前景很有吸引力,也有很多人開始在眼睛檢測(cè)的基礎(chǔ)上進(jìn)一步的研究視線跟蹤,并且取得了一定的成果,在研究者的共同努力下,正朝著更好的方向發(fā)展。到目前為止,人們已經(jīng)提出了很多有效的人眼檢測(cè)方法,包括對(duì)稱變換法、霍夫變換法、特殊光源法、基于統(tǒng)計(jì)的方法、基于模板的方法和灰度投影法。杜干等在2005年提出將主分量分析的對(duì)稱軸檢測(cè)引入到眼睛定位中??梢詸z測(cè)二維圖形的鏡像對(duì)稱軸方向,結(jié)合人臉重心確定人臉對(duì)稱軸的位置;最后應(yīng)用山谷法確定人眼位置。實(shí)驗(yàn)表明,在人臉傾斜時(shí)該方法也能取得良好的效果。高永萍等在2007年提出基于幾何特征的人眼精確定位新方法。利用人臉對(duì)稱特性,結(jié)合膚色匹配和線性變換定位人臉對(duì)稱軸,實(shí)現(xiàn)人眼精確定位。張志剛等在2008年提出利用改進(jìn)的對(duì)稱變換進(jìn)行人眼定位。該方法對(duì)傳統(tǒng)的計(jì)算公式進(jìn)行了改進(jìn),采用基于面積系數(shù)的圓環(huán)鄰域模板,引入了更多邊緣像素的梯度信息,有效地提高了眼睛定位的精度,具有一定的實(shí)用性。吳冰等在2008年提出基于Hough變換橢圓檢測(cè)的人眼睛定位方法。該方法先通過Canny算法對(duì)人臉圖像進(jìn)行邊緣提取,然后利用提取的眼睛邊緣特征進(jìn)行橢圓檢測(cè).該方法定位準(zhǔn)確,能有效的抑制噪聲,但是存在對(duì)人臉圖像的要求較高,計(jì)算量較大的問題。在國(guó)內(nèi)外的研究中,基于統(tǒng)計(jì)的人眼識(shí)別研究最為深入,基于統(tǒng)計(jì)理論的檢測(cè)方法是利用統(tǒng)計(jì)分析完成目標(biāo)定位監(jiān)測(cè),由于其具有較高精度,越來越多的學(xué)者選用此方法對(duì)人眼及相關(guān)領(lǐng)域進(jìn)行研究。國(guó)內(nèi)對(duì)于眼睛識(shí)別的研究起步較晚,但成果頗多。史慧榮等在2004年提出一種結(jié)合眼睛位置關(guān)系的模板匹配方法。該方法將左眼模板和右眼模板進(jìn)行合成,用合成的眼睛模板對(duì)圖像進(jìn)行匹配,有效壓縮了計(jì)算量;但是用來在圖像中匹配后得到多個(gè)相似眼睛點(diǎn),仍需要后續(xù)處理。KuoP.等在2005年提出一種基于變形模板的改進(jìn)的眼睛特征提取算法。該方法引入眼角特征提高模板擬合速度和準(zhǔn)確率,按照預(yù)先設(shè)定的順序存放眼睛的特征值以減少更新過程的復(fù)雜度、提高靈活性。欒柱曉等在2009年提出一種改進(jìn)的人眼模板匹配算法。該方法采用了分步長(zhǎng)模板匹配的策略,在后續(xù)的處理中根據(jù)兩眼的位置特征劃分出準(zhǔn)左眼區(qū)域和準(zhǔn)右眼區(qū)域,因此大幅度壓縮了人眼定位時(shí)的計(jì)算量。孫曉玲等在2008年提出一種改進(jìn)的眼睛精確定位的方法。該方法主要利用積分投影和波峰波谷法對(duì)圖像進(jìn)行分析,進(jìn)而找出一系列的候選眼睛點(diǎn),眼睛點(diǎn)的驗(yàn)證采用人臉的幾何分布特征來進(jìn)行。胡步發(fā)等在2006年提出基于小波變換、對(duì)稱變換和自評(píng)估規(guī)則的人眼定位新方法。該方法首先采用正交小波變換,因?yàn)槿四槇D像中存在大面積的灰度均勻區(qū)域,而人眼圖像區(qū)域灰度變化很大,所以通過該變換去除不含有人眼的大面積區(qū)域,以提高程序運(yùn)行速度;然后根據(jù)人眼區(qū)域灰度變化特點(diǎn),建立更加合理的對(duì)稱變換眼睛模型,增強(qiáng)了對(duì)稱變換應(yīng)用于一般人臉狀態(tài)眼睛定位的穩(wěn)健性;最后根據(jù)人類雙眼相似性以及整個(gè)眼部梯度方向信息提出了快速自評(píng)估算法,由此實(shí)現(xiàn)二次定位,提高了人眼定位的準(zhǔn)確性。朱夏君等在2007年提出人臉識(shí)別中的眼睛定位的新方法:該方法人臉區(qū)域劃分為小塊,計(jì)算每一小塊的圖像復(fù)雜度并排序;然后對(duì)復(fù)雜度最大的前16個(gè)小塊的位置進(jìn)行眼睛準(zhǔn)確定位;算法只能針對(duì)于簡(jiǎn)單背景下的人臉圖像才有效。許多經(jīng)典的用于識(shí)別人眼的統(tǒng)計(jì)方法都是國(guó)外研究者們發(fā)明的。MarkEveringham等在2006年提出降低由于面部識(shí)別給人眼檢測(cè)帶來的負(fù)面影響的方法:一是回歸的方法,以直接減少預(yù)測(cè)眼睛位置的錯(cuò)誤;二是應(yīng)用一個(gè)簡(jiǎn)單的Bayesian模型;三是通過AdaBoost算法訓(xùn)練人眼分類器。每個(gè)方法使用相同的數(shù)據(jù)測(cè)試,Bayesian模型方法執(zhí)行效果最好。Celebi.M.等在2010年提出基于復(fù)雜小波變換和人工復(fù)值神經(jīng)網(wǎng)絡(luò)的人眼狀態(tài)檢測(cè)算法。首先選取紅色信息作為彩色圖像的強(qiáng)度,分別獲得左眼和右眼的紅色圖像之后,通過復(fù)雜小波變換提取眼睛的特征值;之后從提取的特征值中可以得到四個(gè)特征值統(tǒng)計(jì)量(最大值,最小值,平均值和標(biāo)準(zhǔn)偏差)。這些統(tǒng)計(jì)值作為人工神經(jīng)網(wǎng)絡(luò)的輸入。測(cè)試實(shí)驗(yàn)使用的是十個(gè)人不同眼睛狀態(tài)的圖片,CVANN眼睛狀態(tài)檢測(cè)有6.7%的試驗(yàn)誤差,分類結(jié)果顯示10%的圖像沒能被正確區(qū)分人眼狀態(tài)。DavidMonzo等在2010年提出用方向梯度直方圖精確定位眼睛的方法:首先用通過AdaBoost算法得到的分類器預(yù)選可能的人眼位置;然后使用通過方向梯度直方圖數(shù)據(jù)得到的支持向量機(jī)分類選出所有可能組合中最佳的眼睛位置。用FERET和FRGCv1數(shù)據(jù)庫(kù)中數(shù)據(jù)做測(cè)試,該方法準(zhǔn)確率很高。ShuoChen等在2011年提出使用圖像色彩空間變換的人眼檢測(cè)算法:這個(gè)方法包括三個(gè)步驟。首先將彩色圖像從RGB空間轉(zhuǎn)換到Y(jié)UV空間,提取圖像U彩色圖像分量,將獲得的圖像二值化并通過投影確定人眼邊緣;然后通過兩次色彩空間變換找到位于眼睛輪廓內(nèi)的眼球中心;最后,為進(jìn)一步改善人眼檢測(cè)的準(zhǔn)確性,應(yīng)用先驗(yàn)知識(shí)對(duì)眼球中心進(jìn)行調(diào)整。該方法檢測(cè)速度快,準(zhǔn)確率比較高。除了這些算法外還有很多各具特色的人眼識(shí)別算法,但是每個(gè)算法都有自己的優(yōu)點(diǎn)同時(shí)又都有一定的局限性,例如運(yùn)算量太大、程序執(zhí)行效率低、檢測(cè)準(zhǔn)確率不高或在現(xiàn)有軟硬件情況下算法不容易實(shí)現(xiàn)等。由于拍攝圖像時(shí)光照、拍攝時(shí)攝像機(jī)與人的位置關(guān)系等因素的影響,采集到的圖像具有多樣性,一個(gè)算法很難面面俱到,現(xiàn)在國(guó)內(nèi)外研究者得工作就是盡可能的提高算法的性能,在實(shí)際應(yīng)用中,具體情況具體分析。1.3本論文的主要工作與文章結(jié)構(gòu)本文基于前人的研究,實(shí)現(xiàn)一種基于模版匹配方法的人眼定位識(shí)別算法。本文的文章結(jié)構(gòu)概括如下:第一章介紹本文的研究意義和背景。第二章主要闡述目前世界上流行的人眼識(shí)別算法。第三章人眼定位算法設(shè)計(jì)與實(shí)驗(yàn)。第四章實(shí)驗(yàn)結(jié)果分析。第五章分析了人眼識(shí)別的難點(diǎn)以及以后的研究重點(diǎn)。最后是本文的參考文獻(xiàn)。二常光源下的人眼定位識(shí)別 常光源下的人眼定位識(shí)別主要是指在通常的光源下,如自然光、普通人早光源等,對(duì)人臉中的人眼進(jìn)行定位檢測(cè)。由于成本低,取材方便,常光源的人眼定位成為人眼研究的主要探索領(lǐng)域,同時(shí)也為特種光源下的人臉、人眼檢測(cè)提供了基本的檢測(cè)方法和數(shù)據(jù)參考。2.1基于統(tǒng)計(jì)的方法基于統(tǒng)計(jì)的方法一般是通過對(duì)大量目標(biāo)樣本和非目標(biāo)樣本進(jìn)行訓(xùn)練學(xué)習(xí)得到一組模型參數(shù),然后基于模型構(gòu)建分類器或者濾波器來檢測(cè)目標(biāo)。在過去的一段時(shí)間中,基于統(tǒng)計(jì)的方法被廣泛應(yīng)用于人臉檢測(cè)與識(shí)別技術(shù)中,通過訓(xùn)練大量的人臉和非人臉樣本建立分類器,在輸入圖像中分類出人臉圖像。實(shí)踐表明這種方法具有較高的準(zhǔn)確度,近年來隨著人眼檢測(cè)研究的不斷發(fā)展,基于統(tǒng)計(jì)的方法也越來越多地得到了應(yīng)用。神經(jīng)網(wǎng)絡(luò)在基于統(tǒng)計(jì)的研究方法中占有較大的比重,它也逐漸被應(yīng)用于眼睛檢測(cè)中。早期Reinders等人采用神經(jīng)網(wǎng)絡(luò)和眼睛的微特性來定位人臉部特征。該算法將搜索窗口的像素作為神經(jīng)網(wǎng)絡(luò)的輸入,如果該窗口包含眼睛圖像,則神經(jīng)網(wǎng)絡(luò)的輸出較大。武妍等提出了一種基于灰度信息和瞳孔濾波器的方法。首先在圖像中檢測(cè)人臉區(qū)域從而得到人眼檢測(cè)框;然后通過對(duì)投影直方圖的分析進(jìn)行人眼粗檢測(cè),找到人眼候選點(diǎn)后利用BP神經(jīng)網(wǎng)構(gòu)造的瞳孔濾波器進(jìn)行精確的定位。文中指出人的眼睛大小各異,但是瞳孔的大小相差不是很大。文獻(xiàn)通過Adaboost算法進(jìn)行人臉檢測(cè)。實(shí)驗(yàn)統(tǒng)計(jì),Adaboost檢測(cè)器輸出的圖像統(tǒng)一到80*80大小后,瞳孔基本上是5*5的大小,因此設(shè)定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為:輸入層為25個(gè)節(jié)點(diǎn),輸入值與5*5輸入圖像的每個(gè)像素值一一對(duì)應(yīng);隱層取經(jīng)驗(yàn)值9個(gè)節(jié)點(diǎn);輸出層為1個(gè)節(jié)點(diǎn);輸出值越接近1則表明與瞳孔越相近,反之越靠近0表明與瞳孔的差別越大。輸入層與隱層全連接,隱層與輸出層全連接。訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)作為瞳孔濾波器來精確定位眼睛。石華偉提出了一種基于MeanShift算法和粒子濾波器的人眼跟蹤算法。該算法中采用MeanShift搜索后,粒子被集中在測(cè)量模型中,只考慮權(quán)值較大的粒子,用少量樣本就可以維持樣本的多樣性,節(jié)省了大量的計(jì)算時(shí)間。粒子濾波器來源于PerfectMonteCarlo(PMC)仿真,一般用于復(fù)雜環(huán)境下的目標(biāo)跟蹤等。通過MeanShift迭代運(yùn)算,在當(dāng)前幀中搜索與目標(biāo)模板亮度分布最相近的潛在目標(biāo);在得到樣本觀測(cè)值后,將MeanShift分析用于每一個(gè)粒子。在通過MeanShift迭代之后,所有的粒子被集中到觀測(cè)向量的局部區(qū)域內(nèi),粒子在集中的過程中會(huì)獲得大的權(quán)值,這樣就很好地克服了退化現(xiàn)象。該算法中不需要大量的樣本來維持樣本多樣性,因?yàn)椴捎肕eanShift分析之后,樣本會(huì)自動(dòng)集中于其鄰近的局部最大值區(qū)域。支持向量機(jī)(SupportVectorMachines,SVM)在過去的眼睛檢測(cè)研究中也占有重要的地位。SVM是由Vanpik領(lǐng)導(dǎo)的AT&TBell實(shí)驗(yàn)室研究小組在1963年提出的一種分類技術(shù)它是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的模式識(shí)別方法,主要應(yīng)用于模式識(shí)別領(lǐng)域。其核心思想是:對(duì)于輸入空間中非線性可分的情形,選擇一個(gè)適當(dāng)?shù)姆蔷€性映射,將輸入空間中的樣本點(diǎn)映射到一個(gè)高維的特征空間,使對(duì)應(yīng)的樣本點(diǎn)在該特征空間中是線性可分的。從一定程度來講,它要優(yōu)于神經(jīng)網(wǎng)絡(luò)。早期的研究中,Huang等人利用SVM的方法得到了人臉姿態(tài)和人眼位置。LiDiHua提出了一個(gè)二級(jí)的SVM系統(tǒng),先用線性核心的SVM篩選出候選點(diǎn),再用多項(xiàng)式核心的SVM作最終判定,實(shí)踐證明他們的系統(tǒng)對(duì)眼睛、嘴巴等臉部特征的定位成功率達(dá)到96%以上。PANGang使用方形掃描窗口,將眉毛與眼睛作為一個(gè)整體定位對(duì)象,減少了眉毛對(duì)定位的干擾。WangQiong首先利用眼睛的結(jié)構(gòu)在圖像中尋找候選眼睛對(duì),然后再利用支持向量機(jī)來定位眼睛對(duì),最后利用方差濾波器在候選區(qū)域中檢測(cè)眼睛。唐旭晟等人采用基于改進(jìn)的Adaboost算法的級(jí)聯(lián)式人臉和人眼分類器檢測(cè)人臉和眼睛的候選位置,再用SVM分類器驗(yàn)證并確定人眼的最佳位置。由于人臉檢測(cè)器采用包含灰度信息的類Harris小波作為分類特征,對(duì)像素變化較為敏感,常把眉毛、深色眼睛框等區(qū)域誤判為眼睛。因此根據(jù)人臉幾何特征模型,文中提出了13個(gè)用于區(qū)分人眼對(duì)的幾何分類特征,訓(xùn)練SVM分類器作進(jìn)一步的驗(yàn)證;兩種不同類型分類器級(jí)聯(lián)輸出才作為最后的眼睛輸出。實(shí)踐證明,該算法檢測(cè)精度較高,對(duì)于正面圖像或者旋轉(zhuǎn)較少的人臉圖像有著較高的檢測(cè)率。目前困擾SVM方法的主要問題是當(dāng)計(jì)算復(fù)雜度高、訓(xùn)練樣本個(gè)數(shù)較大時(shí),會(huì)得到大量的支持向量,使分類器的計(jì)算量過大?;诮y(tǒng)計(jì)的方法實(shí)施目標(biāo)檢測(cè),在檢測(cè)的精確度上無疑有著很大的提高,但是它需要采集大量的樣本來訓(xùn)練分類器,過程比較復(fù)雜。這是制約此類方法的最大問題。2.2基于知識(shí)的方法基于知識(shí)的方法也被稱之為基于規(guī)則的方法。其指導(dǎo)思想是確定圖像的應(yīng)用環(huán)境,總結(jié)特定條件下可用于人眼檢測(cè)的知識(shí)(如輪廓信息、色彩信息、位置信息)等,把它們歸納成指導(dǎo)人眼檢測(cè)的規(guī)則。ZhangLiMing先用直方圖閾值法將圖像二值化,根據(jù)其中黑色區(qū)域的面積、形狀和相對(duì)位置等幾何特征確定瞳孔位置;最后通過邊緣跟蹤依次找到上眼眶、眼角和下眼眶。范紅深提出了一種類似的方法,它們將圖像二值化后,計(jì)算出黑色區(qū)域的有效面積、質(zhì)心、外接矩形、圓性質(zhì)等幾何特征,依據(jù)經(jīng)驗(yàn)標(biāo)準(zhǔn)篩去一部分黑色區(qū)域,并將余下的區(qū)域作配對(duì)篩選,從而得到雙眼位置。此算法簡(jiǎn)單易行,但容易受到光照和噪聲的影響。Kumar等人在實(shí)施人眼檢測(cè)的過程中首先利用了大量有關(guān)于膚色和眼睛區(qū)域亮度的先驗(yàn)知識(shí),設(shè)定了多個(gè)閾值來分離皮膚及眼睛區(qū)域;然后再利用均值投影函數(shù)和方差投影函數(shù)來實(shí)施最后的定位。由于采用了大量的先驗(yàn)知識(shí),使得該方法的通用性受到了限制,尤其對(duì)于臉部膚色較深的個(gè)體,準(zhǔn)確率不高。此類方法與前述基于幾何模板的方法有很大區(qū)別,雖然都利用到一些人眼的幾何性質(zhì),但前者利用表現(xiàn)出來的幾何性質(zhì)建立了通用性更好的模板來實(shí)施匹配,而基于知識(shí)的方法則是直接利用這些幾何性質(zhì)實(shí)施檢測(cè),通用性要差一些。目前,由于先驗(yàn)知識(shí)有很大的局限性,單獨(dú)用來進(jìn)行人眼檢測(cè)的研究已經(jīng)不多,更多的是用來作為約束條件輔助檢測(cè)?;趯?duì)稱變換的人眼定位識(shí)別方法屬于基于知識(shí)的人眼檢測(cè)范疇?;趯?duì)稱變換的人臉圖像眼睛定位方法是一種利用圖像灰度分布的特性,從計(jì)算對(duì)稱值的角度出發(fā),利用梯度對(duì)稱變換,得到梯度圖,最終實(shí)現(xiàn)自動(dòng)定位人臉圖像中眼睛的算法。對(duì)稱變換是基于梯度圖的局部算子,記,為圖像上的任意兩點(diǎn),它的連線與水平線的逆時(shí)針夾角為,其取值范圍為。以點(diǎn)為連線中心的對(duì)稱點(diǎn)集合為:(1)和處在以為中心,為半徑的一個(gè)圓形區(qū)域內(nèi),定義電的對(duì)稱強(qiáng)度為:(2)其中距離因子,方向因子分別為:(3)(4)其中,為瞳孔半徑。此方法是測(cè)試兩瞳孔的對(duì)稱強(qiáng)度,以對(duì)稱強(qiáng)度大小來定位一對(duì)眼睛的位置,但眼球常因?yàn)檗D(zhuǎn)動(dòng)可能被眼簾遮擋,所以此方法滿足不了對(duì)多姿態(tài)的要求,而且在戴眼鏡的情況下,因?yàn)閮社R片不同程度的反光,效果也不盡如人意。2.3基于模版匹配的方法2.3.1模版匹配法原理 在機(jī)器識(shí)別過程中模板是為了檢測(cè)某些區(qū)域特征而設(shè)計(jì)的數(shù)據(jù)陣列,模板匹配技術(shù)是利用某種算法將已知的模板和待識(shí)別圖像進(jìn)行匹配計(jì)算,獲得圖像中是否含有該模板的信息。模板匹配基本原理是在圖像的搜索區(qū)內(nèi)逐點(diǎn)平移參考模板圖像,遍歷搜索區(qū)內(nèi)的每一個(gè)位置點(diǎn),同時(shí)根據(jù)某個(gè)相似性原則,計(jì)算搜索區(qū)內(nèi)該位置點(diǎn)的圖像區(qū)域和參考模板的相關(guān)值,然后根據(jù)相關(guān)值的大小來判定匹配情況。基本算法:圖像T(M×N個(gè)像素)為模板,圖像S(W×H個(gè)像素)為待搜索圖像。將模板T疊放在需要圖像S上,模板覆蓋的圖像S的那塊區(qū)域叫做子圖。,為子圖左上角在圖像S上的坐標(biāo)。搜索范圍是:橫坐標(biāo)到原圖像的寬度減去匹配圖的寬度,縱坐標(biāo)到原圖像高度減去匹配圖的高度。 圖2.1被搜索圖S(W×H)個(gè)像素圖2.2模板T(M×N)個(gè)像素我們通常利用以下兩種方式衡量模板和它覆蓋區(qū)域的相似程度: (5)(6)將公式(1)展開,可得到: (7)公式(3)中第一項(xiàng)為被模板覆蓋的子圖的能量,第二項(xiàng)為模板T(m,n)的能量,這兩項(xiàng)只與模板和圖像本身有關(guān)。第三項(xiàng)是和模板覆蓋下的子圖像、模板都有關(guān)的函數(shù),它隨(i,j)變化而迅速改變。依據(jù)數(shù)學(xué)不等式原理(,當(dāng)且僅當(dāng)a=b時(shí)等號(hào)成立),模板和子圖匹配時(shí),該項(xiàng)有最大值。因此可以用下列相關(guān)函數(shù)來反應(yīng)匹配程度:(8)經(jīng)過歸一化后可以得到:(9)模板在子圖上平移,在移動(dòng)的過程中,計(jì)算模板和子圖的相關(guān)系數(shù),如果模板和子圖完全匹配則相關(guān)系數(shù)R(i,j)=1。我們可以用模板搜索全部圖像S后,找出最大的相關(guān)系數(shù)R(i,j),最大相關(guān)系數(shù)對(duì)應(yīng)的子圖即為最佳匹配目標(biāo)。顯然,程序需要進(jìn)行大量的循環(huán)計(jì)算,程序執(zhí)行效率低。而且實(shí)驗(yàn)證明,被搜索的圖像越大,匹配的速度越慢。應(yīng)用模板匹配方法定位眼睛窗口首先要得到左眼模板和右眼模板,模板可以從人臉庫(kù)中進(jìn)行選取也可以依據(jù)眼睛參數(shù)自行構(gòu)造,然后分別用兩個(gè)眼睛模板在圖像中動(dòng)態(tài)搜索,得到兩個(gè)匹配度最大的區(qū)域作為眼睛的位置。這種方法使用方便,但定位時(shí)需要對(duì)圖像進(jìn)行兩次掃描,通過計(jì)算模板和檢測(cè)區(qū)域的相似程度,以相似程度最接近的位置作為目標(biāo)的位置來定位左眼與右眼,計(jì)算量較大,處理時(shí)間較長(zhǎng),不能同時(shí)定位兩個(gè)眼睛,而且成功與否與初始模板的設(shè)定有很大關(guān)系;如果待檢測(cè)人臉旋轉(zhuǎn)了一定角度,使用常見的水平人眼模板去檢測(cè),就很可能會(huì)導(dǎo)致人眼模板匹配失敗,得不到理想的定位結(jié)果。在經(jīng)過幾十年研究后,研究者們將模版匹配法大致分為灰度投影模版和幾何特征模版兩種定位方法,下面分別對(duì)兩種方法進(jìn)行介紹。2.3.2灰度投影模版 灰度投影法是指對(duì)人臉灰度圖像進(jìn)行水平和垂直方向的投影,分別統(tǒng)計(jì)出兩個(gè)方向上的灰度值和或灰度函數(shù)值和,找出特定的變化點(diǎn);然后根據(jù)先驗(yàn)知識(shí)將不同方向上的變化點(diǎn)位置相結(jié)合,即得到人眼的位置。也有人利用水平和豎直兩個(gè)方向上的梯度信息來代替原始灰度值,以減小光照條件的影響。當(dāng)前基于灰度投影算法來定位眼睛的方法已經(jīng)得到了較為廣泛的應(yīng)用,且算法得到了很大改進(jìn)和完善。最常用的投影函數(shù)是積分投影函數(shù),可以通過對(duì)積分投影函數(shù)值的分析提取圖像中的特征。K.Sobottka等人和Dieckmann等人在早期的研究中提出直接采用水平和垂直方向投影來定位眼睛。其研究表明單純依據(jù)灰度投影來定位眼睛雖然定位速度快,但波峰波谷的分布對(duì)于不同人臉和姿態(tài)變化非常敏感;另外,投影圖中干擾噪聲太大、曲線不規(guī)則,很難在此基礎(chǔ)上直接找到特征點(diǎn),只能大致地找到眼睛區(qū)域,不能實(shí)現(xiàn)精確定位,很難滿足研究需要。因此把灰度投影與其他算法結(jié)合起來進(jìn)行眼睛檢測(cè)成為新的研究選擇。章玲采用了混合投影函數(shù)。耿新在積分投影函數(shù)(IntegraProjectionFunction,IPF)和方差投影函數(shù)(VarianceproJectionFunction,VPF)的基礎(chǔ)上提出了一種混合投影函數(shù)(HybridProjectionFunction,HPF)。該函數(shù)綜合考慮了圖像中在某個(gè)方向上的均值和方差,既能反映不同的圖像灰度,又能反映不同的灰度變化率。章玲則提出了一種微分與積分投影相結(jié)合的眼睛定位方法,在傳統(tǒng)積分投影的基礎(chǔ)上,提出了一種微分投影算法與之相結(jié)合。考慮到人臉?biāo)椒较蛏匣叶茸兓^大,在灰度變化突變處進(jìn)行微分,將產(chǎn)生高值,將其絕對(duì)值累加,則灰度變化越大的那一行,累積值越大。Thilakkr采用了類似的均值投影函數(shù)(MeanProjectionFunction,MPF)和方差投影函數(shù)相結(jié)合的方法。采用混合投影函數(shù)的方法受噪聲的干擾較大,很難得到規(guī)整的曲線,并沒有從根本上解決傳統(tǒng)投影算法的弊端。Zhou等人對(duì)應(yīng)用于人眼檢測(cè)的IPF、VPF以及HPF進(jìn)行了總結(jié)并做了大量的實(shí)驗(yàn),發(fā)現(xiàn)三種函數(shù)都能夠?qū)崿F(xiàn)眼睛的檢測(cè),但是相比較而言,HPF要優(yōu)于VPF,而VPF要優(yōu)于IPF。張杰提出了一種利用積分投影和Hough變換的快速定位人眼的方法。對(duì)圖像進(jìn)行預(yù)處理后,首先在灰度圖中對(duì)原始圖像在水平和垂直方向上分別進(jìn)行灰度積分投影,根據(jù)積分投影圖的凹凸大致確定雙眼的位置,即人眼粗定位;然后對(duì)圖像進(jìn)行邊緣提取,并將邊緣圖像二值化,用Hough變換的圓檢測(cè)方法對(duì)二值化圖像進(jìn)行圓檢測(cè),從而確定雙眼的精確位置。類似的還有利用Hough變換在眼睛區(qū)域中實(shí)施半圓檢測(cè)的方法。Resselm也提出了一種類似的方法。首先用小灰度值聚類法初步定位虹膜中心,并用Canny算子進(jìn)行邊緣提?。蝗缓?,基于Hough變換精確定位瞳孔中心。由于Hough變換對(duì)邊界的要求較高,眼球受到眼瞼以及眼睫毛等的干擾較大,眼睛較小的人臉很難在圖像中清晰地進(jìn)行邊緣提取,另外Hough變換本身的算法也較復(fù)雜,因而這種方法很難得到廣泛的應(yīng)用。許慰玲等人對(duì)上述方法進(jìn)行了改進(jìn)。首先,利用一種改進(jìn)的小灰度值聚類算法進(jìn)行虹膜中心的初步定位;然后進(jìn)行基于虹膜正圓幾何特性的瞳孔中心定位,有效地克服了眼瞼與眼白交界處小灰度值像素的干擾以及采用Hough變換所造成的檢測(cè)不準(zhǔn)確等問題。此外,針對(duì)灰度圖像中邊緣檢測(cè)的不準(zhǔn)確性,曹倩霞提出了一種新的虹膜檢測(cè)算法。這種方法利用眼睛圖像飽和度信息和亮度信息作為閾值分割判據(jù)來分割出虹膜區(qū)域,再用Hough變換進(jìn)行虹膜檢測(cè)。相比于灰度邊緣檢測(cè),其檢測(cè)率大大提高,且能適應(yīng)一些人臉姿勢(shì)的變化和眼睛凝視方向的變化。但是此法在非均勻光照情況下檢測(cè)率不高。另外,Lin.K.H所提及的山谷法以及尹方平所提及的谷算子也是利用了灰度投影的方法。以上列舉了一些比較典型的基于投影的檢測(cè)眼睛的方法,對(duì)于背景較為簡(jiǎn)單、臉部特征比較規(guī)整的圖像,能夠有效地檢測(cè)到眼睛。但是要準(zhǔn)確定位眼睛位置,還要采取一定的輔助方法來去除干擾,如眉毛、睫毛、眼鏡等。2.3.3幾何特征模版 眼睛在人臉中具有較為明顯的個(gè)體特征以及分布特征。對(duì)于大多數(shù)人來說,眼睛的位置以及兩眼之間的距離相對(duì)于人臉而言是一個(gè)相關(guān)常數(shù)。另外,雙眼的對(duì)稱性、眼睛與其他臉部特征的相對(duì)位置以及眼球的形狀等都可以作為依據(jù)用來實(shí)施人眼檢測(cè)。A.L.Yuille等人在早期的研究中提出了一種二維可變形模板法,用兩條拋物線和一個(gè)球形表示眼睛。該模板的初始位置對(duì)定位結(jié)果有很大影響,而且能量函數(shù)優(yōu)化過程收斂緩慢、耗時(shí)長(zhǎng),能量函數(shù)中各種權(quán)值通過經(jīng)驗(yàn)設(shè)定,難以保證最優(yōu)。后來X.Xie等人又提出了改進(jìn)的眼睛可變形模板。他們提出了一種新的邊緣檢測(cè)算法找到眼睛的四個(gè)邊緣點(diǎn)(左右眼角及瞳孔與上下眼眶的交點(diǎn)),依此為依據(jù)確定模板的初始參數(shù)。實(shí)驗(yàn)表明,他們的模型在準(zhǔn)確率上有了較大提高,但仍然難以克服算法復(fù)雜、檢測(cè)速度慢的缺點(diǎn);另外僅對(duì)正面或近似正面人臉圖像中的眼睛和嘴巴等外形比較規(guī)則的器官特征提取效果較好。在此基礎(chǔ)上,黃萬軍提出了一種基于三維可變形模板的眼睛特征提取算法,利用人臉姿態(tài)估計(jì)策略來估測(cè)人臉的垂直旋轉(zhuǎn)方向,然后利用三維可變形模板匹配技術(shù)來提取眼睛的精確特征。此方法很好地照顧了非正面人臉圖像的眼睛檢測(cè),且可運(yùn)用于臉部其他器官的檢測(cè)。但由于眼睛的個(gè)體差異性,所建立的模板很難滿足不同人眼的需求。對(duì)稱性分析是圖像處理和計(jì)算機(jī)視覺的重要內(nèi)容,其核心是檢測(cè)目標(biāo)的對(duì)稱軸。正面人臉圖像具有很強(qiáng)的軸對(duì)稱性,因此可以利用對(duì)稱性進(jìn)行人臉人眼檢測(cè)。盧春雨提出了利用主分量分析法進(jìn)行對(duì)稱性檢測(cè)的新方法,將對(duì)稱軸方向求解轉(zhuǎn)換為協(xié)方差矩陣的特征值分解問題。實(shí)踐證明該方法對(duì)軸對(duì)稱的復(fù)雜圖像效果較理想。杜干把這種對(duì)稱軸檢測(cè)方法引入到眼睛檢測(cè)中,給出了人臉對(duì)稱軸的確定方法,并基于此提出了一種人眼定位的快速算法。在檢測(cè)到人臉對(duì)稱軸的基礎(chǔ)上再利用山谷法確定眼睛候選點(diǎn),但這種方法局限于人臉正面圖像,通用性不是很好??紤]到眼部區(qū)域的特殊性,宋加濤等人提出了一系列的約束機(jī)制來輔助進(jìn)行眼睛的精確定位,所用的約束機(jī)制主要有:a)位置約束。兩眼球不過于靠近圖像邊界。b)幾何關(guān)系約束。兩眼球中心之間的水平距離約占人臉寬度的四分之一到二分之一,人臉在平面內(nèi)的旋轉(zhuǎn)不超過正負(fù)30°。c)尺寸約束。眼球的面積界于一定范圍之內(nèi),眼球的直徑不大于某一值,如人臉圖像寬度的1/15。d)形狀約束。眼球的外接矩形盡可能接近正方形。e)飽和度約束。眼球的面積與其外接矩形的面積之比大于某一閾值。綜上所述,基于幾何特征來檢測(cè)眼睛的方法利用了大量的先驗(yàn)知識(shí),這通常會(huì)導(dǎo)致檢測(cè)方法的通用性不是很三人眼定位識(shí)別算法設(shè)計(jì)與實(shí)驗(yàn)通過閱讀大量文獻(xiàn)并參考相關(guān)數(shù)據(jù),本文采用模版匹配法中的幾何特征模版實(shí)現(xiàn)人眼的定位識(shí)別。利用模板方法主要有傳統(tǒng)模板和左右眼合成模板的方法。傳統(tǒng)模板需要分別利用左眼模板和右眼模板,對(duì)搜索區(qū)域進(jìn)行模板匹配,對(duì)匹配度大于閾值的塊可以認(rèn)為是眼睛。該方法需要確定眼睛初始位置,計(jì)算量較大。左右眼合成模板,首先將左眼模板和右眼模板求和平均得到合成的眼睛模板,這樣可以提高眼睛模板的魯棒性,降低它對(duì)左右眼的敏感性;利用合成模在圖像中匹配,獲得一個(gè)眼睛點(diǎn)的備選集合。此方法操作簡(jiǎn)便,計(jì)算量比傳統(tǒng)模板匹配方法少一倍,能夠獲得較高的定位準(zhǔn)確率和較快的定位速度,同時(shí)對(duì)于戴眼鏡,頭部姿態(tài)變化,光照變化以及焦距變化具有一定的魯棒性。3.1算法流程設(shè)計(jì)本文采用模版匹配方法識(shí)別人眼,通過計(jì)算模版與測(cè)試圖像的相關(guān)性,確定模版與測(cè)試中相匹配的位置。本算法主要通過四個(gè)步驟對(duì)人眼進(jìn)行定位識(shí)別。首先同時(shí)讀入模版圖像和測(cè)試人臉圖像,其中,測(cè)試圖像為已經(jīng)過圖像矯正,ROI提取、灰度歸一化、直方圖均衡的人臉圖像,該圖像均來自自采人臉數(shù)據(jù)庫(kù)。人眼模版從人臉數(shù)據(jù)庫(kù)外的人臉圖像中提取,目的在于測(cè)試算法的魯棒性。在模版和測(cè)試圖像均讀取成功后,分別獲取兩張圖像的參數(shù),包括尺寸,灰度值,以及圖像均值,作為下一步的計(jì)算參考。利用模版圖像的灰度值和均值,對(duì)測(cè)試人臉圖像的像素進(jìn)行遍歷,根據(jù)遍歷中兩者的相關(guān)系數(shù)判斷測(cè)試圖像中與模版灰度值相匹配的區(qū)域。根據(jù)已經(jīng)獲得的匹配區(qū)域,判斷是否在測(cè)試圖像中處于合理位置,即是否與人眼大致位置相符,如果相符,則在測(cè)試圖像上將該區(qū)域用標(biāo)識(shí)框繪出。算法具體流程如圖3.1所示:圖3.1算法流程設(shè)計(jì)框圖3.2人眼模版的預(yù)處理由于受光照等客觀條件的影響,實(shí)際應(yīng)用中要面對(duì)的人眼圖像是千差萬別的。為了減少這種差別,使人眼的模式空間更加緊湊,需要對(duì)人眼樣本適當(dāng)?shù)念A(yù)處理。人眼的特征并不是很多,尤其在15x30這么小的圖像上,不宜做太多的預(yù)處理,因?yàn)轭A(yù)處理太多會(huì)丟掉部分有用信息,所以本文對(duì)每一個(gè)人眼與非人眼樣本只做了灰度化和直方圖均衡,以克服部分光照帶來的影響。直方圖均衡化通過使用累積函數(shù)對(duì)灰度值進(jìn)行調(diào)整,以實(shí)現(xiàn)對(duì)比度的增強(qiáng)。其中心思想是把原始圖像的灰度直方圖從比較集中的某個(gè)灰度區(qū)間,變成在全部灰度范圍內(nèi)均勻分布,也就是對(duì)圖像進(jìn)行非線性拉伸,重新分配圖像的像元值,使一定灰度范圍內(nèi)的像元數(shù)量大致相同,即把給定圖像的直方圖分布改變成均勻分布直方圖分布。因此這種方法對(duì)較亮和較暗環(huán)境下得到的眼睛都有一定的效果。圖3.2顯示了同一只眼睛在暗光和亮光條件下經(jīng)過直方圖均衡前后的比較結(jié)果:(a)強(qiáng)光下人眼(b)弱光下人眼(c)強(qiáng)光下直方圖均衡結(jié)果(d)弱光下直方圖均衡結(jié)果圖3.2單只人眼進(jìn)行直方圖均衡前后比較3.3人臉數(shù)據(jù)庫(kù)本文的算法使用三個(gè)人臉測(cè)試集作為測(cè)試圖像。第一個(gè)人臉數(shù)據(jù)集為為網(wǎng)絡(luò)開源人臉圖像aberdeen中的100幅正面人臉圖像,該數(shù)據(jù)集中圖像屬于無背景頭肩部圖像。圖3.3所示:圖3.3開源人臉圖像數(shù)據(jù)集第二個(gè)人臉數(shù)據(jù)集為ORL人臉數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)中有40人,每人10張人臉圖像,共400個(gè)人臉圖像。該數(shù)據(jù)庫(kù)被廣泛用于模式識(shí)別領(lǐng)域,包括人臉及面部器官的定位與檢測(cè)。數(shù)據(jù)庫(kù)中采集圖像的角度以及人的表情各不相同,如圖3.4,3.5所示:圖3.4ORL數(shù)據(jù)庫(kù)中男性人臉圖像圖3.5ORL數(shù)據(jù)庫(kù)中女性人臉圖像本文使用的第三個(gè)人臉數(shù)據(jù)集為北京航天航空大學(xué)IRIP實(shí)驗(yàn)室自采人臉圖像。該數(shù)據(jù)集包含200人,每人30張人臉圖像。由于采集設(shè)備及環(huán)境限制,該數(shù)據(jù)集圖像包含一定冗余信息,對(duì)人眼的定位識(shí)別結(jié)果造成影響。為了最大限度避免采集圖像的冗余干擾最終的識(shí)別結(jié)果,本文對(duì)該數(shù)據(jù)庫(kù)中圖像進(jìn)行了幾何歸一化,灰度歸一化,以及ROI提取,目的在于最大限度的反映出圖像中的人臉信息,過濾掉原始圖像的冗余,然后通過圖像矯正、剪切和縮放操作,使得所有人臉圖像的兩眼連線水平,眼距固定,圖像所放到標(biāo)準(zhǔn)大小。處理后的圖像如圖3.6,3.7所示:圖3.6北京航天航空大學(xué)IRIP實(shí)驗(yàn)室人臉圖像集——男性圖3.7北京航天航空大學(xué)IRIP實(shí)驗(yàn)室人臉圖像集——女性采集后的圖像分為彩色圖和灰度圖,用于驗(yàn)證本文算法的可行性。3.4人眼定位與識(shí)別為了驗(yàn)證本文算法的魯棒性,首先使用冗余信息較多的實(shí)驗(yàn)室自采圖像進(jìn)行測(cè)試。依據(jù)算法設(shè)計(jì)流程(見圖3.1),本節(jié)分四個(gè)步驟對(duì)人眼的定位識(shí)別進(jìn)行講解,并附代碼作為參考。3.4.1讀取人眼模版和人臉測(cè)試圖像本文從自采人臉數(shù)據(jù)庫(kù)中隨機(jī)選取一名男性和一名女性的人臉圖像作為測(cè)試圖,并從其余人臉圖像中隨機(jī)選取一人的眼睛部位圖像作為匹配模版,如圖3.8所示:(a)人眼模版圖像(b)男性人臉圖像 (c)女性人臉圖像圖3.8人眼模版與測(cè)試人臉圖像參考代碼如下:%讀取模版圖像im1=imread('template.jpg');%讀取人臉測(cè)試圖像im2=imread(TestImage.jpg');3.4.2獲得圖像相關(guān)參數(shù)(1)判斷輸入圖像格式并進(jìn)行轉(zhuǎn)化由于模版圖像和測(cè)試圖像來自不同個(gè)體,且為了防止使用其他數(shù)據(jù)庫(kù)時(shí)存在彩色人臉圖像影響識(shí)別結(jié)果的情況,本文首先對(duì)讀取的圖像進(jìn)行判斷是否屬于彩色圖像,如果屬于彩色圖像,則轉(zhuǎn)化為二維灰度圖像。在本實(shí)驗(yàn)中,由于輸入圖像已經(jīng)是二維灰度圖像,因此此步驟不改變輸入結(jié)果。參考代碼如下:%如果輸入圖像是彩色圖像,則轉(zhuǎn)換為二維圖像ifsize(im1,3)==3image1=rgb2gray(im1);endifsize(im2,3)==3image2=rgb2gray(im2);End(2)通過圖像尺寸判斷其類型由于模版和人臉圖像的尺寸已經(jīng)經(jīng)過歸一化,因此通過獲得兩張圖片的尺寸可以判斷出哪張圖片可作為模版,哪張可作為人臉圖像,由此可進(jìn)一步獲得模版的均值,作為下一步實(shí)驗(yàn)的參考。%通過圖片的尺寸判斷哪張是測(cè)試圖片,哪張是模版圖像ifsize(image1)>size(image2)Target=image1;Template=image2;elseTarget=image2;Template=image1;End(3)記錄圖像參數(shù)之后將兩種圖像的尺寸分別封裝在兩個(gè)變量中,與模版圖像的灰度均值一起作為下一步定位的基礎(chǔ)參數(shù)%獲得兩幅圖片的尺寸[r1,c1]=size(Target);[r2,c2]=size(Template);%計(jì)算模版圖像的均值image22=Template-mean(mean(Template));3.4.3計(jì)算兩幅圖像的相關(guān)性本算法利用模版的灰度值對(duì)測(cè)試圖像進(jìn)行遍歷,對(duì)與模版大小相同的區(qū)域進(jìn)行匹配,匹配依據(jù)建立在相關(guān)性基礎(chǔ)之上,從而可以得出與模版相似的區(qū)域,參考代碼如下:%計(jì)算兩幅圖像的相關(guān)性M=[];%相關(guān)系數(shù)矩陣fori=1:(r1-r2+1)%橫向遍歷forj=1:(c1-c2+1)%縱向遍歷Nimage=Target(i:i+r2-1,j:j+c2-1);%選取匹配區(qū)域 Nimage=Nimage-mean(mean(Nimage)); corr=sum(sum(Nimage.*image22));%構(gòu)造協(xié)方差矩陣 warningoffM(i,j)=corr/(sqrt(sum(sum(Nimage.^2)))*sqrt(sum(sum(image22.^2))));%計(jì)算均方差的積endend3.4.4標(biāo)識(shí)出人眼定位區(qū)域在獲得了人眼定位的區(qū)域后,在人臉測(cè)試圖像上判斷目標(biāo)位置,將該區(qū)域用白色矩形框標(biāo)識(shí)出來。參考代碼如下:[r1,c1]=size(Target);[r2,c2]=size(Template);(1)提取匹配區(qū)域坐標(biāo)首先,將存有相關(guān)系數(shù)的矩陣中每一列的最大值提取出來,構(gòu)成一個(gè)一維矩陣,計(jì)算出每個(gè)值在測(cè)試圖中所代表的坐標(biāo)。[r,c]=max(M);%選取每一列的最大值,構(gòu)造一維矩陣[r3,c3]=max(max(M));%選取矩陣中的最大值%確定最大值點(diǎn)的坐標(biāo)i=c(c3);%確定行數(shù)j=c3;%確定列數(shù)result=Target;(2)繪制匹配區(qū)域在確定坐標(biāo)之后,開始繪制匹配區(qū)域。%繪制矩形框上方的橫線forx=i:i+r2-1fory=jresult(x,y)=255;%矩形框顏色設(shè)為白色endend%繪制矩形框下方的橫線forx=i:i+r2-1fory=j+c2-1result(x,y)=255;endend%繪制矩形框左邊的豎線forx=ifory=j:j+c2-1result(x,y)=255;endend%繪制矩形框右側(cè)的豎線forx=i+r2-1fory=j:j+c2-1result(x,y)=255;endend%定位完畢四實(shí)驗(yàn)結(jié)果分析4.1定位結(jié)果比較(1)基于北京航天航空大學(xué)IRIP實(shí)驗(yàn)室自采圖像的測(cè)試?yán)孟嗤0鎴D像,對(duì)北京航天航空大學(xué)IRIP實(shí)驗(yàn)室自采圖像中的女性的人臉圖像進(jìn)行測(cè)試。模版圖像及測(cè)試人臉圖像如圖4.1(a),(b)所示:(a)(b)圖4.1北京航天航空大學(xué)IRIP實(shí)驗(yàn)室自采圖像算法測(cè)試——女性測(cè)試結(jié)果如圖4.2所示:圖4.2女性人臉眼睛定位結(jié)果選擇數(shù)據(jù)庫(kù)中男性人臉圖像測(cè)試,模版和測(cè)試人臉圖像如圖4.3(a),(b)所示:(a)(b)圖4.3北京航天航空大學(xué)IRIP實(shí)驗(yàn)室自采圖像算法測(cè)試——男性測(cè)試結(jié)果如圖4.4所示:圖4.4男性人臉眼睛定位結(jié)果(2)基于ORL數(shù)據(jù)庫(kù)測(cè)試結(jié)果輸入模版圖像和測(cè)試人臉圖像如圖4.5(a),(b)所示:(a)(b)圖4.5ORL人臉圖像算法測(cè)試算法定位結(jié)果如圖4.6所示:圖4.6ORL數(shù)據(jù)庫(kù)人眼定位結(jié)果(3)基于網(wǎng)絡(luò)開源人臉數(shù)據(jù)庫(kù)的測(cè)試結(jié)果輸入模版和測(cè)試圖像如圖4.7(a),(b)所示:(a)(b)圖4.7網(wǎng)絡(luò)開源數(shù)據(jù)庫(kù)算法測(cè)試人眼定位結(jié)果如圖4.8所示:圖4.8網(wǎng)絡(luò)開源人臉圖像測(cè)試結(jié)果4.2實(shí)驗(yàn)結(jié)果分析 本文在Matlab平臺(tái)上進(jìn)行試驗(yàn),采用ORL人臉數(shù)據(jù)庫(kù)(40人,400張圖像),網(wǎng)絡(luò)開源數(shù)據(jù)庫(kù)(100人,1000張圖像),實(shí)驗(yàn)室自采人臉數(shù)據(jù)庫(kù)(200人,3000張圖像)對(duì)提出的算法進(jìn)行測(cè)試??梢钥闯?,在大部分情況下,本文所實(shí)現(xiàn)的算法對(duì)三個(gè)數(shù)據(jù)庫(kù)中的任意圖片具有較好的識(shí)別效果,驗(yàn)證了利用灰度值計(jì)算模版與測(cè)試圖片的相關(guān)系數(shù)作為模版匹配的基本方法是可行有效的。然而,在模版圖像眼睛輪廓與測(cè)試圖像差別過大,或者模版中有頭發(fā)、眉毛等其他非人眼成分時(shí),識(shí)別結(jié)果不盡如人意。圖4.9,4.10為識(shí)別失敗的范例,主要原因是人眼模版選擇與測(cè)試圖像的人眼區(qū)域相關(guān)性過低導(dǎo)致:(a)人眼模版圖像和測(cè)試人臉圖像(b)人眼識(shí)別結(jié)果圖4.9人眼定位識(shí)別失敗范例1(a)人眼模版圖像和測(cè)試人臉圖像(b)人眼識(shí)別結(jié)果圖4.10人眼定位識(shí)別失敗范例2五總結(jié)與展望隨著科學(xué)技術(shù)和社會(huì)經(jīng)濟(jì)的發(fā)展,越來越多的智能化技術(shù)將會(huì)得到推廣應(yīng)用。特別是以計(jì)算機(jī)視覺為代表的高科技高智能化領(lǐng)域,研究?jī)?nèi)容豐富,越來越多的研究成果被人們所使用。作為計(jì)算視覺的一個(gè)重要研究方向,人眼識(shí)別技術(shù)得到了長(zhǎng)足的發(fā)展,具有廣闊的應(yīng)用前景。本文通過對(duì)人眼跟蹤及視線檢測(cè),實(shí)現(xiàn)人眼交互,為以后進(jìn)一步的開發(fā)及應(yīng)用打下基礎(chǔ)。人眼檢測(cè)最初是隨人臉識(shí)別而提出的,現(xiàn)在人眼所包含的信息得到越來越多的關(guān)注,人眼檢測(cè)的成果也得到了廣泛應(yīng)用。本論文所做的工作:(1)介紹研究人眼檢測(cè)的意義以及常見的人眼檢測(cè)算法。(2)通過將相關(guān)系數(shù)和模板匹配結(jié)合的方法,搜尋出人眼窗口所在的位置。 本文的算法經(jīng)過Matlab平臺(tái)進(jìn)行測(cè)試,通過對(duì)三種數(shù)據(jù)庫(kù)中任意人臉圖像的測(cè)試,驗(yàn)證了本文算法的精確性和魯棒性。綜合分析當(dāng)前國(guó)內(nèi)外的人眼檢測(cè)技術(shù),結(jié)合筆者在研究過程中的問題,探討一下當(dāng)前制約人眼檢測(cè)技術(shù)發(fā)展的主要因素以及其發(fā)展的趨勢(shì)。a)依賴于人臉檢測(cè)技術(shù)的發(fā)展。由于眼睛區(qū)域在整幅圖像中的面積較小,直接在圖像中實(shí)施眼睛檢測(cè)會(huì)因?yàn)槟繕?biāo)過小致使精度不高。目前多數(shù)的眼睛檢測(cè)研究都是建立在成功實(shí)施人臉檢測(cè)的基礎(chǔ)上,人臉檢測(cè)效果的好壞直接影響眼睛檢測(cè)的準(zhǔn)確與否。b)眉毛、頭發(fā)、眼睫毛、鼻孔等臉部特征與瞳孔的色彩相近,如何有效區(qū)分眼睛與這些區(qū)域成為了制約眼睛檢測(cè)發(fā)展的重要問題。c)當(dāng)前研究針對(duì)正面人臉圖像比較多,在人臉出現(xiàn)偏移和旋轉(zhuǎn)時(shí)檢測(cè)精度不高。因?yàn)榇藭r(shí)圖像中人眼的部分信息會(huì)發(fā)生變化,很難魯棒地檢測(cè)眼睛。d)大多數(shù)研究沒有考慮配戴眼鏡的影響。尤其利用色彩信息進(jìn)行檢測(cè)時(shí),眼鏡對(duì)眼部區(qū)域的亮度有明顯影響,眼鏡邊緣也會(huì)造成干擾,且配戴眼鏡后,瞳孔等區(qū)域會(huì)變得不清晰。e)圖像中眼睛的大小不一也給檢測(cè)帶來了難度。對(duì)于較大且輪廓較清晰的眼睛檢測(cè)起來比較方便,且檢測(cè)精度較高;對(duì)于較小的眼睛,由于受到的干擾較多且特征不明顯,很難找到一種有效的方法實(shí)施檢測(cè)。f)對(duì)圖像中有遮擋物的情形沒有很好的應(yīng)對(duì)策略,這也是制約人眼檢測(cè)的一大難題。g)多數(shù)研究都是針對(duì)分辨率高、噪聲小、質(zhì)量較高的圖像實(shí)施檢測(cè),對(duì)質(zhì)量較差的圖片往往難以實(shí)現(xiàn)有效的檢測(cè)。而在實(shí)際應(yīng)用中并不能保證每一幅目標(biāo)圖像都足夠清晰。h)目前的人眼檢測(cè)研究包括人臉檢測(cè),均會(huì)受到人種膚色的制約,并不能夠很好地適應(yīng)不同膚色的人種。這是制約這項(xiàng)研究國(guó)際化的一個(gè)重大瓶頸。本文的人眼跟蹤方法雖然具有很好的時(shí)效性,但仍然有不少地方需要改進(jìn)。人臉特征的檢測(cè)受到光照、復(fù)雜背景、大幅度人臉轉(zhuǎn)動(dòng)等影響,我們分析的只是簡(jiǎn)單背景下且沒有大幅度人臉轉(zhuǎn)動(dòng)的情況,對(duì)人眼的跟蹤也是簡(jiǎn)單的跟蹤。參考文獻(xiàn)[1]鄧肯.格雷厄姆-羅.眼球跟蹤:身份識(shí)別新技術(shù)[J].科技創(chuàng)業(yè),2010,(12):25.[2]李江泓.七成重大事故源于超載和疲勞駕駛[N].中國(guó)安全生產(chǎn)報(bào),2002-12-7.[3]R.Barea,L.Boquete,S.Ortega,E.López,etal.EOG-basedeyemovementscodificationforhumancomputerinteraction[J].ExpertSystemswithApplications,2012,39(3):2677-2683.[4]K.Abe,S.Ohi,M.Ohyama.AnEye-gazeInputSystembasedontheLimbusTrackingMethodbyImageAnalysisforSeriouslyPhysicallyHandicappedPeople[J].AdjunctProc.,2002:185-186.[5]許俏文.眼睛不會(huì)說謊[N].廣州日?qǐng)?bào),2011-01-09(B1).[6]Forsyth,D.A.andPonce,J.Computervision:AModernApproach[M].PrenticeHallProfessionalTechnicalReference,2002.[7]ZhouZ.H,GengX.Projectionfunctionsforeyedetection[J].PatternRecognition.2004,37(5):1049~1056.[8]RizonM,KawaguchiT.Automaticeyedetectionusingintensityandedgeinformation.Proceedings[J].IEEETENCON.2000,2:415~420[9]徐艷,陳孝威.人臉檢測(cè)中的眼睛定位算法研究[J].計(jì)算機(jī)與信息技術(shù).2006,9:24~28.[10]Xinghuas,GuoyongC,ChunxiaZetal.GazeEstimationofHumanEye[C].6thInternationalConferenceonITSTelecommunicationsProceedings,2006:310-313.[11]KazuhiroTskeshita,AkihikoUchibori,YoshikiMizukami.ACommunicationsystemforALSpatientsusingeyeblinkInternationalJournalofAppliedElectromagneticsandMechanics2003[C],18:1~3[12]ArneJohnGlenstrupandTheoEngell-Nielsen,“EyeControlledMedia:PresentandFutureState”,ThesisofBachelorinInformaitonPsychology[C],PsychologicalLaboratory,UniversityofCopenhagen,Denmark,1995.[13]Graumank,BetkeM,GipsJetal.Communicationviaeyeblinksdetectionanddurationanalysisinrealtime[J].IEEEComputerSocietyConferenceonComputerVisionandPatternRecognition,2001,1010~1017.[14]OpenCV中文網(wǎng)站.人臉檢測(cè).http:///index.php/%E9%A6%96%E9%A1%B5[15]FrobaB,ErnstA.FastFrontal-ViewFaceDetectionUsingaMulti-pathDecisionTree[J].InProceedingsofAudioandVideobasedBiometricPersonAuthentication,2003:921-928.[16]LiSZ,ZhuL,ZhangZQ,ZhangHJ.Learningtodetectmulti-viewfacesinreal-time[Z].WashingtonDC:ProceedingofInternationalConferenceonDevelopmentandLearning,2002.[17]王海濤.基于灰度的人臉檢測(cè)系統(tǒng)[M].北京:電子工業(yè)出版社,2004.[18]ShenLansun.EyeLocationusinggabortransform[J].measurementandcontroltechnology,2006,25(6):27~29.[19]葉劍波.基于卡爾曼粒子濾波器的人眼跟蹤[J].計(jì)算機(jī)工程.2006[20]DoucetA.OnSequentialSimulationMonteCarloSamplingMethodsforBayessianFiltering[J].StaticsandComputing,2000,10(3):197-208.[21]劉黨輝,沈蘭蓀,LAMKM.人臉檢測(cè)研究進(jìn)展[J].計(jì)算機(jī)工程與應(yīng)用,2003,39(28):5-9,21.[22]REINDERSMJT,KOCHRWC,GERBRANDSJJ.Locationfacialfeaturesinimagesequencesusingneuralnetworks[C].Procofthe2ndInternationalConferenceonAutomaticFaceandGestureRecognition.LosAlamitos:IEEECSPress,1996:230-235.[23]武妍,楊洋,王麗萍.基于灰度信息和瞳孔濾波器的人眼定位算法[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(33):45-47.[24]VOILAP,JONESM.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C].ProcofIEEEConferenceonComputerVisionandPatternRecognition.Kaua,Hawaii,2001:511-518.[25]石華偉,夏利民.基于MeanShift算法和粒子濾波器的人眼跟蹤[J].計(jì)算機(jī)工程與應(yīng)用,2006,42(19):26-28.[26]HUANGJ,LID,SHAOX,etal.Posediscriminationandeyedetectionusingsupportvectormachines[C].ProcofNATO-ASIonFaceRecognition:fromTheorytoApplications.1998:528-536.[27]LID-ihua,PODOLAKIT,LEESW.Facialcomponentextractionandfacerecognitionwithsupportvectormachines[C].ProcofAutomaticFaceandGestureRecognition.2002:76-81.[28]PANGang,LINWeixun,WUZhao-hu,etal.AneyedetectionsystembasedonSVMfilter[C].ProcofElectronicImagingandMult-imediaTechnology.2002:326-331.[29]WANGQiong,YANGJing-yu.Eyedetectioninfacialimageswithunconstrainedbackground[J].JournalofPatternRecognitionResearch,2006(1):55-62.[30]唐旭晟,歐宗瑛,蘇鐵明,等.復(fù)雜背景下人眼的快速定位[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2006,18(10):1535-1540.致謝經(jīng)過將近一個(gè)學(xué)期的努力,終于如期完成了本次畢業(yè)設(shè)計(jì)。首先我要感謝我的畢設(shè)導(dǎo)師楊揚(yáng)老師,從選題到整個(gè)畢設(shè)的進(jìn)行過程中,楊老師不但為我們創(chuàng)造了良好的學(xué)習(xí)環(huán)境提供了畢業(yè)設(shè)計(jì)的設(shè)備,而且一直悉心教導(dǎo)并推薦給我們很多畢設(shè)需要的相關(guān)文獻(xiàn)資料供我們參考。論文行文過程中,楊老師也多次幫助我分析思路,開拓視角,給予了我很大的幫助和鼓勵(lì)。從楊老師那里我不僅學(xué)習(xí)到了知識(shí),他嚴(yán)謹(jǐn)求實(shí)的治學(xué)態(tài)度,踏實(shí)堅(jiān)韌的工作精神,也將使我終生受益。感謝北方工業(yè)大學(xué)信息工程學(xué)院為我們提供了做畢業(yè)設(shè)計(jì)的實(shí)驗(yàn)室,也感謝信息工程學(xué)院所有幫助過我、指導(dǎo)過我的老師,是他們細(xì)心的指導(dǎo)和耐心的教誨,讓我學(xué)到了很多,懂得了很多。另外還要感謝通信10A-1班的所有同學(xué)。在與他們共同學(xué)習(xí),共同生活的四年里,我們一同經(jīng)歷了四年的風(fēng)風(fēng)雨雨,與他們的交流和討論,擴(kuò)展了我的思路,鍛煉了我的能力,對(duì)論文的完成頗有益處。最后,我感謝大學(xué)四年以來給過我?guī)椭完P(guān)注的所有人,你們幫助我度過了大學(xué)中的一個(gè)個(gè)難關(guān),幫助我成長(zhǎng)。附錄外文資料翻譯(附原文)基于半邊臉的人臉檢測(cè)概要:圖像中的人臉檢測(cè)是人臉識(shí)別研究中一項(xiàng)非常重要的研究分支。為了更有效地檢測(cè)圖像中的人臉,此次研究設(shè)計(jì)提出了基于半邊臉的人臉檢測(cè)方法。根據(jù)圖像中人半邊臉的容貌或者器官的密度特征,比如眼睛,耳朵,嘴巴,部分臉頰,正面的平均全臉模板就可以被構(gòu)建出來。被模擬出來的半張臉是基于人臉的對(duì)稱性的特點(diǎn)而構(gòu)建的。圖像中人臉檢測(cè)的實(shí)驗(yàn)運(yùn)用了模板匹配法和相似性從而確定人臉在圖像中的位置。此原理分析顯示了平均全臉模型法能夠有效地減少模板的局部密度的不確定性?;诎脒吥樀娜四槞z測(cè)能降低人臉模型密度的過度對(duì)稱性,從而提高人臉檢測(cè)的速度。實(shí)驗(yàn)結(jié)果表明此方法還適用于在大角度拍下的側(cè)臉圖像,這大大增加了側(cè)臉檢測(cè)的準(zhǔn)確性。關(guān)鍵詞:人臉模板,半邊人臉模板,模板匹配法,相似性,側(cè)臉。介紹近幾年,在圖像處理和識(shí)別以及計(jì)算機(jī)視覺的研究領(lǐng)域中,人臉識(shí)別是一個(gè)很熱門的話題。作為人臉識(shí)別中一個(gè)重要的環(huán)節(jié),人臉檢測(cè)也擁有一個(gè)延伸的研究領(lǐng)域。人臉檢測(cè)的主要目的是為了確定圖像中的信息,比如,圖像總是否存在人臉,它的位置,旋轉(zhuǎn)角度以及人臉的姿勢(shì)。根據(jù)人臉的不同特征,人臉檢測(cè)的方法也有所變化[1-4]。而且,根據(jù)人臉器官的密度或顏色的固定布局,我們可以判定是否存在人臉。因此,這種基于膚色模型和模板匹配的方法對(duì)于人臉檢測(cè)具有重要的研究意義[5-7]。這種基于模板匹配的人臉檢測(cè)法是選擇正面臉部的特征作為匹配的模板,導(dǎo)致人臉?biāo)阉鞯挠?jì)算量相對(duì)較大。然而,絕大多數(shù)的人臉都是對(duì)稱的。所以我們可以選擇半邊正面人臉模板,也就是說,選擇左半邊臉或者有半邊臉作為人臉匹配的模板,這樣,大大減少了人臉?biāo)阉鞯挠?jì)算。人臉模板構(gòu)建的方法人臉模板的質(zhì)量直接影響匹配識(shí)別的效果。為了減少模板局部密度的不確定性,構(gòu)建人臉模板是基于大眾臉的信息,例如,平均的眼睛模板,平均的臉型模板。這種方法很簡(jiǎn)單。在模板的仿射變換的實(shí)例中,人臉檢測(cè)的有效性可以被確保。構(gòu)建人臉模板的過程如下[8]:步驟一:選擇正面人臉圖像;步驟二:決定人臉區(qū)域的大小和選擇人臉區(qū)域;步驟三:將選出來的人臉區(qū)域格式化成同一種尺寸大??;步驟四:計(jì)算人臉區(qū)域相對(duì)應(yīng)像素的平均值。在構(gòu)建模板之前,挑選些有正面人臉的圖片。首先,決定人臉區(qū)域的尺寸大小。然后,在圖像中手動(dòng)挑選人臉區(qū)域。我們?cè)O(shè)選定的人臉區(qū)域的數(shù)量為n。因?yàn)槿四槄^(qū)域的矩陣向量都是被獨(dú)立分布的,所以在那些人臉圖像相同位置的像素值也是獨(dú)立分布的。我們?cè)O(shè)在人臉區(qū)域第k(k=1,2,?,n)位置的像素值是fk(i,j)(k=1,2,…,n),那些人臉圖像的是標(biāo)準(zhǔn)比例系數(shù)wk(k=1,2,…,n),由此得出正面人臉模板的表達(dá)式:根據(jù)統(tǒng)計(jì)學(xué),如果在人臉區(qū)域第k個(gè)位置,有些像素值fk(i,j)趨于正態(tài)分布,其中u是像素fk(i,j)的平均值,是方差,T(i,j)是正態(tài)分布。所以模板局部密度的不確定性大大降低了。如果抽樣的人臉圖像都是在同一間距下拍攝的,相對(duì)應(yīng)的人臉尺寸是一致的,標(biāo)準(zhǔn)的比例像素wk就等于1.那么,大眾人臉模板T(i,j)也就變成了正面的平均全臉模板的構(gòu)建在人臉與相機(jī)間距相同,鳥瞰圖的拍攝角度是15°的情況下,120張人臉圖像被取樣,包含正面的,左側(cè)傾斜30°和左側(cè)傾斜45°。每種角度的圖像都是40張。其中20張中的人戴帽子,2張沒有戴帽子。被抽樣的圖像如圖1所示。正面左側(cè)傾斜30°左側(cè)傾斜45°圖1:各個(gè)角度的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論