版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人臉檢測(cè)問(wèn)題研究綜述
1人臉檢測(cè)系統(tǒng)的應(yīng)用背景面部特征的檢測(cè)是輸入圖像時(shí)確定每個(gè)臉的位置、大小和位置的過(guò)程。面部特征的識(shí)別是人類信息數(shù)據(jù)處理的一項(xiàng)重要技術(shù)。近年來(lái),它已成為計(jì)算機(jī)及其他犯罪現(xiàn)場(chǎng)的一個(gè)受廣泛關(guān)注、研究活躍的問(wèn)題。人臉檢測(cè)問(wèn)題最初來(lái)源于人臉識(shí)別(facerecognition).人臉識(shí)別的研究可以追溯到20世紀(jì)60—70年代,經(jīng)過(guò)幾十年的曲折發(fā)展已日趨成熟.人臉檢測(cè)是自動(dòng)人臉識(shí)別系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié),但是早期的人臉識(shí)別研究主要針對(duì)具有較強(qiáng)約束條件的人臉圖像(如無(wú)背景的圖像),往往假設(shè)人臉位置已知或很容易獲得,因此人臉檢測(cè)問(wèn)題并未受到重視.近幾年隨著電子商務(wù)等應(yīng)用的發(fā)展,人臉識(shí)別成為最有潛力的生物身份驗(yàn)證手段,這種應(yīng)用背景要求自動(dòng)人臉識(shí)別系統(tǒng)能夠?qū)σ话悱h(huán)境圖像具有一定的適應(yīng)能力,由此所面臨的一系列問(wèn)題使得人臉檢測(cè)開(kāi)始作為一個(gè)獨(dú)立的課題受到研究者的重視.今天,人臉檢測(cè)的應(yīng)用背景已經(jīng)遠(yuǎn)遠(yuǎn)超出了人臉識(shí)別系統(tǒng)的范疇,在基于內(nèi)容的檢索、數(shù)字視頻處理、視覺(jué)監(jiān)測(cè)等方面有著重要的應(yīng)用價(jià)值.人臉檢測(cè)研究具有重要的學(xué)術(shù)價(jià)值.人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo),此類目標(biāo)的檢測(cè)問(wèn)題的挑戰(zhàn)性在于:(1)人臉由于外貌、表情、膚色等不同,具有模式的可變性;(2)一般意義下的人臉上,可能存在眼鏡、胡須等附屬物;(3)作為三維物體的人臉的影像不可避免地受由光照產(chǎn)生的陰影的影響.因此,如果能夠找到解決這些問(wèn)題的方法,成功構(gòu)造出人臉檢測(cè)與跟蹤系統(tǒng),將為解決其它類似的復(fù)雜模式檢測(cè)問(wèn)題提供重要的啟示.目前,國(guó)外對(duì)人臉檢測(cè)問(wèn)題的研究很多,比較著名的有MIT,CMU等;國(guó)內(nèi)的清華大學(xué)、北京工業(yè)大學(xué)、中國(guó)科學(xué)院計(jì)算技術(shù)研究所和中國(guó)科學(xué)院自動(dòng)化研究所等都有人員從事人臉檢測(cè)相關(guān)的研究.而且,MPEG7標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識(shí)別草案小組,人臉檢測(cè)算法也是一項(xiàng)征集的內(nèi)容.隨著人臉檢測(cè)研究的深入,國(guó)際上發(fā)表的有關(guān)論文數(shù)量也大幅度增長(zhǎng),如IEEE的FG(IEEEInternationalConferenceonAutomaticFaceandGestureRecognition)、ICIP(InternationalConferenceonImageProcessing)、CVPR(ConferenceonComputerVisionandPatternRecognition)等重要國(guó)際會(huì)議上每年都有大量關(guān)于人臉檢測(cè)的論文,占有關(guān)人臉研究論文的近1/3之多.有關(guān)人臉檢測(cè)的內(nèi)容在人臉識(shí)別研究的綜述中有所涉及,但僅僅側(cè)重于人臉識(shí)別系統(tǒng)的輸入環(huán)節(jié),目前較為詳盡的人臉檢測(cè)與跟蹤綜述為文獻(xiàn),著重于介紹各種方法所使用的特征和模型,本文則系統(tǒng)地整理分析了相關(guān)的研究文獻(xiàn),按照人臉檢測(cè)的問(wèn)題分類與模式分析、人臉特征的提取與綜合等線索對(duì)近年來(lái)的研究進(jìn)行了綜述.2人臉模式的系統(tǒng)研究人臉檢測(cè)問(wèn)題所包含的內(nèi)容十分廣泛,從不同的角度可以有多種分類方法(表1).本文主要討論靜止圖像中的人臉檢測(cè)問(wèn)題.動(dòng)態(tài)圖像中單幀內(nèi)的人臉檢測(cè)與靜止圖像的情況基本相同,若考慮動(dòng)態(tài)信息則屬于人臉跟蹤(facetracking)問(wèn)題,將不在本文討論.人臉圖像所包含的模式特征十分豐富,如圖1所示.這些特征中哪些是最有用的、如何利用這些特征,是人臉檢測(cè)要研究的一個(gè)關(guān)鍵問(wèn)題.人臉模式具有復(fù)雜而細(xì)致的變化,因此一般需要采用多種模式特征綜合的方法,如圖2所示.歸納起來(lái),根據(jù)利用特征的色彩屬性可以將人臉檢測(cè)方法分為基于膚色特征的方法和基于灰度特征的方法兩類.前者適用于構(gòu)造快速的人臉檢測(cè)和人臉跟蹤算法,后者利用了人臉區(qū)別于其它物體的更為本質(zhì)的特征,是人臉檢測(cè)領(lǐng)域研究的重點(diǎn).根據(jù)特征綜合時(shí)采用的不同模型,可以將基于灰度特征的方法分為兩大類:基于啟發(fā)式(知識(shí))模型的方法和基于統(tǒng)計(jì)模型的方法.由于人臉檢測(cè)問(wèn)題的復(fù)雜性,無(wú)論哪一類方法都無(wú)法適應(yīng)所有的情況,一般都針對(duì)人臉檢測(cè)領(lǐng)域內(nèi)某個(gè)或某些特定的問(wèn)題.3面部特征的提取人臉模式的特征包括膚色特征和灰度特征.3.1色度空間與結(jié)構(gòu)膚色是人臉的重要信息,不依賴于面部的細(xì)節(jié)特征,對(duì)于旋轉(zhuǎn)、表情等變化情況都能適用,具有相對(duì)的穩(wěn)定性并且和大多數(shù)背景物體的顏色相區(qū)別.因此膚色特征在人臉檢測(cè)中是最常用的一種特征.膚色特征主要由膚色模型描述.使用何種形式的膚色模型與色度空間(chrominancespace)的選擇密切相關(guān).可以從兩個(gè)方面考察某種色度空間:(1)在該色度空間中能否用給定的模型描述“膚色”區(qū)域的分布;(2)色度空間中“膚色”與“非膚色”區(qū)域的重疊有多少.人臉檢測(cè)常用的色度空間主要有RGB(紅、綠、藍(lán)三基色)、rgb(亮度歸一化的三基色)、SHI(飽和度、色調(diào)、亮度)、YIQ(NTSC制的光亮度和色度模型)、YUV(PAL制的光亮度和色度模型)、YCbCr(CCIR601編碼方式的色度模型,與YUV在數(shù)學(xué)上具有等價(jià)性)、CIEL*a*b(國(guó)際照明委員會(huì)提出的基于色度學(xué)的彩色模型)等.常用的膚色模型有高斯模型、混合高斯模型和直方圖模型.Terrillon等考察了歸一化的r-g、CIE-xy、歸一化的TSL、CIE-DSH、HSV、YIQ、YES、CIE-L*u*v和CIE-L*a*b9種色度空間,比較了高斯模型和混合高斯模型在不同色度空間中的性能,發(fā)現(xiàn)除了少數(shù)情況外,一般需要使用混合高斯模型才能較好地描述膚色區(qū)域的分布.Terrillon等同時(shí)指出,最終限制檢測(cè)性能的因素是不同色度空間中“膚色”與“非膚色”區(qū)域的重疊程度.Jones等研究了RGB空間中“膚色”與“非膚色”像素的分布,根據(jù)標(biāo)定出膚色區(qū)域的近2萬(wàn)幅圖片(包含約20億個(gè)像素)建立了三維直方圖,在此基礎(chǔ)上比較了直方圖模型和混合高斯模型,發(fā)現(xiàn)前者的性能略好于后者.除上述3種膚色模型外,還有直接利用幾何參數(shù)描述膚色區(qū)域分布范圍的模型、三維投影模型、基于神經(jīng)網(wǎng)的膚色模型等.此外也有同時(shí)考慮“膚色”與“非膚色”像素分布的基于貝葉斯方法的模型.3.2人臉核心區(qū)域灰度特征包括人臉輪廓特征、人臉灰度分布特征(鑲嵌圖特征、直方圖特征等)、器官特征(對(duì)稱性等)、模板特征等.輪廓是人頭部的重要特征.Craw等首先在低分辨率圖像中使用一個(gè)輪廓模板匹配出人臉的大致范圍,然后在高分辨率圖像中使用Sobel算子獲得邊緣的位置和方向,并連接出完整的人臉輪廓.Wang等提取邊緣特征并根據(jù)廣義Hough變換抽取橢圓形狀信息.人臉核心區(qū)域(眼睛、鼻子、嘴區(qū)域)具有獨(dú)特的灰度分布特征.Yang等首先提出了人臉的鑲嵌圖(mosaicimage,又稱為馬賽克圖)特征.所謂鑲嵌圖就是將圖像劃分為一組大小相同的方格,每個(gè)方格的灰度為格中各個(gè)像素的平均值.鑲嵌圖特征是指這些塊的值應(yīng)滿足的約束規(guī)則.Lu等依據(jù)人臉的左右對(duì)稱性,通過(guò)提取投影直方圖特征檢測(cè)人臉的旋轉(zhuǎn)角度,再提取鑲嵌圖特征.Dai等提取空間灰度共現(xiàn)矩陣(SGLD)特征等等.人臉區(qū)域內(nèi)的各個(gè)器官(如雙眼、鼻子、嘴等)是人臉的重要特征.Kouzani等使用人工神經(jīng)網(wǎng)分別檢測(cè)眼睛、鼻子、嘴以及人臉的整體特征.人臉區(qū)域的灰度本身可以作為模板特征,通常取僅包含雙眼、鼻子和嘴的面部中心區(qū)域作為共性的人臉模板特征,排除掉頭發(fā)、臉頰兩側(cè)變化很大的部分.被廣泛地用于基于統(tǒng)計(jì)學(xué)習(xí)的人臉檢測(cè)方法中.4面部特征的綜合人臉的檢測(cè)過(guò)程實(shí)際上就是對(duì)人臉模式特征的綜合判斷過(guò)程,包括多種方法.4.1細(xì)胞被裂變后的人臉及細(xì)胞的歸并對(duì)于彩色圖像,在確定膚色模型之后,首先可以進(jìn)行膚色檢測(cè).在檢測(cè)出膚色像素后,需要根據(jù)它們?cè)谏壬系南嗨菩院涂臻g上的相關(guān)性分割出可能的人臉區(qū)域,同時(shí)利用區(qū)域的幾何特征或灰度特征進(jìn)行是否是人臉的驗(yàn)證,以排除其它色彩類似膚色的物體.區(qū)域分割與驗(yàn)證在很多方法中是密切結(jié)合、統(tǒng)一考慮的.在一些情況下,僅根據(jù)膚色像素的聚積特性即可完成區(qū)域分割.Yoo等利用膚色像素的連通性分割出區(qū)域,使用橢圓擬合各個(gè)區(qū)域,根據(jù)橢圓長(zhǎng)短軸的比率判斷其是否為人臉.Cai等根據(jù)膚色模型提供的像素的似然度,采用從局部最大值處逐漸擴(kuò)展的方法得到膚色區(qū)域,然后使用灰度平均臉模板匹配的方法驗(yàn)證區(qū)域內(nèi)是否有人臉.對(duì)于較為復(fù)雜的情況,則需要考慮兩方面的問(wèn)題:(1)由于光照和臉部器官的影響,人臉可能被割裂為若干互不連通的膚色區(qū)域;(2)人臉區(qū)域可能與其它類膚色區(qū)域連接在一起.聚類-歸并-驗(yàn)證策略是較常用的解決方法:首先將膚色像素按照較為嚴(yán)格的顏色一致性和幾何約束條件聚類為區(qū)域,然后按照一定規(guī)則進(jìn)行歸并,歸并后或歸并過(guò)程中利用其它特征進(jìn)行驗(yàn)證.Garcia等按照色度的差異將膚色進(jìn)一步量化為不同的類型,將類型相同且相鄰的膚色像素聚類為區(qū)域,根據(jù)幾何位置、形狀和色調(diào)相容性進(jìn)行歸并,歸并過(guò)程中利用區(qū)域的小波特征進(jìn)行驗(yàn)證.Yang等根據(jù)色度的一致性和空間距離將膚色像素聚類成區(qū)域,然后逐步歸并直到得到符合一定先驗(yàn)知識(shí)的橢圓區(qū)域?yàn)橹?最后檢查區(qū)域中由眼睛、嘴巴等特征形成的暗區(qū)或空洞,以確定是否為人臉.Abdel-Mottaleb等首先排除了局部鄰域內(nèi)亮度變化較大的膚色像素,對(duì)其余膚色像素進(jìn)行聚類,從而得到色度一致的區(qū)域;然后使用基于鄰接圖的方法歸并不連通的區(qū)域,并且檢查區(qū)域內(nèi)亮度在鄰域中變化較大的像素(可能對(duì)應(yīng)于眼睛、嘴等特征)所占的比率,對(duì)歸并結(jié)果進(jìn)行驗(yàn)證.另一種策略是先用較弱的條件將膚色像素聚類為區(qū)域,再將符合一定條件的區(qū)域分裂開(kāi).Wei等根據(jù)區(qū)域的大小和形狀找出可能的人臉,剩下的區(qū)域按照一定規(guī)則不斷分裂,以便找出與類膚色背景連接在一起的人臉,最后利用亮度信息對(duì)各個(gè)區(qū)域進(jìn)行驗(yàn)證.還有一些方法使用膚色模板進(jìn)行搜索匹配.Karlekar等對(duì)YCbCr格式的彩色圖像進(jìn)行了小波變換,訓(xùn)練一個(gè)多層感知器在Cb,Cr平面的低通色度子圖中檢測(cè)膚色像素,然后使用一個(gè)“人臉-背景”二值人臉模板匹配搜索,最后利用亮度分量的小波變換系數(shù)驗(yàn)證搜索結(jié)果.Wu等采用了模糊模板匹配方法,該方法不僅建立了膚色模型,同時(shí)也建立了頭發(fā)顏色的模型.根據(jù)人臉位姿的不同,構(gòu)造了5種“膚色-發(fā)色”模板,并定義了相應(yīng)的隸屬度函數(shù)和模糊匹配規(guī)則,對(duì)所有可能尺度和位置的區(qū)域進(jìn)行搜索.此外,還有在分割之前就將膚色檢測(cè)的結(jié)果與其它特征融合在一起的方法,如Sun等提出的基于膚色與對(duì)稱信息的方法、Kim等提出的膚色信息與深度信息相結(jié)合的方法等.4.2人臉局部特征檢測(cè)基于啟發(fā)式模型的方法首先抽取幾何形狀、灰度、紋理等特征,然后檢驗(yàn)它們是否符合人臉的先驗(yàn)知識(shí).Govindaraju等使用變形模板(deformabletemplate)匹配頭頂輪廓線和左右兩條面頰輪廓線,實(shí)現(xiàn)人臉定位.Yang等提出了基于鑲嵌圖(mosaicimage,又稱為馬賽克圖)的人臉檢測(cè)方法.Yang等將人臉的五官區(qū)域分別劃分為4×4個(gè)和8×8個(gè)馬賽克塊,使用一組規(guī)則進(jìn)行檢驗(yàn),并且利用邊緣特征進(jìn)一步驗(yàn)證.盧春雨等對(duì)鑲嵌圖方法進(jìn)行了改進(jìn),按照人臉器官的分布將人臉劃分為3×3個(gè)馬賽克塊,在檢測(cè)中自適應(yīng)地調(diào)整各塊的大小,使用一組基于各塊灰度和梯度統(tǒng)計(jì)特征的知識(shí)規(guī)則檢驗(yàn)該區(qū)域是否為人臉,取得了較好的實(shí)驗(yàn)結(jié)果.人臉區(qū)域內(nèi)的各個(gè)器官也具有較為恒定的模式,因此一些方法首先檢測(cè)器官(如雙眼、鼻子、嘴等)或局部特征,然后根據(jù)它們的相對(duì)位置關(guān)系判斷整個(gè)區(qū)域是否為人臉.Kouzani等將使用人工神經(jīng)網(wǎng)分別檢測(cè)出來(lái)的眼睛、鼻子、嘴以及人臉的整體特征及相互間的位置關(guān)系輸入一個(gè)模糊神經(jīng)元網(wǎng)絡(luò),根據(jù)其中的領(lǐng)域知識(shí)判斷被檢測(cè)的區(qū)域是否為人臉.Miao等從輸入圖像中提取可能對(duì)應(yīng)于眉毛、眼睛、嘴等器官的水平方向的馬賽克邊緣(mosaicedge),計(jì)算各段邊緣的“重心”(gravitycenter)后,使用“重心”模板進(jìn)行匹配,最后使用灰度和邊緣特征驗(yàn)證匹配的結(jié)果.該方法對(duì)人臉位姿的變化具有較強(qiáng)的適應(yīng)能力.采用局部特征檢測(cè)方法的還有基于雙眼檢測(cè)的方法、基于概率框架的局部特征聚類方法以及結(jié)構(gòu)模型、紋理模型和特征模型相結(jié)合的方法等.人臉灰度模板也可以看作是一種啟發(fā)式模型.梁路宏等使用了直接的平均臉模板匹配方法.與Cai等的方法不同,該方法考慮到眼睛在人類辨識(shí)人臉過(guò)程中的特殊作用,使用雙眼模板首先進(jìn)行粗篩選,然后使用不同長(zhǎng)寬比的人臉模板進(jìn)行匹配,最后使用馬賽克規(guī)則進(jìn)行驗(yàn)證.使用的模板參見(jiàn)圖3.此外還有Lu等根據(jù)投影直方圖分析首先確定人臉的旋轉(zhuǎn)角度,然后使用基于鑲嵌圖的方法檢測(cè)人臉;Dai等根據(jù)空間灰度共現(xiàn)矩陣特征檢測(cè)人臉等等.其它基于知識(shí)模型的方法可以參見(jiàn)文獻(xiàn).利用人臉的輪廓、對(duì)稱性等少量特征的方法適用于較強(qiáng)約束條件下(如簡(jiǎn)單背景、頭肩圖像)的人臉檢測(cè).由于使用的特征較少,此類算法可以達(dá)到較高的檢測(cè)速度,實(shí)現(xiàn)實(shí)時(shí)檢測(cè)與跟蹤.利用人臉五官分布特征的知識(shí)模型方法能夠在一定程度上適用于復(fù)雜背景圖像中的人臉檢測(cè),同時(shí)達(dá)到較高的檢測(cè)速度,如文獻(xiàn)等.但是需要看到,要想進(jìn)一步提高知識(shí)模型的適應(yīng)能力,需要綜合更多的特征,這實(shí)際上涉及到圖像理解這一困難的問(wèn)題.這是此類方法進(jìn)一步發(fā)展遇到的主要障礙.4.3人臉檢測(cè)問(wèn)題的分類由于人臉圖像的復(fù)雜性,顯式地描述人臉特征具有一定困難,因此另一類方法——基于統(tǒng)計(jì)模型的方法越來(lái)越受到重視.此類方法將人臉區(qū)域看作一類模式,即模板特征,使用大量的“人臉”與“非人臉”樣本訓(xùn)練、構(gòu)造分類器,通過(guò)判別圖像中所有可能區(qū)域?qū)儆谀念惸J降姆椒▽?shí)現(xiàn)人臉的檢測(cè).實(shí)際上,人臉檢測(cè)問(wèn)題被轉(zhuǎn)化為統(tǒng)計(jì)模式識(shí)別的二分類問(wèn)題.4.3.1人臉檢測(cè)算法此類方法將人臉區(qū)域圖像變換到某一特征空間,根據(jù)其在特征空間中的分布規(guī)律劃分“人臉”與“非人臉”兩類模式.主分量分析(Principal-ComponentAnalysis,PCA)是一種常用的方法.它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交變換(K-L變換),以消除原有向量各個(gè)分量間的相關(guān)性.變換得到對(duì)應(yīng)特征值依次遞減的特征向量,即特征臉.Moghaddam等發(fā)現(xiàn)人臉在特征臉空間的投影聚集比較緊密,因此利用前若干張?zhí)卣髂槍⑷四樝蛄客队暗街髟涌臻gF和與其正交的補(bǔ)空間FˉˉˉFˉ,相應(yīng)的距離度量分別稱為DIFS(DistanceInFeatureSpace)和DFFS(DistanceFromFeatureSpace).對(duì)于人臉檢測(cè)問(wèn)題,由于沒(méi)有考慮“非人臉”樣本的分布,需要同時(shí)使用DIFS和DFFS才能取得較好的效果.MIT的Sung等提出了基于事例學(xué)習(xí)的方法,同時(shí)使用了19×19像素分辨率的“人臉”和“非人臉”樣本.樣本預(yù)處理后按行列順序展開(kāi)為樣本向量進(jìn)行主分量分解.采用k-均值聚類方法在特征空間中建立6個(gè)“人臉”簇(Clusters),同時(shí)建立包圍“人臉”簇的6個(gè)“非人臉”簇,以使“人臉”與“非人臉”模式的邊界更為清晰.Sung等使用樣本到各個(gè)簇中心的距離訓(xùn)練一個(gè)多層感知器進(jìn)行分類.需要指出的是,人臉檢測(cè)中“非人臉”樣本的選取是一個(gè)較為困難的問(wèn)題.Sung等使用了“自舉”(bootstrap)方法加以解決:首先建立一個(gè)僅使用“人臉”簇的初始分類器對(duì)一組圖像進(jìn)行檢測(cè),將所有的錯(cuò)誤報(bào)警(不是人臉而被錯(cuò)檢為“人臉”的結(jié)果)加入“非人臉”樣本庫(kù),構(gòu)造新的使用“人臉”與“非人臉”簇的分類器重新檢測(cè).以上過(guò)程不斷迭代,直到收集了足夠的“非人臉”樣本.屬于特征空間方法的還有因子分解方法(FactorAnalysis,FA)和Fisher準(zhǔn)則方法(FisherLinearDiscriminant,FLD).Yang等在混合線性子空間(mixturesoflinearsubspaces)中對(duì)“人臉”和“非人臉”樣本的分布進(jìn)行建模,分別使用基于EM算法的擴(kuò)展FA方法和基于自組織映射(Self-OrganizingMap,SOM)的FLD方法構(gòu)造檢測(cè)器.此外,小波變換也被用于人臉檢測(cè),如文獻(xiàn)中使用了小波變換提取人臉的多分辨率特征作為分類的依據(jù).4.3.2正面和正面旋轉(zhuǎn)人臉人工神經(jīng)網(wǎng)(ANN)方法是把模式的統(tǒng)計(jì)特性隱含在ANN的結(jié)構(gòu)和參數(shù)之中,對(duì)于人臉這類復(fù)雜的、難以顯式描述的模式,基于ANN的方法具有獨(dú)特的優(yōu)勢(shì).CMU的Rowley等使用了多個(gè)ANN檢測(cè)多姿態(tài)的人臉,算法的框架如圖4所示.圖中顯示了兩類ANN:1個(gè)位姿檢測(cè)器(poseestimator)用于估計(jì)輸入窗口中人臉的位姿、3個(gè)檢測(cè)器(detector)分別檢測(cè)正面(frontal)、半側(cè)面(halfprofile)和側(cè)面(profile)的人臉.使用經(jīng)過(guò)對(duì)準(zhǔn)和預(yù)處理的“人臉”樣本以及采用“自舉”(bootstrap)方法收集分類器錯(cuò)分的樣本作為“非人臉”樣本訓(xùn)練各個(gè)ANN,進(jìn)一步修正分類器.檢測(cè)時(shí)對(duì)輸入圖像中所有可能位置和尺度的區(qū)域首先使用位姿檢測(cè)器估計(jì)人臉位姿,經(jīng)校準(zhǔn)和預(yù)處理后送入3個(gè)檢測(cè)器中,最后對(duì)檢測(cè)器的分類結(jié)果進(jìn)行仲裁.在上述框架下,Rowley等對(duì)正面端正人臉和正面旋轉(zhuǎn)人臉的檢測(cè)單獨(dú)進(jìn)行了研究.對(duì)于正面端正的人臉,僅使用了正面人臉檢測(cè)ANN,是一種三層前向網(wǎng):輸入層對(duì)應(yīng)20×20像素的圖像區(qū)域;隱層節(jié)點(diǎn)分為對(duì)應(yīng)不同人臉區(qū)域的若干組,與輸入層部分連接;ANN輸出1到-1區(qū)間的值表示這個(gè)區(qū)域是否為人臉.Rowley等使用相同的“人臉”樣本和不同“自舉”過(guò)程收集的“非人臉”樣本訓(xùn)練了多個(gè)正面人臉檢測(cè)ANN,對(duì)它們的檢測(cè)結(jié)果進(jìn)行仲裁,以進(jìn)一步減少錯(cuò)誤報(bào)警.對(duì)于正面旋轉(zhuǎn)人臉的檢測(cè)使用了旋轉(zhuǎn)角度檢測(cè)器及正面人臉檢測(cè)ANN,并使用相似的多ANN仲裁方法降低錯(cuò)誤報(bào)警.基于人工神經(jīng)網(wǎng)的方法還有Juell等和Kou-zani等提出的基于人臉器官檢測(cè)的多級(jí)網(wǎng)絡(luò)方法、Anifantis等提出的雙輸出人工神經(jīng)網(wǎng)的檢測(cè)算法等.4.3.3基于概率估計(jì)的人臉檢測(cè)基于概率模型方法的一種思路是計(jì)算輸入圖像區(qū)域region屬于人臉模式object的后驗(yàn)概率p(object|region),據(jù)此對(duì)所有可能的圖像窗口進(jìn)行判別.CMU的Schneiderman等提出一種基于后驗(yàn)概率估計(jì)的人臉檢測(cè)方法.該方法利用貝葉斯原理將后驗(yàn)概率估計(jì)轉(zhuǎn)化為一個(gè)似然度求解問(wèn)題:P(region|object)P(region|objectˉˉˉˉˉˉˉˉˉ)<objectˉˉˉˉˉˉˉˉˉobject>λ=P(objectˉˉˉˉˉˉˉˉˉ)P(object),Ρ(region|object)Ρ(region|objectˉ)<objectˉobject>λ=Ρ(objectˉ)Ρ(object),將難以估計(jì)的先驗(yàn)概率P(objectˉˉˉˉˉˉˉˉˉ)Ρ(objectˉ)和P(object)用一個(gè)比率參數(shù)λ代替,作為調(diào)節(jié)檢測(cè)器敏感度的參量.Schneiderman等采用64×64像素的模式區(qū)域,將其分為16個(gè)子區(qū)域,通過(guò)子區(qū)域獨(dú)立性等假設(shè)降低“人臉”和“非人臉”模式分布表達(dá)式P(region|object)和P(region|objectˉˉˉˉˉˉˉˉˉ)Ρ(region|objectˉ)的復(fù)雜性,最后轉(zhuǎn)化為稀疏編碼的直方圖,通過(guò)計(jì)算訓(xùn)練樣本的頻度求得兩種模式的概率分布.Schneiderman等還將概率估計(jì)的方法用于檢測(cè)正面旋轉(zhuǎn)人臉和側(cè)面人臉,同時(shí)使用多分辨率信息復(fù)用和由粗到精搜索的策略提高檢測(cè)的速度.屬于這一類的還有Weber等提出的視點(diǎn)不變性學(xué)習(xí)(Viewpoint-InvariantLearning)的方法等.另一種概率模型是用于描述信號(hào)統(tǒng)計(jì)特性的隱馬爾可夫模型(HiddenMarkovModels,HMM),目前也被應(yīng)用于人臉檢測(cè)與識(shí)別.Nefian等根據(jù)正面人臉由上到下各個(gè)區(qū)域(頭發(fā)、額頭、雙眼、鼻子、嘴)具有自然不變的順序這一事實(shí),使用一個(gè)包含五個(gè)狀態(tài)的一維連續(xù)HMM加以表示.將頭部圖像按照這五個(gè)區(qū)域劃分為互有重疊的條塊,對(duì)各塊進(jìn)行K-L變換,選取前若干個(gè)變換系數(shù)作為觀測(cè)向量訓(xùn)練HMM.Nefian等還提出了基于嵌入式HMM的人臉檢測(cè)方法.該方法同時(shí)考慮到人臉由左到右各個(gè)特征的自然順序,使用了二維HMM,并且采用二維DCT變換的系數(shù)作為觀察向量.此外還有Meng等使用HMM描述人臉的小波特征中不同級(jí)間的相關(guān)性等方法.基于HMM的方法一般只使用“人臉”樣本進(jìn)行訓(xùn)練,主要針對(duì)用于人臉識(shí)別的頭肩部圖像.4.3.4svm的泛化應(yīng)用支持向量機(jī)(SupportVectorMachines,SVM)是Vapnik等提出的基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理(StructuralRiskMinimizationPrinciple,SRM)的統(tǒng)計(jì)學(xué)習(xí)理論,用于分類與回歸問(wèn)題.SRM使VC(VapnikCherovnenkis)維數(shù)的上限最小化,這使得SVM方法比基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(EmpiricalRiskMinimizationPrinciple,ERM)的人工神經(jīng)網(wǎng)方法具有更好的泛化能力.Osuna等將SVM方法用于人臉檢測(cè),取得了較好的實(shí)驗(yàn)結(jié)果.該方法的基本思路是對(duì)每一個(gè)19×19像素的檢測(cè)窗口使用SVM進(jìn)行分類,以區(qū)分“人臉”和“非人臉”窗口.SVM的訓(xùn)練使用了大量人臉樣本和“自舉”方法收集的“非人臉”樣本,并且使用逼近優(yōu)化的方法減少支持矢量的數(shù)量.需要說(shuō)明的是,長(zhǎng)期以來(lái)SVM的訓(xùn)練需要求解計(jì)算復(fù)雜度極高的二次規(guī)劃問(wèn)題,限制了該方法的應(yīng)用.Platt提出的SMO(SequentialMinimalOptimization)算法解決了SVM訓(xùn)練困難的問(wèn)題.4.3.5高檢測(cè)系統(tǒng)的魯棒性檢測(cè)基于統(tǒng)計(jì)模型的方法是目前比較流行的方法,是解決復(fù)雜的人臉檢測(cè)問(wèn)題的有效途徑.它具有如下優(yōu)點(diǎn):(1)不依賴于人臉的先驗(yàn)知識(shí)和參數(shù)模型,可以避免不精確或不完整的知識(shí)造成的錯(cuò)誤;(2)采用了實(shí)例學(xué)習(xí)的方法獲取模型的參數(shù),統(tǒng)計(jì)意義上更為可靠;(3)通過(guò)增加學(xué)習(xí)的實(shí)例可以擴(kuò)充檢測(cè)模式的范圍、提高檢測(cè)系統(tǒng)的魯棒性.基于統(tǒng)計(jì)模型的方法大多適用于復(fù)雜背景圖像中的人臉檢測(cè).目前基于統(tǒng)計(jì)模型的方法主要針對(duì)正面端正人臉的檢測(cè).評(píng)估不同方法的性能需要共同的測(cè)試集,目前比較公認(rèn)的測(cè)試集是Sung等的MIT測(cè)試集和Rowley等的CMU測(cè)試集(涵蓋了Sung等的測(cè)試集).表2列出了幾個(gè)具有代表性的算法在該測(cè)試集上的檢測(cè)結(jié)果統(tǒng)計(jì).由于基于統(tǒng)計(jì)的方法對(duì)訓(xùn)練樣本具有較強(qiáng)的依賴性,因此表中同時(shí)列出了各種方法使用的樣本規(guī)模.需要指出的是,由于人臉檢測(cè)問(wèn)題本身的復(fù)雜性,加之不同方法往往具有不同的針對(duì)性,表2所列數(shù)據(jù)并不是為了比較各種方法的優(yōu)劣,而是用來(lái)說(shuō)明目前的研究所達(dá)到的大致水平.基于統(tǒng)計(jì)模型的方法具有很強(qiáng)的適應(yīng)能力和魯棒性,但由于需要對(duì)所有可能的檢測(cè)窗口進(jìn)行窮舉搜索,計(jì)算復(fù)雜度很高,因此檢測(cè)速度有待于提高,另外“非人臉”樣本的選取仍然是一個(gè)較為困難的問(wèn)題.此類方法主要針對(duì)正面端正人臉的檢測(cè),旋轉(zhuǎn)人臉、多姿態(tài)人臉的檢測(cè)由于比較復(fù)雜和困難,有效的方法還不多.5人臉檢測(cè)的出路本文結(jié)合近年來(lái)人臉檢測(cè)問(wèn)題上的研究工作,綜述了人臉檢測(cè)問(wèn)題的研究現(xiàn)狀.隨著人機(jī)交互技術(shù)日益成為當(dāng)前研究的一個(gè)中心,人臉檢測(cè)問(wèn)題越來(lái)越受到重視,成為模式識(shí)別與計(jì)算機(jī)視覺(jué)領(lǐng)域研究的一個(gè)熱點(diǎn).人臉檢測(cè)問(wèn)題的內(nèi)涵十分廣泛,已有的方法一般都是針對(duì)某一類問(wèn)題提出的.由于人臉檢測(cè)問(wèn)題的復(fù)雜性,實(shí)現(xiàn)通用的人臉檢測(cè)方法還不現(xiàn)實(shí),因此解決特定約束條件下或某種應(yīng)用背景下的人臉檢測(cè)問(wèn)題仍將是該領(lǐng)域研
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年山西晉中市左權(quán)縣遼潤(rùn)水務(wù)建設(shè)投資有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 2025年遼寧交通物資有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年江山崇安燃?xì)庥邢薰菊衅腹P試參考題庫(kù)含答案解析
- 2025年廣西梧州茶廠有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年山東東方大廈有限公司招聘筆試參考題庫(kù)含答案解析
- 網(wǎng)約車行業(yè)安全培訓(xùn)體系
- 2024水產(chǎn)養(yǎng)殖產(chǎn)品包裝設(shè)計(jì)與銷售合同3篇
- 2024生物制藥技術(shù)開(kāi)發(fā)轉(zhuǎn)讓合同
- 二零二五年度物業(yè)節(jié)能管理合同:促進(jìn)綠色建筑節(jié)能降耗2篇
- 二零二五年度甲方與某公司現(xiàn)代農(nóng)業(yè)勞務(wù)派遣與科技農(nóng)業(yè)合同2篇
- 煤炭運(yùn)輸安全保障措施提升運(yùn)輸安全保障措施
- JTGT-3833-2018-公路工程機(jī)械臺(tái)班費(fèi)用定額
- LDA型電動(dòng)單梁起重機(jī)參數(shù)
- 保安巡邏線路圖
- (完整版)聚乙烯課件
- 中國(guó)雷暴日多發(fā)區(qū)特征及雷電發(fā)展變化
- 大華基線解碼器解碼上墻的操作
- 干部業(yè)績(jī)相關(guān)信息采集表
- 八年級(jí)上綜合性學(xué)習(xí) 我們的互聯(lián)網(wǎng)時(shí)代 練習(xí)卷(含答案)
- 2022-2023學(xué)年四川省成都市高新區(qū)八年級(jí)(下)期末語(yǔ)文試卷(含解析)
- 中西文化概論(第三版)PPT完整全套教學(xué)課件
評(píng)論
0/150
提交評(píng)論