畢業(yè)設(shè)計(jì)-在Ycbcr空間中的基于膚色的人臉檢測_第1頁
畢業(yè)設(shè)計(jì)-在Ycbcr空間中的基于膚色的人臉檢測_第2頁
畢業(yè)設(shè)計(jì)-在Ycbcr空間中的基于膚色的人臉檢測_第3頁
畢業(yè)設(shè)計(jì)-在Ycbcr空間中的基于膚色的人臉檢測_第4頁
畢業(yè)設(shè)計(jì)-在Ycbcr空間中的基于膚色的人臉檢測_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

武漢理工大學(xué)畢業(yè)設(shè)計(jì)〔論文〕基于視頻的人臉檢測研究學(xué)院〔系〕:機(jī)電工程學(xué)院專業(yè)班級:學(xué)生姓名:指導(dǎo)教師:學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包括任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品。本人完全意識(shí)到本聲明的法律后果由本人承當(dāng)。作者簽名:年月日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保障、使用學(xué)位論文的規(guī)定,同意學(xué)校保存并向有關(guān)學(xué)位論文管理部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)省級優(yōu)秀學(xué)士論文評選機(jī)構(gòu)將本學(xué)位論文的全部或局部內(nèi)容編入有關(guān)數(shù)據(jù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本學(xué)位論文屬于1、保密囗,在年解密后適用本授權(quán)書2、不保密囗?!舱?jiān)谝陨舷鄳?yīng)方框內(nèi)打“√”〕作者簽名:年月日導(dǎo)師簽名:年月日目錄TOC\o"1-2"\h\z\u摘要IAbstractII1緒論11.1課題背景及研究意義11.2國內(nèi)外研究開展現(xiàn)狀21.3本文的主要內(nèi)容32人臉檢測技術(shù)簡介42.1基于先驗(yàn)知識(shí)的方法42.2基于特征的方法52.3基于模板匹配的方法62.4基于統(tǒng)計(jì)模型的方法62.5本文算法方案的提出93算法設(shè)計(jì)與matlab實(shí)現(xiàn)103.1常見的顏色空間103.2顏色空間地選擇143.3膚色模型的建立143.4膚色的提取153.5人臉區(qū)域形態(tài)學(xué)處理163.6人臉區(qū)域的篩選與標(biāo)記173.7誤檢分析224結(jié)論及展望24參考文獻(xiàn)25致謝26摘要人臉識(shí)別技術(shù)屬于生物驗(yàn)證的一種,在身份驗(yàn)證領(lǐng)域日益發(fā)揮重要作用,具有十分廣泛的應(yīng)用前景。人臉檢測和定位問題是人臉識(shí)別技術(shù)首先要解決的問題。人臉檢測算法是一個(gè)高效的、自動(dòng)的人臉識(shí)別系統(tǒng)中的關(guān)鍵技術(shù)之一。如今人臉檢測問題已成為一個(gè)熱門研究領(lǐng)域,新的算法不斷被提出,不過由于人臉的復(fù)雜性,目前尚不能找到一個(gè)完美的算法。在不同應(yīng)用環(huán)境下,有不同的算法,本文針對應(yīng)用于視頻中人臉檢測問題進(jìn)行了研究,論文的主要工作如下:本文首先對當(dāng)下流行的幾種人臉檢測算法進(jìn)行分析并比擬各自在視頻人臉識(shí)別中的適用性。結(jié)合其實(shí)現(xiàn)難度,提出一個(gè)能適應(yīng)視頻人臉識(shí)別的在YCbCr色彩空間中基于膚色的人臉檢測算法,由于膚色在YCbCr空間受亮度信息的影響較小,本算法直接考慮YCbCr空間的CbCr分量,映射為兩維獨(dú)立分布的CbCr空間。在CbCr空間下,膚色類聚性好,利用人工閾值法將膚色與非膚色區(qū)域分開,形成二值圖像。非膚色區(qū)域中依然有可能有局部區(qū)域顏色與膚色相近,所以閾值分割后的圖像依然存有局部假膚色區(qū)域,經(jīng)過形態(tài)學(xué)處理和限制長寬比之后,可得到人臉區(qū)域。在確定人臉區(qū)域后,我們需要在原圖上對人臉區(qū)域進(jìn)行標(biāo)記,這里可通過找到一些關(guān)鍵點(diǎn),作出矩形框標(biāo)記人臉區(qū)域。關(guān)鍵詞:YCbCr色彩空間;膚色分割;人臉檢測。AbstractFacerecognitiontechnologyisakindofbiologicalvalidation,inauthenticationrealm,playanincreasinglyimportantrole,withaverywiderangeofapplications.Facedetectionisthefirstproblemtobesolved.Facedetectionalgorithmisoneofthekeystechnologiesofanefficient,automatedfacerecognitionsystem.Today,facedetectionhasbecomeahotresearchfield,newalgorithmscontinuetobemade??,butbecauseofthecomplexityoftheface,itisnotyetfoundaperfectalgorithm.Indifferentapplicationenvironment,therearedifferentalgorithms,thispaperstudiedappliestohumanfacedetectionvideo,thepaper'smainworkisasfollows:Thisarticleanalyzeseveralcurrentpopularfacedetectionalgorithmfirstandthencomparetheirapplicabilityinthefacerecognitionforvideo.Combinedwithitsimplementationdifficulty,proposeanadaptivefacerecognitionforvideointheYCbCrcolorspace,color-basedfacedetectionalgorithm,asintheYCbCrcolorspacelessaffectedbythebrightnessinformation,theproposedalgorithmdirectlyconsiderCbCrcomponentYCbCrspace,two-dimensionaldistributionmapofCbCrspaceindependent.InCbCrSpace,colorclusteringisgood,theuseofartificialthresholdmethodtoseparatetheskinandnon-skinregion,formedabinaryimage.Innon-skinregion,therearestillsomeareasmayhavesimilarcolorandskincolor,soafterthresholdingtheimagestillexistsomefalsecolorregion,throughmorphologicalprocessingandconstraintheaspectratio,theobtainedfaceregion.Indeterminingthefaceregion,weneedtomarkthefaceregionontheoriginalpicture,Byfindingsomekeypointsthe??rectanglelabeledhumanfaceregioncouldbemade.Keywords:YCbCrcolorSpace;skincolorsegmentation;humanfacedetection.1緒論1.1課題背景及研究意義1.1.1課題背景自古以來,有關(guān)身份驗(yàn)證的研究就一直沒有停止過,古代主要通過印章來驗(yàn)證身份,此法沿用至今,到現(xiàn)代,隨著計(jì)算機(jī)和信息技術(shù)的開展,人類通過密碼、ID卡、IC卡等來驗(yàn)證身份,目前,人們還有通過人類的生物特征來驗(yàn)證身份,比方說大家熟知的指紋驗(yàn)證、精確度更高的虹膜驗(yàn)證、掌紋驗(yàn)證、人臉識(shí)別〔facerecognition〕驗(yàn)證等,其中,人臉識(shí)別驗(yàn)證是難度最大的。近年來隨著人工智能和電子商務(wù)迅速開展,人臉識(shí)別技術(shù)成為最有潛力的生物識(shí)別技術(shù)和人類生物特征驗(yàn)證手段。利用計(jì)算機(jī)處理人臉圖像,從中提取出有效的面部信息并以此來辯識(shí)該人的身份的技術(shù),便為人臉識(shí)別技術(shù)。相對于其他身份識(shí)別技術(shù),人臉識(shí)別技術(shù)具有友好,使用方便,受限小等優(yōu)點(diǎn)。人臉識(shí)別技術(shù)可以被應(yīng)用在多種不同的需要身份驗(yàn)證的領(lǐng)域,如金融、證券、公安部門的刑偵等領(lǐng)域。隨著網(wǎng)絡(luò)技術(shù)的開展和其日益廣泛的應(yīng)用,信息平安也成為非常重要的一個(gè)方面,如果將人臉識(shí)別應(yīng)用到計(jì)算機(jī)的登錄上,那么相對于密碼登錄,能更加高效地保證計(jì)算機(jī)被使用時(shí)的平安性。在人臉識(shí)別系統(tǒng)中,對于人臉的檢測與定位是人臉能實(shí)現(xiàn)有效識(shí)別的先決條件和關(guān)鍵技術(shù),在人臉識(shí)別技術(shù)的早期,都是認(rèn)為人臉是已經(jīng)得到并已實(shí)現(xiàn)定位的假設(shè)下進(jìn)行的,但隨著技術(shù)的應(yīng)用日益廣泛,此項(xiàng)假設(shè)已經(jīng)不能滿足需求,這便提出了人臉檢測〔facedetection〕技術(shù)。對于人臉檢測技術(shù),主要涉及以下幾個(gè)問題的研究:人臉特征的描述:即如何描述一張人臉的典型特征,比方說相對固定的幾何外形,都有眼睛和嘴巴,對于同一人種,膚色大家都差不多,也就是膚色具有類聚的特征,對于不同的特征描述方式,我們就會(huì)提出不同的檢測方法,可以這樣說,選擇一個(gè)較好的人臉特征描述方式,那我們就會(huì)事半功倍,取得較好的效果。尺度:對于不同的人臉照片,人臉的大小會(huì)有所不同,在同一張相片中,也可能有大小不一的人臉,這對于在對人臉的大小特征描述是一個(gè)比擬大的挑戰(zhàn)。搜索策略:在描述了人臉特征之后,如何搜索到這些特征點(diǎn)便要用到適宜的搜索策略。速度和精度:任何一個(gè)實(shí)現(xiàn)判斷功能的系統(tǒng),其精度和速度都是十分重要的指標(biāo)。人臉檢測也不例外,在我們選擇特征描述和搜索策略時(shí),要在滿足精度和速度要求下進(jìn)行[1-2]。人臉檢測的難點(diǎn)主要有一下幾項(xiàng):(1)如何判斷圖像中是否存在人臉,如何區(qū)別人臉和類似人臉的非人臉圖像,這是人臉檢測不同于人臉識(shí)別的地方。(2)人臉具有復(fù)雜的細(xì)節(jié)變化,臉形、膚色等特征的個(gè)體差異比擬明顯,即使同一個(gè)人也會(huì)有不同的表情和姿態(tài)等,當(dāng)側(cè)臉時(shí)有面部器官的缺失,這些都使人臉的變化復(fù)雜,增加了很大的難度。(3)某些外部物品可能會(huì)遮擋人臉,如頭發(fā)、眼鏡、帽子等。(4)由于不同的成像角度會(huì)造成人臉的不同姿態(tài),如平面內(nèi)旋轉(zhuǎn)、深度旋轉(zhuǎn)以及上下旋轉(zhuǎn),其中深度旋轉(zhuǎn)影響較大。(5)光照的影響,如圖像中的亮度、比照度的變化和陰影等。(6)圖像的成像條件,如攝像設(shè)備的焦距、成像距離、圖像獲得的途徑。由此可見,人臉檢測涉及的問題十分廣泛,它是一個(gè)復(fù)雜的具有挑戰(zhàn)性的問題。解決此問題具有重要的學(xué)術(shù)價(jià)值,可以為其它類似的復(fù)雜模式檢測問題提供重要啟示,因此人們對人臉檢測進(jìn)行了大量的研究工作。1.1.2課題研究的意義研究人臉識(shí)別在理論和技術(shù)上都有重要的意義:一是可以推進(jìn)對人類視覺系統(tǒng)本身的認(rèn)識(shí);二是可以滿足人工智能應(yīng)用的需要。采用人臉識(shí)別技術(shù),建立自動(dòng)人臉識(shí)別系統(tǒng),用計(jì)算機(jī)實(shí)現(xiàn)對人臉圖像的自動(dòng)識(shí)別有著廣闊的應(yīng)用領(lǐng)域和誘人的應(yīng)用前景。同時(shí)人臉識(shí)別作為一種生物體征識(shí)別與其它較成熟的識(shí)別方法〔如指紋、虹膜、DAN檢測等〕[3]相比有以下幾個(gè)優(yōu)點(diǎn):①無侵犯性,人臉圖像的獲取不需要被檢測人發(fā)生身體接觸,可以在不驚動(dòng)被檢測人的情況下進(jìn)行;②低本錢、易安裝,人臉識(shí)別系統(tǒng)只需要采用普通的攝像頭、數(shù)碼攝像機(jī)或上的嵌入式攝像頭等被廣泛使用的攝像設(shè)備即可,對用戶來說也沒有特別的安裝要求;③無人工參與,整個(gè)人臉識(shí)別過程不需要用戶或被檢測人的主動(dòng)參與,計(jì)算機(jī)可以根據(jù)用戶預(yù)先的設(shè)置自動(dòng)進(jìn)行。由于具有以上優(yōu)點(diǎn),近幾年來,人臉識(shí)別技術(shù)引起了越來越多科研人員的關(guān)注。人臉檢測研究具有重要的學(xué)術(shù)價(jià)值。人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo),此類目標(biāo)的檢測問題的挑戰(zhàn)性在于:①人臉由于外貌、表情、膚色等不同,具有模式的可變性;②一般可能存在眼鏡、胡須等附屬物;③作為三維物體的人臉的影像不可防止地受由光照產(chǎn)生的陰影的影響;因此,如果能夠找到解決這些問題的方法,成功構(gòu)造出人臉檢測與跟蹤系統(tǒng),將為解決其它類似的復(fù)雜模式檢測問題提供重要的啟示。1.2國內(nèi)外研究開展現(xiàn)狀人臉檢測問題是計(jì)算機(jī)視覺領(lǐng)域中的重要問題,最初作為人臉自動(dòng)識(shí)別系統(tǒng)的定位環(huán)節(jié)被提出,近年來由于其在平安訪問控制、視覺監(jiān)測和新一代人機(jī)界面等領(lǐng)域的應(yīng)用價(jià)值,開始作為一個(gè)獨(dú)立的課題受到研究者的重視。人臉檢測問題在近十年中得到了深入的研究并取得了長足的開展,國內(nèi)外的很多學(xué)者提出了許多不同的方法,在不同的領(lǐng)域都取得了不同的成果,但是要尋找一種準(zhǔn)確率很高的、能普遍適用于各種復(fù)雜情況的人臉檢測算法,還有一定的距離。國外的主要研究單位有美國的麻省理工媒體實(shí)驗(yàn)室〔MITMedialab〕、卡耐基梅隆大學(xué)的人機(jī)交互學(xué)院〔Humancomputerinterfaceinstitute〕、微軟研究院的視覺技術(shù)研究組〔VisionTechnologyGroup〕、英國劍橋大學(xué)工程系〔DepartmentofEngineering〕等,國內(nèi)的微軟亞洲研究院、中科院自動(dòng)化研究所、清華大學(xué)、北京工業(yè)大學(xué)等都有專業(yè)人員從事人臉檢測的相關(guān)研究[4]。而且,MPEG7標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識(shí)別草案小組,人臉檢測算法也是一項(xiàng)征集的內(nèi)容。此外,隨著人臉檢測研究的深入,國際上發(fā)表的有關(guān)論文數(shù)量也大幅度增長,如IEEE的FG、ICIP、CVPR等重要的國際會(huì)議上每年都有大量的關(guān)于人臉檢測的論文,占有關(guān)人臉研究論文的1/3之多細(xì)化。其中提出了許多當(dāng)下流行的算法,Yang和Huang提出了Mosaic方法[5];Zabrodshky提出連續(xù)對稱性檢測方法,檢測一個(gè)圓形區(qū)域的對稱性,從而確定是否為人臉[6];Riesfield提出廣義對稱變換方法檢測局部對稱性強(qiáng)的點(diǎn)來進(jìn)行人臉器官定位[7];盧春雨定義方向?qū)ΨQ變換,分別在不同方向上考察對稱性,不僅能用來尋找強(qiáng)對稱點(diǎn),而且還可以描述強(qiáng)對稱性物體的形狀信息,這樣的變換對人臉偏轉(zhuǎn)、臉部表情變換、光照等因素都不敏感,使人臉器官定位更為有效[8]。細(xì)化國內(nèi)很多研究機(jī)構(gòu)、大學(xué)以及科技公司都對此區(qū)域進(jìn)行了深入的研究。清華大學(xué)、北京工業(yè)大學(xué)、南京理工大學(xué)、四川大學(xué)、上海交通大學(xué)、中國科學(xué)院計(jì)算技術(shù)研究所和中國科學(xué)自動(dòng)化研究所等都有人員從事人臉檢測方面的相關(guān)研究。為了促進(jìn)這項(xiàng)技術(shù)的開展,很多知名的國際會(huì)議、期刊都設(shè)立了人臉檢測技術(shù)專題,其中包括CVPR、ICPR、IEEE等,方便研究人員間的技術(shù)交流與學(xué)習(xí)。只不過就目前國內(nèi)外對人臉檢測研究的現(xiàn)狀來看,雖然針對人臉檢測已經(jīng)提出了多種算法,也取得了一定的成果。整體來看,人臉檢測研究涉及計(jì)算機(jī)視覺、數(shù)字圖像處理、人工智能等多個(gè)學(xué)科領(lǐng)域,同時(shí)這項(xiàng)研究還滿足了現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)和通信系統(tǒng)高速開展的需求,無論從實(shí)用性還是從學(xué)術(shù)性來看,均具有很高的研究價(jià)值。隨著計(jì)算機(jī)網(wǎng)絡(luò)的普及,圖像、視頻等多媒體信息在計(jì)算機(jī)信息中比重的加大,這一研究必然會(huì)得到更快、更長遠(yuǎn)的開展。1.3本文的主要內(nèi)容本文主要利用膚色的聚類特性,實(shí)現(xiàn)了一個(gè)復(fù)雜背景下的人臉檢測,本文的主要內(nèi)容為第一章.。。:第一章.。。第一章介紹了研究本課題的課題背景、學(xué)術(shù)意義和應(yīng)用意義,簡要介紹了人臉檢測的國內(nèi)外研究和開展現(xiàn)況,并對本文的主要內(nèi)容作了簡要說明。第二章為人臉檢測技術(shù)簡介,通過比擬目前比擬常用的人臉檢測方法,對它們的優(yōu)劣和實(shí)現(xiàn)難度等指標(biāo)進(jìn)行評估,提出適合在視頻中應(yīng)用的人臉檢測算法,也是本文主要研究的算法-在YCbCr色彩空間中的基于膚色的人臉檢測。第三章針對提出的算法進(jìn)行了算法的實(shí)現(xiàn),并在matlab平臺(tái)上進(jìn)行了計(jì)算機(jī)仿真,對局部仿真結(jié)果進(jìn)行了分析,對算法的應(yīng)用場合和實(shí)用性進(jìn)行評估。對誤檢結(jié)果進(jìn)行了分析,并將其作為未來使用中的參考。2人臉檢測技術(shù)簡介人臉檢測是指在輸入圖像中確定所有人臉〔如果存在〕的位置、大小、位姿的過程。人臉檢測作為人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù),近年來成為模式識(shí)別與計(jì)算機(jī)視覺領(lǐng)域內(nèi)一項(xiàng)受到普遍重視、研究十分活潑的課題。人臉檢測問題來源于人臉識(shí)別問題。人臉檢測是對給定的圖像,判斷其中是否有人臉,假設(shè)有,將所有人臉從背景中分割提取出來,并確定每個(gè)人臉在圖像中的位置和大小。人臉檢測技術(shù)可以應(yīng)用于人臉識(shí)別、視頻會(huì)議、圖像與視頻檢索、刑偵破案和證件驗(yàn)證等領(lǐng)域。人臉檢測是對于輸入的人臉圖像或視頻,首先判斷其中是否存在人臉,如果存在人臉,那么進(jìn)一步給出每個(gè)人臉的位置、大小以及各個(gè)主要面部器官的位置信息,并依據(jù)這些信息,進(jìn)一步提取每個(gè)人臉中所蘊(yùn)含的特征,并將其與人臉庫中的人臉圖像進(jìn)行比照,從而得到識(shí)別結(jié)果。由此可見,一個(gè)完整的人臉識(shí)別過程應(yīng)包括人臉檢測與人臉識(shí)別兩大局部。人臉識(shí)別由兩局部工作組成:(l)人臉檢測:在標(biāo)點(diǎn)符號用中文輸入的圖像或視頻畫面當(dāng)中確定存在的人臉位置、尺寸等的過程,這是識(shí)別工作的根底課題,在減少算法復(fù)雜度等方面對識(shí)別工作有關(guān)鍵性影響。標(biāo)點(diǎn)符號用中文(2)人臉識(shí)別:通過與計(jì)算機(jī)相連的攝像頭動(dòng)態(tài)捕捉人的面部信息,并把捕捉到的人臉與預(yù)先錄入的人臉數(shù)據(jù)庫中存儲(chǔ)的人臉進(jìn)行比擬識(shí)別。人臉檢測的根本思想是建立人臉模型,比擬所有可能的待檢測區(qū)域與人臉模型的匹配程度,從而得到可能存在人臉的區(qū)域。本章主要對常用的人臉檢測方法進(jìn)行總結(jié)、分析,得出自己的算法依據(jù)。近幾年,人臉檢測技術(shù)開展迅猛,研究人員提出很多人臉檢測的方法,但是由于人臉檢測問題的復(fù)雜性,實(shí)現(xiàn)通用的人臉檢測方法還不實(shí)際,因此解決特定約束條件下或某種應(yīng)用背景下的人臉檢測問題仍將是該領(lǐng)域研究的主要課題。對人臉進(jìn)行檢測之前,需要對人臉的特征進(jìn)行適宜的描述,人臉的特征有許多,大體可分為生物特征和外形特征,生物特征有膚色,人類固有的眼、鼻、口等。外形特征有相對固定的長寬比,相對固定的形狀,以及面部器官的幾何關(guān)系等。針對不同的人臉特征描述方式,就可以提出不同的人臉檢測方案。從目前來看,人臉檢測方法大致可分為以下四類。2.1基于先驗(yàn)知識(shí)的方法這種方法是利用對人臉的先驗(yàn)知識(shí)給出檢測規(guī)那么來進(jìn)行人臉檢測。人臉局部特征的分布總是存在著一定的規(guī)那么,如圖像中出現(xiàn)的人臉通常會(huì)有幾個(gè)位置和數(shù)量相對固定的面部器官,如鼻子、眼睛、嘴巴等。在一幅人臉圖像中,面部的這些特征將首先被提取出來,然后基于檢測規(guī)那么將候選的臉部區(qū)域區(qū)分出來。2.1.1器官分布法格式格式雖然人臉在外觀上變化很大,但五官的空間分布大致符合一些普遍的規(guī)律,器官分布法檢測人臉即是檢測圖像中是否存在滿足器官分布規(guī)那么的圖像塊。這種方法一般有兩種思路:一種思路是“從上至下”,其中最為簡單有效的是Mosaic方法,它給出了基于人臉區(qū)域灰度分布的規(guī)那么,依據(jù)這些規(guī)那么對圖像從粗分辨率到高分辨率進(jìn)行篩選,以滿足這些規(guī)那么的程度作為檢測的判據(jù)。這種方法的吸引之處在于使用從粗到細(xì)的策略減少了計(jì)算量。另一種思路那么是“從下至上”,先直接檢測幾個(gè)器官可能分布的位置,然后將這些位置點(diǎn)分別組合,利用器官分布的幾何關(guān)系準(zhǔn)那么進(jìn)行篩選,找到可能存在的人臉。2.1.2投影法這是一種利用圖像的投影快速定位人臉邊界和臉部特征的方法。在處理一幅輸入圖像時(shí),首先獲得其水平投影,然后通過檢測其圖像的急劇變化處得到兩個(gè)局部最小值,這兩個(gè)值對應(yīng)頭部的左右輪廓線。類似地,通過檢測垂直投影的局部最小值,檢測出人臉的嘴唇、鼻尖和眼睛。這種方法的缺陷在于無法有效檢測出有多張人臉的圖像以及在復(fù)雜背景中的人臉。2.1.3對稱法人臉具有一定的軸對稱性,各個(gè)器官也具有很強(qiáng)的點(diǎn)對稱性。連續(xù)對稱性檢測方法,檢測一個(gè)圓形區(qū)域的對稱性,從而確定是否為人臉;廣義對稱變換方法檢測局部對稱性強(qiáng)的點(diǎn)來進(jìn)行人臉器官定位;盧春雨定義方向?qū)ΨQ變換,分別在不同方向上考察對稱性,不僅能用來尋找強(qiáng)對稱點(diǎn),而且還可以描述強(qiáng)對稱性物體的形狀信息,這樣的變換對人臉偏轉(zhuǎn)、臉部表情變換、光照等因素都不敏感,使人臉器官定位更為有效[8]。該方法對圖像要求很高,并且受姿態(tài)、表情、光照等因素的影響較大。其中器官分布法、對稱法準(zhǔn)確率較高,但運(yùn)算量大;而投影法雖然準(zhǔn)確率不高,但運(yùn)算量小。2.2基于特征的方法基于特征的方法試圖先找出人臉的穩(wěn)定特征,再利用其它信息進(jìn)一步檢測人臉。人臉的穩(wěn)定特征是指在外界環(huán)境有所改變時(shí)相對不變的特征,比方人的臉部特征、膚色、紋理以及它它們的綜合特征等。2.2.1臉部特征首先我們要提出一些可靠有效的方法來檢測臉部特征,然后推斷是否有人臉存在。至于人的臉部特征,往往使用邊緣檢測來獲得,如眼睛、眉毛、嘴巴、鼻子等?;谶@些特征,我們可以建立起描述特征之間的統(tǒng)計(jì)模型,然后去校驗(yàn)是否有人臉存在。當(dāng)然,這種方法也存在缺陷,此種方法的缺陷在于表情、光照、噪聲等因素會(huì)造成臉部特征邊界弱化,這樣就影響到人臉檢測結(jié)果的準(zhǔn)確性。2.2.2紋理特征人臉的紋理特征可以分為三類,即皮膚、毛發(fā)和其它類,這些人類特有的紋理可以被用來區(qū)別其它物體。這種方法的優(yōu)點(diǎn)是在對于“不干凈”的人臉檢測上,如有胡須、眼鏡等附屬物存在時(shí),檢測結(jié)果仍然比擬準(zhǔn)確。2.2.3膚色特征研究說明,人類膚色在去除亮度的色度空間〔如YCbCr空間〕具有聚類性,顏色信息在一定程度上可以將人臉同大局部背景區(qū)分開來,因此可以利用膚色模型有效地檢測人臉。利用膚色信息檢測人臉的方法具有計(jì)算量小,方法相對簡單,易于實(shí)時(shí)性處理及適合復(fù)雜背景下的人臉檢測定位等特點(diǎn)。在設(shè)計(jì)了膚色模型表征人臉顏色之后,利用感光模型進(jìn)行復(fù)雜背景下人臉及器官的檢測與分割。該方法對圖像要求較高,但運(yùn)算量小。其最大的優(yōu)點(diǎn)在于受人臉姿態(tài)、表情、光照等因素的影響小。2.3基于模板匹配的方法基于模板匹配的方法也可以用來檢測人臉,首先設(shè)定一些不同標(biāo)準(zhǔn)的、描述人臉的整體特征或局部特征的模板,然后根據(jù)模板與圖待檢測圖像的相似度進(jìn)行匹配檢測。2.3.1預(yù)定模板匹配法根據(jù)人臉的先驗(yàn)知識(shí),我們可以制作出描述人臉輪廓特征的模板,通過計(jì)算圖像區(qū)域和人臉輪廓模板的相關(guān)性參數(shù)可檢測出候選人臉區(qū)域,然后利用器官特征子模板篩選上一步檢測出的候選人臉區(qū)域。在早期研究人員使用了眼睛、鼻子、嘴巴、臉部輪廓的子模板建立起人臉模型。Craw等人首先使用一個(gè)Sobel濾波器來提取邊緣,然后將這些邊緣集合起來搜索基于幾個(gè)約束條件的人臉模板。[9]2.3.2變形模板法其主要思想是定義一個(gè)具有參數(shù)的可變模板和一個(gè)能量函數(shù)來描述人臉特征,通過一個(gè)非線性最優(yōu)化方法求出各個(gè)模板對應(yīng)的能量函數(shù)。能使能量函數(shù)最小的參數(shù)模板即被認(rèn)為是所求特征的描述。此方法充分考慮到人臉是變形體的特點(diǎn),穩(wěn)定可靠,且與姿態(tài)和光照無關(guān),但仍然存在難以適應(yīng)一般情況和計(jì)算量巨大的問題。并且該方法必須是在待檢測的人臉附近,變形模板必須被初始化。2.3.3動(dòng)態(tài)輪廓法又稱Snakes模型法。Kass等人提出在不需要更多先驗(yàn)知識(shí)或高層處理結(jié)果指導(dǎo)的情況下實(shí)現(xiàn)自追跡以得到目標(biāo)的閉合、光滑、連續(xù)的輪廓線,該方法具有較強(qiáng)的抗噪能力[10]。Snakes模型通過對一條初始給定的連續(xù)閉合曲線計(jì)算初始能量函數(shù),然后通過變分方法求取能量函數(shù)的最小化,以得到人臉的輪廓曲線[11]。該方法對圖像要求高,運(yùn)算量大,并且受姿態(tài)、表情、光照等因素的影響大,但其優(yōu)點(diǎn)是準(zhǔn)確率高。2.4基于統(tǒng)計(jì)模型的方法由于人臉圖像的復(fù)雜性,一般地描述人臉特征具有一定困難,因此另一類方法,即基于統(tǒng)計(jì)模型的方法越來越受到重視。此方法將人臉區(qū)域看作一類模式,即模板特征,使用大量的“人臉”與“非人臉”樣本訓(xùn)練、構(gòu)造分類器,通過分類器對圖像中所有可能區(qū)域進(jìn)行“人臉”與“非人臉”的劃分。實(shí)際上此方法將人臉檢測問題轉(zhuǎn)化為統(tǒng)計(jì)模式識(shí)別的二分類問題,即判斷區(qū)域是否為人臉。統(tǒng)計(jì)識(shí)別方法可分為四大類:基于特征空間的格式方法、基于人工神經(jīng)網(wǎng)絡(luò)的方法、基于概率模型的方法和基于支撐向量機(jī)的方法。格式2.4.1基于特征空間的方法此類方法將人臉區(qū)域圖像變換到某一特征空間,根據(jù)其在特征空間中的分布規(guī)律劃分為“人臉”與“非入臉”兩類模式。特征臉方法是一種常用的方法。它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交變換(K-L變換),以消除原有向量各個(gè)分量問的相關(guān)性。變換得到對應(yīng)特征值依次遞減的特征向量。人臉在特征臉空間的投影聚集比擬緊密因此利用前假設(shè)干張?zhí)卣髂槍⑷四樝蛄客队暗街髟涌臻gF和與其正交的補(bǔ)空間F,相應(yīng)的距離度量分別稱為DIFS(DistanceInFeatureSpace)和DFFS(DistanceFromFeatureSpace)。對于人臉檢測問題,由于沒有考慮“非人臉”樣本的分布,需要同時(shí)使用DIFS和DFFS才能取得較好的效果。Sung等人將樣本經(jīng)預(yù)處理后按行列順序展開為樣本向量進(jìn)行主分量分解。采用均值聚類方法在特征空間中建立6個(gè)“人臉”〔CluSterS),同時(shí)建立包圍“人臉”簇的6個(gè)“非人臉”簇,以使“人臉”與“非人臉”模式的邊界更為清晰。并使用“自舉”(bootstrap)方法加以解決了非人臉樣本選區(qū)的問題:首先建立一個(gè)僅使用“人臉”簇的初始分類器對一組圖像進(jìn)行檢測,將所有的錯(cuò)誤報(bào)警(不是人臉而被錯(cuò)檢為“人臉”的結(jié)果)參加“非人臉”樣本庫,構(gòu)造新的使用“人臉”與“非人臉”簇的分類器重新檢測。以上過程不斷迭代,直到收集了足夠的“非人臉”樣本。屬于特征空間方法的還有因子分解方法(FactorAnalysis)和Fisher準(zhǔn)那么方法。Yang等在混合線性子空間(mixturesoflinearsubspaces)中對“人臉”和“非人臉”樣本的分布進(jìn)行建模,分別使用基于EM算法的擴(kuò)展FA方法和基于自組織映射的FLD方法構(gòu)造檢測器。2.4.2基于神經(jīng)網(wǎng)絡(luò)的方法人工神經(jīng)網(wǎng)(ANN)方法是把模式的統(tǒng)計(jì)特性隱含在ANN的結(jié)構(gòu)和參數(shù)之中,對于人臉這類復(fù)雜的、難以顯式描述的模式,基于ANN的方法具有獨(dú)特的優(yōu)勢。CMU的Rowley等使用了多個(gè)ANN檢測多姿態(tài)的人臉,算法顯示了兩類ANN:1個(gè)位姿檢測器(poseestimator)用于估計(jì)輸入窗口中人臉的位姿、3個(gè)檢測器(detector)分別檢測正面(frontal)、半側(cè)面(half-profile)和側(cè)面(profile)的人臉。使用經(jīng)過對準(zhǔn)和預(yù)處理的“人臉”樣本以及采用“自舉”(bootstrap)方法收集分類器錯(cuò)分的樣本作為“非人臉”樣本訓(xùn)練各個(gè)ANN,進(jìn)一步修正分類器。檢測時(shí)對輸入圖像中所有可能位置和尺度的區(qū)域首先使用位姿檢測器估計(jì)人臉位姿,經(jīng)校準(zhǔn)和預(yù)處理后送入3個(gè)檢測器中,最后對檢測器的分類結(jié)果進(jìn)行仲裁。Rowley等對正面端正人臉和正面旋轉(zhuǎn)人臉的檢測單獨(dú)進(jìn)行了研究。對于正面端正的人臉,僅使用了正面入臉檢測ANN,是一種三層前向網(wǎng):輸入層對應(yīng)20×20像素的圖像區(qū)域;隱層節(jié)點(diǎn)分為對應(yīng)不同人臉區(qū)域的假設(shè)干組,與輸入層局部連接;ANN輸出1到.1區(qū)間的值表示這個(gè)區(qū)域是否為人臉。Rowley等使用相同的“人臉”樣本和不同“自舉”過程收集的“非人臉”樣本訓(xùn)練了多個(gè)正面人臉檢測ANN,對它們的檢測結(jié)果進(jìn)行仲裁,以進(jìn)一步減少錯(cuò)誤報(bào)警。對于正面旋轉(zhuǎn)人臉的檢測使用了旋轉(zhuǎn)角度檢測器及正面人臉檢測ANN,并使用相似的多ANN仲裁方法降低錯(cuò)誤報(bào)警。基于人工神經(jīng)網(wǎng)的方法還有Jue等和Kouzani等提出的基于人臉器官檢測的多級網(wǎng)絡(luò)方法、Anifantis等提出的雙輸出人工神經(jīng)網(wǎng)的檢測算法等。神經(jīng)網(wǎng)絡(luò)方法在人臉檢測與識(shí)別上比其它類型的方法有其獨(dú)到的優(yōu)勢,即它防止了復(fù)雜的特征提取工作,可以通過學(xué)習(xí)的過程獲得其它方法難以實(shí)現(xiàn)的關(guān)于人臉識(shí)別的規(guī)律和規(guī)那么的隱性表達(dá)。2.4.3基于支持向量機(jī)的方法支持向量機(jī)法是在統(tǒng)計(jì)學(xué)習(xí)理論的根底上開展出一種新的模式識(shí)別方法,它是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的方法,較之于基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的人工神經(jīng)網(wǎng)絡(luò),一些難以逾越的問題,如:模型選擇和過學(xué)習(xí)問題、非線性和維數(shù)災(zāi)難問題、局部極小點(diǎn)問題等都得到了很大程度上的解決。但是直接使用SVM方法進(jìn)行人臉檢測有兩個(gè)方面的困難:①訓(xùn)練SVM需要求解二次規(guī)劃問題,計(jì)算復(fù)雜度高,內(nèi)存需求量巨大;②在非人臉樣本不受限制時(shí),需要極大規(guī)模的訓(xùn)練集合,得到的支持矢量會(huì)很多,使得分類器的計(jì)算量過高。Platt提出的SMO算法有效地解決了第一個(gè)問題。Osuna等人首先將SVM方法用于人臉檢測問題,在訓(xùn)練中使用了大量人臉樣本,采用“自舉”的方法收集“非人臉”樣本,并使用逼近優(yōu)化的方法減少支持矢量的數(shù)量,在一定程度上解決了第二個(gè)問題;梁路宏等采用模板匹配與SVM方法相結(jié)合的人臉檢測算法,在模板匹配限定的子空間內(nèi)采用自舉的方法收集“非人臉樣本”,訓(xùn)練SVM,降低了訓(xùn)練的難度和最終得到的支持矢量的規(guī)模,使得檢測速度比單純的SVM檢測器提高了20倍,得到了與CMU的神經(jīng)網(wǎng)絡(luò)方法可比擬的結(jié)果。[12]Richman等提出用人臉中的鼻子區(qū)域訓(xùn)練SVM,減少了訓(xùn)練數(shù)據(jù),且不用考慮SVM對發(fā)型、眼鏡等飾物敏感,采集圖像時(shí)也不要求人臉必須定位。該方法為柯達(dá)公司設(shè)計(jì)出了針對顧客圖像的實(shí)用人臉檢測系統(tǒng)。2.4.4基于概率模型的方法基于概率模型的一種思路是利用貝葉斯原理計(jì)算輸入圖像區(qū)域?qū)儆谌四槄^(qū)域的后驗(yàn)概率。CMU的Schneiderman等提出一種基于后驗(yàn)概率的檢側(cè)方法。將難以估計(jì)的先驗(yàn)概率P(object)用一個(gè)比率參數(shù)入代替,作為調(diào)節(jié)檢測器敏感度的參量。在學(xué)習(xí)過程中得到“人臉”和“非人臉”兩種模式的概率分布。通過對敏感度的調(diào)節(jié),到達(dá)檢測的效果。另一種應(yīng)用較多的概率模型是用于描述信號統(tǒng)計(jì)特性的隱馬爾可夫模型(HiddenMarkovModels,HMM),目前也被應(yīng)用于人臉檢測與識(shí)別。Nefian根據(jù)正面人臉由上到下各個(gè)區(qū)域(頭發(fā)、額頭、雙眼、鼻子、嘴)具有自然不變的順序這一事實(shí),使用一個(gè)包含五個(gè)狀態(tài)的一維連續(xù)HMM加以表示。將頭部圖像按照這五個(gè)區(qū)域劃分為互有重疊的條塊,對各塊進(jìn)行K.L變換,選取前假設(shè)干個(gè)變換系數(shù)作為觀測向量訓(xùn)練HMM。[11]Nefian還提出了基于嵌入式HM的人臉檢測方法。該方法同時(shí)考慮到人臉由左到有各個(gè)特征的自然順序,使用了二維HMM,并且采用二維DCT變換的系數(shù)作為觀察向量。此外還有Meng使用HMM描述人臉的小波特征中不同級間的相關(guān)性等方法?;贖MM的方法一般只使用“人臉”樣本進(jìn)行訓(xùn)練,主要針對用于人臉識(shí)別的頭肩部圖像。該算法對圖像要求較低,受姿態(tài)、表情、光照等因素的影響較小,識(shí)別率高,但運(yùn)算量相當(dāng)大。2.5本文算法方案的提出在四類常見的人臉檢測算法中,使用場合各異,優(yōu)勢和劣勢并存,在視頻的人臉檢測中,沒有完美的算法,不過綜合這幾種算法,可以提出一個(gè)適合于視頻應(yīng)用的算法。基于先驗(yàn)知識(shí)的算法由于對人臉的姿態(tài)和背景有要求,如器官分布法對背景有一定要求,且對非正臉的檢測效果不好,投影法對背景要求較高,對稱法運(yùn)算量大,且對非正臉的檢測效果也不好?;谔卣鞯乃惴ㄖ兄饕譃榛谀w色、基于臉部特征和基于紋理,基于膚色具有簡單,快速的優(yōu)點(diǎn),且對臉的姿態(tài)要求不高,基于紋理的算法要求圖像能反映毛發(fā)等信息,對圖像的要求較高?;谀槻刻卣鞯乃惴▽δ樀淖藨B(tài)有要求。對于模板的人臉檢測方法,計(jì)算量大,速度比擬慢。在視頻應(yīng)用中假設(shè)計(jì)算機(jī)運(yùn)算速度不夠快的話,實(shí)時(shí)性較差。對于統(tǒng)計(jì)模型的人臉檢測,優(yōu)點(diǎn)在于將人臉檢測問題化成了二分類問題,難點(diǎn)在于分類器的構(gòu)造,分類器的優(yōu)劣直接影響到了算法的優(yōu)劣,在視頻中,圖像塊變化繁復(fù),這對于構(gòu)造一個(gè)高效高速的分類器來說是一個(gè)不小的挑戰(zhàn)??偟膩碚f,基于膚色的人臉檢測由于其簡單快速、適應(yīng)性較廣、對圖像質(zhì)量要求不高,適合在視頻中用于快速人臉檢測,并且在YCbCr空間中膚色的類聚性較好,加強(qiáng)了其抗干擾的能力,因此本文選擇在YCbCr空間中基于膚色的人臉檢測。此算法首先要將圖像轉(zhuǎn)換到Y(jié)CbCr空間中,提取Cb和Cr分量之后,利用人工閾值法二值化,提取膚色,然后進(jìn)行形態(tài)學(xué)處理;對候選區(qū)進(jìn)行限定長寬比,篩選出人臉,最后在原圖上畫框標(biāo)記人臉。3算法設(shè)計(jì)與matlab實(shí)現(xiàn)對于復(fù)雜背景的彩色圖像,膚色是人體外表最為顯著的特征之一,是人臉的重要信息,不依賴于面部的細(xì)節(jié)特征,對于旋轉(zhuǎn)、表情的變化等情況都能適用,具有較高的穩(wěn)定性,并且計(jì)算機(jī)能將膚色與大多數(shù)背景物體的顏色相區(qū)別。因此膚色特征在人臉檢測中是最常用的一種特征。膚色特征主要由膚色模型描述,基于膚色的人臉檢測方法通常分為顏色空間的選擇、膚色區(qū)域分割和人臉檢測三大步。在確定膚色模型之后,首先可以進(jìn)行膚色檢測,在檢測出膚色像素后,需要根據(jù)它們在色度空間內(nèi)的相似性和位置上的相關(guān)性分割出可能的人臉區(qū)域,同時(shí)利用區(qū)域的幾何特征或是灰度特征進(jìn)行是否是人臉的驗(yàn)證,以排除其它色彩類似膚色的物體,區(qū)域分割與驗(yàn)證在很多方法中是密切結(jié)合統(tǒng)一考慮的。通常為了消除光照對人臉膚色的影響,在膚色區(qū)域分割前會(huì)對圖像進(jìn)行光照校正,以消除色彩偏移。在提取膚色之前,對人臉圖像的預(yù)處理必不可少,這其中包括圖像的噪聲濾除,圖片的亮度平衡等;圖像的噪聲處理可用圖像平滑來實(shí)現(xiàn)。圖像平滑是指用于突出圖像的寬大區(qū)域、低頻成分、主干局部或抑制圖像噪聲和干擾高頻成分,使圖像亮度平緩漸變,減小突變梯度,改善圖像質(zhì)量的圖像處理方法。對于圖像的亮度,假設(shè)要一張圖像實(shí)現(xiàn)亮度平衡,可通過均衡RGB三個(gè)分量的直方圖來實(shí)現(xiàn),不過,對于人臉檢測,我們可以拋開亮度信息,即將圖像轉(zhuǎn)化到Y(jié)CbCr空間。3.1常見的顏色空間光在頻譜分布中的不同位置表達(dá)了各種顏色,顏色是人對光譜中可見光的感知結(jié)果。根據(jù)光度學(xué)和色度學(xué)原理,所有顏色都可以用相互獨(dú)立的三種根本顏色混合得到,這三種顏色被稱為三基色,由此就構(gòu)成了色彩空間。著名的格拉曼定律反映了視覺對顏色的反響取決于紅、綠、藍(lán)三種顏色在輸入量中的代數(shù)和之一事實(shí)。格拉曼定律包括如下四個(gè)方面的內(nèi)容:(1)所有顏色都可以用互相獨(dú)立的三基色混合而得到;(2)假設(shè)三基色的混合比相等,那么色調(diào)和色飽和度也相等;(3)任意兩種顏色相混合產(chǎn)生的新顏色與采用三基色分別合成這兩種顏色的各自成份再混合起來得到的結(jié)果相同;(4)混合色的光亮度是原來各分量光亮度的總和;這里色調(diào)、色飽和度、亮度是表示色覺程度的。色調(diào)表示各種顏色,色飽和度表示顏色深淺。以三基色為根底的格拉曼定律可以用式3-1來表示:(3-1)根據(jù)計(jì)算機(jī)色彩理論,對于同一種顏色而言,在計(jì)算機(jī)中有不同的表達(dá)方式,這樣就形成了各種不同的色彩空間。每一種色彩空間都有其各自的產(chǎn)生背景及應(yīng)用領(lǐng)域。數(shù)字圖像中的一個(gè)象素點(diǎn)的顏色可以有很多種方法來表示,其中最直接的表示方法是我們所熟知的由紅、綠、藍(lán)三基色構(gòu)成的色彩空間。下面我們具體介紹一些常用于膚色提取的色彩空間,通過比擬膚色在各顏色空間的聚類效果的好壞來選擇適宜的顏色空間。RGB色彩空間RGB色彩空間也稱為紅、綠、藍(lán)基色模型。為標(biāo)準(zhǔn)化起見,CEI(國際照明委員會(huì))在年選擇紅色(波長i=700nm),綠色(波長z=546nm),藍(lán)色(波長z=435nm)三種單色光作為表色系統(tǒng)得三基色,這就是色彩空間,它也是最常見的色彩空間。由于彩色圖像是多光譜圖像的一種特殊情況,對應(yīng)于人類視覺的三基色,即紅、綠、藍(lán)三個(gè)波段,是對人眼的光譜量化性質(zhì)的近似[13]。因此,利用R、G、B三基色這三個(gè)分量來表征顏色是很自然的一種格式。而且多數(shù)的圖像采集設(shè)備都直接感知色彩的三個(gè)分量,這也使得模型成為圖像成像、顯示、打印等設(shè)備的根底,具有十分重要的作用。在色彩空間中,每一個(gè)數(shù)字圖像中象素點(diǎn)的顏色都可以用三維空間中的第一象限中的一個(gè)點(diǎn)來表示。如所示的為彩色立方體。色彩空問的原點(diǎn)表示在任何顏色分量上的亮度都為零,因此它表示黑色。當(dāng)三個(gè)分量亮度都到達(dá)最大時(shí)為白色。而當(dāng)三個(gè)分量相等時(shí)產(chǎn)生的就是灰度象素點(diǎn)。除了黑白兩色位于立方體的頂點(diǎn)外,立方體的另外三個(gè)頂點(diǎn)對應(yīng)于三基色紅、綠、藍(lán),剩下的那么對應(yīng)于黃、青以及紫色。如圖3.1所示。圖3.1RGB色彩空間一般情況下,都是以色彩空間為根底來描述其它類型的色彩空間,將其它色彩空間的基色描述為三基色的線性或非線性函數(shù)。但是,RGB存在一些缺乏:(1)RGB空間用紅、綠、藍(lán)三原色的混合比例定義不同的色彩,因而不同的色彩很難用準(zhǔn)確的數(shù)值來表示,即對色彩的定量分析比擬困難;(2)RGB彩色空間中,彩色通道之間的相關(guān)性很高,合成的圖像存在飽和度偏低、色調(diào)變化較小、視覺效果較差等問題。(3)人眼只能夠通過感知顏色的色調(diào)、亮度以及飽和度來區(qū)分物體,不能夠直接感覺紅、綠、藍(lán)三種顏色的比例,并且色調(diào)、飽和度與紅、綠、藍(lán)是非線性關(guān)系,并且膚色在此空間中的類聚特性不是很好,如圖3.2所示。故RGB空間中對圖像的色彩信息進(jìn)行分析與處理,難以控制其結(jié)果。圖3.2膚色在RGB空間中的類聚特性3.1.2歸一化色彩空間如果在色彩空間中有兩個(gè)像素點(diǎn)[R1,G1,Bl]和[R2,G2,B2]存在如式3-2所示的關(guān)系:(3-2)這兩個(gè)點(diǎn)具有相同的色彩、不同的亮度。人臉圖像中不同區(qū)域的膚色差異主要存在于亮度上,通過色彩的亮度歸一化,可縮小膚色差異。相當(dāng)于將三維的GRB空間降低成為二維的r-g空間[14]。歸一化可用式3-3簡單得到:〔3-3〕3.1.3HIS色彩空間HIS色彩空間也稱為色度、飽和度、亮度模型。這是由提出的色彩系統(tǒng)模型,經(jīng)常為藝術(shù)家所使用。H(Hue)表示色度,I(Intensity)表示亮度,S(Saturation)表示飽和度。這種色彩空間反映了人類觀察色彩的方式,同時(shí)也有利于圖像處理。在這種顏色表示方法中,盡管在計(jì)算均值的時(shí)候三個(gè)顏色分量的權(quán)重并不一樣,但I(xiàn)是RGB三基色分量的平均值。I的值僅僅表示了像素的亮度,而不包含顏色信息。在從彩色圖像到灰度圖像的轉(zhuǎn)換時(shí),就可以通過計(jì)算I值從而拋棄顏色信息。H和S代表了像素點(diǎn)的顏色,圖3.3對這兩個(gè)參數(shù)進(jìn)行了說明。顏色的色度指與它最接近的頻譜波長,當(dāng)色度為0時(shí)為紅色,120時(shí)為綠色,240時(shí)為藍(lán)色。色度在O至240之間的時(shí)候代表可見頻譜光,240與360之間的是非頻譜光(紫色就屬于這一區(qū)域)。飽和度參數(shù)是圖中點(diǎn)與顏色圓圓心之間的距離。對圓周上的點(diǎn),其飽和度參數(shù)為l,而在圓心處飽和度為0。飽和度的概念可以這樣解釋:一幅亮度很強(qiáng)的紅色圖像的色度為0,而飽和度為1。如果往里面摻入白色,那么紅色變淡了,飽和度變小了,可是圖像的亮度并沒有變化。相反,如果參加黑色,圖像的亮度減小,可是色度和飽和度都沒有變化。HIS是一個(gè)圓柱體形的色彩空間。圖3.3HIS色彩空間灰度像素點(diǎn)在圓柱體的中軸線上,底端對應(yīng)黑色點(diǎn),頂端對應(yīng)白色點(diǎn)。亮度最高且飽和度最大的點(diǎn)在圓柱體頂層的外圍圓周上。HIS色彩空間的優(yōu)點(diǎn)在于它將亮度(I)與反映色彩本質(zhì)特性的兩個(gè)參數(shù)色度(H)和飽和度(S)別離開。[15]我們在提取一類物體在色彩方面的特性時(shí),比方說人臉。經(jīng)常需要了解其在某一色彩空間的聚類特性,這一聚類特性往往表達(dá)在色彩的本質(zhì)特性上,而又經(jīng)常受到光照明暗等條件的干擾影響。光照明給物體顏色帶來的直接影響就是亮度分量(I),所以假設(shè)能將亮度分量從色彩中提取出去,而只用反映色彩本質(zhì)特性的色度、飽和度來進(jìn)行聚類分析,會(huì)獲得比擬好的結(jié)果。從RGB色彩空間到HIS色彩空間可用式3-4,式3-5,式3-6和式3-7得到:(3-4)(3-5)(3-6)(3-7)3.1.4YCbCr顏色空間YCbCr這種色彩空間是以演播室質(zhì)量標(biāo)準(zhǔn)為目標(biāo)的CCIR601編碼方案中采用的彩色表示模型,被廣泛應(yīng)用到電視的色彩顯示等領(lǐng)域中,它具有將亮度分量別離的優(yōu)點(diǎn),且可以直接有RGB色彩空間經(jīng)過線性變換得到,所以可以直接應(yīng)用于物體的色彩聚類分析中。它與RGB色彩空間的轉(zhuǎn)換公式如式3-8所示?!?-8〕在此空間中,膚色的類聚性良好,如圖3.4所示:圖3.4膚色在YCbCr色彩空間中的類聚特性3.2顏色空間地選擇在彩色人臉分割算法中,為了把人臉區(qū)域從復(fù)雜背景中別離出來,需要使用適合不同光照條件下可靠的膚色模型。研究說明,盡管不同民族、不同年齡、不同性別的人臉膚色看上去不同,但是這種不同主要集中在亮度上,在去除亮度的某些色彩空間中,不同人臉的膚色分布是一致的,而且集中在一個(gè)較小的區(qū)域里,即具有聚類性。膚色模型的建立與選用的色彩空間密切相關(guān)。一般來說,色彩空間的選用原那么是:(1)膚色在該色彩空間中具有良好的聚類特性;(2)膚色模型能夠把“膚色”和“非膚色”充分區(qū)分開,即在該顏色空間中,“膚色”與“非色”重疊區(qū)域盡量小。大多數(shù)彩色錄像機(jī)、數(shù)碼相機(jī)等圖像采集設(shè)備都采用RGB模型來表示顏色,而RGB色彩空間表達(dá)中,色度信息與亮度信息是混合在一起的。由于周圍環(huán)境光照的改變,亮度可能使人臉的檢測變得更加復(fù)雜,使膚色分割的結(jié)果不可靠,因此RGB色彩空間并不是理想之選。為了充分利用膚色在色度空間中的聚類特性,需要把顏色表達(dá)式中的色度信息與亮度信息分開,所以必須將RGB色彩空間進(jìn)行轉(zhuǎn)換以到達(dá)該目的。研究發(fā)現(xiàn):在YCbCr色彩空間中Cb和Cr分別代表藍(lán)色和紅色分量,能將亮度和色度別離,膚色在該色彩空間中聚集在一個(gè)很小的范圍內(nèi),并且YCbCr空間既能充分表達(dá)人臉膚色,又能在很大程度上消除了亮度影響,降低了色彩空間的維數(shù),減少了計(jì)算復(fù)雜度。3.3膚色模型的建立膚色模型就是在一定的顏色空間描述膚色分布規(guī)律的數(shù)學(xué)模型,它是膚色檢測的前提。本文在顏色空間YCbCr上建立了亮度、藍(lán)色色度分量和紅色色分量度信息聯(lián)合進(jìn)行膚色區(qū)域檢測的模型,在此根底上提出了一種快速的閾值分割的方法。統(tǒng)計(jì)說明不同人種的膚色區(qū)別主要受亮度信息影響,而受色度信息的影響較小,所以直接考慮YCbCr空間的CbCr分量,映射為YCbCr空間,在YCbCr空間下,受亮度變化的影響少,且是兩維獨(dú)立分布。通過實(shí)踐,選取大量膚色樣本進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)膚色在CbCr空間的分布呈現(xiàn)良好的聚類特性。統(tǒng)計(jì)分布滿足77≤Cb≤127并且滿足133≤Cr≤173。故本人臉檢測系統(tǒng)主要利用高斯膚色的歸一化概率模型,將靜態(tài)圖像中的每一個(gè)像素限定在0到1的范圍內(nèi)。利用人工閾值法將膚色與非膚色區(qū)域分開,形成二值圖像。3.4膚色的提取膚色的提取有兩局部組成,首先將原圖從RGB色彩空間轉(zhuǎn)換到Y(jié)CbCr空間,在matlab中有專門的命令實(shí)現(xiàn)此功能,即rgb2yCbCr(),其中括號中的參數(shù)是待轉(zhuǎn)換的圖像矩陣。然后提取cb和cr分量,通過限制條件直接得到二值圖像。代碼如下:clear;%去除變量I=imread(‘2.jpg’);%讀取圖像figure,imshow(I);%顯示圖像I_yCbCr=rgb2yCbCr(I);%將原圖從rgb色彩空間轉(zhuǎn)換到Y(jié)CbCr空間I_cb=I_yCbCr(:,:,2);%提取cb分量I_cr=I_yCbCr(:,:,3);%提取cr分量U=(I_cb>=77)&(I_cb<=127)&(I_cr>=133)&(I_cr<=173);%提取膚色,得二值圖像figure,imshow(U);%顯示結(jié)果對多張圖片的實(shí)驗(yàn)結(jié)果如圖3.5所示:〔a〕〔b〕〔c〕圖3.5YCbCr算法的膚色提取結(jié)果3.5人臉區(qū)域形態(tài)學(xué)處理從上述結(jié)果可以看出,在YCbCr空間中的膚色提取會(huì)產(chǎn)生假臉,所謂假臉,就是指并非人臉卻依然被計(jì)算機(jī)提取出來的區(qū)域,主要是因?yàn)槿寺懵兜哪w色有時(shí)不只有人臉,可能有手、手臂、腿和脖子等,甚至與膚色較為相近的背景也會(huì)成為干擾因素,剔除這些假臉主要通過圖像的形態(tài)學(xué)處理和濾波去噪來完成。形態(tài)學(xué)處理主要有圖像的開運(yùn)算、閉運(yùn)算、膨脹、腐蝕和填洞操作,濾波有中值濾波等。膨脹和腐蝕互為逆運(yùn)算,膨脹將圖像區(qū)域擴(kuò)張大,而腐蝕那么是縮小,開運(yùn)算一般使對象的輪廓變得光滑,可斷開狹窄的間斷和消除細(xì)小的突出物。閉運(yùn)算同樣可使輪廓線更為光滑,但與開運(yùn)算相反的是,它通常消除狹窄的間斷和長細(xì)的鴻溝,消除小的空洞,并填補(bǔ)輪廓線中的斷裂。通過上面的分析可知,形態(tài)學(xué)的腐蝕操作能夠使圖像的區(qū)域縮?。⒛軌蛳w粒噪音,開運(yùn)算能夠使圖像的輪廓變的更光滑。研究中利用閉運(yùn)算和開運(yùn)算對二值化的圖像進(jìn)行處理??梢詾V除由噪聲或其他原因引入的不可能為人臉的類膚色區(qū)域,可以減少候選區(qū)域的判斷,提高檢測速度。代碼如下:se=strel('square',3);%構(gòu)造結(jié)構(gòu)元素U=imopen(U,se);%開運(yùn)算U=imclose(U,se);%閉運(yùn)算U=imfill(U,'hole');%填洞figure,imshow(U);%顯示形態(tài)學(xué)處理結(jié)果se1=strel('square',8);U=imerode(U,se1);U=imdilate(U,se1);%區(qū)域連通figure,imshow(U);%顯示結(jié)果樣本測試結(jié)果如圖3.6所示:圖3.6形態(tài)學(xué)處理例如3.6人臉區(qū)域的篩選與標(biāo)記經(jīng)過基于數(shù)學(xué)形態(tài)學(xué)的濾波方法處理后,圖像中的小塊噪聲大多數(shù)被去除。但是由于背景十分復(fù)雜,影響因素較多,某些較小或較大的類膚色區(qū)域仍存在其中。為了刪除假人臉區(qū)域,還要對形態(tài)學(xué)處理后的圖像進(jìn)行一下操作:(1)首先對處理后的二值化圖像進(jìn)行順序掃描的標(biāo)記,可以準(zhǔn)確的標(biāo)記出二值化圖像中各種形狀的連通區(qū)域;(2)計(jì)算每個(gè)連通區(qū)域的長軸、短軸,確定該候選區(qū)域的外接矩形:(3)判斷矩形框的長寬之比,由于人瞼的長寬之比在1.2到1.8之間,舍棄不滿足條件的標(biāo)記區(qū)域。(4)對滿足條件的標(biāo)記區(qū)域,用其矩形框在圖像上標(biāo)出,作為人臉區(qū)域。代碼如下:[L,num]=bwlabel(U,4);sum=0;fori=1:num;[r,c]=find(L==i);r_temp=max(r)-min(r);%臉部區(qū)域長度c_temp=max(c)-min(c);%臉部區(qū)域?qū)挾萾emp=size(r);sum=sum+temp;if(r_temp/c_temp<1.2)|(r_temp/c_temp>1.8);%判斷是否符合長寬比范圍fork=1:temp;L(r(k),c(k))=0;%非人臉剔除endelsecontinue;%繼續(xù)for循環(huán)endendfigure,imshow(U);%顯示結(jié)果sr=strel('disk',6);C=imclose(U,sr);L=bwlabel(C);B=regionprops(L,'area');Se=[B.Area];Sm=max(Se);ifSm>m*n/27B1=bwareaopen(C,Sm);k_y1=m;k2=m;l2=n;%初始化fori=1:mifany(B1(i,:))==1k_y1=i;breakendend%找出上邊界點(diǎn)fori=k_y1:mifB1(i,:)==0k2=i;breakendend%找出下邊界點(diǎn)forj=1:nifany(B1(:,j))==1l_y1=j;breakendend%找出左邊界點(diǎn)forj=l_y1:nifB1(:,j)==0l2=j;breakendend%找出右邊界點(diǎn)k_y=k2-k_y1;l=l2-l_y1;ifk_y>1.2*l&&k_y<1.8*l%限定長寬比I1=imcrop(B1,[l_y1k_y1l.4*k_y]);[n1m1]=size(I1);L1=bwlabel(I1);E=regionprops(L1,'area');Si=[E.Area];Sm=max(Si);ifSm/(n1*m1)>0.3B2=bwareaopen(I1,floor(.5*Sm));g_y1=m1;g2=m1;forj=1:m1ifany(B2(:,j))==1g_y1=j;breakendendforj=g_y1:m1ifB2(:,j)==0;g2=j;breakendendg=g2-g_y1;figure;imshow(I);holdonh1=line([l_y1+g_y1,l_y1+g_y1+g],[k_y1,k_y1]);h2=line([l_y1+g_y1+g,l_y1+g_y1+g],[k_y1,k_y1+1.1*g]);h3=line([l_y1+g_y1+g,l_y1+g_y1],[k_y1+1.1*g,k_y1+1.1*g]);h4=line([l_y1+g_y1,l_y1+g_y1],[k_y1+1.1*g,k_y1]);h=[h1h2h3h4];set(h,'Color',[100],'LineWidth',2);%劃線標(biāo)記elsefigure;imshow(I);endelsefigure;imshow(I);endelsefigure;imshow(I);%顯示結(jié)果end局部測試結(jié)果如圖3.7所示:(a)(b)(c)(d)(e)圖3.7人臉檢測結(jié)果例如3.7誤檢分析本課題選了一些眾多圖片做實(shí)驗(yàn),除了以上得到的局部較理想結(jié)果以外,還有一些圖片出現(xiàn)了誤檢的情況,誤檢雖在所難免,但誤檢卻可以說明算法的劣勢所在,為以后的應(yīng)用提供參考。誤檢結(jié)果中具有代表性的如圖3.8所示。(a)(b)(c)(d)圖3.7誤檢結(jié)果例如從上面的結(jié)果可以看出,本算法對于某些圖片還是有比擬好的效果,對于膚色與背景有明顯差距效果尤佳,經(jīng)測試,計(jì)算速度很快,適宜在對速度要求較高而對精度要求不高的場合使用,其最大缺陷在于當(dāng)背景與膚色比擬接近時(shí),或者是對象的裸露膚色太多時(shí),結(jié)果也會(huì)有一定的不確定性,我認(rèn)為,會(huì)產(chǎn)生這樣的結(jié)果,主要的原因有那么幾個(gè);一是在YCbCr空間中,當(dāng)膚色與背景較接近時(shí),會(huì)產(chǎn)生很多假臉信息,這些假臉處理起來有些困難;二是人的膚色在化裝后會(huì)有一定的變化,脫離本來膚色應(yīng)該有的分布特征。4結(jié)論及展望人臉檢測是指在圖像或視頻流中確定人臉位置、大小的過程,其應(yīng)用背景遠(yuǎn)遠(yuǎn)超出了人臉識(shí)別系統(tǒng)的范疇,近年來,由于人臉檢測在平安監(jiān)視、基于內(nèi)容的圖像檢索等領(lǐng)域的潛在應(yīng)用價(jià)值,人臉檢測已成為一個(gè)獨(dú)立課題并受到眾多研究者的普遍重視。本文首先全面概述了人臉檢測技術(shù)及其開展方向、應(yīng)用背景和研究意義,重點(diǎn)描述了人臉檢測的研究內(nèi)容和方法;然后采用了YCbCr顏色空間來研究膚色模型,以及各

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論