




已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 摘要 人臉識別是近年來興起的基于生物特征的身份認(rèn)證與識別的重要研究方向。鑒于 問題本身的復(fù)雜性,到目前為止沒有一個或少數(shù)幾個算法就能徹底解決所有情況下的 人臉識別問題,而用不同算法進行不同組合得到性能不同的識別系統(tǒng),成為本領(lǐng)域目 前的主流方法。 本文對人臉識別系統(tǒng)的預(yù)處理、特征提取和分類器設(shè)計三個重要環(huán)節(jié)展開了較為 深入的討論。在預(yù)處理環(huán)節(jié)中,將基于像素平均的降維處理、基于能量的光照歸一和 基于f o u r i e r 變換的臉像平移效應(yīng)消除三種算法相結(jié)合;在特征提取環(huán)節(jié),為避免“小 樣本問題”,采用基于主元分析( p c a ) 或基于k - l 變換的特征子空間方法提取本征 臉( e i g e n f a c e ) 或本征譜( e i g e n s p e e t r a ) :在分類器設(shè)計環(huán)節(jié),重點討論了一類對特 征兵有最優(yōu)鑒別能力的核非線性分類器( 即k n d 分類器) 及其擴展形式,提出一種 對特征具有最優(yōu)表達能力的核非線性分類器哏分類器。k n r 分類器建立在正 交投影定理基礎(chǔ)上,在緊湊表達特征時的誤差能量最小。 對o r l 臉像數(shù)據(jù)庫的實驗結(jié)果表明:對于本征臉,k n r 分類器優(yōu)于常見分類器; 利用本征譜比利用本征臉有更好的識別效果;在模式識別應(yīng)用中,同基于i d a 的特 征提取方法不總是優(yōu)于基于p c a 的特征提取方法一樣,對特征具有最優(yōu)鑒別能力的 k n d 分類器不總是優(yōu)于對特征具有最優(yōu)表達能力的k n r 分類器;擴展k n d 分類器 與k n r 分類器性能相當(dāng)。 關(guān)鍵詞人臉識別本征臉臉像本征譜k n d 分類器k n r 分類器 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 a b s t r a c t f a c er e c o g n i t i o ni so n eo ft h em o s ti m p o r t a n tf i e l d si nb i o m e t r i c - b a s e di d e n t i t y v e r i f i c a t i o na n dr e c o g n i t i o n d u et ot h ec o m p l e x i t yi nf a c er e c o g n i t i o n ,t h e r ee x i s t sn o s i n g l ea l g o r i t h mo rs e v e r a la l g o r i t h m st h a tc a ns o l v ea l lt h ep r o b l e m si nf a c er e c o g n i t i o n u n d e rd i f f e r e n ts i t u a t i o n s o nt h ec o n t r a r y , c o m b i n a t i o n so fd i f f e r e n ta l g o r i t h m sl e a dt o f a c er e c o g n i t i o ns y s t e m sw i t hd i f f e r e n tp e r f o r m a n c e s ;a n dt h u si tb e c o m e st h em a i ns t u d y i nt h i sf i e l d t h i sp a p e rf o c u s e so np r e p r o c e s s i n g ,f e a t u r ee x t r a c t i o n ,a n dc l a s s i f i c a t i o n ,t h et h r e e m o s ti m p o r t a n tm o d u l e so faf a c er e c o g n i t i o ns y s t e m i nt h ep r e p r o e e a s i n gs t a g e ,w e p r o p o s et oc o m b i n ep i x e la v e r a g i n g ,e n e r g y - n o r m a l i z a t i o n ,a n dt h ef o u r i e rt r a n s f o r mt o o b t a i nav e c t o rw h i c hh a sr e l a t i v e l yl o wd i m e n s i o n ,l o ws e n s i t i v i t yt ob r i g h t n e s sv a r i a t i o n a n dt of a c es h i f t i n gi nt h ei m a g ep l a n e i nf e a t u r ee x t r a c t i o n ,p c ao rk _ lt r a n s f o r m - b a s e d a n dl d a b a s e ds u b s p a c em e t h o d sa r ed i s c u s s e d t oa v o i dt h es m a l ls a m p l es i z ep r o b l e m , ag e n e r a lp r o b l e mi naf a c er e c o g n i t i o ns y s t e m ,w ea d o p tt h ef o r m e rm e t h o dt oe x t r a c t e i g e n f b a c u r e s c a l l e d e i g e n s p e c t r a o re i g e n f a c e d e p e n d i n go nw h e t h e rt h ef o u r i e r t r a n s f o r mi sp e r f o r m e do rn o ta tt h ep r e p r o c e s s i n gs t a g e i nc l a s s i f i c a t i o n ,t h ep o p u l a r 1 i n e a ra n dn o n l i n e a rm e t h o d s ,s u c ha st h ee u c l i d e a nd i s t a n c ec l a s s i f t e ra n dt h en o n l i n e a r s u p p o r tv e c t o rm a c h i n ec l a s s i f i e r , a r ed i s c u s s e d a n dt h em o s ta t t e n t i o n i sp a i dt oa k e r n e l b a s e dn o n l i n e a rd i s c r i m i n a t o r ( k n d ) a n di t se x t e n d e dv e r s i o n ,e k n d ,b a s e do n w h i c han o v e ln o n l i n e a rc l a s s i f i e rc a l l e dak e r n e l b a s e dn o n l i n e a rr e p r e s e n t o r ( k n r ) i s p r o p o s e d ak n r c l a s s i f i e ri sd e r i v e df r o mt h ep r o j e c t i o nt h e o r e mi nf u n c t i o n a la n a l y s i s a n dt h u si ti sr e p r e s e n t a t i v et ot h ef e a t u r e so ft h et a r g e tp a t t e r nc l a s s w i t hr e s p e c tt o m i n i m u me r r o rn o r m e x p e r i m e n t a lr e s u l t so nt h eo l i v e t t ir e s e a r c hl a b o r a t o r y ( o r l ) f a c ed a t a b a s es h o w t h a tak n rc l a s s i f i e ri ss u p e r i o rt og e n e r a lc l a s s i f i e r s ,i n c l u d i n gak n dc l a s s i f i e r , w i t h r e s p e c t t oc o r r e c tc l a s s i f i c a t i o nr a t e ;b e t t e rr e s u l t sc a nb eo b t a i n e di fe i g e n f a c ei s s u b s t i t u t e db ye i g e n s p e c t r av e c t o r , a n dt h ep e r f o r m a n c eo f a ne k n di sn e a r l yt h es a m et oa k n r k e y w o r d s :f a c er e c o g n i t i o n ;e i g e n f a c e ;e i g e n s p e c t r ao f af a c ei m a g e ;k n dc l a s s i f i e r ; k n rc l a s s i f i e r i i 獨創(chuàng)性聲明 本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進行的研究工 作及取得的研究成果。據(jù)我所知,除了文中特別加以標(biāo)注和致謝的地 方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含 為獲終電子科技大學(xué)或其它教育機構(gòu)的學(xué)位或遷書而使用過的材料。 與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明 確的說明并表示謝意, 簽名: 2 幺兇日期:加,年f o 月d 伯 關(guān)于論文使用授權(quán)的說明 本學(xué)位論文作者完全了解電子科技大學(xué)有關(guān)保留、使用學(xué)位論文 的規(guī)定,有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和磁 盤,允許論文被查閱和借閱。本人授權(quán)電子科技大學(xué)可以將學(xué)位論文 的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或 掃描等復(fù)制手段保存、匯編學(xué)位論文。 ( 保密的學(xué)位論文在解密后應(yīng)遵守此規(guī)定) 簽名:塑遺導(dǎo)師簽名: :蓬整 日期:御年 f 月如日 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 第一章緒論 1 1 人臉識別問題 人臉識別是近年來在全球范圍內(nèi)迅速發(fā)展的人體生物特征識別技術(shù)之一,它在 身份認(rèn)證、視頻監(jiān)視、訪問控制、空港安檢、海關(guān)邊檢、人機交互、智能環(huán)境等方面 有廣泛的應(yīng)用前景。“。與其它個性化生物特征( 語音、虹膜、指紋、掌紋等) 相比, 因臉像的獲取無須介入被識別對象的活動,而且識別系統(tǒng)造價相對低廉,所以基于臉 像的個體識別手段更隱蔽、友好和經(jīng)濟“1 ,人臉識別也因此成為計算機視覺、圖像處 理和模式識別等多個領(lǐng)域的一個研究熱點。 自動人臉識別是利用計算機分析人臉圖像,從中提取出有效的識別信息,用來辨 別身份的一門技術(shù)。它涉及認(rèn)知科學(xué)、圖像處理、計算機圖形學(xué)、機器視覺和模式識 別等多個研究領(lǐng)域。經(jīng)過十多年的努力,這些領(lǐng)域的研究人員在人臉識別方面已今取 得許多科研成果,產(chǎn)生了一系列的方法與理論,但均存在這樣或那樣的限制,如識別 率易受姿態(tài)、表情、光照等因素變化的影響。它的困難體現(xiàn)在: ( 1 )人臉?biāo)苄宰冃? 如表情等) 的不確定性; ( 2 )人臉模式的多樣性( 如胡須、發(fā)型、眼鏡、化妝等) ; ( 3 )圖像獲取過程中的不確定性( 如光照的強度、光源方向) ,等。 這諸多困難使得人臉識別成為一個富于挑戰(zhàn)的課題。 人臉識別主要依據(jù)人臉上的特征,也就是依據(jù)那些在不同個體之間存在較大差異 而對同一個體比較穩(wěn)定的度量。針對上述困難,提取穩(wěn)健可靠的以資區(qū)別于不同個體 的個性化特征,并設(shè)計恰當(dāng)?shù)木哂凶銐蚍夯芰Φ姆诸惼鳎浅晒Φ刈R別人臉的關(guān)鍵。 1 2人臉識別研究的主要內(nèi)容 一個自動人臉識別系統(tǒng)包括四個主要技術(shù)環(huán)節(jié),如圖1 1 所示。 輸 圖像- j :i i j i :弘 i j j ! i i - i i j j i j i - :d 識別輸出 圖1 1自動人臉識別系統(tǒng)的構(gòu)成 1 2 1 人臉檢測與定位 人臉檢測是指在待檢測圖像中確定是否存在人臉,進而確定人臉的大小、形狀、 位置、姿態(tài)等信息的過程。人臉定位包含在人臉檢測中,主要指在含人臉的圖像中確 定人臉的大小、形狀、位置和姿態(tài)。自動人臉識別技術(shù)的前提就是人臉檢測,它關(guān)系 到后續(xù)識別工作能否正確進行,保障最終識別結(jié)果的可靠性。而人臉檢測技術(shù)的核心 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 內(nèi)容實際是人臉定位。對于人臉定位技術(shù)的研究主要有以下三個種類:一類是基于人 臉幾何特征,并利用模扳匹配的定位方法。另一類是基于統(tǒng)計的人臉定位方法,將人 臉圖像看作一個多維向量,從而將人臉定位問題轉(zhuǎn)換為在多維空間中分布信號的檢測 問題,如主量分析( p c a ) 方法。還有一類是利用膚色、紋理特征的定位方法。 1 2 2 人臉圖像的預(yù)處理 由于實際成像系統(tǒng)多少存在不完善的地方以及外界光照條件等因素的影響,在一 定程度上增加了圖像的噪聲,使圖像變得模糊、對比度低、區(qū)域灰度不平衡等。為了 提高圖像的質(zhì)量,保證提取特征的有效性,進而提高識別系統(tǒng)的識別率,在提取特征 之前,有必要對圖像進行一些預(yù)處理,包括灰度化、平滑、歸一化等。 1 、人臉圖像的灰度化 為了便于圖像的處理,需將所攝取的真彩色圖像進行灰度化處理?;叶然褪鞘?紅、綠、藍彩色分量相等的過程。 2 、人臉圖像的平滑及噪聲過濾 人臉識別對輸入圖像有較高的要求,如果輸入圖像噪聲較強或存在干擾物,則對 人臉特征的提取乃至識別都有較大的影響。因此在人臉特征提取之前,常常需要對輸 入圖像進行降噪處理,盡可能減少噪聲的影響。一般采用近鄰平均平滑處理,如采用 8 近鄰平均平滑法,噪聲功率可以降低近2 0 d b 。這種方法的優(yōu)點是算法簡單,容易實 現(xiàn)以及速度快。若經(jīng)過平滑處理后,仍存在少數(shù)殘余噪聲,可以采用中值濾波等方式 對噪聲加以過濾。 3 、人臉圖像的= 值化 由于灰度的差異,人臉圖像中在入臉的眼、嘴、頭發(fā)、輪廓等處灰度值與周圍部 分有一較大的梯度,灰度特征非常明顯。通過對圖像進行二值能夠?qū)⑷四樑c背景分離 開,同時保留了人臉的基本特征,很容易從處理后的圖像中確定人臉位置。二值化處 理的關(guān)鍵是確定一個合適的閥值,若閥值選得過高,則會將過多的對象點誤認(rèn)為背景 點;反之則會將過多的背景點誤認(rèn)為對象點。通常采用類別方差等自動門限法對圖像 進行二值化。 4 、人臉圖像的歸一化 為了使圖像具有一致的亮度和對比度等特性,并降低光照的影響,需要對圖像進 行歸一化處理。使用的方法有亮度歸一化( 使圖像具有一致的平均亮度) 、對比度歸 化( 使圖像具有致的對比度) 和直方圖歸一化( 使處理后的i 蛋像在各個灰度級有大致 相同數(shù)量的點,以便充分利用各灰度級的信息) 。 1 2 3 臉像特征提取方法 電子科技大學(xué)碩士學(xué)位論文: 基于本征特征的臉像非線性分類方法研究 特征提取是模式識別研究的基本問題之一。對于圖像識別而言,提取有效的圖像 特征是完成圖像識別的首要任務(wù)。目前用于圖像識別的特征可以分為如下幾種: ( 1 )直觀性特征。如圖像的邊緣、輪廓、紋理或區(qū)域等。在人臉識別中用得 最多的直觀性特征是幾何特征,即人臉的五官尺寸及相對位置。 ( 2 )灰度的統(tǒng)計特征。如直方圖特征、主分量特征等。將圖像看作一種二維 隨機過程,可以引入統(tǒng)計上的各階矩作為特征來描述和分析圖像,它們能夠在保留主 要分類信息的基礎(chǔ)上大大降低特征的維數(shù)。 ( 3 )變換系數(shù)特征。對圖像作各種數(shù)學(xué)變換,可以將變換的系數(shù)作為圖像的 一種特征,例如f o u r i e r 變換,h o u g h 變換等在圖像特征提取方面均有廣泛應(yīng)用。這 類方法的優(yōu)點是計算比較方便,但去相關(guān)能力不強。系數(shù)特征的維數(shù)仍較大。 ( 4 )代數(shù)特征。它反映了圖像的一種內(nèi)在屬性。將圖像作為矩陣看待,可對 其進行各種代數(shù)變換,或進行各種矩陣分解。由于矩陣的特征向量反映了矩陣的一種 代數(shù)屬性,并具有不變性,因此可用來作為圖像特征。在人臉識別中,用來提取圖像 代數(shù)特征的典型方法有矩陣的奇異值分解( s v d ) 等。 上述特征可以分為兩大類:局部特征( l o c a lf e a t u r e s ) 和整體特征( h o i i s t i c f e a t u r e s ) 。前者主要指直觀性幾何特征( 人臉的五官尺寸及相對位置) 。這類特征雖 然具有維數(shù)低等優(yōu)點,但由于同一個人因表情及光照條件變化往往會導(dǎo)致其尺寸及相 對位置發(fā)生較大的變化,即局部幾何特征對人臉姿態(tài)、表情、光照等的變化非常敏感, 穩(wěn)健性和可靠性差。后者指對整個人臉按圖像處理的方式得到的特征,包括灰度特征、 變換特征和代數(shù)特征。這些整體特征對臉像上述變化較穩(wěn)健,但要得到可靠的特征, 往往需要采取適當(dāng)?shù)妮^為復(fù)雜的處理手段。用這些處理手段提取人臉特征時一般遵循 以下原則:首先必須緊湊,即提取的特征為一個低維向量;其次要表達力強,即提取 的特征必須能充分地表示人臉;另外必須穩(wěn)健可靠,即對光照、人臉姿態(tài)、細(xì)節(jié)等不 敏感。為此,從2 0 世紀(jì)8 0 年代末期以來,臉像特征提取和描述一直成為人臉識別研 究中的焦點,也因此出現(xiàn)了各種特征提取方法,包括基于模型的幾何特征提取方法8 “、整體的或局部的統(tǒng)計特征提取方法,如傅氏不變特征“1 、多尺度特征隨”、不變矩 與統(tǒng)計模型( 如隱m a r k o v 模型) 特征、文獻 1 0 所綜述的各種子空間特征等提取方 法,以及混合特征提取方法“+ ”。這些方法是模式識別理論和信號處理技術(shù)在人臉識 別問題中的具體應(yīng)用和發(fā)展。 1 2 4 分類器設(shè)計 模式的分類是模式識別中很重要的一環(huán),對識別率有較大的影響。模式分類的實 質(zhì)是找出輸入數(shù)據(jù)空間到輸出類別空間的映射關(guān)系。在數(shù)學(xué)上,這種映射關(guān)系可以用 一個函數(shù)來表示,即用它可以將不同類別的數(shù)據(jù)集分割開來,其幾何意義是高維數(shù)據(jù) 空間中的一個超平面或超曲面。尋求適用、性能優(yōu)良的分類方法構(gòu)造出性能優(yōu)良的分 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 類器,是提高模式識別系統(tǒng)性能的關(guān)鍵。 傳統(tǒng)的分類方法有統(tǒng)計決策法和句法結(jié)構(gòu)。統(tǒng)計決策是一種聚合運算,即條件概 率用p ( x b ) 表示 表示樣本向量,g 表示第i 類別) ,c 類就有c 個分布,然后判 定未知模式屬于哪一類分布,從而達到分類的目的。句法結(jié)構(gòu)主要采用語法規(guī)則來達 到分類的目的。它們的共同特點是需要對樣本的統(tǒng)計性質(zhì)有較好的了解,如參數(shù)貝葉 斯分類器,如果能事先對參數(shù)的分布有所了解,往往能夠取得較好的分類效果。 分類囂可看成是由硬件或軟件組成的“機器”,按已確定的分類判別規(guī)則對待識 別模式進行分類判別,輸出分類結(jié)果。其設(shè)計過程是:用一定數(shù)量的樣本( 稱為訓(xùn)練 樣本集) ,確定出一套分類判別規(guī)則,使得按這套分類判別規(guī)則對待識別模式進行分 類所造成的錯誤識別率最小或引起的損失最小。 分類方法是人臉識別系統(tǒng)的一個重要環(huán)節(jié)。然而與特征提取方法相比,人臉識別 中對分類方法的研究相對較少。在相關(guān)研究中,除了運用傳統(tǒng)模式分類方法如歐氏距 離法、最近鄰法、馬氏距離法、b a y e s 分類器、p a r z e n 分類器以外,各種神經(jīng)網(wǎng)絡(luò) 分類器如徑向基函數(shù)( r b f :r a d i a lb a s i sf u n c t i o n ) 神經(jīng)網(wǎng)絡(luò)“、支撐向量學(xué)習(xí)機 ( s v m :s u p p o r tv e c t o rm a c h i n e ) “4 等也被廣泛采用,并得到改進“嘲或綜合“螂。 這些分類方法分為線性和非線性兩類。理論和應(yīng)用表明,對于線性不可分特征,恰當(dāng) 的非線性方法能得到較為理想的分類效果。然而,上述非線性分類方法要么需要預(yù)先 知道模式特征的統(tǒng)計分布( 參數(shù)化非線性b a y e s 分類器) ,要么需要附加復(fù)雜的手段 ( 如二次規(guī)劃) 訓(xùn)練或估計分類器參數(shù)( 非線性s v m 分類器、p a r z e n 分類器、r b f 神經(jīng)網(wǎng)絡(luò)等) ,因而限制了分類性能或訓(xùn)練速度。 1 3本文的主要工作及創(chuàng)新點 1 3 1 主要工作 如上所述,個完整的人臉識別系統(tǒng)包括臉像檢測定位、預(yù)處理、特征選擇 提取、分類識別等多個環(huán)節(jié)。本文的工作主要集中在臉像檢測的后續(xù)幾個環(huán)節(jié),即在 假定已經(jīng)完成人臉檢測工作的基礎(chǔ)上,對預(yù)處理、特征提取、分類方法和分類器設(shè)計 展開討論。具體內(nèi)容如下: ( 1 )臉像預(yù)處理方法在常用預(yù)處理方法進行較為詳細(xì)地討論的基礎(chǔ)上,重 點討論基于像素平均的臉像降維方法、基于能量的亮度歸一化方法和基于快速 f o u r i e r 變換( f 阿) 的臉像平移影響消除法( 第二章) 。 ( 2 )臉像線性特征提取方法重點對子空間臉像特征提取方法進行討論,其 中包括基于主元分析( p c a :p r i n c i p a lc o m p o n e n ta n a l y s i s ) 和k a a h u n o n l o e v e ( k l ) 變換的本征特征提取方法和基于線性鑒別分析( l d a :l i n e a rd i s c r i m i n a n t a n a l y s i s ) 的線性特征提取方法進行分析討論( 第二章) 。 4 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 ( 3 )分類方法與分類器設(shè)計在對常用線性分類方法和非線性方法進行初步 介紹的基礎(chǔ)上,重點討論了一種具有特征最優(yōu)鑒別能力的核非線性分類器( k n d : k e r n e l - b a s e dn o n l i n e a rd i s c r i m i n a t o r ) 及其斜投影實現(xiàn)( e l ( n d :e x t e n d e dk n d ) 。 與特征最優(yōu)鑒別相應(yīng),提出一種具有特征最優(yōu)表達能力的核非線性分類器( k n r : k e r n e l b a s e dn o n l i n e a rr e p r e s e n t o r ) ( 第三章) 。 ( 4 )人臉識別分類實驗利用o r l ( o l i v e t t ir e s e a r c hl a b o r a t o r y ) 人臉基 準(zhǔn)數(shù)據(jù)庫,根據(jù)上述預(yù)處理方法和臉像本征特征提取方法,對歐氏距離分類器和基于 k n d 、k n r 的非線性分類器的識別性能( 正確識別率或分類錯誤率) 進行實驗研究( 第 四章) 。 1 3 2 主要創(chuàng)新點 總結(jié)上述研究內(nèi)容,本文創(chuàng)新點主要有如下兩點: ( 1 )在臉像預(yù)處理方法方面提出了基于像素平均的臉像降維方法、基于能 量歸一的光照敏感度降低方法和基于快速f o u r i e r 變換( f f t ) 的臉像平移消除法。 這些方法計算簡單,對比實驗結(jié)果也表明了其有效性。 ( 2 )在臉像特征分類方法面提出一種具有特征最優(yōu)表達能力的核非線性分 類器。對比實驗結(jié)果表明,其性能優(yōu)于常用的歐氏距離分類器和基于k n d 的非線性分 類器。 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 第二章臉像預(yù)處理與線性特征提取 人臉識別本質(zhì)上是一個特征分類闖題。所以,從臉像中提取穩(wěn)健可靠的以資區(qū)別 于不同個體的個性化特征,是成功地識別人臉的一個關(guān)鍵,也是人臉識別研究中最富 于挑戰(zhàn)性的問題之一。然而,恰當(dāng)?shù)哪樝耦A(yù)處理一方面可以降低后續(xù)特征提取的運算 量,同時有助于提取穩(wěn)健可靠的特征。 本章在介紹常見預(yù)處理方法的基礎(chǔ)上,重點討論基于像素平均的臉像降維方法、 基于能量歸一化的光照敏感度降低方法和基于f f t 的臉像平移效應(yīng)消除法。在特征提 取方面,重點討論基于子空間的線性特征提取方法,包括基于p c a 和k _ l 變換的本征 特征提取方法和基于l d a 的線性特征提取方法,并對這些方法進行比較和評述。 2 1 臉像預(yù)處理 2 1 1 常見預(yù)處理 常見預(yù)處理包括人臉圖像的灰度化、平滑與過濾、二值化和歸一化。本小節(jié)分別 對這些過程作簡單介紹。 1 、人臉圖像的灰度化 灰度化就是使彩色的r ( 紅) 、g ( 綠) 、b ( 藍) 分量相等的過程。由于r 、g 、b 的取值范圍是0 2 5 5 ,所以灰度級別只有2 5 6 級,即灰度圖像僅能表現(xiàn)2 5 6 種顏色( 灰 度) 。常見灰度處理方法主要有最大值法、平均值法和加權(quán)平均值法。 ( 1 )最大值法:使r 、g 、b 三元色的值等于三個值中最大的一個。即 r gb m a x ( r ,g ,b ) ( 2 1 ) ( 2 )平均值法:使r 、g 、b 三元色的值等于三個值的平均值,即 r gb m e a n ( r ,g ,b ) ( 2 2 ) ( 3 )加權(quán)平均值法:根據(jù)重要性或其他指標(biāo)給r 、g 、b 三元色的值賦予不同 的權(quán)值,并使r 、g 、b 的值加權(quán)平均,即 r gb ( r4 - g + b ) 3 ( 2 3 ) 其中w r 、分別為r 、g 、b 三元色的權(quán)值。實驗和理論推導(dǎo)證明,當(dāng)三者分 別取0 3 0 、0 5 9 、0 兒時,能得到最合理的灰度圖像。即取 r g b ( 0 3 0 r + 0 5 9 g + o 1 1 b ) 3 ( 2 4 ) 2 、人臉圖像的平滑與過濾 ( 1 )臉像的平滑指滑動平均,它具有低通特性。事實上,設(shè)“n ) 為一維序 電子科技大學(xué)碩士學(xué)位論文: 基于本征特征的臉像非線性分類方法研究 列( 二維的情況有相l(xiāng) 刊的結(jié)論) ,其m 點半滑結(jié)果為“n ) ,則 砌) 5 吉薈砌“) 相應(yīng)的系統(tǒng)函數(shù)為: 日( :) = 擊簍z = 面1 百1 - z t m 而幅頻響應(yīng)為: 陬e 坤刪= 擊啵矧 ( 2 5 ) ( 2 6 ) ( 2 7 ) 如圖2 - 1 為5 點平滑的幅頻響應(yīng)“。所以,通過平滑可以過濾掉部分高頻噪聲。 = 3 3 工 圖2 - 15 點平滑對應(yīng)的幅頻特性 臉像平滑可以降低噪聲方差。設(shè)原始臉像及加性噪聲分別為g o ( n ,聊) 和v ( ,m ) ,并 設(shè)噪聲為零均值平穩(wěn)白噪聲,其方差為a 2 ,且噪聲與原始臉像不相關(guān)。則在8 近鄰 ( 共9 點) 平滑下得到平滑結(jié)果為 咖川= ;蚤1 量1 “n - i , m - 卅v ( n - i , m - j ) ( 28 ) 7 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 平滑結(jié)果中噪聲方差的變?yōu)? 2 8 1 ,即降低近2 0 d b 。這種方法的優(yōu)點是算法簡單易 實現(xiàn),而且速度快。但由圖2 1 可知,平滑結(jié)果仍保留部分高頻噪聲;而且容易破壞 圖像的輪廓和邊緣。為克服這些不足,常常采用其它方法對臉像進行過濾。 ( 2 )臉像的過濾指設(shè)計恰當(dāng)?shù)臄?shù)字濾波器對臉像進行過濾。其中普遍使用 的濾波器是中值濾波器。在一維情況下,中值濾波法是一個含有奇數(shù)個單元的滑動窗 口,經(jīng)過對窗口內(nèi)的信號排序,選擇中間值作為輸出,即: y ( n ) = m e d e a n y ( n ) ,y ( n + 1 ) ,y ( n + 2 k + 1 ) ) ,k e z ( 2 9 ) 其中z 為整數(shù)集合。上述結(jié)果很易引入二維情況,如選擇一3 3 的窗口,對9 個像 素的灰度值進行排序,輸出中間值,即 g ( n ,m ) = m e d e a n g o ( n l ,m 一,) ,一1 i i , - l j s l ,f ,j z ( 2 1 0 ) 中值濾波器在過濾噪聲的同時,能保護圖像的輪廓和邊緣。 3 、臉像的二值化 二值化的關(guān)鍵是確定一個合適的閥值。通常采用自動門限法對圖像進行二值化, 以下簡述類別方差自動門限選取算法o ”。 設(shè)在0 - 2 5 5 的灰度值中取第i 個灰度值的像素數(shù)占總數(shù)的比例為p ( i ) 。選擇一個 閥值t ,它將所有的像素分為兩類具有t 及以下灰度值的像素類和以上灰度值的 像素類,它們的概率分別為 p d t ) = p ( f ) ,b ( f ) = p ( f ) ( 2 1 1 ) 均值分別為 肌o ) _ 南萎f p ( i ) 川如卜贏丕烈f ) ( 2 1 2 ) 方差分別為 啪) 2 南o ( i - # 1 2 m 喲2 贏群哨( m 2 加) ( 2 _ 1 3 ) 相應(yīng)地,兩類的類內(nèi)方差、類間方差和總方差分別為: a 參( f ) = e ( f ) a ;( f ) + 最( r ) a ;( f ) , a ;( f ) = 置o ) o ) 。( f ) 一一:( f ) 2 , ( 2 1 4 ) 4 ( 0 = a ( f ) + 4 ( t ) 使類問方差與總方差之比2 0 ) 盯;( f ) 最大的t ,就是所需要的閥值。 4 、臉像的歸一化 電子科技大學(xué)碩士學(xué)位論文: 基于本征特征的臉像非線性分類方法研究 常用的歸一化方法有亮度歸一化、對比度歸一化、直方圖歸一化等。 ( 1 )亮度歸一化亮度歸一化處理目的是使圖像具有一致的平均亮度,以便 進一步進行人臉識別過程,提高系統(tǒng)的正確識別率。設(shè)灰度圖像為9 0 ( n ,聊) ,亮度值為 0 2 5 5 ,圖像的寬度和高度分別為m 、,平均亮度設(shè)定為萬= 1 2 0 “”。圖像的平均亮 度為: p 2 赤委薈姚m ) ( 2 1 5 ) 變換后的圖像為 g ( n ,m ) = s a t l i n s 仁g 。( n ,m ” ( 2 1 6 ) p 其中s a t l i n s 為一傳遞函數(shù),其定義如下 f0 ,x 2 5 5 如圖2 - 2 所示。 y = s a t l i n s ( x ) j l 2 5 5 r 02 5 5 圖2 - 2 傳遞函數(shù)s a t l i n s0 ) ( 2 )對比度歸一化 對比度歸一化的目的是使圖像有一致的對比度。對亮度歸一化后的圖像為 g ( n ,肌) ,令 p 一= m a x g ( n ,m ) 】,p m = m i n g ( n ,研) ( 2 1 8 ) 則對比度歸一化的圖像為 1 g ( 玎,m ) = 二一【g ( 以,m ) 一p 。面】 ( 2 1 9 ) p 一p f d h ( 3 )直方圖歸一化 經(jīng)過亮度與對比度歸一化處理后的圖像已經(jīng)比較規(guī)范了,為了進一步規(guī)范圖像, 可以進一步將圖像直方圖進行均衡化處理,得到在各個灰度級有大致相同數(shù)量的點的 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 圖像,使得各灰度級得到充分的利用“。 2 1 2 本文的預(yù)處理 本文的預(yù)處理包括基于像素平均的臉像降維方法、基于能量的亮度歸一化方法和 基于f f t 的臉像平移效應(yīng)消除法。詳細(xì)討論如下, 1 、基于像素平均的人臉圖像降維 通常一幅原始入臉圖像是高維空間里的一點,在高維空間上直接進行特征提取的 計算量非常大,限制了臉像的快速識別。所以,降維成為臉像處理的首要問題。對此, 我們采用簡單的像素平均法,在預(yù)處理階段對原始圖像進行欠采,達到一定的降維和 減輕運算量的目的。像素平均是一種局部的空間處理算法,其基本思想是用選定鄰域 內(nèi)像素的灰度均值來代替每個像素的灰度并作為一個新的像素。假定給出一幅分辨率 為n 。x m 。的原始圖像9 0 ( n 。,m 。) ,經(jīng)像素平均后得到的則是一幅具有較低分辨率 n x m 的圖像g ( n ,玳) g ( n ,m ) = i 1 e g 。( z ,y ) ,i n n n ,1 s 現(xiàn)m ( 2 2 0 ) 1 7 ( j ,) e s 其中,s 是所選區(qū)域中像素的集合,d 則是這一集合中像素的總數(shù),其大小由原始圖 像分辨率和后續(xù)特征提取算法的特點決定。研究表明,對一幅9 2 x 1 1 2 的臉像,分辨 率降低為原來1 1 6 的結(jié)果基本不影響識別性能。 2 、基于能量的光照敏感度降低方法 實際問題中,光照變化在很大程度上影響人臉識別系統(tǒng)的性能”。為減小這一影 響,我們將欠采后的圖像進行能量歸一化。對于式( 2 2 0 ) 中的圖像g ( n ,m ) 。能量 歸一化結(jié)果如下為 m 朋卜揣 2 1 ) 其中 廠n f、i 2 l k o ,叫i 1 9 2 ( m ) i ( 2 2 2 ) 為矩陣f r o b e m u s 范數(shù)。 3 、基于f f t 的臉像平移效應(yīng)消除方法 提取不變特征一直是模式識別研究工作者所追求的一個目標(biāo)。平移不變性是對不 變特征的一種基本要求,通常利用f o u r i e r 變換的平移不變性實現(xiàn)。事實上,對一維 信號x ( n ) ,若其f o u r i e r 變換為x f f ”) ,則平移信號x 0 一f ) 的f o u r i e r 變換為 口一如x 0 扣) ,顯然信號平移后其f o u r i e r 變換保持不變的模:離散f o u r i e r 變換( d f t ) 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 也具有相同的特點,即序列周期移位的d f t 保持不變的模。利用這一特點對臉像進行 預(yù)處理,結(jié)果不受臉像在像平面內(nèi)平移的影響。另外,實信號的d f t 具有對稱性,利 用該特點可以使模式向量的維數(shù)減半。最后,d f t 可以通過快速算法e f t 實現(xiàn)。根據(jù) 這三個特點,本文采用基于f f t 的臉像預(yù)處理方法,消除臉像在像平面內(nèi)的平移帶來 的影響。具體過程如下: 將上述預(yù)處理后的二維圖像l ( n ,確按行連接,得到n m 維空間中的一個列向量v 。 通過d ? t ,我們可以獲得v 的頻域表達: 袱) = 藝l v d 一,蔫)(2zs)n-o t ( 七) = v ( n ) c x d 一,專籌l ( 2 2 3 ) 1 r 其中v ( n ) 是向量v 的第( n + 1 ) 個元素,o ( k ) 則是其離散傅氏變換所得序列口的第 ( 斛1 ) 個元素,k - - o ,1 ,( n m - o 。由d f t 的對稱性可知,實序列的d f t 具有共軛 對稱性,所以其模是一偶對稱序列。據(jù)此,t 的長度可以減半,結(jié)果記為 z = 0 t ( 叫l(wèi) 呷) l i 口( 三) i j ( 2 2 4 ) 其中,t 代表向量或矩陣的轉(zhuǎn)置,的值取決于n m 的奇偶性 三:刪7 2 ,i f 塒i 8 吖吼 ( 2 2 5 )l = 、0 j 【n m 2 + 0 5 ,i f n mi so d d 通常狀況下,一幅人臉圖像的維數(shù)是非常高的。雖然在確保以資區(qū)別于不同個體 的信息基本不變的條件下,經(jīng)過預(yù)處理后得到的數(shù)據(jù)向量z 的維數(shù)較之原臉像有很大 程度的降低,但通常還不是緊湊的向量。若不作進一步去相關(guān)處理而直接利用,則后 續(xù)分類器難以快速訓(xùn)練和分類。所以,接下來的工作是在確保足夠的特征表達能力或 鑒別能力的條件下,采用恰當(dāng)?shù)奶幚矸椒ù蠓冉档蛿?shù)據(jù)向量z 的維數(shù),得到緊湊的 特征向量,這就是特征提取問題。 2 2 臉像線性特征提取 特征提取的目的在于通過提取最具代表性的典型特征,將原始信號數(shù)據(jù)壓縮到一 個低維空間,為數(shù)據(jù)描述提供更好的手段。這一領(lǐng)域中出現(xiàn)的一些有效算法大致可分 為兩大類:基于幾何模型的方法和基于統(tǒng)計的方法。前者提取的是眼睛、嘴、鼻子、 下頜等面部特征點的相對位置、距離、角度等“,這種方法的成功性依賴于人臉部位 的精確檢測,而且所提取的特征對表情等細(xì)節(jié)變化非常敏感;基于統(tǒng)計的方法則利用 統(tǒng)計策略直接從整個訓(xùn)練圖像集合提取統(tǒng)計特征,以其快速、簡易和相對穩(wěn)定等優(yōu)點, 在近年來引起了極大關(guān)注。其中主元分析( p c a ) ( 或k l 變換) 和線性鑒別分析( l d a ) 是這一研究熱點中兩種最基本的線性特征提取手段?!? “,本節(jié)對這兩種方法進行具體 介紹。 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 2 2 1 本征特征提取 主分量分析( p c a ) 的主要思想是:利用一組為數(shù)不多的特征去盡可能精確地表 示模式樣本。它通常采用訓(xùn)練樣本協(xié)方差矩陣的特征向量系作為展開基,那些對應(yīng)若 干個最大特征值的特征向量被稱為主分量或主成分。模式樣本在這些主分量上投影 后,所得的投影系數(shù)即為主分量特征,亦稱為本征特征。從而,原模式樣本可表示為 這些主分量與投影系數(shù)乘積的代數(shù)和,這種表示在最大協(xié)方差意義下是最優(yōu)的。主分 量分析有兩大優(yōu)點:一是消除了模式樣本之間的相關(guān)性,二是實現(xiàn)了模式樣本的維數(shù) 壓縮。主分量分析能將高維的模式樣本壓縮為更易于處理的低維樣本,給出高維數(shù)據(jù) 的一種簡約的表示。 1 、基于p c a 的特征子空間 基于p c a 的特征提取方法又稱為特征子空間法嘲,其核心是矩陣的特征分解,討 論如下o “: 設(shè)工維模式空聞的p 維普通子空間由p 個向量張成為 、 rp、 s _ s p a n ( ”雌) 一h x 一黔蠔 ( 2 2 6 ) 其中毫。,鼉:,毫。( pc 三) 為常數(shù)。當(dāng)p 維子空間s 的p 個正交基向量通過對訓(xùn)練模 式向量的協(xié)方差矩陣進行特征分解求得時,該子空間即特征子空間。 設(shè)維空間中任意向量z 經(jīng)矩陣a 線性變換的結(jié)果為y - - a z ,如圖2 3 所示( 二 維情形) 。k z ( 七為常數(shù)) 是對z 在其原方向或反方向進行的展縮,而a ( k ) = k ( a z ) = 姆 是對j ,在其原方向或反方向的相應(yīng)展縮。對工維空間,存在工個基本的方向,使得沿 這些方向的向量經(jīng)過4 變換后長度保持不變或只是受到展縮,而方向不變,即有 a z = 把( 2 2 7 ) 這個基本方向即該空間的特征方向( 本征方向或慣性主軸) 。模式向量在這些方向 上的投影就是其本征特征,以所有特征向量為基響亮的空間為特征空間,而以其中一 部分特征向量為基響亮的空間為特征子空問。 主元分析的目的是通過線性變換找到一組最優(yōu)的單位正交向量基,即式( 2 2 6 ) 中的向量集 h 。,比:,h 。,用它們的線性組合來重建原樣本。在數(shù)學(xué)上,是通過解特 征值問題來使協(xié)方差矩陣對角化來實現(xiàn)。 假定有p 個訓(xùn)練向量z j ,i = 1 , 2 ,p ,其協(xié)方差矩陣& ( 又稱總散布矩陣) 為 p s ,= i 1 瓦z 1 ( 2 2 8 ) 其中 92 z p 卜 1 一p = 一z x 2 一z l 一 0 i 屯子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 少 圖2 - 3 模式向量的線性變換 對協(xié)方差矩陣曼作特征分解;對分解結(jié)果,選取p ( p ) 個最具表達性的特征值對 應(yīng)的特征向量,構(gòu)成向量集 。,口:,“, 并張成子空間,該子空間即特征子空間。 2 、基于奇異值分解( s w ) 的特征子空間 通過對上工維的協(xié)方差矩陣最作特征分解,直接確定其個特征值及所對應(yīng)特 征向量的過程計算非常繁復(fù)??紤]到人臉識別中訓(xùn)練圖像的數(shù)目c p ) 常常遠(yuǎn)遠(yuǎn)小于模 式向量的維數(shù)( 三) ,為降低運算的復(fù)雜度,可以利用奇異值分解( s v d :s i n g u l a rv a l u e d e c o m p o s i t i o n ) 來實現(xiàn)特征分解,構(gòu)造特征子空間。其過程如下: 首先,由訓(xùn)練樣本構(gòu)造較低維矩陣三 z = 薯 2 p 】 ( 2 3 0 ) 三的奇異值分解為 z l ,= u l x l :毛。,r z ,= 己- ,z 。,c v z ,z 。t c 一,】x 9 1 ”。g :,。二h 。,一, 1 1 毛,【以】;x ( 。一r ( 2 3 1 ) = u 1 日1 曙+ u 22 2 曙( s u b s c r i p t so m i t t e d ) 其中奇異值矩陣占為對角陣,其對角元素俄。,九:,九,) 取平方后按從大到小的順序 排列:p 為特征子空間維數(shù),可以由預(yù)先指定的信息壓縮比叩按下式確定 。:! i :1 2 蘭i :笠 ( 2 3 2 ) 1 a ;+ a :十五i + 十a(chǎn) ; u 和礦分別為三的左、右奇異矩陣,滿足 u 吁2 u 7 【,= i 一( 2 3 3 ) v v l = v r 礦= ,p 。p u l 由目的前p 個值所對應(yīng)的奇異向量為列所構(gòu)成( p s l ,p p ) 。容易證明 電子科技大學(xué)碩士學(xué)位論文:基于本征特征的臉像非線性分類方法研究 望2 u 3 8 t u t = 【,釅u 7( 2 3 4 ) 乞1 2 :v 3 7 z v 7 :y 占2 v 7 即乞的左、右奇異矩陣分別為三三7 、三7 三的特征矩陣。所以礬的列就是所尋找的p 維特征子空間的基向量,即式( 2 2 6 ) 中的向量集合砸。,盯:,h , 。 與人臉識別有關(guān)的奇異值具有如下特性口4 :良好的穩(wěn)定性,人臉圖像當(dāng)有小的擾 動時,奇異值的變化不大:奇異值表征了圖像的代數(shù)特征,在某種程度上,奇異值特 征擁有代數(shù)與幾何兩方面的不變性。 一旦確定了特征子空間的p 個基向量 玎,?。海琱 。) ,每個模式向量z 均可投影到 該特征子空間,形成一特征向量本征特征x : 工= _ x 2 x , 1 ,工,= h j k z jj = 1 ,2 ,p ( 2 3 5 ) 即 x = u j ( z z ) ( 2 3 6 ) 對于在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZZB 3589-2023 潔凈轉(zhuǎn)子泵標(biāo)準(zhǔn)
- 2025年度礦山新能源利用合作開發(fā)協(xié)議
- 二零二五年度船舶租賃與船舶融資租賃合同
- 二零二五年度金融產(chǎn)品創(chuàng)新增資協(xié)議
- 2025年度酒店品牌授權(quán)及加盟合作協(xié)議
- 二零二五年度有機果園使用權(quán)及品牌授權(quán)合同
- 二零二五美容院轉(zhuǎn)讓合同包含員工培訓(xùn)體系與職業(yè)發(fā)展規(guī)劃
- 2025年度旅游度假區(qū)合租商鋪合作協(xié)議
- 二零二五年度知識產(chǎn)權(quán)標(biāo)準(zhǔn)化與認(rèn)證顧問合同
- 二零二五年度科技園區(qū)出租房承包管理協(xié)議
- 正常分娩過程與護理
- 膿毒血癥患者的護理查房
- 2024商品房買賣合同范本下載
- 廣東省廣州仲元中學(xué)2025年高三下學(xué)期入學(xué)考試試化學(xué)試題文試卷含解析
- 衛(wèi)生部病歷管理規(guī)定
- 4《海燕》公開課一等獎創(chuàng)新教學(xué)設(shè)計
- 班主任能力大賽情景答辯環(huán)節(jié)真題及答案高中組
- 定制公司用工合同范本
- 2024年四川省成都市雙流區(qū)中考物理第二次適應(yīng)性考試試卷
- 2024年岳陽職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫附答案
- 2024年江西司法警官職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫含答案
評論
0/150
提交評論