模式識(shí)別論文——PCA與SVD融合人臉識(shí)別算法設(shè)計(jì)

上傳人：A*** IP屬地：廣東上傳時(shí)間：2021-11-22 格式：DOCX 頁(yè)數(shù)：13 大小：1.22MB 積分：22 舉報(bào) 版權(quán)申訴

模式識(shí)別論文——PCA與SVD融合人臉識(shí)別算法設(shè)計(jì)_第2頁(yè)

模式識(shí)別論文——PCA與SVD融合人臉識(shí)別算法設(shè)計(jì)_第3頁(yè)

模式識(shí)別論文——PCA與SVD融合人臉識(shí)別算法設(shè)計(jì)_第4頁(yè)

模式識(shí)別論文——PCA與SVD融合人臉識(shí)別算法設(shè)計(jì)_第5頁(yè)

已閱讀5頁(yè)，還剩8頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.PCA與SVD相融合的人臉識(shí)別算法設(shè)計(jì)與系統(tǒng)實(shí)現(xiàn)摘要：主成分分析是基于K-L變換思想的優(yōu)秀線性分類算法之一，根據(jù)方差最大化原理，將信號(hào)在一組新的規(guī)范正交基下展開，其在人臉識(shí)別中具有重要應(yīng)用價(jià)值，所形成的算法稱為本征臉?lè)椒?，然而，由于該方法將圖像變換為本征臉空間的一點(diǎn)，因此對(duì)光照，角度和平移等因素比較敏感。奇異值分解作為一種有效的代數(shù)特征提取方法，將圖像看作矩陣進(jìn)行處理，具有位移，旋轉(zhuǎn)不變性等優(yōu)點(diǎn)，恰好彌補(bǔ)了PCA在這方面的不足，兩者相融合的算法可以有效地提高識(shí)別率，通過(guò)ORL庫(kù)的測(cè)試，可以證實(shí)這一算法的優(yōu)勢(shì)。最后，設(shè)計(jì)了基于Matlab GUIDE的人臉識(shí)別系統(tǒng)。關(guān)鍵詞：主成分分析，奇異值

2、分解，人臉識(shí)別，K-L變換1. 介紹隨著社會(huì)的發(fā)展以及技術(shù)的進(jìn)步，尤其是最近十年內(nèi)計(jì)算機(jī)的軟硬件性能的飛速提升，以及社會(huì)各方面對(duì)快速高效的自動(dòng)身份驗(yàn)證的要求日益迫切，生物識(shí)別技術(shù)在科研領(lǐng)域取得了極大的重視和發(fā)展。其中，人臉識(shí)別技術(shù)的研究近些年受到普遍重視，它與指紋識(shí)別、視網(wǎng)膜識(shí)別等同屬于生物特征識(shí)別。在公安、安全驗(yàn)證系統(tǒng)、醫(yī)學(xué)、金融、視頻會(huì)議、交通量控制等方面有著巨大的應(yīng)用前景，因而成為當(dāng)前人工智能領(lǐng)域和模式識(shí)別的一個(gè)研究熱點(diǎn)。人臉識(shí)別的研究始于60 年代末，在90年代取得重大突破，而得到前所未有的重視。早期的人臉識(shí)別研究主要集中于兩大方向1，一是提取人臉幾何特征的方法, 包括人臉部件歸一化的

3、點(diǎn)間距離和比率以及人臉的一些特征點(diǎn)；二是模板匹配的方法, 主要是利用計(jì)算模板和圖像灰度的自相關(guān)性來(lái)實(shí)現(xiàn)識(shí)別功能。目前的研究也主要有兩個(gè)方向：其一是基于整體的研究方法，它考慮了模式的整體屬性，包括特征臉（Eigenface）方法、SVD分解的方法2、人臉等密度線分析匹配方法3、彈性圖匹配（Elastic Graph Matching）方法4、隱馬爾可夫模型（Hidden Markov Model）方法5以及神經(jīng)網(wǎng)絡(luò)的方法等；其二是基于特征分析的方法, 將人臉基準(zhǔn)點(diǎn)的相對(duì)比率和其它描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識(shí)別特征向量。這類基于整體臉識(shí)別方法的優(yōu)勢(shì)在于保留了更多的信息，而基于部

4、件的識(shí)別可以有效地提取指定特征，然而卻沒(méi)有表達(dá)識(shí)別部件的可靠模型?？偟脕?lái)說(shuō)，人臉檢測(cè)是一個(gè)整體識(shí)別與特征識(shí)別共同作用的結(jié)果，其中前者提供低層次特征，遠(yuǎn)距離進(jìn)行辨別時(shí)更重要，而后者提供高層次特征，在近距離的人臉識(shí)別中，特征部件的識(shí)別更重要。本文的結(jié)構(gòu)安排如下：第一部分主要進(jìn)行人臉識(shí)別的總體介紹，包括其應(yīng)用背景和研究現(xiàn)狀；第二部分為相關(guān)算法描述與分析，即對(duì)KL變換、主成分分析（Principle Component Analysis，PCA）和奇異值分解（Singular Value Decomposition，SVD）進(jìn)行詳細(xì)推導(dǎo)與分析；第三部分為算法設(shè)計(jì)，提出基于PCA和SVD相融合的分類算法

5、；第四部分為系統(tǒng)設(shè)計(jì)，針對(duì)于人臉認(rèn)證登錄這一應(yīng)用，基于Matlab GUIDE開發(fā)出實(shí)際系統(tǒng)；第五部分為實(shí)驗(yàn)結(jié)果，分為兩個(gè)部分，其一，對(duì)所提出的算法進(jìn)行性能驗(yàn)證，測(cè)試樣本取自于劍橋大學(xué)ORL人臉庫(kù)，其二，對(duì)所開發(fā)的系統(tǒng)進(jìn)行實(shí)際測(cè)試；最后得出本文結(jié)論，并提出幾種算法的優(yōu)化改進(jìn)策略。2. 相關(guān)算法描述與分析2.1 Karhunen-Loeve變換Karhunen-Loeve變換簡(jiǎn)稱為K-L變換，是模式識(shí)別中常用的一種特征提取方法。K-L變換是從K-L展開引出的，對(duì)于某一個(gè)樣本，可以在一組規(guī)范正交基上展開，即（2-1）式（2-1）同時(shí)左乘，得（2-2）由此，K-L變換思想可以表述為，將向量在一組規(guī)范

6、正交基上展開，得到新的向量（其中和的各分量均為在各自基上的線性組合系數(shù)）。其目的是使的各分量具有最小的相關(guān)性，從而達(dá)到降維的目的。如果只用有限項(xiàng)（）來(lái)逼近，即（2-3）則該估計(jì)的均方誤差為，（2-4）記，為的自相關(guān)矩陣（K-L變換的產(chǎn)生矩陣）。將均方誤差作為目標(biāo)函數(shù)，則問(wèn)題轉(zhuǎn)變?yōu)樽钚』繕?biāo)函數(shù)，（2-5）Lagrange方程為，（2-6）令，得（2-7）即為矩陣的特征值，為對(duì)應(yīng)的特征向量，此時(shí)，取得極值。將此條件代入目標(biāo)函數(shù)式（2-4），得，（2-8）因此，K-L變換可以總述為，以矩陣最大個(gè)特征值對(duì)應(yīng)的特征向量作為規(guī)范正交基，構(gòu)成新的特征空間，使在其上展開，展開系數(shù)組成了新的向量，則通過(guò)這樣的

7、變換，誤差最小。表示成矩陣形式，（2-9）K-L變換具有如下性質(zhì)：第一，自相關(guān)矩陣可以相似對(duì)角化，因此，有（2-10）通過(guò)K-L變換，消除了原有向量分量間的相關(guān)性，從而有可能去掉那些帶有較少信息或不含信息的冗余分量，以達(dá)到降維的目的；第二，K-L變換是信號(hào)的最佳的壓縮表示，也叫最優(yōu)線性變換，用維K-L變換特征代表原始信號(hào)，所帶來(lái)的誤差在所有維正交坐標(biāo)變換中最??；第三，用K-L坐標(biāo)系代表原始數(shù)據(jù)表示熵最小，樣本方差信息最大程度低集中在少數(shù)的維度上。2.2 主成分分析（PCA）PCA是基于K-L變換思想的特征提取方法，它的出發(fā)點(diǎn)是從一組特征中計(jì)算出一組按重要性從大到小排列的新特征，它們是原有特征的

8、線性組合，且相互之間是不相關(guān)的。PCA的目標(biāo)是使新特征的方差達(dá)到極大值，可用于線性分類，最大化類間離散度。最重要的應(yīng)用之一，便是人臉識(shí)別，該方法最早由Turk和Pentland提出，成為本征臉（eigenface）方法6。本征臉?lè)椒ň唧w可描述為，對(duì)于一幅個(gè)像素組成的人臉圖像，可以將其看作一個(gè)特征為維向量的樣本。設(shè)訓(xùn)練樣本集有類樣本，每類樣本的個(gè)數(shù)為，則所有樣本個(gè)數(shù)為，樣本集表示為。樣本集的平均臉向量表示為，（2-11）每個(gè)樣本減去平均臉，得到差值臉，（2-12）協(xié)方差矩陣（也稱總體散布矩陣）表示為，（2-13）其中，因?yàn)榫仃嚨木S度為，因此考慮另一個(gè)矩陣，它的維度為，通常M<N2。矩陣的特

9、征方程為，（2-14）兩邊同時(shí)左乘，得，（2-15）記，則式（2-15）可寫成（2-16）因此，維的矩陣和維矩陣具有相同的特征值，特征向量具有如下關(guān)系，（2-17）兩規(guī)范化特征向量的關(guān)系為，（2-18）式（2-18）可用下節(jié)介紹奇異值分解定理解釋。與矩陣一樣，矩陣最多具有個(gè)非零特征值。由于每個(gè)特征向量仍然是一個(gè)維的向量，即仍然是一個(gè)的圖像。這些特征向量的圖像仍然具有一些人臉的特點(diǎn)，因此被稱作“本征臉”。將特征值從大到小排列，選取前個(gè)特征值，滿足一定的貢獻(xiàn)率，即（2-19）則這個(gè)特征值在這些新的規(guī)范正交基上的投影構(gòu)成了對(duì)原圖像的降維表示，所在空間為特征臉空間。根據(jù)K-L變換的性質(zhì)，這種降維表示是

10、所有相同維數(shù)的線性表示中誤差最小的。特征臉空間可用矩陣表示，其列向量為規(guī)范正交基，即，（2-20）式（2-12）表示的差值臉在其上投影，投影系數(shù)可表示為，（2-21）而本征臉可通過(guò)下式重構(gòu)出原始圖像，（2-22）總得來(lái)說(shuō)，PCA算法通過(guò)利用規(guī)范正交基的線性組合描述、表達(dá)人臉和逼近人臉，因此可以進(jìn)行人臉的識(shí)別和重建。然而，PCA具有兩點(diǎn)不足：其一，將二維圖像一維向量化，丟失了圖像中像素的鄰域相關(guān)信息；其二，圖像中所有像素點(diǎn)的權(quán)重相同，沒(méi)有突出人臉信息，因此，本質(zhì)上來(lái)說(shuō)并不能稱作“本征臉”。2.3 奇異值分解（SVD）SVD是一種有效的代數(shù)特征提取方法，基于SVD的人臉識(shí)別方法將圖像看作一個(gè)矩陣，

11、對(duì)任何一個(gè)矩陣，都可以利用SVD分解為對(duì)角陣。SVD原理可表述為，對(duì)于任意矩陣，都存在兩個(gè)正交矩陣和，以及對(duì)角矩陣，使得，（2-23）其中，同時(shí)是矩陣和的特征值，和分別是矩陣和對(duì)應(yīng)于的特征向量，稱為奇異值（SV）。在識(shí)別人臉時(shí)，將奇異值構(gòu)成的向量作為特征向量，將訓(xùn)練樣本圖像得到特征向量記為，將待測(cè)圖像得到的特征向量記為，可以利用最近鄰法進(jìn)行分類。SVD將圖像看作一個(gè)矩陣進(jìn)行分解，是一種代數(shù)特征提取方法。因?yàn)槠淇紤]到圖像時(shí)空域的相關(guān)性，因此用它描述圖像特征具有穩(wěn)定性，且具有轉(zhuǎn)置、旋轉(zhuǎn)、平移以及鏡像不變形等優(yōu)點(diǎn)7。3. PCA和SVD相融合的算法設(shè)計(jì)融合的目的是獲得比單個(gè)分類器更高的分類精度，分類

12、器融合分為特征層上的融合和決策層上的融合8，本算法所涉及的是特征層上的融合，對(duì)一幅圖像提取主分量PCA特征和奇異值SV特征，融合這兩種特征來(lái)完成最后的分類。融合能提高分類性能的前提是，不同特征具有獨(dú)立性與信息互補(bǔ)性。由于PCA將圖像變換為特征臉空間中的一點(diǎn)，因此該方法對(duì)光線、角度和平移等變化比較敏感，并且由于將二維圖像一維向量化，丟失了像素鄰域相關(guān)信息，而SVD恰好可以彌補(bǔ)這些方面的不足，因此考慮將兩者進(jìn)行融合。本文采用加權(quán)平均的融合策略，PCA和SVD的權(quán)重相等。樣本特征融合階段的大致過(guò)程如下所述。首先，分別使用式（2-21）和式（2-23）提取待識(shí)別人臉的PCA特征和SVD特征；然后，使用

13、式（3-1）和式（3-2）計(jì)算待識(shí)別樣本特征與樣本集中各樣本特征的歐式距離和，其中表示類別，表示類別中樣本；（3-1）（3-2）接下來(lái)，求出融合后的距離，（3-3）利用最近鄰法完成分類，（3-4）則該待測(cè)樣本屬于第類。整個(gè)PCA與SVD相融合算法的執(zhí)行框圖如圖3-1所示。圖3-1 PCA與SVD相融合算法的執(zhí)行框圖4. 系統(tǒng)實(shí)現(xiàn)本文所實(shí)現(xiàn)的實(shí)現(xiàn)是人臉認(rèn)證登錄系統(tǒng)，基于Matlab GUIDE開發(fā)設(shè)計(jì)，從而模擬Android 4.0系統(tǒng)的人臉識(shí)別認(rèn)證功能。由于這種界面登錄系統(tǒng)的環(huán)境特定性，需要考慮的干擾因素并不多，因此對(duì)算法的要求并不高。與多類分類識(shí)別不同的是，該識(shí)別算法只需判斷待測(cè)樣本與訓(xùn)練樣

14、本是否足夠相近，即滿足一定的閾值，給出“屬于”和“不屬于”兩個(gè)結(jié)果。系統(tǒng)實(shí)現(xiàn)流程上可大致分為兩類，其一為訓(xùn)練階段，其二為識(shí)別階段。在訓(xùn)練階段中，系統(tǒng)進(jìn)行次采樣，樣本圖像規(guī)模為，構(gòu)成樣本集，首先進(jìn)行PCA和SVD投影，分別得到特征向量和，求出其均值和，（4-1）（4-2）然后，求出均值向量與所有特征向量的歐式距離，并作PCA與SVD融合，最后將其中最大距離作為判別閾值。（4-3）（4-4）（4-5）（4-6）在識(shí)別階段，系統(tǒng)獲得待測(cè)樣本，對(duì)其進(jìn)行PCA和SVD投影，分別得到特征向量和，接下來(lái)求出與訓(xùn)練樣本特征向量的最小融合距離，（4-7）若滿足，表示待測(cè)樣本與訓(xùn)練樣本足夠接近，識(shí)別成功，反之失敗

15、。圖4-1為系統(tǒng)界面，圖4-2為整個(gè)系統(tǒng)實(shí)現(xiàn)的流程圖。圖4-1人臉認(rèn)證登錄系統(tǒng)的界面圖4-2 人臉認(rèn)證登錄系統(tǒng)的流程圖5. 實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)采用劍橋大學(xué)ORL人臉庫(kù)，該人臉庫(kù)包含了40個(gè)人臉，每個(gè)人有10幅不同的圖像。圖像包含了一定的光照變化、表情變化（睜眼和閉眼，笑與不笑）、面部細(xì)節(jié)變化（戴眼鏡與不戴眼鏡）以及一定范圍內(nèi)的旋轉(zhuǎn)，包含比較齊全。這些圖像分辨率大小都是112×92像素的9。圖5-1是ORL人臉數(shù)據(jù)庫(kù)中某人的人臉圖像。圖5-1 ORL人臉數(shù)據(jù)庫(kù)中某人的人臉圖像測(cè)試階段，在每類中隨機(jī)抽取抽取個(gè)樣本作為訓(xùn)練樣本，剩下的個(gè)樣本則作為測(cè)試樣本，當(dāng)分別選作5和7時(shí)，測(cè)試結(jié)果如表5-1和

16、5-2所示。表5-1 樣本數(shù)的測(cè)試識(shí)別率表5-1 樣本數(shù)的測(cè)試識(shí)別率從任意一表都可以看出，單獨(dú)SVD的識(shí)別率低于單獨(dú)PCA，但PCA+SVD的識(shí)別率卻高于任意一種，這說(shuō)明了該算法的有效性。并且對(duì)比兩表可以看出，當(dāng)樣本數(shù)量增加，則識(shí)別率明顯提高。同時(shí)，對(duì)于人臉認(rèn)證登錄系統(tǒng)，也作了相關(guān)測(cè)試，如圖5-2至5-5所示。通過(guò)實(shí)際測(cè)試，驗(yàn)證了該P(yáng)CA與SVD相融合的識(shí)別算法的有效性。圖5-2 人臉認(rèn)證登錄系統(tǒng)測(cè)試一圖5-3 人臉認(rèn)證登錄系統(tǒng)測(cè)試二圖5-4 人臉認(rèn)證登錄系統(tǒng)測(cè)試三圖 5-5人臉認(rèn)證登錄系統(tǒng)測(cè)試四6. 結(jié)論由于PCA和SVD具有信息的互補(bǔ)性，因此兩者相融合的算法可以提高識(shí)別性能，本文使用ORL

17、人臉庫(kù)的數(shù)據(jù)進(jìn)行測(cè)試，驗(yàn)證了該算法的優(yōu)越性。最后設(shè)計(jì)并實(shí)現(xiàn)了人臉認(rèn)證登錄系統(tǒng)，并進(jìn)行了實(shí)際的識(shí)別測(cè)試，該系統(tǒng)可以在以下三個(gè)方面進(jìn)行完善。一、圖像預(yù)處理。根據(jù)PCA算法分析所述，圖像中每個(gè)點(diǎn)的權(quán)重是一樣的，因此為了增大人臉信息的權(quán)重，可采用相關(guān)人臉檢測(cè)算法，對(duì)所拍的圖像進(jìn)行剪切，提取出人臉部分，去除背景；二、使用顏色特征?？梢杂萌ǖ赖腞GB圖像作為樣本，而非灰度圖像，因?yàn)轭^發(fā)或面部等顏色特征有助于人臉識(shí)別；三、整體與部件特征相結(jié)合。如本文介紹部分所述，整體臉與部件亦具有信息互補(bǔ)性，而PCA和SVD同屬基于整體臉的識(shí)別，加入某些部件特征會(huì)進(jìn)一步提高識(shí)別率。參考文獻(xiàn)1 蘇光大, 張翠平. 人臉識(shí)

18、別技術(shù)綜述J. 中國(guó)圖形圖像學(xué)報(bào), 2000, 5(11): 885-894.2 Ziquan Hong. Algebraic feature extraction of image for recognitionJ. Pattern Recognition, 1991, 24(3): 211-219.3 Nakamura O, Mathur S, Minami T. Identification of human faces based on isodensity mapsJ. Pattern Recognition, 1991, 24(3): 263-272.4 LadesM, Vorbuggen J, Buhmann Jetal. Distortion invariant object recognition in the dynamic link architectureJ. IEEE Trans.on Computers, 1991, 42(3): 300-311.5 Samaria F, Young S. HMM-based architecture for face identificationJ. Image and Vision Computing, 1994, 12(8).6 Turk M,

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 工作計(jì)劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

模式識(shí)別論文——PCA與SVD融合人臉識(shí)別算法設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

模式識(shí)別論文——PCA與SVD融合人臉識(shí)別算法設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔