計(jì)算機(jī)視覺基礎(chǔ)大作業(yè)人臉識別_第1頁
計(jì)算機(jī)視覺基礎(chǔ)大作業(yè)人臉識別_第2頁
計(jì)算機(jī)視覺基礎(chǔ)大作業(yè)人臉識別_第3頁
計(jì)算機(jī)視覺基礎(chǔ)大作業(yè)人臉識別_第4頁
計(jì)算機(jī)視覺基礎(chǔ)大作業(yè)人臉識別_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、伊力Z.計(jì)算機(jī)視覺根底期末大作業(yè)題目:基于matlab的人臉識別系統(tǒng)設(shè)計(jì)物聯(lián)網(wǎng)工程學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)學(xué)號學(xué)生姓名任課教師二0一六年六月目錄摘要31 .概述41.1 人臉識別技術(shù)41.2 人臉識別根本方法41.2.1 幾何特征的人臉識別41.2.2 基于特征臉PCA的人臉識別41.2.3 神經(jīng)網(wǎng)絡(luò)的人臉識別51.3 人臉識別新技術(shù)52 .人臉識別功能的實(shí)現(xiàn)52.1 PCA方法根本原理52.2 基于主成分分析法的人臉識別62.2.1 讀入人臉庫62.2.2 計(jì)算K-L變換的生成矩陣62.2.3 求解特征值和特征向量72.2.4 樣本投影與識別82.3 基于PCA算法人臉識別的matlab實(shí)現(xiàn)

2、82.3.1 讀取人臉庫82.3.2 利用生成矩陣求特征值和特征向量92.3.3 選取閾值提取練習(xí)樣本特征92.3.4 選取測試樣本進(jìn)行識別92.4 人臉識別代碼102.5 實(shí)驗(yàn)結(jié)果及分析113 .實(shí)驗(yàn)結(jié)果及實(shí)現(xiàn)功能123.1 文件局部123.2 圖像預(yù)處理局部123.3 練習(xí)局部133.4 識別局部134 .總結(jié)134.1 人臉識別的困難性134.1.1 相似性144.1.2 易變性144.2 實(shí)驗(yàn)心得14參考文獻(xiàn):14摘要人臉識別系統(tǒng)以人臉識別技術(shù)為核心,是一項(xiàng)新興的生物識別技術(shù),是當(dāng)今國際科技領(lǐng)域攻關(guān)的高精尖技術(shù).這次設(shè)計(jì)主要是完成了基于主成分分析PCA方法的人臉識別,PCA方法的根本原

3、理是:利用離散K-L變換提取人臉的主要成分,構(gòu)成特征臉空間,識別時(shí)把測試樣本投影到該空間,構(gòu)成一組投影系數(shù),通過與特征臉的距離比擬,距離最小的特征臉對應(yīng)的即是識別結(jié)果.基于PCA的人臉識別其實(shí)一種統(tǒng)計(jì)性的模板比配方法,原理簡單,易于實(shí)現(xiàn),但也有缺乏,它的識別率會隨著照顧,人臉角度,練習(xí)樣本集的數(shù)量而變換,但仍不失為一種比擬好的方法.關(guān)鍵詞:人臉識別、PCA特征提取1 .概述1.1 人臉識別技術(shù)人臉識別技術(shù)是采用某種技術(shù)和手段對人的身份進(jìn)行標(biāo)識,從而依據(jù)該標(biāo)識對人進(jìn)行身份識別,以到達(dá)監(jiān)督、治理和識別目的的一種技術(shù).近年來由于在公安罪犯識別、平安驗(yàn)證、平安驗(yàn)證系統(tǒng)、信用卡驗(yàn)證等方面的巨大應(yīng)用前景而

4、越來越成為當(dāng)前模式識別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn).人臉識別根本上可分為兩個(gè)方面:一是給定一幅待識別人臉圖像,判別它是否是某人,即通常所說的身份驗(yàn)證,這是個(gè)“一對一的兩分類問題;另一個(gè)是給定一幅待識別人臉圖像,判斷它是誰,即通常所說的身份識別,這是一個(gè)一對多的問題基于人臉圖像整體特征的人臉識別方法由于不需要提取人臉圖像中器官的具體信息,而且充分利用到人臉圖像本身具有的灰度信息,因此可獲得更高的識別性能.基于人臉圖像整體特征的人臉識別方法主要有特征臉法,最正確鑒別矢量集法,貝葉斯法,基于傅立葉變換特征法,彈性圖匹配法,相關(guān)方法,線性子空間法,可變形模型法和基于人工神經(jīng)網(wǎng)絡(luò)的方法等等.其中彈性圖匹

5、配法和傅里葉不變特征法側(cè)重于表述人臉圖像;最正確鑒別矢量集法,貝葉斯法,基于人工神經(jīng)網(wǎng)絡(luò)的方法側(cè)重于分類;特征臉法和線性子空間法等側(cè)重于人臉圖像的重構(gòu).1.2 人臉識別根本方法1.2.1 幾何特征的人臉識別幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系如相互之間的距離.這些算法識別速度快,需要的內(nèi)存小,但識別率較低.1.2.2 基于特征臉PCA的人臉識別特征臉方法是基于KL變換的人臉識別方法,KL變換是圖像壓縮的一種最優(yōu)正交變換.高維的圖像空間經(jīng)過KL變換后得到一組新的正交基,保存其中重要的正交基,由這些基可以張成低維線性空間.如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些

6、投影用作識別的特征矢量,這就是特征臉方法的根本思想.這些方法需要較多的練習(xí)樣本,而且完全是基于圖像灰度的統(tǒng)計(jì)特性的.目前有一些改良型的特征臉方法,也是本文所要講述的的方法.1.2.3 神經(jīng)網(wǎng)絡(luò)的人臉識別神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等.這類方法同樣需要較多的樣本進(jìn)行練習(xí),而在許多應(yīng)用中,樣本數(shù)量是很有限的.1.3 人臉識別新技術(shù)傳統(tǒng)的人臉識別技術(shù)主要是基于可見光圖像的人臉識別,這也是人們最熟悉的識別方式,已有30多年的研發(fā)歷史.但這種方式有著難以克服的缺陷,尤其在環(huán)境光照發(fā)生變化時(shí),識別效果會急劇下降,無法滿足實(shí)際系統(tǒng)的需要.解決光照問題的方案

7、有三維圖像人臉識別,和熱成像人臉識別.但目前這兩種技術(shù)還遠(yuǎn)不成熟,識別效果不盡人意.最近迅速開展起來的一種解決方案是基于主動近紅外圖像的多光源人臉識別技術(shù).它可以克服光線變化的影響,已經(jīng)取得了卓越的識別性能,在精度、穩(wěn)定性和速度方面的整體系統(tǒng)性能超過三維圖像人臉識別.這項(xiàng)技術(shù)在近兩三年開展迅速,使人臉識別技術(shù)逐漸走向?qū)嵱没?2 .人臉識別功能的實(shí)現(xiàn)2.1 PCA方法根本原理設(shè)人臉圖像I(x,y)為二維mxn灰度圖像,用N=m><n維列向量X表示.人臉圖像練習(xí)集為Xi|i=1|,M,其中M為練習(xí)集中圖像總數(shù).根據(jù)練習(xí)集構(gòu)造NMN總體散布矩M陣S:St=E(Xi-2)(Xi-2)Ti1

8、1M其中R為所有練習(xí)樣本的平均向量:1=ZXiMid選取一組標(biāo)準(zhǔn)正交且使得準(zhǔn)那么函數(shù)式(3.3)到達(dá)極值的向量011116d作為投影軸,其物理意義是使投影后所得特征的總體散布量(類間散布量與類內(nèi)散布量之和)最大.Jt-St=1其等價(jià)于:Jt二'St,上式即為矩陣的Rayleig嫡,由Rayleigh嫡7的極值性質(zhì),最優(yōu)投影軸1Hlec1d可取為St的d個(gè)最大的特征值所對應(yīng)的標(biāo)準(zhǔn)正交的特征向量.對于mxn人臉圖像,總體散布矩陣St的大小為NxN,對它求解特征值和特征向量是很困難的,由奇異值定理,一種取而代之的方法是解MxM個(gè)較小的矩陣.首先計(jì)算MxM矩陣L的特征向量vi(l=1"

9、;,M):L=AtA、A=XiR,|,Xm-叩矩陣St的特征向量:U=打,|1|,與=XiN,|,Xm因Vi川,Vm=AVH(l=1用,M)由差值圖像XiN(l=1|,M與)Vl(l=1川,M)線性組合得到取L的前d個(gè)最大特征值的特征向量計(jì)算特征臉,d由門限值8:確定:JUdMJ=mind工A/£%Ij41.2 基于主成分分析法的人臉識別完整的PCA人臉識別的應(yīng)用包括四個(gè)步驟:人臉圖像的預(yù)處理;讀入人臉庫,練習(xí)形成特征臉空間;把練習(xí)樣本和測試樣本投影到特征臉空間中;選擇一個(gè)距離函數(shù)根據(jù)某種規(guī)那么進(jìn)行識別.下面看一下詳細(xì)的過程:1.2.1 讀入人臉庫這次設(shè)計(jì)中選用英國劍橋大學(xué)人臉庫即O

10、RL人臉庫,此人臉數(shù)據(jù)庫有40人,每人有10幅圖像.這些圖像具有以下特點(diǎn):有些圖像拍攝于不同的時(shí)期;人的臉部表情和臉部細(xì)節(jié)有著不同程度的變化,比方,笑或不笑,眼睛或睜或閉,戴或不戴眼鏡;人臉姿態(tài)也有相當(dāng)程度的變化,深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達(dá)20.;人臉的尺度也有多達(dá)10%的變化;圖像的分辨率是112x92.在ORL人臉庫中選出每個(gè)人的前5幅圖像作為練習(xí)圖像,構(gòu)成一個(gè)200幅圖像的練習(xí)集,剩下的200幅圖像構(gòu)成測試集.每幅圖像按列相連構(gòu)成10304維列向量,讀入的練習(xí)樣本集就構(gòu)成10304X200的矩陣.1.2.2 計(jì)算K-L變換的生成矩陣200以練習(xí)樣本集的總體散布矩陣為生成矩陣St,即:St(X

11、i-)(Xi-)Ti1其中Xi為第i幅練習(xí)樣本的圖像向量,N為練習(xí)樣本集的均值向量,練習(xí)樣本的總數(shù)為200.由于矩陣維數(shù)過高,計(jì)算量太大,可以為了求的生成矩陣的特征值和正交歸一化特征向量,引進(jìn)奇異值分解定理SVD定理.圖2.1平均臉1.2.3 求解特征值和特征向量SVD定理的定義:假設(shè)矩陣AwRm河,那么存在正交矩陣U=坊卅2,川,與卜爐刈,V=vi,V2,|",VnwRmM,使得UTAV=diag9i,Q2,lll,Up)=W,p=min(m,n),即A=UWVt,那么稱A為奇異值分解.其中,.1之.2至III至仃p至0,5i=1,23|,p為A的奇異值,是AAT或ATA的特征值的

12、平方根,即5=".奇異值向量具有良好的穩(wěn)定性,所以它對圖像噪音、圖像光照條件引起的灰度變化具有不敏感的特性.計(jì)算特征值和特征向量的根本步驟是:1創(chuàng)立協(xié)方差矩陣;2計(jì)算協(xié)方差矩陣的特征值和特征向量;3按特征值由小到大順序排列特征值和特征向量.這些特征向量對應(yīng)的圖像很像人臉,所以被稱為“特征臉.有了這樣一個(gè)由“特征臉組成的降維子空間,任何一幅圖像都可以向其投影并獲得一組坐標(biāo)系數(shù),這組坐標(biāo)系數(shù)說明了該圖像在“特征臉子空間的位置,從而可以作為人臉識別的依據(jù).選擇了其中30個(gè)特征臉如下列圖所示圖2.2特征臉1.2.4 樣本投影與識別得到特征臉子空間以后,就要把練習(xí)樣本和測試樣本都投影到特征臉子

13、空間,每幅圖像得到一組坐標(biāo)系數(shù),對應(yīng)子空間中的一個(gè)點(diǎn).任何一幅圖像都可以有這組特征臉線性組合,加權(quán)系數(shù)就是K-L變換的系數(shù).主成分取100的重建圖主成分取150的重建圖完全重建圖1.3 基于PCA算法人臉識別的matlab實(shí)現(xiàn)用matlab語言仿真PCA算法的人臉識別,分為以下幾個(gè)步驟:1.3.1 讀取人臉庫allsamples=;%allsample用于存儲讀取的人臉圖像矩陣fori=1:40forj=1:5a=imread(strcat('e:ORLs',num2str(i),'',num2str(j),'.pgm');b=a(1:112*9

14、2);b=double(b);allsamples=allsamples;b;endEnd1.3.2 利用生成矩陣求特征值和特征向量samplemean=mean(allsamples);fori=1:200xmean(i,:)=allsamples(i,:)-samplemean;endsigma=xmean*xmean'vd=eig(sigma);1.3.3 選取閾值提取練習(xí)樣本特征上面得到的200個(gè)特征向量,雖然已經(jīng)比擬小了,但計(jì)算量還是比擬大.其實(shí)不必要保留所有的特征向量,較大特征值對應(yīng)的特征向量已經(jīng)能夠提供足夠多的用于識別的特征.一般是通過計(jì)算閾值進(jìn)一步降低維數(shù),這種方法的具

15、體做法是把特征向量和特征值從大到小排列,選取特征值占總特征值之和的比值大于一定值所對應(yīng)的特征向量.閾值8一般是取0.9.pM計(jì)算公式是8=£入/£%.但發(fā)現(xiàn)在這里8取0.91更好,識別率更高一點(diǎn).通過程序運(yùn)j17行可以發(fā)現(xiàn),閾值選擇為0.91時(shí)特征值個(gè)數(shù)減少為75個(gè),就是說很多特征值是很小的,數(shù)值小的特征值對應(yīng)的特征向量對識別只能提供很少的信息.所以通過閾值選擇,計(jì)算量減少了很多.d1=diag(d);dsort=flipud(d1);vsort=fliplr(v);dsum=sum(dsort);dsum_extract=0;p=0;while(dsum_extract/

16、dsum<0.91)p=p+1;dsum_extract=sum(dsort(1:p);endbase=xmean'*vsort(:,1:p)*diag(dsort(1:p).A(-1/2);allcoor=allsamples*base;1.3.4 選取測試樣本進(jìn)行識別測試樣本識別的過程就是把測試圖像投影到特征臉子空間,得到一組特征系數(shù),然后按照歐式距離的最小近鄰法與練習(xí)樣本集投影得到的系數(shù)匹配,找到距離最小的樣本就是識別的結(jié)果.但為了克服單個(gè)樣本的偶然性,這里選擇最近的3個(gè)樣本,然后把待識別人臉判別為這3個(gè)樣本中同類樣本最多的那個(gè)類別.a=imread(strcat('

17、;e:ORLs',num2str(i),'',num2str(j),'.pgm');b=a(1:10304);b=double(b);tcoor=b*base;fork=1:200mdist(k)=norm(tcoor-allcoor(k,:);end;dist,index2=sort(mdist);class1=floor(index2-1)/5)+1;class2=floor(index2(2)-1)/5)+1;class3=floor(index2-1)/5)+1;ifclass1=class2&&class2=class3clas

18、s=class1;elseifclass1=class2class=class1;elseifclass2=class3class=class2;end;1.4 人臉識別代碼clearallclcallsamples=;%thearrayallsamplesisusedtorestoreallpicturesfori=1:40forj=1:7a=imread(strcat('e:ORLs',num2str(i),'',num2str(j),'.pgm');b=a(1:112*92);b=double(b);allsamples=allsample

19、s;b;endendsamplemean=mean(allsamples);%averagethepicturesfori=1:280xmean(i,:)=allsamples(i,:)-samplemean;endsigma=xmean*xmean'%obtaintheM*Marrayvd=eig(sigma);%vproducesadiagonalmatrixDofeigenvaluesanda%fullmatrixVwhosecolumnsarethecorrespondingeigenvectorsso%thatX*V=V*D.d1=diag(d);%obtainthediag

20、onalofthesigmadsort=flipud(d1);vsort=fliplr(v);dsum=sum(dsort);dsum_extract=0;P=0;while(dsum_extract/dsum<0.90)P=P+1;dsum_extract=sum(dsort(1:p);endbase=xmean'*vsort(:,1:p)*diag(dsort(1:p).A(-1/2);allcoor=allsamples*base;accu=0;fori=1:40forj=8:10a=imread(strcat('e:ORLs',num2str(i),

21、9;',num2str(j),'.pgm');b=a(1:10304);b=double(b);tcoor=b*base;fork=1:280mdist(k)=norm(tcoor-allcoor(k,:);end;dist,index2=sort(mdist);class1=floor(index2(1)-1)/7)+1;class2=floor(index2(2)-1)/7)+1;class3=floor(index2(3)-1)/7)+1;ifclass1=class2&&class2=class3class=class1;elseifclass1

22、=class2class=class1;elseifclass2=class3class=class2;end;ifclass=iaccu=accu+1;end;end;end;accuracy=accu/1201.5 實(shí)驗(yàn)結(jié)果及分析對于ORL人臉庫,選用每人前5幅圖像作為練習(xí)樣本,后5幅圖像作為測試樣本,訓(xùn)練樣本和測試樣本總數(shù)均為200,閾值選為0.91.程序運(yùn)行可得識別率為0.885.選取的特征空間的維數(shù)是88.PCA算法是基于人臉圖像整體特征的人臉識別方法,影響識別率的因素主要有很多,如人臉庫的差異,算法的差異,參數(shù)的選擇,都會產(chǎn)生很大的影響.但現(xiàn)在主要考慮兩點(diǎn)因素:(1)閾值的選擇,即

23、特征空間的維數(shù);(2)練習(xí)樣本的數(shù)量.下面就看一下選擇不同的參數(shù)時(shí)候他們各自對識別率的影響如表2.1所示.表2.1閾值及樣本數(shù)量對識別率的影響每人7幅每人6幅每人5幅每人4幅每人3幅每人2幅每人1幅0.200.35830.36880.32000.35000.36070.34690.32220.400.65000.63120.61500.56670.57140.53750.42500.600.86670.83130.76500.71670.70360.66560.60830.800.93330.89380.86000.80830.76430.73440.64440.850.94170.88750

24、.86000.83330.78570.73750.66390.880.94170.90630.87000.84170.78930.75000.66390.900.94170.90630.88000.84580.78930.75000.67780.920.93330.89380.88000.83330.79640.76250.68060.940.93330.90000.87500.82920.79640.75310.69720.960.93330.89380.88000.82500.78570.74690.6944從上表可以看出當(dāng)閾值一定時(shí),練習(xí)樣本數(shù)的增加會使識別率提升,大概每人每增加一幅圖像

25、,識別率提升4個(gè)百分點(diǎn).在練習(xí)樣本數(shù)一定時(shí),閾值的改變也相應(yīng)的影響識別率,閾值太小的時(shí)候識別率顯然很低,大概閾值到0.8以上時(shí),識別率變化不大,這就說明,降低特征矩陣維數(shù)不但可以減少計(jì)算量,而且根本上不會影響識別率太多.3 .實(shí)驗(yàn)結(jié)果及實(shí)現(xiàn)功能MATLAB提供了專門的GUI設(shè)計(jì)工具一一圖形用戶界面開發(fā)環(huán)境GUIDE,為了便于操作及演示的需要,利用GUIDE設(shè)計(jì)了可視化界面.3.1 文件局部“文件菜單中有“翻開、“保存、“退出二級子菜單,分別用于翻開,保存處理后的圖像和退出界面操作.文件圖像處理人臉識別翻開退出3.2 圖像預(yù)處理局部“圖像處理菜單主要是完成一些根本的圖像處理功能主要有兩個(gè)作用:一個(gè)是消除或減少噪聲,改善圖像質(zhì)量;另一個(gè)是模糊圖像,使圖像看起來柔和自然.3.3 練習(xí)局部3.4識別局部4 .總結(jié)4.1 人臉識別的困難性人臉識別人臉識別被認(rèn)為是生物特征識別領(lǐng)域甚至人工智能領(lǐng)域最困難的研究課題之一.的困難主要是人臉作為生物特征的特點(diǎn)所帶來的.4.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論