人臉識別與數(shù)字圖像處理_第1頁
人臉識別與數(shù)字圖像處理_第2頁
人臉識別與數(shù)字圖像處理_第3頁
人臉識別與數(shù)字圖像處理_第4頁
人臉識別與數(shù)字圖像處理_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

人臉識別與數(shù)字圖像處理

劉小芳控制工程137700597人臉識別與數(shù)字圖像處理簡介:人臉識別是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。一、人臉識別內(nèi)容1、人臉檢測2、人臉跟蹤3、人臉對比二、人臉識別過程一般分三步:(1)首先建立人臉的面像檔案。即用攝像機(jī)采集單位人員的人臉的面像文件或取他們的照片形成面像文件,并將這些面像文件生成面紋(Faceprint)編碼貯存起來。(2)獲取當(dāng)前的人體面像。即用攝像機(jī)捕捉的當(dāng)前出入人員的面像,或取照片輸入,并將當(dāng)前的面像文件生成面紋編碼。(3)用當(dāng)前的面紋編碼與檔案庫存的比對。即將當(dāng)前的面像的面紋編碼與檔案庫存中的面紋編碼進(jìn)行檢索比對。上述的“面紋編碼”方式是根據(jù)人臉臉部的本質(zhì)特征和開頭來工作的。這種面紋編碼可以抵抗光線、皮膚色調(diào)、面部毛發(fā)、發(fā)型、眼鏡、表情和姿態(tài)的變化,具有強(qiáng)大的可靠性,從而使它可以從百萬人中精確地辯認(rèn)出某個人。人臉的識別過程,利用普通的圖像處理設(shè)備就能自動、連續(xù)、實(shí)時地完成[1]。三、人臉識別方法基于特征臉(PCA)的人臉識別方法:特征臉方法是基于KL變換的人臉識別方法,KL變換是圖像壓縮的一種最優(yōu)正交變換。高維的圖像空間經(jīng)過KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識別的特征矢量,這就是特征臉方法的基本思想。這些方法需要較多的訓(xùn)練樣本,而且完全是基于圖像灰度的統(tǒng)計特性的?;赑CA的人臉識別研究,要用matlab進(jìn)行實(shí)驗(yàn)部分,對圖像進(jìn)行簡單灰度處理,剪切出臉部部分,選擇合適算法進(jìn)行檢測。在電腦預(yù)先準(zhǔn)備好的80個人臉庫中運(yùn)用matlab程序?qū)崿F(xiàn)圖像與處理并檢測識別人臉。從電腦導(dǎo)入圖像從攝像頭拍照圖像大小歸一化,彩色圖轉(zhuǎn)換成灰度圖

圖像灰度值歸一化

人臉檢測訓(xùn)練圖像人臉識別人臉圖像采集模塊圖像預(yù)處理模塊

人臉信息庫歐式距離判斷輸出基本信息結(jié)束否識別模塊圖像的格式轉(zhuǎn)換和壓縮

圖像采集設(shè)備采集的圖像通常以bmp或jpg格式存入計算機(jī)。以bmp格式文件為例,bmp文件通常分為四部分:文件頭、信息頭、調(diào)色板、數(shù)據(jù)部分。一幅24位的真彩圖像的每個像素由三個字節(jié)表示,這樣,儲存一幅6403480的圖像就需要占用640348033=921,600字節(jié),無論對于存儲容量和處理時間都是不太理想的,因此,需要對圖像進(jìn)行壓縮。一般采用的方法是將彩色圖像轉(zhuǎn)換為灰度圖像,公式為:Y=R30.299+G30.587+B30.114,其中Y被稱為灰度值。這樣,彩色圖像的每個像素通過索引使用統(tǒng)一的調(diào)色板,節(jié)省了大量的存儲空間和處理時間。

在計算機(jī)中,圖像被分割成圖1-1所示的像素(Pixel),各像素的灰度值用整數(shù)表示。一幅M×N個像素的數(shù)字圖像,其像素灰度值可以用M行、N列的矩陣G表示:(1-1)Matlab實(shí)現(xiàn)closeall;clc;formatlongpgmw=168;pgmh=192;C=38;percentage=5;param.lambda=0.05;param.mode=1;wrong=0;

n=717;

tic;

B_struct=load('B_smallL2norm.mat');

TestClassNumber=load('testnumber.mat');

TestSamplePath=load('testsample.mat');

TrainClassNumber=load('trainnumber.mat');toc;

fprintf('載入訓(xùn)練數(shù)據(jù)時間%d秒\n',toc);

B=B_struct.B;

scale=3;

scalew=pgmw/scale;%scalew=56

scaleh=pgmh/scale;%scaleh=64

m=scalew*scaleh;%m=56*64=3584

testnumber=TestClassNumber.classtest;%1*38[12,12,12,12,12,12,12,12,12,12,11,10,11,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12;]

trainnumber=TrainClassNumber.class;%1*38[19,17,19,19,19,19,19,19,19,19,19,19,19,19,18,18,18,19,19,19,19,19,19,19,19,19,19,19,19,19,19,19,19,19,19,19,19,19;]

testsamplepgm=TestSamplePath.testpgm;%38*12存著圖像文件路徑測試

%ifchoice==3

occlutionpath='baboon.pgm';

ocpath=char(occlutionpath);

ocpgm=imread(ocpath(1,:));

tmpscale=(pgmw*pgmh*percentage/100/56)^(0.5);%tmpscale=(168*192*10/100/56)^0.5=7.589466384404110

r1=floor(tmpscale*8);%r1=60高度

c1=floor(tmpscale*7);%c1=53寬度

ps=imresize(ocpgm,[r1,c1]);

forpositionwmax=1:pgmw%pgmw=168

if(positionwmax+c1-1)>=pgmw%positionwmax=116

break;

end

end

forpositionhmax=1:pgmh%pgmh=192

if(positionhmax+r1-1)>=pgmh%positionhmax=133

break;

end

end

%end

%fork=1:C%C=38

%forj=1:testnumber(k);

pgmmatrix=imread(testsamplepgm{7,5});%讀入第k類的第j個測試圖

figure;

imshow(pgmmatrix);

%ifchoice==3

positionw=randi(positionwmax);%在[1,116]隨機(jī)產(chǎn)生一個整數(shù)寬度assume2

positionh=randi(positionhmax);%在[1,133]隨機(jī)產(chǎn)生一個整數(shù)高度10

pgmmatrix(positionh:(positionh+r1-1),positionw:(positionw+c1-1))=ps;%增加遮擋照片

%end

pgm_small=imresize(pgmmatrix,[scaleh,scalew]);figure;

imshow(pgm_small);

v_Curr=reshape(pgm_small,m,1);%轉(zhuǎn)換城56*64行*1列

Y1(:,1)=double(v_Curr(:,1))/norm(double(v_Curr(:,1)));%56*64行*1列

v_Curr=reshape(v_Curr,scaleh,scalew);%轉(zhuǎn)換城56*64行

%tic;

alpha=mexLasso(Y1,B,param);%B是3584*4301alpha是4301*1Y1是3584*14301-3584=717

%toc;

alpha_vec0=full(alpha);

alpha_vec=alpha_vec0(1:717);%獲取x0的值717*1

e_hat=alpha_vec0(718:4301);%獲取噪聲e0值3584*1

Y=Y1-e_hat;delta=zeros(n,C);%產(chǎn)生717*38零矩陣

delta(1:sum(trainnumber(1)),1)=alpha_vec(1:sum(trainnumber(1)),:);

fori=2:C

delta(sum(trainnumber(1:i-1))+1:sum(trainnumber(1:i)),i)=alpha_vec(sum(trainnumber(1:i-1))+1:sum(trainnumber(1:i)),:);

end

A=B(:,1:n);

fori=1:C

r(:,i)=Y-A*delta(:,i);%計算38個圖像的殘差

class(i)=norm(r(:,i));

end

delta_p=abs(delta);

L1_nor=sum(delta_p);

[maxi,i]=max(L1_nor);

SCI=(C*maxi/sum(abs(alpha_vec))-1)/(C-1);

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論