基于 FPGA 的模式識(shí)別與人臉識(shí)別_第1頁(yè)
基于 FPGA 的模式識(shí)別與人臉識(shí)別_第2頁(yè)
基于 FPGA 的模式識(shí)別與人臉識(shí)別_第3頁(yè)
基于 FPGA 的模式識(shí)別與人臉識(shí)別_第4頁(yè)
基于 FPGA 的模式識(shí)別與人臉識(shí)別_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于 FPGA 的圖像識(shí)別與語(yǔ)音播報(bào)系統(tǒng)第一部分設(shè)計(jì)概述 /Design Introduction本設(shè)計(jì)實(shí)現(xiàn)了圖像識(shí)別與智能語(yǔ)音播報(bào)的功能。能實(shí)時(shí)的識(shí)別出當(dāng)前圖像,并進(jìn)行智能的播報(bào)。本設(shè)計(jì)主要涉及到圖像采集,圖像處理與識(shí)別,語(yǔ)音技術(shù)等一系列當(dāng)前熱點(diǎn)技術(shù),并將它們有機(jī)結(jié)合,構(gòu)建出了一個(gè)實(shí)用性很強(qiáng)的系統(tǒng)。主要可以應(yīng)用于機(jī)場(chǎng),安檢,監(jiān)控等需要圖像處理技術(shù)的領(lǐng)域中。同時(shí)利用智能語(yǔ)音播報(bào)系統(tǒng)將圖像處理結(jié)果進(jìn)行實(shí)時(shí)的播報(bào),極大的增強(qiáng)了人機(jī)交互界面的友好性。另外,本設(shè)計(jì)根據(jù)圖像處理以及語(yǔ)音模塊的控制等特點(diǎn),采用了FPGA 與單片機(jī)相組合的數(shù)字系統(tǒng)。即利用了FPGA 的高速處理能力(主要處理圖像信號(hào)),同時(shí)又

2、采用了單片機(jī)的強(qiáng)大控制驅(qū)動(dòng)能力(主要控制智能語(yǔ)音播報(bào)系統(tǒng)),同時(shí)又借助于高效的數(shù)據(jù)傳輸協(xié)議,搭建出了一個(gè)集高速的數(shù)據(jù)處理能力與強(qiáng)大的控制能力于一身的多處理器系統(tǒng)。該架構(gòu)在現(xiàn)實(shí)的復(fù)雜數(shù)字系統(tǒng)中也有較多的應(yīng)用。具有一定的實(shí)用性。第二部分系統(tǒng)組成及功能說(shuō)明 /System Construction & Function Description整個(gè)系統(tǒng)由攝像頭,前端FPGA,核心FPGA,語(yǔ)音MPU,VGA 顯示器構(gòu)成。系統(tǒng)通過(guò)攝像頭讀取圖像信息,由前端FPGA 進(jìn)行圖像初步降噪二值化處理,僅保留有效信息后由前端FPGA 存儲(chǔ),由后端FPGA 進(jìn)行有效圖像區(qū)域的提取、壓縮、特征對(duì)比過(guò)程,完成圖

3、像識(shí)別的功能,并利用語(yǔ)音MCU 播報(bào)被識(shí)別的圖像1、可以手動(dòng)設(shè)置圖像的“亮度”,以適應(yīng)不同光照條件下的圖像采集。2、可以切換自動(dòng)/手動(dòng)模式。自動(dòng)模式下系統(tǒng)將連續(xù)采集攝像頭數(shù)據(jù)。手動(dòng)模式下,單擊按鍵進(jìn)行一次圖像識(shí)別。3.語(yǔ)音模塊的詳細(xì)框圖如下:在本系統(tǒng)中,當(dāng)前端圖像識(shí)別完成后,按下播報(bào)按鈕后,語(yǔ)音模塊能將當(dāng)前識(shí)別出的圖像播報(bào)出來(lái)。交互說(shuō)明:1、 前端FPGA1、4 鍵控制攝像頭二值化灰度閾值,2 鍵使閾值恢復(fù)為128。A 鍵切換自動(dòng)和手動(dòng)模式,自動(dòng)模式下系統(tǒng)不斷采集新圖像進(jìn)行識(shí)別,手動(dòng)模式下采集暫停,需要按下F 鍵才采集一幀。2、核心FPGAA. 數(shù)碼管顯示當(dāng)前被識(shí)別的圖像序號(hào)及成功識(shí)別次數(shù)。B

4、. LED 顯示前端FPGA 與后端通信情況。3.語(yǔ)音播報(bào)系統(tǒng)主要采用單片機(jī)來(lái)驅(qū)動(dòng)語(yǔ)音模塊。在前端圖像識(shí)別完成后,當(dāng)按下語(yǔ)音播報(bào)按鈕后,單品機(jī)將要播報(bào)的內(nèi)容傳給語(yǔ)音模塊,進(jìn)行播報(bào)。2、 4、VGA 圖像VGA 顯示各區(qū)域意義解釋工作流程:3、 能夠提取出有效圖像區(qū)域時(shí)的時(shí)序流程第三部分完成情況及性能參數(shù)/Final Design & Performance Parameters1、能進(jìn)行圖像識(shí)別,識(shí)別09 十個(gè)數(shù)字,少量字母,部分形狀如方形、圓形、X 形。2、以VGA 顯示攝像頭采集的數(shù)據(jù),能標(biāo)出有效圖像的區(qū)域;后端數(shù)碼管實(shí)時(shí)顯示識(shí)別結(jié)果。識(shí)別快速準(zhǔn)確。3、系統(tǒng)可識(shí)別圖像種類(lèi)非常容易添

5、加和更改,具有良好的編程可拓展性。4、可以手動(dòng)設(shè)置圖像的“亮度”,能適應(yīng)不同光照條件下的圖像采集。5、可以切換自動(dòng)/手動(dòng)模式,手動(dòng)模式下功耗低。6、可以語(yǔ)音播報(bào)被識(shí)別的圖像,聲音洪亮清晰??勺R(shí)別內(nèi)容舉例:第四部分總結(jié) /Conclusions經(jīng)過(guò)幾個(gè)星期的努力,我們小組終于將作品設(shè)計(jì)完成。經(jīng)過(guò)實(shí)際測(cè)試后,該系統(tǒng)基本完成了當(dāng)初的設(shè)計(jì)任務(wù),即當(dāng)給出不同的圖像時(shí),前端攝像頭能采集圖像,自動(dòng)識(shí)別,并進(jìn)行語(yǔ)音播報(bào)。本系統(tǒng)中圖像識(shí)別速度快,準(zhǔn)確率較高,語(yǔ)音播報(bào)模塊聲音基本自然,沒(méi)有明顯播報(bào)的錯(cuò)誤。當(dāng)然,此次設(shè)計(jì)還有一些不足之處。比如準(zhǔn)確率還沒(méi)有達(dá)到99%以上,對(duì)于一些奇怪的圖像無(wú)法準(zhǔn)確的檢測(cè)出來(lái),語(yǔ)音播報(bào)

6、模塊的聲音在自然度上還需進(jìn)一步的提升等問(wèn)題??梢赃M(jìn)一步發(fā)揮提高的部分1.優(yōu)化識(shí)別流程,讓識(shí)別更快速,VGA 顯示的抖動(dòng)更小。2.設(shè)置臨時(shí)模板,可以不再次編程而通過(guò)攝像頭輸入一個(gè)模板。3.語(yǔ)音模塊聲音更加的自然流暢,能使用不同的聲音比如男聲,女聲以及方言等播報(bào)。組員設(shè)計(jì)體會(huì)不同的處理器有不同的特點(diǎn),比如本系統(tǒng)中使用的FPGA 與單片機(jī)就是兩個(gè)典型的處理器。FPGA 具有強(qiáng)大的數(shù)據(jù)吞吐與處理能力,但是它在控制方面不太擅長(zhǎng),單片機(jī)有強(qiáng)大的控制能力,但是在數(shù)據(jù)處理上又顯得力不從心。因此,如果能將其二者合二為一,則構(gòu)建出來(lái)的系統(tǒng)就具有很強(qiáng)大的性能力。但是,如何有效的進(jìn)行兩類(lèi)處理器之間的通信則是一個(gè)非常關(guān)

7、鍵的部分。一個(gè)高效的數(shù)據(jù)傳輸協(xié)議不緊能使兩個(gè)處理器之間數(shù)據(jù)傳輸誤差減小,還能保持整個(gè)系統(tǒng)合理快速的運(yùn)行。圖像處理技術(shù)非常復(fù)雜,這個(gè)系統(tǒng)中每一個(gè)步驟去除多余圖像信息、圖像降噪、提取目標(biāo)區(qū)域、壓縮目標(biāo)區(qū)域、圖像識(shí)別都選擇了相對(duì)簡(jiǎn)單的算法進(jìn)行。其實(shí)這每一個(gè)步驟都值得深入研究。參加此次競(jìng)賽對(duì)自己的查閱資料能力、設(shè)計(jì)能力、編程能力、動(dòng)手實(shí)踐能力、團(tuán)隊(duì)協(xié)作能力4、 以及知識(shí)面都有極大的提高??吹阶罱K實(shí)現(xiàn)的成果得到的是對(duì)自己,對(duì)團(tuán)隊(duì)的認(rèn)可。基于人臉識(shí)別技術(shù)的智能安保系統(tǒng)第一部分設(shè)計(jì)概述 /Design Introduction隨著信息技術(shù)及計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,信息安全顯示出前所未有的重要性。身份鑒定是保證信息

8、安全的必要部分,在很多領(lǐng)域都需要身份鑒定來(lái)達(dá)到保護(hù)信息安全的作用。傳統(tǒng)的身份認(rèn)證技術(shù)主要是依靠證件、密碼和口令的認(rèn)證方式,在現(xiàn)代科技快速發(fā)展的今天,這些都很容易丟失、破解或偽造,嚴(yán)重威脅到個(gè)人或公共財(cái)產(chǎn)信息安全。近年來(lái),以人臉、虹膜、視網(wǎng)膜、指紋、聲音、基因等人的生物特征作為識(shí)別手段的生物特征識(shí)別技術(shù)漸漸發(fā)揮出了很好的作用,這類(lèi)識(shí)別屬于模式識(shí)別范疇,相比傳統(tǒng)的識(shí)別方式更安全、穩(wěn)定和方便。其中,人臉識(shí)別因具有友好、方便、直接等優(yōu)點(diǎn)成為一個(gè)熱門(mén)研究領(lǐng)域。本系統(tǒng)就決定采用人臉識(shí)別+密碼輸入的雙保險(xiǎn)方式來(lái)構(gòu)建安保系統(tǒng)。第二部分系統(tǒng)組成及功能說(shuō)明 /System Construction & F

9、unction Description1 硬件設(shè)計(jì)1.1 ov7620 攝像頭本系統(tǒng)是圖像采集與處理系統(tǒng),所以攝像頭是非常關(guān)鍵的一個(gè)部分。文采用了Omnivision公司推出的CMOS圖像傳感器OV7620。OV7620結(jié)合CMOS技術(shù),采用數(shù)字接口,低功率(<120 mW),單電源供電(5 V),為實(shí)現(xiàn)更高質(zhì)量的視頻圖像應(yīng)用提供了一種簡(jiǎn)單的解決方法。0V7620的功能特點(diǎn)包括:?jiǎn)涡酒?3”鏡頭,最大664×492像素分辨;IzC控制,標(biāo)準(zhǔn)SCCB接口;開(kāi)窗功能,局部圖像輸出;自動(dòng)曝光控制、自動(dòng)白平衡、自動(dòng)增益控制、自動(dòng)亮度控制;圖像質(zhì)量控制,包括顏色飽和度、銳度、伽馬校正等功

10、能。圖一:ov7620攝像頭本系統(tǒng)選取OV7620作為采集模塊的原因主要是OV7620圖像傳感器是CMOS彩色黑白圖像傳感器,支持連續(xù)和隔行兩種掃描方式,VGA與QVGA兩種圖像格式,幀速率可達(dá)30 fps,數(shù)據(jù)格式包括YUV、YCrCb、RGB三種,其中有我們作為看重的YUV模式,其中的Y代表著灰度。OV7620是八位灰度輸出最黑的時(shí)候輸出0,最白的時(shí)候輸出255。這種特性對(duì)于圖像的處理是非常有利的,因?yàn)閷?duì)于灰度的處理方法是很多的。OV7620 接口控制器分為SCCB 總線控制器和OV7620采集控制器2 部分。SCCB 總線控制器用于實(shí)現(xiàn)符合SCCB 總線協(xié)議的接口控制; OV7620 采

11、集控制器根據(jù)OV7620 的視頻同步信號(hào)實(shí)現(xiàn)圖像數(shù)據(jù)采集。總線控制器的作用就是更改攝像頭內(nèi)部寄存器的數(shù)值,通過(guò)這樣的配置來(lái)設(shè)置攝像頭的工作模式。更改數(shù)值是通過(guò)SCCB協(xié)議來(lái)實(shí)現(xiàn)的,SCCB 是類(lèi)似I2C 的串行總線協(xié)議, 定義了串行數(shù)據(jù)線SDA 和串行時(shí)鐘線SCL, 數(shù)據(jù)傳輸通過(guò)SDA、SCL2 條線上電平的狀態(tài)以及二者之間的相互配合來(lái)實(shí)現(xiàn)。其傳輸時(shí)序如圖2 所示。由圖2 可以看出, SCCB 采用簡(jiǎn)單的三相寫(xiě)數(shù)據(jù)的方式, 即在寫(xiě)寄存器的過(guò)程中先發(fā)送OV7620 的ID地址, 然后發(fā)送寫(xiě)數(shù)據(jù)的目地寄存器地址, 最后發(fā)送要寫(xiě)入的數(shù)據(jù)。其中具體具體過(guò)程就是SCCB_SCL為高電平時(shí),SCCBSDA

12、出現(xiàn)一個(gè)下降沿,此時(shí)傳輸啟動(dòng)。在啟動(dòng)條件滿(mǎn)足后,SCCB SDA為穩(wěn)定數(shù)據(jù)狀態(tài),SCCBSCL產(chǎn)生一個(gè)正脈沖,將傳送一位數(shù)據(jù)。當(dāng)SCCBSCL為高電平時(shí),SCCBSDA出現(xiàn)一個(gè)上升沿,傳輸停止。通過(guò)SCCB協(xié)議配置好攝像頭之后,就可以進(jìn)行采集控制了。OV7620多種信號(hào)輸出。對(duì)于我們的系_統(tǒng),我們只關(guān)心其中場(chǎng)中斷信號(hào)VSYN、行中斷信號(hào)HREF、像素中斷信號(hào)PCLK。他們的時(shí)序關(guān)系如圖三所示:圖三:三個(gè)中斷信號(hào)的時(shí)序關(guān)系其中,VSYN 的周期是16.64ms,高電平時(shí)間為換場(chǎng)時(shí)間,約80us;低電平時(shí)間內(nèi)像素輸出。我們?cè)诓杉疺SYN脈沖時(shí),既可以采集上升沿,也可以采集下降沿,采集下降沿更準(zhǔn)確些

13、,這也是一場(chǎng)的開(kāi)始。從VSYN的周期可以算出,1s/16.64ms=60幀,OV7620的幀率是60幀/s。HREF的周期63.6us,高電平時(shí)間為像素輸出時(shí)間,約47us;低電平時(shí)間為換行時(shí)間,因此采集HREF一定要采集其上升沿,下降沿后的數(shù)據(jù)是無(wú)效的。從HREF的周期可以算出,16.64ms/63.6us261,除去期間的間隙時(shí)間,可以算出每場(chǎng)圖像有240行。PCLK的周期是73ns,高電平輸出像素,低電平像素?zé)o效。PCLK是一直輸出的,因此一定要在觸發(fā)VSYN并且觸發(fā)HREF以后,再去捕捉PCLK才能捕捉到像素?cái)?shù)據(jù)。從PCLK的周期可以算出,47us/73ns640,可以算出每行圖像中有

14、640個(gè)像素點(diǎn)。在之后的軟件設(shè)計(jì)中主要就是通過(guò)對(duì)于這三個(gè)信號(hào)的使用來(lái)完成系統(tǒng)的功能。1.2 VGA 顯示系統(tǒng)采集了圖像,在一定的情況下是需要查看圖像內(nèi)容的,同時(shí)也方便對(duì)系統(tǒng)進(jìn)行控制。本系統(tǒng)才有VGA顯示屏進(jìn)行顯示。VGA協(xié)議主要由5個(gè)輸入信號(hào)組成,亦是HSYNCSignal, VSYNC Signal, RGB Signal。說(shuō)簡(jiǎn)單一點(diǎn),HSYNC Signal 是“列同步信號(hào)”,VSYNC Signal是“行同步信號(hào)”,RGB Signal是“紅色-綠色-藍(lán)色”顏色信號(hào)。VGA的掃描是固定的。一幀的屏幕是由“m行掃描”和“n列填充”組成。掃描的時(shí)序是通過(guò)行同步信號(hào)與列同步信號(hào)來(lái)控制的,同時(shí)掃

15、描的頻率與數(shù)據(jù)輸出格式也是固定的。掃描時(shí)序圖見(jiàn)圖四,掃描頻率標(biāo)準(zhǔn)見(jiàn)圖五。 圖四:VGA時(shí)序圖圖五:VGA掃描頻率標(biāo)準(zhǔn)本系統(tǒng)為了配合OV7620的模式特點(diǎn),采用了640*480,每秒60幀的標(biāo)準(zhǔn)。于超凡;040110362 圖像處理原理與方式(軟件設(shè)計(jì))本系統(tǒng)的軟件開(kāi)發(fā)采用模塊化的設(shè)計(jì),一共分為四個(gè)模塊:采集模塊、存儲(chǔ)模塊、處理模塊、顯示模塊。下面對(duì)這些模塊進(jìn)行一一介紹。2.1 采集模塊通過(guò)對(duì)OV7620寄存器的配置,攝像頭的工作模式被設(shè)定為:輸出像素分辨率:640×480;VGA 模式、隔行掃描、16 位YUV(取其8 位Y 輸出)。采集的控制主要就是依托場(chǎng)同步信號(hào)(vclk)、行同

16、步信號(hào)(hclk)以及像素同步信號(hào)(pclk)。所以模塊首先要檢測(cè)出vclk的下降沿,此時(shí)說(shuō)明新的一幀的數(shù)據(jù)發(fā)送開(kāi)始了,使能采集模塊。然后開(kāi)始檢測(cè)hclk的上升沿,檢測(cè)到上升沿后說(shuō)明一行的采集開(kāi)始了,并將行計(jì)數(shù)加1。然后開(kāi)始檢測(cè)pclk的下降沿,每來(lái)一個(gè)下降沿就說(shuō)明一個(gè)像素的信號(hào)發(fā)送的過(guò)來(lái),然后將此數(shù)據(jù)存入數(shù)組中,把像素計(jì)數(shù)加一。此時(shí)要檢測(cè)一下行計(jì)數(shù)是不是已經(jīng)到了640,如果是的話(huà)就要將行計(jì)數(shù)加一,像素計(jì)數(shù)歸零。此時(shí)也要檢測(cè)行計(jì)數(shù),若行計(jì)數(shù)到了480, 圖六:數(shù)據(jù)采集流程圖說(shuō)明一幀的數(shù)據(jù)采集結(jié)束。流程圖見(jiàn)圖六。由于圖像的數(shù)據(jù)量是非常大的,所以不可能也不必要一直采集,所以本系統(tǒng)也加上了定時(shí)模塊,

17、也就是說(shuō)每隔若干幀才使能一次采集模塊,這樣可以減小存儲(chǔ)模塊的壓力。2.2 存儲(chǔ)模塊數(shù)據(jù)采集中是把每一行的數(shù)據(jù)暫存在一個(gè)數(shù)組里,但是如果480 行都存入數(shù)組里,數(shù)據(jù)量會(huì)使一般的FPGA 開(kāi)發(fā)板難以承受,所以必須將數(shù)據(jù)暫存在ram 中。在 xilinx 開(kāi)發(fā)板配套的軟件ISE 中有著豐富的軟核資源,其中就有很多塊存儲(chǔ)器。根據(jù)系統(tǒng)的需要,最終選取了其中單口RAM 的IP CORE。圖七就是單口ram 的接線圖。其中DINA 是數(shù)據(jù)輸入端,ADDRA 是地址輸入端,WE 是寫(xiě)使能(本系統(tǒng)采用寫(xiě)優(yōu)先模式),CLKA 是RAM 的時(shí)鐘輸入端。本系統(tǒng)的存儲(chǔ)是這樣設(shè)計(jì)的:沒(méi)到一行的數(shù)據(jù)采集結(jié)束后,就會(huì)使WE

18、信號(hào)變高,然后這一行的數(shù)據(jù)就存了進(jìn)去,也就是640 個(gè)像素點(diǎn)的數(shù)據(jù)并行輸 圖七:?jiǎn)慰赗AM入了 RAM 中,然后地址加一,這里的地址也就是行計(jì)數(shù)。在其余的時(shí)間里WE 都是低電平,這個(gè)時(shí)候RAM 就是讀模式,可以進(jìn)行讀操作,為后面的數(shù)據(jù)處理提供數(shù)據(jù)。2.3 顯示模塊顯示模塊主要分為兩個(gè)部分,一個(gè)是同步模塊,一個(gè)是VGA 控制模塊。顯示模塊的整體結(jié)構(gòu)圖如圖八所示。首先是同步模塊。簡(jiǎn)單的說(shuō)該模塊就是通過(guò)對(duì)時(shí)鐘的計(jì)數(shù)來(lái)控制輸向VGA 顯示屏的信號(hào):行同步與列同步。之前提到過(guò)VGA 是有頻率標(biāo)準(zhǔn)的,而且并不是任何時(shí)間輸入的數(shù)據(jù)都是有效數(shù)據(jù),在一個(gè)周期內(nèi)有空閑的時(shí)間段,只有中間的一部分是有效顯示段。所以同

19、步模塊就根據(jù)這些行業(yè)標(biāo)準(zhǔn)來(lái)進(jìn)行定時(shí),輸出行同步、列同步信號(hào)。同時(shí),于行、列的計(jì)數(shù)就是VGA 圖像上相應(yīng)的位置坐標(biāo),這與攝像頭采集到的一幅圖像的坐標(biāo)信息是相對(duì)應(yīng)的,所以很自然地這個(gè)模塊也會(huì)輸出這種坐標(biāo),其中行計(jì)數(shù)可以作為讀取RAM 里數(shù)據(jù)時(shí)的地址。然后是 VGA 控制模塊。這個(gè)模塊的任務(wù)就是輸出RGB 數(shù)據(jù)給VGA 顯示屏。這里RGB 的數(shù)據(jù)是存在RAM 里面的,之前通過(guò)同步模塊輸出的地址信號(hào)對(duì)RAM 進(jìn)行了讀取,這里就相應(yīng)的將RAM 里的數(shù)據(jù)進(jìn)行輸出。2.4 處理模塊處理模塊是本系統(tǒng)的核心。人臉自動(dòng)識(shí)別系統(tǒng)主要包括人臉檢測(cè)和定位、人臉特征的提取和識(shí)別兩個(gè)主要部份。人臉檢測(cè)和定位,即從輸入圖像中

20、找到人臉及人臉的位置,并將人臉從背景中分割出來(lái),然后才是對(duì)歸一化的人臉圖像進(jìn)行特征提取和識(shí)別。對(duì)人臉的基本特征如眼睛、鼻子和嘴巴的準(zhǔn)確定位在很多人臉識(shí)別方法中也是必不可少的步驟,尤其是眼睛的準(zhǔn)確定位,這是因?yàn)閮裳坶g距受光照或表情變化的影響最小,所以常被用于幾何特征或臉像尺寸的歸一化標(biāo)準(zhǔn)。本系統(tǒng)主要依靠人臉整體粗略識(shí)別與人眼識(shí)別兩種方式。首先介紹人眼識(shí)別。由于眼睛虹膜、瞳孔部位的灰度值明顯比其鄰近區(qū)域(眼部周?chē)つw、眼白)灰度值要低,因此能夠從適當(dāng)光照條件下拍照的圖像中分割眼睛虹膜、瞳孔部位的灰度值總是存在的,并且不是唯一的,而是有一定的小范圍。然而尋找這樣的最佳分割閾值并不是一件容易的事,眼睛

21、虹膜、瞳孔部位及其鄰近區(qū)域的灰度值會(huì)因人而異,并隨光照條件、帶眼鏡時(shí)鏡片的反光而變化,加上復(fù)雜背景的變化,使得最佳分割閾值的估計(jì)十分困難,但通過(guò)圖像灰度直方圖分析和統(tǒng)計(jì)的方法,對(duì)最佳分割閡值可能所在的灰度區(qū)間進(jìn)行粗估計(jì)還是可以做到的。若選擇固定的背景和光照條件,由統(tǒng)計(jì)的方法可估計(jì)出更小的最佳分割閾值可能所在的區(qū)間。本系統(tǒng)就采用固定的背景,而且是只拍攝頭部部分(作為安保系統(tǒng)是合理的安排),這樣就大大提升了檢測(cè)的水平。具體做法是:首先用某一分割閾值T 將包含人臉的灰度圖像二值化,對(duì)二值化圖像進(jìn)“Majority”形態(tài)運(yùn)算以去除二值化圖像中小的黑斑點(diǎn),再對(duì)二值化圖像中黑色塊進(jìn)行標(biāo)記、計(jì)算每塊面積(像

22、素?cái)?shù))、確定每塊的外按矩形位置及寬高。人眼位置的判定是根據(jù)眼睛在二值化人臉圖像中的幾何位置確定的,主要有以下幾條準(zhǔn)則:1)雙眼中心距應(yīng)在某個(gè)范圍內(nèi):設(shè)圖像尺寸為160x120,考慮到人臉在圖像中大小的變化,雙眼中心距變化大約在20-50個(gè)像素距離范圍內(nèi);2)雙眼下方一定距離內(nèi)不能有其它黑塊:雙眼下方一定距離內(nèi)沒(méi)有其它器官,因此在二值化圖像中不能有其它黑塊,這一特點(diǎn)也是區(qū)分眉毛與眼睛的重要判據(jù);3)雙眼中心位置上下相差不超過(guò)一定距離:由于人臉在圖像中可能向兩側(cè)傾斜,雙眼中心位置常常不在水平線上。作為判據(jù),允許人臉在一定程度上向兩側(cè)傾斜,雙眼中心位置在垂直方向相差不超過(guò)一定距離(如1 5個(gè)像素距離

23、);4)眼睛黑塊所包含的像素?cái)?shù)應(yīng)在某個(gè)范圍內(nèi):二值化圖像中眼塊所包含的像素?cái)?shù)應(yīng)在某個(gè)范圍內(nèi)(如5-50個(gè)像素),太大的黑塊不太可能是眼塊;5)眼睛黑塊的外接矩形應(yīng)是一寬大于高的矩形或接近于正方形:由于眼睛的結(jié)構(gòu)特點(diǎn),二值化圖像中眼塊的外接矩形常常是一寬大于高的矩形或接近于正方形,眼塊的幾何中心位于圓形的眼睛虹膜(含瞳孔)位置,高遠(yuǎn)大于寬的外接矩形對(duì)應(yīng)的黑塊不可能是眼塊;6)與圖像四邊接壤或非常接近的黑塊不是眼塊:由于拍攝人臉圖像時(shí),要求人臉在照片中應(yīng)完整,且較靠近圖像中心,因此在二值化圖像中與圖像四邊接壤或非常接近的黑塊不是眼塊。在這些原理的基礎(chǔ)上,結(jié)合實(shí)驗(yàn)得到的閥值,使用RAM里的數(shù)據(jù)就可以

24、進(jìn)行人臉識(shí)別了。系統(tǒng)主要是依靠人眼間距來(lái)進(jìn)行人臉識(shí)別。在大多數(shù)情況下其實(shí)是不需要進(jìn)行麻煩的人眼識(shí)別的,粗略的識(shí)別就可以完成預(yù)定功能,具體來(lái)說(shuō)主要基于對(duì)圖像每一個(gè)像素點(diǎn)的灰度值比較。對(duì)于判斷比對(duì)人臉來(lái)說(shuō),我們這里是比較簡(jiǎn)單的一種方式,因?yàn)槲覀兪窃O(shè)計(jì)密碼鎖,所以要求解鎖者在指定位置進(jìn)行人臉的測(cè)試,這也就是說(shuō)圖像中除了人臉的部分,其余的背景是固定的,所以這就為我們進(jìn)行簡(jiǎn)單的人臉識(shí)別提供了基礎(chǔ):我們只需要先預(yù)存一幅人臉圖像,然后與被測(cè)試者的人臉圖像想比對(duì),然后把誤差率與先前設(shè)定好的閥值相比對(duì),然后就可以加以判斷了。事實(shí)證明,這種方法可以完成多數(shù)情況下的識(shí)別,可以作為第一級(jí)識(shí)別,而人臉識(shí)別作為第二級(jí)識(shí)別,這樣既準(zhǔn)確又高效。3 系統(tǒng)結(jié)構(gòu)總圖第三部分完成情況及性能參數(shù)/Final Design & Performance Parameters

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論