用空間特征和結(jié)構(gòu)特征提取身份證號(hào)_第1頁(yè)
用空間特征和結(jié)構(gòu)特征提取身份證號(hào)_第2頁(yè)
用空間特征和結(jié)構(gòu)特征提取身份證號(hào)_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

用空間特征和結(jié)構(gòu)特征提取身份證號(hào)

1身份證自動(dòng)識(shí)別錄入作為居民身份的象征,身份是生活中不可或缺的證書。出于保障公民合法權(quán)益和社會(huì)治安的考慮,越來(lái)越多的行業(yè)都開(kāi)始要求進(jìn)行實(shí)名制和身份證登記管理,如公安、海關(guān)、銀行、通信、網(wǎng)吧及酒店旅館、洗浴業(yè)等,因此利用計(jì)算機(jī)進(jìn)行自動(dòng)識(shí)別錄入尤為必要。身份證自動(dòng)識(shí)別代替手工錄入可以大大提高工作效率,因而具有廣闊的應(yīng)用前景。本文以第二代居民身份證為研究對(duì)象,從身份證號(hào)碼圖像中提取號(hào)碼數(shù)字0~9的空間分布特征和結(jié)構(gòu)特征,采用相似系數(shù)最大和結(jié)構(gòu)特征一致準(zhǔn)則,應(yīng)用Matlab軟件編程實(shí)現(xiàn)了身份證號(hào)碼的快速識(shí)別。2數(shù)據(jù)特征預(yù)處理身份證號(hào)碼識(shí)別技術(shù)的基本原理如圖1所示。第二代居民身份證的大小是固定的,寬度為8.6cm,高度為5.4cm,因此掃描身份證得到的圖像可以縮放到同一個(gè)大小,本文采用的圖像寬度為366個(gè)像素,高度為233像素,這樣在從身份證圖像中提取號(hào)碼數(shù)字圖像時(shí)可以快速定位。由于第二代居民身份證的號(hào)碼字體比較特殊,所以需要從身份證圖像中獲取號(hào)碼數(shù)字0~9的圖像作為樣本,用于提取特征。樣本數(shù)字圖像如圖2所示。該樣本數(shù)字圖像為真彩色圖像,需要對(duì)其進(jìn)行預(yù)處理。首先將真彩色數(shù)字圖像轉(zhuǎn)化為二值圖像:設(shè)P為真彩色數(shù)字圖像的任意點(diǎn),P的顏色三分量值分別為r、g、b,若0.299*r+0.587*g+0.114*b<0.5,則二值圖像對(duì)應(yīng)的點(diǎn)為白色,否則為黑色。然后對(duì)二值圖像進(jìn)行數(shù)字分割,將圖像中的10個(gè)數(shù)字完整、單獨(dú)地分割出來(lái)。最后對(duì)分割后的每個(gè)數(shù)字圖像進(jìn)行規(guī)范化處理:若單個(gè)數(shù)字圖像的整行或整列全為0,則刪除該行或該列。預(yù)處理后的各樣本數(shù)字圖像如圖3所示。注:為達(dá)到較好的視覺(jué)效果,在每個(gè)樣本數(shù)字圖像周圍増加了一個(gè)黑色矩形方框。完成預(yù)處理后,接下來(lái)就是提取每個(gè)數(shù)字的特征。本文考慮每個(gè)數(shù)字的空間分布情況和形狀結(jié)構(gòu)特點(diǎn),作為分類識(shí)別的特征。2.1空間分布情況首先將預(yù)處理后的樣本數(shù)字圖像看成是有質(zhì)量的圖形,其中白色點(diǎn)的質(zhì)量為1,黑色點(diǎn)的質(zhì)量為0。該圖形的質(zhì)心坐標(biāo)總體上能反映對(duì)應(yīng)數(shù)字的空間分布情況,用x再將樣本數(shù)字圖像等分成上、下兩個(gè)部分,用x最后將樣本數(shù)字圖像等分成左、右兩個(gè)部分,用x各區(qū)域的質(zhì)心橫坐標(biāo)為該區(qū)域內(nèi)的白色點(diǎn)的橫坐標(biāo)之和除以該區(qū)域內(nèi)的白色點(diǎn)的個(gè)數(shù);各區(qū)域的質(zhì)心縱坐標(biāo)為該區(qū)域內(nèi)的白色點(diǎn)的縱坐標(biāo)之和除以該區(qū)域內(nèi)的白色點(diǎn)的個(gè)數(shù)。這10個(gè)質(zhì)心坐標(biāo)組成的向量:就是該樣本數(shù)字圖像對(duì)應(yīng)的數(shù)字的空間分布特征。逐個(gè)計(jì)算各數(shù)字的空間分布特征向量,并將它們存放于數(shù)組中。2.2數(shù)的阿姆斯特丹數(shù)采用數(shù)字的空間分布特征可以將數(shù)字“1”、“2”、“4”、“5”、“7”正確識(shí)別出來(lái),但數(shù)字“0”、“3”、“6”、“8”、“9”有時(shí)卻不能正確識(shí)別。針對(duì)這幾個(gè)會(huì)出現(xiàn)誤判情形的數(shù)字進(jìn)行分析,不難發(fā)現(xiàn)它們的形狀結(jié)構(gòu)特征明顯,數(shù)字“0”和“6”及“9”含有一個(gè)洞;數(shù)字“3”不包含洞;數(shù)字“8”包含兩個(gè)洞。由于身份證號(hào)碼字體的特殊性,數(shù)字“1”、“2”、“4”、“5”、“7”均不含有洞。Matlab中的bweuler函數(shù)返回二值圖像的歐拉數(shù)。歐拉數(shù)是對(duì)圖像的拓?fù)涠攘?它是指圖像中對(duì)象的總個(gè)數(shù)與這些對(duì)象中洞的個(gè)數(shù)的差,可以使用4連通或8連通鄰域。各數(shù)字的歐拉數(shù)參見(jiàn)表1。本文采用8連通鄰域,將各樣本數(shù)字圖像的歐拉數(shù)作為它的結(jié)構(gòu)特征,并存放于數(shù)組中E(10)。2.3號(hào)碼數(shù)字特征樣本數(shù)字圖像的空間分布特征和結(jié)構(gòu)特征分別存于數(shù)組digital(10,10)和E(10)中。對(duì)于待識(shí)別身份證號(hào)碼(共18個(gè))的目標(biāo),按照前面類似的處理過(guò)程,提取各號(hào)碼數(shù)字的空間分布特征和結(jié)構(gòu)特征,并存放于數(shù)組obj(18,10)和objE(18)中。令x=(x對(duì)于待識(shí)別的目標(biāo)數(shù)字號(hào)碼,計(jì)算該數(shù)字號(hào)碼的空間分布特征與10個(gè)樣本數(shù)字的空間分布特征的相似系數(shù),其分類識(shí)別準(zhǔn)則是:在結(jié)構(gòu)特征一致的條件下,相似系數(shù)最大的對(duì)應(yīng)的樣本數(shù)字就是該目標(biāo)號(hào)碼的識(shí)別結(jié)果。3身份證號(hào)碼的實(shí)現(xiàn)采用Matlab6.5(releaseR13)作為開(kāi)發(fā)工具,在WindowsXP平臺(tái)下實(shí)現(xiàn)了身份證號(hào)碼的快速識(shí)別。圖4是程序使用的身份證圖像,程序輸出結(jié)果為對(duì)多個(gè)身份證圖像進(jìn)行測(cè)試,均得到正確的結(jié)果。身份證號(hào)碼識(shí)別的程序代碼如下:四、多個(gè)身份證圖像的分類識(shí)別本文對(duì)第二代居民身份證的號(hào)碼數(shù)字進(jìn)行分析,提出了基于空

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論