版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 數(shù)字識(shí)別系統(tǒng)1.緒論研究背景1.1.1索書號(hào)的簡(jiǎn)介索書號(hào)是圖書館賦予每一種館藏圖書的號(hào)碼,這種號(hào)碼具有一定結(jié)構(gòu)并帶有特定的意義。在館藏系中,每種書的索書號(hào)是唯一的,可準(zhǔn)確地確定館藏圖書在書架上的排列位置,它是讀者查找圖書必要的代碼信息。索書號(hào)通常是根據(jù)中國圖書資料分類法編排的【1】一一簡(jiǎn)稱中圖法中圖法采拉丁字母和阿拉伯?dāng)?shù)字相結(jié)合的混合標(biāo)記符號(hào)。根據(jù)圖書的學(xué)科主題,以拉丁字母標(biāo)記并順序展列出22個(gè)基本大類,其中沒有L、M和Y開頭的一一參考附錄1中圖法簡(jiǎn)表。由于“T工業(yè)技術(shù)”的大類范圍廣泛、內(nèi)容繁多,故又在該類基礎(chǔ)上采用雙位拉丁字母標(biāo)記出16個(gè)二級(jí)類目,如TK、TL、TM和TN等。字母之后再用阿
2、拉伯?dāng)?shù)字對(duì)大類進(jìn)行細(xì)分。如B表示哲學(xué)、宗教一大類;B020則表示宗教理論。有的圖書館如清華大學(xué)還在圖書分類號(hào)碼后添加按照?qǐng)D書作者姓名所編排的著者號(hào)碼,或者是按照?qǐng)D書進(jìn)館時(shí)間的先后所取用的順序號(hào)碼。不同索書號(hào)確定排列先后順序的步驟是,先比較分類號(hào)碼:如分類號(hào)碼相同再比較著者號(hào)碼或順序號(hào)碼。最后按照字母表和數(shù)字大小的順序排列。1.1.2書庫中圖書查找存在的問題隨著電子計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,現(xiàn)代圖書館都已經(jīng)廣泛建立電子數(shù)據(jù)庫圖書管理系統(tǒng),方便用戶查找、閱覽書籍。讀者借圖書的流程如圖2所示,一般利用書目查詢系統(tǒng),根據(jù)圖書的書名,出版社,作者以及書的內(nèi)容等在電子數(shù)據(jù)庫中檢索自己需要的圖書,記錄圖書相關(guān)
3、信息。最后,根據(jù)圖書的索書號(hào),快速方便地在書庫中找到相應(yīng)的圖書。但是,經(jīng)常會(huì)遇到下列問題:電子數(shù)據(jù)庫系統(tǒng)顯示圖書狀態(tài)為“歸還”,利用檢索到號(hào),卻無法在書庫找到此書。出現(xiàn)這種情況主要有兩個(gè)原因:(1)圖書錯(cuò)位放置,即圖書在書庫中擺放的位置與索書號(hào)不一致。(2)圖書已經(jīng)丟失,即雖然電子數(shù)據(jù)庫中顯示圖書狀態(tài)為“歸還”,但實(shí)質(zhì)圖書已經(jīng)丟失,并不在書庫中。隨著圖書館藏書數(shù)目的不斷增加,每天借閱的人數(shù)增多,而且有的圖書館發(fā)展成擁有幾個(gè)分館,上述問題越來越嚴(yán)重。這一方面嚴(yán)重降低了圖書館的資源的利用率;另一方面,浪費(fèi)了讀者的時(shí)間,造成了很大麻煩。目前,圖書館主要通過定期的人工檢查發(fā)現(xiàn)書庫中錯(cuò)位和丟失的圖書。但
4、是,由丁館藏圖書多達(dá)上萬,甚至幾十萬,而且每天又都有大量圖書的借出和還入,人工檢查工作量很大,單調(diào)、重復(fù)的工作容易使工作員疲勞,檢查速度比較慢,無法滿足實(shí)際的需要。因此,迫切希望開發(fā)索書號(hào)自動(dòng)識(shí)別系統(tǒng),實(shí)現(xiàn)對(duì)書庫中圖書放置位置的自動(dòng)檢查,并通過索書號(hào)識(shí)別結(jié)果與電子數(shù)據(jù)庫中圖書信息的比較,找出已經(jīng)丟失的圖書。確保電子數(shù)據(jù)庫中的圖書狀態(tài)與書庫中的一致,以及書庫中的圖書準(zhǔn)確排放,從而有效解決上述“用索書號(hào)找不到圖書”的問題。1.2索書號(hào)自動(dòng)識(shí)別系統(tǒng)近年來,隨著電子計(jì)算機(jī)技術(shù)、圖像處理技術(shù)和攝像技術(shù)的迅速發(fā)展,圖像中的文字信息提取系統(tǒng)已經(jīng)成功地應(yīng)用于各個(gè)領(lǐng)域。因此,借助其經(jīng)驗(yàn),本文研究采用圖像處理和識(shí)
5、別技術(shù)實(shí)現(xiàn)索書號(hào)的自動(dòng)識(shí)別。1.2.1索書號(hào)自動(dòng)識(shí)別系統(tǒng)概述系統(tǒng)的硬件由彩色CCD攝像頭,8位圖像采集卡和計(jì)算機(jī)組成,拍攝的圖像為8位RGB彩色數(shù)字圖像。如圖1-1所示CCD攝像索書號(hào)文字圖像分割文字圖像二值化單個(gè)字符切分索書號(hào)識(shí)別圖書排放位置判斷CCD攝像機(jī)拍攝排放在書架上的圖書圖像,圖書的圖像出索書號(hào)外還有其他內(nèi)容,如出版社的標(biāo)志,其他文字甚至大塊的污漬等,必須從中分割出僅包含索書號(hào)的文字圖像?;叶鹊奈淖謭D像難以直接用于識(shí)別,所以講灰度的文字圖像裝換為二值圖像。由于噪聲和五點(diǎn)的干擾,以及光照不均勻的影響,二值化后的文字會(huì)發(fā)生粘連,嚴(yán)重改變文字的自營(yíng)。字符切分成單個(gè)字符后才進(jìn)行文字識(shí)別。按照
6、上述流程,具體介紹索書號(hào)識(shí)別的整個(gè)過程。1.2.2索書號(hào)識(shí)別存在的問題及關(guān)鍵技術(shù)索書號(hào)識(shí)別所涉及的攝像技術(shù),無線通訊技術(shù),電子數(shù)據(jù)庫圖書管理技術(shù),AGV自動(dòng)導(dǎo)引技術(shù)和圖像處理技術(shù)都已經(jīng)在其他領(lǐng)域有成功應(yīng)用的實(shí)例。圖像處理技術(shù)是索書號(hào)識(shí)別的核心技術(shù),而與相類似的應(yīng)用相比,索書號(hào)圖像處理與識(shí)別又有其自身顯著的特點(diǎn)和難點(diǎn)。圖書館收集了近幾十年的藏書,不同時(shí)代的索書號(hào)編寫風(fēng)格大不相同。本論文選取圖書館的主要類別圖書一一印刷體索書號(hào),從圖書館的書架上隨即抽取樣本進(jìn)行研究。如圖7所示,CCD攝像頭拍攝的索書號(hào)圖像,由于光照不均勻、退色、污跡、噪聲以及其他非索書號(hào)文字的存在,大大增加了索書號(hào)識(shí)別的困難。為了
7、能夠解決上述問題,索書號(hào)圖像識(shí)別主要由以下4個(gè)模塊組成:索書號(hào)定位,索書號(hào)提取,索書號(hào)字符切分和索書號(hào)單字識(shí)別。第一階段:索書號(hào)定位是在圖像中找到包含索書號(hào)的圖像區(qū)域,要求該區(qū)域盡可能包含完整的索書號(hào),同時(shí)盡量排除非索書號(hào)的圖像區(qū)域。由于該階段是解決索書號(hào)的區(qū)域查找問題,而沒有涉及單字切分,因此圖像區(qū)域的估計(jì)允許有一定誤差。為了包含完整的索書號(hào)以及避免索書號(hào)漏檢,往往是定位得到的圖像區(qū)域略大于索書號(hào)的真實(shí)區(qū)域。索書號(hào)定位主要存在兩個(gè)問題:(1)受不均勻光照和褪色的影響,索書號(hào)的紋理特征、顏色特征以及形狀特征等有較大的變化,可靠性相對(duì)較差;(2)有的索書號(hào)由1個(gè)字符串組成,有的索陸號(hào)由2個(gè)字符串
8、組成,而在索書號(hào)的周圍附近還會(huì)存在其他文字,如出版社名稱和作者姓名。因此,將索書號(hào)與其他文字相區(qū)別比較困難。第二階段:索書號(hào)提取是在定位得到的索書號(hào)區(qū)域中,將索書號(hào)字符與周圍目標(biāo)和背景相互分離。通過二值化處理,能將字符與背最相互分離。但由于定位得到的圖像區(qū)域略大于真實(shí)索書號(hào)區(qū)域,二值化后在索書號(hào)字符附近可能會(huì)存在一些非字符目標(biāo),影響后續(xù)的單字切分和識(shí)別。所以,二值化后采用連通域?yàn)V波進(jìn)一步消除索書號(hào)周圍的非字符目標(biāo)。索書號(hào)提取主要存在的問題:(1)不均勻光照增大了索書號(hào)圖像的灰度值變化范圍。(2)褪色程度的不同則降低了字符與背景的對(duì)比度。(3)污跡的影響。上述因素的存在不僅使得確定二值化過程中合
9、理的閾值非常困難,而且會(huì)改變索書號(hào)字符的形狀特征,最終影響連通域?yàn)V波的性能。第三階段:索書號(hào)字符切分是將索書號(hào)字符串切分成一個(gè)個(gè)字符,以提供給識(shí)別算法進(jìn)行識(shí)別。單字切分的結(jié)果如何將直接影響識(shí)別結(jié)果,而且切分好壞除字符能否正確識(shí)別之外,沒有較好的判別依據(jù)。因此,單字切分往往與字符識(shí)別緊密結(jié)合在一起。索書號(hào)的單字切分可以分為兩種情況:非粘連單字切分和粘連字符的單字切分。非粘連單字切分比價(jià)容易解決。但質(zhì)量較差索書號(hào)圖像二值化處理后,相鄰字符可能會(huì)發(fā)生粘連。而粘連索書號(hào)切分存在的主要問題是(1)粘連字符的切分比較困難:(2)索書號(hào)字符發(fā)生粘連有一部分是字符的筆畫發(fā)生變形所致,如筆劃寬度變粗等。即使正確
10、的切分也不一定能夠完全修正筆畫的變形,即無法通過粘連切分恢復(fù)字符的原形。第四階段:索書號(hào)單字識(shí)別。印刷體單字識(shí)別的研究已經(jīng)相當(dāng)成熟,只是與其他應(yīng)用領(lǐng)域的文字識(shí)別相比,索書號(hào)文字的質(zhì)量較差,存在字符不均勻褪色,筆劃殘缺以及大面積污跡等問題,2索書號(hào)文字圖像分割復(fù)雜背景圖像中的文字定位和分割是從圖像中獲取文字信息的關(guān)鍵步驟,直接影響到后續(xù)文字識(shí)別的準(zhǔn)確性,它在機(jī)器人視覺.汽車牌照自動(dòng)識(shí)別,計(jì)算機(jī)文本自動(dòng)輸入,郵件地址自動(dòng)識(shí)別,集裝箱編號(hào)自動(dòng)識(shí)別以及視頻圖像內(nèi)容的檢索等系統(tǒng)中都有廣泛的應(yīng)用CCD拍攝的圖書索書號(hào)圖像如圖2-1所示圖像中除了索書號(hào)還包含尤其他文字,紅色條形框還包含有其他文字,紅色條形框
11、以及裝飾景物等,為了能夠正確識(shí)別該書的索書號(hào),首先必須從圖像中正確分割出索書號(hào)圖像。但是,從圖像尤其場(chǎng)景圖像中自動(dòng)定位和分割文字是比一,文字嵌入在圖像中,并與其它圖形共存,如邊框顏色退化,文字顏色不均勻,熱切背景顏色有食欲吻脖第四,關(guān)照條件無去控制,廣州不均勻;第五,索書號(hào)本課題利用基于邊緣點(diǎn)數(shù)量統(tǒng)計(jì)的文字圖像分號(hào)文字圖像具有如下特征:第一,索書號(hào)文字采用黑色第三,索書號(hào)字符水平排列;第四,索書號(hào)貼在書脊的驗(yàn)結(jié)果證明,該方去具有定位精度高,準(zhǔn)確率高,抗噪得理想效果。像有以下幾個(gè)方面:第等;第二,由于文字,文字尺寸大小變化書號(hào)的制定規(guī)則,索書字的數(shù)量至少為3個(gè);程如圖2-2所示,實(shí)2-1圖書索書
12、號(hào)I目難的,其主要,一示,裝飾物以及污色差異很?。坏?與其他文字。J去。根據(jù)圖書館索I;第二,索書號(hào)部分。它的算去n強(qiáng),并在“索書”中取V圖2-2索書號(hào)圖像分割算法流程HSI彩色空間轉(zhuǎn)換攝像頭拍攝的彩色圖片的像素點(diǎn)通常是采用24位RGB表示。但R,G和B3分量之間有很高的相關(guān)性,直接利用這些分量常常不嫩得到所需的分割效果。比較接近人堆顏色視覺感知的是色度,飽和度和亮度空間。其中I表示顏色的敏感程度,H表示不同的顏色,S表示顏色的深淺,I分量與彩色信息無關(guān),H和S與人感受彩色的方式緊密相連。本算法中,只對(duì)邊緣點(diǎn)進(jìn)行財(cái)社分割,切自用S分量。英雌,問了減少算法的耗時(shí),首先子轉(zhuǎn)換I分量,如圖2-3所示
13、,待邊緣檢測(cè)出來后,再堆邊緣點(diǎn)進(jìn)行S分量計(jì)算。轉(zhuǎn)換關(guān)系如下:I=(R+G+B)/3(2-1)S=1-3/(R+G+B)*min(R,G,B)(2-2)2.2Canny算子檢測(cè)Canny算子邊緣檢測(cè)先計(jì)算X和Y方向的梯度平方和,局部最大的梯度幅值局部變化最大的點(diǎn)的過程叫非極大值抑制。Canny算子邊緣檢測(cè)有如下3個(gè)指標(biāo):第一,對(duì)每個(gè)邊緣點(diǎn)有唯一的響應(yīng),得到的邊緣為單像素狂;第二,錯(cuò)誤率最低,即要少將真正的邊緣點(diǎn)丟失也要少將非邊緣點(diǎn)判為邊緣點(diǎn);第三,高位置精度,檢測(cè)的邊緣應(yīng)在正真的邊界上。為此,Canny像影帝定義了3給準(zhǔn)函數(shù)衣表達(dá)上述指標(biāo)的約束:a,信噪比函數(shù)準(zhǔn)則;b,定位精度準(zhǔn)這函數(shù);c,單邊
14、緣響應(yīng)準(zhǔn)這函數(shù)。這三個(gè)準(zhǔn)則相結(jié)合可以檢測(cè)的最佳的邊緣。Canny算子中有3個(gè)參數(shù),。是高斯函數(shù)聞不得參數(shù),他控制平滑程度:高閾值(TG)和低閾值(TL)。實(shí)驗(yàn)中。設(shè)置為1,TL=0.4*TG。這樣在Canny算子中只保留了一個(gè)參數(shù)高閾值(TG)。實(shí)際應(yīng)用中,TG取值只需要滿足兩個(gè)條件:第一,確保盡可能地檢測(cè)出索書號(hào)文字的邊緣點(diǎn),這粗限定了TG取值的最高上限;第二,確保加邊緣盡可能少,這限定了TG取值的下限。由于文字和背景具有較強(qiáng)的對(duì)比度,TG取值有一個(gè)較大的范圍,實(shí)驗(yàn)中TG=0.2。如圖2-4所示,即實(shí)驗(yàn)中的Canny算子邊緣檢測(cè)結(jié)果。D圖2-3Canny算子檢測(cè)的邊緣2.3索書號(hào)邊緣點(diǎn)彩色分
15、割文字圖像有一些獨(dú)特的特征,文字圖像的解構(gòu)比較復(fù)雜,邊緣像素點(diǎn)比較多,切分布比較集中。BW_Word(i,j)二受光照條件和文字顏色退化程度不同的影響,文字部分特征如對(duì)比度,亮度等容易搜到干擾,但是文字的邊緣分布規(guī)律且有較強(qiáng)的干擾性能。Canny算子檢測(cè)等到的邊緣點(diǎn)在HSI彩色空間S分量上精心索書號(hào)文字邊緣點(diǎn)的分割。由于索書號(hào)文字采用黑色應(yīng)刷,但發(fā)生不同程度的退色,繼黑巖色的飽和度s有一定的變化,故S1SNy0(non-word)(2-4)式中,Ny0(word)為文職圖像區(qū)域的行平均邊緣點(diǎn)個(gè)數(shù),Ny0(non-word)為非文字圖像區(qū)域的行平均邊緣點(diǎn)個(gè)數(shù)。雖然文字圖像區(qū)域中也存在者字符見得間
16、隔,必能完全保證每一行的邊緣點(diǎn)數(shù)量都比非文字區(qū)域的行邊緣點(diǎn)數(shù)量多。但是從概率角度可以認(rèn)為,文字圖像區(qū)域的每一行邊緣點(diǎn)適量大于政府圖像邊緣點(diǎn)數(shù)量的行平均值,而非文字圖像區(qū)域者相反,即:Ny(word)Ny0(word)Ny(non-word)(2-5)式中Ny(word)是文字圖像區(qū)域中某一行的邊緣點(diǎn)數(shù)量,Ny(non-word)是非文字圖像區(qū)域中某一行的邊緣點(diǎn)數(shù)量,Ny0(word)所示是整幅圖像邊緣點(diǎn)數(shù)量的行平均值。邊緣點(diǎn)數(shù)量統(tǒng)計(jì)如圖2-6所示。圖2-6行方向邊緣點(diǎn)數(shù)量統(tǒng)計(jì)檢測(cè)出的可能文字圖像應(yīng)先進(jìn)行合并,形成可能的文字圖像區(qū)域。受文字圖形自身結(jié)構(gòu)繁簡(jiǎn)程度不同的影響,以及索書號(hào)可能有多行字符
17、串組成,而兩行字符串之間可能存在間隔,使的圖像文字區(qū)域中的某些行的邊緣點(diǎn)數(shù)量低于平均值,設(shè)置行方向的間隔閾值Ty=10.即去過兩可能文字圖像行的間距DyNx0(non-word)(2-6)式中,Nx0(word)為文字圖像區(qū)域的列平均邊緣點(diǎn)個(gè)數(shù),Nx0(non-word)為非文字圖像區(qū)域的列平均邊緣點(diǎn)個(gè)數(shù)。文字圖像區(qū)域列邊緣點(diǎn)數(shù)兩也有下屬關(guān)系:Nx(word)Nx0(word)Nx(non-word)(2-7)式中Nx(word)是文字圖像區(qū)域中某一列的邊緣點(diǎn)數(shù)量,Nx(non-word)是非文字圖像區(qū)域中某一列的邊緣點(diǎn)數(shù)量,Nx0(word)所示是整幅圖像邊緣點(diǎn)數(shù)量的列平均值。邊緣點(diǎn)數(shù)量統(tǒng)計(jì)
18、如圖2-7所示。檢測(cè)出的可能文字圖像應(yīng)先進(jìn)行合并,形成可能的文字圖像區(qū)域。受文字圖形自身結(jié)構(gòu)繁簡(jiǎn)程度不同的影響,以及索書號(hào)可能有多列字符串組成,而兩列字符串之間可能存在間隔,使的圖像文字區(qū)域中的某些列的邊緣點(diǎn)數(shù)量低于平均值,設(shè)置行方向的間隔閾值Tx=20即去過兩可能文字圖像行的間距DxTx,這經(jīng)性合并,否則視為兩個(gè)獨(dú)立的文字圖像區(qū)域。經(jīng)可能文字圖像行合并后,圖2-1所示的索書號(hào)文字圖像區(qū)域中存在兩個(gè)索書號(hào)圖像區(qū)域?,F(xiàn)在其中包含可能文字圖像行最多的區(qū)域?yàn)樗鲿?hào)文字圖像。邊界調(diào)整檢測(cè)出的文字圖像中,由于文字大小寫,吱聲結(jié)構(gòu)等造成字符排列不爭(zhēng)氣,導(dǎo)致不問字符的筆畫會(huì)被漏檢,如字符P的下半部分。因此,
19、必須調(diào)整文字圖像的邊界。在已經(jīng)分割出的文字區(qū)域赴京,統(tǒng)計(jì)行方向的邊緣點(diǎn)數(shù)量,若邊緣點(diǎn)數(shù)量大于2,則將列并入文字圖像區(qū)域。同理在列方向進(jìn)行邊界調(diào)整。經(jīng)過列方向和行方向邊界天正,形成完整的文字圖像區(qū),并提取出文字圖像。如圖2-1所示的索書號(hào)分割出的索書號(hào)圖像如圖2-8所示。圖2-8分割出的索書號(hào)圖像文字圖像二值化3.1二值化的概述多數(shù)OCR文字識(shí)別系統(tǒng)都是在二值化的文字圖像上實(shí)現(xiàn)的。因此,灰度文字圖像的二值化處理是文字識(shí)別系統(tǒng)中的關(guān)鍵步驟,其結(jié)果直接影響后續(xù)的圖像處理,包括字符切分、特征提取和字符識(shí)別等。二值化問題描述如:令N為一系列自然數(shù),(x,y)是數(shù)字圖像的空間坐標(biāo),G二0,1,21-1是表
20、示灰度級(jí)的正整數(shù),這樣圖像函數(shù)以定義為映射:f:N*NG,坐標(biāo)為(x,y)的像素點(diǎn)值為f(x,y)o設(shè)t為閾值,B=(0,1),是一對(duì)二值灰度,其二值化過程為:0f(x,y)=I1f(x,y)0,若k32,iW(j,j+k),TDp(i)=0,則在j,j+k】?jī)?nèi)必然存在唯一的凹結(jié)構(gòu),如果BDp(j)0,若k2,i(j,j+k),BDp(i)=0,則在jj+k】?jī)?nèi)必然存在唯一的凸結(jié)構(gòu),如圖4-1所示為二值化的索書號(hào)圖像的上輪廓和下輪廓曲線,在凹凸輪廓實(shí)際檢測(cè)時(shí),由于字符圖像受噪聲影響,字符的部分筆劃邊緣不光滑,會(huì)檢測(cè)到一些僅有1,2個(gè)象素深度或高度的假凹輪廓或假凸輪廓。為了有效抑制筆劃邊緣不光滑
21、的干擾影響,在檢測(cè)過程中,增加了一個(gè)約束條件,即凹輪廓的深度和凸輪廓的高度必須大于等于3個(gè)象素。0102030405060708090100圖4-1(a)字符串上輪廓曲線圖4-1(b)字符串下輪廓曲線432字符高度和寬度的近似檢測(cè)根據(jù)上輪廓和下輪廓的定義,可以檢測(cè)到各列字符高度H(i):H(i)=ET(i)-EB(i)(式4-4)取字符串的最大高度為字符的近似高度Hw:Hw=maxH(i)(式4-5)字符串圖像的上下輪廓曲線表明:(1)非粘連字符的間隔處存在鮮明的凹凸結(jié)構(gòu);(2)絕大部分粘連字符在間隔處也會(huì)同樣存在凹凸結(jié)構(gòu);(3)絕大部分水平筆劃粘連的字符至少也會(huì)存在凹結(jié)構(gòu)或凸結(jié)構(gòu)因此,可以采
22、用凹凸結(jié)構(gòu)的間距近似檢測(cè)單個(gè)字符的寬度Gw.由于凹凸結(jié)構(gòu)受字符自身形狀和粘連情況的影響,如I,I,1(小寫L)和1等字符相對(duì)較窄,而M,N,V,W等字符本身包含凹凸結(jié)構(gòu),從這些字符檢測(cè)到的問距會(huì)偏小,而水平筆劃的字符粘連會(huì)使檢測(cè)到的間距偏大,所以取凹結(jié)構(gòu)間距和凸結(jié)構(gòu)間距的中間值作為單個(gè)字符的近似寬度設(shè)n個(gè)凹結(jié)構(gòu)的位置集合為CT(1),CT(2),.CT(n),凸結(jié)構(gòu)位置集合為CB(1),CB,,.CB(m),則凹結(jié)構(gòu)和凸結(jié)構(gòu)的間距分別為:DCT(i)=CT(i)-CT(i-1),i=2,3,n(式4-6)DCB(i)=CB(i)-CB(i-1),i=2,3,m(式4-7)為了將第一個(gè)凹結(jié)構(gòu)和凸
23、結(jié)構(gòu)的間距包括在內(nèi),定義第一個(gè)凹結(jié)構(gòu)和凸結(jié)構(gòu)的間距為:DCT(1)=CT(1)-LcDCB(1)=CB(1)-Lc(式4-8)(式4-9)其中Lc為字符串的起始列。單個(gè)字符的寬度估計(jì)值為:Gw=medDCT(1),.DCT(1),.DCB(1),.DCB(1)(式4-10)由于受字符形態(tài)的影響,即使相同字體的字符,其寬度也有較大的變化,如字符1和字符“M”的寬度,而字符的高度保持基本保持一致。因此,字符高度的檢測(cè)比寬度檢測(cè)更加準(zhǔn)確,一般來說印刷體的字符高度和寬度之間滿足如下關(guān)系;Gw=0.7Hw(式4-11)因此,如果當(dāng)字符因干擾嚴(yán)重而無法準(zhǔn)確檢測(cè)到字符寬度時(shí),根據(jù)上述(4-14)式關(guān)系,建立
24、字符寬度檢測(cè)的約束條件:0.5HwGw0.8Hw(式412)即當(dāng)用凹凸結(jié)構(gòu)輪廓檢測(cè)的字符寬度不能滿足式(4-11)的約束關(guān)系時(shí),用式(4-12)估計(jì)字符寬度。433粘連索書號(hào)的切分索書號(hào)字符粘連的類型主要是簡(jiǎn)單粘連。上下輪廓的凹凸結(jié)構(gòu)位置作為可能的切分列,在如在約束條件的作用下進(jìn)行切分:同一索書號(hào)的字符尺寸大小相同,則每個(gè)字符的寬度Lw應(yīng)該在一定范圍內(nèi),即:0.6GwLw1.5Gw(式413)在上述約束條件的作用下,切分算法如下所示。切分的步驟如下:第一步:為非粘連字符的切分。檢測(cè)上輪廓的凹結(jié)構(gòu),若第i個(gè)凹結(jié)構(gòu)的Tp(CT(i)=O,則i凹結(jié)構(gòu)為非粘連字符的間隔,切分后所得的字符區(qū)域?yàn)镻l,P
25、2.Pn)。第二步:在上述切分的基礎(chǔ)進(jìn)行粘連字符的切分。4.3.4字符筆畫變形的修復(fù)粘連字符的切分是對(duì)字符變形的糾正,但并不是正確的切分就能完全修復(fù)字符筆劃的變形。如圖55所示,正確的切分后,字符“3”的變形。由于索書號(hào)字符串的字符筆劃寬度接近相等,粘連筆劃切分后同樣應(yīng)該滿足該條件:Rw=minSL/SR,SR/SL(式414)若Rw=PT,則在k處檢測(cè)到結(jié)構(gòu)突變(P);若SLLT,SRRT,則檢測(cè)到結(jié)構(gòu)為豎直(V);若SLLT,SRRT,則檢測(cè)到結(jié)構(gòu)為右斜(R);若SLLT,SRRT,則檢測(cè)到結(jié)構(gòu)為圓弧(c)。(2)由于字符輪廓突變處,表示字符輪廓不連續(xù),則突變前后的輪廓特征必須分別檢測(cè)。即
26、若l處檢測(cè)到P,則在【1,匕一1】的字符輪廓范圍內(nèi)統(tǒng)計(jì)SL,SV和SR獨(dú)立進(jìn)行結(jié)構(gòu)基元檢測(cè)。若在k2處又檢測(cè)到P,則在【匕+1,也一1】范圍內(nèi)進(jìn)行基元檢測(cè),依此類推。由于字符輪廓基元的形成需要一定數(shù)(T)輪廓像素點(diǎn),即只有當(dāng)SL+SV+SR=ST時(shí),才能進(jìn)行基元檢測(cè),否則不進(jìn)行基元檢測(cè)。例如,當(dāng)SL+SV+SR=2時(shí),其形成的基元結(jié)構(gòu)是不穩(wěn)定。一般取ST=4。(4)檢測(cè)到突變結(jié)構(gòu)P的有效范圍在xW【ST,NST+1】,YW【ST,MST+1】。這主要是因?yàn)樵谄渌秶鷥?nèi)出現(xiàn)的結(jié)構(gòu)P多為干擾所致,結(jié)構(gòu)P截成的輪廓曲線過短,不能判定其結(jié)構(gòu)。左右兩側(cè)輪廓上檢測(cè)到的基元按照從上到下的順序保存在各自的向量
27、組LS和RS中;項(xiàng)部檢測(cè)到基元按從左到右的順序保存在另一個(gè)向量組TS中。頂部輪廓上,Ts(i)表示頂部輪廓結(jié)構(gòu)基元的向量組的第i個(gè)結(jié)構(gòu)基元,Tn表示頂部輪廓共有的基元數(shù)目;左側(cè)輪廓上,LS(i)表示左側(cè)輪廓結(jié)構(gòu)基元的向量組的第i個(gè)結(jié)構(gòu)基元,Ln表示左側(cè)輪廓共有的基元數(shù)目;右側(cè)輪廓上,RS(i)表示右側(cè)輪廓結(jié)構(gòu)基元的向量組的第i個(gè)結(jié)構(gòu)基元,Rn表示右側(cè)輪廓共有的基元數(shù)目。輪廓的統(tǒng)計(jì)特征采用上述的解構(gòu)基元還不足以準(zhǔn)確識(shí)別殘缺和完整的數(shù)字,引入輪廓的統(tǒng)計(jì)特征。水平方向的最大字符寬度Wmax;maxW=maxRP(k)-LP(k)max該特征主要用語識(shí)別數(shù)字1。當(dāng)W占/2,即為數(shù)字1,H=M。max垂
28、直方向的筆劃數(shù)該特征主要用于所示別數(shù)字0和8。因?yàn)?和8的輪廓解構(gòu)特征及其相似,所以借助與垂直方向的筆畫數(shù)加以區(qū)分。8在垂直方向的最大筆畫數(shù)也可能位。采用檢測(cè)到筆畫數(shù)為2時(shí)垂直方向的最小值來代替。假設(shè)J列上的像素點(diǎn)P(j,i-1),檢測(cè)到垂直方向的筆畫書為1,在P(j,i-1)檢測(cè)到了第二個(gè)筆畫,則S2=i,表示檢測(cè)到第二個(gè)筆畫的像素點(diǎn)位置。當(dāng)S2vM-ST時(shí),檢測(cè)到的字符為8,否則為0。數(shù)字字符的識(shí)別算法講數(shù)字字符的頂部,左右兩側(cè)的局部輪廓解構(gòu)特征和輪廓統(tǒng)計(jì)特征結(jié)合成特征向量,用以描述10個(gè)數(shù)字。更具特征向量,采用結(jié)構(gòu)識(shí)別算法識(shí)別地步殘缺的和完整的數(shù)字字符。由于底部特征丟失,會(huì)改變左右兩側(cè)的
29、部分結(jié)構(gòu)特征,但不會(huì)影響頂部特征,因此特征描述和機(jī)構(gòu)匹配識(shí)別都從頂部輪廓特征開始。局部輪廓解構(gòu)特征和統(tǒng)計(jì)特征描述數(shù)字:0:TS=C,Size(LS)=Size(RS)=1;S2M-ST.9;TS=C,LS(1)=C,LS(2)=P.實(shí)驗(yàn)結(jié)果如圖5-1所示,它是被切割字符3識(shí)別的結(jié)果,其中包括該字符的左輪廓圖像(a),右輪廓圖像(b),上輪廓圖像(c),字符寬度圖像(d);同樣,圖5-2是字符7,圖5-3字符4的識(shí)別的結(jié)果圖5-1(b)圖5-2(b)圖5-3(a)圖5-3(b)圖5-1(c)Digit=3Digit=7圖5-2(c)圖5-2(d)Digit=4圖5-3(c)圖5-4(d)由于在該
30、字符識(shí)別的過程中并不是采用模版匹配識(shí)別或是神經(jīng)網(wǎng)絡(luò)識(shí)別,故程序的識(shí)別結(jié)果并不是與圖像庫中原有的字符相比較,而是通過找出一個(gè)待識(shí)別的字符的各個(gè)輪廓結(jié)構(gòu),并找出其微分結(jié)構(gòu),根據(jù)句法結(jié)構(gòu)語句的識(shí)別的方法,給出Digit的值,其值即是待識(shí)別的字符數(shù)字,總的來說該算法雖然較繁瑣,但從程序結(jié)果可以看出其識(shí)別能力較好,基本上能正確的將索書號(hào)數(shù)字識(shí)別出來。程序附錄附錄A索書號(hào)文字圖像分割代碼:%I=imread(24-1.jpg);該圖像的試驗(yàn)結(jié)果讀者自行試驗(yàn)。I=imread(22-2.jpg);ticy,x,z=size(I);myI=double(I);%RGBtoHSI%HS_I=(myI(:,:,1
31、)+myI(:,:,2)+myI(:,:,3)/3;t1=toctic%邊緣點(diǎn)數(shù)量統(tǒng)計(jì)與S分量的紋理分割%S=zeros(y,x);BW=edge(HS_I,canny,0.2);%邊緣檢測(cè),對(duì)邊緣像素點(diǎn)作統(tǒng)計(jì)分析。t2=tocticES=0;fori=1:xforj=1:yif(BW(j,i)=1)S(j,i)=1-min(myI(j,i,:)/HS_I(j,i);SR=round(S(j,i)*100)/100;ES=ESSR;endendendESx=(0:0.01:1);BW1=zeros(y,x);fori=1:xforj=1:y%根據(jù)上述的統(tǒng)計(jì)直方圖設(shè)定S的閾值if(BW(j,i)
32、=1)&(S(j,i)=0.01)BW1(j,i)=1;endendendt3=toctic%邊緣像素點(diǎn)數(shù)量統(tǒng)計(jì)%EdgePointsX=sum(BWl);%X方向AveragePointsX=mean(EdgePointsX);EPx=(1:x);%文字圖像區(qū)域分割%XDirectionColumnX=zeros(1,x);fori=1:xif(EdgePointsX(i)=AveragePointsX)ColumnX(i)=1;endendNx=sum(ColumnX);Posx=zeros(1,Nx);%挑出邊緣點(diǎn)數(shù)量大于平均值的位置k=1;fori=1:xif(EdgePointsX(
33、i)=AveragePointsX)Posx(k)=i;k=k+1;endendgapx=12;%間隔小于10列的,區(qū)域合并Partx0=zeros(1,Nx);Partx1=zeros(1,Nx);k=1;Partx0(1)=Posx(1);fori=2:Nxd=Posx(i)-Posx(i-1);if(dgapx)Partx1(k)=Posx(i-1);k=k+1;Partx0(k)=Posx(i);endendPartx1(k)=Posx(Nx);%最后一列大于平均值的位置作為,最后一個(gè)區(qū)域的切分位置Spanx=zeros(1,k);%共有k個(gè)區(qū)域fori=1:kSpanx(i)=sum
34、(ColumnX(Partx0(i):Partx1(i);endmytempnPartx=max(Spanx);word_Xseg0=Partx0(nPartx);word_Xseg1=Partx1(nPartx);%BWSeg=BWl(:,word_XsegO:word_Xseg1);%Y方向邊緣點(diǎn)統(tǒng)計(jì)BWT=BWSeg;EdgePointsY=sum(BWT);AveragePointsY=mean(EdgePointsY);EPy=(1:y);RowY=zeros(1,y);fori=1:yif(EdgePointsY(i)=AveragePointsY)RowY(i)=1;endend
35、Ny=sum(RowY);Posy=zeros(1,Ny);%挑出邊緣點(diǎn)數(shù)量大于平均值的位置k=1;fori=1:yif(EdgePointsY(i)=AveragePointsY)Posy(k)=i;k=k+1;endendgapy=20;%間隔小于30列的,區(qū)域合并Party0=zeros(1,Ny);Party1=zeros(1,Ny);k=1;Party0(1)=Posy(1);fori=2:Nyd=Posy(i)-Posy(i-1);if(dgapy)Party1(k)=Posy(i-1);k=k+1;Party0(k)=Posy(i);endendParty1(k)=Posy(Ny
36、);%最后一列大于平均值的位置作為,最后一個(gè)區(qū)域的切分位置Spany=zeros(1,k);%共有k個(gè)區(qū)域fori=1:kSpany(i)=sum(RowY(Party0(i):Party1(i);endmytempnParty=max(Spany);word_Yseg0=Party0(nParty);word_Yseg1=Party1(nParty);word=I(word_Yseg0:word_Yseg1,word_Xseg0:word_Xseg1,:);t4=tocHS_I=uint8(HS_I);%Display%imshow(word);附錄B圖像二值化代碼:load(word.ma
37、t);T2=graythresh(word);J=im2bw(word,T2);se=strel(square,2);fo=imopen(J,se);imshow(fo);附錄C粘連字符切分代碼:I=imread(19-3-02.jpg);%I=imread(49-3-BW01.jpg);I=im2bw(I,0.43);yx=size(I);Top=zeros(1,x);%頂端輪廓檢測(cè)fori=1:xj=1;while(I(j,i)=1)&(j1)j=j-1;endBottom(i)=y-j;endHeight=Top-Bottom;WordHeight=max(Height);%文字高度%=
38、輪廓線的凹檢測(cè)=%記錄凹輪廓處的位置,%下降值%上升值%凹輪廓的深度閾值1表示默認(rèn)起始列為TopD=zeros(1,x-1);Concave=1;第一個(gè)ConcaveDeep=0;DeepH=0;DeepT=5;Sign=0;fori=1:x-1TopD(i)=Top(i+1)-Top(i);endfori=1:x-2if(TopD(i)0)if(abs(Deep)=DeepT)DeepH=DeepH+TopD(i);if(abs(DeepH)=DeepT)Concave=ConcavetempX;Sign=0;%確認(rèn)為凹后,復(fù)位標(biāo)志位DeepH=0;endelseSign=0;%確認(rèn)為凹后,
39、復(fù)位標(biāo)志位Deep=0;endendend%上升值%下降值%凸程度閾值%=輪廓線的凸檢測(cè)=%BottomD=zeros(1,x-1);Convex=1;Asend=0;Desend=0;ConvexT=3;Sign=0;fori=1:x-1BottomD(i)=Bottom(i+1)-Bottom(i);endfori=1:x-2if(BottomD(i)0)Sign=1;Desend=0;Asend=Asend+BottomD(i);tempX=i+1;%最接近于左端endif(Sign=1)&(BottomD(i)=ConvexT)Desend=Desend+BottomD(i);if(a
40、bs(Desend)=ConvexT)Convex=ConvextempX;Sign=0;%復(fù)位Desend=0;end%復(fù)位elseSign=0;Asend=0;endendend%=切分=%mytempn=size(Concave);%注意Concave的第一個(gè)數(shù)值無效StrokeT=5;%筆劃寬度閾值GapT=8;W=zeros(1,n);fori=1:n-1W(i)=Concave(i+1)-Concave(i);endW(n)=x-Concave(n);Width=median(W);%近似的字符寬度PXR1=1;%記錄第一次切分位置PXR2=1;%記錄第二次切分位置Mark=0;%
41、記錄黑白轉(zhuǎn)換的次數(shù)%CrossSign=0;%交錯(cuò)粘連的標(biāo)志Black=zeros(1,x);%統(tǒng)計(jì)筆劃像素點(diǎn)BP=zeros(1,x);SegSoke=zeros(3,x);%切分點(diǎn)處的筆劃寬度RH=zeros(1,x);%切分后的高度比RW=zeros(1,x);%切分后的寬度比Score=zeros(1,x);%特征值的總得分XGood=1;%X切分位置SegY=1;%記錄第一次切分的Y深度fork=2:nWordH=max(Height(Concave(k-1):Concave(k);WordW=Concave(k)-Concave(k-1);if(WordW=0.5*Width)&(
42、WordW=1.5*Width)%選定切分的區(qū)域PX1=Concave(k);PX2=PX1;while(TopD(PX2)=0)&(PX2x)PX2=PX2+1;%凹右邊的列位置endi=fix(PX1+PX2)/2);if(Top(i)=1)%無粘連PXR1=PXR1i;PXR2=PXR2i;elsej=y+1-Top(i);%PY為實(shí)際的y坐標(biāo)值,此處已為黑色像素點(diǎn)八、Mark=0;while(jy)&(Mark1)&(I(j,Si)=0)%左筆劃寬度Si=Si-1;SegSoke(1,i)=SegSoke(1,i)+1;endSi=i;while(Si1)&(I(j-1,SLi)=1)
43、SLi=SLi-1;endSRi=i;while(SRi1.5*Width)PX=fix(Concave(k)+Concave(k-1)/2);%避免水平“橫”的粘連k=k-1;end%如果寬度過小,則不切分endend%=Segment=%fori=2:nWI=I(:,fix(PXR1(i-1)+PXR2(i-1)/2):fix(PXR1(i)+PXR2(i)/2);figure(10+i);imshow(WI);endWI=I(:,fix(PXR1(i)+PXR2(i)/2):x);figure(10+i+1);imshow(WI);%=圖像顯示=%px=(1:x);%X軸坐標(biāo)figure
44、(1);imshow(I);figure(2);plot(Top);holdonplot(px,y,red);gridtitle(上輪廓);figure(3);plot(Bottom);holdonplot(px,y,red);gridtitle(下輪廓);figure(4);plot(Height);grid附錄D單個(gè)字符識(shí)別代碼(字符3的識(shí)別):I0=imread(3.jpg);%必須為二值圖像I=im2bw(I0,0.4);y0 x0=size(I);Range=sum(I);Hy=0;forj=1:y0if(Range(j)=1)Hy=Hy+1;endendRangeX=sum(I);Wx=0;fori=1:x0if(RangeX(i)=1)Wx=Wx+1;endendAmp=24/Hy;%將文字圖像歸一化到24像素點(diǎn)的高度I=imresize(I,Amp);yx=size(I);%I=bwmorph(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 獨(dú)立董事2025年度履職評(píng)價(jià)與激勵(lì)措施合同3篇
- 二零二五年度禾青幼兒園教玩具采購與幼兒園設(shè)施維護(hù)合同3篇
- 二零二五搬家公司合同模板:搬家保險(xiǎn)責(zé)任與賠償條款2篇
- 二零二五版物流行業(yè)預(yù)付款擔(dān)保合同2篇
- 二零二五版搬家服務(wù)與家政服務(wù)融合合同樣本2篇
- 二零二五年度蔬菜電子商務(wù)合同:線上銷售平臺(tái)與賣家之間的規(guī)則2篇
- 二零二五版汽車零部件購銷合同標(biāo)準(zhǔn)及售后服務(wù)模板3篇
- 二零二五年度國際教育機(jī)構(gòu)合作辦學(xué)合同3篇
- 二零二五年度高壓變壓器安裝及安全防護(hù)技術(shù)合同3篇
- 二零二五版社保繳納與工傷保險(xiǎn)待遇保障合同3篇
- ICU常見藥物課件
- CNAS實(shí)驗(yàn)室評(píng)審不符合項(xiàng)整改報(bào)告
- 農(nóng)民工考勤表(模板)
- 承臺(tái)混凝土施工技術(shù)交底
- 臥床患者更換床單-軸線翻身
- 計(jì)量基礎(chǔ)知識(shí)培訓(xùn)教材201309
- 中考英語 短文填詞、選詞填空練習(xí)
- 一汽集團(tuán)及各合資公司組織架構(gòu)
- 阿特拉斯基本擰緊技術(shù)ppt課件
- 初一至初三數(shù)學(xué)全部知識(shí)點(diǎn)
- 新課程理念下的班主任工作藝術(shù)
評(píng)論
0/150
提交評(píng)論