基于MATLAB的圖片中文字的提取及識別要點_第1頁
基于MATLAB的圖片中文字的提取及識別要點_第2頁
基于MATLAB的圖片中文字的提取及識別要點_第3頁
基于MATLAB的圖片中文字的提取及識別要點_第4頁
基于MATLAB的圖片中文字的提取及識別要點_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 | HYPERLINK / 百度首頁 HYPERLINK /v2/?login 登錄 HYPERLINK /cashier/browse/vipcashier?dqStatCode=topnav_joinvip&cashier_code=topnav_joinvip VIP意見反饋 HYPERLINK /apps?fr=1011 下載客戶端基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字 HYPERLINK /?fr=logo 圖象處理DigitalImageProgressing HYPERLINK javascript:void(0); 頻道專區(qū) HYPERLINK java

2、script:void(0); 分類 HYPERLINK javascript:void(0); 精品內(nèi)容 HYPERLINK /wenkuverify?from=1 申請認(rèn)證 HYPERLINK javascript:void(0); 機構(gòu)合作 HYPERLINK /xtopic/wkback 百度智慧課堂 HYPERLINK /user/browse/vip/ 百度教育VIP HYPERLINK /?fr=crumbs 百度文庫 HYPERLINK /?fr=crumbs HYPERLINK /edu/index 教育專區(qū) HYPERLINK /edu/index HYPERLINK /l

3、ist/629 職業(yè)教育 HYPERLINK /list/629 HYPERLINK /list/646 其它鄒浩,余龍,鄒勇博,劉宇童,和振喬,李少梅(西安電子科技大學(xué) 電子工程學(xué)院,西安,710126)隨著現(xiàn)代社會的發(fā)展,信息的形式和數(shù)量正在迅猛增長。其中很大一部分是圖像,圖像可以把事物生動地呈現(xiàn)在我們面前,讓我們更直觀地接受信息。同時,計算機已經(jīng)作為一種人們普遍使用的工具為人們的生產(chǎn)生活服務(wù)。從圖像中提取文字屬于信息智能化處理的前沿課題,是當(dāng)前人工智能與模式識別領(lǐng)域中的研究熱點。由于文字具有高級語義特征,對圖片內(nèi)容的理解、索引、檢索具有重要作用,因此,研究圖片文字提取具有重要的實際意義。

4、又由于靜態(tài)圖像文字提取是動態(tài)圖像文字提取的基礎(chǔ),故著重介紹了靜態(tài)圖像文字提取技術(shù)。MATLAB 圖像處理 文字提取 文字識別TextExtractionandRecognitioninImagesBasedonMATLABZOUHao,YUlong,ZOUYongbo,LIUYutong,HEZhenqiao,LIShaomei(XidianUniversity ElectronicEngineeringCollege,Xian,710126)AbstractWiththedevelopmentofsociety,the formandquantityofimformationareincre

5、asingquickly.Alargepartofthemareimages,whichcanmakethingsvividlypresentedinfrontofus,letusmoreintuitivetoacceptinformation.Atthesametime,thecomputerhasbeenasawidelyusedtoolforpeoplesproductionandlivingservices.Extractingtextfromimagebelongstothefrontierofintelligentinformationprocessing,anditisthecu

6、rrenthotresearchtopicinthefieldofartificialintelligenceandpatternrecognition.Asthetextwithhigh-levelsemanticfeatureandplaysanimportantroleonunderstanding,indexingandretrievalimagecontent.Therefore,thestudyonextractingtextsfromimageshaveimportantactualmeanings.Andbecauseextractingtextsfromstillimages

7、isthebasisforextractingtextsfromdynamicimages,thearticleemphaticallyintroducesthetechnologyofextractingtextsfromstillimages.KeyWords:MATLAB imageprocessing wordextraction wordrecognition 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing一引言隨著計算機科學(xué)的飛速發(fā)展,以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介,在圖像中,文字信息(如新聞標(biāo)題

8、等字幕) 包含了豐富的高層語義信息,提取出這些文字,對于圖像高層語義的理解、索引和檢索非常有幫助。圖像文字提取又分為動態(tài)圖像文字提取和靜態(tài)圖像文字提取兩種,其中,靜態(tài)圖像文字提取是動態(tài)圖像文字提取的基礎(chǔ),其應(yīng)用范圍更為廣泛,對它的研究具有基礎(chǔ)性,色為單色, 相對與前者更易被檢測和提取,又因其對圖像內(nèi)容起到說明總結(jié)的作用,故適合用來做圖像的索引和檢索關(guān)鍵字。對圖像中場景文字的研究難度大,目前這方面的研究成果與文獻(xiàn)也不是很豐富,本文主要討論圖像中人工文字提取技術(shù)。(2)文字一般是單色的;(3)文字大小在一幅圖片中固定,并且寬度和高度大體相同,從滿足人眼視覺感受的角度來說,圖像中文字的尺寸既不會過大

9、也不會過??;(4)文字的分布比較集中;(5)文字的排列一般為水平方向或垂直方向;(6)多行文字之間,以及單行內(nèi)各個字之間存在不同于文字區(qū)域的空隙。在靜態(tài)圖片文字的檢測與提取過程中, 一般情況下都是依據(jù)上述特征進(jìn)行處理的。 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing靜態(tài)圖像文字提取一般分為以下步驟:文字區(qū)域檢測與定位、文字分割與文字提取、文字后處理。其流程如圖1所示。(圖1)在Matlab中調(diào)用i1=imread(字符.jpg),可得到原始圖像,如圖2所示:(圖2)調(diào)用i2=rgb2gray(i1),則得到了灰度圖像,如圖3

10、所示:(圖3)調(diào)用a=size(i1);b=size(i2);可得到:a=3,b=2 即三維圖像變成了二維灰度圖像0,i2 thresh=thresh); 其中thresh為門限,在0,255之間1,i2 thresh這里,i2_max=double(max(max(i2); %獲取亮度最大值i2_min=double(min(min(i2); %獲取亮度最小值thresh=round(i2_max-(i2_max-i2_min)/3);得到二值圖像,如圖4所示: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖4)把二值圖

11、像放大觀察,可看到離散的黑點對其采用腐蝕膨脹處理,得到處理后的圖像,如圖5所示(圖5)可見,腐蝕膨脹處理后的圖像質(zhì)量有了很大的改觀。橫向、縱向分別的腐蝕膨脹運算比橫向、縱向同時的腐蝕膨脹運算好上很多,圖6可看出差別:(圖6)對腐蝕膨脹后的圖像進(jìn)行Y方向上的區(qū)域選定,限定區(qū)域后的圖像如圖7所示:掃描方法:中間往兩邊掃 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖7)縱向掃描后的圖像與原圖像的對照,如圖8所示:(圖8)(圖9)縱向掃描后的圖像與原圖像的對照,如圖10所示:(圖10)調(diào)用i8=(iiXY=1),使背景為黑色(0

12、),字符為白色(1),便于后期處理。背景交換后的圖像如圖11所示: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖11)(圖12) 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖13)可以看到,字符寬度不一致調(diào)用以下代碼,將字符規(guī)格化,便于識別:forj=1:cnum得到規(guī)格化之后的字符如圖14所示:(圖14)調(diào)用以下代碼創(chuàng)建字符集:code=char(由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正,。);將創(chuàng)建的字符集保存在一個文件夾里面,

13、以供匹配時候調(diào)用,如圖15所示: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖15)字符匹配采用模板匹配算法:將現(xiàn)有字符逐個與模板字符相減,認(rèn)為相減誤差最小的現(xiàn)有字符與該模板字符匹配。1 0 0 11 0 0 1假設(shè):字符,模板字符,模板字符TA =T =21sum(sum(abs(A- )= 8,sum(sum(abs(A- )= 2T1T2也就是說,字符A與模板字符T 更相似,我們可以認(rèn)為字符集中的字符T 就是字符A。12經(jīng)模板匹配,可得字符信息如下:效果如圖16所示:(圖16)調(diào)用以下代碼,將字符放入newtxt.

14、txt文本: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingc=fopen(new,a+);fprintf(c,%sn,Code(1:cnum);fclose(c);newtxt.txt文本內(nèi)容如圖17所示:(圖17)算法具有局限性。對于左右結(jié)構(gòu)的字符(如:川)容易造成誤識別,“川”字將會被識別成三部分。當(dāng)圖片中文字有一定傾斜角度時,這將造成識別困難。模板匹配效率低。對于處理大小為mm的字符,假設(shè)有n個模板字符,則識別一個字符至少需要mmn2次運算,由于漢字有近萬個,這將使得運算量十分巨大!此次字符識別一共花了2.838秒。1

15、 樊昀, 王潤生.從圖像中提取文字J .國防科技大學(xué)學(xué)報,2002,24 (1) :59-62.2 王健,王晨.基于靜態(tài)圖片的文本提取技術(shù)的研究J .延邊大學(xué)學(xué)報(自然科學(xué)版) , 2007,33(2) :124-128.3 夏瑩,馬少平,孫茂松等 計算機語言學(xué)方法在中文文字識別后處理中的應(yīng)用J .中文信息,1996,(2) :50-51. 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing%圖片中文字的提取及識別%tici_max=double(max(max(I); %獲取亮度最大值I=(I=thresh); %I為二值圖像%

16、figure(3);imshow(I);title(二值圖像,color,b);I=imdilate(I,seX);I=imerode(I,seX);%figure(4);imshow(I);title(腐蝕膨脹后的圖像,color,b);ii=double(I);m,n=size(ii); %獲取圖像大小信息%確定文字區(qū)域%縱向掃描countY=zeros(m,1);fori=1:mforj=1:nifii(i,j)=0 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingendendendendtempY2=indexY;end

17、tempY1=tempY1-1;tempY2=tempY2+1;%橫向掃描countX=zeros(1,n);forj=1:ncountX(1,j)=countX(1,j)+1;endtempX1=1;while(countX(1,tempX2)1)tempX1=tempX1-1;%figure(6);imshow(iiXY);title(X、Y方向區(qū)域都大致確定后的圖像,color,b);ii=(iiXY=1);%黑色背景,白色字體%figure(7);imshow(ii);title(背景和文字交換顏色的圖像,color,b);ii=bwareaopen(ii,200); %刪除面積小于2

18、00的雜質(zhì)圖像11 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingy1=10;y2=0.25;flag=0;figure(10)whilesize(myI,2)10 %當(dāng)myI的長度小等于10,可確定沒有字符了wordk,myI=getword(myI); %獲取字符k=k+1;ifk=2subplot(5,1,1);imshow(myI);title(第一次切割后的圖像,color,b);endifk=3subplot(5,1,2);imshow(myI);title(第二次切割后的圖像,color,b);endifk=5s

19、ubplot(5,1,3);imshow(myI);title(第四次切割后的圖像,color,b);endifk=16subplot(5,1,4);imshow(myI);title(第十五次切割后的圖像,color,b);subplot(5,1,5);imshow(myI);title(最后一次切割后的圖像,color,b);%cnum=k-1; %實際字符總個數(shù)%forj=1:cnum 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingwordj=imresize(wordj,4040); %字符規(guī)格化成4040的endfi

20、gure(12);forj=1:cnumsubplot(5,8,j),imshow(wordj),title(int2str(j); %顯示字符endforj=1:cnumimwrite(wordj,int2str(j),.jpg); %保存字符enddefx=40;defy=40;code=char(由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正,。);%創(chuàng)建字符集codenum=size(code,2); %獲取字符集中字符個數(shù)fori=1:cnumch=int2str(i); %數(shù)字轉(zhuǎn)化為字符tempbw=imread(ch.jpg); %打開預(yù)匹配字符fork=1:codenumfname=strcat(C:UsersAdministratorDesktop 數(shù)字圖像處理大作業(yè)字符匹配庫,code(k),.jpg);%字符匹配庫中的字符sample=imread(fname);subsam=abs(tempbw-sample); %作比較count=sum(sum(subsam); %匹配誤差統(tǒng)計err(k)=count;enderro=err(1:codenum);minerror=min(erro); %找出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論