基于MATLAB的圖片中文字的提取及識別要點

上傳人：秋*** IP屬地：四川上傳時間：2022-08-31 格式：DOC 頁數(shù)：16 大?。?.89MB 積分：10.8 舉報 版權(quán)申訴

已閱讀5頁，還剩11頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、 | HYPERLINK / 百度首頁 HYPERLINK /v2/?login 登錄 HYPERLINK /cashier/browse/vipcashier?dqStatCode=topnav_joinvip&cashier_code=topnav_joinvip VIP意見反饋 HYPERLINK /apps?fr=1011 下載客戶端基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字 HYPERLINK /?fr=logo 圖象處理DigitalImageProgressing HYPERLINK javascript:void(0); 頻道專區(qū) HYPERLINK java

2、script:void(0); 分類 HYPERLINK javascript:void(0); 精品內(nèi)容 HYPERLINK /wenkuverify?from=1 申請認(rèn)證 HYPERLINK javascript:void(0); 機構(gòu)合作 HYPERLINK /xtopic/wkback 百度智慧課堂 HYPERLINK /user/browse/vip/ 百度教育VIP HYPERLINK /?fr=crumbs 百度文庫 HYPERLINK /?fr=crumbs HYPERLINK /edu/index 教育專區(qū) HYPERLINK /edu/index HYPERLINK /l

3、ist/629 職業(yè)教育 HYPERLINK /list/629 HYPERLINK /list/646 其它鄒浩，余龍，鄒勇博，劉宇童，和振喬，李少梅（西安電子科技大學(xué) 電子工程學(xué)院，西安，710126）隨著現(xiàn)代社會的發(fā)展，信息的形式和數(shù)量正在迅猛增長。其中很大一部分是圖像，圖像可以把事物生動地呈現(xiàn)在我們面前，讓我們更直觀地接受信息。同時，計算機已經(jīng)作為一種人們普遍使用的工具為人們的生產(chǎn)生活服務(wù)。從圖像中提取文字屬于信息智能化處理的前沿課題，是當(dāng)前人工智能與模式識別領(lǐng)域中的研究熱點。由于文字具有高級語義特征，對圖片內(nèi)容的理解、索引、檢索具有重要作用，因此，研究圖片文字提取具有重要的實際意義。

4、又由于靜態(tài)圖像文字提取是動態(tài)圖像文字提取的基礎(chǔ)，故著重介紹了靜態(tài)圖像文字提取技術(shù)。MATLAB 圖像處理文字提取文字識別TextExtractionandRecognitioninImagesBasedonMATLABZOUHao,YUlong,ZOUYongbo,LIUYutong,HEZhenqiao,LIShaomei(XidianUniversity ElectronicEngineeringCollege,Xian,710126)AbstractWiththedevelopmentofsociety,the formandquantityofimformationareincre

5、asingquickly.Alargepartofthemareimages,whichcanmakethingsvividlypresentedinfrontofus,letusmoreintuitivetoacceptinformation.Atthesametime,thecomputerhasbeenasawidelyusedtoolforpeoplesproductionandlivingservices.Extractingtextfromimagebelongstothefrontierofintelligentinformationprocessing,anditisthecu

6、rrenthotresearchtopicinthefieldofartificialintelligenceandpatternrecognition.Asthetextwithhigh-levelsemanticfeatureandplaysanimportantroleonunderstanding,indexingandretrievalimagecontent.Therefore,thestudyonextractingtextsfromimageshaveimportantactualmeanings.Andbecauseextractingtextsfromstillimages

7、isthebasisforextractingtextsfromdynamicimages,thearticleemphaticallyintroducesthetechnologyofextractingtextsfromstillimages.KeyWords:MATLAB imageprocessing wordextraction wordrecognition 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing一引言隨著計算機科學(xué)的飛速發(fā)展，以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介，在圖像中，文字信息(如新聞標(biāo)題

8、等字幕) 包含了豐富的高層語義信息，提取出這些文字，對于圖像高層語義的理解、索引和檢索非常有幫助。圖像文字提取又分為動態(tài)圖像文字提取和靜態(tài)圖像文字提取兩種，其中，靜態(tài)圖像文字提取是動態(tài)圖像文字提取的基礎(chǔ)，其應(yīng)用范圍更為廣泛，對它的研究具有基礎(chǔ)性，色為單色, 相對與前者更易被檢測和提取，又因其對圖像內(nèi)容起到說明總結(jié)的作用,故適合用來做圖像的索引和檢索關(guān)鍵字。對圖像中場景文字的研究難度大，目前這方面的研究成果與文獻也不是很豐富，本文主要討論圖像中人工文字提取技術(shù)。（2）文字一般是單色的；（3）文字大小在一幅圖片中固定，并且寬度和高度大體相同，從滿足人眼視覺感受的角度來說，圖像中文字的尺寸既不會過大

9、也不會過?。唬?）文字的分布比較集中；（5）文字的排列一般為水平方向或垂直方向；（6）多行文字之間，以及單行內(nèi)各個字之間存在不同于文字區(qū)域的空隙。在靜態(tài)圖片文字的檢測與提取過程中, 一般情況下都是依據(jù)上述特征進行處理的。基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing靜態(tài)圖像文字提取一般分為以下步驟：文字區(qū)域檢測與定位、文字分割與文字提取、文字后處理。其流程如圖1所示。（圖1）在Matlab中調(diào)用i1=imread(字符.jpg)，可得到原始圖像，如圖2所示：（圖2）調(diào)用i2=rgb2gray(i1)，則得到了灰度圖像，如圖3

10、所示：（圖3）調(diào)用a=size(i1);b=size(i2);可得到：a=3,b=2 即三維圖像變成了二維灰度圖像0,i2 thresh=thresh); 其中thresh為門限，在0，255之間1,i2 thresh這里，i2_max=double(max(max(i2); %獲取亮度最大值i2_min=double(min(min(i2); %獲取亮度最小值thresh=round(i2_max-(i2_max-i2_min)/3);得到二值圖像，如圖4所示：基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing（圖4）把二值圖

11、像放大觀察，可看到離散的黑點對其采用腐蝕膨脹處理，得到處理后的圖像，如圖5所示（圖5）可見，腐蝕膨脹處理后的圖像質(zhì)量有了很大的改觀。橫向、縱向分別的腐蝕膨脹運算比橫向、縱向同時的腐蝕膨脹運算好上很多，圖6可看出差別：（圖6）對腐蝕膨脹后的圖像進行Y方向上的區(qū)域選定，限定區(qū)域后的圖像如圖7所示：掃描方法：中間往兩邊掃基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing（圖7）縱向掃描后的圖像與原圖像的對照，如圖8所示：（圖8）（圖9）縱向掃描后的圖像與原圖像的對照，如圖10所示：（圖10）調(diào)用i8=(iiXY=1)，使背景為黑色（0

12、），字符為白色（1），便于后期處理。背景交換后的圖像如圖11所示：基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing（圖11）(圖12）基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing（圖13）可以看到，字符寬度不一致調(diào)用以下代碼，將字符規(guī)格化，便于識別：forj=1:cnum得到規(guī)格化之后的字符如圖14所示：（圖14）調(diào)用以下代碼創(chuàng)建字符集：code=char(由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正，。);將創(chuàng)建的字符集保存在一個文件夾里面，

13、以供匹配時候調(diào)用，如圖15所示：基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing（圖15）字符匹配采用模板匹配算法：將現(xiàn)有字符逐個與模板字符相減，認(rèn)為相減誤差最小的現(xiàn)有字符與該模板字符匹配。1 0 0 11 0 0 1假設(shè):字符，模板字符，模板字符TA =T =21sum(sum(abs(A- )= 8,sum(sum(abs(A- )= 2T1T2也就是說，字符A與模板字符T 更相似，我們可以認(rèn)為字符集中的字符T 就是字符A。12經(jīng)模板匹配，可得字符信息如下：效果如圖16所示：（圖16）調(diào)用以下代碼，將字符放入newtxt.

14、txt文本：基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingc=fopen(new,a+);fprintf(c,%sn,Code(1:cnum);fclose(c);newtxt.txt文本內(nèi)容如圖17所示：（圖17）算法具有局限性。對于左右結(jié)構(gòu)的字符（如：川）容易造成誤識別，“川”字將會被識別成三部分。當(dāng)圖片中文字有一定傾斜角度時，這將造成識別困難。模板匹配效率低。對于處理大小為mm的字符，假設(shè)有n個模板字符，則識別一個字符至少需要mmn2次運算，由于漢字有近萬個，這將使得運算量十分巨大！此次字符識別一共花了2.838秒。1

15、樊昀，王潤生.從圖像中提取文字J .國防科技大學(xué)學(xué)報,2002,24 (1) :59-62.2 王健,王晨.基于靜態(tài)圖片的文本提取技術(shù)的研究J .延邊大學(xué)學(xué)報(自然科學(xué)版) , 2007,33(2) :124-128.3 夏瑩,馬少平,孫茂松等計算機語言學(xué)方法在中文文字識別后處理中的應(yīng)用J .中文信息,1996,(2) :50-51. 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing%圖片中文字的提取及識別%tici_max=double(max(max(I); %獲取亮度最大值I=(I=thresh); %I為二值圖像%

16、figure(3);imshow(I);title(二值圖像,color,b);I=imdilate(I,seX);I=imerode(I,seX);%figure(4);imshow(I);title(腐蝕膨脹后的圖像,color,b);ii=double(I);m,n=size(ii); %獲取圖像大小信息%確定文字區(qū)域%縱向掃描countY=zeros(m,1);fori=1:mforj=1:nifii(i,j)=0 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingendendendendtempY2=indexY;end

17、tempY1=tempY1-1;tempY2=tempY2+1;%橫向掃描countX=zeros(1,n);forj=1:ncountX(1,j)=countX(1,j)+1;endtempX1=1;while(countX(1,tempX2)1)tempX1=tempX1-1;%figure(6);imshow(iiXY);title(X、Y方向區(qū)域都大致確定后的圖像,color,b);ii=(iiXY=1);%黑色背景，白色字體%figure(7);imshow(ii);title(背景和文字交換顏色的圖像,color,b);ii=bwareaopen(ii,200); %刪除面積小于2

18、00的雜質(zhì)圖像11 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingy1=10;y2=0.25;flag=0;figure(10)whilesize(myI,2)10 %當(dāng)myI的長度小等于10，可確定沒有字符了wordk,myI=getword(myI); %獲取字符k=k+1;ifk=2subplot(5,1,1);imshow(myI);title(第一次切割后的圖像,color,b);endifk=3subplot(5,1,2);imshow(myI);title(第二次切割后的圖像,color,b);endifk=5s

19、ubplot(5,1,3);imshow(myI);title(第四次切割后的圖像,color,b);endifk=16subplot(5,1,4);imshow(myI);title(第十五次切割后的圖像,color,b);subplot(5,1,5);imshow(myI);title(最后一次切割后的圖像,color,b);%cnum=k-1; %實際字符總個數(shù)%forj=1:cnum 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingwordj=imresize(wordj,4040); %字符規(guī)格化成4040的endfi

20、gure(12);forj=1:cnumsubplot(5,8,j),imshow(wordj),title(int2str(j); %顯示字符endforj=1:cnumimwrite(wordj,int2str(j),.jpg); %保存字符enddefx=40;defy=40;code=char(由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正，。);%創(chuàng)建字符集codenum=size(code,2); %獲取字符集中字符個數(shù)fori=1:cnumch=int2str(i); %數(shù)字轉(zhuǎn)化為字符tempbw=imread(ch.jpg); %打開預(yù)匹配字符fork=1:codenumfname=strcat(C:UsersAdministratorDesktop 數(shù)字圖像處理大作業(yè)字符匹配庫,code(k),.jpg);%字符匹配庫中的字符sample=imread(fname);subsam=abs(tempbw-sample); %作比較count=sum(sum(subsam); %匹配誤差統(tǒng)計err(k)=count;enderro=err(1:codenum);minerror=min(erro); %找出

人人文庫> 全部分類> 教育資料 > 畢業(yè)論文

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于MATLAB的圖片中文字的提取及識別要點

文檔簡介

溫馨提示

最新文檔

評論

基于MATLAB的圖片中文字的提取及識別要點

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔