版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 | HYPERLINK / 百度首頁 HYPERLINK /v2/?login 登錄 HYPERLINK /cashier/browse/vipcashier?dqStatCode=topnav_joinvip&cashier_code=topnav_joinvip VIP意見反饋 HYPERLINK /apps?fr=1011 下載客戶端基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字 HYPERLINK /?fr=logo 圖象處理DigitalImageProgressing HYPERLINK javascript:void(0); 頻道專區(qū) HYPERLINK java
2、script:void(0); 分類 HYPERLINK javascript:void(0); 精品內(nèi)容 HYPERLINK /wenkuverify?from=1 申請認(rèn)證 HYPERLINK javascript:void(0); 機構(gòu)合作 HYPERLINK /xtopic/wkback 百度智慧課堂 HYPERLINK /user/browse/vip/ 百度教育VIP HYPERLINK /?fr=crumbs 百度文庫 HYPERLINK /?fr=crumbs HYPERLINK /edu/index 教育專區(qū) HYPERLINK /edu/index HYPERLINK /l
3、ist/629 職業(yè)教育 HYPERLINK /list/629 HYPERLINK /list/646 其它鄒浩,余龍,鄒勇博,劉宇童,和振喬,李少梅(西安電子科技大學(xué) 電子工程學(xué)院,西安,710126)隨著現(xiàn)代社會的發(fā)展,信息的形式和數(shù)量正在迅猛增長。其中很大一部分是圖像,圖像可以把事物生動地呈現(xiàn)在我們面前,讓我們更直觀地接受信息。同時,計算機已經(jīng)作為一種人們普遍使用的工具為人們的生產(chǎn)生活服務(wù)。從圖像中提取文字屬于信息智能化處理的前沿課題,是當(dāng)前人工智能與模式識別領(lǐng)域中的研究熱點。由于文字具有高級語義特征,對圖片內(nèi)容的理解、索引、檢索具有重要作用,因此,研究圖片文字提取具有重要的實際意義。
4、又由于靜態(tài)圖像文字提取是動態(tài)圖像文字提取的基礎(chǔ),故著重介紹了靜態(tài)圖像文字提取技術(shù)。MATLAB 圖像處理 文字提取 文字識別TextExtractionandRecognitioninImagesBasedonMATLABZOUHao,YUlong,ZOUYongbo,LIUYutong,HEZhenqiao,LIShaomei(XidianUniversity ElectronicEngineeringCollege,Xian,710126)AbstractWiththedevelopmentofsociety,the formandquantityofimformationareincre
5、asingquickly.Alargepartofthemareimages,whichcanmakethingsvividlypresentedinfrontofus,letusmoreintuitivetoacceptinformation.Atthesametime,thecomputerhasbeenasawidelyusedtoolforpeoplesproductionandlivingservices.Extractingtextfromimagebelongstothefrontierofintelligentinformationprocessing,anditisthecu
6、rrenthotresearchtopicinthefieldofartificialintelligenceandpatternrecognition.Asthetextwithhigh-levelsemanticfeatureandplaysanimportantroleonunderstanding,indexingandretrievalimagecontent.Therefore,thestudyonextractingtextsfromimageshaveimportantactualmeanings.Andbecauseextractingtextsfromstillimages
7、isthebasisforextractingtextsfromdynamicimages,thearticleemphaticallyintroducesthetechnologyofextractingtextsfromstillimages.KeyWords:MATLAB imageprocessing wordextraction wordrecognition 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing一引言隨著計算機科學(xué)的飛速發(fā)展,以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介,在圖像中,文字信息(如新聞標(biāo)題
8、等字幕) 包含了豐富的高層語義信息,提取出這些文字,對于圖像高層語義的理解、索引和檢索非常有幫助。圖像文字提取又分為動態(tài)圖像文字提取和靜態(tài)圖像文字提取兩種,其中,靜態(tài)圖像文字提取是動態(tài)圖像文字提取的基礎(chǔ),其應(yīng)用范圍更為廣泛,對它的研究具有基礎(chǔ)性,色為單色, 相對與前者更易被檢測和提取,又因其對圖像內(nèi)容起到說明總結(jié)的作用,故適合用來做圖像的索引和檢索關(guān)鍵字。對圖像中場景文字的研究難度大,目前這方面的研究成果與文獻(xiàn)也不是很豐富,本文主要討論圖像中人工文字提取技術(shù)。(2)文字一般是單色的;(3)文字大小在一幅圖片中固定,并且寬度和高度大體相同,從滿足人眼視覺感受的角度來說,圖像中文字的尺寸既不會過大
9、也不會過??;(4)文字的分布比較集中;(5)文字的排列一般為水平方向或垂直方向;(6)多行文字之間,以及單行內(nèi)各個字之間存在不同于文字區(qū)域的空隙。在靜態(tài)圖片文字的檢測與提取過程中, 一般情況下都是依據(jù)上述特征進(jìn)行處理的。 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing靜態(tài)圖像文字提取一般分為以下步驟:文字區(qū)域檢測與定位、文字分割與文字提取、文字后處理。其流程如圖1所示。(圖1)在Matlab中調(diào)用i1=imread(字符.jpg),可得到原始圖像,如圖2所示:(圖2)調(diào)用i2=rgb2gray(i1),則得到了灰度圖像,如圖3
10、所示:(圖3)調(diào)用a=size(i1);b=size(i2);可得到:a=3,b=2 即三維圖像變成了二維灰度圖像0,i2 thresh=thresh); 其中thresh為門限,在0,255之間1,i2 thresh這里,i2_max=double(max(max(i2); %獲取亮度最大值i2_min=double(min(min(i2); %獲取亮度最小值thresh=round(i2_max-(i2_max-i2_min)/3);得到二值圖像,如圖4所示: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖4)把二值圖
11、像放大觀察,可看到離散的黑點對其采用腐蝕膨脹處理,得到處理后的圖像,如圖5所示(圖5)可見,腐蝕膨脹處理后的圖像質(zhì)量有了很大的改觀。橫向、縱向分別的腐蝕膨脹運算比橫向、縱向同時的腐蝕膨脹運算好上很多,圖6可看出差別:(圖6)對腐蝕膨脹后的圖像進(jìn)行Y方向上的區(qū)域選定,限定區(qū)域后的圖像如圖7所示:掃描方法:中間往兩邊掃 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖7)縱向掃描后的圖像與原圖像的對照,如圖8所示:(圖8)(圖9)縱向掃描后的圖像與原圖像的對照,如圖10所示:(圖10)調(diào)用i8=(iiXY=1),使背景為黑色(0
12、),字符為白色(1),便于后期處理。背景交換后的圖像如圖11所示: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖11)(圖12) 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖13)可以看到,字符寬度不一致調(diào)用以下代碼,將字符規(guī)格化,便于識別:forj=1:cnum得到規(guī)格化之后的字符如圖14所示:(圖14)調(diào)用以下代碼創(chuàng)建字符集:code=char(由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正,。);將創(chuàng)建的字符集保存在一個文件夾里面,
13、以供匹配時候調(diào)用,如圖15所示: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing(圖15)字符匹配采用模板匹配算法:將現(xiàn)有字符逐個與模板字符相減,認(rèn)為相減誤差最小的現(xiàn)有字符與該模板字符匹配。1 0 0 11 0 0 1假設(shè):字符,模板字符,模板字符TA =T =21sum(sum(abs(A- )= 8,sum(sum(abs(A- )= 2T1T2也就是說,字符A與模板字符T 更相似,我們可以認(rèn)為字符集中的字符T 就是字符A。12經(jīng)模板匹配,可得字符信息如下:效果如圖16所示:(圖16)調(diào)用以下代碼,將字符放入newtxt.
14、txt文本: 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingc=fopen(new,a+);fprintf(c,%sn,Code(1:cnum);fclose(c);newtxt.txt文本內(nèi)容如圖17所示:(圖17)算法具有局限性。對于左右結(jié)構(gòu)的字符(如:川)容易造成誤識別,“川”字將會被識別成三部分。當(dāng)圖片中文字有一定傾斜角度時,這將造成識別困難。模板匹配效率低。對于處理大小為mm的字符,假設(shè)有n個模板字符,則識別一個字符至少需要mmn2次運算,由于漢字有近萬個,這將使得運算量十分巨大!此次字符識別一共花了2.838秒。1
15、 樊昀, 王潤生.從圖像中提取文字J .國防科技大學(xué)學(xué)報,2002,24 (1) :59-62.2 王健,王晨.基于靜態(tài)圖片的文本提取技術(shù)的研究J .延邊大學(xué)學(xué)報(自然科學(xué)版) , 2007,33(2) :124-128.3 夏瑩,馬少平,孫茂松等 計算機語言學(xué)方法在中文文字識別后處理中的應(yīng)用J .中文信息,1996,(2) :50-51. 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressing%圖片中文字的提取及識別%tici_max=double(max(max(I); %獲取亮度最大值I=(I=thresh); %I為二值圖像%
16、figure(3);imshow(I);title(二值圖像,color,b);I=imdilate(I,seX);I=imerode(I,seX);%figure(4);imshow(I);title(腐蝕膨脹后的圖像,color,b);ii=double(I);m,n=size(ii); %獲取圖像大小信息%確定文字區(qū)域%縱向掃描countY=zeros(m,1);fori=1:mforj=1:nifii(i,j)=0 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingendendendendtempY2=indexY;end
17、tempY1=tempY1-1;tempY2=tempY2+1;%橫向掃描countX=zeros(1,n);forj=1:ncountX(1,j)=countX(1,j)+1;endtempX1=1;while(countX(1,tempX2)1)tempX1=tempX1-1;%figure(6);imshow(iiXY);title(X、Y方向區(qū)域都大致確定后的圖像,color,b);ii=(iiXY=1);%黑色背景,白色字體%figure(7);imshow(ii);title(背景和文字交換顏色的圖像,color,b);ii=bwareaopen(ii,200); %刪除面積小于2
18、00的雜質(zhì)圖像11 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingy1=10;y2=0.25;flag=0;figure(10)whilesize(myI,2)10 %當(dāng)myI的長度小等于10,可確定沒有字符了wordk,myI=getword(myI); %獲取字符k=k+1;ifk=2subplot(5,1,1);imshow(myI);title(第一次切割后的圖像,color,b);endifk=3subplot(5,1,2);imshow(myI);title(第二次切割后的圖像,color,b);endifk=5s
19、ubplot(5,1,3);imshow(myI);title(第四次切割后的圖像,color,b);endifk=16subplot(5,1,4);imshow(myI);title(第十五次切割后的圖像,color,b);subplot(5,1,5);imshow(myI);title(最后一次切割后的圖像,color,b);%cnum=k-1; %實際字符總個數(shù)%forj=1:cnum 基于MATLAB的圖片中文字的提取及識別要點- 百度文庫數(shù)字圖象處理DigitalImageProgressingwordj=imresize(wordj,4040); %字符規(guī)格化成4040的endfi
20、gure(12);forj=1:cnumsubplot(5,8,j),imshow(wordj),title(int2str(j); %顯示字符endforj=1:cnumimwrite(wordj,int2str(j),.jpg); %保存字符enddefx=40;defy=40;code=char(由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正,。);%創(chuàng)建字符集codenum=size(code,2); %獲取字符集中字符個數(shù)fori=1:cnumch=int2str(i); %數(shù)字轉(zhuǎn)化為字符tempbw=imread(ch.jpg); %打開預(yù)匹配字符fork=1:codenumfname=strcat(C:UsersAdministratorDesktop 數(shù)字圖像處理大作業(yè)字符匹配庫,code(k),.jpg);%字符匹配庫中的字符sample=imread(fname);subsam=abs(tempbw-sample); %作比較count=sum(sum(subsam); %匹配誤差統(tǒng)計err(k)=count;enderro=err(1:codenum);minerror=min(erro); %找出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【講練通】2021版高中歷史岳麓版必修1-單元質(zhì)量評估(三)
- 六年級上冊數(shù)學(xué)教研組工作計劃范文評價
- 【學(xué)練考】2021-2022蘇教版化學(xué)必修1練習(xí)-專題3-從礦物到基礎(chǔ)材料
- 三年級數(shù)學(xué)(上)計算題專項練習(xí)附答案
- 五年級數(shù)學(xué)(小數(shù)乘除法)計算題專項練習(xí)及答案匯編
- 全程方略2021屆高考數(shù)學(xué)專項精析精煉:2014年考點48-隨機事件的概率、古典概型、幾何概型
- 家長進(jìn)課堂小學(xué)生食品安演示教學(xué)
- 增塑劑聚酯薄膜行業(yè)分析
- 2018-2019學(xué)年高中生物-第三章-遺傳的分子基礎(chǔ)本章知識體系構(gòu)建課件-浙科版必修2
- (期末押題卷)期末重難點高頻易錯培優(yōu)卷(試題)-2024-2025學(xué)年四年級上冊數(shù)學(xué)人教版
- 2024年度物流園區(qū)運營承包合同范本3篇
- 第五單元第四節(jié) 全球發(fā)展與合作 教學(xué)實錄-2024-2025學(xué)年粵人版地理七年級上冊
- 貴州省部分學(xué)校2024-2025學(xué)年高三年級上冊10月聯(lián)考 化學(xué)試卷
- 期末綜合試卷(試題)2024-2025學(xué)年人教版數(shù)學(xué)五年級上冊(含答案)
- 2024-2025學(xué)年上學(xué)期武漢小學(xué)語文六年級期末模擬試卷
- 《爭做文明班級》課件
- 遼寧省大連市沙河口區(qū)2022-2023學(xué)年八年級上學(xué)期物理期末試卷(含答案)
- 2024年新能源汽車概論考試題庫
- 2024年醫(yī)師定期考核臨床類人文醫(yī)學(xué)知識考試題庫及答案(共280題)
- 江蘇省南通市2024屆高三上學(xué)期第一次調(diào)研測試(一模)生物 含答案
- 2024年公司年終工作會議講話稿(4篇)
評論
0/150
提交評論