版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院畢業(yè)論文課題名稱(chēng):手寫(xiě)體數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)學(xué)生姓名:學(xué)號(hào):學(xué)院:信息科學(xué)與技術(shù)學(xué)院專(zhuān)業(yè)年級(jí):電子信息工程2007級(jí)指導(dǎo)教師:職稱(chēng):完成日期:二○一一年六月十一日手寫(xiě)體數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)學(xué)生:指導(dǎo)教師:[摘要]隨著科學(xué)技術(shù)的迅速發(fā)展,在郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)等處理大量字符信息錄入的場(chǎng)合,手寫(xiě)數(shù)字識(shí)別系統(tǒng)的應(yīng)用需求越來(lái)越強(qiáng)烈,如何將數(shù)字方便、快速地輸入到計(jì)算機(jī)中已成為關(guān)系到計(jì)算機(jī)技術(shù)普及的關(guān)鍵問(wèn)題。本文設(shè)計(jì)實(shí)現(xiàn)了一個(gè)基于Matlab軟件的手寫(xiě)體數(shù)字識(shí)別系統(tǒng),采用模塊化設(shè)計(jì)方法,編寫(xiě)了攝像頭輸入、直接讀取圖片、寫(xiě)字板輸入三個(gè)模塊,利用攝像頭等工具,將以文本形式存在的手寫(xiě)體數(shù)字輸入進(jìn)計(jì)算機(jī),完成對(duì)手寫(xiě)體數(shù)字圖片的采集,并設(shè)計(jì)了一種手寫(xiě)數(shù)字識(shí)別方法,對(duì)手寫(xiě)體數(shù)字圖像進(jìn)行預(yù)處理、結(jié)構(gòu)特征提取、分類(lèi)識(shí)別,最終以文本形式輸出數(shù)字,從而實(shí)現(xiàn)手寫(xiě)體數(shù)字的識(shí)別。[關(guān)鍵詞]預(yù)處理,結(jié)構(gòu)特征提取,分類(lèi)識(shí)別,手寫(xiě)體數(shù)字識(shí)別HandwrittenDigitRecognitionSystemStudents:Teacher:Abstract:Withtherapiddevelopmentofscienceandtechnology,inzipcode,statistics,reports,financialstatements,Bankbillsdealingwithalargenumberofcharacters,suchasinformationrecordedoccasions,handwrittendigitrecognitionsystemofrequirementhasbecomestrongerandstronger,howeasilyandquicklythenumberenteredinthecomputerhasbecomeakeyissuerelatestothepopularizationofcomputertechnology.ThisarticledesignimplementationhasabasedonMatlabsoftwareofhandwritingbodydigitalrecognitionsystem,usedmoduleofdesignmethod,writehascameraentered,anddirectlyreadpictures,andwriteBoardenteredthreeamodule,usingcamera,tools,willtotextformexistsofhandwritingbodydigitalenteredintocomputer,completedonhandwritingbodydigitalpicturesofcollection,anddesignhasahandwritingdigitalrecognitionmethod,onhandwritingbodydigitalimageforpretreatment,andstructurefeaturesextraction,andclassificationrecognition,eventuallytotextformoutputdigital,toimplementationhandwritingbodydigitalofrecognition.Keywords:Pretreatment,structurefeatureextraction,classificationandrecognition,handwrittendigitrecognition.目錄TOC\o"1-4"\h\z\u第一章引言 11.1課題背景 11.2課題研究目的及意義 11.2.1手寫(xiě)體數(shù)字識(shí)別的研究目的 11.2.2手寫(xiě)體數(shù)字識(shí)別的研究意義 21.3課題研究現(xiàn)狀及發(fā)展趨勢(shì) 21.4課題整體結(jié)構(gòu) 31.5課題難點(diǎn)分析 4第二章開(kāi)發(fā)運(yùn)行環(huán)境 52.1系統(tǒng)開(kāi)發(fā)環(huán)境和運(yùn)行環(huán)境 52.2開(kāi)發(fā)工具介紹 52.2.1硬件部分介紹 52.2.2軟件部分介紹 6第三章手寫(xiě)體數(shù)字識(shí)別系統(tǒng)構(gòu)成及原理 83.1圖像處理基礎(chǔ)知識(shí) 83.2手寫(xiě)體數(shù)字識(shí)別系統(tǒng)構(gòu)成 103.3手寫(xiě)體數(shù)字識(shí)別系統(tǒng)原理 103.3.1預(yù)處理 103.3.2圖像分割 143.3.3特征提取 143.3.4分類(lèi)識(shí)別 15第四章手寫(xiě)體數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)分析 164.1程序主界面 164.2基準(zhǔn)庫(kù)的選擇與建立 184.3手寫(xiě)體數(shù)字識(shí)別系統(tǒng)設(shè)計(jì) 194.3.1攝像頭輸入模塊的設(shè)計(jì) 194.3.2直接讀圖模塊的設(shè)計(jì) 204.3.3寫(xiě)字板輸入模塊的設(shè)計(jì) 22第五章系統(tǒng)性能評(píng)價(jià)及實(shí)驗(yàn)結(jié)果分析 255.1識(shí)別系統(tǒng)性能的評(píng)價(jià) 255.2實(shí)驗(yàn)結(jié)果分析 25第六章結(jié)論 276.1畢業(yè)設(shè)計(jì)總結(jié) 276.2課題前景與展望 27致謝 29參考文獻(xiàn) 30附錄 31附1、識(shí)別部分主程序 31附2、創(chuàng)建模板部分函數(shù) 32附3、切割圖片部分函數(shù) 33附4、輸出圖片部分函數(shù) 34第一章引言1.1課題背景數(shù)字已有數(shù)千年的歷史,在世界上使用很廣,然而,在當(dāng)今社會(huì)里,如何快速高效地將數(shù)字輸入計(jì)算機(jī),已成為影響人機(jī)接口效率的一個(gè)重要瓶頸,也關(guān)系到計(jì)算機(jī)能否真正在我國(guó)得到普及應(yīng)用[1]。手寫(xiě)數(shù)字識(shí)別是光學(xué)字符識(shí)別技術(shù)(OpticalCharacterRecognition,簡(jiǎn)稱(chēng)OCR)的一個(gè)分支,它研究的對(duì)象是:如何利用電子計(jì)算機(jī)自動(dòng)辨認(rèn)人手寫(xiě)在紙張上的阿拉伯?dāng)?shù)字。在整個(gè)OCR領(lǐng)域中,最為困難的就是脫機(jī)手寫(xiě)字符的識(shí)別。到目前為止,盡管人們?cè)诿摍C(jī)手寫(xiě)英文、漢字識(shí)別的研究中已取得很多可喜成就,但距實(shí)用還有一定距離。而在手寫(xiě)數(shù)字識(shí)別這個(gè)方向上,經(jīng)過(guò)多年研究,研究工作者已經(jīng)開(kāi)始把它向各種實(shí)際應(yīng)用推廣,為手寫(xiě)數(shù)據(jù)的高速自動(dòng)輸入提供了一種解決方案[2]。字符識(shí)別處理的信息可分為兩大類(lèi):一類(lèi)是文字信息,處理的主要是用各國(guó)家、各民族的文字(如:漢字,英文等)書(shū)寫(xiě)或印刷的文本信息,目前在印刷體和聯(lián)機(jī)手寫(xiě)方面技術(shù)已趨向成熟,并且推出了很多應(yīng)用系統(tǒng);另一類(lèi)是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù),如:郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)等等,處理這類(lèi)信息的核心技術(shù)是手寫(xiě)數(shù)字識(shí)別。這幾年來(lái)我國(guó)開(kāi)始大力推廣的“三金”工程在很大程度上要依賴(lài)數(shù)據(jù)信息的輸入,如果能通過(guò)手寫(xiě)數(shù)字識(shí)別技術(shù)實(shí)現(xiàn)信息的自動(dòng)錄入,無(wú)疑會(huì)促進(jìn)這一事業(yè)的進(jìn)展。因此,手寫(xiě)數(shù)字的識(shí)別研究有著重大的現(xiàn)實(shí)意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益[3]。1.2課題研究目的及意義1.2.1手寫(xiě)體數(shù)字識(shí)別的研究目的手寫(xiě)數(shù)字識(shí)別在學(xué)科上屬于模式識(shí)別和人工智能的范疇。在過(guò)去的四十年中,人們想出了很多辦法獲取手寫(xiě)字符的關(guān)鍵特征。這些手段分兩大類(lèi):全局分析和結(jié)構(gòu)分析。對(duì)前者,我們可以使用模板匹配、象素密度、矩、特征點(diǎn)、數(shù)學(xué)變換等技術(shù)。對(duì)后者,多半需要從字符的輪廓或骨架上提取字符形狀的基本特征,包括:圈、端點(diǎn)、節(jié)點(diǎn)、弧、突起、凹陷、筆畫(huà)等[4]。多年的研究實(shí)踐表明,對(duì)于完全沒(méi)有限制的手寫(xiě)數(shù)字,幾乎可以肯定:沒(méi)有一種簡(jiǎn)單的方案能達(dá)到很高的識(shí)別率和識(shí)別精度。因此,最近這方面的努力向著更為成熟、復(fù)雜、綜合的方向發(fā)展。本課題通過(guò)對(duì)手寫(xiě)體數(shù)字識(shí)別系統(tǒng)的研究,介紹了一種手寫(xiě)數(shù)字識(shí)別核心算法。即基于數(shù)字的結(jié)構(gòu),利用模板匹配、象素密度、矩、特征點(diǎn)、數(shù)學(xué)變換等技術(shù)獲取手寫(xiě)體數(shù)字的關(guān)鍵特征,提出一種具體識(shí)別數(shù)字的方法,利用我們所掌握的電子信息工程的專(zhuān)業(yè)知識(shí)來(lái)實(shí)現(xiàn),進(jìn)而完成手寫(xiě)體數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)。1.2.2手寫(xiě)體數(shù)字識(shí)別的研究意義手寫(xiě)數(shù)字識(shí)別研究?jī)r(jià)值意義在于自然人機(jī)交互領(lǐng)域,提高人機(jī)交互的自然性和友好性。在于數(shù)字信息自動(dòng)處理領(lǐng)域,節(jié)省人力,提高效率,加快信息流動(dòng),創(chuàng)造巨大的經(jīng)濟(jì)效益[5]。手寫(xiě)數(shù)字識(shí)別的理論價(jià)值如下[6]:(1)阿拉伯?dāng)?shù)字是唯一的被世界各國(guó)通用的符號(hào),對(duì)手寫(xiě)數(shù)字識(shí)別的研究基本上與文化背景無(wú)關(guān),這樣就為各國(guó),各地區(qū)的研究工作者提供了一個(gè)施展才智的大舞臺(tái)。在這一領(lǐng)域大家可以探討,比較各種研究方法。(2)由于數(shù)字識(shí)別的類(lèi)別數(shù)較小,有助于做深入分析及驗(yàn)證一些新的理論。(3)盡管人們對(duì)手寫(xiě)數(shù)字的識(shí)別已從事了很長(zhǎng)時(shí)間的研究,并已取得了很多成果,但到目前為止機(jī)器的識(shí)別本領(lǐng)還無(wú)法與人的認(rèn)知能力相比,這仍是一個(gè)有難度的開(kāi)放問(wèn)題。(4)手寫(xiě)數(shù)字的識(shí)別方法很容易推廣到其它一些相關(guān)問(wèn)題,一個(gè)直接的應(yīng)用是對(duì)英文這樣的拼音文字的識(shí)別。事實(shí)上,很多學(xué)者就是把數(shù)字和英文字母的識(shí)別放在一塊兒研究的。1.3課題研究現(xiàn)狀及發(fā)展趨勢(shì)手寫(xiě)數(shù)字識(shí)別有著重要的價(jià)值,IBM、HP、日立、東芝、夏普、NEC、理光和新加坡熱卡公司等國(guó)外公司都曾巨額投入手寫(xiě)數(shù)字識(shí)別領(lǐng)域。而隨著國(guó)家信息化進(jìn)程的加速,手寫(xiě)數(shù)字識(shí)別的應(yīng)用需求越來(lái)越廣泛,應(yīng)用系統(tǒng)的性能的關(guān)鍵與瓶頸在于手寫(xiě)數(shù)字識(shí)別核心算法性能上,最終目標(biāo)是研究零誤識(shí)率和低拒識(shí)率的高速識(shí)別算法。此外,盡早建立反映中國(guó)人書(shū)寫(xiě)習(xí)慣的、具有國(guó)家標(biāo)準(zhǔn)性質(zhì)的手寫(xiě)數(shù)字樣本庫(kù)也是當(dāng)務(wù)之急。在大規(guī)模的數(shù)據(jù)統(tǒng)計(jì)(如:行業(yè)年檢、人口普查等)中,需要輸入大量的數(shù)據(jù),以前完全要手工輸入,需耗費(fèi)大量的人力和物力。近年來(lái)在這類(lèi)工作中采用手寫(xiě)識(shí)別技術(shù)已成為一種趨勢(shì)。因?yàn)閿?shù)據(jù)的錄入是集中組織的,所以往往可以通過(guò)專(zhuān)門(mén)設(shè)計(jì)表格和對(duì)書(shū)寫(xiě)施加限制以便于機(jī)器的自動(dòng)識(shí)別。目前國(guó)內(nèi)的大多數(shù)實(shí)用系統(tǒng)都要求用戶(hù)按指定規(guī)范在方格內(nèi)填寫(xiě)。另外,這些系統(tǒng)往往采用合適的用戶(hù)界面對(duì)識(shí)別結(jié)果做全面的檢查,最終保證結(jié)果正確無(wú)誤??梢钥闯?,這種應(yīng)用對(duì)識(shí)別核心算法的要求比較低,是目前國(guó)內(nèi)很多單位應(yīng)用開(kāi)發(fā)的熱點(diǎn)[7]。財(cái)務(wù)、稅務(wù)、金融是手寫(xiě)數(shù)字識(shí)別大有可為的又一領(lǐng)域。隨著我國(guó)經(jīng)濟(jì)的迅速發(fā)展,每天等待處理的財(cái)務(wù)、稅務(wù)報(bào)表、支票、付款單等越來(lái)越多。如果能把它們用計(jì)算機(jī)自動(dòng)處理,無(wú)疑可以節(jié)約大量的時(shí)間、金錢(qián)和勞力。與上面提到的統(tǒng)計(jì)報(bào)表處理相比,在這個(gè)領(lǐng)域的應(yīng)用難度更大,因?yàn)閷?duì)識(shí)別的精度要求更高,處理的表格種類(lèi)更多等,這樣對(duì)識(shí)別及預(yù)處理的核心算法要求也提高了。手寫(xiě)數(shù)字識(shí)別在郵件分揀中的應(yīng)用也十分廣泛,隨著人們生活水平的提高,經(jīng)濟(jì)活動(dòng)的發(fā)展,通信聯(lián)系的需求使信函的互換量大幅度增加,我國(guó)函件業(yè)務(wù)量也在不斷增長(zhǎng),一些大城市的中心郵局每天處理量將高達(dá)上千萬(wàn)件,業(yè)務(wù)量的急劇上升使得郵件的分揀自動(dòng)化成為大勢(shì)所趨。在郵件的自動(dòng)分揀中,手寫(xiě)數(shù)字識(shí)別往往與光學(xué)條碼識(shí)別(OBROpticalBarReading),人工輔助識(shí)別等手段相結(jié)合,完成郵政編碼的閱讀。這就需要分揀機(jī)有一定的性能指標(biāo),差錯(cuò)率要越小越好。1.4課題整體結(jié)構(gòu)我們的思路是利用Matlab軟件建立一個(gè)手寫(xiě)體數(shù)字識(shí)別系統(tǒng),利用三種方法實(shí)現(xiàn)圖像輸入的功能,然后對(duì)輸入的圖像進(jìn)行預(yù)處理,分割,結(jié)構(gòu)特征提取,分類(lèi)識(shí)別等操作,最終識(shí)別出圖像上的數(shù)字,如圖1-1。圖1-1識(shí)別的基本思路框架圖1.5課題難點(diǎn)分析數(shù)字的類(lèi)別只有十種,筆劃又簡(jiǎn)單,其識(shí)別問(wèn)題似乎不是很困難。但事實(shí)上,一些測(cè)試結(jié)果表明,數(shù)字的正確識(shí)別率并不如印刷體漢字識(shí)別正確率高,甚至也不如聯(lián)機(jī)手寫(xiě)體漢字識(shí)別率高,而只僅僅優(yōu)于脫機(jī)手寫(xiě)體漢字識(shí)別。這其中主要原因是:數(shù)字的字形信息量很小,不同數(shù)字寫(xiě)法相近,字形相差不大,使得準(zhǔn)確區(qū)分某些數(shù)字相當(dāng)困難;第二,數(shù)字雖然只有十種,而且筆劃簡(jiǎn)單,但同一數(shù)字寫(xiě)法千差萬(wàn)別,全世界各個(gè)國(guó)家各個(gè)地區(qū)的人都用,其書(shū)寫(xiě)上帶有明顯的區(qū)域特性,很難完全做到兼顧世界各種寫(xiě)法的極高識(shí)別率的通用性數(shù)字識(shí)別系統(tǒng)。另外,在實(shí)際應(yīng)用中,對(duì)數(shù)字識(shí)別單字識(shí)別正確率的要求要比文字要苛刻得多。這是因?yàn)?,?shù)字沒(méi)有上下文關(guān)系,每個(gè)單字的識(shí)別都事關(guān)重要,而且數(shù)字識(shí)別經(jīng)常涉及的財(cái)會(huì)、金融領(lǐng)域其嚴(yán)格性更是不言而喻的。因此,用戶(hù)的要求不是單純的高正確率,更重要的是極低的、千分之一甚至萬(wàn)分之一以下的誤識(shí)率。此外,大批量數(shù)據(jù)處理對(duì)系統(tǒng)速度又有相當(dāng)?shù)囊螅S多理論上很完美但速度過(guò)低的方法是行不通的。因此,研究高性能的手寫(xiě)數(shù)字識(shí)別算法是一個(gè)有相當(dāng)?shù)奶魬?zhàn)性的任務(wù)[8]。第二章開(kāi)發(fā)運(yùn)行環(huán)境2.1系統(tǒng)開(kāi)發(fā)環(huán)境和運(yùn)行環(huán)境硬件環(huán)境:計(jì)算機(jī)一臺(tái)。攝像頭一個(gè)。軟件環(huán)境:(1)WindowsXP操作系統(tǒng)。(2)Matlab軟件。2.2開(kāi)發(fā)工具介紹2.2.1硬件部分介紹本課題中,我們所用到的硬件有攝像頭,攝像頭(CAMERA)又稱(chēng)為電腦相機(jī),電腦眼等,是一種視頻輸入設(shè)備,被廣泛的運(yùn)用于視頻會(huì)議,遠(yuǎn)程醫(yī)療及實(shí)時(shí)監(jiān)控等方面。普通人也可以彼此通過(guò)攝像頭在網(wǎng)絡(luò)進(jìn)行有影像、有聲音的交談和溝通。另外,人們還可以將其用于當(dāng)前各種流行的數(shù)碼影像,影音處理[9]。在本實(shí)驗(yàn)中,我們主要用它來(lái)進(jìn)行手寫(xiě)體數(shù)字圖像的輸入,即圖像的采集部分。攝像頭分為模擬攝像頭和數(shù)字?jǐn)z像頭兩大類(lèi)。模擬攝像頭捕捉到的視頻信號(hào)必須經(jīng)過(guò)特定的視頻捕捉卡將模擬信號(hào)轉(zhuǎn)換成數(shù)字模式,并加以壓縮后才可以轉(zhuǎn)換到計(jì)算機(jī)上運(yùn)用。數(shù)字?jǐn)z像頭則可以直接捕捉影像,然后通過(guò)串、并口或者USB接口傳到計(jì)算機(jī)里。由于個(gè)人電腦的迅速普及,模擬攝像頭的整體成本較高等原因,現(xiàn)在電腦市場(chǎng)上的攝像頭基本以數(shù)字?jǐn)z像頭為主,而數(shù)字?jǐn)z像頭中又以使用新型數(shù)據(jù)傳輸接口的USB數(shù)字?jǐn)z像頭為主。在本實(shí)驗(yàn)中,我們就選擇使用了USB數(shù)字?jǐn)z像頭。這種攝像頭的工作原理大致為:景物通過(guò)鏡頭(LENS)生成的光學(xué)圖像投射到圖像傳感器表面上,然后轉(zhuǎn)為電信號(hào),經(jīng)過(guò)A/D(模數(shù)轉(zhuǎn)換)轉(zhuǎn)換后變?yōu)閿?shù)字圖像信號(hào),再送到數(shù)字信號(hào)處理芯片(DSP)中加工處理,再通過(guò)USB接口傳輸?shù)诫娔X中處理,通過(guò)顯示器就可以看到圖像[10]。圖像解析度(Resolution)又名傳感器像素,是衡量攝像頭的一個(gè)重要指標(biāo)之一,攝像頭的像素越高,它的解析圖像的能力也越強(qiáng),拍攝出來(lái)的圖像品質(zhì)就越好,我們選擇的這種USB數(shù)字?jǐn)z像頭的像素并不是特別高,只能勉強(qiáng)實(shí)現(xiàn)我們對(duì)實(shí)驗(yàn)的要求,如果想進(jìn)一步提高識(shí)別率,一個(gè)更高像素的攝像頭可能對(duì)此有所幫助。另外,視頻捕獲能力也是用戶(hù)最為關(guān)心的功能之一,目前攝像頭的視頻捕獲都是通過(guò)軟件來(lái)實(shí)現(xiàn)的,在本實(shí)驗(yàn)中,我們?cè)O(shè)置了根據(jù)秒數(shù)來(lái)自動(dòng)截取圖片,這對(duì)電腦的要求非常高,即CPU的處理能力要足夠的快,其次對(duì)畫(huà)面也有要求,不同大小最大分辨率下的畫(huà)面,捕獲能力也不盡相同,我們選擇的這種USB數(shù)字?jǐn)z像頭的捕獲能力一般,勉強(qiáng)能夠?qū)崿F(xiàn)我們對(duì)實(shí)驗(yàn)的要求,如果想要更高的識(shí)別率,可以選擇更好些的攝像頭甚至是工控?cái)z像頭。2.2.2軟件部分介紹本課題中,我們所用到的軟件是Matlab,Matlab是MATrixLABoratory的縮寫(xiě),它是一種科學(xué)計(jì)算軟件,專(zhuān)門(mén)以矩陣的形式處理數(shù)據(jù)。Matlab將高性能的數(shù)值計(jì)算和可視化集成在一起,并提供了大量的內(nèi)置函數(shù),從而被廣泛地應(yīng)用于科學(xué)計(jì)算、控制系統(tǒng)、信息處理等領(lǐng)域的分析、仿真和設(shè)計(jì)工作,而且利用Matlab產(chǎn)品的開(kāi)放式結(jié)構(gòu),可以非常容易地對(duì)Matlab的功能進(jìn)行擴(kuò)充,從而在不斷深化對(duì)問(wèn)題認(rèn)識(shí)的同時(shí),完善Matlab產(chǎn)品以提高產(chǎn)品自身的競(jìng)爭(zhēng)力[11]。Matlab被稱(chēng)作為第四代計(jì)算機(jī)語(yǔ)言,最大的特點(diǎn)就是簡(jiǎn)潔,利用其豐富的函數(shù)資源,更符合人們思維習(xí)慣的代碼,帶來(lái)直觀的程序開(kāi)發(fā)環(huán)境。Matlab的主要特色如下[12]:(1)語(yǔ)言簡(jiǎn)潔緊湊,使用方便靈活,庫(kù)函數(shù)極其豐富;(2)運(yùn)算符豐富;(3)既具有結(jié)構(gòu)化的控制語(yǔ)句(如for循環(huán)、while循環(huán)、break語(yǔ)句和if語(yǔ)句),又有面向?qū)ο缶幊痰奶匦?;?)語(yǔ)法限制不嚴(yán)格,程序設(shè)計(jì)自由度大;(5)程序的可移植性很好,基本上不做修改就可以在各種型號(hào)的計(jì)算機(jī)和操作系統(tǒng)上運(yùn)行;(6)圖形功能強(qiáng)大;(7)包含功能強(qiáng)勁的工具箱。本試驗(yàn)中,我們使用了Matlab圖形用戶(hù)界面(簡(jiǎn)稱(chēng)GUI)設(shè)計(jì)主界面和子界面,優(yōu)化界面并實(shí)現(xiàn)主界面對(duì)子界面的調(diào)用,編寫(xiě)界面的回調(diào)函數(shù)。系統(tǒng)界面設(shè)計(jì)布局采用自頂向下的設(shè)計(jì)方法,即先設(shè)計(jì)主界面再設(shè)計(jì)各個(gè)子界面。而各個(gè)回調(diào)函數(shù)側(cè)是采用自底向上的設(shè)計(jì)方法,即先設(shè)計(jì)各個(gè)子界面的回調(diào)函數(shù),再設(shè)計(jì)主界面的回調(diào)函數(shù)。本課題避開(kāi)了硬件系統(tǒng)的不足,巧妙的運(yùn)用軟件來(lái)仿真硬件才能實(shí)現(xiàn)的實(shí)驗(yàn)結(jié)果,大大降低了實(shí)驗(yàn)設(shè)備要求,節(jié)約了人力和財(cái)力,而且有很多的庫(kù)函數(shù)可以在實(shí)驗(yàn)時(shí)直接調(diào)用,避免了用硬件做實(shí)驗(yàn)的局限性。根據(jù)國(guó)內(nèi)外優(yōu)秀的GUI技術(shù)應(yīng)用的成功經(jīng)驗(yàn),可以總結(jié)出近幾年的設(shè)計(jì)具備以下幾個(gè)最基本特點(diǎn)[13]:(1)技術(shù)上具有先進(jìn)性、高效性、實(shí)用性、安全性;(2)數(shù)據(jù)管理功能完善,數(shù)據(jù)的采集、處理、發(fā)布過(guò)程中不會(huì)出現(xiàn)數(shù)據(jù)丟失、改變的問(wèn)題;(3)界面友好,操作簡(jiǎn)便,使用統(tǒng)一的瀏覽器界面;(4)自動(dòng)化程度高,結(jié)構(gòu)設(shè)計(jì)簡(jiǎn)單;(5)模塊化設(shè)計(jì),易于擴(kuò)充功能;(6)產(chǎn)品設(shè)計(jì)靈活;(7)投資少,最大限度保護(hù)用戶(hù)的投資。
第三章手寫(xiě)體數(shù)字識(shí)別系統(tǒng)構(gòu)成及原理3.1圖像處理基礎(chǔ)知識(shí)圖像處理(imageprocessing),是指用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,以達(dá)到所需結(jié)果的技術(shù),又稱(chēng)影像處理,一般指的是數(shù)字圖像處理[14]。數(shù)字圖像是指用數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備經(jīng)過(guò)采樣和數(shù)字化得到的一個(gè)大的二維數(shù)組,該數(shù)組的元素稱(chēng)為像素,其值為一整數(shù),稱(chēng)為灰度值。圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,增強(qiáng)和復(fù)原,匹配、描述和識(shí)別這幾個(gè)部分。其中,常見(jiàn)的處理有圖像數(shù)字化、圖像編碼、圖像增強(qiáng)、圖像復(fù)原、圖像分割和圖像分析等。圖像數(shù)字化指的是通過(guò)取樣和量化過(guò)程將一個(gè)以自然形式存在的圖像變換為適合計(jì)算機(jī)處理的數(shù)字形式。圖像在計(jì)算機(jī)內(nèi)部被表示為一個(gè)數(shù)字矩陣,矩陣中每一元素稱(chēng)為像素。圖像數(shù)字化需要專(zhuān)門(mén)的設(shè)備,常見(jiàn)的有各種電子的和光學(xué)的掃描設(shè)備,還有機(jī)電掃描設(shè)備和手工操作的數(shù)字化儀。在本文中,我們就是利用USB攝像頭將圖像數(shù)字化。圖像編碼是對(duì)圖像信息編碼,以滿足傳輸和存儲(chǔ)的要求。編碼能壓縮圖像的信息量,但圖像質(zhì)量幾乎不變。圖像增強(qiáng)的目標(biāo)是改進(jìn)圖片的質(zhì)量,例如增加對(duì)比度,去掉模糊和噪聲,修正幾何畸變等;圖像復(fù)原是在假定已知模糊或噪聲的模型時(shí),試圖估計(jì)原圖像的一種技術(shù)。圖像分割是將圖像劃分為一些互不重疊的區(qū)域,每一區(qū)域是像素的一個(gè)連續(xù)集。通常采用把像素分入特定區(qū)域的區(qū)域法和尋求區(qū)域之間邊界的境界法。區(qū)域法根據(jù)被分割對(duì)象與背景的對(duì)比度進(jìn)行閾值運(yùn)算,將對(duì)象從背景中分割出來(lái)。有時(shí)用固定的閾值不能得到滿意的分割,可根據(jù)局部的對(duì)比度調(diào)整閾值,這稱(chēng)為自適應(yīng)閾值。境界法利用各種邊緣檢測(cè)技術(shù),即根據(jù)圖像邊緣處具有很大的梯度值進(jìn)行檢測(cè)。這兩種方法都可以利用圖像的紋理特性實(shí)現(xiàn)圖像分割。圖像分析是指從圖像中抽取某些有用的度量、數(shù)據(jù)或信息。圖像匹配、描述和識(shí)別是對(duì)圖像進(jìn)行比較和配準(zhǔn),通過(guò)提取圖像的特征及相互關(guān)系,得到圖像符號(hào)化的描述,再把它同模型比較,以確定其分類(lèi)。圖像匹配試圖建立兩張圖片之間的幾何對(duì)應(yīng)關(guān)系,度量其類(lèi)似或不同的程度。Matlab圖像處理是指計(jì)算機(jī)采用Matlab處理圖形圖像的技術(shù)。Matlab中的一幅圖像可能包含一個(gè)數(shù)據(jù)矩陣,也可能包含一個(gè)顏色映射表矩陣,它包含4種基本的圖像類(lèi)型:索引圖像、灰度圖像、RGB圖像和二值圖像。此外,Matlab還支持由多幀圖像組成的圖像序列[15]。(1)索引圖像索引圖像是一種把像素值直接作為RGB調(diào)色板下標(biāo)的圖像。索引圖像可把像素值直接映射為調(diào)色板數(shù)值。調(diào)色板通常與索引圖像存儲(chǔ)在一起,裝載圖像時(shí),調(diào)色板將和圖像一同自動(dòng)裝載。索引圖像包括一個(gè)數(shù)據(jù)矩陣A,一個(gè)顏色映射矩陣B。其中B是一個(gè)包含3列和若干行的數(shù)據(jù)陣列。B矩陣的每一行分別表示紅色、綠色和藍(lán)色的顏色值。在Matlab中,索引圖像是從像素值到顏色映射表值的直接映射。像素顏色由數(shù)據(jù)矩陣A作為索引指向矩陣B進(jìn)行索引。(2)灰度圖像灰度數(shù)字圖像是每個(gè)像素只有一個(gè)采樣顏色的圖像,這類(lèi)圖像通常顯示為從最暗的黑色到最亮的白色的灰度,盡管理論上這個(gè)采樣可以用于任何顏色的不同深淺,甚至可以是不同亮度上的不同顏色。Matlab中,一幅灰度圖像是一個(gè)數(shù)據(jù)矩陣I,其中I的數(shù)據(jù)均代表了在一定范圍內(nèi)的顏色灰度值。Matlab把灰度圖像存儲(chǔ)為一個(gè)數(shù)據(jù)矩陣,該數(shù)據(jù)矩陣中的元素分別代表了圖像中的像素。矩陣中的元素可以是雙精度的浮點(diǎn)數(shù)類(lèi)型、8位或16位無(wú)符號(hào)的整數(shù)類(lèi)型。大多數(shù)情況下,灰度圖像很少和顏色映射表一起保存。但是在顯示灰度圖像時(shí),Matlab仍然在后臺(tái)使用系統(tǒng)預(yù)定義的默認(rèn)的灰度顏色映射表。(3)二值圖像二值圖像是指每個(gè)像素不是黑就是白,其灰度值沒(méi)有中間過(guò)渡的圖像。與灰度圖像相同,二值圖像只需要一個(gè)數(shù)據(jù)矩陣,每個(gè)像素只取兩個(gè)灰度值。二值圖像可以采用uint和double類(lèi)型存儲(chǔ),工具箱中以二值圖像作為返回結(jié)果的函數(shù)都使用uint類(lèi)型。(4)RGB圖像RGB圖像,即真彩色圖像,在Matlab中存儲(chǔ)為nXmX3的數(shù)據(jù)矩陣。數(shù)組中的元素定義了圖像中每一個(gè)像素的紅、綠、藍(lán)顏色值。需要指出的是,RGB圖像不使用Windows顏色映射表。像素的顏色保存在像素位置上的紅、綠、藍(lán)的強(qiáng)度值的組合來(lái)確定。圖像文件格式把RGB圖像存儲(chǔ)為24位的圖像,紅、綠、藍(lán)分別占8位。這樣可以有約1000萬(wàn)種顏色。3.2手寫(xiě)體數(shù)字識(shí)別系統(tǒng)構(gòu)成手寫(xiě)體數(shù)字識(shí)別系統(tǒng)結(jié)構(gòu)圖如圖3-1所示。圖3-1手寫(xiě)體數(shù)字識(shí)別系統(tǒng)結(jié)構(gòu)圖其中三個(gè)模塊的輸入部分以及部分輸出部分的具體設(shè)計(jì)將會(huì)在下一章中提到。3.3手寫(xiě)體數(shù)字識(shí)別系統(tǒng)原理當(dāng)今手寫(xiě)體數(shù)字識(shí)別的應(yīng)用需求越來(lái)越廣泛,在財(cái)務(wù)、稅務(wù)、金融方面具有不可替代的作用,因此手寫(xiě)體數(shù)字識(shí)別系統(tǒng)應(yīng)具有很高的識(shí)別正確率,對(duì)環(huán)境光照條件、手寫(xiě)規(guī)范等因素的影響應(yīng)有較大的容閾,并且要求滿足實(shí)時(shí)性要求[16]。該系統(tǒng)是計(jì)算機(jī)圖像處理與字符識(shí)別技術(shù)在手寫(xiě)體數(shù)字識(shí)別系統(tǒng)中的應(yīng)用,它主要由手寫(xiě)體數(shù)字圖像的采集和預(yù)處理、手寫(xiě)體數(shù)字圖像的定位和提取、手寫(xiě)體數(shù)字的分割和識(shí)別等幾個(gè)部分組成。3.3.1預(yù)處理為了研究圖像內(nèi)容的識(shí)別,首先要對(duì)獲得的圖像信息進(jìn)行預(yù)處理,濾去干擾、噪聲,當(dāng)信息微弱無(wú)法辨識(shí)時(shí),還須對(duì)圖像進(jìn)行增強(qiáng)處理,顏色校正等,以便人、機(jī)分析[17]。在本系統(tǒng)中,我們?cè)O(shè)計(jì)的這個(gè)部分主要由計(jì)算數(shù)據(jù)大小,灰度,全局圖像閾值選取,二值化,刪除小面積圖形等過(guò)程組成。(1)計(jì)算數(shù)據(jù)大小計(jì)算數(shù)據(jù)大小的函數(shù)為size,函數(shù)公式以及具體解析如下:d
=
size(X)返回?cái)?shù)組X每一維的大小
。[m,n]
=
size(X)返回矩陣X的行列,當(dāng)X是一個(gè)大于二維的數(shù)組時(shí),m
是第一維的大小,n返回其他維相乘。m
=
size(X,dim)返回X數(shù)組第
dim
維的大小。[d1,d2,d3,…,dn]
=
size(X)返回X數(shù)組每一維的大小到
d1,d2,d3,…,dn。(2)灰度灰度是指灰度圖的轉(zhuǎn)換,利用rgb2gray函數(shù),將RGB圖形或色圖矩陣轉(zhuǎn)換成灰度圖[18]。對(duì)于將彩色圖像轉(zhuǎn)換成灰度圖像時(shí),圖像灰度值可由下面的公式計(jì)算:gray=0.2989*R+0.5870*G+0.1140*B注:原始圖像可以是Matlab可以處理的圖像格式。I=rgb2gray(RGB)將真彩色圖像RGB轉(zhuǎn)換成灰度圖像I。rgb2gray刪除圖像中的色調(diào)和飽和度信息,而保留亮度信息,從而將RGB圖像轉(zhuǎn)換為灰度圖。newmap=rgb2gray(map)返回與色圖map相對(duì)應(yīng)的灰度色圖。注意:如果函數(shù)的輸入是一個(gè)RGB圖像,則它可以是unit8、uint16、single或double類(lèi)型。輸出的圖像I的數(shù)據(jù)與輸入的圖像是相同類(lèi)型的數(shù)據(jù)。如果輸入的是色圖,則輸入和輸出都是double類(lèi)型的。rgb2gray測(cè)試:I=imread('chuli.jpg');J=rgb2gray(I);%將圖片轉(zhuǎn)為灰度圖并且保存到J當(dāng)中。Figure%打開(kāi)新的作圖窗口。imshow(I)%顯示轉(zhuǎn)換前的彩色圖。figure;%打開(kāi)新的作圖窗口。imshow(J);%顯示轉(zhuǎn)換后的灰度圖J。測(cè)試結(jié)果如圖3.2、3.3所示:圖3-2原始圖像圖3-3灰度圖像(3)全局圖像閾值選取全局圖像閾值選取的函數(shù)為graythresh,函數(shù)功能為使用大津法進(jìn)行全局圖像閾值選取。函數(shù)公式以及具體解析如下:level=graythresh(I)計(jì)算全局閾值(level),該閾值可以用在將強(qiáng)度圖像轉(zhuǎn)換為二進(jìn)制圖像的函數(shù)im2bw中。level是在[0,1]內(nèi)歸一化的強(qiáng)度值。函數(shù)graythresh選擇使黑白像素類(lèi)內(nèi)方差最小的閾值。多維矩陣被reshape自動(dòng)轉(zhuǎn)換為二維矩陣。函數(shù)graythresh忽略I的所有非零虛部。[levelEM]=graythresh(I)返回效力矩陣EM作為第二個(gè)輸出變量。效力矩陣是[01]范圍內(nèi)的值,指示輸入圖像閾值選取的有效性。只有單一灰度值的圖像0,只有兩個(gè)灰度值的圖像1。(4)二值化將圖像轉(zhuǎn)換為基于閾值的二進(jìn)制圖像的函數(shù)為im2bw,函數(shù)公式以及具體解析如下:BW=im2bw(I,level)將灰度圖像I轉(zhuǎn)換為二進(jìn)制圖像。輸出圖像BW將輸入圖像中亮度值大于level的像素替換為值1(白色),其他替換為值0(黑色)。你指定level在[0,1]之間,不用管輸入圖像的等級(jí)。函數(shù)graythresh能用來(lái)自動(dòng)計(jì)算變量level。如果你不指定level,im2bw使用0.5。BW=im2bw(X,map,level)將顏色表為map的索引圖像X轉(zhuǎn)換為二進(jìn)制圖像。BW=im2bw(RGB,level)將RGB真彩圖像轉(zhuǎn)換為二進(jìn)制圖像。注:如果輸入圖像不是灰度圖像,im2bw首先將圖像轉(zhuǎn)換為灰度圖像,然后通過(guò)閾值將灰度圖像轉(zhuǎn)換成二進(jìn)制圖像。im2bw測(cè)試:A=imread(['1.jpg']);B=im2bw(A);figure;imshow(A)figure;imshow(B);測(cè)試結(jié)果如圖3.4、3.5所示:圖3-4灰度圖像圖3-5二值化圖像(5)刪除小面積圖形刪除小面積圖形的函數(shù)為bwareaopen,函數(shù)公式以及具體解析如下:格式:BW2=bwareaopen(BW,P,conn)作用:刪除二值圖像BW中面積小于P的對(duì)象,默認(rèn)情況下conn使用8鄰域,這個(gè)部分其實(shí)就是去噪,根據(jù)設(shè)置的P的大小,去除圖像上的雜點(diǎn)。算法:A.Determinetheconnectedcomponents.L=bwlabeln(BW,conn);B.Computetheareaofeachcomponent.S=regionprops(L,'Area');C.Removesmallobjects.bw2=ismember(L,find([S.Area]>=P));功能:用于從對(duì)象中移除小對(duì)象。用法:BW2=bwareaopen(BW,P)BW2=bwareaopen(BW,P,CONN)BW2=bwareaopen(BW,P,CONN)從二值圖像中移除所有小于P的連通對(duì)象。CONN對(duì)應(yīng)鄰域方法,默認(rèn)為8。3.3.2圖像分割圖像分割就是把圖像分成若干個(gè)特定的、具有獨(dú)特性質(zhì)的區(qū)域并提出感興趣目標(biāo)的技術(shù)和過(guò)程。它是由圖像處理到圖像分析的關(guān)鍵步驟,它是一種重要的圖像技術(shù),在理論研究和實(shí)際應(yīng)用中都得到了人們的廣泛重視。圖像分割的方法和種類(lèi)有很多,有些分割運(yùn)算可直接應(yīng)用于任何圖像,而另一些只能適用于特殊類(lèi)別的圖像。有些算法需要先對(duì)圖像進(jìn)行粗分割,因?yàn)樗麄冃枰獜膱D像中提取出來(lái)的信息。例如,可以對(duì)圖像的灰度級(jí)設(shè)置門(mén)限的方法分割。值得提出的是,沒(méi)有唯一的標(biāo)準(zhǔn)的分割方法。許多不同種類(lèi)的圖像或景物都可作為待分割的圖像數(shù)據(jù),不同類(lèi)型的圖像,已經(jīng)有相對(duì)應(yīng)的分割方法對(duì)其分割,同時(shí),某些分割方法也只是適合于某些特殊類(lèi)型的圖像分割。分割結(jié)果的好壞需要根據(jù)具體的場(chǎng)合及要求衡量。圖像分割是從圖像處理到圖像分析的關(guān)鍵步驟,可以說(shuō),圖像分割結(jié)果的好壞直接影響對(duì)圖像的理解。人們通常將圖像分割的方法歸納為基于灰度直方圖的閾值化方法和基于區(qū)域增長(zhǎng)法兩大類(lèi)。其中閾值化方法因其簡(jiǎn)單、計(jì)算量小、性能較穩(wěn)定而成為圖像分割中應(yīng)用最廣泛的分割技術(shù)[19]。閾值分割方法中對(duì)灰度圖像的取閾值分割就是先確定一個(gè)處于圖像灰度取值范圍之中的灰度閾值,然后將圖像中各個(gè)像素的灰度值都與這個(gè)閾值相比較,并根據(jù)比較結(jié)果將對(duì)應(yīng)的像素分為兩類(lèi)。這兩類(lèi)像素一般分屬圖像的兩類(lèi)區(qū)域,從而達(dá)到分割的目的。從該方法中可以看出,確定一個(gè)最優(yōu)閾值是分割的關(guān)鍵。現(xiàn)有的大部分算法都是集中在閾值確定的研究上。閾值分割方法根據(jù)圖像本身的特點(diǎn),可分為單閾值分割方法和多閾值分割方法;也可分為基于像素值的閾值分割方法、基于區(qū)域性質(zhì)的閾值分割方法和基于坐標(biāo)位置的閾值分割方法。若根據(jù)分割算法所有的特征或準(zhǔn)則,還可以分為直方圖與直方圖變換法、最大類(lèi)空間方差法、最小誤差法與均勻化誤差法、共生矩陣法、最大熵法、簡(jiǎn)單統(tǒng)計(jì)法與局部特性法、概率松馳法、模糊集法、特征空間聚類(lèi)法、基于過(guò)渡區(qū)的閾值選取法等。3.3.3特征提取圖像特征抽取是指在需要識(shí)別的物體被分割出來(lái)的基礎(chǔ)上,提取需要的特征,并對(duì)某些參數(shù)進(jìn)行計(jì)算、測(cè)量,根據(jù)測(cè)量結(jié)果進(jìn)行分類(lèi)。這一過(guò)程輸入是龐大的信息圖像,輸出則是少量的特征信息,而且這些特征信息僅僅代表物體,無(wú)法還原回原物體。特征提取是計(jì)算機(jī)視覺(jué)和圖像處理中的一個(gè)概念。它指的是使用計(jì)算機(jī)提取圖像信息,決定每個(gè)圖像的點(diǎn)是否屬于一個(gè)圖像特征。特征提取的結(jié)果是把圖像上的點(diǎn)分為不同的子集,這些子集往往屬于孤立的點(diǎn)、連續(xù)的曲線或者連續(xù)的區(qū)域。特征提取是圖象處理中的一個(gè)初級(jí)運(yùn)算,也就是說(shuō)它是對(duì)一個(gè)圖像進(jìn)行的第一個(gè)運(yùn)算處理。它檢查每個(gè)像素來(lái)確定該像素是否代表一個(gè)特征。假如它是一個(gè)更大的算法的一部分,那么這個(gè)算法一般只檢查圖像的特征區(qū)域。作為特征提取的一個(gè)前提運(yùn)算,輸入圖像一般通過(guò)高斯模糊核在尺度空間中被平滑。此后通過(guò)局部導(dǎo)數(shù)運(yùn)算來(lái)計(jì)算圖像的一個(gè)或多個(gè)特征。特征提取的目的是從原始數(shù)據(jù)中抽取出用于區(qū)分不同類(lèi)型的本質(zhì)特征。無(wú)論是識(shí)別過(guò)程還是學(xué)習(xí)過(guò)程,都要對(duì)研究對(duì)象固有的、本質(zhì)的重要特征或?qū)傩赃M(jìn)行量測(cè)并將結(jié)果數(shù)值化,形成特征矢量[20]。通常能描述對(duì)象的元素很多,為了節(jié)約資源,節(jié)省計(jì)算機(jī)存儲(chǔ)空間、處理時(shí)間、特征提取的費(fèi)用,有時(shí)更是為了可行性,在保證滿足分類(lèi)識(shí)別正確率要求的條件下,按某種準(zhǔn)則盡量選用對(duì)正確分類(lèi)識(shí)別作用較大的特征,使得用較少的特征就能完成分類(lèi)識(shí)別任務(wù)。這項(xiàng)工作表現(xiàn)為減少特征矢量的維數(shù)或符號(hào)字符數(shù)。3.3.4分類(lèi)識(shí)別圖像分類(lèi)指的是根據(jù)提取的特征值,利用模式識(shí)別的方法進(jìn)行分類(lèi),確定類(lèi)別名稱(chēng),以便對(duì)圖像的重要信息得到一種理解和解釋。這一過(guò)程輸入的是特征信息,輸出是類(lèi)別名稱(chēng)[21]。識(shí)別的代碼如下:forn=1:shuzisshuzidb=corr2(templates{1,n},tupian1);%計(jì)算兩個(gè)矩陣的2維相關(guān)系數(shù)。shuzijz=[shuzijzshuzidb];endvd=find(shuzijz==max(shuzijz));代碼的意義是計(jì)算兩個(gè)矩陣的2維相關(guān)系數(shù),相關(guān)系數(shù)最大的就是所識(shí)別的結(jié)果。第四章手寫(xiě)體數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)分析本次設(shè)計(jì)使用Matlab語(yǔ)言實(shí)現(xiàn)該系統(tǒng),其用戶(hù)界面分別介紹如下。4.1程序主界面程序的主界面如下,功能主要分為三個(gè)模塊,分別為攝像頭輸入模塊、直接讀取圖片模塊以及寫(xiě)字板輸入模塊,另外,右下角還有個(gè)退出的按鈕,如圖4.1。圖4-1手寫(xiě)體數(shù)字識(shí)別系統(tǒng)的主界面在程序主界面上,界面設(shè)計(jì)的代碼如下:ha=axes('units','normalized','position',[0011]);uistack(ha,'down')II=imread('Beijingtupian\shouxieshuzishibiejmbj.jpg');image(II)colormapgrayset(ha,'handlevisibility','off','visible','off');I=imread('Beijingtupian\shouxieshuzishibiejman1.jpg');J=imread('Beijingtupian\shouxieshuzishibiejman2.jpg');K=imread('Beijingtupian\shouxieshuzishibiejman3.jpg');L=imread('Beijingtupian\shouxieshuzishibiejman4.jpg');set(handles.pushbutton1,'cdata',I);set(handles.pushbutton2,'cdata',J);set(handles.pushbutton3,'cdata',K);set(handles.pushbutton4,'cdata',L);以上包括了主界面的背景圖片以及主界面按鈕的背景圖片的關(guān)聯(lián)等。設(shè)計(jì)時(shí)候的原始界面如圖4.2:圖4-2手寫(xiě)體數(shù)字識(shí)別系統(tǒng)的原始界面pushbutton1 2.5*1%直接讀取圖片12.0字體set(gcf,'visible','off');zjdqtppushbutton22.5*1 %視屏輸入12.0字體set(gcf,'visible','off');sxtpushbutton32.5*1 %寫(xiě)字板輸入12.0字體set(gcf,'visible','off');xzbpushbutton4 %退出大小為2*1close(gcf);以上是4個(gè)按鈕的功能,大小,字體等設(shè)置。另外,在界面的左上角有幾組下拉菜單,主界面的下拉菜單如圖4.3所示,內(nèi)容包括幫助以及退出,另外三個(gè)下拉菜單的內(nèi)容是三個(gè)模塊的功能。而各個(gè)分界面下的菜單如如4.4所示,菜單下的內(nèi)容包括返回以及退出,另外兩個(gè)下拉菜單的內(nèi)容是其他兩個(gè)模塊的功能。圖4-3主界面的下拉菜單圖4-4分界面下的下拉菜單4.2基準(zhǔn)庫(kù)的選擇與建立手寫(xiě)數(shù)字的寫(xiě)法帶有明顯的地區(qū)性和民族性,因而選擇一個(gè)可供系統(tǒng)訓(xùn)練和測(cè)試使用的樣本庫(kù)是手寫(xiě)數(shù)字識(shí)別研究的重要基礎(chǔ)之一,對(duì)識(shí)別系統(tǒng)的性能也有重要的影響。研究者對(duì)所需的樣本庫(kù)有兩種選擇:一是自己根據(jù)需要建立專(zhuān)門(mén)的樣本庫(kù),二是選用其它機(jī)構(gòu)做好的現(xiàn)成的樣本庫(kù)。前者的優(yōu)點(diǎn)是帖近自己的應(yīng)用,缺點(diǎn)也是明顯的:要費(fèi)相當(dāng)?shù)木η掖硇院茈y保證,與其它人的結(jié)果不好比較。因此,現(xiàn)在的趨勢(shì)是使用有權(quán)威性的通用樣本庫(kù)。目前,比較有代表性的、樣本數(shù)量較大的手寫(xiě)數(shù)字樣本庫(kù)有:(1).NIST數(shù)據(jù)庫(kù),由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)局收集;(2).CEDAR數(shù)據(jù)庫(kù),是由紐約州立大學(xué)Buffalo分校計(jì)算機(jī)科學(xué)系文本分析與識(shí)別中完成的郵政編碼的樣本庫(kù);(3).ETL數(shù)據(jù)庫(kù),由日本電工技術(shù)研究所收集;(4).ITPT數(shù)據(jù)庫(kù),由日本郵電通信政策研究所收集。在本文中,我們根據(jù)自己需要所建立了專(zhuān)門(mén)的樣本庫(kù),具體建立方法如下:設(shè)置不同字體,大小,線條粗細(xì)的0-9的數(shù)字圖片共計(jì)120張,用來(lái)建立樣本,作為基準(zhǔn)庫(kù),如圖4.5。在實(shí)驗(yàn)的過(guò)程中,我們還可以根據(jù)手寫(xiě)體數(shù)字的樣式,來(lái)添加樣本,充實(shí)基準(zhǔn)庫(kù)。圖4-5手寫(xiě)體數(shù)字識(shí)別系統(tǒng)的基準(zhǔn)庫(kù)4.3手寫(xiě)體數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)4.3.1攝像頭輸入模塊的設(shè)計(jì)點(diǎn)擊主界面中的攝像頭輸入按鈕,進(jìn)入利用攝像頭輸入的數(shù)字識(shí)別,如圖4.6。識(shí)別的具體過(guò)程為點(diǎn)擊界面上的視頻輸入按鈕,即可出現(xiàn)裝載攝像頭的界面,如圖4.7。同時(shí),界面左邊的空白處,也會(huì)出現(xiàn)相同的圖像,如圖4.8。此時(shí),如果點(diǎn)擊視頻輸入按鈕下面的自動(dòng)截取按鈕,視頻輸入在界面中的畫(huà)面就會(huì)按照規(guī)定的時(shí)間間隔進(jìn)行截取,比如程序設(shè)定是5秒進(jìn)行一次截取,畫(huà)面就會(huì)固定在視頻輸入后的5秒的圖像上,進(jìn)行截取,然后輸出。另外,還有一種方法是手動(dòng)輸入,即是自己調(diào)整攝像頭輸入的畫(huà)面,覺(jué)得足夠完整、清晰的時(shí)候,點(diǎn)擊保存按鈕,畫(huà)面就會(huì)固定在點(diǎn)擊按鈕的那一刻,接著點(diǎn)擊手動(dòng)輸出,即可輸出固定下來(lái)的畫(huà)面中手寫(xiě)體數(shù)字。圖4-6利用攝像頭輸入的手寫(xiě)體數(shù)字識(shí)別界面圖4-7攝像頭攝入畫(huà)面圖4-8利用攝像頭輸入的手寫(xiě)體數(shù)字識(shí)別讀圖過(guò)程以及結(jié)果在利用攝像頭輸入的手寫(xiě)體數(shù)字識(shí)別界面上,視頻輸入、手動(dòng)輸入的代碼如下:clc;clear;globalsph=waitbar(0.1,'請(qǐng)稍等'); %顯示等待條sp=videoinput('winvideo',1,'YUY2_320x240');%攝像頭=videoinput('適配器名稱(chēng)',設(shè)備號(hào))baocun=uicontrol('Style','pushbutton',...'String','保存',...'Position',[102004020],...'Callback',{@baocuntupian})set(sp,'TriggerRepeat',Inf);set(sp,'ReturnedColorSpace','rgb');waitbar(0.8,h,'請(qǐng)稍等');close(h);preview(sp); %創(chuàng)建一個(gè)視頻預(yù)覽窗口的視頻顯示現(xiàn)場(chǎng)視頻數(shù)據(jù)輸入對(duì)象set(sp,'ReturnedColorSpace','rgb');data=getsnapshot(sp); %捕獲圖像,設(shè)置成rgbimshow(data);自動(dòng)截取部分的代碼如下:globalvid;globalq1;period=str2num(get(q1,'string'))globalt;t=timer('TimerFcn',{@timerCallback},'ExecutionMode','fixedDelay','Period',period);start(t);4.3.2直接讀圖模塊的設(shè)計(jì)點(diǎn)擊主界面中的讀取圖片按鈕,進(jìn)入直接讀圖的手寫(xiě)體數(shù)字識(shí)別,如圖4.9。識(shí)別的具體過(guò)程為點(diǎn)擊界面上的讀取圖片按鈕,選取以前設(shè)置好的被掃描進(jìn)電腦的手寫(xiě)體數(shù)字圖片,單擊打開(kāi),如圖4.10。圖4-9直接讀圖的手寫(xiě)體數(shù)字識(shí)別界面圖4-10直接讀圖的手寫(xiě)體數(shù)字識(shí)別讀圖過(guò)程最后點(diǎn)擊右邊的圖片識(shí)別按鈕即可識(shí)別出數(shù)字,如圖4.11。圖4-11直接讀圖的手寫(xiě)體數(shù)字識(shí)別讀圖結(jié)果在直接讀圖的手寫(xiě)體數(shù)字識(shí)別界面上,左邊空白部分的代碼如下:set(gca,'XColor',get(gca,'Color'))set(gca,'YColor',get(gca,'Color'))set(gca,'XTickLabel',[])set(gca,'YTickLabel',[])它代表的意思是將坐標(biāo)軸去掉,實(shí)現(xiàn)那一部分的空白。讀取圖片按鈕的代碼如下:[filename,pathname]=uigetfile({'*.jpg';'*.bmp';'*.gif';'*.*'},'yangbentupian\');S=imread([pathname,filename]);axes(handles.axes1);imshow(S);str='shengchengwenjian\zjdqtpsctp';str=strcat(str,'.jpg');imwrite(S,str,'jpg');它代表的意思是讀取圖片,并且插入到左邊的空白處。圖片識(shí)別按鈕的代碼如下:zjdqtpsb()edit1=load('shengchengwenjian\zjdqtpsbscwb.txt')str=mat2str(edit1);strset(handles.edit1,'STRING',str);它代表的意思是首先調(diào)用識(shí)別程序進(jìn)行識(shí)別,然后將識(shí)別出來(lái)的TXT文件中的內(nèi)容傳入到edit1中,即右邊空白處。4.3.3寫(xiě)字板輸入模塊的設(shè)計(jì)點(diǎn)擊主界面中的寫(xiě)字板輸入按鈕,進(jìn)入利用寫(xiě)字板輸入的數(shù)字識(shí)別,如圖4.12。識(shí)別的具體過(guò)程為單擊界面左邊空白處,拉動(dòng)鼠標(biāo)不松左鍵,即可在寫(xiě)字板上進(jìn)行手寫(xiě)體數(shù)字的輸入,如圖4-13。在程序的下方有五個(gè)按鈕,按照各自的名稱(chēng),分別代表著擦除寫(xiě)字板上的所有內(nèi)容,保存寫(xiě)字板上的內(nèi)容,顯示手寫(xiě)體數(shù)字識(shí)別的結(jié)果,返回以及退出。圖4-12利用寫(xiě)字板輸入的手寫(xiě)體數(shù)字識(shí)別圖4-13識(shí)別過(guò)程以及結(jié)果自制的寫(xiě)字板代碼如下:functionshubiaogensui(dongz)globalxyx0y0ifnargin==0,dongz='start';endswitch(dongz)case'start',axis([0.11100110]);set(gcf,'WindowButtonDownFcn','shubiaogensuidown');case'down',set(gcf,'WindowButtonMotionFcn','shubiaogensuimove');set(gcf,'WindowButtonUpFcn','shubiaogensuistop');dianji=get(gca,'CurrentPoint');x0=dianji(1,1);y0=dianji(1,2);case'move',dianji=get(gca,'CurrentPoint');x=dianji(1,1);y=dianji(1,2);%y=kx+b直線方程實(shí)現(xiàn)。x_zl=0.1;y_zl=0.1;%定義xy方向增量ifx>x0yidong_x=x_zl;elseyidong_x=-x_zl;endify>y0yidong_y=y_zl;elseyidong_y=-y_zl;endX=x0:yidong_x:x;%定義x的變化%定義y的變化ifabs(x-x0)<0.01%直線平行于y軸Y=y0:yidong_y:y;%斜率不存在時(shí),y值固定elseY=(y-y0)*(X-x0)/(x-x0)+y0;%當(dāng)斜率存在,k=(y-y0)/(x-x0)=0endline(X,Y,'marker','.','markerSize',30,'LineStyle','-','LineWidth',4,'Color','black');x0=x;y0=y;%記住當(dāng)前點(diǎn)坐標(biāo)case'stop',set(gcf,'WindowButtonMotionFcn','');end這段代碼所實(shí)現(xiàn)的功能是鼠標(biāo)跟隨,即單擊左鍵,會(huì)進(jìn)行鼠標(biāo)更隨,松開(kāi)左鍵,會(huì)釋放更隨命令。另外,line(X,Y,'marker','.','markerSize',30,'LineStyle','-','LineWidth',4,'Color','black');這行代碼,設(shè)置了鼠標(biāo)跟隨功能里的兩個(gè)標(biāo)記,一個(gè)是代碼30的點(diǎn)標(biāo)記,一個(gè)是代碼為4的線標(biāo)記,字色是黑色,這個(gè)設(shè)置實(shí)現(xiàn)了手寫(xiě)體數(shù)字在寫(xiě)字板上的書(shū)寫(xiě)。最后,在寫(xiě)字板輸入的過(guò)程中,還需要保存手寫(xiě)出的圖片,然后才能進(jìn)行識(shí)別,具體流程如圖4.14所示:圖4-14寫(xiě)字板輸入的流程圖保存部分的代碼如下:[FileName,PathName]=uiputfile({'*.jpg','JPEG(*.jpg)';...'*.bmp','Bitmap(*.bmp)';...'*.gif','GIF(*.gif)';...'*.*','AllFiles(*.*)'},...'SavePicture','shengchengwenjian\xzbsbqt');ifFileName==0return;elseh=getframe(handles.axes1);imwrite(h.cdata,[PathName,FileName]);end第五章系統(tǒng)性能評(píng)價(jià)及實(shí)驗(yàn)結(jié)果分析5.1識(shí)別系統(tǒng)性能的評(píng)價(jià)作為一個(gè)識(shí)別系統(tǒng),我們最終要用某些參數(shù)來(lái)評(píng)價(jià)其性能的高低,手寫(xiě)數(shù)字識(shí)別也不例外。評(píng)價(jià)的指標(biāo)除了借用一般文字識(shí)別里的通常做法外,還要根據(jù)數(shù)字識(shí)別的特點(diǎn)進(jìn)行修改和補(bǔ)充[22]。對(duì)一個(gè)手寫(xiě)數(shù)字識(shí)別系統(tǒng),可以用三方面的指標(biāo)表征系統(tǒng)的性能:正確識(shí)別率A=正確識(shí)別樣本數(shù)/全部樣本數(shù)*100%替代率(誤識(shí)率)S=誤識(shí)樣本數(shù)/全部樣本數(shù)*100% 拒識(shí)率R=拒識(shí)樣本數(shù)/全部樣本數(shù)*100%三者的關(guān)系是:A+S+R=100% 數(shù)字識(shí)別的應(yīng)用中,人們往往很關(guān)心的一個(gè)指標(biāo)是“識(shí)別精度”,即:在所有識(shí)別的字符中,除去拒識(shí)字符,正確識(shí)別的比例有多大,我們定義:識(shí)別精度P=A/(A+S)*100%。一個(gè)理想的系統(tǒng)應(yīng)是R,S盡量小,而P,A盡可能大。而在一個(gè)實(shí)際系統(tǒng)中,S,R是相互制約的,拒識(shí)率R的提高總伴隨著誤識(shí)率S的下降,與此同時(shí)識(shí)別率A和識(shí)別精度P的提高。因此,在評(píng)價(jià)手寫(xiě)數(shù)字識(shí)別系統(tǒng)系統(tǒng)時(shí),我們必須綜合考慮這幾個(gè)指標(biāo)。另外,由于手寫(xiě)數(shù)字的書(shū)寫(xiě)風(fēng)格、工整程度可以有相當(dāng)大的差別,因此必須弄清一個(gè)指標(biāo)在怎樣的樣本集合下獲得的。5.2實(shí)驗(yàn)結(jié)果分析在實(shí)驗(yàn)過(guò)程中,我們以三組樣本作為訓(xùn)練樣本對(duì)知識(shí)庫(kù)的參數(shù)進(jìn)行調(diào)整,這三組訓(xùn)練樣本分別為100個(gè)標(biāo)準(zhǔn)字體存在的樣本,100個(gè)手寫(xiě)體樣本,以及1000個(gè)手寫(xiě)體樣本,利用攝像頭輸入的手寫(xiě)體樣本訓(xùn)練結(jié)果如表5.1所示,直接讀圖的手寫(xiě)體樣本訓(xùn)練結(jié)果如表5.2所示,利用手寫(xiě)板輸入的手寫(xiě)體樣本訓(xùn)練結(jié)果如表5.3所示。由表5.1所示,因?yàn)閿z像頭識(shí)別會(huì)受到光線,攝像頭像素等客觀條件的影響,所以每次每個(gè)樣本測(cè)試出的結(jié)果有可能略有不同,因此利用攝像頭輸入的手寫(xiě)體數(shù)字識(shí)別率較低,才有52%。而由表5.2所示,以標(biāo)準(zhǔn)字體存在的手寫(xiě)體數(shù)字識(shí)別率較高,達(dá)到了84%。由表5.3所示,字符0、2、9的誤識(shí)率較高,這是由于它們的標(biāo)準(zhǔn)特征向量距離較小,需要通過(guò)增添標(biāo)準(zhǔn)庫(kù)等方法對(duì)此情況進(jìn)行改進(jìn)。實(shí)驗(yàn)結(jié)果表明,基于所用結(jié)構(gòu)模型和知識(shí)庫(kù)的識(shí)別方法對(duì)規(guī)范手寫(xiě)體數(shù)字是可行的,具有較高的識(shí)別率及較好的抗噪性能,也可以識(shí)別一定條件下的自由手寫(xiě)體數(shù)字。為了提高識(shí)別率和可靠性,除了要增強(qiáng)對(duì)噪聲的濾除能力外,還要增大知識(shí)庫(kù),以解決細(xì)化中出現(xiàn)的結(jié)構(gòu)畸變問(wèn)題,這些都有待我們進(jìn)一步的研究。表5-1利用攝像頭輸入的手寫(xiě)體訓(xùn)練結(jié)果表5-2直接讀圖的手寫(xiě)體訓(xùn)練結(jié)果數(shù)字類(lèi)別正識(shí)樣本數(shù)誤識(shí)樣本數(shù)識(shí)別率04640%15550%24640%35550%47370%56460%65550%73730%87370%96460%合計(jì)524852%數(shù)字類(lèi)別正識(shí)樣本數(shù)誤識(shí)樣本數(shù)識(shí)別率06460%18280%29190%39190%49190%59190%67370%79190%89190%99190%合計(jì)841684%表5-3利用手寫(xiě)板輸入的手寫(xiě)體訓(xùn)練結(jié)果數(shù)字類(lèi)別正識(shí)樣本數(shù)誤識(shí)樣本數(shù)識(shí)別率0604060%1861486%2653565%3891189%4613961%5901090%692892%7851585%8732773%9692969%合計(jì)77023077%第六章結(jié)論6.1畢業(yè)設(shè)計(jì)總結(jié)經(jīng)過(guò)這段時(shí)間的努力,我們的畢業(yè)設(shè)計(jì)終于如期完成。在這期間,我們查閱了大量的文獻(xiàn),對(duì)手寫(xiě)數(shù)字識(shí)別做了比較深刻的了解,并實(shí)現(xiàn)在Matlab環(huán)境中識(shí)別數(shù)字。結(jié)果表明對(duì)所做數(shù)字的識(shí)別率還是比較高,基本達(dá)到要求。本論文是對(duì)本次畢業(yè)設(shè)計(jì)的總結(jié),主要做的工作有以下幾點(diǎn):(1)查閱文獻(xiàn)資料,對(duì)手寫(xiě)數(shù)字識(shí)別進(jìn)行調(diào)研,找出系統(tǒng)設(shè)計(jì)的幾種方法。(2)熟悉Matlab編程環(huán)境,并對(duì)Matlab語(yǔ)言進(jìn)行深入的學(xué)習(xí)。(3)實(shí)現(xiàn)基于特征提取的手寫(xiě)識(shí)別系統(tǒng)的編寫(xiě)工作。(4)對(duì)系統(tǒng)進(jìn)行調(diào)試和進(jìn)一步優(yōu)化。本次畢業(yè)設(shè)計(jì)還存在較多需改善和完善的工作,具體有以下兩點(diǎn):手寫(xiě)數(shù)字變形問(wèn)題是非特定人脫機(jī)手寫(xiě)數(shù)字識(shí)別中的關(guān)鍵問(wèn)題,在模版匹配的過(guò)程中,由于手寫(xiě)變形的存在,單模板字典顯得不足,因此有必要生成多模板字典,但在本設(shè)計(jì)中,由于人力等問(wèn)題,樣本庫(kù)中的樣本無(wú)法達(dá)到成百上千的數(shù)目,因而識(shí)別率不是很高。特征提取過(guò)程中的特征抽取是模式識(shí)別的一個(gè)重要環(huán)節(jié),抽取穩(wěn)定且有效的特征是識(shí)別系統(tǒng)成功的關(guān)鍵。一般認(rèn)為,手寫(xiě)體數(shù)字的筆畫(huà)及其相對(duì)位置關(guān)系是手寫(xiě)體數(shù)字中最為穩(wěn)定的特征,然而,直接從數(shù)字點(diǎn)陣圖象上準(zhǔn)確地抽取數(shù)字的每一個(gè)筆畫(huà)并找出其相對(duì)位置關(guān)系則十分困難,早期利用結(jié)構(gòu)模式識(shí)別方法來(lái)識(shí)別手寫(xiě)體數(shù)字的研究人員所遇到的問(wèn)題和困難證實(shí)了這一點(diǎn)。統(tǒng)計(jì)特征具有良好的抗噪聲、抗筆畫(huà)的粘連與斷裂等特性,但是,數(shù)字具有二維結(jié)構(gòu),單純利用統(tǒng)計(jì)特征還不能很好的反映出數(shù)字的結(jié)構(gòu)信息,所以,一種有效的手寫(xiě)體數(shù)字特征應(yīng)該將數(shù)字的統(tǒng)計(jì)特性與結(jié)構(gòu)信息結(jié)合起來(lái),將數(shù)字筆畫(huà)的特性與數(shù)字背景空白處的特性結(jié)合起來(lái)。6.2課題前景與展望手寫(xiě)識(shí)別不應(yīng)該只局限于一種方法,應(yīng)該多種方法相結(jié)合,這里我們提一下統(tǒng)計(jì)模式識(shí)別和神經(jīng)網(wǎng)絡(luò)識(shí)別。統(tǒng)計(jì)模式識(shí)別根據(jù)特征抽取區(qū)域的不同可粗略地分為全局統(tǒng)計(jì)特征和局部統(tǒng)計(jì)特征兩大類(lèi)。與結(jié)構(gòu)法相比,統(tǒng)計(jì)法具有良好的抗噪聲、抗干擾的性能??梢韵扔媒y(tǒng)計(jì)方法進(jìn)行粗分類(lèi),再用結(jié)構(gòu)方法進(jìn)行細(xì)分類(lèi)來(lái)區(qū)分相似數(shù)字,即兩種方法的串聯(lián);也可以將兩種方法并聯(lián)使用,然后進(jìn)行綜合集成,這是近年來(lái)識(shí)別領(lǐng)域的一個(gè)重要研究方向。神經(jīng)網(wǎng)絡(luò)識(shí)別,用于識(shí)別的人工神經(jīng)網(wǎng)絡(luò)模型有:hopfield神經(jīng)網(wǎng)絡(luò)、前向多層神經(jīng)網(wǎng)絡(luò)(如bp算法、rbf網(wǎng)絡(luò)等)、art網(wǎng)絡(luò)、自組織特征映射網(wǎng)絡(luò)、認(rèn)知器模型等等。目前常用的做法是將神經(jīng)網(wǎng)絡(luò)方法和傳統(tǒng)的識(shí)別方法結(jié)合起來(lái)使用,互相取長(zhǎng)補(bǔ)短,如先用傳統(tǒng)的方法抽取較為穩(wěn)定的特征,然后再用神經(jīng)網(wǎng)絡(luò)進(jìn)行自組織聚類(lèi)學(xué)習(xí)并設(shè)計(jì)性能良好的分類(lèi)器等。人們正以期盼的目光注視著人腦功能的揭示和神經(jīng)網(wǎng)絡(luò)的進(jìn)一步發(fā)展[23]。脫機(jī)手寫(xiě)數(shù)字識(shí)別的預(yù)處理,是探討直接從數(shù)字點(diǎn)陣圖象上補(bǔ)償手寫(xiě)變形、減小屬于同一類(lèi)別的不同模式之間的差異的理論和方法。通常,直接從數(shù)字點(diǎn)陣圖象上消除手寫(xiě)變形的方法有兩種,即非線性規(guī)一化方法和變換函數(shù)法。非線性規(guī)一化是預(yù)處理方法的主流和核心,其目的主要是將不同大小的數(shù)字點(diǎn)陣規(guī)一化成相同大小并直接在數(shù)字點(diǎn)陣圖象上矯正手寫(xiě)變形,常用的非線性規(guī)一化方法有:基于點(diǎn)密度均衡的非線性規(guī)一化、基于筆畫(huà)穿透數(shù)目均衡的非線性規(guī)一化、基于筆畫(huà)間隔均衡的非線性規(guī)一化、基于線密度均衡的非線性規(guī)一化、等,各種非線性規(guī)一化方法的主要區(qū)別在于如何刻畫(huà)數(shù)字筆畫(huà)的疏密程度的不同,使得規(guī)一化后的漢字點(diǎn)陣中筆畫(huà)分布盡量均勻。變換函數(shù)法也是近年來(lái)圖象識(shí)別及文字識(shí)別的一個(gè)研究方向,常用的變換函數(shù)法有基于幾何模型的變換函數(shù)法、余弦整形變換函數(shù)法、基于筆畫(huà)傾斜角度的變換函數(shù)法等。三種方法各有優(yōu)缺點(diǎn),能解決的不同類(lèi)型的手寫(xiě)變形。但是,目前的變換函數(shù)法的自適應(yīng)能力不強(qiáng),如何根據(jù)不同的手寫(xiě)變形自適應(yīng)地采用不同的變換函數(shù)和不同的處理方法可能是變換函數(shù)法今后的研究方向[24]。致謝畢業(yè)設(shè)計(jì)完成了,我們衷心地感謝所有在這期間指導(dǎo)和幫助過(guò)我們的人。首先,我們要感謝崔瑞龍同學(xué),他為我們提出了寶貴的意見(jiàn)。他對(duì)科學(xué)的鉆研精神,值得我們學(xué)習(xí)。然后,感謝同組同學(xué)的支持、鼓勵(lì)和幫助。是我們兩人的密切配合,才使畢業(yè)設(shè)計(jì)和論文如期完成。最后,感謝我們的導(dǎo)師老師。在整個(gè)畢業(yè)設(shè)計(jì)過(guò)程中,老師給予了我們悉心的教誨與指導(dǎo),有了她理論上與技術(shù)上的大力支持,才使我們的畢業(yè)設(shè)計(jì)得以順利開(kāi)展。從老師身上,我們也看到了力求完美、務(wù)實(shí)創(chuàng)新的科研態(tài)度,老師高效、嚴(yán)謹(jǐn)?shù)目茖W(xué)作風(fēng),讓我們受益匪淺。參考文獻(xiàn)[2]馬向辰.字符識(shí)別系統(tǒng)中圖像預(yù)處理方法的研究[D].北京:北京科技大學(xué),2002.[3]郝紅衛(wèi).手寫(xiě)體字符的識(shí)別與集成[D].北京:中國(guó)科學(xué)院聲學(xué)研究所,1998.[4]李珺.手寫(xiě)體數(shù)字識(shí)別方法研究[J].甘肅科技,no.8,2003.[5]鄧魏.MATLAB在圖像處理和分析中的應(yīng)用[J].農(nóng)機(jī)化研究,2006.[6]張捷.手寫(xiě)數(shù)字識(shí)別的研究與應(yīng)用.西安:西安建筑科技大學(xué),2004.[8]蔡炯熙.基于旋轉(zhuǎn)不變性的印刷體數(shù)字識(shí)別[J].計(jì)算機(jī)應(yīng)用,no.3,2002.[9]陳榮保,陳翊.手寫(xiě)體數(shù)字的識(shí)別[D].合肥:合肥工業(yè)大學(xué)工業(yè)自動(dòng)化研究所,2003.[10]侯繼紅,徐軍.手寫(xiě)體數(shù)字識(shí)別技術(shù)的研究[J].電子計(jì)算機(jī)與外部設(shè)備,no.5,1999.[11]王沫然.MATLAB與科學(xué)計(jì)算(第2版)[M].北京:電子工業(yè)出版社,2003.[12]孫兆林.MATLAB6.X圖像處理[M].北京:清華大學(xué)出版社,2002.[13]傅德勝,壽益禾.圖形圖像處理學(xué)[M].南京:東南大學(xué)出版社,2002.[14]張平等.matlab基礎(chǔ)與應(yīng)用簡(jiǎn)明教程[M].北京:北京航空航天大學(xué)出版社,2001.[15]J.P.MarquesdeSa著,吳逸飛譯.模式識(shí)別――原理、方法及應(yīng)用[M].北京:清華大學(xué)出版社,2002.[16]岡薩雷斯.數(shù)字圖像處理(MATLAB版).北京:電子工業(yè)出版社,2005.9.[17]章毓晉.圖象處理和分析.北京:清華大學(xué)出版社[M],2003.[18]張宏林.數(shù)字圖象模式識(shí)別技術(shù)及工程實(shí)踐[M].北京:人民郵電出版社,2004.[19]飛思科技產(chǎn)品研發(fā)中心.matlab6.5輔助圖像處理[M].北京:電子工業(yè)出版社,2003.[20]林曉帆,丁曉青,吳佑壽.手寫(xiě)數(shù)字識(shí)別的原理及應(yīng)用[M].北京:清華大學(xué)出版社,2002.[21]葛哲學(xué).精通MATLAB.北京:電子工業(yè)出版社.2008.2.[22]鄒偉.高精度手寫(xiě)體數(shù)字識(shí)別的算法研究及應(yīng)用[D].北京:北京郵電大學(xué),2001.[23]許志影,李晉平.MATLAB及其在圖像處理中的應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,2003(4):64-65.[24]柳回春,馬樹(shù)元,吳平東,楊峰,曾興生,畢路拯.基于結(jié)構(gòu)特征的手寫(xiě)體數(shù)字識(shí)別算法[J].附錄附1、識(shí)別部分主程序clccleartupian=imread('shengchengwenjian\zjdqtpsctp.jpg');imshow(tupian);ifsize(tupian,3)==3tupian=rgb2gray(tupian); %將RGB圖形轉(zhuǎn)換成灰度圖endthreshold=graythresh(tupian); %進(jìn)行全局圖像閾值選取tupian=~im2bw(tupian,threshold); %將圖像轉(zhuǎn)換為基于閾值的二進(jìn)制圖像tupian=bwareaopen(tupian,30); %刪除小面積圖形word=[]; %將圖象信息存入矩陣sy=tupian;fid=fopen('shengchengwenjian\zjdqtpsbscwb.txt','wt');%創(chuàng)建txt用于寫(xiě)入數(shù)據(jù)loadtemplatesglobaltemplatesshuzis=size(templates,2);while1[qgsy]=qgtp(sy); %對(duì)圖像行切割,qg是切割出來(lái)的塊,sy是剩余部分clhtp=qg;[LN]=bwlabel(clhtp); %對(duì)圖像中的八連接區(qū)域由上到下,左到右編碼,然后給Lforn=1:N[r,c]=find(L==n); %把區(qū)域n的每個(gè)元素的行標(biāo)給r列標(biāo)給c,r、c均為列矩陣n1=clhtp(min(r):max(r),min(c):max(c)); %把切割出來(lái)的圖像中區(qū)域n分割出來(lái)img_r=imresize(n1,[4224]); %把區(qū)域n的圖像變得與模板同樣大小shuzi=dqsz(img_r,shuzis); %讀數(shù)字word=[wordshuzi]; %讀的數(shù)字給wordendfprintf(fid,'%s\n',word); %把數(shù)字寫(xiě)到fid指定的文件word=[];ifisempty(sy)breakendend附2、創(chuàng)建模板部分函數(shù)A001=imread('letters_numbers\A.bmp');A002=imread('letters_numbers\B.bmp');A003=imread('letters_numbers\C.bmp');A004=imread('letters_numbers\
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度危險(xiǎn)化學(xué)品儲(chǔ)存安全合同書(shū)模板3篇
- 教育領(lǐng)域中的農(nóng)業(yè)科技應(yīng)用與實(shí)踐
- 二零二五年度車(chē)庫(kù)門(mén)行業(yè)信息化建設(shè)與支持合同4篇
- 生物醫(yī)學(xué)工程專(zhuān)業(yè)人才需求與培養(yǎng)方案
- 二零二五年度尊享不過(guò)戶(hù)二手房買(mǎi)賣(mài)合同3篇
- 2025年度個(gè)人所得稅贍養(yǎng)老人專(zhuān)項(xiàng)附加扣除協(xié)議執(zhí)行細(xì)則3篇
- 2025年度個(gè)人二手房購(gòu)房合同范本及稅費(fèi)代繳服務(wù)協(xié)議3篇
- AI驅(qū)動(dòng)的智能醫(yī)療設(shè)備進(jìn)展報(bào)告
- 科技驅(qū)動(dòng)的小學(xué)道德與法治教育變革
- 珠海廣東珠海市斗門(mén)區(qū)人民法院特邀調(diào)解員招聘10人筆試歷年參考題庫(kù)附帶答案詳解
- 口腔醫(yī)學(xué)中的人工智能應(yīng)用培訓(xùn)課件
- 工程質(zhì)保金返還審批單
- 【可行性報(bào)告】2023年電動(dòng)自行車(chē)項(xiàng)目可行性研究分析報(bào)告
- 五月天歌詞全集
- 商品退換貨申請(qǐng)表模板
- 實(shí)習(xí)單位鑒定表(模板)
- 六西格瑪(6Sigma)詳解及實(shí)際案例分析
- 機(jī)械制造技術(shù)-成都工業(yè)學(xué)院中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- 數(shù)字媒體應(yīng)用技術(shù)專(zhuān)業(yè)調(diào)研方案
- 2023年常州市新課結(jié)束考試九年級(jí)數(shù)學(xué)試卷(含答案)
- 正常分娩 分娩機(jī)制 助產(chǎn)學(xué)課件
評(píng)論
0/150
提交評(píng)論