版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、 文字識別技術 簡介簡介文字識別一般包括文字信息的采集、信息的分析與處理、信息的分類判別等幾個部分。信息采集 將紙面上的文字灰度變換成電信號,輸入到計算機中去。信息采集由文字識別機中的送紙機構(gòu)和光電變換裝置來實現(xiàn),有飛點掃描、攝像機、光敏元件和激光掃描等光電變換裝置。信息分析和處理 對變換后的電信號消除各種由于印刷質(zhì)量、紙質(zhì)(均勻性、污點等)或書寫工具等因素所造成的噪音和干擾,進行大小、偏轉(zhuǎn)、濃淡、粗細等各種正規(guī)化處理。信息的分類判別 對去掉噪聲并正規(guī)化后的文字信息進行分類判別,以輸出識別結(jié)果。識別方法識別方法 模板匹配法 將輸入的文字與給定的各類別標準文字(模板)進行相關匹配,計算輸入文字與
2、各模板之間的相似性程度,取相似度最大的類別作為識別結(jié)果。這種方法的缺點是當被識別類別數(shù)增加時,標準文字模板的數(shù)量也隨之增加。這一方面會增加機器的存儲容量,另一方面也會降低識別的正確率,所以這種方式適用于識別固定字型的印刷體文字。這種方法的優(yōu)點是用整個文字進行相似度計算,所以對文字的缺損、邊緣噪聲等具有較強的適應能力。 幾何特征抽取法 抽取文字的一些幾何特征,如文字的端點、分叉點、凹凸部分以及水平、垂直、傾斜等各方向的線段、閉合環(huán)路等,根據(jù)這些特征的位置和相互關系進行邏輯組合判斷,獲得識別結(jié)果。這種識別方式由于利用結(jié)構(gòu)信息,也適用于手寫體文字那樣變型較大的文字。模板匹配的流程模板匹配的流程 建立
3、標準模板庫建立標準模板庫 文字識別文字識別1. 文字分割2. 特征提取3. 相似度比較 模板比較和識別方法模板比較和識別方法 遇到未知字符則更新模板庫遇到未知字符則更新模板庫標準模板庫標準模板庫 確定標準圖像確定標準圖像 待識別圖像的比較待識別圖像的比較 分辨率分辨率100100120120文字讀入與分割文字讀入與分割(1) 讀入圖像并轉(zhuǎn)換為灰度圖讀入圖像并轉(zhuǎn)換為灰度圖 將灰度圖進行二值化將灰度圖進行二值化文字讀入與分割文字讀入與分割(2) 對列求和,若為對列求和,若為0 0則可以作為分則可以作為分割線割線 橫向求和,去除上下的黑邊橫向求和,去除上下的黑邊文字讀入與分割文字讀入與分割(3) 執(zhí)
4、行了分割執(zhí)行了分割 對分割后圖片使用對分割后圖片使用matlabmatlab內(nèi)置的內(nèi)置的imresizeimresize函數(shù)進行標準化函數(shù)進行標準化模板比較和識別模板比較和識別 將輸入圖像與標準模板異或操作將輸入圖像與標準模板異或操作 每個像素點的分量相加每個像素點的分量相加 結(jié)果越小則匹配相似度越高結(jié)果越小則匹配相似度越高模板庫的更新模板庫的更新 異或結(jié)果均得到較大值時異或結(jié)果均得到較大值時 經(jīng)過一定實驗得到了一個經(jīng)驗值經(jīng)過一定實驗得到了一個經(jīng)驗值40004000 如果和所有模板的結(jié)果都超過如果和所有模板的結(jié)果都超過40004000,則認為匹配失敗,需要更,則認為匹配失敗,需要更新新運行結(jié)果運行結(jié)果1 輸入了輸入了8 8個字母,其中個字母,其中X X不在模板不在模板庫之中庫之中運行結(jié)果運行結(jié)果2 X X沒有識別出來,添加沒有識別出來,添加X X的模板之的模板之后重新識別,能夠識別出來后重新識別,能夠識別出來局限性與不足局限性與不足 筆畫太細會造成無法識別筆畫太細會造成無法識別 有偏角和過于潦草的字無法識別有偏角和過于潦草的字無法識別 相似度太大的字母無法識別相似度太大的字母無法識別(C(C和和c c,X X和和x)x) 經(jīng)驗值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024專利知識產(chǎn)權(quán)合同
- 2024五星級酒店食品供應與采購勞務合同
- 2024外架搭設合同
- 2024軟件項目委托開發(fā)合同
- 2024年度旅游景點開發(fā)合作協(xié)議
- 2024年度安置房買賣合同中的違約責任
- 2024年度新能源項目開發(fā)建設合同
- 文書模板-充電樁股份轉(zhuǎn)讓合同
- 2024年度貨物買賣合同商品描述與支付方式詳解
- 2024年幼兒園教育聯(lián)盟協(xié)議
- 國開電大 可編程控制器應用實訓 形考任務6實訓報告
- GB/T 34120-2023電化學儲能系統(tǒng)儲能變流器技術要求
- 跨國企業(yè)中方外派人員的跨文化適應
- 《道路交叉設計》課件
- 《活著》讀后感-課件
- 體檢報告匯總分析中風險的防范
- 村里建群管理制度
- 【城市軌道交通運營安全管理研究5300字】
- 2024年中核匯能有限公司招聘筆試參考題庫含答案解析
- 上海市2024屆高三7月模擬預測歷史試題(等級考)(解析版)
- 肺炎護理查房課件
評論
0/150
提交評論