OCR自動閱卷解決方案_第1頁
OCR自動閱卷解決方案_第2頁
OCR自動閱卷解決方案_第3頁
OCR自動閱卷解決方案_第4頁
OCR自動閱卷解決方案_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 OCR自動閱卷解決方案北京文通科技有限公司2014年4月目錄第一章背景介紹1第二章系統(tǒng)概述2第三章解決方案21處理流程22功能介紹33系統(tǒng)拓撲結(jié)構(gòu)54方案組成65系統(tǒng)特點76應(yīng)用效果8Best Regards!劉經(jīng)理 北京文通科技有限公司BeijingWintoneScience & Technology Corporation Ltd.地址:北京海淀區(qū)北四環(huán)西路9號銀谷大廈16層1609室郵編:手機:公司網(wǎng)址:E-mail:第一章 背景介紹問卷是政府機關(guān)、教育機構(gòu)、公司、企業(yè)和媒體做專題調(diào)查并且期望得到結(jié)

2、果的一種方式。對問卷結(jié)果的錄入和統(tǒng)計傳統(tǒng)方式都是采用人工作業(yè),對于數(shù)量特別多的問卷,處理起來會花費大量的人力和時間,甚至不能在期望的時間內(nèi)完成。另外,有些調(diào)查問卷也是客戶、會員等資料的收集渠道,因此調(diào)查問卷的結(jié)果除了進行必要的保存以及分析外,還需要進行必要的影像管理和查詢。例如像一年一度的全國高考這樣的大型考試,數(shù)千萬份試卷的批閱,對高考的閱卷系統(tǒng)就提出了嚴峻的挑戰(zhàn)。第二章 系統(tǒng)概述傳統(tǒng)的人工閱卷方式,工作量大,出錯率高,整個過程可謂高成本低效率。而傳統(tǒng)的OMR閱卷技術(shù)也隨著近年來的大范圍應(yīng)用,其不足之處也日漸顯現(xiàn):首先是對答題卡的印刷質(zhì)量要求非常苛刻,答題卡不能折疊、起皺,字跡亦不能潦草,否

3、則處理起來困難重重,錯判誤判現(xiàn)象更是時有發(fā)生。OMR答題方式并不直觀,考生涂填答題卡時非常容易出錯,例如錯位;信息采集量少,不易改變答題卡的內(nèi)容;不能保存原始圖像,查對時必須對照原卡或原考卷,極大地增加了工作量;如果考生想修改所選答案,由于擦涂不干凈,極易產(chǎn)生錯判現(xiàn)象,特別是當考生進行多項選擇時。OMR技術(shù)的不足,在考生資源巨大的情形下尤其明顯,例如高考。由于OMR技術(shù)對考生成績誤判、錯判、漏判的現(xiàn)象屢屢發(fā)生,在一定程度上嚴重影響了考試的公平公正性。針對當前市場上的實際需求,文通科技推出了基于清華TH-OCR(光學(xué)字符識別)技術(shù)的自動閱卷系統(tǒng),該系統(tǒng)首先通過高速掃描儀對問卷進行快速掃描,然后對

4、掃描得到的圖像進行OCR識別,最后對識別得到的結(jié)果進行校對,并將校對后的結(jié)果存入數(shù)據(jù)庫中。文通OCR自動閱卷系統(tǒng)為廣大用戶提供了一套完整而周全的解決方案,充分滿足了用戶對問卷數(shù)據(jù)采集的四個需求:高質(zhì)量、高效率、低成本、低風(fēng)險。作為該解決方案的核心,清華TH-OCR識別引擎,是由清華大學(xué)電子工程系智能圖文信息處理實驗室研制,是國家“863”計劃支持的重要科研成果。該識別引擎包含了表格處理、手寫數(shù)字識別、印刷體中英文識別等多種技術(shù),在識別率、適應(yīng)能力、校對能力等方面均位居國際領(lǐng)先水平。第三章 解決方案1 處理流程識別問卷掃描識別為了達到最佳的識別效果,從而提高數(shù)據(jù)統(tǒng)計的準確性,文通對系統(tǒng)識別流程做

5、了周密的設(shè)計(詳見下圖)。2 功能介紹 問卷掃描系統(tǒng)連接高速掃描儀,按照每份問卷的頁序進行掃描。系統(tǒng)會自動按照每份問卷的頁數(shù)分組,并添加到主界面左邊的樹結(jié)構(gòu)中。高速掃描儀的掃描速度在3060頁/分鐘。 問卷識別系統(tǒng)自動對掃描進來的問卷識別,首先自動分類問卷,然后依據(jù)不同的模板對問卷OCR識別。識別速度平均為1張/秒,結(jié)合掃描速度3060頁/分鐘,掃描和識別可以同步處理,系統(tǒng)總體處理速度為3060頁/分鐘,以人工閱卷12分鐘/頁對比,OCR的數(shù)據(jù)采集速率是人工閱卷速率的30120倍(注:表格的復(fù)雜程度對人工閱卷速率的影響明顯,而對OCR系統(tǒng)處理速率的影響微乎其微),可見OCR技術(shù)的絕對優(yōu)勢。 問

6、卷校對系統(tǒng)提供全圖映射校對方式,直觀簡潔,用戶光標定位到任一窗口的任一位置,系統(tǒng)會自動定位到另一窗口的對應(yīng)位置。 數(shù)據(jù)入庫統(tǒng)計系統(tǒng)按照預(yù)先建立的問卷表,把識別的結(jié)果導(dǎo)入到相應(yīng)的數(shù)據(jù)表中,并按照問卷設(shè)定的評分規(guī)則實時對數(shù)據(jù)做評分計算,評分統(tǒng)計結(jié)果與問卷掃描識別同步完成。 報表輸出用戶可定制豐富的報表輸出,定制查詢和報表輸出功能,用戶可方便打印各單位的得分情況和總體的考評情況,及時掌握各單位年度的工作情況。3 系統(tǒng)拓撲結(jié)構(gòu)可根據(jù)不同的應(yīng)用場景靈活配置,根據(jù)問卷調(diào)查的規(guī)模確定處理客戶端的數(shù)量,系統(tǒng)具有很強的可擴展性;方案的部署比較簡單,在現(xiàn)場布置局域網(wǎng)即可,甚至掃描識別客戶端、數(shù)據(jù)庫、任務(wù)管理工作都

7、可以在一臺計算機上完成。系統(tǒng)的拓撲圖如下:4 方案組成 掃描儀及驅(qū)動程序掃描儀對問卷快速掃描,驅(qū)動軟件具有智能化處理的完美頁面掃描功能,自動完成影像的歪斜校正、原稿尺寸裁剪、去底色、旋轉(zhuǎn)、去白頁等功能。可同時得到掃描稿件的黑白、灰度、彩色三種影像輸出,并且針對稅票特征配置了最優(yōu)化的對比度、亮度,為后續(xù)OCR(文字識別)提供優(yōu)質(zhì)的影像。 OCR自動閱卷客戶端軟件文通OCR識別技術(shù)已在中組部、全國武警總隊系統(tǒng)中成熟應(yīng)用,技術(shù)特點如下:a) 準確率在達99%:充分利于框線、框線顏色、標題內(nèi)容、標題顏色、文本內(nèi)容、文本顏色等多種特征來進行版面的區(qū)分;相似憑證、多聯(lián)憑證、同聯(lián)憑證打印多種交易均可準確區(qū)分

8、。b) 識別類型豐富:系統(tǒng)支持印刷體中英數(shù)混排識別、印刷漢字識別、印刷英文識別、印刷數(shù)字識別、手寫漢字識別、手寫英文識別、手寫數(shù)字識別、磁碼識別、條形碼識別等引擎。c) 識別速度快:200DPI彩色圖像,生產(chǎn)線上平均識別時間約500ms,300DPI彩色圖像,識別平均時間約為1秒。 OCR識別引擎(SDK)OCR識別引擎(SDK)以DLL(動態(tài)鏈接庫)或者OCX控件的方式提供客戶端調(diào)用。5 系統(tǒng)特點 識別性能強勁w 識別字符類型豐富,系統(tǒng)能識別的字符 印刷中文(簡體)、印刷中文(繁體) 、印刷英文、印刷數(shù)字 手寫中文(簡體) 、手寫中文(繁體)、手寫英文、手寫數(shù)字 標識碼、條碼、 CheckB

9、ox 等w 識別速度快 一張表格的速度在1.0秒鐘左右; w 識別率高 對版面整潔的印刷字符的識別,正確率達99.96% 對于規(guī)范手寫數(shù)字的識別,正確率在99.5%以上 對于規(guī)范手寫漢字的識別,正確率在93%左右; 抗干擾能力強文通強大的數(shù)字圖像處理技術(shù),能對圖像自動糾偏、去黑邊、去除裝訂孔、去噪、圖像增強弱化,多樣的二值化手段保障為識別輸入優(yōu)質(zhì)的圖像;文通成熟的OCR技術(shù)提供高精度的識別,對彩色、灰度、二值圖像均適用。 可保留原始圖像可以將識別完的圖像保存到光盤等大容量的存貯介質(zhì),長久地保存,既安全又方便,不需要再保留原始紙質(zhì)問卷,大大減少了問卷存檔管理的費用和紙張堆放的空間。 提供可集成SDK系統(tǒng)背后有強大的TH-OCR表格識別引擎支撐,同時該引擎以標準的DLL方式提供二次開發(fā),用戶可把表格識別技術(shù)嵌入到自己的應(yīng)用系統(tǒng)中,滿足多樣化的需求。第四章 關(guān)于文通北京文通科技有限公司是在原國家科委的支持下,為推廣應(yīng)用清華大學(xué)電子工程系的科

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論