版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
文通TH-OCR資料數(shù)字化系統(tǒng)自有產(chǎn)品事業(yè)部編寫人:王亞鵬文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第1頁!
專業(yè)的檔案、公文、圖書、剪報冊等紙介質文檔及電子文檔的數(shù)字化工具。1.系統(tǒng)特點:雙層PDF技術及版式還原技術處于業(yè)內領先水平單字識別率達到行業(yè)內領先水平題錄信息可以自定義工序可以自定義2.應用領域政府部門出版社圖書館電力行業(yè)報社一.軟件用途文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第2頁!二.軟件簡介資料數(shù)字化系統(tǒng)管理端ACCESS數(shù)據(jù)庫(備選SQL數(shù)據(jù)庫)加工端1.總體架構文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第3頁!2.1管理端簡介:角色管理角色管理分為:角色創(chuàng)建、修改、刪除、成員管理用戶管理用戶管理:用戶管理包括添加用戶、用戶資料修改、用戶權限設置工作量統(tǒng)計按照工作量、時間段等進行各種統(tǒng)計及生成報表題錄數(shù)據(jù)設置根據(jù)客戶要求進行題錄項的設置文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第4頁!加工工序選擇生成加工工序數(shù)據(jù)流通道3.1任務調度中心文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第5頁!可以對檔案、圖書、公文、報紙等進行自動版面分析。將版面分為橫排文本、豎排文本、圖像、表格四種類型。用戶也可以根據(jù)需求,進行手動版面分析。3.3版面分析豎排文本圖像表格橫排文本文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第6頁!可以進行簡繁日韓英五種語言的文字識別:簡體多體繁體多體簡體全字集繁體全字集手寫體純英文日文韓文識別語言種類文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第7頁!查錯率高,集字校對編輯器把識別結果相同的文字對應的圖像顯示在一起。由于少數(shù)錯誤的字與大量正確的字有差別,可以比較容易地發(fā)現(xiàn)錯字,不易漏掉錯誤。集字校對編輯器重新組織文字順序,不會使校對人員陷入到識別文字的故事情節(jié)中。校對效率高,不易疲勞。把集字校對的結果與傳統(tǒng)方法校對的結果進行比較、綜合,就能得到最高的查錯和糾錯效果,得到盡可能低的錯誤率和最好的最終結果。集字校對文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第8頁!識別結果經(jīng)修改編輯后,可根據(jù)需要將文檔存為RTF、PDF或直接保存為TXT格式。導出為PDF格式導出為RTF格式導出為TXT格式導出題錄數(shù)據(jù)3.6生成多種格式文件文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第9頁!題錄著錄:根據(jù)題錄項要求錄入題錄數(shù)據(jù)3.7題錄數(shù)據(jù)錄入文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第10頁!三、典型應用政府行業(yè):中央辦公廳、組織部、紀檢委、保密局等圖書館:清華大學圖書館、北京大學圖書館等出版社:商務印書館、中華書局等電力行業(yè):國電信息中心、各省市電力設計院、各省市電力科學院報杜:大連日報社、深圳特區(qū)報、南方周末文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第11頁!2、圖書館行業(yè)客戶:高校圖書館、國家圖書館、省圖、市圖、區(qū)圖、縣圖等需求:特色館藏,期刊,論文,圖書等3、集成商客戶:方正電子、方正阿帕比、同方知網(wǎng)、萬方數(shù)據(jù)、書生、龍源等需求:數(shù)字出版、資料加工、檔案數(shù)字化等需求文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第12頁!2.管理端管理端角色管理用戶管理工作量統(tǒng)計題錄數(shù)據(jù)設置文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第13頁!3.加工端任務調度掃描及圖處版面分析識別校對制作多種格式文件題錄制作質檢及導出完成制作是否返工否是文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第14頁!自動傾斜校正二值化去裝訂孔去黑邊去雜點3.2圖像處理文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第15頁!識別核心流程版內置文通科技最新研發(fā)的高性能文字識別引擎,識別率達99.8%以上。Unicode編碼采用UNICODE國際編碼標準。系統(tǒng)可在一個統(tǒng)一的平臺下,同時處理包括中文、日文、韓文、英文在內的多種文字的識別和校對修改。XML技術系統(tǒng)基于開放式的XML數(shù)據(jù)結構,可以對數(shù)據(jù)進行擴充和再定義。支持第三方開發(fā)廠商方便地進行文檔數(shù)據(jù)的轉換、遷移和再利用。3.4識別核心技術文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第16頁!橫向校對在識別結果區(qū)域中,通過人工逐字逐句比較識別結果與原始圖像,找到錯誤的地方并修改。浮動跟蹤條可以提高橫向校對的速度,它是將識別的原始圖像塊跟蹤顯示在識別結果上,使識別結果與原始圖像一一對應的顯示,直觀、方便、快捷3.5校對文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第17頁!識別結果與原始圖像塊對照區(qū):第一個方格為識別結果,其后的方格為原始圖像塊識別結果列表區(qū):顯示當前校對圖像的識別結果文字列表原始圖像區(qū)直接輸入的結果字符,可以跳到該字符集字校對文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第18頁!PDF中的文字層用于查詢、檢索、利用,圖像層用于瀏覽,提供給用戶多種應用方式。圖像部分壓縮存儲。對黑白圖像采用G4壓縮,對彩色、灰度圖像采用JPEG壓縮。文字部分所占空間極小。整個文件與壓縮過的圖像文件大小相差無幾。識別圖像文本層圖像層雙層PDF雙層PDF特點文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第19頁!題錄校驗、全文文件檢查、題錄項修改、數(shù)據(jù)導出或上傳3.8質檢、導出或上傳文通THOCR資料數(shù)字化系統(tǒng)共22頁,您現(xiàn)在瀏覽的是第20頁!四、銷售策略1、政府行業(yè)客戶:省級中共辦公廳:機要局、秘
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學通關試題庫(有答案)
- 2024年熟食制品項目資金籌措計劃書代可行性研究報告
- 2024年造紙完成工段智能裝備項目資金申請報告代可行性研究報告
- 2024常年采購協(xié)議條款與條件示例
- 2024年度建材銷售協(xié)議格式
- 2024年專業(yè)門窗安裝服務協(xié)議模板
- 2024公司B棟生產(chǎn)車間租賃協(xié)議
- 員工基本行為準則
- 銀行外匯便利化政策落實情況總結
- 2024年規(guī)范二手公寓房產(chǎn)交易協(xié)議書
- 微型計算機原理與應用習題集及答案
- 河北省唐山市藥品零售藥店企業(yè)藥房名單目錄
- 喵喵老師制作 電子百拼的黑白電路圖
- DB34-T 4010-2021 水利工程外觀質量評定規(guī)程-高清現(xiàn)行
- 《整改報告》模板
- 送達地址確認書(樣本)
- 江蘇省歷屆中學生與社會作文大賽決賽試題及獲獎范文(完整版)資料
- 六年級數(shù)學上冊教案-分數(shù)乘法整理與練習 蘇教版
- 《民航服務禮儀》項目五 地面服務禮儀
- 營業(yè)執(zhí)照借用免責協(xié)議
- 小學道德與法治人教三年級上冊第三單元安全護我成長-《遭遇陌生人》教案
評論
0/150
提交評論