版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第第頁目次TOC\o"1-3"\h\u67221緒論 1233791.1選題背景 1162301.2選題意義 1176731.3Java平臺的文本識別系統(tǒng)需求 2264881.4系統(tǒng)可行性分析 2192852系統(tǒng)總體結(jié)構(gòu)設(shè)計及功能概述 4201452.1系統(tǒng)功能結(jié)構(gòu)設(shè)計圖 4180342.2圖片處理模塊 4280652.2.1上傳文件功能 4207152.2.2圖片預覽功能 5204742.2.3圖片重識功能 5321802.2.4圖片清除功能 5170912.2.5截圖識別功能 6235732.3文字識別模塊 674422.3.1內(nèi)容展示功能 681752.3.2復制文字功能 6163272.3.3清空文字功能 7146263調(diào)用API接口 830313.1OCR技術(shù) 8151293.2百度API接口簡介 8194913.3接口設(shè)計與應(yīng)用 8158164系統(tǒng)的設(shè)計流程與實現(xiàn) 10140754.1系統(tǒng)流程概要介紹 10275624.2系統(tǒng)模塊的劃分與執(zhí)行流程 1032544.3圖片處理模塊功能的實現(xiàn) 11195724.3.1上傳文件功能 11174154.3.2圖片預覽功能 1268094.3.3圖片重識功能 13312194.3.4圖片清除功能 1486714.3.5截圖識別功能 15191034.4文字識別模塊功能的實現(xiàn) 16224084.4.1內(nèi)容展示功能 1685144.4.2復制文字功能 1784184.4.3清空文字功能 17166475系統(tǒng)測試 1990205.1對系統(tǒng)測試的目的和場景 1955395.2系統(tǒng)測試的設(shè)計 1942355.2.1上傳不同文件黑盒測試 1945825.2.2文字識別性能測試 19159515.2.3截圖功能測試 1921397結(jié)論 2116202參考文獻 23中文文本識別系統(tǒng)的實現(xiàn)1緒論1.1選題背景隨著計算機信息技術(shù)的發(fā)展,可以處理的事情越來越多。在當今社會,計算機不再是專業(yè)人士的專利,而是廣泛應(yīng)用于各個方面。從各個方面來看,數(shù)字信息時代給人們的生活帶來了許多好處。在這些網(wǎng)絡(luò)產(chǎn)品中,自動識別系統(tǒng)的開發(fā)無疑是最豐富的產(chǎn)品之一。目前,人們收到的信息大多來自互聯(lián)網(wǎng)和各種數(shù)字媒體。信息存儲有兩種形式:紙質(zhì)文檔和數(shù)字文檔。與紙質(zhì)文檔相比,數(shù)字文檔具有操作簡單、自動分類收集、管理方便、存取方便、存儲空間小、檢索速度快、資源共享、支持遠程瀏覽等優(yōu)點,編輯等便捷的數(shù)字文檔共享可以滿足人們對信息獲取和處理的需求。盡管近年來數(shù)字存儲技術(shù)發(fā)展迅速,但知識的數(shù)字化還有很長的路要走。目前,字符識別系統(tǒng)仍處于瓶頸,社會識別有待提高,識別性能等問題亟待解決,這對開發(fā)者來說是一個巨大的挑戰(zhàn)。隨著ORC技術(shù)的飛速發(fā)展,ORC將逐步普及到人們的日常生活中,在一定程度上提高數(shù)字信息的存儲速度,使人們的生活更加方便快捷。隨著數(shù)字多媒體技術(shù)的飛速發(fā)展,圖像無處不在。這些圖像通常包含很多個人信息,比如車牌、路標、路標等等。隨著越來越多先進的移動智能設(shè)備的普及,數(shù)字圖像、交通標志、遙感圖像等被人們隨時隨地廣泛應(yīng)用于各個領(lǐng)域。為了進一步分析和理解這些圖像中包含的個人信息,許多數(shù)字圖像處理技術(shù)應(yīng)運而生。字符識別是從數(shù)字圖像中提取字符信息的重要技術(shù)。在我們的日常生活中,文本經(jīng)常被用來提醒人們周圍的環(huán)境或物體。使用智能儀器檢測和識別這些圖像中的字符具有非常重要的實際作用。1.2選題意義未來數(shù)字信息存儲將發(fā)生更多變化。如今,最重要的是編寫航空公司或文件,以提高信息存儲的穩(wěn)定性和安全性,因此這兩類航空公司是當今信息存儲的重要組成部分。為了將數(shù)字信息與書面文件結(jié)合起來,促進社會發(fā)展,OCR技術(shù)必須共存,在技術(shù)上進行更新,使兩種存儲形式呈現(xiàn)各自的亮點,以解決手寫文件與數(shù)字信息的互補性,具有更大的現(xiàn)實意義和應(yīng)用前景。Java平臺可能更具挑戰(zhàn)性,但它也帶來了研究價值。目前,很多識別軟件只能識別特定的物體,從而達到一定的特異性或效率。例如,識別軟件只能識別字符。普通身份證很快。然而,當前身份識別軟件的局限性不僅在于功能的需要,還在于OCR技術(shù)的滯后和信息的快速發(fā)展,身份證有許多獨特的設(shè)計和重復程度,各種設(shè)計也不常見。在識別輸入時,如果我們每次識別不同的ID信息時都使用不同的識別軟件,這將花費大量時間,因此我們可以看出在本例中識別是非常必要的。本文基于Java對各種場景和圖片進行了測試,對百度、騰訊等知名企業(yè)的圖片處理和機器學習算法進行了查詢,并對具體實現(xiàn)結(jié)果進行了分析,具有一定的理論研究價值。經(jīng)過多年的實踐,這些算法可以擴展到類似的對象。本文從模式識別的基本原理出發(fā),討論了如何運用模式識別的基本理論,并找到了將OCR技術(shù)應(yīng)用于字符識別系統(tǒng)的相關(guān)算法。字符識別,這種OCR也適用于人工智能或模式分析。在結(jié)構(gòu)分析和全局統(tǒng)計分類分析中,常用的兩種方法,如像素法、高度法、寬度法、高度法和特征變換法,該框架的主要特點是通過結(jié)合分類語法和合理的場景布局,有效地提出了所有字符。1.3Java平臺的文本識別系統(tǒng)需求字符識別系統(tǒng)需要在圖像下載后實現(xiàn)字符識別功能,并為使用該系統(tǒng)的用戶提供文件下載功能。文件下載后,用戶將在系統(tǒng)右側(cè)顯示圖片并輸出,以準確識別文本內(nèi)容,方便用戶更快地使用識別出的文本。該系統(tǒng)具有將文本快速復制到剪貼板的功能,用戶可以存儲數(shù)字信息,并且使用時間更長。如果用戶上傳了錯誤的圖像或想要再次識別圖像,用戶可以掃描圖像和文本,這減少了許多復雜的操作,使得字符識別系統(tǒng)不僅快速準確地識別,還為用戶提供了良好的交互體驗。1.4系統(tǒng)可行性分析(1)經(jīng)濟可行本系統(tǒng)采用的技術(shù)和開發(fā)環(huán)境在實際開發(fā)中應(yīng)用非常廣泛,周期預計20天,每天費用按200/天的話需要4000元,并且硬件需求的話也是使用自己的筆記本電腦,開發(fā)完后可以部署到自己的電腦系統(tǒng)中,那樣服務(wù)器的費用也能免了,寫作、辦公不需要聯(lián)網(wǎng)也能使用本系統(tǒng)進行文字識別,所以一但應(yīng)用后可讓所有PC端用戶都能快捷使用。(2)技術(shù)可行我們熟知常規(guī)的垂直應(yīng)用架構(gòu)現(xiàn)在已經(jīng)無法應(yīng)對,分布式服務(wù)架構(gòu)和流動計算架構(gòu)已勢在必行,迫切需一個治理系統(tǒng)確保架構(gòu)有條不紊的演進。再利用百度應(yīng)用程序接口集成一些優(yōu)秀的API接口保證后臺的高可用和系統(tǒng)安全,再通過添加libraries完成圖形化界面的部署,配置后達到一定程度的高可用和易維護,充分說明本系統(tǒng)在技術(shù)方面可行REF_Ref7773\r\h[8]。2系統(tǒng)總體結(jié)構(gòu)設(shè)計及功能概述2.1系統(tǒng)功能結(jié)構(gòu)設(shè)計圖通過對以上系統(tǒng)需求的分析,可以看出字符識別系統(tǒng)分為兩個模塊,主要包括圖像處理模塊和字符識別功能模塊。圖像處理模塊具有文件選擇、圖像預覽、圖像恢復、清晰圖像識別、快照識別等功能。字符識別模塊具有內(nèi)容顯示和文本復制掃描文本等功能。使用本系統(tǒng),用戶可以選擇下載文件。主要功能是選擇計算機來處理各種信息和圖像。所選圖像在顯示和識別后可以自動識別語音識別區(qū)域,完成獨立的個人信息處理功能,通過內(nèi)容復制系統(tǒng)功能可以快速使用,用戶可以將數(shù)字信息存儲在桌面上;等待字符識別系統(tǒng)的具體功能和結(jié)構(gòu)如圖2-1所示。文字識別系統(tǒng)文字識別系統(tǒng)文字識別模塊圖片處理模塊文字識別模塊圖片處理模塊圖片清除圖片重識圖片預覽上傳文件復制文字截圖識別內(nèi)容展示清空文字圖片清除圖片重識圖片預覽上傳文件復制文字截圖識別內(nèi)容展示清空文字圖2.1功能結(jié)構(gòu)圖2.2圖片處理模塊2.2.1上傳文件功能本系統(tǒng)是基于eclipseswing圖形界面的模塊化設(shè)計。它是一個功能強大、重量輕的swing圖形組件。因此,圖形界面中的按鈕形式稱為腳本工具。我設(shè)計的上傳文件和下面的功能模塊設(shè)計不再是圖形插件的詳細描述。當用戶需要識別文本圖像時,首先上傳圖像文件。當圖形程序插入I/O方法時,此函數(shù)稱為,但加載類型為數(shù)組。這樣,如果圖像是文件類型,是否加載它。如果文件類型匹配,例如如果沒有匹配的文件加載對象,則拋出異常以返回上一個表單。即使在以后的模塊中,也只需要使用這種重載方法。詳細功能描述見表2.1。表2-1上傳文件功能描述上傳文件功能描述提供用戶進行離線上傳文件的功能并同步識別出文字進行的操作判斷文件類型是否符合產(chǎn)生的結(jié)果如果文件類型符合則同步識別出圖片中的文字,如果文件類型不符合則返回上一個窗體2.2.2圖片預覽功能成功選擇并加載圖像后,預覽圖像將顯示在系統(tǒng)中,用戶界面將進行早期定位,圖像將再次顯示到指定位置,并指定文件長度;高度和方向,這樣上傳的圖片可以再次適應(yīng)用戶界面,用戶可以清晰地預覽上傳的圖片。如果上傳失敗或上傳的圖片無法提前完成,詳細功能描述見表2.2。表2-2圖片預覽功能描述圖片預覽功能描述將上傳成功的圖片預覽到界面上進行的操作上傳一張需要文字識別的圖片產(chǎn)生的結(jié)果系統(tǒng)界面上按照指定的縮放圖片進行圖片的渲染以及回顯2.2.3圖片重識功能圖片重識功能并不需要重新再次上傳文件,所以綜上所述只需重載文字識別的方法即可,給用戶提供再次識別的功能,讓用戶更加清晰、準確的知道圖片識別的結(jié)果是否有誤。具體功能描述參見表2-3。表2-3圖片重識功能描述圖片重識功能描述無需再次上傳文件,提供用戶再次對圖片進行識別的功能進行的操作對內(nèi)存中上一次上傳的符合文件類型的圖片文件進行重載文字識別的方法產(chǎn)生的結(jié)果圖片重新進行文字識別2.2.4圖片清除功能圖片清除功能并不是直接刪除這個圖片,因為本系統(tǒng)文字識別功能是基于內(nèi)存來完成的,所以使用本清除功能時對原來上傳成功的文件不會產(chǎn)生任何影響,所以也能稱作軟刪除,將圖片清除功能之后將失去圖片預覽功能,但是可以重新進行圖片上傳功能。具體功能描述參見表2-4。表2-4圖片清除功能描述圖片清除功能描述將圖片進行清除提供用戶下一次上傳操作進行的操作在內(nèi)存中把上一次使用的圖片清除產(chǎn)生的結(jié)果圖片預覽中清除掉回顯的圖片2.2.5截圖識別功能當用戶需要識別的文本不再是文件類型,但無法將圖像類型保存在計算機頁面或其他類型的軟件中時,圖像識別功能可用于識別圖像所需的位置,不僅可以準確識別用戶的身份,而且還可以自動同步上傳到預覽區(qū),這樣可以有效減少用戶訪問圖像和上傳文件等超時操作。詳細功能描述見表2.5。表2-5截圖識別功能描述截圖識別功能描述提供用戶對所需要識別文字的地方進行截圖選取并同步上傳進行的操作將截圖選擇的部分進行上傳產(chǎn)生的結(jié)果用戶通過截圖識別功能選取的部分自動轉(zhuǎn)為圖片格式存取到內(nèi)存中并且進行上傳2.3文字識別模塊2.3.1內(nèi)容展示功能文字識別模塊中最重要的就是把內(nèi)容準確、迅速、完整的展示給用戶,所以內(nèi)容展示功能是將文字識別方法執(zhí)行后生成的文字進行展示,和圖片預覽功能類似,也需要提前設(shè)置展示內(nèi)容的文字大小、定位等,所以用戶進行上傳完圖片之后可以自動將圖片中的文字進行渲染到頁面中。具體功能描述參見表2-6。表2-6內(nèi)容展示功能描述內(nèi)容展示功能描述將識別后的文字到指定窗體中展示進行的操作將用戶上傳的圖片識別成文字產(chǎn)生的結(jié)果在系統(tǒng)右側(cè)圖像界面窗體中通過指定的格式渲染出用戶識別之后的文字2.3.2復制文字功能本系統(tǒng)的初衷就是使用戶能快捷的從指定文件或位置識別出自己想要的文字,所以復制文字功能完全符合本系統(tǒng)的初衷,讓用戶識別完之后的文字只用按一個按鈕就可將內(nèi)容復制到剪貼板,其中復制文字功能也是將內(nèi)容復制到內(nèi)存中,不會對識別出的文字產(chǎn)生影響。具體功能描述參見表2-7。表2-7復制文字功能描述復制文字功能描述將識別出來的文字復制到剪貼板中進行的操作執(zhí)行主窗體界面中的復制功能產(chǎn)生的結(jié)果若文字存在則將全部內(nèi)容復制到剪貼板中,若文字不存在則不產(chǎn)生影響2.3.3清空文字功能當復制完文字內(nèi)容之后或者需要重新識別之后即可使用本清空文字功能,本功能和上述的清空圖片功能類似,只對內(nèi)存中剪貼板的內(nèi)容濟寧進行清空,對本系統(tǒng)識別出來的文件不產(chǎn)生影響,清空文字之后界面中將等待重新識別輸出內(nèi)容。具體功能描述參見表2-8。表2-8清空文字功能描述清空文字功能描述提供用戶對主窗體中的輸出內(nèi)容進行清空進行的操作將識別出來的文字從內(nèi)容預覽窗體中清除產(chǎn)生的結(jié)果若文字存在則將全部內(nèi)容從窗體中清除,若文字不存在則內(nèi)容預覽不受影響3調(diào)用API接口3.1OCR技術(shù)該系統(tǒng)采用光學字符識別(OCR)技術(shù),通過圖像從文本中提取信息,稱為光學字符識別(OCR)。光學字符識別(OCR)OCR是一種掃描文本、圖形和紙張的技術(shù),屬于模式識別(patternrecognition)的知識。這種字符識別是一種知識。只要計算機識別出內(nèi)容的類型,它就可以做出預測。在字符識別領(lǐng)域,人工智能應(yīng)用的主要支柱是教計算機如何通過人類等更深入的物體自動識別紙張、票據(jù)或圖像。如何利用現(xiàn)有的光學字符識別技術(shù)進行圖像識別和模式識別是本章的重點,而模板匹配是通過該領(lǐng)域的數(shù)據(jù)分析方法獲得的我國對OCR的研究在國外相對較晚,因為在20世紀60年代,我國不僅限于國際經(jīng)濟和技術(shù)領(lǐng)域,而且從中很難識別出文本類型。經(jīng)過國外學者多年的研究和探索,光學字符識別技術(shù)在20世紀得到了廣泛的應(yīng)用。它不僅局限于文本的經(jīng)濟性和效果,而且適用于中國發(fā)展的第一階段,沒有這樣的理解。因此,在我國字符識別發(fā)展的早期階段,字符識別的研究相對滯后。在中國社會主義的指導下,各種數(shù)字技術(shù)迅速發(fā)展。因此,OCR技術(shù)在21世紀中國有著廣闊的發(fā)展前景,傳統(tǒng)的文字處理技術(shù)有助于OCR的大規(guī)模發(fā)展。隨著國內(nèi)外信息交流的深入,該領(lǐng)域的技術(shù)越來越成熟和實用。在計算機重復和頻繁交互的基礎(chǔ)上,人們逐漸投資于光學識別。字符識別技術(shù)的發(fā)展給字符識別領(lǐng)域帶來了又一輪的發(fā)展浪潮,使越來越多的人參與到字符識別的深入研究中。該技術(shù)產(chǎn)生了卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、深度置信度網(wǎng)絡(luò)等。各種深度算法結(jié)構(gòu)使得OCR技術(shù)仍處于早期階段,實驗室階段取得了質(zhì)的飛躍。它不僅提高了字符識別的速度,而且在自然場景中取得了良好的字符識別效果。3.2百度API接口簡介百度字符識別應(yīng)用界面是基于業(yè)界領(lǐng)先的深度學習技術(shù),多場景、多語言、高分辨率的全圖像文本檢測和識別服務(wù),ICDAR指標數(shù)量居世界首位。多功能選擇,提供通用字符識別,高精度版本包括位置信息,高精度版本包括位置信息,四個版本,可適應(yīng)不同場景工作對精確識別、速度識別和位置信息的要求;支持多語種識別和字符識別,包括位置信息版本,支持中國、西班牙、葡萄牙、德國、意大利、日本、韓國、英國、法國、俄羅斯、中國、英國等多語種內(nèi)容識別,支持中、英、日、韓測試、高精度、圖像增強、模糊、傾斜、,人臉等,魯棒性強,識別速度快,支持2W+大型數(shù)據(jù)庫,整體識別準確率高達99%;服務(wù)穩(wěn)定、可靠性強百度云技術(shù)提供高可靠性、靈活性、可移植性和高并發(fā)性的字符識別服務(wù),服務(wù)可用性高達99.99%。3.3接口設(shè)計與應(yīng)用第一章指出系統(tǒng)將使用百度API進行字符識別應(yīng)用編程接口,所以我們需要了解百度API接口平臺的一般功能是什么。您可以在AI平臺上看到許多選項,包括文本識別和AI導航欄,可以在控制文本識別功能末尾的下拉列表框中找到,輸入相關(guān)文檔的狀態(tài)。在此頁面上,您可以通過注冊應(yīng)用程序界面的密鑰來查找應(yīng)用程序類型。如果選擇僅識別文本,則選擇所有服務(wù)經(jīng)理識別的默認文本,并填寫應(yīng)用程序名稱和系統(tǒng)描述。當然,除了識別文本,你還可以檢查多個界面,因為百度API技術(shù)已經(jīng)成熟了很多。單擊打開技術(shù)范圍,查找具有不同需求的Java文檔。如果需要人臉識別,請檢查所有人臉識別界面。創(chuàng)建后,單擊應(yīng)用程序菜單上的后退按鈕。在應(yīng)用程序界面菜單中,可以顯示相應(yīng)的應(yīng)用程序API密鑰和密鑰。使用jar包應(yīng)用到系統(tǒng)中在官方網(wǎng)站下載JavaSDK壓縮工具包;將下載的對應(yīng)的壓縮包解壓后,復制到工程文件夾中;在Eclipse右鍵工程選擇Properties然后在JavaBuildPath里添加AddJARS;添加SDK工具包和第三方依賴工具包JSON的jar包和log4j的jar包,其中,version為版本號,添加完成后,用戶就可以在工程中使用OCRJavaSDK,在代碼的范圍內(nèi)修改和編譯SDK和jar包以適配文字識別系統(tǒng)環(huán)境REF_Ref8700\r\h[20]。4系統(tǒng)的設(shè)計流程與實現(xiàn)4.1系統(tǒng)流程概要介紹本章首先分析了計算機外圍結(jié)構(gòu)的特點,然后通過實驗比較了NDK框架、C語言和Java等復雜圖像處理算法的差異。然后,根據(jù)現(xiàn)場的特點和國內(nèi)外同類產(chǎn)品的性能,提出了系統(tǒng)的設(shè)計目標,得出了系統(tǒng)需要解決的關(guān)鍵技術(shù)問題。為了實現(xiàn)字符識別系統(tǒng),本文提出了一種解決方案。應(yīng)用程序開發(fā)人員在應(yīng)用程序?qū)泳帉懗绦?,這些程序是用Java語言開發(fā)的。眾所周知,Java語言的最大優(yōu)勢是更好的封裝性和可伸縮性,而不是比C/C++更低的效率。然而,由于圖像處理算法和時間的復雜性,如果將字符識別系統(tǒng)直接放置在應(yīng)用層,并使用Java,整個系統(tǒng)的時間將相對較短。在很大程度上,實時結(jié)果是半次努力的兩倍。4.2系統(tǒng)模塊的劃分與執(zhí)行流程系統(tǒng)通過一個面板容器類將所有功能結(jié)合在一起,主要使用eclipse的GUI工具,這是一個輕量級的容器,可以使與用戶的交互更加方便,簡單快捷,所以我們在這個主面板中都有模塊,然后使用子窗體作為父窗體的值來完成所有的構(gòu)造方法和其他方法。我們在主板上的功能模塊分為:圖像選擇、字符識別、空白、復制、快照識別、清除和重新識別。系統(tǒng)模塊設(shè)計完成后,我們將定義每個按鈕的字體、大小和位置。除了按鈕分割模塊,還有一個用戶顯示模塊,例如預覽圖片、標簽、文本輸出區(qū)域和文本字段的滾動條、面板的各個方向等。將每個模塊劃分為設(shè)計模塊后,依次將每個模塊添加到相應(yīng)的方向盤上,然后設(shè)置當前系統(tǒng)模式,依次調(diào)用其他方法后編寫主方法可選參數(shù)調(diào)用界面等,系統(tǒng)實現(xiàn)流程圖如圖4-1所示。開始開始清空圖片預覽清空圖片預覽N文件類型不匹配N文件類型不匹配選擇文件上傳文字識別查詢文字識別查詢Y文件類型匹配成功Y文件類型匹配成功識別成功識別成功結(jié)束結(jié)束圖4.1概要執(zhí)行流程圖4.3圖片處理模塊功能的實現(xiàn)4.3.1上傳文件功能在第2章中,我們可以看到我們設(shè)計的所有模塊都必須在圖形界面工具包上設(shè)計,所以我想介紹如何在eclipse中實現(xiàn)這個強大的swing插件。SWTdesigner是一個非常強大的swing圖形編程插件。如果你想開發(fā)谷歌的網(wǎng)絡(luò)工具,GWT設(shè)計師。直達下載Windowsbuilderpro,它包含所有插件的全面設(shè)計器、swing設(shè)計器和GWT設(shè)計器。請注意,當您下載與eclipse版本對應(yīng)的windowsbuilderPro時。下載windowsbuilderpro后,即可開始安裝。您選擇下載安裝程序,安裝相同的通用應(yīng)用程序,并選擇通過圖形界面提示符連接到eclipse。完成圖形界面的主模型設(shè)計后,確定了各模塊與尺寸之間的距離。判斷用戶下載的文件是否為空文件。在創(chuàng)建文件的方法中,可以使用if(!fileexists())通過嘗試捕獲加載時遇到的異常來確定文件是否存在。然后使用j按鈕返回“讀取文件”按鈕,通過讀取文件讀取器讀取文件內(nèi)容。在上面的第二章中,當文件加載到內(nèi)存中時,即使加載了文件,也要使用讀卡器緩沖區(qū)打開緩存空間,并以相同的方式返回“寫入文件”按鈕。在上述方法中,使用文本文件編寫器以文件的形式獲取文本框中的所有內(nèi)容,并將其輸出到控制臺提示“fileWritesuccessfully”。點擊所選文件時,調(diào)用GUI功能包文件打開一個新表單,向下輸出,當“選擇文件”再次出現(xiàn)時,添加所需的圖像,不僅可以從設(shè)備下載選擇圖片,也可以使用網(wǎng)站書簽作為圖片下載的源文件。使用文件下載功能讀取和寫入文件。見圖4-2。圖4.2上傳文件圖4.3.2圖片預覽功能圖片預覽功能是用戶可以看到上傳的圖片文件是否已成功上傳或是否上傳圖片。圖片預覽不需要在用戶流中再次讀寫文件,文件加載已經(jīng)讀寫了文件設(shè)置方法,所以該功能是通過GUI格式設(shè)置的。該功能使用OCR面板的方法作為界面。本章介紹了基于GUI工具的所有方法。主面板下的表格不再詳細。下載完正確的文件類型后關(guān)閉文件流,然后替換圖片預覽模型。預覽圖像界面如圖4-3所示。圖4.3圖片預覽圖4.3.3圖片重識功能在第二章中,圖像重新定義不需要重新加載圖像文件,因此可以減少用戶的冗余操作,并且系統(tǒng)編寫的代碼不需要為文本識別而重寫,您只需要在主面板中重新定義調(diào)用對象的重載模式,直接刪除圖像過濾文件中可選的參數(shù)調(diào)用接口,重新分析JSON格式,需要注意的是,在執(zhí)行此方法時,必須調(diào)用字符識別以外的模塊,否則會出現(xiàn)異常類型的異常。使用圖像識別功能重新識別文本,見圖4-4。圖4.4圖片重識圖4.3.4圖片清除功能當用戶需要重新識別文本時,他們需要設(shè)計一個清晰的圖像功能,然后是一個空文本功能。但是,當用戶需要設(shè)計流文件版本時,圖像文件類型為空。在Java編程中,我們經(jīng)常需要使用一些主動發(fā)布的文件,比如輸入流、輸出流、通道套接字等,所以我們需要釋放這些資源。首先,GC內(nèi)存中的恢復不會主動釋放這個不確定的答案。然后我們可以知道以下特征:每個進程都有一個文件描述符表,不同的描述符可以指向同一個文件。這個數(shù)字只是一個有意義的進程。在Java中,文件通過文件描述符運行,然后Johnny調(diào)用相應(yīng)的C代碼并調(diào)用系統(tǒng)中的函數(shù)進程。本章介紹加載目標文件的過程,在一個實施例中,打開文件主要是調(diào)用操作系統(tǒng)的指令,然后獲取有效的文件運算符,然后設(shè)置相應(yīng)的Java變量,然后通過文件描述符系統(tǒng)命令調(diào)用下一個close,在Java中釋放對象之前調(diào)用finalize()方法,因此一些JDK應(yīng)用程序?qū)⑻砑觕lose操作,例如輸入文件流,這是對JDK的補償,可能會導致程序員不關(guān)閉文件。最好的方法是養(yǎng)成在文件用完后關(guān)閉文件的習慣。當然,Java是關(guān)閉最后一個塊最可靠的方法。用清晰的圖像編輯文件后,參見圖4-5。圖4.5寫入文件圖4.3.5截圖識別功能當待識別文本無法保存在計算機中時,需要使用圖像識別功能,因此該功能不需要下載文件,下載時可以同步圖像。首先,在使用snapshot函數(shù)之前,必須繼承一個通用類型的Jwindow類。獲取默認工具調(diào)用方法時,泛型類型的構(gòu)造函數(shù)設(shè)置方法的大小,以獲取調(diào)用此方法的屏幕的大小,計算機屏幕將生成一個層掩碼,該層掩碼根據(jù)數(shù)組綁定獲取屏幕的大小和分辨率,以使層掩模覆蓋整個計算機屏幕進行圖像捕獲。成功下載后,用戶將再次顯示成功的快照。使用快照標識按鈕選擇圖像后,右下角將分別顯示不同的圖標。如果選擇或重新啟動快照。有關(guān)使用快照選擇功能的詳細信息,請參見圖4-6。圖4.6寫入文件圖4.4文字識別模塊功能的實現(xiàn)4.4.1內(nèi)容展示功能內(nèi)容顯示功能是從文本中識別圖像并形成顯示,因此首先要解決的問題是如何識別和提取字符。區(qū)域文本分割系統(tǒng)主要包括以下五個步驟:區(qū)域直方圖;以最小方差測量文本內(nèi)容的單詞水平;將文本的平均長度分成幾行;對單個字符對象進行提取,得到其點陣坐標方向。創(chuàng)建一個字符串來存儲所有文本內(nèi)容,通過字體界面進行提取和比較,最終實現(xiàn)字符識別的效果,從而逐步細化這個過程。第三章提出了利用OCR技術(shù)實現(xiàn)字符識別的具體解決方案。在實際應(yīng)用中,一般通過檢測圖像中的文本來定位區(qū)域,然后提取區(qū)域的序列特征,并在此基礎(chǔ)上進行特殊字符識別。簡單了解工作流及其在本系統(tǒng)中的應(yīng)用。在識別標準文本行時,通常使用crnn或seq2seq方法來彎曲不規(guī)則文本。如果遵循之前的識別方法,CNN+RNN將直接應(yīng)用于整個文本區(qū)域的圖像。由于錯誤區(qū)域較多,識別效果較差。因此,我們還提出了一種通過STN網(wǎng)絡(luò)參數(shù)轉(zhuǎn)換的學習方法,將相應(yīng)的圖像特征傳輸給后續(xù)的RNN識別。因此,我使用目前的技術(shù)作為一種新的、更安全的百度API應(yīng)用接口方法。在介紹接口的功能以及如何調(diào)用應(yīng)用程序接口之前,我們沒有詳細介紹具體的接口代碼。最后最重要的就是傳值問題,因為使用該接口識別出來的文字為java中最常見的JSON數(shù)據(jù)格式,在array的數(shù)組中進行g(shù)et傳值,把拆分出來的文字用String強制轉(zhuǎn)換,最后使用tostring進行解析之后用return返回所有內(nèi)容。以上傳一個廣告圖為例,具體使用文字識別功能后內(nèi)容展示參見圖4.7。圖4.7內(nèi)容展示圖4.4.2復制文字功能復制文字功能即為復制文字到剪貼板中,這和復制文件類型相似但也有區(qū)別,復制文字時雖然也需要用到file類的使用,但是在上一步內(nèi)容識別展示時已經(jīng)將這一步驟完善了,在調(diào)用接口傳值之后不需要再對文件進行讀取、存儲,從緩存來避免任何性能的阻礙,明顯我們將使用不同的源文件和不同的目標文件都能快速復制到剪貼板,最后保存在String類型的內(nèi)容使用SetContents方法進行存值。使用復制文字功能將文字復制到剪貼板中參見圖4.8。圖4.8復制文字圖4.4.3清空文字功能清空文字功能是為了避免再次識別文字時文件讀寫的時候出現(xiàn)異常,所以添加手動清空文字的功能,雖然再次識別的時候也能將文字清空,但這樣的操作會使系統(tǒng)產(chǎn)生多余的操作因而造成一定意義上的內(nèi)存泄漏,所以我們在actionPerformed的方法中判定文字是否存在,當用if對getSource取出來的值為空時即跳出本方法不做任何操作,當取出來的內(nèi)容不為空才繼續(xù)執(zhí)行本方法,在setText方法中將圖形界面的文字窗體中把內(nèi)容全部清空。使用清空文字功能參見圖4.9。圖4.9清空文字圖
5系統(tǒng)測試5.1對系統(tǒng)測試的目的和場景系統(tǒng)工程是軟件開發(fā)、調(diào)試和測試的重要組成部分,也是保證軟件質(zhì)量的關(guān)鍵環(huán)節(jié),直接影響到計算機外設(shè)的可用性評估。然而,在使用該系統(tǒng)之前,仍然可以通過聯(lián)合測試來測試計算機輔助系統(tǒng)的一些基本功能代碼,并嘗試查找和調(diào)試這些代碼。如果你有關(guān)于這個話題的任何信息,請免費添加。5.2系統(tǒng)測試的設(shè)計5.2.1上傳不同文件黑盒測試黑盒測試是軟件測試中最常用的測試方法。黑盒測試是基于不同的測試場景,從用戶的角度對測試用例進行測試,我們設(shè)計了測試用例來檢測加載時的文件,并且每個功能都可以正常使用。顧名思義,在測試黑盒中,系統(tǒng)與黑盒白測試密不可分,而不是考慮設(shè)計的內(nèi)部結(jié)構(gòu)和特點。對于單元測試,它也可以以多種方式分離,包括在代碼中查找位置錯誤。在開發(fā)工具中使用單元測試需要導入測試包junit4,因為本項目使用的Eclipse開發(fā)工具只在測試文件中添加以下依賴代碼,因為系統(tǒng)不涉及不同的用戶角色,每個普通用戶都可以使用系統(tǒng),所以沒有詳細的單元測試描述5.2.2文字識別性能測試字符識別的主要任務(wù)是正確、清晰地顯示用戶上傳的文件,但這也是最基本的需求。一個好的系統(tǒng)需要完成性能測試,系統(tǒng)壓力測試也是性能測試的重要組成部分。它可以識別性能瓶頸或標點符號過多,從而確保系統(tǒng)的測試。這也是確保當今市場軟件質(zhì)量的關(guān)鍵。中國軟件測試中心提出了各種性能測試,將系統(tǒng)實施與瓶頸綜合分析預測有效合理地結(jié)合起來。5.2.3截圖功能測試前一節(jié)介紹了功能測試的重要性,并根據(jù)自己的測試情況對系統(tǒng)功能進行了改進。因為這張圖片可能是功能測試中用戶行為的各種問題,所以再次在識別文本快照功能之前,設(shè)計了各種測試用例。這個測試需要使用錯誤推理來預測基于收集的網(wǎng)絡(luò)數(shù)據(jù)通過我在系統(tǒng)設(shè)計中的經(jīng)驗和直覺,我們可以判斷系統(tǒng)中所有可能的錯誤或風險。通過考慮手術(shù)前的條件和手術(shù)后結(jié)果之間的關(guān)系,并結(jié)合它們創(chuàng)造新的條件,不容易
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度企業(yè)員工臨時住房借用協(xié)議3篇
- 二零二五年度航空航天設(shè)備安裝與測試服務(wù)協(xié)議3篇
- 2025年鋼材市場調(diào)研與市場推廣服務(wù)合同2篇
- 二零二五年度船舶改裝與升級合同范本8篇
- 臨時工人事勞動協(xié)議政府機關(guān)專用版2024
- 2025年個人文化藝術(shù)品投資合同范本4篇
- 2025年場部保密信息保密合同范本4篇
- 二零二四年度音樂器材回收利用合同規(guī)范3篇
- 專利代理銷售合同:2024年度標準版一
- 二零二五年度噴錨設(shè)備進出口貿(mào)易合同4篇
- 急性肺栓塞搶救流程
- 《統(tǒng)計學-基于Python》 課件全套 第1-11章 數(shù)據(jù)與Python語言-時間序列分析和預測
- 《形象價值百萬》課件
- 紅色文化教育國內(nèi)外研究現(xiàn)狀范文十
- 中醫(yī)基礎(chǔ)理論-肝
- 小學外來人員出入校門登記表
- 《土地利用規(guī)劃學》完整課件
- GB/T 25283-2023礦產(chǎn)資源綜合勘查評價規(guī)范
- 《汽車衡全自動智能稱重系統(tǒng)》設(shè)計方案
- 義務(wù)教育歷史課程標準(2022年版)
- GB/T 2550-2016氣體焊接設(shè)備焊接、切割和類似作業(yè)用橡膠軟管
評論
0/150
提交評論