數(shù)字圖像處理畢業(yè)設計論文正稿_第1頁
數(shù)字圖像處理畢業(yè)設計論文正稿_第2頁
數(shù)字圖像處理畢業(yè)設計論文正稿_第3頁
數(shù)字圖像處理畢業(yè)設計論文正稿_第4頁
數(shù)字圖像處理畢業(yè)設計論文正稿_第5頁
已閱讀5頁,還剩34頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

./目錄摘要3Abstract4第1章緒論51.1自動識別課題背景51.2機器視覺51.2.1機器視覺的發(fā)展概況51.2.2機器視覺與圖像處理71.3圖像處理與識別技術91.4圖像處理與識別系統(tǒng)101.4.1關于計算機圖像處理系統(tǒng)101.4.2圖像處理與識別系統(tǒng)的構成111.5斑馬線自動識別系統(tǒng)課題研究內容12第2章圖像處理與識別及圖像理解142.1二值圖像分析142.1.1閾值運算152.2圖像區(qū)域分析17區(qū)域與邊緣172.3圖像處理與識別及圖像理解所研究的內容192.3.1圖像處理技術192.3.2圖像識別技術202.3.3圖像理解212.4圖像處理與識別及圖像理解的關系242.4.1圖像處理242.4.2圖像理解252.5圖像處理工具MATLAB26第三章斑馬線自動識別系統(tǒng)主要算法283.1邊緣檢測283.2坎尼〔Canny算子293.3模板匹配算法32第4章基于matlab的斑馬線自動識別系統(tǒng)354.1系統(tǒng)結構流圖354.2系統(tǒng)功能模塊分析與實現(xiàn)364.2.1圖像分割模塊364.2.2模板讀取模塊404.2.3圖像識別模塊404.3GUI界面設計及系統(tǒng)測試42結論45致謝47參考文獻48摘要機器視覺也稱圖像分析與理解。機器視覺的發(fā)展推動智能系統(tǒng)的發(fā)展,也拓寬計算機與各種智能機器的研究范圍和應用領域。圖像處理與識別技術是機器視覺的一個重要組成部分。圖像處理與識別技術的發(fā)展經(jīng)歷了初創(chuàng)期,發(fā)展期,普及期,和實用期4個階段。20世紀90年代是圖像技術的實用化時期,特點就是圖像處理的信息量巨大,對處理速度的要求極高。人行道路的斑馬線自動識別系統(tǒng)的課題設計,以一幅交通道路識別為例,具體介紹了斑馬線自動識別的原理。整個處理過程分為圖像預處理、圖像邊緣提取、圖像定位、圖像分割、圖像識別五大模塊,用MATLAB軟件編程來實現(xiàn)每一個部分,最后識別出人行道路圖像。在研究的同時對其中出現(xiàn)的問題進行了具體分析。關鍵詞:機器視覺圖像處理自動識別預處理邊緣提取圖像定位圖像分割圖像識別AbstractMachinevisionisalsoImageanalysisandunderstanding.ThedevelopmentofmachinevisionpromotetheprogressofIntelligentsystem,andalsowidentheresearchandapplicationfieldofcomputerandeveryintelligentmachine.Technologyofimageprocessingandrecognitionistheimportantcomponentofmachinevision.Theprogressofimageprocessingandrecognitionhavefourphasesthatisinitialperioddevelopmentperioduniversalperiodandpracticalperiod.Thepracticalperiodofimagetechnologyis1990s20thcentury.Thefeaturesisthattheinformationofimageprocessingtoobig,andsothat,itsprocessingspeedmustbefast.Thecourseoftrafficsignautomatismrecognitionsystem,withonetrafficsignrecognition,theprincipleofthetrafficsignrecognitionisintroducedconcretely.Thisprocesswasdividedintoimagepre-process,imageedgeextraction,imagelocation,imagedivisionandimagerecognition,whichisimplementedseparatedbyusingMATLAB.Thetrafficsignimageisrecognizedatlast.Atthesametime,theproblemsarealsoanalyzed.Andsolvedintheprocess.Keywords:Machinevisionimageprocessingautomatismrecognitionpre-processedgeextractionimagelocationimagedivisionimagerecognition第1章緒論1.1自動識別課題背景人類在征服自然、改造自然和推動社會進步的過程中,面臨著自身能力、能量的局限性,因而發(fā)明和創(chuàng)造了許多機器來輔助或代替人類完成任務.智能機器,包括智能機器人,是這種機器最理想的形式,也是人類科學研究中所面臨的最大挑戰(zhàn)之一.智能機器是指這樣一種系統(tǒng),它能模擬人類的功能,能感知外部世界并有效地解決人所能解決問題.人類感知外部世界主要是通過視覺、觸覺、聽覺和嗅覺等感覺器官,其中約80%的信息是由視覺獲取的.因此,對于智能機器來說,賦予機器以人類視覺功能對發(fā)展智能機器是及其重要的,也由此形成了一門新的學科—機器視覺<也稱機器視覺或圖像分析與理解等>.機器視覺的發(fā)展不僅將大大推動智能系統(tǒng)的發(fā)展,也將拓寬計算機與各種智能機器的研究范圍和應用領域。1.2機器視覺機器視覺的發(fā)展概況70年代中期,麻省理工學院<MIT>人工智能<AI>實驗室正式開設"機器視覺"<

MachineVision>課程,由國際著名學者B.K.P.Horn教授講授.同時,MITAI實驗室吸引了國際上許多知名學者參與機器視覺的理論、算法、系統(tǒng)設計的研究,DavidMarr教授就是其中的一位.他于1973年應邀在MITAI實驗室領導一個以博士生為主體的研究小組,1977年提出了不同于"積木世界"分析方法的計算視覺理論<computationalvision>,該理論在80年代成為機器視覺研究領域中的一個十分重要的理論框架.可以說,對機器視覺的全球性研究熱潮是從20世紀80年代開始的,到了80年代中期,機器視覺獲得了蓬勃發(fā)展,新概念、新方法、新理論不斷涌現(xiàn),比如,基于感知特征群的物體識別理論框架,主動視覺理論框架,視覺集成理論框架等.到目前為止,機器視覺仍然是一個非?;钴S的研究領域.許多會議論文集都反應了該領域的最新進展,比如,InternationalConferenceonComputerVisionandPatternRecognition<CVPR>;InternationalConferenceonComputerVision<ICCV>;InternationalConferenceonPatternRecognition<ICPR>;InternationalConferenceonRoboticsandAutomation<ICRA>;WorkshoponComputerVision,andnumerousconferencesofSPIE.還有許多學術期刊也包含了這一領域的最新研究成果,如,IEEETransactiononPatternAnalysisandMachineIntelligence<PAMI>;ComputerVision,Graphics,andImageProcessing<CVGIP>;IEEETransactiononImageProcessing;IEEETransactiononSystems,Man,andCybernetics<SMC>;MachineVisionandApplications;InternationalJournalonComputerVision<IJCV>;ImageandVisionComputing;andPatternRecognition.每年還出版許多研究專集、學術著作、技術報告,舉行專題討論會等.所有這些都是研究機器視覺及其應用的很好信息來源.Marr的視覺計算理論[Marr1982]立足于計算機科學,系統(tǒng)地概括了心理生理學、神經(jīng)生理學等方面業(yè)已取得的所有重要成果,是視覺研究中迄今為止最為完善的視覺理論.Marr建立的視覺計算理論,使機器視覺研究有了一個比較明確的體系,并大大推動了機器視覺研究的發(fā)展.人們普遍認為,機器視覺這門學科的形成與Marr的視覺理論有著密切的關系.事實上,盡管20世紀70年代初期就有人使用機器視覺這個名詞機器視覺與圖像處理機器視覺相關的學科有許多.與機器視覺密切相關的領域及機器視覺與其它學科的關系如下.圖像處理是一個發(fā)展比較成熟的領域.圖像處理技術通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統(tǒng)的輸入是圖像,輸出仍然是圖像,信息恢復任務則留給人來完成.圖像處理包括圖像增強、圖像壓縮和模糊校正與非聚焦圖像等課題.機器視覺系統(tǒng)把圖像作為輸入,產生的輸出為另一種形式,比如圖像中物體輪廓的表示.因此,機器視覺的重點是在人的最小干預下,由計算機自動恢復場景信息.圖像處理算法在機器視覺系統(tǒng)的早期階段起著很大的作用,它們通常被用來增強特定信息并抑制噪聲.計算機圖形學是通過幾何基元,如線、圓和自由曲面,來生成圖像,它在可視化〔Visualization和虛擬現(xiàn)實〔VirtualReality中起著很重要的作用.機器視覺正好是解決相反的問題,即從圖像中估計幾何基元和其它特征.因此,計算機圖形學屬于圖像綜合,機器視覺屬于圖像分析.這兩個領域在其發(fā)展的早期階段是沒有什么聯(lián)系的,但是近十幾年來發(fā)展的越來越相近了.機器視覺使用了計算機圖形學中的曲線和曲面表示方法以及其它的一些技術,而計算機圖形學也使用機器視覺技術,以便在計算機中建立逼真的圖像模型.可視化和虛擬現(xiàn)實把這兩個領域緊密地聯(lián)系在一起.模式識別主要用于識別各種符號、圖畫等平面圖形.模式一般指一類事物區(qū)別于其它事物所具有的共同特征。模式識別方法主要有統(tǒng)計方法和句法方法兩種,統(tǒng)計方法是指從模式抽取一組特征值,并以劃分特征空間的方法來識別每一個模式。句法方法是指利用一組簡單的子模式〔模式基元通過文法規(guī)則來描述復雜的模式。模式識別方法是機器視覺識別物體的重要基礎之一.機器視覺識別物體還經(jīng)常需要其它的技術.我們將在物體識別部分簡要地討論統(tǒng)計模式識別的主要內容.人工智能〔artificialintelligent,AI涉及到智能系統(tǒng)的設計和智能計算的研究.在經(jīng)過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對場景特征進行表示,并分析和理解場景.人工智能有三個過程:感知、認知和行動.感知把反應現(xiàn)實世界的信息轉換成信號,并表示成符號,認知是對符號進行各種操作,行動則把符號轉換成影響周圍環(huán)境的信號.人工智能的許多技術在機器視覺的各個方面起著重要作用.事實上,機器視覺通常被視為人工智能的一個分支.人工神經(jīng)網(wǎng)絡〔artificialneuralnetworks,ANNs是一種信息處理系統(tǒng),它是由大量簡單的處理單元〔稱為神經(jīng)元通過具有強度的連接〔connection相互聯(lián)系起來,實現(xiàn)并行分布式處理〔paralleldistributionprocessing,PDP.人工神經(jīng)網(wǎng)絡的最大特點是可以通過改變連接強度來調整系統(tǒng),使之適應復雜的環(huán)境,實現(xiàn)類似人的學習、歸納和分類等功能.人工神經(jīng)網(wǎng)絡已經(jīng)在許多工程技術領域得到了廣泛的應用.神經(jīng)網(wǎng)絡作為一種方法和機制將用于解決機器視覺中的許多問題.神經(jīng)物理學與認知科學長期將人類視覺作為主要的研究對象.機器視覺中已有的許多方法與人類視覺極為相似.目前,許多機器視覺研究者對研究人類視覺計算模型比研究機器視覺系統(tǒng)更感興趣,希望機器視覺更加自然化,更加接近生物視覺。1.3圖像處理與識別技術圖像就是用各種觀測系統(tǒng)以不同形式和手段觀測客觀世界而獲得的,可以直接或間接作用于人眼而產生視知覺的實體。人類從外界獲得的信息約有75%來自于視角系統(tǒng),也就是說,人類的大部分信息都是從圖像中獲得。圖像處理是人類視覺延伸的重要手段,可以使人們看到任意波長上所測得的圖像。例如,借助伽馬相機,X光機,人們可以看到紅外和超聲圖像;借助CT可看到物體內部的斷層圖像;借助相應工具可看到立體圖像。1964年,美國在太空拍回的大量月球照片就是使用了計算機對圖像進行了處理,使原本不清晰的圖像信息得以清晰再現(xiàn)。這是這門技術發(fā)展的重要里程碑。此后,圖像處理技術在空間研究方面得到廣泛應用。總體來說,圖像處理技術的發(fā)展經(jīng)歷了初創(chuàng)期,發(fā)展期,普及期,和實用期4個階段。20世紀90年代是圖像技術的實用化時期,圖像處理的信息量巨大,對處理速度的要求極高。圖像識別所討論的問題,是研究用計算機代替人工自動地處理大量的物理信息,解決人類生理器官所不能識別的問題,從而部分代替人的腦力勞動。人類識別圖像的過程總是先找出它們外形或顏色的某些特征進行比較分析,判斷,然后加以分門別類,即識別它們。人們在研制自動識別機時也往往借鑒人的思維活動,采用同樣的處理方法,然后圖像的灰度與色彩是由光強和波長不同的光波引起,它們與景物表面的特性,方向,光線條件以及干預等多種因素有關。在各種惡劣的工作環(huán)境中,圖像與景物已有較大的差別。因此要區(qū)分圖像屬于哪一類,往往要經(jīng)過預處理,分割,特征抽取,分析,分類,識別等一系列過程?,F(xiàn)在這些技術完全可通過計算機進行模擬,對圖像信息進行處理來達到對它的區(qū)別。21世紀的圖像技術要向高質量化方面發(fā)展,主要體現(xiàn)在以下幾點:首先高分辨率,高速度,圖像處理技術發(fā)展的最終目標是要實現(xiàn)圖像的實時處理,這在移動目標的生成,識別和跟蹤上有著重要意義;其次是立體化,立體化所包括的信息最為完整和豐富,數(shù)字全息技術將有利于達到這個目的;再者是智能化,其目的是實現(xiàn)圖像的智能生成,處理,識別和理解。1.4圖像處理與識別系統(tǒng)關于計算機圖像處理系統(tǒng)計算機圖像處理技術是以計算機為核心的應用技術,因此,計算機圖像處理系統(tǒng)的發(fā)展,是隨著計算機技術的提高而提高的。從系統(tǒng)的層次來看,可分為高、中、低3個檔次;從圖像傳感器的敏感區(qū)域看,又可分為可見光、紅外、近紅外、X射線、雷達、伽瑪射線、超聲波等圖像處理系統(tǒng);從采集部件與景物的距離上來說,還可以分成遙感、宏觀和微觀圖像處理系統(tǒng);就應用場所而言,又能分成通用圖像處理系統(tǒng)和專用圖像處理系統(tǒng)。通用圖像處理系統(tǒng)一般用于研究開發(fā),因此,要求傳感器敏感區(qū)間寬,線性度好;而專用系統(tǒng)一般用于特殊用途,是在通用系統(tǒng)研究基礎上,研制開發(fā)的為現(xiàn)實某一個或幾個功能的商用系統(tǒng)。因此,在保證性能的前提下,由價格因素決定系統(tǒng)的配置。1、高檔圖像處理系統(tǒng)采用高速芯片設計,完全適合圖像和信號處理特有規(guī)律的并行陣列圖像處理機。這類系統(tǒng)采用多CPU或多機結構,可以以并行或流水線方式工作。2、中檔圖像處理工作站以小型機或工作站為主控計算機,加上圖像處理器構成。這類系統(tǒng)有較強的交互處理能力,同時,由于用通用機做主控機,因而在系統(tǒng)環(huán)境下,具有較好的再開發(fā)能力。3、抵擋的微機圖像處理系統(tǒng)由微機加上圖像采集卡構成,其結構簡單,是一種便于普及和推廣的圖像處理系統(tǒng),也是本書著重介紹的系統(tǒng)。1.4.微機圖像處理系統(tǒng)由圖像的采集部件、主機和圖像的輸出部件3個部分組成。1、采集部件。原始的圖像數(shù)據(jù)是通過圖像采集部件進入計算機的,因此,圖像采集部件的作用是采集原始的模擬圖像數(shù)據(jù),并將模擬信號轉換成數(shù)字信號。計算機在接收到圖像的數(shù)字信號后,將其存入內存。微機圖像處理系統(tǒng)常用的圖像采集部件有攝像頭加上視頻圖像采集卡、圖像掃描儀以及數(shù)碼攝像機等。2、圖像處理部件。在微機圖像處理系統(tǒng)中,圖像處理工作是由微機完成的,微機的擴展槽上插有帶幀存儲器的采集卡,圖像處理的過程通常包含從幀存儲器讀取數(shù)據(jù)到計算機內存、處理內存中的圖像數(shù)據(jù)和送數(shù)據(jù)回圖像幀存儲器3個步驟。對于直接使用內存的采集卡,則只需和內存進行數(shù)據(jù)交換,計算機的內存越大,CPU的運算速度越快,圖像處理的速度也越快。3、識別結果的輸出部件。圖像的輸出是圖像處理的最終目的。從廣義的角度來講,圖像的輸出形式可以分為兩種:一種是根據(jù)圖像處理的結果做出判斷,例如質量檢測中的合格和不合格,輸出不一定以圖像骯作為最終形式,而只需做出提示供人或機器做出選擇。這種提示可以是計算機屏幕信息或是電平信號的高低,這樣的輸出往往用于成熟研究的應用上。另一種則是以圖像為輸出方式,它包括中間過程的監(jiān)視以及結果圖像的輸出。圖像輸出方式有屏幕輸出、打印輸出和視頻硬拷貝輸出。1.5斑馬線自動識別系統(tǒng)課題研究內容斑馬線識別,最基本的就是對那些斑馬線圖標圖片的識別,即是對圖片的處理和識別,圖像格式一般都是RGB等。主要是對輸入的原始RGB圖像進行處理.這一過程借用了大量的圖像處理技術和算法,如圖像濾波、圖像增強、邊緣檢測等,以便從圖像中抽取諸如角點、邊緣、線條、邊界以及色彩等關于場景的基本特征;這一過程還包含了各種圖像變換〔如校正、圖像紋理檢測、圖像運動檢測等。對一幅圖像進行一系列處理之后,提取出系統(tǒng)要求的感興趣區(qū)域,最后和之前做好的模板匹配比較,就得出一組相關的比較系數(shù),從這一組系數(shù)中取出一個最大值,就可以識別出圖像就是這個值指定的模板。斑馬線自動識別系統(tǒng)圖像處理與識別包括斑馬線圖像的預處理,圖像的分割以及圖像的匹配識別。處理識別流程如下:斑馬線圖像的邊緣提取、分割斑馬線斑馬線圖像的邊緣提取、分割斑馬線圖像的預處理<圖像變換、增強>輸入斑馬線圖像最后將圖像進行匹配識別將分割的最后將圖像進行匹配識別將分割的斑馬線圖像進行后期處理圖1-1處理識別流程圖.第2章圖像處理與識別及圖像理解2.1二值圖像分析一幅數(shù)字圖像是一個二維陣列,陣列元素值稱為灰度值或強度值.實際上,圖像在量化成數(shù)字圖像前是一個連續(xù)強度函數(shù)的集合,場景信息就包含在這些強度值中.圖像強度通常被量化成256個不同灰度級,對某些應用來說,也常有32、64、128或512個灰度級的情況,在醫(yī)療領域里甚至使用高達4096<12bits個灰度級.很明顯,灰度級越高,圖像質量越好,但所需的內存也越大.在機器視覺研究的早期,由于內存和計算能力非常有限,而且十分昂貴,因此視覺研究人員把精力主要集中在研究輸入圖像僅包含兩個灰度值的二值視覺系統(tǒng)上.人們注意到,人類視覺在理解僅由兩個灰度級組成的線條、輪廓影像或其它圖像時沒有任何困難,而且應用場合很多.隨著計算機計算能力的不斷增強和計算成本的不斷下降,人們普遍開始研究基于灰度圖像、彩色圖像和深度圖像的視覺系統(tǒng).盡管如此,二值視覺系統(tǒng)還是十分有用的,其原因如下:=1\*GB2⑴計算二值圖像特性的算法非常簡單,容易理解和實現(xiàn),并且計算速度很快.=2\*GB2⑵二值視覺所需的內存小,對計算設備要求低.工作在256個灰度級的視覺系統(tǒng)所需內存是工作在相同大小二值圖像視覺系統(tǒng)所需內存的八倍.如若利用游程長度編碼等技術。還可使所需內存進一步減少.由于二值圖像中的許多運算是邏輯運算而不是算術運算,所以所需的處理時間很短.〔3許多二值視覺系統(tǒng)技術也可以用于灰度圖像視覺系統(tǒng)上.在灰度或彩色圖像中,表示一個目標或物體的一種簡易方法就是使用物體模板<mask>,物體模板就是一幅二值圖像,其中1表示目標上的點,0表示其它點.在物體從背景中分離出來后,為了進行決策,還需要求取物體的幾何和拓撲特性,這些特性可以從它的二值圖像計算出來.因此,盡管我們是在二值圖像上討論這些方法,但它們的應用并不限于二值圖像.一般來說,當物體輪廓足以用來識別物體且周圍環(huán)境可以適當?shù)乜刂茣r,二值視覺系統(tǒng)是非常有用的.當使用特殊的照明技術和背景并且場景中只有少數(shù)物體時,物體可以很容易地從背景中分離出來,并可得到較好的輪廓,比如,許多工業(yè)場合都屬于這種情況.二值視覺系統(tǒng)的輸入一般是灰度圖像,通常使用閾值法首先將圖像變成二值圖像,以便把物體從背景中分離出來,其中的閾值取決于照明條件和物體的反射特性.二值圖像可用來計算特定任務中物體的幾何和拓撲特性,在許多應用中,這種特性對識別物體來說是足夠的.二值視覺系統(tǒng)已經(jīng)在光學字符識別、染色體分析和工業(yè)零件的識別中得到了廣泛應用.閾值運算視覺系統(tǒng)中的一個重要問題是從圖像中識別代表物體的區(qū)域〔或子圖像,這種對人來說是件非常容易的事,對計算機來說卻是令人吃驚的困難.為了將物體區(qū)域同圖像其它區(qū)域分離出來,需要首先對圖像進行分割.把圖像劃分成區(qū)域的過程稱為分割,即把圖像劃分成區(qū)域,使得每一個區(qū)域對應一個候選的物體.下面給出分割的嚴格定義.定義分割是把像素聚合成區(qū)域的過程,使得:整幅圖像<是一個完備分割>.,<是一個完備分割>.每個區(qū)域滿足一個謂詞,即區(qū)域內的所有點有某種共同的性質.不同區(qū)域的圖像,不滿足這一謂詞.正如上面所表明的,分割滿足一個謂詞,這一謂詞可能是簡單的,如分割灰度圖像時用的均勻灰度分布、相同紋理等謂詞,但在大多數(shù)應用場合,謂詞十分復雜.在圖像理解過程中,分割是一個非常重要的步驟.二值圖像可以通過適當?shù)胤指罨叶葓D像得到.如果物體的灰度值落在某一區(qū)間內,并且背景的灰度值在這一區(qū)間之外,則可以通過閾值運算得到物體的二值圖像,即把區(qū)間內的點置成1,區(qū)間外的點置成0.對于二值視覺,分割和閾值化是同義的.閾值化可以通過軟件來實現(xiàn),也可以通過硬件直接完成.通過閾值運算是否可以有效地進行圖像分割,取決于物體和背景之間是否有足夠的對比度.設一幅灰度圖像中物體的灰度分布在區(qū)間內,經(jīng)過閾值運算后的圖像為二值圖像,即:如果物體灰度值分布在幾個不相鄰區(qū)間內時,閾值化方案可表示為:其中Z是組成物體各部分灰度值的集合.圖3.1是對一幅灰度圖像使用不同閾值得到的二值圖像輸出結果.閾值算法與應用領域密切相關.事實上,某一閾值運算常常是為某一應用專門設計的,在其它應用領域可能無法工作.閾值選擇常常是基于在某一應用領域獲取的先驗知識,因此在某些場合下,前幾輪運算通常采用交互式方式來分析圖像,以便確定合適的閾值.但是,在機器視覺系統(tǒng)中,由于視覺系統(tǒng)的自主性能〔autonomy要求,必須進行自動閾值選擇.現(xiàn)在已經(jīng)研究出許多利用圖像灰度分布和有關的物體知識來自動選擇適當閾值的技術.2.2圖像區(qū)域分析圖像中的區(qū)域是指相互連結的具有相似特性的一組像素.由于區(qū)域可能對應場景中的物體,因此,區(qū)域的檢測對于圖像解釋十分重要.一幅圖像可能包含若干個物體,而每一個物體又可能包含對應于物體不同部位的若干個區(qū)域.為了精確解釋一幅圖像,首先要把一幅圖像劃分成對應于不同物體或物體不同部位的區(qū)域.2.2.1區(qū)域與邊緣圖像區(qū)域劃分有兩種方法:一種是基于區(qū)域的方法,另一種是使用邊緣檢測的輪廓預估方法.在基于區(qū)域的方法中,把所有對應于一個物體的像素組合在一起,并進行標記,以表示它們屬于一個區(qū)域,這一處理過程稱為分割.在某一評判標準下,把像素分配給某一區(qū)域,就可以把這些像素同圖像其余部分分開.圖像分割中的兩個最基本的原則是數(shù)值相似性和空間接近性.如果兩個像素具有相似的強度特性,或它們之間十分靠近,則可以把它們分配到同一區(qū)域,例如,兩個像素之間的數(shù)值相似性度量可以是它們的灰度值之差,也可以是區(qū)域灰度值分布;它們的空間接近性度量可以是歐幾里德距離,也可以是區(qū)域致密度.相似性和接近性原則來源于如下假設:同一物體上的點投影到圖像上得到的像素點在空間上十分靠近,且具有相似的灰度值.很顯然,這一假設并不是在任何情況下都成立.然而可以使用這一假設來組合圖像中的像素,然后利用相關域知識來匹配物體模型和區(qū)域.在簡單的情況下,可以通過閾值法和連通成份標記法來進行圖像分割.對于復雜的圖像,可以使用更高級的方法實現(xiàn)圖像分割.分割也可以通過求取區(qū)域邊界上的像素來進行.這些像素點〔也稱為邊緣可以通過搜尋鄰近像素的方法來得到.由于邊緣像素是在邊界上,在邊界兩邊的區(qū)域具有不同的灰度值,這樣,區(qū)域的邊界可以通過測量鄰近像素差值來求?。M管邊緣檢測可能使用誘導特性〔如紋理和運動來檢測邊緣.但大多數(shù)邊緣檢測器僅使用強度特性作為邊緣檢測的基礎.在理想的圖像中,一個區(qū)域是由一條封閉輪廓線包圍著.原則上,區(qū)域分割和邊緣檢測應該產生相同的結果,即使用邊界跟蹤算法可以得到區(qū)域的邊緣〔或封閉的輪廓線;反過來,使用區(qū)域填充算法也可以得到邊緣所包圍的區(qū)域.但在實際的圖像中,很少能夠從區(qū)域中得到正確的邊緣,反之亦然.由于噪聲和其它因素的影響,不論是區(qū)域分割還是邊緣檢測,都無法提供完整的信息.2.3圖像處理與識別及圖像理解所研究的內容圖像處理技術1.圖像數(shù)字化其目的是將模擬形式的數(shù)字圖像通過數(shù)字化設備變?yōu)閿?shù)字計算機可用的離散的圖像數(shù)據(jù)。2.圖像變換為了達到某種目的〔通常是從圖像中獲得某種重要的信息而對圖像使用一種數(shù)學技巧,經(jīng)過變換后的圖像更為方便、容易地處理和操作。3.圖像增強圖像增強的主要目標是改善圖像的質量。采用某種特殊的技術來突出圖像中的某些信息,削弱或消除某些無關信息,從而有目的地強調圖像的整體或局部特征。常常用來改善人對圖像的視覺效果,讓觀察者能看到更加直接、清晰、適于分析的信息。直方圖修正、灰度變換、強化圖像輪廓等都是常用的手段。4.圖像分割在圖像的研究和應用中,人們往往僅對圖像的某些部分感興趣。它們一般對應圖像中特定的、具有獨特性質的區(qū)域。圖像分割就是把圖像分割成各具特性的區(qū)域并提取出感興趣的目標。5.圖像分析圖像分析也可稱為圖像理解,主要研究從圖像中提取有用的數(shù)據(jù)或信息,生成非圖像的描述或表示。圖像分析的內容分為特征提取、圖像分割、符號描述、紋理分析、運動圖像分析和圖像的檢測和配準。圖像識別技術圖像識別是近20年來發(fā)展起來的一門新型技術科學,它以研究某些對象或過程的分類與描述為主要內容。圖像識別所研究的領域十分廣泛,它可以是醫(yī)學圖像中的癌細胞識別;機械加工中的零部件的識別、分類;可以是從遙感圖片中辨別農作物、森林、湖泊與軍事設施;可以是自導引小車中的路徑識別;郵政系統(tǒng)中自動分煉信函;交通管制、識別違章行使的汽車牌照;銀行的支票識別、身份證識別等。上述都是圖像識別研究的課題??偟脕碚f所研究的問題,主要是分類問題。圖像識別系統(tǒng)的組成一個圖像識別系統(tǒng)主要包括3部分:圖像信息獲??;信息加工和處理、抽取特征;判斷和分類。如圖2-2所示。被識別圖像圖像信息獲取處理、特征抽取被識別圖像圖像信息獲取處理、特征抽取識別判斷識別判斷圖2-2圖像識別系統(tǒng)框圖圖像識別方法圖像識別的方法較多,大體上可以歸納為兩類方法:統(tǒng)計方法〔數(shù)學方法和語言〔或結構學方法,后者亦稱句法結構識別方法。統(tǒng)計方法以數(shù)學上決策理論為基礎,根據(jù)這種理論建立了統(tǒng)計學識別模型。其基本模型是在對研究的圖像進行大量統(tǒng)計分析,找出規(guī)律性認識,抽出反映圖像本質特征進行識別。在這種方法中,大量工作在于如何抽取圖像的特征或決定統(tǒng)計參數(shù),即所謂參數(shù)法。另外,還有非參數(shù)決策法,如鄰近法則,它是一種跳過概率的估計而直接進行決策的方法。對于特征抽取,必須把圖像的大量原始信息縮減為少數(shù)的特征,例如采用分差分布、特征向量法。對文字、符號等可只抽取幾何圖形特征,對聲波信號可抽取頻普特征。為了抽取特征,有時要對原始圖像信息進行各種變換,空間投影,把多維的圖像點簡化到幾個坐標分量上。句法結構識別法立足于分析圖像的結構,一幅圖像可以模仿語言構造,用一些語句來表達。語句的結構是由詞、短語等組成,并按照一定的語法表達出來。也就是說,語句由短語組成,而短語由單詞組成,其中最基本的元素就是單詞。那么一些語句又怎么樣和圖像發(fā)生聯(lián)系呢?這可從圖像的形成說起,任何一幅圖像,總是由一些點、直線、斜線、弧線及環(huán)組成,分析圖像的這些基本元素,看它們按怎樣的規(guī)則構成圖像,這就是結構分析的課題。這些基本元素就相當于言句中的單詞;那些直線、曲線可看成短語,它們的全體按怎樣的規(guī)則構成整個圖像,就相當于語法結構。而對圖像識別來說,就相當于檢查圖像所代表的某一類句型,是否符合事先規(guī)定的語法。若語法正確,則認為識別出結果。圖像理解圖像理解的研究顯然要涉及或包含研究獲取圖像的方法、裝置和具體應用的實現(xiàn),這就形成了所謂的計算機視覺。1、傳感器引起失真的補償人的圖像是用灰度的二維陣列表示的,通常由于傳感器的特性會引起幾何學上或者光學上的失真,因此需進行補償。2、圖像特征的提取圖像凡是亮度發(fā)生急劇變化的地方,都是對應于不同物體面與面之間的邊緣,這是一個重要特征,所以把圖像中亮度急劇變化的點提取出來并對其性質進行描述〔如邊緣的方向、幅度、直方圖等,對這些特征點的統(tǒng)計分布狀況進行研究,可認識到物體的構造。如果把相鄰的特征點連接起來則可以構成輸入圖像的曲線。3、景物特征的提取在觀看物體時看到的不僅是亮度急劇變化的點,同時還有各個面的方向、距離、顏色反射率,這些特征與照明的情況和視點的位置無關,是物體所固有的特征。為了與圖像上特征相區(qū)別,一般稱為景物特征。4、景物的分割物體的發(fā)現(xiàn)利用景物的特征,把其性質大致相同的領域分割開來,這與圖像處理中把亮度相同的領域分割出來的領域法相同。5、物體的識別從景物所發(fā)現(xiàn)的各物體再參照物體的模型來識別物體,與此同時確定各物體的位置和方向。6、景物的識別研究各物體之間的連接關系,由這個連接關系和模型來認識更復雜的物體,從而可以對景物的全體進行描述。特征描述的一致性物體的模型景物的描述物體的描述特征描述的一致性物體的模型景物的描述物體的描述分離的描述復雜物體的模型關于景物的先驗知識圖像顏色、形狀、紋理景物的特征圖像特征提取圖像景物傳感器的模型關于景物的先驗知識圖像顏色、形狀、紋理景物的特征圖像特征提取圖像景物傳感器的模型圖2-3典型的圖像理解系統(tǒng)2.4圖像處理與識別及圖像理解的關系在研究圖像理解時,往往要進行圖像的處理、識別及圖像理解的過程,三者關系非常密切,互相交錯。圖像處理在研究圖像首先要對獲得的圖像進行預處理以濾去影響的因素,作為幾何、彩色校正等。這樣可提高信噪比:有時由于信息微弱,無法辨識,還得進行增強處理。并且為了從圖像中找到需要識別的東西,還得對圖像進行分割,也就是進行定位和分離,以分出不同的物體。為了給觀察者以清晰的圖像,還要對圖像進行改善,即進行復原處理,它是把已經(jīng)退化了的圖像加以重建或恢復的過程,以便改進圖像的保真度。在實際處理中,由于圖像信息量非常大,在存儲及傳送中,還要對圖像進行壓縮。上述工作必須用計算機來完成,因而要進行編碼等工作。之前等等都是圖像處理的工作,因此,圖像處理包括圖像增強,圖像編碼,圖像壓縮,圖像復原,圖像分割等。輸入的是圖像,輸出的也是圖像,過程如下所示:圖像處理圖像處理〔編碼、壓縮、增強、分割、復原圖像輸入圖像輸出2-4圖像處理示意圖圖像識別是在上述分割后的每個部分中,找出它的形狀及紋理等特征,即特征抽取〔有時也包括圖像分割,以便對圖像進行分類并對整個圖像作結構上的分析。所以,對圖像識別來說,輸入的是圖像,輸出的是類別和圖像的結構分析,如下圖所示:圖像處理〔編碼、壓縮、增強、分割、復原圖像處理〔編碼、壓縮、增強、分割、復原2-5圖像識別示意圖圖像理解所謂圖像理解是一個總稱。上述圖像處理及圖像識別的最終目的就在于對圖像作描述和解釋,以便最終理解它是什么圖像。所以它是在圖像處理及識別的基礎上,再根據(jù)分類作結構句法分析,去描述圖像和解釋圖像。圖像處理、識別、及理解之間的關系如圖:圖像處理圖像處理〔編碼、壓縮、增強、分割、復原圖像圖像描述+解釋2-6圖像理解示意圖2.5圖像處理工具MATLABMATLAB語言的首創(chuàng)者CleveMoler教授在數(shù)值分析,特別是在數(shù)值線性代數(shù)的領域中很有影響,他參與編寫了數(shù)值分析領域一些著名的著作和兩個重要的Fortran程序EISPACK和LINPACK。他曾在密西根大學、斯坦福大學和新墨西哥大學任數(shù)學與計算機科學教授。1980年前后,當時的新墨西哥大學計算機系主任Moler教授在講授線性代數(shù)課程時,發(fā)現(xiàn)了用其他高級語言變成極為不便,便構思并開發(fā)了MATLAB<MATrixLABoratory,即矩陣實驗室>,這一軟件利用了當時數(shù)值線性代數(shù)領域最高水平的EISPACK和LINPACK兩大軟件包中可靠的子程序,用Fortran語言編寫了集命令翻譯、科學計算于一身的一套交互式軟件系統(tǒng)。MATLAB語言是當今國際上科學界<尤其是自動控制領域>最具影響力、也是最有活力的軟件。它起源于矩陣運算,并已經(jīng)發(fā)展成一種高度集成的計算機語言。它提供了強大的科學運算、靈活的程序設計流程、高質量的圖形可視化與界面設計、便捷的與其他程序和語言接口的功能。MATLAB語言在各國高校與研究單位起著重大的作用。MATLAB的數(shù)字圖像處理功能很強大,其自帶的圖像處理工具箱〔ImageprocessingToolbox包括了經(jīng)典圖像處理的許多方面,如圖像的幾何操作、鄰域和區(qū)域操作、圖像變換、圖像的恢復和增強、線性濾波器設計、圖像分析和統(tǒng)計、色彩、集合及形態(tài)操作等方面,同時,MATLAB還提供了對多種圖像文件格式的讀寫和顯示,這使得在MATLAB的集成環(huán)境中可以輕松實現(xiàn)圖像處理。在圖像幾何操作方面,MATLAB的圖像幾何操作提供了插值函數(shù),圖像尺寸調整,以及任意角度的圖像旋轉,可以對圖像進行縮放、旋轉和剪切等操作。在圖像濾波方面,MATLAB圖像片理工具箱提供了多個函數(shù)用于設計和實現(xiàn)多種濾波操作,圖像的線性濾波操作即可用MATLAB預定義的多種濾波器進行濾波,也可以根據(jù)需要用MATLAB實現(xiàn)自定義的濾波器進行濾波。在圖像變換方面,MATLAB圖像處理工具箱提供了Fourier變換,離散余弦變換,Radon變換以及這些變換的逆變換等,同時民可以利用MATLAB的小波變換工具箱來實現(xiàn)圖像的小波變換。在圖像分析方面,MATLAB圖像處理工具箱支持多種標準的圖像處理操作,以方便用戶對圖像進行分析和調整。MATLAB圖像處理工具箱提供了多個函數(shù)對圖像的像素進行操作,包括:選定像素的灰度值,沿圖像中某個路徑的灰度值,圖像的灰度的輪廓圖,圖像灰度直方圖,圖像灰度的摘要統(tǒng)計以及圖像區(qū)域的特征度量。MATLAB圖像分析技術可以提取圖像的結構信息。如,MATLAB圖像處理工具箱提供的多種邊緣檢測算子可以提取圖像的邊界信息。MATLAB圖像處理工具箱己經(jīng)實現(xiàn)了如Log算子、Canny算子、Sobel算子、Prewitt算子、Roberts算子等多種經(jīng)典的檢測邊界檢測算法,MATLAB中的圖像處理技術用于改善圖像,包括對圖像噪聲的操作,濾波以減少噪音,以及對圖像的顏色和灰度的調整,如,圖像灰度直方圖修下和直方圖均衡化。第三章斑馬線自動識別系統(tǒng)主要算法3.1邊緣檢測邊緣<edge>是指圖像局部強度變化最顯著的部分.邊緣主要存在于目標與目標、目標與背景、區(qū)域與區(qū)域<包括不同色彩>之間,是圖像分割、紋理特征和形狀特征等圖像分析的重要基礎.圖像分析和理解的第一步常常是邊緣檢測<edgedetection>.圖像中的邊緣通常與圖像強度或圖像強度的一階導數(shù)的不連續(xù)性有關.圖像強度的不連續(xù)可分為:<1>階躍不連續(xù),即圖像強度在不連續(xù)處的兩邊的像素灰度值有著顯著的差異;<2>線條不連續(xù),即圖像強度突然從一個值變化到另一個值,保持一個較小的行程后又返回到原來的值.在實際中,階躍和線條邊緣圖像是很少見的,由于大多數(shù)傳感元件具有低頻特性,使得階躍邊緣變成斜坡型邊緣,線條邊緣變成屋頂形邊緣,其中的強度變化不是瞬間的,而是跨越一定的距離,這些邊緣如圖3.1所示.圖3.1兩種常見的邊緣,<a>階躍函數(shù),<b>線條函數(shù).其中第一排為理想信號,第二排對應實際信號對一個邊緣來說,有可能同時具有階躍和線條邊緣特性.例如在一個表面上,由一個平面變化到法線方向不同的另一個平面就會產生階躍邊緣;如果這一表面具有鏡面反射特性且兩平面形成的棱角比較圓滑,則當棱角圓滑表面的法線經(jīng)過鏡面反射角時,由于鏡面反射分量,在棱角圓滑表面上會產生明亮光條,這樣的邊緣看起來象在階躍邊緣上疊加了一個線條邊緣.由于邊緣可能與場景中物體的重要特征對應,所以它是很重要的圖像特征。比如,一個物體的輪廓通常產生階躍邊緣,因為物體的圖像強度不同于背景的圖像強度.3.2坎尼〔Canny算子檢測階躍邊緣的基本思想是在圖像中找出具有局部最大梯度幅值的像素點.檢測階躍邊緣的大部分工作集中在尋找能夠用于實際圖像的梯度數(shù)字逼近.由于實際的圖像經(jīng)過了攝像機光學系統(tǒng)和電路系統(tǒng)〔帶寬限制固有的低通濾波器的平滑,因此,圖像中的階躍邊緣不是十分陡立.圖像也受到攝像機噪聲和場景中不希望的細節(jié)的干擾.圖像梯度逼近必須滿足兩個要求:<1>逼近必須能夠抑制噪聲效應,<2>必須盡量精確地確定邊緣的位置.抑制噪聲和邊緣精確定位是無法同時得到滿足的,也就是說,邊緣檢測算法通過圖像平滑算子去除了噪聲,但卻增加了邊緣定位的不確定性;反過來,若提高邊緣檢測算子對邊緣的敏感性,同時也提高了對噪聲的敏感性.有一種線性算子可以在抗噪聲干擾和精確定位之間提供最佳折衷方案,它就是高斯函數(shù)的一階導數(shù),對應于圖像的高斯函數(shù)平滑和梯度計算.梯度的數(shù)值逼近可用上述中列出的和方向上的一階偏導的有限差分來表示.高斯平滑和梯度逼近相結合的算子不是旋轉對稱的.這種算子在邊緣方向上是對稱的,在垂直邊緣的方向上是反對稱的<沿梯度方向>.這也意味著該算子對最急劇變化方向上的邊緣特別敏感,但在沿邊緣這一方向上是不敏感的,其作用就象一個平滑算子.在高斯噪聲中,一個典型的邊緣代表一個階躍的強度變化。根據(jù)這個模型,好的邊緣檢測算子應該有3個指標:①低失誤概率,即真正的邊緣點盡可能少的丟失又要盡可能避免將非邊緣點檢測為邊緣;②高位置精度,檢測的邊緣應盡可能接近真實的邊緣;③對每一個邊緣點有惟一的響應,得到單像素寬度的邊緣??材崴阕犹岢隽诉吘壦阕拥娜缦?個準則?!?信噪比準則信噪比越大,提取的邊緣質量越高。信噪比SNR定義為:其中G〔x代表邊緣函數(shù),h〔x代表寬度為W的濾波器的脈沖響應,σ代表高斯噪聲的均方差?!?定位精度準則邊緣定位精度L如下定義:其中和分別是G〔x和h〔x的導數(shù)。L越大表明定位精度越高?!?單邊緣響應準則為了保證單邊緣只有一個響應,檢測算子的脈沖響應導數(shù)的零交叉點平均距離應滿足:是的二階導數(shù)。以上述指標和準則為基礎,利用泛函求導的方法可導出坎尼邊緣檢測器是信噪比與定位之乘積的最優(yōu)逼近算子,表達式近似于高斯函數(shù)的一階導數(shù)。將坎尼3個準則相結合可以獲得最優(yōu)的檢測算子??材徇吘墮z測的算法步驟如下:〔1用高斯濾波器平滑圖像;〔2用一階偏導的有限差分來計算梯度的幅值和方向;〔3對梯度幅值進行非極大值抑制;〔4用雙閥值算法檢測和連接邊緣??材崴阕右部梢杂肕ATLAB中的edge函數(shù)來檢測邊緣:BW=edge<I,’canny’,thresh,sigma>式中thresh是邊緣檢測的閥值,sigma是高斯濾波器的σ值,默認為2。3.3模板匹配算法認知是一個把未知與已知聯(lián)系起來的過程。對一個復雜的視覺系統(tǒng)來說,它的內部常同時存在著多種輸入和其它知識共存的表達形式。感知是把視覺輸入與事前已有表達結合的過程,而識別也需要建立或發(fā)現(xiàn)各種內部表達式之間的聯(lián)系。模板匹配的基本概念:模板就是一幅已知的小圖像。模板匹配就是在一幅大圖像中搜尋目標,已知該圖中有要找的目標,且該目標同模板有相同的尺寸、方向和圖像,通過一定的算法可以在圖中找到目標,確定其坐標位置。以8位圖像<其1個像素由1個字節(jié)描述>為例,模板T<mn個像素>疊放在被搜索圖S<WH個像素>上平移,模板覆蓋被搜索圖的那塊區(qū)域叫子圖Sij。i,j為子圖左上角在被搜索圖S上的坐標。搜索范圍是:通過比較T和Sij的相似性,完成模板匹配過程。兩個函數(shù)的相關性定義,可用下式表示:=表示的復共軛,我們知道相關理論相似于卷積理論,和分別表示和的傅利葉變換,根據(jù)卷積理論有:和可知卷積是空間域過濾和頻率域過濾之間的紐帶,相關的重要用途在于匹配,在匹配中是一幅包物體或區(qū)域的圖像。如果要確定是否包含有感興趣的物體或區(qū)域,讓作為那個物體的區(qū)域〔通常稱該物體為模板。如果匹配成功,2個函數(shù)的相關值會在找到中相應點的位置上達到最大。從上面的分析可知:相關算法可以有兩種方法,可以在空間域進行,也可以在頻率域進行。由傅利葉分析中的相關定理可知,兩個函數(shù)在定義域的卷積等于它們在頻域的乘積,而相關則是卷積的一種特定形式。因此可在頻域中實現(xiàn)相關算法,由于快速傅利葉變換〔FFT技術比直接用空間域卷積計算速度要快,為此利用FFT進行頻域相關運算也是一種可行的方法。首先把基圖和實圖進行二維離散傅利葉變換〔DFT,對于基圖有:=,其中和分別表示和方向的頻域變量,且=并借定其圖的尺寸是MM維的。實時圖的傅利葉變換可以用同樣的方法得到。然后由相關定理可以寫出相關離散傅利中變換為:,為此,對求傅利葉反變換就可以得出空間域中相關系數(shù)為:第4章基于matlab的斑馬線自動識別系統(tǒng)4.1系統(tǒng)結構流圖RGB圖像輸入將輸入的圖像灰度化RGB圖像輸入將輸入的圖像灰度化將灰度化的圖像二值化用Canny算子進行邊緣檢測裁剪提取興趣區(qū)域,分割圖像將分割的圖像再進行灰度化二值化反色處理將最后得出的圖與模板庫中的模板進行匹配匹配得出結果,輸出識別結果圖4.1基于matlab的的斑馬線自動識別系統(tǒng)結構流圖4.2系統(tǒng)功能模塊分析與實現(xiàn)系統(tǒng)主要包括幾大功能模塊:圖像分割模塊、模板讀取模塊、圖像識別模塊。圖像分割模塊首先輸入一幅圖片,將RGB圖像轉為HIS格式,代碼實現(xiàn):HS_I=<myI<:,:,1>+myI<:,:,2>+myI<:,:,3>>/3;如下:圖輸入的RGB原圖圖4.2.2處理后的灰度圖再對其進行邊緣檢測,包括邊緣點數(shù)量統(tǒng)計與S分量的紋理分割:BW=edge<HS_I,'canny',0.8>;%邊緣檢測,對邊緣像素點作統(tǒng)計分析。t2=tocticES=0;fori=1:xforj=1:yif<BW<j,i>==1>S<j,i>=1-min<myI<j,i,:>>/HS_I<j,i>;SR=round<S<j,i>*100>/100;ES=[ESSR];endendend圖4.2.3CANNY算子處理后的圖BW1=zeros<y,x>;%根據(jù)上述的統(tǒng)計直方圖設定S的閾值fori=1:xforj=1:yif<<BW<j,i>==1>&<S<j,i><=0.06>&<S<j,i>>=0.01>>BW1<j,i>=1;endendend對X方向和Y方向進行邊緣像素點數(shù)量統(tǒng)計,挑出邊緣點數(shù)量大于平均值的位置,最后一列大于平均值的位置作為,最后一個區(qū)域的切分位置,下面是X方向的算法,Y方向的也類似,代碼簡要實現(xiàn)如下:ColumnX=zeros<1,x>;fori=1:xif<EdgePointsX<i>>=AveragePointsX>ColumnX<i>=1;endendNx=sum<ColumnX>;Posx=zeros<1,Nx>;%挑出邊緣點數(shù)量大于平均值的位置k=1;fori=1:xif<EdgePointsX<i>>=AveragePointsX>Posx<k>=i;k=k+1;endendgapx=12;%間隔小于10列的,區(qū)域合并Partx0=zeros<1,Nx>;Partx1=zeros<1,Nx>;k=1;Partx0<1>=Posx<1>;fori=2:Nxd=Posx<i>-Posx<i-1>;if<d>gapx>Partx1<k>=Posx<i-1>;k=k+1;Partx0<k>=Posx<i>;endendPartx1<k>=Posx<Nx>;%最后一列大于平均值的位置作為,最后一個區(qū)域的切分位置Spanx=zeros<1,k>;%共有k個區(qū)域fori=1:kSpanx<i>=sum<ColumnX<Partx0<i>:Partx1<i>>>;end[mytempnPartx]=max<Spanx>;word_Xseg0=Partx0<nPartx>;word_Xseg1=Partx1<nPartx>;最后得出分割的圖片,代碼實現(xiàn)如下:word=I<word_Yseg0:word_Yseg1,word_Xseg0:word_Xseg1,:>;圖4.2.5最后分割出來的圖模板讀取模塊在圖像識別之前,首先就是要從模板庫中讀取模板,之后才可以進行匹配識別。下面就是模板讀取算法的實現(xiàn)代碼:function[Plate]=get_model<>forn=1:15Plate{n}=imread<['plates\',int2str(n),'.bmp']>;Plate{n}=rgb2gray<Plate{n}>;Plate{n}=im2bw<Plate{n}>;End圖像識別模塊將RGB原圖分割出來之后,再將其灰度化、二值化、反色處理,之后將其大小調整至和模板大小一樣,因為模板匹配的時候,兩幅二值化圖片的大小要一樣才能夠進行模板匹配,之后再讀取模板,調用識別函數(shù)就可以得出該圖片和模板庫里面哪一幅圖片相似度最大了。代碼實現(xiàn)如下:ww=word;Img2=rgb2gray<ww>;%將切割出來的圖片灰度化處理Threshold=graythresh<Img2>;Img3=im2bw<Img2,Threshold>;%將灰度化的圖片二值化處理Img4=~Img3;Img5=imresize<Img4,[100,100]>;%將該圖片重新調整至模版尺寸plate=get_model;%讀取模版forn=1:15like<n>=shibie<Img5,plate{n}>;%調用識別函數(shù)end下面是模板匹配識別函數(shù)的實現(xiàn)代碼:Plate=Load_Plate;%Plate定義的變量,用來加%載導入的模板數(shù)據(jù)%Load_Plate是導入模板數(shù)據(jù)%的函數(shù)forn=1:24A=get_Img4;B=Plate{n};a=A-mean2<A>;b=B-mean2<B>;r<n>=sum<sum<a.*b>>/sqrt<sum<sum<a.*a>>*sum<sum<b.*b>>>;end[like,j]=max<r>;%like是相關系數(shù),j是所對應的模板序號之后就再定義一個空數(shù)組message{i}=''來存儲字符串,這個空的字符串數(shù)組的賦值方式如下:ifi>=0.5&&j==1result='

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論