基于數(shù)學(xué)形態(tài)學(xué)和投影法的車牌定位算法_第1頁
基于數(shù)學(xué)形態(tài)學(xué)和投影法的車牌定位算法_第2頁
基于數(shù)學(xué)形態(tài)學(xué)和投影法的車牌定位算法_第3頁
基于數(shù)學(xué)形態(tài)學(xué)和投影法的車牌定位算法_第4頁
基于數(shù)學(xué)形態(tài)學(xué)和投影法的車牌定位算法_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)基于數(shù)學(xué)形態(tài)學(xué)和投影法的車牌定位算法大學(xué)光電工程學(xué)院GraduationDesign(Thesis)ofChongqingVehicleLicensePlatelocationBasedonprojectionandMathematicalMorphologyUndergraduate:LiHuiyingSupervisor:Prof.LiZhiminAssistantSupervisor:LiangJunMajor:InformationEngineeringCollegeofChongqingJune2009重慶大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)摘要PAGEI摘要車牌識別技術(shù)是智能交通領(lǐng)域的重要課題之一,它主要包括車牌定位、字符分割、字符識別三個部分。其中,車牌定位算法的處理效果對字符識別起著決定性的作用。因此研究車牌定位算法有著重要的現(xiàn)實意義。本文采用了一種由數(shù)學(xué)形態(tài)學(xué)和投影法相結(jié)合的車牌定位方法,定位過程由以下幾個步驟實現(xiàn):首先,是車牌圖像的預(yù)處理,它包括圖像的灰度化、灰度線性變換、二值化、圖像去噪等;然后,采用數(shù)學(xué)形態(tài)學(xué)算子進行車牌粗定位以提取候選車牌區(qū)域,因為它可增大目標、縮小孔洞,填補目標中的空洞,使目標形成連通域;最后,對車牌進行行掃描和列掃描,通過對跳變點的判斷完成車牌細定位。這種利用數(shù)學(xué)形態(tài)學(xué)方法對傳統(tǒng)投影定位法進行改進,從而實現(xiàn)車牌的準確定位的方法,具有定位準確、運算快速的優(yōu)點,適合實際應(yīng)用。通過實驗表明,該方法的定位準確率達到了98.3%,定位時間約為40ms,基本上滿足了在復(fù)雜背景下有效提高了車牌圖像定位的準確性和運算速度等要求。關(guān)鍵詞:數(shù)學(xué)形態(tài)學(xué),投影法,車牌定位,二值化重慶大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)ABSTRACTPAGEIIIABSTRACTThetechnologyofLicensePlateRecognitionisanimportantissueinthefieldofintelligenttransportation,whichincludesthreeparts:licenseplatelocation,charactersegmentation,characterrecognition.Amongthem,theeffectofthelicenseplatelocationplaysadecisiveroleinthecharacterrecognition.Sothereisaverypracticalsignificanceinstudyingthealgorithmoflicenseplatelocation.Thispaperpresentsalicenseplatelocationalgorithmbasedonprojectionwhichassociatewithmathematicalmorphology.Locationprocessingiscametruebythefollowingsteps:firstofall,preprocessingofthelicenseplateimage,whichincludesthecolortogray,gray-linear-transformation,binarization,imagedenoising,etc;then,usemorphologicaloperatorsforlicenseplateregion’sroughdetection,becauseitcaneliminatelittleobjectsandfillinlittleholesofobjects;finally,licenseplateexactlylocation,ontheplateforhorizontalandverticalprojection,hoppingtojudgetheaccuratepositionoftheplatesthroughthesaltuspoint.Thismethodwhichisusedmathematicalmorphologytoimprovethetraditionalprojectioninordertoachieveaccuratepositioningissuitableforpracticalapplicationwiththeadvantagesofpositioningaccuracyandsimpleoperation.Experimentsshowthatthemethod’spositioningaccuracyratereach98.3percent,positioningtimeisabout40ms,itmeetsthebasicrequirementsthatimprovingpositioningaccuracyandcomputationalspeedinthecomplexitybackgroundofthelicenseplateimageeffectively.Keywords:mathematicalmorphology,projections,platelocation,binarization重慶大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)目錄PAGEV目錄中文摘要 IABSTRACT II1緒論 11.1課題背景和現(xiàn)實意義 11.2國內(nèi)外研究現(xiàn)狀 21.2.1LPRS的主要應(yīng)用技術(shù) 21.2.2車牌定位的研究現(xiàn)狀 31.2.3車牌字符識別的研究現(xiàn)狀 51.3本文研究內(nèi)容和各章安排 62圖像預(yù)處理 82.1圖像的灰度化 82.2灰度線性變換 92.2.1圖像增強介紹 92.2.2灰度線性變換 102.2.1基于區(qū)域分割的分段線性變換 112.3二值化 122.4中值濾波去噪 142.4.1中值濾波 143車牌定位 173.1基于數(shù)學(xué)形態(tài)學(xué)的粗定位 173.1.1數(shù)學(xué)形態(tài)學(xué)的發(fā)展史 173.1.2數(shù)學(xué)形態(tài)學(xué)與圖像處理 183.1.3數(shù)學(xué)形態(tài)學(xué)的有關(guān)定義 193.1.4基于形態(tài)學(xué)運算的候選區(qū)域選取 203.1.5基于結(jié)構(gòu)特征的候選區(qū)域篩選 223.2基于投影法的車牌圖像精確定位 223.2.1水平方向定位 233.2.2牌照垂直方向的定位算法 244結(jié)論與展望 264.1實驗結(jié)果 264.2課題主要研究成果和創(chuàng)新點 264.3研究工作的展望 27參考文獻 28重慶大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)第1章緒論PAGE261緒論近年來,隨著國民經(jīng)濟的快速發(fā)展,各種機動車輛不斷增加,導(dǎo)致道路交通量不斷增大,交通事故、交通堵塞等問題日益嚴重,我國正面臨著道路網(wǎng)通行能力不能滿足交通量增長需求等問題。為了解決這些問題,部分發(fā)達國家相繼推出了適應(yīng)未來運輸需求的智能交通系統(tǒng)(IntelligentTrafficManagementSystem,ITS),我國也將發(fā)展ITS作為今后交通建設(shè)的一個重要發(fā)展方向。作為現(xiàn)代智能交通系統(tǒng)中的一項非常重要的技術(shù),車牌識別(LicensePlateRecognition,LPR)技術(shù)是近幾年來的研究熱點。其涉及的領(lǐng)域包括模式識別、圖像處理、人工智能、信息論、計算機等多門學(xué)科,是一門綜合的應(yīng)用技術(shù)。它主要包括車牌定位、字符分割、字符識別三個部分。其中,車牌定位與字符分割算法的處理效果對字符識別起著決定性的作用。車牌識別系統(tǒng)既具有重要的理論意義,也具有良好的實際應(yīng)用價值,并且在現(xiàn)實生活中已經(jīng)得到一定程度的應(yīng)用。雖然它的研究已經(jīng)有一段時間,但現(xiàn)有的車牌定位算法環(huán)境適應(yīng)性差,在復(fù)雜背景下存在著定位困難的問題,因此車牌定位算法的研究仍有著很深的現(xiàn)實意義。本章首先就本課題提出的背景和現(xiàn)實意義進行闡述,然后對國內(nèi)外車牌識別技術(shù)的研究現(xiàn)狀做一個概況。最后講述本文的內(nèi)容安排。1.1課題背景和現(xiàn)實意義隨著21世紀經(jīng)濟全球化和信息時代的到來,計算機技術(shù)、通信技術(shù)和網(wǎng)絡(luò)技術(shù)迅猛發(fā)展,自動化的信息處理能力和水平不斷提高,并在人們社會活動和生活的各個領(lǐng)域得到廣泛應(yīng)用。高速度、高效率的生活節(jié)奏,使汽車普及成為必然趨勢。伴隨著世界各國汽車數(shù)量的增加,城市交通狀況日趨嚴峻,如何有效地進行交通管理,越來越成為各國政府相關(guān)部門關(guān)注的焦點。針對這一問題,人們運行先進的科學(xué)技術(shù),相繼研發(fā)了各種交通道路監(jiān)視管理系統(tǒng)、車輛控制系統(tǒng)及公共交通系統(tǒng)。這些系統(tǒng)將車輛和道路綜合起來進行考慮,運行各種先進的技術(shù)解決道路交通的問題,統(tǒng)稱為智能交通系統(tǒng)。ITS是90年代興起的新一代交通運輸系統(tǒng)。它利用先進的信息處理技術(shù)、導(dǎo)航定位技術(shù)、無線通信技術(shù)、自動控制技術(shù)、圖像處理和識別技術(shù)及計算機網(wǎng)絡(luò)技術(shù)等加強道路、車輛、駕駛員和管理人員的聯(lián)系,實現(xiàn)道路交通管理自動化和車輛行駛的智能化,增強交通安全,減少交通堵塞,提高運輸效率,減少環(huán)境污染,節(jié)約能源,提高經(jīng)濟活力。車牌識別系統(tǒng),是智能交通系統(tǒng)的重要組成部分,是交通管理自動化的重要手段和車輛檢測系統(tǒng)的一個重要環(huán)節(jié),在交通監(jiān)視和控制中占有很重要的地位。車輛牌照識別系統(tǒng)本身是一個整體的智能化解決方案,系統(tǒng)同時具有良好的維護性和擴展性,可在無需為車輛加裝其他特殊裝置情況下實現(xiàn)對車輛的自動檢測。車牌識別技術(shù)的推廣普及,必將對加強城市道路管理、提高運輸效率、提高經(jīng)濟活力、減少交通事故及車輛被盜案件的發(fā)生、保障社會穩(wěn)定等方面產(chǎn)生重大而深遠的影響,因而對LPR技術(shù)的研究和應(yīng)用系統(tǒng)開發(fā)具有重要的實際意義。目前的車牌識別系統(tǒng)主要是針對車輛自動注冊和收費、停車場管理等場合,所監(jiān)視區(qū)域的背景一般比較簡單。而實際應(yīng)用中,所監(jiān)視的如高速公路、城市要道等往往都比較復(fù)雜,它包括一些路標、廣告牌、樹木、行人、建筑物等,都會對車輛檢測造成干擾,加上光照條件、拍攝角度等因素的影響,造成目前的算法不夠準確、快速,不能夠適應(yīng)復(fù)雜背景下的車牌識別。這就要求車牌識別算法必須要具有較強的適應(yīng)性,能夠去除各種干擾背景,可以克服視角不同所造成的車牌的變形,并能對不同尺度大小的車輛進行檢測等。因此,復(fù)雜背景下的車牌識別系統(tǒng),如果能夠?qū)崿F(xiàn)高實時性和高識別率的話,必定可以創(chuàng)造出可觀的社會經(jīng)濟效益。1.2國內(nèi)外研究現(xiàn)狀本課題重點是對LPRS的相關(guān)技術(shù)進行研究,因此本節(jié)主要介紹與此相關(guān)的研究現(xiàn)狀,且分為以下三個部分:“LPRS的主要應(yīng)用技術(shù)”、“車牌定位”和“車牌字符識別”的研究現(xiàn)狀。1.2.1LPRS的主要應(yīng)用技術(shù)上世紀90年代初,各國學(xué)者對LPRS展開了研究,當(dāng)前主要采用IC卡識別、條形碼識別、數(shù)字圖像處理、傳統(tǒng)模式識別和人工神經(jīng)網(wǎng)絡(luò)等技術(shù)來實現(xiàn)系統(tǒng)要求。eq\o\ac(○,1)IC卡識別技術(shù):IC卡是一種集微電子技術(shù)、通訊技術(shù)和計算機技術(shù)于一體的高科技產(chǎn)品,利用IC卡技術(shù)進行車牌識別,主要是指在車上安裝一個微型的電子信號接收和發(fā)射裝置即IC卡,卡內(nèi)存儲了該車的車牌號碼以及其他一些信息,當(dāng)車通過設(shè)有車輛檢測裝置的路口時,IC卡系統(tǒng)將與路口的計算機系統(tǒng)進行對話,使之識別出車牌號碼及其他信息,從而實現(xiàn)車輛的監(jiān)督和管理。IC卡識別技術(shù)具有識別率高,運行可靠和全天候作業(yè)等優(yōu)點,但整套裝置價格昂貴,硬件十分復(fù)雜,不適用于異地作業(yè),且需要制定出全國統(tǒng)一的標準。eq\o\ac(○,2)條形碼識別技術(shù):在車輛的側(cè)面印刷條形碼或是制作帶有條形碼的車牌,條形碼包含了該車車型、車牌號碼等基本信息,當(dāng)車通過紅外線掃描器時,條形碼上的信息被反射到讀取單元并被抽取出來,從而實現(xiàn)識別功能。條形碼識別技術(shù)具有識別速度快識別率高、成本低等優(yōu)點,但是該技術(shù)對于掃描器的要求很高,而且同IC卡技術(shù)一樣,須在全國范圍內(nèi)制定出統(tǒng)一的標準。eq\o\ac(○,3)數(shù)字圖像處理技術(shù):數(shù)字圖像處理(DigitalImageProcessing)又稱為計算機圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理的過程,具體的講就是將連續(xù)的模擬圖像變成離散的數(shù)字圖像后,用建立在特定的物理模型和數(shù)學(xué)模型基礎(chǔ)上編制的程序控制、運行并實現(xiàn)種種要求的處理。在LPRS中,用數(shù)字圖像處理實現(xiàn)識別的技術(shù)具有低成本、對硬件依賴性小等優(yōu)點,但其識別率的高低主要取決于識別算法。eq\o\ac(○,4)傳統(tǒng)模式識別技術(shù):傳統(tǒng)模式識別技術(shù)一般包括模版匹配算法,統(tǒng)計特征等。進入90年代,由于計算機視覺技術(shù)(ComputerVisionTechnique)的發(fā)展,開始對車牌識別進行系統(tǒng)化的研究。1990年A.S.Johnson等運用計算機視覺技術(shù)開發(fā)出一套LPRS。該系統(tǒng)分為圖像分割、特征提取和模塊構(gòu)造、字符識別等三個部分。利用不同閾值對應(yīng)的直方圖,經(jīng)過實驗確定出車牌位置的閾值范圍,從而根據(jù)特定閾值對應(yīng)的直方圖分割出車牌,再利用預(yù)先設(shè)置的標準字符模塊進行模塊匹配。它具有識別率高的優(yōu)點,但識別速度較慢。eq\o\ac(○,5)人工神經(jīng)網(wǎng)絡(luò)技術(shù):近幾年來,一些發(fā)達國家開始探討用人工神經(jīng)網(wǎng)絡(luò)解決車牌識別問題。它具有并行計算,分布式信息存儲,容錯能力強以及具備自適應(yīng)學(xué)習(xí)功能等一系列優(yōu)點,但是它常常將初始權(quán)值取為零或隨機數(shù),從而增加網(wǎng)絡(luò)的訓(xùn)練時間或陷入非要求的局部最小值??偨Y(jié)上述技術(shù),發(fā)現(xiàn)現(xiàn)階段最可行的車牌識別方法就是數(shù)字圖像處理技術(shù)。1.2.2車牌定位的研究現(xiàn)狀車牌定位(LicensePlateLocation,LPL)就是把車牌區(qū)域完整的從一幅具有復(fù)雜背景的車輛圖像中分割出來,它是LPRS中至關(guān)重要的一步。對于一幅車輛圖像來說,車牌區(qū)域只占全圖的一小部分,要想將其準確定位并分割出來是非常困難的,這就要求研究人員對車牌區(qū)域內(nèi)字符的紋理特征和字符與其背景之間的灰度特征進行分析,尋找它們之間的差別。當(dāng)前最常見的定位技術(shù)主要有:“基于邊緣檢測的方法”、“基于彩色分割的方法”、“基于小波變換的方法”和“遺傳算法”等。eq\o\ac(○,1)基于邊緣檢測的車牌定位方法:所謂“邊緣”就是指其周圍像素灰度有階躍變化的那些像素的集合。邊緣的兩側(cè)分屬于兩個區(qū)域,每個區(qū)域的灰度均勻一致,而兩個區(qū)域的灰度在特征上存在一定差異。邊緣檢測的基本原理是對圖像進行微分來達到檢測的目的。微分運算的結(jié)果表明:凡是灰度迅速變化的點都具有較高的微分值。大多數(shù)的邊緣檢測方法是基于方向?qū)?shù)掩模求卷積的方法。eq\o\ac(○,2)基于彩色分割的車牌定位方法:該方法由彩色分割和目標定位等模塊組成,采用多層感知器網(wǎng)絡(luò)對彩色圖像進行分割,然后通過投影法分割出潛在的車牌區(qū)域。在進行彩色分割時采用神經(jīng)網(wǎng)絡(luò)模型,一般圖像采用RGB三原色,但RGB三原色中兩點的歐氏距離與顏色距離不成線性比例。為了更好的進行彩色分割,將RGB模式的彩色圖像轉(zhuǎn)化為HSI模式,然后對輸出圖像的飽和度作調(diào)整。為了減少計算量,將彩色圖像抽稀后再進行模式轉(zhuǎn)化,同時為了減少光照條件對圖像分割產(chǎn)生的影響,采用對數(shù)方法進行彩色飽和度調(diào)整。然后對模式轉(zhuǎn)化后的彩色圖像進行彩色神經(jīng)網(wǎng)絡(luò)分割,最后根據(jù)車牌底色及長寬比等先驗知識,采用投影法分割出合理的車牌區(qū)域。當(dāng)獲取的彩色圖像質(zhì)量較高時,尤其是車牌區(qū)域顏色與附近顏色差別較大時,該定位算法正確率較高,但當(dāng)區(qū)域顏色與附近顏色相似時,正確率將有所下降,且由于采用了神經(jīng)網(wǎng)絡(luò)計算,因而計算速度較慢。eq\o\ac(○,3)基于小波變換的車牌定位:提出了一種基于小波分析和數(shù)學(xué)形態(tài)學(xué)的車牌定位方法,該方法通過小波多尺度分解提取出紋理清晰且具有不同空間分辨率、不同方向的邊緣子圖;然后利用車牌目標區(qū)域具有水平方向低頻、垂直方向高頻的的特點實現(xiàn)子圖提?。蛔詈笥脭?shù)學(xué)形態(tài)學(xué)方法對小波分解后的細節(jié)圖像進行一系列的形態(tài)運算,進一步消除無用信息和噪聲,以確定車牌位置。該方法在噪聲較小條件下定位效果好,分割精度高,其缺點是速度較慢,且在噪聲較大時誤定位機率也隨之增大。eq\o\ac(○,4)基于遺傳算法的車牌定位:該方法利用遺傳算法對圖像進行優(yōu)化搜索,結(jié)合區(qū)域特征矢量構(gòu)造適應(yīng)度函數(shù),最終尋找車牌區(qū)域的最佳定位參量。車牌定位是尋找一個符合“車牌區(qū)域特征”最佳區(qū)域的過程,本質(zhì)上就是從參量空間尋找最優(yōu)定位參量的問題,而尋找參量空間的最優(yōu)解正是遺傳算法最擅長的,但是在實時系統(tǒng)中,車牌定位速度受遺傳算法中迭代次數(shù)的影響很大。1.2.3車牌字符識別的研究現(xiàn)狀eq\o\ac(○,1)研究現(xiàn)狀:車牌字符識別實際上就是對車牌上的漢字、字母和數(shù)字進行準確確認的過程,其基本原理是將輸入字符與各個標準字符模版進行模式匹配,計算類似度,將具有最大類似度的標準字符作為識別結(jié)果輸出,當(dāng)前字符識別的主要方法有“模板匹配法”、“神經(jīng)網(wǎng)絡(luò)方法”、“特征點匹配法”、“光電混合聯(lián)合變換相關(guān)方法”和“小波法”等。模板匹配法計算快速,但對字符的噪聲、變形和光照較敏感。常用的神經(jīng)網(wǎng)絡(luò)有BP神經(jīng)網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)和Coonan網(wǎng)絡(luò)等,其優(yōu)點是對于字符的噪聲和變形不敏感,缺點是不易區(qū)分特征值相近的字符,例如:0,D,Q,8,B等。特征點匹配法選取了能夠區(qū)分各字符的若干特征點,進而得到各字符的編碼,從而能較好的區(qū)分特征值相近的字符,但是該方法只適用于二值圖。光電混合聯(lián)合變換相關(guān)方法是利用“聯(lián)合變換相關(guān)器”根據(jù)輸出面上相關(guān)峰的位置確定目標圖像和參考圖像,但速度較慢。eq\o\ac(○,2)國內(nèi)外字符識別的技術(shù)水平:字符識別中較難處理的是漢字識別。漢字識別技術(shù)是在英文、數(shù)字識別的基礎(chǔ)上,由日本學(xué)者于60年代末期最先開始研究的。并于1977年完成了日本通產(chǎn)省制定的“圖像信息處理系統(tǒng)”中的印刷漢字識別裝置,該裝置是一個龐大的硬件專用設(shè)備,可識別2000個漢字,識別速度可達到100字/秒。到80年代中期,日本的漢字識別技術(shù)已經(jīng)相當(dāng)成熟,并由東芝、三菱、三洋、松下等公司開發(fā)的以軟件為主并使用通用高檔微機的產(chǎn)品也已走向市場。我國于70年代末期開始對數(shù)字、英文、符號的識別進行研究,同期有少數(shù)大學(xué)和研究所對漢字識別方法進行了探索,并發(fā)表了一些學(xué)術(shù)論文,研究出少量模識識別軟件和系統(tǒng)。到80年代中期,我國漢字識別技術(shù)進入了研究的高潮,印刷體漢字識別技術(shù)的研究獲得了豐碩的成果,有11個單位進行了14次印刷體漢字識別成果的鑒定。進入90年代,在國家重點科研計劃的支持和市場驅(qū)動下,漢字識別系統(tǒng)一直朝著實用化的方向發(fā)展。今天,印刷體漢字識別已有四五個系統(tǒng),如北京信息工程學(xué)院研制的BI-OCR,清華大學(xué)研制的TH-OCR,國家智能計算機研究開發(fā)中心研制的NC-OCR,臺灣研究的丹青OCR等。它們能識別4000多個不同體、不同號的常用漢字,識別率達到95-99%,識別速度達到20-40字/秒。大陸和臺灣研制的聯(lián)機手寫漢字識別系統(tǒng)已有10多種,如中國科學(xué)院自動化研究所研制的漢王筆,臺灣研制的蒙恬筆等,市場銷售量已超過5萬套。這些系統(tǒng)能實時識別10000個以上的規(guī)范書寫的簡繁體漢字,筆順無限制或少限制,少數(shù)常用字可以連筆,識別率可達90%以上??傊覈∷Ⅲw漢字識別和聯(lián)機手寫漢字識別已經(jīng)進入實用階段,其技術(shù)水平和當(dāng)前世界最高水平并駕齊驅(qū)。1.3本文研究內(nèi)容和各章安排本文以汽車牌照自動識別為背景,以車輛圖像為主要對象,深入研究了計算機圖像處理、人工智能、模式識別等背景知識,探索了用數(shù)字圖像處理進行車牌定位的方法。上述算法盡管在一定的條件下能夠分割出車牌,但車牌識別系統(tǒng)大多是在室外使用,這就會存在許多客觀的干擾,如天氣、背景、車牌磨損、圖像傾斜等因素,因此,定位并不理想,使得后期識別車牌難度增加,甚至產(chǎn)生拒絕識別或誤識別。而且這些方法多有針對性和局限性,適用范圍不大。傳統(tǒng)的投影定位法作為一種常用的車牌圖像定位技術(shù)也取得了一定的效果,但對車牌圖像質(zhì)量有較高的要求,在實際應(yīng)用中正確分割率不理想。由于形態(tài)學(xué)梯度基本能夠反映圖像的所有邊緣,而車牌圖像區(qū)是梯度變化較多區(qū)域,即邊緣信息較多區(qū)域,為此本文提出了一種新的車牌定位方法,采用一種基于投影法和數(shù)學(xué)形態(tài)學(xué)梯度相結(jié)合的車牌定位算法,即利用數(shù)學(xué)形態(tài)學(xué)方法對傳統(tǒng)定位方法投影法進行改進和優(yōu)化,將此二種方法相結(jié)合,最終獲得準確的車牌區(qū)域。定位流程圖如下:投影法定位投影法定位形態(tài)學(xué)邊緣檢測中值濾波去噪二值化彩色圖像灰度化灰度線性變換圖1.1程序流程圖本文各章安排如下:第一章:緒論部分,介紹了本課題的研究背景與現(xiàn)實意義。概述了車輛牌照識別系統(tǒng)在國內(nèi)外的發(fā)展和應(yīng)用現(xiàn)狀;簡單介紹了車牌識別系統(tǒng)中存在的難點;最后給出了本文的內(nèi)容安排。第二章:詳細闡述了本文采用的車牌車牌圖像預(yù)處理的方法。首先,將圖像灰度化;然后對灰度圖像進行基于閾值分割的分段線性變換;再利用全局動態(tài)閾值化方法對圖像進行二值化后,最后對二值圖像進行中值濾波平滑去噪。第三章:結(jié)合形態(tài)學(xué)運算進行膨脹運算,并對膨脹后的連通區(qū)域進行篩選;再使用水平投影和垂直投影分別確定車牌的上下和左右邊界。第四章:總結(jié)全文,并對車牌定位和分割算法的研究加以展望,并提出了有待解決的問題。重慶大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)第2章圖像預(yù)處理2圖像預(yù)處理由CCD攝像機采集的圖象可以存儲在計算機中,為了用于牌照的分割和牌照字符的識別,原始圖像應(yīng)具有適當(dāng)?shù)牧炼?,較大的對比度和清晰可辨的牌照圖像。但由于攝像工作在開放的戶外環(huán)境,加之車輛牌照的整潔度、自然光照條件、拍攝時CCD攝像機與牌照的距離和角度以及車輛行駛速度等因素的影響,牌照圖像可能出現(xiàn)模糊、歪斜和缺損等嚴重缺陷,因此需要對原始圖像進行識別前的預(yù)處理。2.1圖像的灰度化預(yù)處理前的圖像都是彩色圖像。對于彩色圖像,顏色本身就是其一個非常重要的屬性,所以在識別中可以利用顏色信息,于是發(fā)展了很多色彩模式,例如RGB模式、HSV模式、CMY模式、HSI模式、YUN模式等。顏色模型是三維顏色空間中的一個可見光子集,它包括某個顏色域的所有顏色。RGB(red,green,blue)(紅、綠、藍)是最常見的彩色模型,它是一種正方體的空間結(jié)構(gòu)模型。紅、綠、藍是相互正交的坐標軸,每個坐標軸都量化為0~255,0對應(yīng)最暗,255對應(yīng)最亮。彩色立方體中任一點都表示一種顏色,RGB圖像又稱真彩色圖像,它是利用R,G,B這3個分量表示一個像素的顏色,通過三基色可以合成出任意顏色。以下是常見顏色的RGB數(shù)值,黑色=(0,0,0),白色=(255,255,255),灰色=(128,128,128),紅色=(255,0,0),綠色=(0,255,0),藍色=(0,0,255),青色=(0,255,255),品紅=(255,0,255),黃色=(255,255,0)。RGB彩色系統(tǒng)是通過對顏色進行加運算來完成顏色綜合的彩色系統(tǒng),其原點是黑色,通過在黑色中加入不同分量的紅色、綠色、藍色來得到某種彩色。大多數(shù)圖像格式都采用RGB模型來表示像素的顏色,Windows內(nèi)部和位圖也采用RGB顏色模型。YUV模型(Y代表亮度,U和V是兩個彩色分量,表示色差)是另一種常見的顏色模型,主要用于多媒體計算機技術(shù)中,比如JPEG的圖像格式。其基本特征是將亮度和色度信號分離。由于人眼對亮度的變化比對彩色的更敏感,因此YUV模型中Y分量所占的帶寬大于彩色分量的帶寬。主要的YUV格式有4:1:1,4:2:2。彩色圖像包含著大量的顏色信息,不但在存儲上開銷很大,而且在處理上也會降低系統(tǒng)的執(zhí)行速度。由于圖像的每個象素都具有三個不同的顏色分量,存在許多與識別無關(guān)的信息,不便于進一步的識別工作,因此在對圖像進行識別等處理時需要將彩色圖像轉(zhuǎn)變?yōu)榛叶葓D像,以加快處理速度。YUV和RGB具有線性關(guān)系,其換算公式為:(2.1)灰度化結(jié)果如圖2.2所示:圖2.1原始圖像圖2.2灰度化后的圖像2.2灰度線性變換2.2.1圖像增強介紹對質(zhì)量下降的圖像一般要進行改善。改善的辦法有兩類:一類是不考慮圖像質(zhì)量下降的原因,只將圖像中感興趣的特征有選擇地突出,而衰減其它不需要的特征,故改善后的圖像不一定要逼近原圖像。這類圖像改善方法統(tǒng)稱為圖象增強技術(shù)。另一類改善圖像的方法是針對圖像質(zhì)量下降的原因,設(shè)法去補償降質(zhì)因素,從而使改善的圖像盡可能地逼近原圖像,這類圖像改善方法統(tǒng)稱為圖像復(fù)原技術(shù)。車輛圖像處理的目的是為了將感興趣的目標突出,因而要采用圖像增強技術(shù)來提高圖像質(zhì)量。圖像增強技術(shù)有兩類方法:空間域法和頻率域法??臻g域法主要是在空間域內(nèi)對圖像灰度值直接運算處理。頻率域法是在圖像的某種變換域內(nèi),對圖象的變換值進行運算。這是一種間接處理方法。空間域增強是以對圖像的像素直接處理為基礎(chǔ)的增強,可用下式表示:(2.2)其中,是輸入圖像,是處理后的圖像,是對的一種操作,是圖像像素點的位置,操作最簡單的形式是鄰域為的尺度(即單個像素)。在這種情況下,僅依賴于在點的值,操作是灰度級變換函數(shù),形式為。其中和分別為和在任意點的灰度級。2.2.2灰度線性變換如果一幅圖成像時由于光線過暗或曝光不足,則整幅圖將偏暗(如灰度范圍從0到63);光線過亮或曝光過度則圖像偏亮(如灰度范圍從200到255),這都會造成圖像對比度偏低問題,即灰度都擠在一起了,沒有拉開。在這種情況下,可以采用灰度變換的方法來增強圖像的對比度。所謂灰度變換就是將一個灰度區(qū)間映射到另一個灰度區(qū)間的變換。它是空間域圖像增強的一種,也就是通過分段線性變換函數(shù)來調(diào)整圖像灰度級的動態(tài)范圍,這樣的變換可以把我們感興趣的灰度區(qū)間拉開,使得亮的越亮,暗的越暗,從而達到增強對比度的目的。如圖2.3所示,通過點和點的位置控制變換函數(shù)的形狀,使得和之間的灰度級不同程度的展開,因而影響其對比度,以達到增強圖像之目的。圖2.3灰度線性變換示意圖分段線性變換公式如下:(2.3)(2.4)(2.5)(2.6)2.2.3基于區(qū)域分割的分段線性變換分段線性變換給出了變換的原理,合理的劃分灰度區(qū)間是取得較好增強效果的保證?;叶戎狈綀D描述了一幅圖像的灰度級內(nèi)容,任何一幅直方圖都包括了可觀的信息,可以結(jié)合它來劃分灰度區(qū)間。但由于不能直觀地把某一灰度范圍和圖像中對應(yīng)的區(qū)域聯(lián)系起來,調(diào)整灰度區(qū)間時帶有一定的盲目性,需要反復(fù)調(diào)整多次。本文提出的基于區(qū)域分割的分段線性變換提供了一種劃分灰度區(qū)間的方法,可以較快的確定圖像中需要增強的目標灰度范圍,然后變換到所需的灰度范圍。確定灰度變換區(qū)間包含如下三個方面:eq\o\ac(○,1)顯示圖像的灰度直方圖圖像的灰度直方圖是進行圖像處理的一種有利的工具,它顯示了圖像的灰度分布情況。通常,對于目標和背景的灰度可明確區(qū)分的圖像,目標對應(yīng)直方圖中某一灰度范圍。通過觀察直方圖來確定谷點的大致位置,以它為分界點來確定目標的大致灰度范圍。本文生成了可以調(diào)節(jié)大小的灰度直方圖,其中橫坐標為0~255灰度級,縱坐標為圖中具有該灰度值的像素的個數(shù)。當(dāng)圖像中包含較多的灰度級時,直方圖圖像的許多線會連成一片,這時調(diào)節(jié)直方圖的寬度,加大相鄰直線之間的距離即可找出分界點;當(dāng)圖像中一些直線的長度較短又相距較近時,很難看出它們之間的相對長短,這時調(diào)節(jié)直方圖的高度,就可以看出它們之間的區(qū)別。當(dāng)鼠標在直方圖圖像上移動時,可顯示縱橫坐標值。把灰度直方圖調(diào)整到合適的大小,這時就可以較容易確定谷點的大致位置。eq\o\ac(○,2)顯示圖像的像素灰度值灰度直方圖提供了圖像灰度分布的統(tǒng)計信息,但丟失了圖像像素的空間位置信息。對于含有多個目標的圖像,察看它們較大和較小的灰度級,可以確定多個目標的大致灰度范圍。圖像以像素為單位,當(dāng)鼠標在圖像上移動時,顯示該位置處的坐標值和對應(yīng)的灰度值。把鼠標放在目標上較亮和較暗的位置,就得到了較大和較小的灰度值。當(dāng)灰度范圍太小,不宜察看較亮和較暗的位置,可以使鼠標在目標上來回移動來確定較大和較小的灰度值。eq\o\ac(○,3)顯示圖像的變換區(qū)域確定了某個灰度變換區(qū)間,我們并不知道所對應(yīng)的圖像區(qū)域的確切范圍,通過顯示該灰度區(qū)間對應(yīng)的圖像區(qū)域,可以知道要增強的目標是否包含在其內(nèi)。由于人眼對顏色的信息較為敏感,對于灰度圖像,可以把某灰度區(qū)間對應(yīng)的圖像區(qū)域顯示為彩色,這樣就可以得知劃分的灰度區(qū)間是否合理。通過顯示目標中沒有包含的區(qū)域或彩色部分中非目標區(qū)域的較大和較小的灰度值,調(diào)整灰度區(qū)間范圍,根據(jù)需要確定變換后的彩色部分大小是否合乎要求。實際應(yīng)用時,我們可以靈活應(yīng)用以上方法,大大加快了確定灰度變換區(qū)間的過程。然后進行分段線性變換,增強目標的對比度?;叶染€性變換結(jié)果如圖2.4,變換后的圖像可以看清目標區(qū)域更多的細節(jié)信息,比較變換前后的直方圖,可見拉伸了目標對應(yīng)的灰度區(qū)間,壓縮了背景對應(yīng)的灰度區(qū)間。雖然損失了背景的一些信息,但目標得到了增強,變得清晰可見。圖2.4灰度線性變換后的圖像2.3二值化二值圖像是指整幅圖像畫面內(nèi)僅有黑、白二值的圖像。在數(shù)字圖像處理中,二值圖像占有非常重要的地位。這是因為,一方面,有些需要處理的如文字圖像、指紋圖像、工程圖紙等圖像本身是二值的;另一方面,在某些情況下即使圖像本身是灰度的,我們也設(shè)法使它變成二值圖像再進行處理(即灰度圖像的二值化)。這是考慮到實用的圖像處理系統(tǒng)要求處理的速度高、成本低,信息量大,采用二值圖像進行處理,能大大地提高處理效率。而且,二值化后的圖像能夠用幾何學(xué)中的概念進行分析和特征描述,比灰度圖像優(yōu)勢大的多。在實際的車牌系統(tǒng)中,進行圖像二值變換的關(guān)鍵是要確定合適的閾值,根據(jù)閾值t來區(qū)分圖像中的對象和背景。在各種二值化方法中,全局閾值方法對輸入圖像量化噪聲或不均勻光照等情況抵抗能力差,在分割時會出現(xiàn)斷裂和大面積粘連現(xiàn)象,應(yīng)用受到極大限制;局部閾值法也存在缺點和問題,分割時會出現(xiàn)非字符區(qū)域的干擾和粘連現(xiàn)象。當(dāng)兩個相鄰的塊的閾值相差太大,二值化后的車牌字符就可能造成變形,不能保證字符筆劃連通性,降低了識別率。而且,該方法實現(xiàn)速度慢、容易出現(xiàn)偽影現(xiàn)象。本文采用全局動態(tài)閾值化方法進行二值化。該方法是從整個灰度圖像的像素分布出發(fā),尋求一個最佳的閾值。其中經(jīng)典算法是OTSU算法—類間最大方差算法。該方法的主要思想是從圖像的灰度直方圖中把灰度的集合用閾值t分為兩類,然后根據(jù)兩個類別的平均值方差(類間方差)和各類的方差(類內(nèi)方差)的比為最大來確定閾值t。該閾值即為二值化圖像的最佳閾值。這種方法不論圖像的直方圖有無明顯的雙峰,都能得到較為滿意的效果,因此這種方法是閾值自動選取的較優(yōu)方法。按灰度閾值t將圖像劃分為兩類:和,因此,和類的類出現(xiàn)概率及均值分別由下列各式給出:(2.7)(2.8)(2.9)(2.10)其中,,不難得出,對于任何t值,都有和類可由下式得(2.11)(2.12)定義類內(nèi)方差,類間方差,總體方差為:(2.13)(2.14)(2.15)我們把使得和兩類得到最佳分離的t值作為最佳閾值,最佳閾值t應(yīng)使類間方差最大,即選(2.16)為判斷準則,從1,2,…,L改變t,使最大的t值即為分割門限即最佳閾值。Ostu算法有以下優(yōu)點:算法實現(xiàn)較為簡單且適應(yīng)性較強;它是基于圖像的整體特性而非局部特性的,可以推廣到多閾值的分割方法中去。圖2.5顯示了經(jīng)過全局閾值法Ostu方法獲得的二值化圖像,從圖中可看到Ostu方法處理效果明顯,車牌區(qū)域在圖像中得到了完整的保留。圖2.5二值化圖像2.4中值濾波去噪2.4.1中值濾波中值濾波是一種非線性濾波技術(shù),不屬于卷積算法的區(qū)域處理方法。它將區(qū)域中所有值按大小進行排序,并將排序后位于中間的像素值賦予中心像素。由于區(qū)域中像素值發(fā)生隨機突變的像素,經(jīng)排序后將位于隊首或隊尾,因此取得的中位像素值是正常的像素值。噪聲往往以孤立點的形式隨機出現(xiàn),這些點對應(yīng)的像素數(shù)很少,而圖像則是由像素數(shù)較多、面積較大的小塊構(gòu)成的,因此中值濾波可以采用一個含有奇數(shù)個像素的滑動窗口在圖像上滑動,將窗口中心點所對應(yīng)像素值,用窗口內(nèi)所有像素值的中間值代替。中值定義為:一組數(shù)據(jù),把這n個數(shù)據(jù)按值的大小順序排列如下:則:(2.17)y稱為序列的中值。例如,在一維的情況下,若中值濾波器的窗口長度為5,窗口中像素的灰度值為80、90、200、110和120,則中值為110。因為,按小到大(或大到小)排序后,第三位的值是110,于是原來窗口正中的灰度值200就由110取代。如果200是一個噪聲的尖峰,則將被濾除,達到消除噪聲的目的。這樣中值濾波在一定條件下既可以克服線性濾波器濾波帶來的圖像細節(jié)模糊,又可以有效的濾除脈沖干擾和圖像的掃描噪聲。中值濾波器可以推廣到二維,即對二維圖像操作。對數(shù)字圖像進行中值濾波,實質(zhì)是對二維序列的中值濾波,濾波窗口也是二維的。設(shè)表示數(shù)字圖像各點的灰度值,濾波窗口為A的二維中值濾波可定義為:(2.18)式中,A為窗口。二維中值濾波的窗口形狀和尺寸對濾波效果影響較大,不同的圖像內(nèi)容和不同的應(yīng)用要求,往往采用不同的窗口形狀和尺寸。常用的窗口形狀有線形、方形、圓形、十字形以及圓環(huán)形等,窗口的尺寸一般先用3再取5逐點增大,直到其濾波效果滿意為止。一般對于有緩變的較長輪廓線物體的圖像,采用方形或圓形窗口為宜,對于包含有尖頂角物體的圖像,適宜用十字形窗口。而窗口大小則以不超過圖像中最小有效的細線狀物體為宜,如果圖像中點、線、尖角細節(jié)較多,不宜采用中值濾波。本課題由于采集車輛圖像的噪聲點往往是孤立的,且這些點對應(yīng)的像素數(shù)很少,而彩色圖像的各區(qū)域顏色具有單一性和連通性,其像素數(shù)較多、面積較大,因此,很適合用中值濾波來濾除噪聲。本文選用了的模板進行濾波去噪,效果如圖2.6顯示:圖2.6中值濾波后的圖像重慶大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)第3章車牌定位3車牌定位車牌定位的算法很多,不過,所有的車牌定位算法基本上都考慮了牌照區(qū)域的特點。所以在此也有必要先了解一下車牌區(qū)域的特征,其大體可分為以下幾類:eq\o\ac(○,1)車牌的幾何特征:車牌為矩形,寬、高比例約在3.0左右;eq\o\ac(○,2)車牌字符格式特征:車牌字符位于矩形框中且有間隔;eq\o\ac(○,3)車牌區(qū)域的紋理特征:車牌區(qū)具有排列基本均勻的字符;eq\o\ac(○,4)車牌區(qū)域內(nèi)灰度直方圖統(tǒng)計特征:具有兩個明顯且分離的分布中心;eq\o\ac(○,5)車牌區(qū)域的灰度分布特征:水平灰度呈現(xiàn)連續(xù)的峰、谷、峰的分布;eq\o\ac(○,6)車牌區(qū)域圖像的水平(垂直)投影特征:投影呈現(xiàn)連續(xù)的峰、谷、峰的分布。直接利用車牌的某個或某幾個特征一般總能把車牌從車牌圖像中分離出來,不過并不一定能得到精確的車牌位置。本文采用了一種由數(shù)學(xué)形態(tài)學(xué)和投影法相結(jié)合的車牌定位方法,即利用數(shù)學(xué)形態(tài)學(xué)方法對傳統(tǒng)投影定位法進行改進,從而實現(xiàn)車牌的準確定位。3.1基于數(shù)學(xué)形態(tài)學(xué)的粗定位3.1.1數(shù)學(xué)形態(tài)學(xué)的發(fā)展史數(shù)學(xué)形態(tài)學(xué)是研究數(shù)字影像的形態(tài)、結(jié)構(gòu)及其特征與快速并行處理方法的理論,它通過對目標影像的形態(tài)變換來實現(xiàn)結(jié)構(gòu)分析和特征提取的目的。數(shù)學(xué)形態(tài)學(xué)是一門新興學(xué)科,1964年,法國的G.Mathern和J.Serra在積分幾何的基礎(chǔ)上首次創(chuàng)立了這門學(xué)科,此后,他們又在法國建立了“楓丹白露數(shù)學(xué)形態(tài)學(xué)研究中心”,在該中心學(xué)者和其他各國研究人員的共同努力下,數(shù)學(xué)形態(tài)學(xué)得到了不斷的豐富和完善。最初,由Maheron和Serra提出的數(shù)學(xué)形態(tài)學(xué)研究以二值圖像為對象,稱為二值形態(tài)學(xué);此后,Serra和Sternberg等借助于傘理論,把二值形態(tài)算子推廣到灰度圖像,因而使灰度形態(tài)學(xué)的理論和應(yīng)用研究也得到很大的發(fā)展。1982年,J.Serra的專著《圖像分析與數(shù)學(xué)形態(tài)學(xué)》問世后,數(shù)學(xué)形態(tài)學(xué)才在圖像處理、模式識別和計算機視覺等領(lǐng)域引起廣泛的重視和應(yīng)用,并成為數(shù)字圖像信號處理和計算機視覺領(lǐng)域中的一種有效方法,這些應(yīng)用反過來又促進它的進一步發(fā)展。數(shù)學(xué)形態(tài)學(xué)的理論內(nèi)容包含十分廣闊。特別地,傳統(tǒng)圖像處理中的線性算子和非線性算子均是形態(tài)學(xué)算子的特例!這個令人吃驚的結(jié)論說明數(shù)學(xué)形態(tài)學(xué)是圖像處理的一個統(tǒng)一理論,是對傳統(tǒng)理論的推廣,在這個統(tǒng)一理論的框架下,經(jīng)典的方法得以在一個新的、統(tǒng)一的層次上進行分析,從而幫助我們從不同的側(cè)面更深入地了解經(jīng)典算法的性質(zhì),并在更廣泛的范圍以更靈活的方式對它們進行改進。目前國內(nèi)許多有效的圖像處理系統(tǒng)有的是基于數(shù)學(xué)形態(tài)學(xué)方法原理設(shè)計的,有的是把數(shù)學(xué)形態(tài)學(xué)算法納入其基本軟件,并以其運算速度作為系統(tǒng)性能的重要標志之一。它被廣泛地應(yīng)用到圖像處理的很多領(lǐng)域中,這些領(lǐng)域涉及醫(yī)學(xué)成像、顯微鏡學(xué)、生物學(xué)、機器人視覺、自動字符讀取、金相學(xué)、地質(zhì)學(xué)、冶金學(xué)、遙感技術(shù)等等。在這些領(lǐng)域中,利用數(shù)學(xué)形態(tài)學(xué)可以對圖像進行增強、分割、邊緣檢測、結(jié)構(gòu)分析、形態(tài)分析、骨架化、組分分析、曲線填充、圖像壓縮等。3.1.2數(shù)學(xué)形態(tài)學(xué)與圖像處理隨著計算機技術(shù)的飛速發(fā)展,圖像處理成為了當(dāng)前人們廣泛關(guān)注的科學(xué)領(lǐng)域。它包含的領(lǐng)域?qū)拸V,諸如:檢測圖像的質(zhì)量,實現(xiàn)圖像清晰化的圖像增強;提取圖像的幾何特征,實現(xiàn)圖像分割和編碼壓縮;通過對圖像的分析、理解實現(xiàn)對投影圖像的三維重建;通過序列圖像分析,從而實現(xiàn)運動場景分析等。數(shù)學(xué)形態(tài)學(xué)是一種特殊的圖像處理技術(shù),它的描述語言是集合論,它設(shè)計了一整套的基于集合運算的概念和方法,提供了統(tǒng)一而強大的工具來處理圖像中遇到的問題。它通過研究圖像中對象的幾何特征等來描述圖像中各個研究對象的特征和對象之間的相互關(guān)系。數(shù)學(xué)形態(tài)學(xué)進行圖像處理的基本思想是:用結(jié)構(gòu)元素對原圖像進行位移、交、并等運算,然后輸出處理后的圖像。數(shù)學(xué)形態(tài)學(xué)算法的思想簡單直觀并且?guī)缀蚊枋龅奶攸c非常適合與視覺信息相關(guān)的信息處理與分析。利用數(shù)學(xué)形態(tài)學(xué)進行圖像分析的基本步驟一般有:eq\o\ac(○,1)提出所要描述的物體的幾何結(jié)構(gòu)模式,即提取物體的幾何結(jié)構(gòu)特征;eq\o\ac(○,2)根據(jù)模式選擇相應(yīng)的結(jié)構(gòu)元素,結(jié)構(gòu)元素應(yīng)簡單且對模式具有最強的表現(xiàn)力;eq\o\ac(○,3)用結(jié)構(gòu)元對圖像進行形態(tài)變換,得到比原圖像更突出研究對象特征信息的圖像;eq\o\ac(○,4)從經(jīng)過形態(tài)變換的圖像中提取出所需要的圖像信息。數(shù)學(xué)形態(tài)學(xué)方法比起其它圖像處理方法具有一些明顯的優(yōu)勢,它可以有效的濾除噪聲,同時保留圖像中的原有信息,并且突出圖像的幾何特征使得對圖像的進一步分析更加簡便。在數(shù)學(xué)形態(tài)學(xué)運算中,結(jié)構(gòu)元的選擇對于能否有效的提取圖像的有關(guān)信息至關(guān)重要。故選擇結(jié)構(gòu)元時一般要注意以下兩個原則:eq\o\ac(○,1)結(jié)構(gòu)元有凸性;eq\o\ac(○,2)結(jié)構(gòu)元在幾何結(jié)構(gòu)上比原圖像簡單,且有界。3.1.3數(shù)學(xué)形態(tài)學(xué)的有關(guān)定義數(shù)學(xué)形態(tài)學(xué)的基本運算有4個:膨脹,腐蝕,開啟和閉合。他們在二值圖像和灰度圖像中各有特點。由于本文處理的是二值圖像,所以只需對二值形態(tài)學(xué)的基本運算進行探討。二值圖像是指圖像的灰度只有1和0構(gòu)成。傳統(tǒng)的圖像處理一般取圖像中目標的灰度值為1,背景灰度值為0。二值形態(tài)學(xué)中的形態(tài)變換是針對集合的處理,記圖像中所有灰度值為1的點組成的集合為X。圖像形態(tài)處理時,就是在圖像中移動一個結(jié)構(gòu)元素,然后對集合X用結(jié)構(gòu)元素與圖像進行交,并等運算。以下是形態(tài)學(xué)有關(guān)算子的定義:eq\o\ac(○,1)具有某種確定性質(zhì)的對象的全體或范圍稱之為集合,常常用大寫的英文字母表示;若這種全體或范圍中不包含任何對象稱為空集,計作。eq\o\ac(○,2)若設(shè)全集為I,集合,稱是集合B的補集。eq\o\ac(○,3)設(shè)X是某一基本集合,記,稱為X的冪集,若集合,則集合A,B之間只能有以下三種關(guān)系:1)集合包含于集合B,記作;2)集合A擊中集合B,記作;3)集合A相離于集合B,記作。eq\o\ac(○,4)設(shè)A,B是二維集合,記是集合A,B的元素,任意的二維向量,記,稱集合A平移X。顯然,若集合由一幅圖像中的每個點組成,則集合的平移表示圖像的每個點沿著坐標軸移動一定位置;集合的映像表示圖像的每個點關(guān)于原點的對稱點。eq\o\ac(○,5)若記集合,記為空集,則集合A被集合B膨脹記為:(3.1)其中“”數(shù)學(xué)形態(tài)學(xué)的膨脹算子。由上可以看出:集合A被集合B膨脹即是集合B中的元素先作關(guān)于原點的對稱點,每個對稱點平移x后,總有點落在集合A中。eq\o\ac(○,6)若記集合記為空集,則集合A被集合腐蝕記為:(3.2)其中“”數(shù)學(xué)形態(tài)學(xué)的腐蝕算子。顯然:集合A被集合B腐蝕即是集合B中的每個元素平移x后,全部落在集合A中。eq\o\ac(○,7)設(shè)A是輸入圖像,B是結(jié)構(gòu)元圖像,則集合A被集合B作開運算記為,用膨脹和腐蝕記為:(3.3)開運算的結(jié)果實質(zhì)上是集合A先被結(jié)構(gòu)元B腐蝕后結(jié)果再被B膨脹。開運算可以平滑圖像輪廓,除去圖像中不能包含結(jié)構(gòu)元的部分即是除去圖像中細小突出。A被B開后的邊界就是B在A內(nèi)平移所能達到的B的邊界的集合。eq\o\ac(○,8)設(shè)A是輸入圖像,B是結(jié)構(gòu)元圖像,則集合A被集合B作閉運算記為,用膨脹和腐蝕記為:(3.4)A被B作閉運算的實質(zhì)就是A被B膨脹后結(jié)果再被B腐蝕。由閉運算的定義可知:閉運算也能平滑圖像,他能去掉原圖像中的小洞,填補輪廓上的小縫隙并能融合圖像上狹窄的缺口和細長的彎口。由于膨脹和腐蝕的對偶性,開運算與閉運算也可得到相應(yīng)的對偶性。故而,A被B閉后的邊界就是B在內(nèi)平移所能達到的B的邊界的集合,故A被B開還可記為:(3.5)腐蝕具有使目標縮小、目標內(nèi)孔增大以及外部孤立噪聲消除的效果;膨脹是將圖像中與目標物體接觸的所有背景點合并到物體中的過程,結(jié)果是使目標增大、孔洞縮小,可填補目標中的空洞,使其形成連通域。對于開運算就是在腐蝕的基礎(chǔ)上再進行一次膨脹,對于閉運算就是在膨脹的基礎(chǔ)上再進行一次腐蝕。由上述定義可知,若取,即為一大小可調(diào)的正方形灰度平面,則膨脹運算的實質(zhì)就是以為模板,尋找圖像在結(jié)構(gòu)元大小范圍內(nèi)所有點的灰度極大值,以該極大值代替該結(jié)構(gòu)元大小范圍內(nèi)所有點的類度值,在圖像灰度曲面上移動結(jié)構(gòu)元模板,重復(fù)同樣的操作,直到圖像上所有點都參與運算為止。因此,膨脹的結(jié)果就濾去了小于二倍結(jié)構(gòu)元的波峰,同時原圖像灰度曲面在原有基礎(chǔ)上有了一定程度的膨脹。而腐蝕運算就相當(dāng)于削去小于二倍結(jié)構(gòu)元的波谷。如果用原圖減去開運算的結(jié)果,就可以提取出原圖像小于結(jié)構(gòu)元的波峰;用原圖減去閉運算的結(jié)果就可以提取出小于結(jié)構(gòu)元的波谷,改變結(jié)構(gòu)元的大小就可以提取不同的目標。3.1.4基于形態(tài)學(xué)運算的候選區(qū)域選取為了進一步確定車牌區(qū),用形態(tài)學(xué)運算對二值圖像進行分割,形成若干閉合的連通區(qū)域,并從這些區(qū)域中提取真實的車牌。為了防止連通區(qū)域斷裂和盡可能減少與背景紋理的粘連,結(jié)構(gòu)元的形狀和尺寸的選取尤為重要。尺寸過大,會使車牌區(qū)域跟周圍非車牌區(qū)域的邊緣點發(fā)生粘連;尺寸過小,會使車牌區(qū)域無法粘連在一起,可能使真正的車牌區(qū)域不包含在可能的候選區(qū)域中。在車牌區(qū),各字符之間的最大距離(一般情況下為第二、三字符的間距)約為筆畫寬度w的4倍。為了避免形態(tài)運算后車牌區(qū)發(fā)生斷裂,將此間距作為設(shè)計結(jié)構(gòu)元的一個主要依據(jù)。設(shè)width為采集圖像的寬度(以像素為單位),同時考慮到字符間距最大情況以及車牌傾斜等因素,為了保證能夠形成一個完整車牌連通區(qū),設(shè)計了一個水平結(jié)構(gòu)元,其長度為:(3.6)式中,是車牌寬度與圖像寬度之比,是字符最大間距與車牌寬度之比。本文取=l/4,我國車牌的標準寬度為440mm,最大字符間距為34mm,其比例約為0.08,考慮到字符斷裂及磨損等因素,取=0.10。用此結(jié)構(gòu)元進行形態(tài)閉運算,形成可能的字符連通域如圖3.1所示:圖3.1水平閉運算大多數(shù)情況下車牌區(qū)域經(jīng)過上述閉運算后已經(jīng)粘連,但對于車牌周圍紋理較為密集的情況,附近的其他紋理區(qū)也容易融入連通域范圍,從而擴大了有效車牌區(qū)域的范圍。為了斷開粘連,同時保證車牌字符形成的連通域不被斷開,需使用垂直方向上的結(jié)構(gòu)元。大量實驗表明,該結(jié)構(gòu)元尺度約為車牌字符高度的1/4到1/3時效果較好?;谶@個尺度設(shè)計一個垂直結(jié)構(gòu)元:(3.7)為結(jié)構(gòu)元尺寸與字符高度的比例,本文取1/3;為字符高度與車牌寬度的比例,車牌的標準字符高度為90mm,則取值約為90/4400.20。用上述結(jié)構(gòu)元對上一步形態(tài)學(xué)閉運算后得到的圖像進行開運算后,紋理區(qū)域集中部分得到較好的分割,實驗結(jié)果如圖3.2所示,方便了后續(xù)的連通域結(jié)構(gòu)特征分析。圖3.2垂直開運算3.1.5基于結(jié)構(gòu)特征的候選區(qū)域篩選車牌區(qū)具有明顯的結(jié)構(gòu)和紋理特征,車輛前部的車牌寬高比約為3.14(考慮到拍攝及傾斜等原因,寬高比可取1.3到4),剔除不符合寬高比要求的連通域,此時若只有一個連通域,則可確認為車牌區(qū)域,否則再根據(jù)車牌的特征篩選出候選區(qū),結(jié)果如圖3.3所示:圖3.3符合結(jié)構(gòu)特征的連通域大量實驗結(jié)果表明,可能出現(xiàn)的候選區(qū)包括車體上的車燈、車牌,以及散熱器等部分,也可能包括周圍環(huán)境帶來的干擾。3.2基于投影法的車牌圖像精確定位經(jīng)過車牌圖像粗定位后獲得的圖像中不僅有含有車輛的車牌架,而且也包含了其他的圖像信息,為了便于后續(xù)的車牌圖像的字符分割和識別的效果,對粗定位后的車牌圖像進行精確定位是很必要的,本文采用的車牌圖像精確定位的算法流程如下圖所示:通過區(qū)域剪裁得到精確定位車牌圖像通過區(qū)域剪裁得到精確定位車牌圖像水平投影和垂直投影得到車牌圖像的精確邊界坐標車牌圖像的粗定位圖像圖3.4車牌圖像精確定位算法流程車牌的字符和背景的灰度對比較大,對應(yīng)于車牌區(qū)域的水平灰度變化較頻繁,而且在車牌圖像中每個字符號碼本身都大小一致,即寬度和高度都相等,使得車牌區(qū)域在水平方向上的投影具有明顯的規(guī)律,且車牌一般掛在汽車的防撞器上或附近,靠近整幅圖像的下部,同時,在圖像的下部一般干擾較少,因此可通過自下而上的搜索方法確定車牌的上下邊界。另外,在投影圖上,車牌區(qū)與背景相比有較多的豎向紋理,車牌字符之間具有較低的谷點,較低谷點之間又至少有一個較高的峰值點,且谷點與谷點近似等距,根據(jù)這些特征就可以確定出車牌的左右邊界。由此推出的算法步驟為:eq\o\ac(○,1)對二值圖像做水平投影確定候選車牌的上下邊界,得到一個或多個帶狀區(qū)域;eq\o\ac(○,2)對帶狀區(qū)域作垂直方向上的投影確定左右邊界;eq\o\ac(○,3)根據(jù)車牌的幾何特征即長寬比為3.1-3.2排除偽車牌。3.2.1水平方向定位本文采用的車牌水平方向定位算法如下:eq\o\ac(○,1)對車牌灰度圖像進行水平方向的投影運算;eq\o\ac(○,2)找出車牌水平區(qū)域?qū)?yīng)的峰值;eq\o\ac(○,3)確定切割點,在圖像上進行水平切割。對圖像的灰度值按(3.8)式做水平投影:(3.8)圖3.5水平投影圖在投影圖中,車牌投影值區(qū)域一般有以下特點:一般情況下,車牌區(qū)域中出現(xiàn)的投影波峰值為圖像下部往上搜索時出現(xiàn)的第一個較大波峰值;車牌投影區(qū)域大致對應(yīng)于上述波峰值上、下臨近的波谷之間包含的投影值區(qū)域,且這兩個波谷大致對稱于波峰,波峰和波谷變化率較大。根據(jù)車牌特征,車牌中的垂直邊緣較為密集,而且車牌一般懸掛在車身較低的位置,其下方?jīng)]有很多的邊緣密集區(qū),因此在車牌對應(yīng)的水平位置上會出現(xiàn)一個或連續(xù)多個峰值,連續(xù)峰群的第一個和最后一個峰值作為車牌邊緣峰。從圖中可以看出,這樣就得到了包含了車牌的帶狀區(qū)域。圖3.6投影圖確定車牌上下邊界第一個邊緣峰左邊的波谷點作為分割點,最后一個邊緣峰右邊的波谷點作為分割點,對圖像進行切割。圖3.7車牌水平切割區(qū)域3.2.2牌照垂直方向的定位算法車輛牌照垂直方向的定位算法跟車輛牌照水平方向的定位算法類似,首先對圖像做垂直方向的投影運算,然后確定切割點。平滑后的投影圖如圖3.8所示:圖3.8垂直投影圖從圖中可以看出,對于垂直方向的投影切割,車牌區(qū)域內(nèi)的差分投影不是只有一個單峰,而是一群多峰,并且這一峰群對于車牌外區(qū)域的峰值相對要高出很多。于是我們選取最大峰值的0.6作為閾值,找出第一個和最后一個高于此閾值的峰作為車牌邊緣峰。第一個邊緣峰左邊的波谷點作為分割點,最后一個邊緣峰右邊的波谷點作為分割點,對圖像進行切割。對垂直方向進行投影切割的效果如圖3.9所示。圖3.9投影圖對應(yīng)的車牌垂直區(qū)域圖3.10精確定位后的車牌重慶大學(xué)本科學(xué)生畢業(yè)設(shè)計(論文)第4章結(jié)論與展望4結(jié)論與展望4.1實驗結(jié)果綜上所述,為了檢驗本章提出的車輛牌照定位算法,本文建立了包含車牌的圖像的集合。實驗所用車輛圖像為用數(shù)碼相機在自然場景中拍攝的彩色圖像,其中牌照為普通牌照(底色為藍,字符為白)。圖像中牌照大小不一,背景不一,背景包括人、其它車輛、樹木、建筑物等,光照條件也不一。需要說明的是,所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論