基于霍夫變換的圓形識別畢業(yè)論文_第1頁
基于霍夫變換的圓形識別畢業(yè)論文_第2頁
基于霍夫變換的圓形識別畢業(yè)論文_第3頁
基于霍夫變換的圓形識別畢業(yè)論文_第4頁
基于霍夫變換的圓形識別畢業(yè)論文_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、基于霍夫變換的圓形識別目 錄摘要1ABSTRACT2第一章 緒論3 1.1 論文的研究背景3 1.2 圖像識別技術(shù)的現(xiàn)狀3 1.3 本文的主要內(nèi)容5第二章 圖像預(yù)處理7 2.1 簡介7 2.2 圖像的灰度化7 2.3 二值圖像8 2.4 邊緣檢測9第三章 圓形識別的研究13 3.1 霍夫變換簡介13 3.2 標(biāo)準(zhǔn)霍夫變換檢測直線14 3.3 圓檢測原理15 3.4 圓形識別的研究17 3.5 本章小結(jié)21第四章 圓的拓展橢圓22 4.1 橢圓的研究22 4.2 研究成果23 4.3 本章小結(jié)25第五章 論文總結(jié)26參考文獻27致謝28附錄1 圓形識別的程序29附錄2 橢圓的程序31摘要在計算機

2、視覺領(lǐng)域中,圖像識別近幾年受到廣泛熱議。隨著現(xiàn)代科學(xué)技術(shù)的不斷發(fā)展,圖像識別技術(shù)的應(yīng)用范圍也越來越廣泛,例如,人臉識別,指紋識別,車牌號的特征識別等。本文根據(jù)霍夫變換和圖形的幾何特征,提出了一種圖像識別方法。在圖像檢測中,圓的檢測是非常重要的。在圓形檢測中,霍夫變換是使用最多的一種方法。本文介紹了霍夫變換識別圓的算法,并對橢圓進行了研究。本文給出了圖像識別的四個步驟:第一,圖像預(yù)處理,目的是將圖形物體與背景區(qū)分開。預(yù)處理運算能夠獲得目標(biāo)物體的信息,然后檢測出圖像的邊緣。第二,基于霍夫變換的圓形識別的研究。第三,橢圓的研究。最后,對研究的成果進行了總結(jié)。關(guān)鍵詞:霍夫變換;邊緣檢測;圖像識別;圓形

3、識別。ABSTRACT In the field of computer vision, image recognition has been a hot issue for several years. With the continuous development of modern science and technology, image recognition technology has been used widely. Such as, face recognition, fingerprint recognition and character recognition of

4、license plate number. We propose an image recognition method based on the Hough transform and the geometric characteristics of graphics.Circles are very important in the image detection. The Hough transform is widely used in solving this problem. This article describes the Hough transform algorithm

5、to identify the circle and the ellipse. This paper describes four steps of image recognition. First, the image preprocessing. The purpose is to separate graphical objects from the background. Preprocessing operation can achieve the information of the target object, and we need to detect the edge of

6、the image. Second, based on the study of circular Hough transform identified. Third, study on the ellipse. Finally, summarize the results of the work.Keyword: Hough transform, edge detection, image recognition, circle recognition.第一章 緒論1.1 論文的研究背景隨著科學(xué)技術(shù)和信息技術(shù)的不斷發(fā)展,圖像的處理與識別已經(jīng)覆蓋我們生活的各個方面。在日常生活中,可以通過圖片獲

7、取我們所需要的信息,并且在人們之間相互傳遞。另外,圖片不受語言和地域的限制,有利于人們之間的交流。圖像識別技術(shù)是人們根據(jù)圖像的固有特性,先對圖像進行特征提取,然后再對圖像進行識別和處理的一種技術(shù)。圖像識別的應(yīng)用范圍非常廣泛,例如,能夠進行指紋識別的手機,車牌號的識別,藥品檢測,工業(yè)生產(chǎn)中對原材料的檢驗等方面。圖像識別就是借助計算機去讀取圖片中的信息,并根據(jù)要求作出判斷。借助圖像識別技術(shù),我們可以通過對圖片的搜索,快速的獲取信息。在2011年,李彥宏曾說過“全新的讀圖時代已經(jīng)來臨”。有時候,我們更加傾向于通過圖片獲取信息。如今,越來越多的互聯(lián)網(wǎng)行業(yè)和科技公司開始組建研發(fā)團隊,從事圖像識別技術(shù)的研

8、究。我們所熟悉的微軟、谷歌、亞馬遜等都在注入大量的資金從事這項研究,致力于往更加智能的方向發(fā)展。 現(xiàn)如今,圖像識別技術(shù)發(fā)展迅速,引領(lǐng)著時代潮流。這篇論文主要是根據(jù)圖像識別的理論基礎(chǔ),利用matlab,研究圖像識別。1.2 圖像識別技術(shù)的現(xiàn)狀數(shù)字圖像處理技術(shù)范圍很廣,主要包括圖像增強、圖像去噪、圖像分割以及邊緣檢測等,它的目的主要是對原始的圖像進行處理,以便于人眼的觀察和機器的識別。模式識別在60年代得到了迅速發(fā)展,并取得了眾多的理論研究成果,其應(yīng)用領(lǐng)域也擴展到很多的方面,比如語音識別、圖像識別、信息檢索以及視頻識別等領(lǐng)域。模式識別是利用計算機來實現(xiàn)人類的識別能力,該技術(shù)主要是對圖像的特征進行提

9、取,并且根據(jù)圖像的特征進行目標(biāo)物體的分類與識別。國外對圖像識別的研究主要集中在80年代以前,國內(nèi)的理論研究較少。但隨著計算機的的普及與發(fā)展,運算能力顯著增強。圖像識別的系統(tǒng)主要包括三個部分:圖像信息的獲取、特征提取和分類判決。圖像信息的獲取主要是把圖片、文字等用掃描儀變換為電信號,再進行處理;特征提取就是找出能反映物體本質(zhì)的特征;分類判決就是根據(jù)提取的特征做出分類總結(jié)的過程。我們在進行圖像識別前,首先要對圖像進行預(yù)處理,然后對圖像的特征進行提取,進而加以判斷和分類,從而達到識別的目的。常見的圖像識別方法主要有四種:統(tǒng)計圖像識別方法、結(jié)構(gòu)圖像識別方法、模糊圖像識別方法以及神經(jīng)網(wǎng)絡(luò)圖像識別方法。在

10、我們的生活中存在很多圖像識別的應(yīng)用,例如身份證中的人臉識別和指紋識別,交通管制中的車牌識別,工業(yè)生產(chǎn)中零部件的識別和分類等。圖像識別技術(shù)主要是利用計算機系統(tǒng)對圖像進行分析和處理,以此來識別不同的圖像的一種技術(shù)。自圖像識別誕生以來,主要經(jīng)歷了三個階段:第一,是文字識別,開始于1950年,主要是對一些簡單的數(shù)字、字母以及符號進行識別,是圖像識別的基礎(chǔ),應(yīng)用非常廣泛。第二,是數(shù)字圖像處理與識別,開始于1965年,相比于模擬圖像來說,存儲方便,傳輸過程不易失真,該研究廣泛應(yīng)用于企業(yè)生產(chǎn)和我們的生活中。第三,是物體識別,與前兩者相比,較復(fù)雜,同時也存在一些不足,經(jīng)常會受到噪聲的干擾,檢測不準(zhǔn)確。在圖像識

11、別過程中,需要有當(dāng)時信息的錄入和原始記憶信息的存儲。只有通過對兩種信息之間的比較和加工,才能實現(xiàn)對圖像的識別。隨著計算機識別技術(shù)的發(fā)展,搜索引擎逐漸完善,引擎可以給每張圖片加上標(biāo)簽。當(dāng)我們想要查找某個特定的圖片的時候,輸入關(guān)鍵字,搜索引擎就可以快速識別。另外,無人機以及自動駕駛也依靠圖像識別,更加準(zhǔn)確的識別周圍的物體,對人們的生活帶來便利。下面結(jié)合圖片介紹兩個具體的應(yīng)用,圖1.2.1(a)是在2012年中科院自動化研究所,研制的機器人,它能夠識別不同的人。其原理主要是對機器人進行一些基本信息的錄入,以及對不同人的臉進行掃描。當(dāng)再次靠近機器人的時候,它就能認出靠近的這個人。另外,機器人還能根據(jù)之

12、前輸入的一些基本信息與識別出的這個人進行互動。(b)圖是對車牌號進行識別。車牌識別是圖像識別的一個重要應(yīng)用,它主要有三部分組成:圖像輸入、牌照定位與分割、字符識別。車輛進出停車場,不需要刷卡就能直接進出,加快了車輛進出的速度,減少了管理人員的支出。車牌識別技術(shù)的目的是從汽車牌照中提取車牌信息并識別出來。應(yīng)用的主要技術(shù)包括車牌信息的提取、圖像預(yù)處理、車牌特征的提取等技術(shù),以此來識別車輛牌號和顏色等信息,方便快捷,主要應(yīng)用在車輛檢查、停車場管理以及高速公路的收費管理等方面。 (a) 機器人 (b) 車牌號的識別圖1.2.1 圖像識別直線、圓、橢圓是自然界中常見的一些基本圖形,它們組成了更多復(fù)雜的圖

13、形,所以研究圖像識別的意義重大。另外,圖像識別技術(shù)也將朝著更加精確、快速的方向發(fā)展,涉及到交通、公安、醫(yī)藥、農(nóng)業(yè)、航天、工業(yè)等眾多領(lǐng)域,給我們的工作、生活帶來了極大便利。霍夫變換是研究圖像識別的常用方法,它是在1962年提出的一種線性描述方法,主要檢測圖像中的直線,但直線斜率不存在的時候就無法檢測出來。Duda和Hart提出了標(biāo)準(zhǔn)的霍夫變換,解決了這一問題,它的基本思想是通過直角坐標(biāo)和極坐標(biāo)之間的變換來檢測直線和曲線,把圖像空間中的每個邊緣像素點映射到參數(shù)空間,進行邊緣累積,最后形成峰值點。霍夫變換是進行圖像識別的常用方法,應(yīng)用廣泛。它主要是從原始的圖像中分離出相同的圖形,例如,在一幅有三角形

14、、矩形、圓和橢圓的圖形中,找出所有的圓。另外,與其它方法相比,霍夫變換具有獨特的優(yōu)點,能夠減少噪聲的干擾,從而減少目標(biāo)的錯誤識別。本文研究的重點是標(biāo)準(zhǔn)的霍夫變換,它經(jīng)常用來識別直線、矩形、圓、橢圓等,能夠快速的識別出我們所需要的某種圖形?;诨舴蜃儞Q的圓形識別的研究主要是通過霍夫變換原理來實現(xiàn)的。最初,通過霍夫變換對直線進行了研究,其原理是把圖像空間上的每一個點映射到參數(shù)空間,形成一條直線或曲線,圖像空間中的所有的像素點在參數(shù)空間形成一個交點。同理,參數(shù)空間上的一個點對應(yīng)到圖像空間變成一條直線,這樣就可以檢測出我們所需要的直線。在此基礎(chǔ)上,把直線檢測擴展到圓、橢圓等,維度增加,計算量增大。為了

15、進一步加快運算的速度,對霍夫變換做了一系列的改進,例如隨機霍夫變換、基于梯度信息的霍夫變換等。1.3 本文的主要內(nèi)容本文主要的研究內(nèi)容是霍夫變換的圓形識別。圓的圖片選取了五張,首先對圖片進行灰度化、二值化,然后進行邊緣檢測。通過霍夫變換原理的理解和分析,進行圓形識別,最后整理效果圖。本文的安排如下。第一章為緒論,闡述了論文的研究背景,總結(jié)回顧圖像識別技術(shù)的現(xiàn)狀,以及本文的主要內(nèi)容。第二章為圖像預(yù)處理,簡單介紹了圖像的灰度化、二值化以及邊緣檢測,目的是將目標(biāo)物體與周圍的環(huán)境隔離開。 第三章為圓形識別的研究,對霍夫變換原理做了簡要介紹,通過對直線檢測的理論推導(dǎo)引出圓。重點對圓檢測的理論進行推導(dǎo)與分

16、析,借助matlab對圖像進行了識別,給出了實驗效果圖。第四章為橢圓的研究,把圖形從三維空間的圓拓展到五維的橢圓,并對相關(guān)理論及結(jié)果做了推導(dǎo)與分析,編寫程序,給出效果圖。 第五章進行了總結(jié),得出結(jié)論。第二章 圖像預(yù)處理2.1 簡介在一幅圖像輸入到計算機的時候,由于受到了各種條件的限制和噪聲的干擾,輸入的圖像會失真,所以一般不能直接獲取原始圖像。為了便于特征提取,需要對圖像進行預(yù)處理。比如,在獲取圖片的過程中,光照強度以及照相機的不同,獲取的圖片存在很大的差異,影響圖片的質(zhì)量,為圖像識別的研究帶來了不利的影響。因此,在圖像識別之前,必須進行預(yù)處理操作,使處理后的圖像易于目標(biāo)的提取和圖像模式識別。

17、 圖像預(yù)處理一般包括:灰度化,二值化,圖像增強,圖像去噪和邊緣檢測等,下面對預(yù)處理的過程做下簡單介紹。2.2 圖像的灰度化圖2.2.1 圖像的灰度變換灰度化是一種常用的圖像處理方法,目的是將彩色圖像轉(zhuǎn)化為灰度圖像,主要應(yīng)用在圖像的識別與分析中。我們在研究圖像識別的過程中,對彩色圖像的顏色信息進行識別,容易受到復(fù)雜背景的影響,存在缺陷,然而灰度圖像是一種簡單的對比度增強方法,所以圖像識別的研究一般以灰度圖像為研究對象。在自然界中,大多數(shù)顏色都可以看成是由紅(R)、綠(G)、藍(B)三種基本的顏色組成,不同含量的R、G、B組成不同的顏色。為了生動形象的描述灰度化,我們可以在直角坐標(biāo)系中建立一個RG

18、B的空間模型,該模型的原點對應(yīng)的是黑色,距離原點最遠的那個頂點對應(yīng)的是白色。連接原點和這個頂點,該線段對應(yīng)了從黑色到白色的灰度值,也稱亮度值。從圖2.2.1的流程圖中,我們可以看出圖像的灰度變換過程。彩色圖像中的每一個像素的顏色都是由R、G、B三個分量決定的,而每個分量都有255個值,在RGB彩色空間中,大約有1600萬種不同的顏色。灰度圖像只含有亮度信息,不含色彩信息,其亮度是連續(xù)變化的,要表示灰度圖像就需要把亮度值進行量化,通常把灰度劃分為256個灰度級,從0到255?;叶戎翟浇咏?,對應(yīng)像素點越接近黑色?;叶戎翟浇咏?55,對應(yīng)像素點越接近白色。另外,我們稱灰度圖像是一種特殊的彩色圖

19、像,其中R、G、B三個分量相同,并且一個像素點有255種變換。在圖像識別中,為了減少圖像的計算量,將各種圖像轉(zhuǎn)變?yōu)榛叶葓D像。灰度圖像和彩色圖像都反映了整幅圖像的色度和亮度等級的特征,圖像的灰度化可以用多種方法來實現(xiàn):第一種,先求出每一個像素點的三個分量R、G、B,然后取平均值,并把這個平均值賦給該像素的三個分量;第二種,先求出每個像素點的R、G、B三個分量,然后取三個分量的最大值,并把最大值賦給這個像素的三個分量;第三種,在YUV的顏色空間中,Y分量的意義是點的亮度,能夠表示出一幅灰度圖。根據(jù)RGB和YUV顏色空間的變化,建立亮度Y與R、G、B三個顏色分量的對應(yīng)關(guān)系: (2-1)其中Y是灰度化

20、后的灰度值,R、G、B分別是原真彩圖中的紅、綠、藍灰度分量,用亮度值來表示圖像的灰度值。 2.3 二值圖像圖像二值化是圖像處理的一種基本技術(shù),也是圖像處理技術(shù)的預(yù)處理技術(shù),又稱圖像黑白化。通過二值化的處理,可以凸顯出圖像的輪廓。其像素點的灰度值設(shè)置為0或者255,不會出現(xiàn)其他的灰度值,目的是使整個圖像都呈現(xiàn)出黑白效果。通過選取合適的閾值,將256個不同等級的灰度圖像進行劃分,劃分結(jié)果仍然可以描繪圖像的整體或局部特征,這樣就實現(xiàn)了圖像的二值化。在進行二值圖像的處理與分析時,首先要對灰度圖像進行處理,得到二值化圖像。圖像的集合性質(zhì)與像素的多級值無關(guān),只與像素值為0或者255的點的位置有關(guān),從而簡化

21、了圖像處理,減少了數(shù)據(jù)的運算量。為了使輸出的二值圖像變得更加理想,通常采用封閉的或者連通的邊界來定義兩個不重疊的區(qū)域。如果像素點的灰度值大于或等于閾值,那么該點的灰度值用255表示,否則灰度值用0表示。 圖像二值化是圖像識別與處理中最常見的方法,圖像二值化過程中可能會損失原圖像的許多有用的信息,所以在進行二值化處理的過程中,關(guān)鍵是保留原始圖像的主要特征,正確選擇合適的閾值起到非常重要的作用。圖像二值化的閾值選取有很多方法,主要分為三類:整體閾值法和局部閾值法。整體閾值法只使用了一個固定的閾值,大概分三種:第一,對RGB彩色圖像灰度化后,掃描圖像中的每一個像素值,大于或等于127的像素值設(shè)為25

22、5,小于127的像素值設(shè)為0。這種方法不僅減少了在圖像識別過程中的計算量,而且加快了程序的運算速度。但是,這種方法存在很多缺點,直接設(shè)置閾值為127,并沒有考慮像素的分布情況及像素值的特征,很難達到預(yù)設(shè)的要求,因此并不常用。第二,計算圖像中像素的平均值,如果這個像素值大于或等于平均值,那就設(shè)為255,小于平均值,就設(shè)為0。該方法把平均值作為二值化的閾值,也可能導(dǎo)致部分像素丟失,不能真正的反映圖片信息。第三,使用直方圖的方法來確定二值化的閾值,在直方圖中,我們可以看到圖像的兩個高峰,在兩個高峰中間有個峰谷,閾值取該峰谷的值。該方法相對精準(zhǔn),能夠較多的反映圖片的信息,適用于質(zhì)量較好的圖片。整體閾值

23、法算法簡單,對目標(biāo)和背景明顯分離,直方圖呈雙峰的圖像效果較好。但是對噪聲和光照的抵抗能力差,易受到限制。局部閾值法是由當(dāng)前像素灰度值與該像素周圍點的局部灰度值來確定,該方法的選取一般將圖像劃分成許多的子圖像,在子圖像上采用整體閾值法。例如將原始圖像分成許多小塊,各小塊之間不相交。然后將各塊圖像的灰度值作為該小塊的閾值。局部閾值法可以根據(jù)局部特征,自適應(yīng)的選擇閾值。該方法既可以有效地消除光照不均帶來的影響,又能夠消除偽影,提高運算速度,并有有較大的靈活性。但是局部閾值運算速度較慢。該方法實際上是在局部采用了上述的整體閾值法。局部閾值法一般處理外界干擾嚴重、質(zhì)量較差的圖像,與整體閾值法相比,應(yīng)用比

24、較廣泛。2.4 邊緣檢測邊緣中包含物體的邊界信息,這些信息可以用于圖像分析、目標(biāo)識別,并且可以通過邊緣檢測降低圖像分析處理的數(shù)據(jù)量。邊緣是指圖像沿著某一特定方向發(fā)生強度變化的位置,至今為止,邊緣還沒有被廣泛認可的數(shù)學(xué)定義。一方面是因為自然界的圖像內(nèi)容比較復(fù)雜,很難用數(shù)學(xué)理論進行描述,另一方面是因為人類對目標(biāo)的邊界認識還處在不斷地完善之中。圖2.4.1是邊緣檢測的步驟流程圖,該過程列出了在圖像識別前的邊緣檢測過程。該過程能夠減少噪聲的干擾,有利于后期的圖像識別。圖2.4.1 邊緣檢測步驟不同檢測邊緣的差異在于梯度分量以及梯度分量的濾波器類型。局部邊緣變換越強,邊緣特征越顯著。邊緣檢測在圖像處理和

25、識別中起著很重要的作用,檢測效果的好壞將會直接影響圖像識別的性能。邊緣檢測在1959年被提出,經(jīng)過五十多年的發(fā)展變化,出現(xiàn)了許多邊緣檢測的算法。常見的邊緣檢測算法有Canny,Sobel,Prewitt,Roberts等算子,算子都經(jīng)過四個步驟:濾波、增強、檢測和定位。在邊緣檢測算子中,需要關(guān)注邊緣的法線方向、邊緣的方向以及邊緣點的強度。一般而言,沿邊緣方向的灰度變換比較平緩,邊緣法線方向的灰度變換相對劇烈。一種好的邊緣檢測算子具有抑制噪聲的能力,并且能夠保持完整的邊緣特性。為了降低噪聲的干擾,用微分算子進行檢測前先對圖像平滑濾波,Canny算子是具有平滑功能的一階和二階微分算子,邊緣檢測效果

26、較好。下面重點討論本文所采用的Canny算子。在使用霍夫變換之前,必須對圖像進行邊緣檢測,這樣可以增加實驗結(jié)果的準(zhǔn)確性。本文采用Canny算子對圖像進行邊緣檢測。Canny算子是JohnF.Canny在1986年提出的一種多級邊緣檢測算法,其核心是一種一階梯度方法,并使用二階梯度的過零點來來定位邊緣。Canny算子能夠標(biāo)出圖像中的實際邊緣,盡可能多地與實際圖像中的邊緣接近。Canny算子的邊緣檢測實現(xiàn)過程:(1)使用高斯濾波器對圖像進行平滑處理,抑制了噪聲,但是會使原始圖像變得模糊。(2)再計算平滑后圖像梯度的幅值和方向,找到梯度值最大的位置,這就是物體的邊緣。Canny采用的卷積算子:其中、

27、為一階偏導(dǎo)矩陣,得出梯度幅值、梯度方向的數(shù)學(xué)表達式: , (2-2) (2-3)(2-4)(2-5)求出這幾個矩陣,完成進一步檢測。(3)對梯度幅值進行非極大值抑制,能夠更好的處理圖像,細化邊緣。比較各個像素點,保留每個像素點的最大值,刪除其它的值,即置0。(4)最后,用雙閾值算法處理圖像,以檢測和連接物體的邊緣。設(shè)置一個高閾值和一個低閾值,高閾值可以減少假邊緣,低閾值更好的使圖像的邊緣閉合。針對不同分辨率的圖像,Canny算子使用了有向濾波器進行濾波,然后將濾波的結(jié)果融合起來構(gòu)成邊緣圖。根據(jù)提出的不同要求,我們可以修改相應(yīng)的參數(shù),來識別不同的邊緣特性,因此適用范圍比較廣。Canny算子在進行

28、邊緣檢測時必須滿足以下兩個條件:第一,能夠有效地抑制噪聲;第二,使錯誤的邊緣點數(shù)量最少;第三,準(zhǔn)確的找到邊緣點的位置。Canny算子的核心是基于一階導(dǎo)數(shù)的梯度方法,它使用二階導(dǎo)數(shù)來定位邊緣?;谝陨显?,對圓以及橢圓的程序進行了編寫,得出了一些效果圖。如圖2.4.2所示,選取了(a)、(c)三幅檢測圓的圖形,(b)、(d)是Canny算子對圖像進行邊緣檢測得到的效果圖。由于圖像的質(zhì)量以及外界干擾,邊緣檢測得到的效果圖會出現(xiàn)模糊,但不會對圖像的后續(xù)研究造成影響。 (a) 原圖 (b) 邊緣檢測 (c) 原圖 (d) 邊緣檢測 圖2.4.2 圓的邊緣檢測效果圖如圖2.4.3所示,選取了(a)、(c

29、)兩幅檢測橢圓的圖形,(b)、(d)是Canny算子對圖像進行邊緣檢測得到的效果圖。在后面對橢圓的研究中,使用了下面的圖形。 (a) 原圖 (b) 邊緣檢測 (c) 原圖 (d) 邊緣檢測 圖2.4.3 橢圓的邊緣檢測效果圖第三章 圓形識別的研究3.1 霍夫變換簡介霍夫變換是由Paul Hough首次提出的一種線描述方法,該方法經(jīng)常用來檢測圖像中的直線,后來擴展到識別任意形狀的物體,比如,矩形,圓和橢圓等?;舴蜃儞Q是通過直角坐標(biāo)系和極坐標(biāo)系之間的變換將圖像空間中具有相同特征的直線或者曲線映射到參數(shù)空間中的一個點上,然后在參數(shù)空間中對點進行描述,使結(jié)果更易識別和檢測,最后用累加器進行累加,從而把

30、檢測圖形的問題轉(zhuǎn)化為尋找最大累加值的問題。設(shè)圖像空間上的一條直線是y=x,我們?nèi)≈本€上的任意三個點:A(1,1), B(2,2), C(3,3)。我們可以得出,過A點的直線要滿足方程1=k+b,過B點的直線要滿足方程2=2k+b,過C點的直線要滿足方程3=3k+b,這三個方程就對應(yīng)著參數(shù)平面上的三條直線,這三條直線會相交于一點(k=1,b=0)。同理,圖像空間上直線y=x上的其它點,例如(4,4),(5,5)等,也交于這一點。 對于圖像上每一個像素點,求出參數(shù)平面中對應(yīng)的直線,并統(tǒng)計該直線上所有的像素點出現(xiàn)的次數(shù)。我們需要找到參數(shù)平面上出現(xiàn)次數(shù)最多的點位置,那么出現(xiàn)次數(shù)最多的這個位置就是圖像空

31、間上該直線的參數(shù),這就是霍夫變換的主要思想。我們把圖像平面上的像素點對應(yīng)到參數(shù)平面上的線,然后通過統(tǒng)計特性來進行識別。如果在圖像空間中有三條直線,那么在參數(shù)平面上就會看到統(tǒng)計的三個峰值點,最后通過遍歷,找到峰值點對應(yīng)的三條直線,這樣就實現(xiàn)了直線的檢測?;舴蜃儞Q常用來檢測直線,下面就用直線來介紹霍夫變換的原理。在直角坐標(biāo)系中有條直線: (3-1)其中k是斜率,b是截距。如圖3.1.1所示,在直線上選取兩個點A、B,帶入方程(3-1),過A點的直線表示為,通過變形就可以表示為,即點確定了一條直線。同理,過B點的直線表示為,變形為,確定另一條直線。兩條直線交于一點O,這個公共點就是AB所在的直線。因

32、此,我們可以知道,圖像空間的一個點映射到參數(shù)平面上,就成為一條直線。圖像空間中的每條直線都可以用k和b來表示,在參數(shù)空間的一個點對應(yīng)到圖像空間,就成為一條直線。只要找到參數(shù)空間最大累加值,就找到了圖像空間中的那條直線。(a) 圖像空間 (b) 參數(shù)空間圖3.1.1 霍夫變換原理3.2 標(biāo)準(zhǔn)霍夫變換檢測直線在上節(jié)介紹霍夫變換的理論的時候,對直線進行霍夫變換理論思想的詮釋。但是,在實際操作中,當(dāng)斜率趨于無窮大的時候,處理參數(shù)空間的累加值時,會出現(xiàn)問題。所以在這里采用極坐標(biāo)的表示方法: (3-2)將x-y平面的圖像變換到-平面,表示為直線相對于原點的距離,為直線的法線與x軸的夾角?;舴蜃儞Q是把-空間

33、細分為累加器單元。標(biāo)準(zhǔn)霍夫變換檢測直線的步驟:(1) 首先得到邊緣圖像;(2) 對圖像空間的每一個邊緣像素,在參數(shù)空間中都可以畫出一條線;(3) 對在參數(shù)空間每條線的交點進行“投票”,即累加;(4) 遍歷參數(shù)空間,找出局部最大值。如圖3.2.1 所示,基于霍夫變換的直線檢測,在圖像空間中的一條直線上有三個點,每一個點對應(yīng)到參數(shù)空間都為一條曲線。在(a)中隨機的選取三個點,在(b)中可以看出三條曲線交于一點。由此可以推出,在圖像空間中的所有像素點,映射到參數(shù)空間都交于一點。直線上的每一個點在參數(shù)空間中變換為正弦曲線,并且都過p點,p點就是參數(shù)空間的局部最大值。(a) 圖像空間 (b) 參數(shù)空間圖

34、3.2.1 基于霍夫變換的直線檢測3.3 圓檢測原理根據(jù)上述的理論,對本次論文進行研究。利用霍夫變換進行圓檢測,需要對圓及霍夫變換有一定的認識?;舴蜃儞Q圓檢測的基本思想是將圖像空間中的邊緣像素點映射到參數(shù)空間,然后把參數(shù)空間中的坐標(biāo)點元素對應(yīng)的累加值進行累加,最后根據(jù)累加值確定圓心和半徑。圓的一般方程可以寫成: (3-3)其中(a,b)為圓心,r為半徑。在直角坐標(biāo)系中,將圓上的點(x,y)轉(zhuǎn)換到極坐標(biāo)平面中,對應(yīng)的公式: (3-4)假設(shè)圖像空間中的一個邊緣點,以半徑為映射到參數(shù)空間。將這個邊緣點代入(3-4),再進行相應(yīng)的變換,可以寫成: (3-5)其中,由(3-5)的公式可以知道,對進行遍歷

35、,那么圖像空間上的點映射到參數(shù)空間為一個圓。由此我們可以推出,圖像空間中的每一個邊緣點對應(yīng)到參數(shù)空間都是一個圓。如果我們在圖像空間中取出A、B、C、D四個邊緣像素點,以r為半徑映射到參數(shù)空間。由圖3.3.1可以看出,圖像空間中的每一個點映射到參數(shù)空間都是一個圓,并且參數(shù)空間的四個圓交于點O。我們需要對參數(shù)空間中所以坐標(biāo)點進行統(tǒng)計,找出參數(shù)空間累加值最大的點。半徑已知的情況下,就存在、兩個參數(shù),在圖像識別的過程中,需要求出、的值。根據(jù)下圖可以得出,O點的累加值在參數(shù)空間中是最大的,也就是圖像空間的圓心。(a) 圖像空間 (b) 參數(shù)空間圖3.3.1 二維空間效果圖(半徑r已知) 在實際操作中,并

36、不知道檢測圓的半徑,那么圖像空間中的點映射到參數(shù)空間為,圖像空間中的任意一點對應(yīng)參數(shù)空間的一個圓錐面,這樣圓的檢測就從二維空間上升到三維空間,計算量明顯增大。在圖像空間取圓上的任意一點,由于r可以取任意值,那么映射到參數(shù)空間是一個圓錐。如圖3.3.2所示,(a)為某一點在參數(shù)空間的顯示,(b)為圓在參數(shù)空間的顯示。從(b)中可以看出,多個圓錐交于一點,這個點反應(yīng)出了圓的坐標(biāo)和圓的半徑。在圓形識別中,我們需要計算出最大累加值,就可以找到圓心和半徑,然后通過遍歷,標(biāo)出所有的像素點。(a) 點在參數(shù)空間的顯示 (b) 圓在參數(shù)空間的顯示圖3.3.2 三維空間效果圖(半徑r未知) 3.4 圓形識別的研

37、究在使用霍夫變換進行圓檢測時,要對圖像進行灰度化和二值化處理,提取圖像的邊緣信息,在圖像識別中,使結(jié)果更加準(zhǔn)確。圓檢測的步驟:(1) 對需要檢測的圖像灰度化、二值化;(2) 對圖像進行邊緣檢測;(3) 在參數(shù)空間-中建立一個累加數(shù)組,并設(shè)置該數(shù)組中的初值為零;(4) 然后對數(shù)組進行峰值檢測,得到被檢測直線的參數(shù)和。將參數(shù)空間等分成m行、n列,m為的等分數(shù),n為的等分數(shù),并設(shè)置累加值矩陣。設(shè)置半徑最小刻度,角度最小刻度,半徑的最大值,最小值。遍歷所有的像素點,求出和的值。然后判斷是否在矩陣中,如果在該范圍內(nèi),累加器加1,從而獲得霍夫累積矩陣。在圓的檢測中需要設(shè)置閾值,最大累加值確定閾值。搜索超過

38、閾值的聚焦點,對應(yīng)的參數(shù)就認為是圓的參數(shù)。閾值不同,檢測的效果也不同,如果閾值設(shè)置為0.75,那么大于最大累加值的百分之七十五的累積矩陣對應(yīng)的圓都可以檢測出來。這次遍歷目的是找出符合參數(shù)的像素,也就找到了圓的像素。根據(jù)霍夫變換的原理,編寫程序,并運行。圓形識別的效果圖如圖3.4.1所示,(a)是原始圖像,該圖像中有圓、正方形和橢圓。該程序?qū)D像中的每一個像素點進行遍歷,在參數(shù)空間中進行累加,并對累加值進行分析。然后進行遍歷,將參數(shù)空間中累加值最大的點對應(yīng)的圓標(biāo)出,從而得到(b)圖。 (a) 原始圖形 (b) 圓形識別效果圖 圖3.4.1 圓檢測效果圖在對圓檢測的程序進行調(diào)試的時候,也出現(xiàn)了一些

39、問題。如果圖片占用的空間比較大,那么運行的速度比較慢。在調(diào)試程序的時候需要設(shè)置閾值,不同的閾值檢測效果存在很大差異,有時候閾值設(shè)置的太小,可能存在誤檢的現(xiàn)象。另外,我們需要根據(jù)數(shù)據(jù)游標(biāo)估計圓的半徑,設(shè)置半徑的范圍。檢測的圓的半徑必須在設(shè)定的半徑范圍中,否則不能識別出圓。上述的圖形相對簡單,接著對相對復(fù)雜的圖形進行了調(diào)試、運行。在一幅圖片中有許多的圖形,比如正方形、長方形、圓、橢圓以及一些不規(guī)則的多邊形。從圖3.4.2可以看到,(a)、(c)是相對復(fù)雜的原始圖像。根據(jù)上述原理,改變相應(yīng)的參數(shù),對圖像進行調(diào)試,得到(b)、(d)圖。由此可以得出,各圖形之間不會受到相應(yīng)的干擾,只檢測出了圓,并沒有出

40、現(xiàn)誤檢的現(xiàn)象,檢測比較準(zhǔn)確。 (a) 原始圖形 (b) 圓形識別效果圖 (c) 原始圖形 (d) 圓形識別效果圖圖3.4.2 復(fù)雜圖片的圓檢測在實際操作中,為了減少運算量,我們需要設(shè)置合適的半徑范圍。另外,設(shè)置不同的閾值,檢測結(jié)果也不同。如圖3.4.3所示,(a)是原始圖像,(b)是閾值為0.6的圓檢測效果圖,(c)是閾值為0.7的圓檢測效果圖,(d)是閾值為0.9的圓檢測效果圖。 (a) 原始圖形 (b) 閾值為0.6 (c) 閾值為0.7 (d) 閾值為0.9圖3.4.3 設(shè)置不同閾值的圓檢測效果圖由上圖可知,閾值的設(shè)定對檢測效果有很大的影響。當(dāng)閾值設(shè)置為0.6的時候,能夠檢測出原始圖像中

41、的三個圓,并且每個圓的邊緣像素點比較多。當(dāng)閾值設(shè)置為0.7的時候,能夠完整檢測出原始圖像中的兩個圓,還有一個較大的圓通過霍夫變換,只能檢測出四分之三個圓,并不完整。而且每個圓的邊緣像素點都比較少。當(dāng)閾值設(shè)置為0.9的時候,最小的圓可以完全檢測出來,最大的圓沒有檢測出來,還有一個圓的邊緣像素點比較少,但是可以看出是圓。在圓的檢測中需要設(shè)置閾值,根據(jù)最大累加值來確定閾值。搜索超過閾值的聚焦點,那么對應(yīng)的參數(shù)就認為是圓的參數(shù)。閾值不同,檢測的效果也不同。如果閾值設(shè)置為0.7,那么大于最大累加值的百分之七十的累積矩陣對應(yīng)的圓都可以檢測出來。在上圖中,我們可以看出在閾值為0.9的時候,有的圓并沒有識別出

42、來,這是因為該圓并沒有超過最大累加值的百分之九十。相反,如果我們把閾值設(shè)置的比較小,這樣檢測出的圖形較多。在檢測圓的時候,有可能也識別出了類似圓的圖形以及某些圖形的邊緣,造成了誤識別的現(xiàn)象。所以在選取閾值的時候,需要根據(jù)實際情況而定。為了使圓檢測便于識別,對上述的程序作了相應(yīng)的改進。目的是將識別出來的圓在邊緣檢測的圖形中凸顯,易于人眼的觀察與識別。圖3.4.4不僅識別出了圓,而且用綠色線標(biāo)出了識別的圓。從(b)、(d)三幅檢測結(jié)果圖片可以清楚地在看出圓與其他圖形,從而達到了檢測的目的。 (a) 原始圖形 (b) 突出圓形 (c) 原始圖形 (d) 突出圓形圖3.4.4 綠色線標(biāo)出圓的效果圖 3

43、.5 本章小結(jié)本章主要介紹了霍夫變換檢測直線的原理,并根據(jù)這一原理,分析、總結(jié)了霍夫變換圓檢測的方法。在實現(xiàn)圓檢測的過程中,根據(jù)不同的圖像選取不同的閾值,參數(shù)空間的閾值選取依靠經(jīng)驗選取某一固定值,使檢測的效果圖更加明顯。第四章 圓的拓展橢圓4.1 橢圓的研究圓和橢圓在使用霍夫變換進行檢測時,都需要對圖像進行邊緣檢測,提取圖像的邊緣信息,使圖像識別更加準(zhǔn)確。另外,圓和橢圓都是以標(biāo)準(zhǔn)方程為基礎(chǔ),根據(jù)推導(dǎo)結(jié)果編寫程序,實現(xiàn)圓與橢圓的檢測。用圖像的特征把邊緣像素連接起來,組成區(qū)域封閉邊界,將圖像空間中的點轉(zhuǎn)換到參數(shù)空間。這樣就能夠?qū)λ锌赡艿倪吘夵c進行統(tǒng)計,進行霍夫累積矩陣的變換,使每個邊緣像素點變換

44、到霍夫空間,根據(jù)統(tǒng)計累加值來判斷是否是我們所需要檢測的圖形。橢圓有5個自由參數(shù),需要在五維的參數(shù)空間進行累加,與三維參數(shù)空間的圓相比,計算量明顯增加。對于圖像空間中的任意橢圓,我們可以通過對單位圓的變形得到,下面進行了一系列的推導(dǎo): (4-1) (4-2)其中 是單位圓上的點,是比例因子,任意橢圓上的點。從(4-1)的公式可以看出,單位圓在比例因子的作用下,變換為圓心在原點的橢圓。然后進行旋轉(zhuǎn)變換,正向旋轉(zhuǎn)的角度為,最后進行上下平移。這樣就得到了任意橢圓的極坐標(biāo)方程。根據(jù)(4-1)和(4-2)兩個公式可以得到:(4-3)對公式(4-3)變形: (4-4)通過比例因子對單位圓進行變換,成為中心在

45、原點的橢圓,然后對圖形進行旋轉(zhuǎn),再進行平移,即可得到任意橢圓,如圖4.1.1所示,可以看到在直角坐標(biāo)系中的任意橢圓。圖中的是比例因子,是橢圓的長軸,是橢圓的短軸。經(jīng)過了上下左右平移,它是橢圓的中心坐標(biāo)點。圖4.1.1 任意橢圓4.2 研究成果圓形特征是自然界最基本的要素,在許多產(chǎn)品中都可以看到,在機器視覺領(lǐng)域得到廣泛關(guān)注。圓形特征是二次曲線的一個特例,它在任意方向的投影都是一個橢圓。在數(shù)字圖像中,識別出橢圓,將有利于在視覺領(lǐng)域中的定位?;舴蜃儞Q是一種檢測曲線的方法,檢測的曲線通常能夠用參數(shù)表示,例如直線、圓、橢圓等。由于定義一個橢圓需要五個參數(shù),霍夫變換需要使用五維累加器矩陣來構(gòu)造參數(shù)空間。根據(jù)不同的圖形,需要設(shè)置a、b的值,兩個值的范圍越小,圖形的像素越小運行速度越快。由于橢圓用的是五維參數(shù)空間,需要較大的內(nèi)存,所以在選取圖片的時候,盡量取像素小的圖片。具體實現(xiàn)過程:輸入圖片,對圖像進行灰度化、二值化以及邊緣檢測,提取圖像的邊緣特征信息。把圖像所在的參數(shù)空間等分成m行、n列,然后設(shè)置霍夫變換的累加值矩陣hough_space(p,q,a,b,theta)。設(shè)置傾斜角theta的最大值、最小值和步長,橢圓長軸的最大值和最小值,橢圓短軸的最大和最小值,令長軸、短軸和角度的步長都為1。設(shè)置參數(shù)空間的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論