chp03 二值圖像分析說課講解_第1頁
chp03 二值圖像分析說課講解_第2頁
chp03 二值圖像分析說課講解_第3頁
chp03 二值圖像分析說課講解_第4頁
chp03 二值圖像分析說課講解_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Good is good, but better carries it.精益求精,善益求善。chp03 二值圖像分析-第三章二值圖像分析一幅數(shù)字圖像是一個(gè)二維陣列,陣列元素值稱為灰度值或強(qiáng)度值實(shí)際上,圖像在量化成數(shù)字圖像前是一個(gè)連續(xù)強(qiáng)度函數(shù)的集合,場景信息就包含在這些強(qiáng)度值中圖像強(qiáng)度通常被量化成256個(gè)不同灰度級,對某些應(yīng)用來說,也常有32、64、128或512個(gè)灰度級的情況,在醫(yī)療領(lǐng)域里甚至使用高達(dá)4096(12bits)個(gè)灰度級很明顯,灰度級越高,圖像質(zhì)量越好,但所需的內(nèi)存也越大在機(jī)器視覺研究的早期,由于內(nèi)存和計(jì)算能力非常有限,而且十分昂貴,因此視覺研究人員把精力主要集中在研究輸入圖像僅包

2、含兩個(gè)灰度值的二值視覺系統(tǒng)上人們注意到,人類視覺在理解僅由兩個(gè)灰度級組成的線條、輪廓影像或其它圖像時(shí)沒有任何困難,而且應(yīng)用場合很多,這一點(diǎn)對研究二值視覺系統(tǒng)的研究人員是一個(gè)極大的鼓舞隨著計(jì)算機(jī)計(jì)算能力的不斷增強(qiáng)和計(jì)算成本的不斷下降,人們普遍開始研究基于灰度圖像、彩色圖像和深度圖像的視覺系統(tǒng)盡管如此,二值視覺系統(tǒng)還是十分有用的,其原因如下:=1*GB2計(jì)算二值圖像特性的算法非常簡單,容易理解和實(shí)現(xiàn),并且計(jì)算速度很快=2*GB2二值視覺所需的內(nèi)存小,對計(jì)算設(shè)備要求低工作在256個(gè)灰度級的視覺系統(tǒng)所需內(nèi)存是工作在相同大小二值圖像視覺系統(tǒng)所需內(nèi)存的八倍如若利用游程長度編碼等技術(shù)(見34節(jié))還可使所需內(nèi)

3、存進(jìn)一步減少由于二值圖像中的許多運(yùn)算是邏輯運(yùn)算而不是算術(shù)運(yùn)算,所以所需的處理時(shí)間很短(3)許多二值視覺系統(tǒng)技術(shù)也可以用于灰度圖像視覺系統(tǒng)上在灰度或彩色圖像中,表示一個(gè)目標(biāo)或物體的一種簡易方法就是使用物體模板(mask),物體模板就是一幅二值圖像,其中1表示目標(biāo)上的點(diǎn),0表示其它點(diǎn)在物體從背景中分離出來后,為了進(jìn)行決策,還需要求取物體的幾何和拓?fù)涮匦?,這些特性可以從它的二值圖像計(jì)算出來因此,盡管我們是在二值圖像上討論這些方法,但它們的應(yīng)用并不限于二值圖像一般來說,當(dāng)物體輪廓足以用來識(shí)別物體且周圍環(huán)境可以適當(dāng)?shù)乜刂茣r(shí),二值視覺系統(tǒng)是非常有用的當(dāng)使用特殊的照明技術(shù)和背景并且場景中只有少數(shù)物體時(shí),物體

4、可以很容易地從背景中分離出來,并可得到較好的輪廓,比如,許多工業(yè)場合都屬于這種情況二值視覺系統(tǒng)的輸入一般是灰度圖像,通常使用閾值法首先將圖像變成二值圖像,以便把物體從背景中分離出來,其中的閾值取決于照明條件和物體的反射特性二值圖像可用來計(jì)算特定任務(wù)中物體的幾何和拓?fù)涮匦?,在許多應(yīng)用中,這種特性對識(shí)別物體來說是足夠的二值視覺系統(tǒng)已經(jīng)在光學(xué)字符識(shí)別、染色體分析和工業(yè)零件的識(shí)別中得到了廣泛應(yīng)用在下面的討論中,假定二值圖像大小為,其中物體像素值為1,背景像素值為031閾值視覺系統(tǒng)中的一個(gè)重要問題是從圖像中識(shí)別代表物體的區(qū)域(或子圖像),這種對人來說是件非常容易的事,對計(jì)算機(jī)來說卻是令人吃驚的困難為了將

5、物體區(qū)域同圖像其它區(qū)域分離出來,需要首先對圖像進(jìn)行分割把圖像劃分成區(qū)域的過程稱為分割,即把圖像劃分成區(qū)域,使得每一個(gè)區(qū)域?qū)?yīng)一個(gè)候選的物體下面給出分割的嚴(yán)格定義定義分割是把像素聚合成區(qū)域的過程,使得:整幅圖像(是一個(gè)完備分割),(是一個(gè)完備分割)每個(gè)區(qū)域滿足一個(gè)謂詞,即區(qū)域內(nèi)的所有點(diǎn)有某種共同的性質(zhì)不同區(qū)域的圖像,不滿足這一謂詞正如上面所表明的,分割滿足一個(gè)謂詞,這一謂詞可能是簡單的,如分割灰度圖像時(shí)用的均勻灰度分布、相同紋理等謂詞,但在大多數(shù)應(yīng)用場合,謂詞十分復(fù)雜在圖像理解過程中,分割是一個(gè)非常重要的步驟二值圖像可以通過適當(dāng)?shù)胤指罨叶葓D像得到如果物體的灰度值落在某一區(qū)間內(nèi),并且背景的灰度值在

6、這一區(qū)間之外,則可以通過閾值運(yùn)算得到物體的二值圖像,即把區(qū)間內(nèi)的點(diǎn)置成1,區(qū)間外的點(diǎn)置成0對于二值視覺,分割和閾值化是同義的閾值化可以通過軟件來實(shí)現(xiàn),也可以通過硬件直接完成通過閾值運(yùn)算是否可以有效地進(jìn)行圖像分割,取決于物體和背景之間是否有足夠的對比度設(shè)一幅灰度圖像中物體的灰度分布在區(qū)間內(nèi),經(jīng)過閾值運(yùn)算后的圖像為二值圖像,即:(31)如果物體灰度值分布在幾個(gè)不相鄰區(qū)間內(nèi)時(shí),閾值化方案可表示為:(32)其中Z是組成物體各部分灰度值的集合圖31是對一幅灰度圖像使用不同閾值得到的二值圖像輸出結(jié)果閾值算法與應(yīng)用領(lǐng)域密切相關(guān)事實(shí)上,某一閾值運(yùn)算常常是為某一應(yīng)用專門設(shè)計(jì)的,在其它應(yīng)用領(lǐng)域可能無法工作閾值選擇

7、常常是基于在某一應(yīng)用領(lǐng)域獲取的先驗(yàn)知識(shí),因此在某些場合下,前幾輪運(yùn)算通常采用交互式方式來分析圖像,以便確定合適的閾值但是,在機(jī)器視覺系統(tǒng)中,由于視覺系統(tǒng)的自主性能(autonomy)要求,必須進(jìn)行自動(dòng)閾值選擇現(xiàn)在已經(jīng)研究出許多利用圖像灰度分布和有關(guān)的物體知識(shí)來自動(dòng)選擇適當(dāng)閾值的技術(shù)其中的一些方法將在32節(jié)介紹圖31一幅灰度圖像和使用不同閾值得到的二值圖像結(jié)果上左:原始灰度圖像,上右:閾值T=100;左下:T=128右下:T1=100|T2=12832幾何特性通過閾值化方法從圖像中檢測出物體后,下一步就要對物體進(jìn)行識(shí)別和定位在大多數(shù)工業(yè)應(yīng)用中,攝像機(jī)的位置和環(huán)境是已知的,因此通過簡單的幾何知識(shí)就

8、可以從物體的二維圖像確定出物體的三維位置在大多數(shù)應(yīng)用中,物體的數(shù)量不是很多,如果物體的尺寸和形狀完全不同,則可以利用尺度和形狀特征來識(shí)別這些物體實(shí)際上在許多工業(yè)應(yīng)用中,經(jīng)常使用區(qū)域的一些簡單特征,如大小、位置和方向,來確定物體的位置并識(shí)別它們321尺寸和位置一幅二值圖像區(qū)域的面積(或零階矩)由下式給出:(33)在許多應(yīng)用中,物體的位置起著十分重要的作用工業(yè)應(yīng)用中,物體通常出現(xiàn)在已知表面(如工作臺(tái)面)上,而且攝像機(jī)相對臺(tái)面的位置也是已知的在這種情況下,圖像中的物體位置決定了它的空間位置確定物體位置的方法有許多,比如用物體的外接矩形、物體矩心(區(qū)域中心)等來表示物體的位置區(qū)域中心是通過對圖像進(jìn)行“

9、全局”運(yùn)算得到的一個(gè)點(diǎn),因此它對圖像中的噪聲相對來說是不敏感的對于二值圖像,物體的中心位置與物體的質(zhì)心相同,因此可以使用下式求物體的中心位置:(34)其中和是區(qū)域相對于左上角圖像的中心坐標(biāo)物體的位置為:(35)這些是一階矩注意,由于約定y軸向上,因此方程34和35的第二個(gè)式子的等號(hào)右邊加了負(fù)號(hào)322方向計(jì)算物體的方向比計(jì)算它的位置稍微復(fù)雜一點(diǎn)某些形狀(如圓)的方向不是唯一的,為了定義唯一的方向,一般假定物體是長形的,其長軸方向被定義為物體的方向通常,二維平面上與最小慣量軸同方向的最小二階矩軸被定為長軸圖像中物體的二階矩軸是這樣一條線,物體上的全部點(diǎn)到該線的距離平方和最小給出一幅二值圖像,計(jì)算物

10、體點(diǎn)到直線的最小二乘方擬合,使所有物體點(diǎn)到直線的距離平方和最?。?36)其中是物體點(diǎn)到直線的距離為了避免直線處于近似垂直時(shí)所出現(xiàn)的數(shù)值病態(tài)問題,人們一般把直線表示成極坐標(biāo)形式:(37)如圖32所示,是直線的法線與x軸的夾角,是直線到原點(diǎn)的距離把點(diǎn)坐標(biāo)代入直線的極坐標(biāo)方程得出距離:(38)圖32直線的極坐標(biāo)表示將方程38代入方程36并求極小化問題,可以確定參數(shù)和:(39)令對的導(dǎo)數(shù)等于零求解得:(310)它說明回歸直線通過物體中心用這一值代入上面的,則極小化問題變?yōu)椋?311)其中的參數(shù):(312)是二階矩表達(dá)式可重寫為:(313)對微分,并置微分結(jié)果為零,求解值:(314)因此,慣性軸的方向由

11、下式給出:(315)所以由的最小值可以確定方向軸注意,如果,那么物體就不會(huì)只有唯一的方向軸物體的伸長率是的最大值與最小值之比:(316)323密集度和體態(tài)比區(qū)域的密集度(compact)可用下面的式子來度量:(317)其中,和A分別為圖形的周長和面積根據(jù)這一衡量標(biāo)準(zhǔn),圓是最密集的圖形,其密集密度為最大值,其它一些圖形的比值要小一些讓我們來看一下圓,當(dāng)圓后仰時(shí),形狀成了一橢圓,面積減小了而周長卻不象面積減小的那么快,因此密集度降低了在后仰到極限角時(shí),橢圓被壓縮成了一條無限長直線,橢圓的周長為無窮大,故密集度變成了零對于數(shù)字圖像,是指物體尺寸(像素點(diǎn)數(shù)量)除以邊界長度的平方這是一種很好的散布性或密

12、集性度量方法這一比值在許多應(yīng)用中被用作為區(qū)域的一個(gè)特征密集度的另一層意義是:在給定周長的條件下,密集度越高,圍成的面積就越大注意在等周長的情況下,正方形密集度大于長方形密集度體態(tài)比定義為區(qū)域的最小外接矩形的長與寬之比,正方形和圓的體態(tài)比等于1,細(xì)長形物體的體態(tài)比大于1圖3.3所示的是幾種形狀的外接矩形圖3.3幾種外接矩形示意圖33投影給定一條直線,用垂直該直線的一簇等間距直線將一幅二值圖像分割成若干條,每一條內(nèi)像素值為1的像素個(gè)數(shù)為該條二值圖像在給定直線上的投影(projection)當(dāng)給定直線為水平或垂直直線時(shí),計(jì)算二值圖像每一列或每一行上像素值為1的像素?cái)?shù)量,就得到了二值圖像的水平和垂直投

13、影,如圖34所示由于投影包含了圖像的許多信息,所以投影是二值圖像的一種簡潔表示方式顯然,投影不是唯一的,同樣的投影可能對應(yīng)不同的圖像圖34一幅二值圖像及其水平投影圖在某些應(yīng)用中,投影可以作為物體識(shí)別的一個(gè)特征投影既是一種簡潔的圖像表示,又可以實(shí)現(xiàn)快速算法下面介紹對角線投影的求解方法對角線投影的關(guān)鍵是計(jì)算當(dāng)前行和列對應(yīng)的投影分布圖位置標(biāo)號(hào)設(shè)行和列的標(biāo)號(hào)分別用和表示若圖像矩陣為行列,則和的范圍分別為0到和0到假設(shè)對角線的標(biāo)號(hào)用行和列的仿射變換(線性組合加上常數(shù))計(jì)算,即:(318)對角線投影共對應(yīng)個(gè)條,其中仿射變換把右上角像素映射成對角線投影的第一個(gè)位置,把左下角像素映射成最后一個(gè)位置,如圖3.5

14、所示,則當(dāng)前行列對應(yīng)的標(biāo)號(hào)d的公式為:(319)圖35二值圖像及其對角線上的投影圖34游程長度編碼游程長度編碼(run-lengthencoding)是另一種二值圖像的簡潔表示方法,它是用圖像像素值連續(xù)為1的個(gè)數(shù)(像素1的長度)來描述圖像這種編碼已被用于圖像傳輸另外,圖像的某些性質(zhì),如物體區(qū)域面積,也可以從游程長度編碼直接計(jì)算出來在游程長度編碼中經(jīng)常運(yùn)用兩種方法,一種是使用1的起始位置和1的游程長度,另一種是僅僅使用游程長度,但須從1的游程長度開始描述,如圖3.6所示0110011100001111110100011111101111111111111110000010000011111的游程

15、(2,2)(6,3)(13,6)(20,1)(4,6)(11,10)(1,5)(11,1)(17,4)1和0的游程長度:0,2,2,3,4,6,1,10,3,6,1,105,5,1,5,4圖36一幅簡單二值圖像的游程長度編碼如果用第二種方法來表示圖像每行的游程長度,并用代表圖像第行的第個(gè)游程長度,則全部1的游程長度之和就是所求物體的面積(320)其中是第行游程個(gè)數(shù),取整,表示1的游程個(gè)數(shù)由游程長度編碼能很容易地計(jì)算水平投影而無需變成原來的圖像使用更巧妙的方法也能從游程長度編碼計(jì)算出垂直和對角線投影35二值圖像算法從背景中分離出物體是一個(gè)困難的問題,在此將不討論這個(gè)問題這里假設(shè)物體可以從背景中分

16、離,并且使用某一謂詞,可以對圖像中屬于物體的點(diǎn)進(jìn)行標(biāo)記因此,問題就變?yōu)槿绾螌⒁环鶊D像中所有被標(biāo)記的點(diǎn)組合成物體圖像這里還假設(shè)物體點(diǎn)在空間上是非常接近的利用空間接近概念可以嚴(yán)格定義,利用此定義研究的算法可以把空間上非常接近的點(diǎn)聚合在一起,構(gòu)成圖像的一個(gè)成分(component)下面首先引進(jìn)一些定義,然后討論有關(guān)算法351定義(1)近鄰在數(shù)字圖像中,一個(gè)像素在空間上可能非常接近其它一些像素在用方格表示的數(shù)字圖像中,一個(gè)像素與其它四個(gè)像素有公共邊界,并與另外四個(gè)像素共享頂角如果兩個(gè)像素有公共邊界,則把它們稱為4近鄰(4-neighbors)同樣,如果兩個(gè)像素至少共享一個(gè)頂角,則稱它們?yōu)?近鄰例如,位

17、于的像素有四個(gè)4近鄰:,它的8近鄰包括這四個(gè)4近鄰,再加上,一個(gè)像素被認(rèn)為與它的4近鄰是4連通(4connected)關(guān)系,與它的8近鄰是8連通關(guān)系(如圖37)圖37矩形像素網(wǎng)格的4近鄰和8近鄰示意圖像素位于圖的中心(2)路徑從像素到像素的路徑(path)是指一個(gè)像素序列,其中像素是像素的近鄰像素,如果近鄰關(guān)系是4連通的,則路徑是4路徑;如果是8連通的,則稱為8路徑圖38即為路徑的兩個(gè)簡單例子圖384路徑和8路徑示意圖(3)前景圖像中值為1的全部像素的集合稱為前景(foreground),用S表示(4)連通性已知像素,如果存在一條從p到q的路徑,且路徑上的全部像素都包含在S中,則稱p與q是連通

18、的注意,連通性(connectivity)是等價(jià)關(guān)系對屬于S的任意三個(gè)像素p、q和r,有下列性質(zhì):像素p與p本身連通(自反性)如果p與q連通,則q與p連通(互換性)如果p與q連通且q與r連通,則p與r連通(傳遞性)(5)連通成份一個(gè)像素集合,如果集合內(nèi)的每一個(gè)像素與集合內(nèi)其它像素連通,則稱該集合為一個(gè)連通成份(connectedcomponent)(6)背景S(S的補(bǔ)集)中包含圖像邊界點(diǎn)的所有連通成份的集合稱為背景(background)S中所有其它元稱為洞考慮下面的兩個(gè)圖像首先看左圖中有幾個(gè)洞和幾個(gè)物體如果從前景和背景來考慮4連通,有四個(gè)大小為個(gè)像素的物體和一個(gè)洞如果考慮8連通,那么有一個(gè)物

19、體而沒有洞直觀地,在這兩種情況下出現(xiàn)了不確定性情況右圖為另一個(gè)類似的不確定問題其中如果1是連通的,那么0就應(yīng)該是不連通的為了避免這種難以處理的情況,對物體和背景應(yīng)使用不同的連通如果我們對S使用8連通,那么對S就應(yīng)使用4連通(7)邊界S的邊界(boundary)是S中與S中有4連通關(guān)系的像素集合邊界通常記為(8)內(nèi)部內(nèi)部(interior)是中不屬于它的邊界的像素集合的內(nèi)部等于(9)包圍如果從S中任意一點(diǎn)到圖像邊界的4路徑必須與區(qū)域T相交,則區(qū)域T包圍(surrounds)區(qū)域S(或S在T內(nèi))圖39即為一幅簡單二值圖像和它的邊界、內(nèi)部、包圍示意圖圖39一幅二值圖像與它的邊界,內(nèi)部和包圍352連通

20、成份標(biāo)記在一幅圖像中找出連通成份是機(jī)器視覺中最常見的運(yùn)算之一連通區(qū)域內(nèi)的點(diǎn)構(gòu)成表示物體的候選區(qū)域機(jī)器視覺中的大多數(shù)物體都有表面,顯然,物體表面點(diǎn)投影到圖像平面上會(huì)形成空間上密集的點(diǎn)集這里應(yīng)該指出,連通成份算法常常會(huì)在二值視覺系統(tǒng)中形成瓶頸效應(yīng),原因是連通成份運(yùn)算是一個(gè)全局性的運(yùn)算,這種算法在本質(zhì)上是序貫的如果圖像中僅有一個(gè)物體,那么找連通成份就沒有必要;如果圖像中有許多物體,且需要求出物體的特性與位置,則必須確定連通成份連通標(biāo)記算法可以找到圖像中的所有連通成份,并對同一連通成份中的所有點(diǎn)分配同一標(biāo)記圖310表示的是一幅圖像和已標(biāo)記的連通成份在很多應(yīng)用中,要求在標(biāo)記連通成份的同時(shí)算出連通成份的特

21、征,如尺寸、位置、方向和外接矩形下面介紹兩種連通成份標(biāo)記算法:遞歸算法和序貫算法Jain1995圖3.10一副圖像及其連通成分圖像()遞歸算法遞歸算法在串行處理器上的計(jì)算效率是很低的,因此,這一算法主要用于并行機(jī)上算法31連通成份遞歸算法1掃描圖像,找到?jīng)]有標(biāo)記的1點(diǎn),給它分配一個(gè)新的標(biāo)記L3遞歸分配標(biāo)記L給1點(diǎn)的鄰點(diǎn)3如果不存在沒標(biāo)記的點(diǎn),則停止4返回第一步()序貫算法序貫算法通常要求對圖像進(jìn)行二次處理由于這一算法一次僅運(yùn)算圖像的兩行,因此當(dāng)圖像以文件形式存貯且空間不允許把整幅圖像載入內(nèi)存時(shí)也能使用這一算法這一算法(見算法32)可以查看某一點(diǎn)的鄰點(diǎn),并且可以給像素值為1的鄰點(diǎn)分配一個(gè)已經(jīng)使用

22、過的標(biāo)記如果圖像的鄰點(diǎn)有兩種不同的標(biāo)記,則用一個(gè)等價(jià)表(equivalenttable)來記錄所有的等價(jià)標(biāo)記在第二次處理過程中,使用這一等價(jià)表來給某一連通成份中所有像素點(diǎn)分配唯一的標(biāo)記本算法在從左到右、從上到下掃描圖像時(shí),算法僅能查詢到某一像素點(diǎn)的4近鄰中的兩個(gè)近鄰點(diǎn),即上點(diǎn)與左點(diǎn)設(shè)算法已經(jīng)查到了該像素的這兩個(gè)近鄰點(diǎn),此時(shí)出現(xiàn)三種情況:(1)如果這兩個(gè)近鄰點(diǎn)中沒有一點(diǎn)為1,則該像素點(diǎn)需要一個(gè)新的標(biāo)記(2)如果這兩個(gè)近鄰點(diǎn)中只有一點(diǎn)為1,且分配了標(biāo)記L,那么該像素點(diǎn)的標(biāo)記也為L(3)如果這兩個(gè)鄰點(diǎn)都為1,且已分配了標(biāo)記L,則該像素點(diǎn)的標(biāo)記還是L;但是當(dāng)近鄰點(diǎn)被分配了不同標(biāo)記M與N,則這兩個(gè)標(biāo)記被

23、用于了同一組元,應(yīng)該把它們合并在這種情況下,應(yīng)把其中的一個(gè)標(biāo)記(一般選用最小的那個(gè)標(biāo)記)分配給該像素點(diǎn),并在等價(jià)表中登記為等價(jià)標(biāo)記等價(jià)表包含了給每一連通成份分配唯一標(biāo)記的信息在第一次掃描中,所有屬于同一連通成份的標(biāo)記被視為是等價(jià)的在第二次掃描中,從一個(gè)等價(jià)集(equivalentset)中選擇一個(gè)標(biāo)記并分配給連通成份中所有像素點(diǎn)通常將最小的標(biāo)記分配給一個(gè)連通成份第二次掃描將給每一連通成份分配唯一的標(biāo)記在找到所有的連通成份后,應(yīng)該統(tǒng)計(jì)等價(jià)表,以便刪除其中的空格;然后將等價(jià)表作為查找表對圖像重新進(jìn)行掃描,以便重新統(tǒng)計(jì)圖像中的標(biāo)記計(jì)算每一連通成份的面積、一階矩、二階矩是序貫連通成份算法的一個(gè)部分當(dāng)然

24、,必須使用分離變量來累加每一區(qū)域的矩信息當(dāng)區(qū)域合并后,每一區(qū)域的矩累計(jì)值也應(yīng)加到一起算法324連通序貫連通成份算法1從左至右、從上到下掃描圖像2如果像素點(diǎn)為1,則:(a)如果上面點(diǎn)和左面點(diǎn)有一個(gè)標(biāo)記,則復(fù)制這一標(biāo)記(b)如果兩點(diǎn)有相同的標(biāo)記,復(fù)制這一標(biāo)記(c)如果兩點(diǎn)有不同的標(biāo)記,則復(fù)制上點(diǎn)的標(biāo)記且將兩個(gè)標(biāo)記輸入等價(jià)表中作為等價(jià)標(biāo)記(d)否則給這一個(gè)像素點(diǎn)分配一新的標(biāo)記并將這一標(biāo)記輸入等價(jià)表3如果需考慮更多的點(diǎn),則回到第二步4在等價(jià)表的每一等價(jià)集中找到最低的標(biāo)記5掃描圖像,用等價(jià)表中的最低標(biāo)記取代每一標(biāo)記353歐拉數(shù)在許多應(yīng)用中,虧格數(shù)(genus)或歐拉數(shù)可作為識(shí)別物體的特征虧格數(shù)定義為連通

25、成份數(shù)減去空洞數(shù),(321)其中,和分別是歐拉數(shù)、連通成份數(shù)與空洞數(shù)這個(gè)式子給出了一個(gè)簡單的拓樸特征,這種拓?fù)涮卣骶哂衅椒€(wěn)、旋轉(zhuǎn)和比例不變特性圖311給出了一些例子及其對應(yīng)的歐拉數(shù)圖311字母“A”、“B”、“”及它們的歐拉數(shù)注意前景用了8連通,而背景用了4連通354區(qū)域邊界連通成份S的邊界是那些屬于S且與S鄰接的點(diǎn)集使用簡單的局部運(yùn)算就可找到邊界點(diǎn)在大多數(shù)應(yīng)用中,我們都想用一特定的順序跟蹤邊界點(diǎn)一般的算法是按順時(shí)針方向跟蹤區(qū)域的所有點(diǎn)此處討論一個(gè)簡單的邊界跟蹤算法假定物體邊界不在圖像的邊界上(即物體完全在圖像內(nèi)部),邊界跟蹤算法先選擇一起始點(diǎn),然后跟蹤邊界直到回到起始點(diǎn)這種算法概括在算法33

26、中這種算法對尺寸大于1個(gè)象素的所有區(qū)域都是有效的用這種算法求區(qū)域8鄰點(diǎn)的邊界如圖312(a)所示為了得到平滑的圖像邊界,可以在檢測和跟蹤圖像邊界后,利用邊界點(diǎn)的方向信息來平滑邊界。顯然,圖像邊界噪聲越大,圖像邊界點(diǎn)變化越劇烈,圖像邊界相鄰點(diǎn)的方向變化數(shù)(與差分鏈碼有一點(diǎn)區(qū)別,鏈碼見第七章)也越大根據(jù)這一特點(diǎn),設(shè)置一個(gè)邊界點(diǎn)方向變化數(shù)閾值,把方向變化數(shù)大于這一閾值的圖像邊界點(diǎn)濾除,由此可得到平滑的圖像邊界。圖3.12(b)所示的是一個(gè)經(jīng)過平滑過的區(qū)域邊界示意圖,其中的方向變化數(shù)閾值為1。注意,由于采用8鄰點(diǎn)邊界跟蹤,因此方向變化數(shù)的最大值為4。如果閾值設(shè)成4,則對原始邊界沒有平滑。邊界跟蹤和平滑

27、常常結(jié)合在一起使用,見計(jì)算機(jī)作業(yè)3.5。圖312邊界跟蹤算法結(jié)果,(a)圖像邊界跟蹤結(jié)果;(b)邊界跟蹤與平滑結(jié)果算法33邊界跟蹤算法=1*GB3從左到右、從上到下掃描圖像,求區(qū)域S的起始點(diǎn).=2*GB3用c表示當(dāng)前邊界上被跟蹤的像素點(diǎn)置,記c左4鄰點(diǎn)為b,=3*GB3按逆時(shí)針方向從b開始將c的8個(gè)8鄰點(diǎn)分別記為,,=4*GB3從b開始,沿逆時(shí)針方向找到第一個(gè),=5*GB3置,=6*GB3重復(fù)步驟=3*GB3、=4*GB3、=5*GB3,直到。355距離測量在許多應(yīng)用中,找到一幅圖像中兩個(gè)像素點(diǎn)或兩個(gè)連通成份之間的距離是很有必要的目前還沒有定義數(shù)字圖像距離的唯一方法,但對所有的像素點(diǎn)p、q和r

28、,任何距離度量都必須滿足下列性質(zhì):1,當(dāng)且僅當(dāng)時(shí),23下面是一些常用的距離函數(shù)歐幾里德距離:(322)街區(qū)距離:(323)棋盤距離:(324)356中軸如果對中像素的所有鄰點(diǎn)有下式成立:(325)則中像素到的距離是局部最大值中所有到的距離是局部最大值的像素點(diǎn)集合稱為對稱軸或中軸,通常記為使用4近鄰的中軸變換的一些例子見圖313圖313b表明少量噪聲會(huì)使中軸變換結(jié)果產(chǎn)生顯著的差異由和中每一點(diǎn)到的距離能重構(gòu)原始像素集是的簡潔表示可用來表示一個(gè)區(qū)域的形狀通過去除中與距離較小的像素點(diǎn),可以生成一個(gè)簡化的集中軸可作為物體的一種簡潔表示但是,二值圖像中的區(qū)域也可用其邊界來表示邊界跟蹤算法可用來獲得表示邊界

29、的序列點(diǎn)在第七章還將討論用鏈碼來簡潔地表示邊界的方法對任意物體,邊界將是區(qū)域的簡潔表示但要明確給定像素點(diǎn)是否在某一區(qū)域內(nèi),中軸則是更好的表示,因?yàn)槭褂弥休S上的像素點(diǎn)和每一個(gè)給定像素點(diǎn)的最大距離圓盤(中軸距離變換),可以很容易地檢測出給定像素是否在中軸定義的區(qū)域中圖313中軸變換舉例357細(xì)化細(xì)化(thinning)是一種圖像處理運(yùn)算,可以把二值圖像區(qū)域縮成線條,以逼近區(qū)域的中心線,也稱之為骨架或核線細(xì)化的目的是減少圖像成份,直到只留下區(qū)域的最基本信息,以便進(jìn)一步分析和識(shí)別雖然細(xì)化可以用在包含任何區(qū)域形狀的二值圖像,但它主要對細(xì)長形(而不是凸圓形或水滴狀)區(qū)域有效細(xì)化一般用于文本分析預(yù)處理階段,

30、以便將文本圖像中線條圖畫或字符筆畫表示成單像素線條細(xì)化要求如下:連通圖像區(qū)域必須細(xì)化成連通線結(jié)構(gòu)細(xì)化結(jié)果最少應(yīng)該是8連通(下面將要解釋)保留近似終止線的位置細(xì)化結(jié)果應(yīng)該近似于中軸線由細(xì)化引起的附加突刺(短分支)應(yīng)該是最小的細(xì)化結(jié)果應(yīng)該保證第一條要求中所定義的連通性,這一點(diǎn)是最基本的要求,它保證了連通線結(jié)構(gòu)的數(shù)量等于原始圖像中連通區(qū)域的數(shù)量第二條要求保證所得到的線條總是含有8連通圖像的最小數(shù)量第三條要求說明終止線位置應(yīng)該保持不變細(xì)化可以通過迭代方式不斷去除邊界點(diǎn)來實(shí)現(xiàn),重要的是在迭代過程中不要去除端點(diǎn)像素,因?yàn)檫@樣不僅會(huì)縮短細(xì)化線,丟掉結(jié)構(gòu)信息,而且不能保持其位置不變第四條要求說明所得線段應(yīng)能最

31、好地逼近原始區(qū)域的中線,如兩個(gè)像素點(diǎn)寬的豎線或水平線的真正中線應(yīng)該位于這兩個(gè)像素之間半個(gè)像素間距的位置在數(shù)字圖像中表示半個(gè)像素間距是不可能的,因此得到的結(jié)果是一條位于原直線一側(cè)的直線第五條要求沒有明確指出噪聲的影響控制到最低程度,因?yàn)榕袛嘣肼暠旧硎且患茈y的事一般不希望原始區(qū)域含有會(huì)引起突刺的隆起,但當(dāng)某些較大隆起是區(qū)域特征時(shí),卻必須識(shí)別它們應(yīng)該指出,某些細(xì)化算法有去除突刺的參數(shù),不過最好將細(xì)化和去除噪聲分開進(jìn)行,這是由于某些情況下不需要的突刺,可能是另一些情況下所需要的短線因此,最好的辦法是先進(jìn)行細(xì)化,然后單獨(dú)去除長度低于某一特定最小值的任何突刺一種常用的細(xì)化手段是在至少鄰域內(nèi)檢查圖像的每一

32、點(diǎn),剝?nèi)^(qū)域邊界一次剝?nèi)ヒ粚訄D像,直至區(qū)域被細(xì)化成一條線這一過程是用迭代法實(shí)現(xiàn)的,如算法4在每次迭代時(shí),每一個(gè)像素點(diǎn)用窗函數(shù)檢查,為了保持連通性或線末端位置,將單像素厚的邊界擦除在圖314中將會(huì)看到,在每次迭代中,值為1的外層區(qū)域就是用這種方式削掉的當(dāng)?shù)Y(jié)果沒有變化時(shí),迭代過程結(jié)束,圖像得到細(xì)化算法近鄰細(xì)化迭代算法對于每一個(gè)像素,如果沒有上近鄰(下近鄰左近鄰右近鄰)不是孤立點(diǎn)或終止線去除該像素點(diǎn)不會(huì)斷開區(qū)域則去除該像素點(diǎn)重復(fù)這一步驟直到?jīng)]有像素點(diǎn)可以去除圖314細(xì)化手寫體“華”的迭代過程(a)原圖像,(b)(f)為五次迭代過程,每次迭代削去一層邊界358擴(kuò)展與收縮圖像中的一個(gè)連通成份可以進(jìn)行

33、全方位的擴(kuò)展(expanding)或收縮(shrinking)如果某一連通成份可以變化,使得一些背景像素點(diǎn)變成1,這一運(yùn)算就稱為擴(kuò)展如果物體像素點(diǎn)全方位地消減或變?yōu)?時(shí),則稱為收縮一種簡單的擴(kuò)展與收縮實(shí)現(xiàn)方法如下:擴(kuò)展:如果近鄰點(diǎn)是1,則將該點(diǎn)從0變?yōu)?收縮:如果近鄰點(diǎn)是0,則將該點(diǎn)從1變?yōu)?這樣,收縮可以看作是擴(kuò)展背景這類運(yùn)算的例子見圖315需要指出,擴(kuò)展與收縮這樣簡單的運(yùn)算可以完成非常有用而又貌似很復(fù)雜的運(yùn)算下面引進(jìn)符號(hào):S擴(kuò)展倍:S收縮倍其中下列性質(zhì)必須滿足:先擴(kuò)展后收縮算法能補(bǔ)上不希望存在的洞,如圖3.15(b)(d)所示;先收縮后擴(kuò)展算法則能去除孤立的噪聲點(diǎn),見圖315(c)(e)請

34、注意,擴(kuò)展與收縮可用來確定孤立組元或簇注意,擴(kuò)展后收縮有效地填滿了空洞卻沒有去除噪聲;相反,收縮后擴(kuò)展能去除噪聲卻沒有填滿空洞在地形圖像處理和膨脹與腐蝕運(yùn)算中,擴(kuò)展與收縮算法的一般形式被廣泛地用于許多任務(wù)中圖315對字母“h”收縮與擴(kuò)展算法實(shí)驗(yàn)結(jié)果(a)原始噪聲圖像;(b)擴(kuò)展運(yùn)算;(c)收縮運(yùn)算;(d)擴(kuò)展后收縮運(yùn)算;(e)收縮后擴(kuò)展運(yùn)算36形態(tài)算子數(shù)學(xué)形態(tài)(morphology)這一名稱是從形狀研究得來的這種方法也說明了一個(gè)事實(shí),即在許多機(jī)器視覺算法設(shè)計(jì)中,根據(jù)形狀來思考問題是最自然,也是最容易的形態(tài)方法有助于進(jìn)行基于形狀或圖形思考形態(tài)方法中圖像信息的基本單元是二值像素任意兩個(gè)二值圖像和的

35、交是一個(gè)二值圖像,記為,即與中皆為1的圖像點(diǎn)p的集合:(326)和B的并,記為,是一個(gè)二值圖像,是或B或兩者中為1的所有圖像點(diǎn)p的集合,用符號(hào)表示為:(327)設(shè)是全值二值圖像(所有的像素值皆為),是二值圖像的補(bǔ)集是中1與0互相交換后的二值圖像,即:(328)標(biāo)號(hào)為與的兩像素點(diǎn)和,其向量和是標(biāo)號(hào)為的像素點(diǎn)向量差是標(biāo)號(hào)為的像素點(diǎn)若是二值圖像,是二值圖像中的一個(gè)像素點(diǎn),則被平移后的二值圖像由下式表示:(329)即二值圖像被一個(gè)像素點(diǎn)平移是指將的原點(diǎn)移到(1)膨脹已知二值圖像,如果是由二值圖像中像素值為1的點(diǎn)平移得到的,則由平移的并稱為被膨脹,即;(330)膨脹具有結(jié)合性、交換性這樣,在進(jìn)行膨脹的步

36、驟序列中,完成運(yùn)算的順序就不重要了這就允許我們將一個(gè)復(fù)雜的形狀拆成幾個(gè)簡單的形狀,然后重新組合成為膨脹序列(2)腐蝕腐蝕是膨脹的相反過程二值圖像經(jīng)二值圖像腐蝕后在點(diǎn)仍為1的充分必要條件是:平移到后,中的1像素也是A中的1像素被腐蝕可用下式表示:(331)二值圖像常常是規(guī)則圖像,是作用于圖像中的一種探針,也稱為結(jié)構(gòu)元腐蝕在許多應(yīng)用中起著十分重要的作用結(jié)構(gòu)元對一幅圖像進(jìn)行腐蝕會(huì)生成一幅包含結(jié)構(gòu)元所有位置的圖像圖316到317是一個(gè)倒T形結(jié)構(gòu)元對一個(gè)簡單物體進(jìn)行膨脹與腐蝕運(yùn)算的示意圖用結(jié)構(gòu)元進(jìn)行膨脹或腐蝕運(yùn)算也可以描述為:結(jié)構(gòu)元的原點(diǎn)像素經(jīng)過待膨脹的二值圖像中所有1像素點(diǎn)時(shí),對應(yīng)結(jié)構(gòu)元所有像素的待膨脹二值圖像像素置為像素;在腐蝕運(yùn)算過程中,結(jié)構(gòu)元的原點(diǎn)像素經(jīng)過待腐蝕的二值圖像中所有1像素點(diǎn)時(shí),如果結(jié)構(gòu)元中有一個(gè)像素沒有對應(yīng)待腐蝕二值圖像的像素,則對應(yīng)結(jié)構(gòu)元原點(diǎn)的待腐蝕二值圖像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論