數(shù)字圖像處理技術(shù)_第1頁
數(shù)字圖像處理技術(shù)_第2頁
數(shù)字圖像處理技術(shù)_第3頁
數(shù)字圖像處理技術(shù)_第4頁
數(shù)字圖像處理技術(shù)_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)字圖像處理技術(shù)一.數(shù)字圖像處理概述數(shù)字圖像處理是指人們?yōu)榱双@得一定的預(yù)期結(jié)果和相關(guān)數(shù)據(jù)利用計算機處理系統(tǒng)對獲得的數(shù)字圖像進行一系列有目的性的技術(shù)操作。數(shù)字圖像處理技術(shù)最早出現(xiàn)在上個世紀中期,伴隨著計算機的發(fā)展,數(shù)字圖像處理技術(shù)也慢慢地發(fā)展起來。數(shù)字圖像處理首次獲得成功的應(yīng)用是在航空航天領(lǐng)域,即1964年使用計算機對幾千張月球照片使用了圖像處理技術(shù),并成功的繪制了月球表面地圖,取得了數(shù)字圖像處理應(yīng)用中里程碑式的成功。最近幾十年來,科學(xué)技術(shù)的不斷發(fā)展使數(shù)字圖像處理在各領(lǐng)域都得到了更加廣泛的應(yīng)用和關(guān)注。許多學(xué)者在圖像處理的技術(shù)中投入了大量的研究并且取得了豐碩的成果,使數(shù)字圖像處理技術(shù)達到了新的高度

2、,并且發(fā)展迅猛。二.數(shù)字圖象處理研究的內(nèi)容一般的數(shù)字圖像處理的主要目的集中在圖像的存儲和傳輸,提高圖像的質(zhì)量,改善圖像的視覺效果,圖像理解以及模式識別等方面。新世紀以來,信息技術(shù)取得了長足的發(fā)展和進步,小波理論、神經(jīng)元理論、數(shù)字形態(tài)學(xué)以及模糊理論都與數(shù)字處理技術(shù)相結(jié)合,產(chǎn)生了新的圖像處理方法和理論。比如,數(shù)學(xué)形態(tài)學(xué)與神經(jīng)網(wǎng)絡(luò)相結(jié)合用于圖像去噪。這些新的方法和理論都以傳統(tǒng)的數(shù)字圖像處理技術(shù)為依托,在其理論基礎(chǔ)上發(fā)展而來的。數(shù)字圖像處理技術(shù)主要包括:圖像增強圖像增強是數(shù)字圖像處理過程中經(jīng)常采用的一種方法。其目的是改善視覺效果或者便于人和機器對圖像的理解和分析,根據(jù)圖像的特點或存在的問題采取的簡單改

3、善方法或加強特征的措施就稱為圖像增強。圖像恢復(fù)圖像恢復(fù)也稱為圖像還原,其目的是盡可能的減少或者去除數(shù)字圖像在獲取過程中的降質(zhì),恢復(fù)被退化圖像的本來面貌,從而改善圖像質(zhì)量,以提高視覺觀察效果。從這個意義上看,圖像恢復(fù)和圖像增強的目的是相同的,不同的是圖像恢復(fù)后的圖像可看成時圖像逆退化過程的結(jié)果,而圖像增強不用考慮處理后的圖像是否失真,適應(yīng)人眼視覺和心理即可。圖像變換圖像變換就是把圖像從空域轉(zhuǎn)換到頻域,就是對原圖像函數(shù)尋找一個合適變換的數(shù)學(xué)問題,每個圖像變換方法都存在自己的正交變換集,正是由于各種正交換集的不同而形成不同的變換。圖像變換分為可分離變換和統(tǒng)計變換兩大類。圖像壓縮數(shù)字圖像需要很大的存儲

4、空間,因此無論傳輸或存儲都需要對圖像數(shù)據(jù)進行有效的壓縮,其目的是生成占用較少空間而獲得與原圖十分接近的圖像。圖像分割圖像分割的目的是把一個圖像分解成它的構(gòu)成成分,圖像分割是一個十分困難的過程。圖像分割的方法主要有兩類:一種是假設(shè)圖像各成分的強度值是均勻的,并利用這個特性。另一種方法是尋找圖像成分之間的邊界,利用的是圖像的不均勻性。(6)邊緣檢測邊緣檢測技術(shù)用于檢測圖像中的線狀局部結(jié)構(gòu)。邊緣是圖像中具有不同平均灰度等級的兩個區(qū)域間的邊界,因此,大多數(shù)的檢測技術(shù)應(yīng)用某種形式的梯度算子。圖像邊緣是圖像的基本特征之一,蘊含了圖像豐富的內(nèi)在信息,它廣泛應(yīng)用于圖像分割、圖像分類、圖像配準(zhǔn)和模式識別中。在大

5、多數(shù)的實際應(yīng)用中,邊緣檢測是當(dāng)做一個局部濾波運算完成的。三.數(shù)字圖像處理系統(tǒng)不論是對什么圖像進行數(shù)字處理,它的基本思想和操作方法都是一樣的。數(shù)字圖像處理系統(tǒng)主要由三個基本部件構(gòu)成,分別是計算機(用于處理圖像程序的執(zhí)行和運算)、數(shù)字化設(shè)備(主要用于圖像模式轉(zhuǎn)化)和顯示設(shè)備(用于圖像處理過程中圖像的顯示)。圖像處理過程中按照步驟進行劃分的數(shù)字圖像處理系統(tǒng)如下圖所示:歡迎下載初始人機交互由于數(shù)字圖像處理系統(tǒng)的靈活性和方便性,所以數(shù)字圖像處理已成為圖像處理的主流。常見的數(shù)字圖像處理有:圖像的采集、數(shù)字化、編碼、增強、恢復(fù)、變換、壓縮、存儲、傳輸、分析、識別、分割等。圖像處理的各個內(nèi)容是相互聯(lián)系的,一個

6、實用的圖像處理系統(tǒng)往往結(jié)合幾種圖像處理技術(shù)才能得到所需的結(jié)果,圖象數(shù)字化是將一個圖像變換為適合計算機處理的形式的第一步,圖像編碼可用以傳輸和存儲圖像,圖像增強和復(fù)原可以是圖像處理的最后目的,也可以是為進一步的處理做準(zhǔn)備。通過圖像分割得到的圖像特征可以作為最后結(jié)果,也可以作為下一步圖像分析和識別的基礎(chǔ)。四.數(shù)字圖像處理技術(shù)1 .圖像數(shù)字化圖像數(shù)字化是計算機處理圖像之前的基本步驟,目的是把真實的圖像轉(zhuǎn)變成計算機能夠接受的存儲格式,數(shù)字化過程分為采樣和量化兩個步驟。圖像在某個空間上的離散化狀態(tài)稱為采樣,即用空間上部分點的灰度值來表示圖像,這些點稱為樣點。采樣的實質(zhì)就是要用多少點來描述一幅圖像,采樣結(jié)

7、果質(zhì)量的高低用圖像分辨率來衡量。采樣方法可分為兩種:點陣采樣(直接對表示圖像的二維函數(shù)值進行采樣)和正交系數(shù)采樣(對圖像函數(shù)進行正交變換,用其變換系數(shù)作為采樣值)。量化是指要使用多大范圍的數(shù)值來表示圖像采樣后的每個點,這個數(shù)值范圍包括了圖像上所能使用的顏色總數(shù)。量化的結(jié)果是圖像能夠容納的顏色總數(shù)。所以,量化位數(shù)越大,表示圖像可以擁有的顏色越多,可以產(chǎn)生更為細致的圖像效果。歡迎下載圖像經(jīng)過采樣和量化后才能產(chǎn)生一張計算機能夠處理的數(shù)字化圖像,不僅可減少計算量,而且可獲得更有效的處理。2 .圖像類型轉(zhuǎn)換數(shù)字圖像存在著很多不同的類型,在處理圖像前,有時必須轉(zhuǎn)換成所需類型或者處理技術(shù)所支持的圖像類型,這

8、里介紹圖像類型之間的相互轉(zhuǎn)換的實現(xiàn)。2.1. 圖像類型數(shù)字圖像類型主要有以下幾種:索引圖像索引圖像是一種把像素值直接作為RGB調(diào)色板下標(biāo)的圖像?;叶葓D像灰度圖像就是只有強度信息,在灰度圖像中,像素灰度級用8bit表示。由于灰度圖像中每個像素都是介于黑色和白色之間的256種灰度中的一種,所以灰度圖像是沒有顏色信息的圖像。(3) RGB圖像RGB圖像又稱為真彩色圖像,它利用R(red)、G(green)、B(blue)3個分量表示一個像素的顏色,用R、G、B這3種不同的顏色可以合成出任意顏色。二值圖像表示二值圖像的二維矩陣僅由0、1組成。二值圖像可看成是一個僅包括黑和白的特殊灰度圖像,亦可看成是僅

9、有2種顏色的索引圖像。多幀圖像多幀圖像是一種包含多幅圖像或幀的圖像文件,又稱為多頁圖像或圖像序列,它主要用于對時間或場景上相關(guān)圖像合集進行操作的場合,例如電影幀。2.2. 圖像類型之間的相互轉(zhuǎn)換圖像類型的相互轉(zhuǎn)換有很多種,灰度-二值、RGB-灰度、灰度-索引、二值-索引、索引-RGB等圖像類型的相互轉(zhuǎn)換的實現(xiàn)主要是利用MATLAB提供的圖像類型轉(zhuǎn)換函數(shù)。假定B為轉(zhuǎn)換后輸出圖像類型,A為輸入圖像類型,下面列舉幾種利用MATALB實現(xiàn)的圖像類型轉(zhuǎn)換:(1)灰度-二值:利用dither函數(shù)來實現(xiàn),這里用到的是抖動法,B=dither(A)。RGB-灰度:利用rgb2gray函數(shù)實現(xiàn),B=rgb2gr

10、ay(A)。歡迎下載4灰度-索引:利用gray2ind函數(shù)實現(xiàn),B,map=gray2ind(A,n),按照指定的灰度級數(shù)n和顏色圖map進行轉(zhuǎn)換。二值-索引:轉(zhuǎn)換的實現(xiàn)與灰度-索引的轉(zhuǎn)換相同,使用同一個調(diào)用函數(shù),在這里n表示的是指定顏色圖map的顏色種類。索引-RGB:利用ind2rgb函數(shù)實現(xiàn),B=ind2rgb(A,map),將矩陣A和對應(yīng)的顏色圖map轉(zhuǎn)換成RGB圖像。3 .圖像變換由于圖像陣列很大,直接在空間域中進行處理,涉及計算量很大。因此,往往采用各種圖像變換的方法,將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理。圖像變換分為可分離變換和統(tǒng)計變換兩大類,

11、可分離變換包括傅里葉變換、離散余弦變換、哈達瑪變換、沃爾什變換和哈爾變換等等;統(tǒng)計變換主要是霍特林變換。下面主要介紹離散余弦變換和小波變換的基本原理。離散余弦變換離散余弦變換(DCT)是數(shù)碼率壓縮需要常用的一個變換編碼方法。任何連續(xù)的實對稱函數(shù)的傅里葉變換中只含余弦項,因此余弦變換與傅里葉變換一樣有明確的物理意義。DCT是先將整體圖像分成N*N像素塊,然后對N*N像素塊逐一進行DCT變換。由于大多數(shù)圖像的高頻分量較小,相應(yīng)于圖像高頻分量的系數(shù)經(jīng)常為零,加上人眼對高頻成分的失真不太敏感,所以可用更粗的量化。因此,傳送變換系數(shù)的數(shù)碼率要大大小于傳送圖像像素所用的數(shù)碼率。到達接收端后通過反離散余弦變

12、換回到樣值,雖然會有一定的失真,但人眼是可以接受的。a.一維DCT的變換核定義為g(x,u)c2C(u)N(2x1)u式中,ux=0,1,2,,N1;C(u),2一維DCT定義如下:設(shè)f(x)|x=0,1,,N-1為離散的信號列2NL、(2x1)uF(u)Qu)Nx0f(x)cosf歡迎下載式中,u,x=0,1,2,,N1。將變換式展開整理后,可以寫成矩陣的形式,即11/2N)cos(3/2N)F=Gf1cos(2N1)/2N)cos(2N1)/2N)1/-N2/Ncos(G2/Ncos(2/Ncos(N1)/2N)cos(N1)(3/2N)cos(N1)(2N1)/2N)/2N)cos(6/

13、2N)b.二維離散余弦變換考慮到兩個變量,很容易將一維DCT的定義推廣到二維DCT。其正變換核為:g(x,y,u,v)C(u)C(v)cos(2x1)u2Mcos(2y1)v2N式中,C(u)和C(v)的定義同前面;x,u=0,1,2,,M-1;y,v=0,1,2,N1。二維DCT定義如下:設(shè)f(x,y)為MXN的數(shù)字圖像矩陣,則2M1N1HU"),MNx0y0f(x,y)C(u)aV)8s(2x1)u(2y1)vcos2M2N式中:x,u=0,1,2,,M1;y,v=0,1,2,,N1。二tDCT也可用兩次一維DCT來完成。小波變換小波變換是一種窗口大小固定不變,但其形狀可以改變的

14、局部化分析方法。小波變換在信號的高頻部分可以取得較好的時間分辨率;在信號的低頻部分可以取得較好的頻率分辨率,從而能有效地從信號中提取信息。a.連續(xù)小波變換(CWT)設(shè)L2L1且?00,則下面的函數(shù)族a,b,2tbCa,btaa0a,叫小波分析或連續(xù)小波,叫基本小波或小波。若是窗函數(shù),就叫為窗口小波函數(shù),一般我們包假定為窗口小波函數(shù)。式中,a稱為尺度參數(shù),b稱為平移參數(shù)歡迎下載維連續(xù)小波變換:設(shè)是基本小波,a,b是其生成的連續(xù)小波,對fL2,信號f的內(nèi)積形式連續(xù)小波變換定義為bdt1Wfa,bf,a,b)a2ftRb.離散小波變換(DWT)離散小波變換針對尺度參數(shù)a,平移參數(shù)b進行離散化,最常用

15、的是二進制動態(tài)采樣網(wǎng)絡(luò),每個網(wǎng)格點對應(yīng)的尺度為2j,平移為2jk,即:小2j/2(2jtk),j,kZ該離散化小波稱為二進制小波,二進制小波對信號的分析具有變焦距的作用。4 .圖像預(yù)處理圖像預(yù)處理的目的是去除干擾、噪聲及差異,將原始圖像變成適于計算機進行特征提取的形式,它包括圖像的變換、增強和濾波等。4.1. 圖像壓縮編碼圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量,以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進行。編碼是壓縮技術(shù)中最重要的方法,編碼的目的是壓縮圖像的信息量(但圖像質(zhì)量幾乎不變),以滿足傳輸和存儲的要求。為此,可以采用模擬

16、處理技術(shù),再通過模-數(shù)轉(zhuǎn)換得到編碼,不過多數(shù)是采用數(shù)字編碼技術(shù),其編碼可以對圖像逐點進行加工也可以對圖像施加某種變換或基于區(qū)域、特征進行編碼。首先,對經(jīng)過高精度模-數(shù)變換的原始數(shù)字圖像進行去相關(guān)處理,去除信息的冗余度;然后,根據(jù)一定的允許失真要求,對去相關(guān)后的信號編碼即重新碼化。一般用線性預(yù)測和正交變換進行去相關(guān)處理;與之相對應(yīng),圖像編碼方案也分成預(yù)測編碼和變換域編碼兩大類。預(yù)測編碼利用線性預(yù)測逐個對圖像信息樣本去相關(guān)。對某個像素S0來說,它用鄰近一些像素亮度的加權(quán)和(線性組合)作為估值,對S0進行預(yù)測。S0與它的差值e(u)就是預(yù)測誤差。由于相鄰像素與S0間存在相關(guān)性,差值的統(tǒng)計平均能量就變

17、得很小。因此,只需用少量數(shù)碼就可以實現(xiàn)差值圖像的傳輸。變換域編碼用一維、二維或三維正交變換對一維n、二維nxn、三維nXn歡迎下載xn塊中的圖像樣本的集合去相關(guān),得到能量分布比較集中的變換域;在再碼化時,根據(jù)變換域中變換系數(shù)能量大小分配數(shù)碼,就能壓縮頻帶。最常用的正交變換是離散余弦變換(DCT),n值一般選為8或16。三維正交變換同時去除了三維方向的相關(guān)性,它可以壓縮到平均每樣本1比特。4.2. 彩色圖像灰度處理由于彩色圖像存儲空間較大,因此,在對圖像進行識別等處理過程中,需要將彩色圖像轉(zhuǎn)換為灰度圖像,以加快后續(xù)工作的處理速度。將彩色圖像轉(zhuǎn)換為灰度圖像的過程叫做灰度化處理,在MATLAB中將彩

18、色圖像轉(zhuǎn)換為灰色圖像的實現(xiàn)語句為B=rgb2gray(A)。4.3. 圖像去噪數(shù)字圖像在數(shù)字化和傳輸過程中常受到成像設(shè)備與外部環(huán)境噪聲干擾等影響,減少數(shù)字圖像中噪聲的過程稱為圖像去噪。典型的圖像去噪主要有以下幾種方法:中值濾波、均值濾波、灰度形態(tài)學(xué)濾波、小波變換、高斯低通濾波和統(tǒng)計濾波等。下面主要對中值濾波、均值濾波、灰度形態(tài)學(xué)濾波的算法原理做以說明。中值濾波的主要原理是:首先確定一個以某個像素為中心點的窗口,然后將窗口中的各個像素的灰度值按照大小進行排序,取其中間值作為中心點像素灰度的新值。中值濾波對異常值(與周圍像素灰度值差別較大的像素的值)的敏感性比均值濾波小,它可以在不減小圖像對比度的

19、情況下剔除這些異常值,使圖像產(chǎn)生較少的模糊。因為它能夠有效地去除尖峰噪聲,還能對邊緣起到很好的保護作用。均值濾波是對圖像進行局部運算,每個像素信用其局部領(lǐng)域內(nèi)所有值的均值代替。均值濾波可以消除圖像噪聲等高頻成分,但同時會導(dǎo)致圖像細節(jié)損失,圖像的模糊程度會更大,為了克服這個缺點,采用閥值法減少模糊效應(yīng)?;叶刃螒B(tài)學(xué)濾波是一種非線性濾波方法,它有四種基礎(chǔ)操作:腐蝕、膨脹、開操作和閉操作。灰度形態(tài)膨脹和腐蝕是以結(jié)構(gòu)元素為模板,分別搜尋圖像在結(jié)構(gòu)基元大小范圍內(nèi)的灰度和的極大值和灰度差的極小值,開運算是采用相同的結(jié)構(gòu)元先做腐蝕再做膨脹的迭代運算,閉運算是采用相同的結(jié)構(gòu)元先做膨脹再做腐蝕的迭代運算,開閉運算

20、的基本作用是對圖像進行平滑處理。形態(tài)學(xué)濾波能夠在一次性濾波的同時,保持圖像結(jié)構(gòu)不被鈍化。歡迎下載4.4. 圖像增強圖像增強主要是指利用各種數(shù)學(xué)方法和變換手段提高圖像中人們感興趣部分的清晰度,突出一幅圖像中的某些信息,同時削弱另一些無用信息,包括圖像灰度修正、噪聲去除、圖像平滑、腐蝕、銳化、圖像邊緣增強等。根據(jù)圖像增強處理過程所在的空間不同,可分為基于空間域的增強方法和基于頻率域的增強方法兩類,前者直接在圖像所在的二維空間進行處理,即直接對每一像素的灰度值進行處理;后者則是首先經(jīng)過傅立葉變換將圖像從空間域變換到頻率域,然后在頻率域?qū)︻l譜進行操作和處理,再將其反變換到空間域,從而得到增強后的圖像。

21、如下圖所示:點運算灰度變換增強圖像增強空域方法空域濾波直方圖增強圖像平滑圖像銳化直方圖均衡化直方圖規(guī)定化噪聲消除法領(lǐng)域平均法中值濾波法梯度倒數(shù)加權(quán)選擇式模板平滑梯度法拉普拉斯算子高斯-拉普拉斯算子線性灰度增強分段線性灰度增強非線性灰度增強模板匹配法統(tǒng)計差值法頻域方法低通濾波高通濾波帶通-帶阻濾波同態(tài)濾波彩色圖像真彩色圖像假彩色圖像上述圖像增強方法中,灰度變換是針對圖像某一部分或整幅圖像曝光不足而使用的灰度級變換,目的是增強圖像灰度對比度;而直方圖修正則是通過變換拉開圖像的灰度范圍或使灰度級分布在動態(tài)范圍內(nèi)趨于均勻,從而增強反差,使圖像細節(jié)清晰??沼驗V波的機理是在待處理的圖像中逐點的移動模板,濾

22、波器在該歡迎下載點的響應(yīng)通過事先定義的濾波器的系數(shù)與濾波模板掃描區(qū)域的相應(yīng)像素值關(guān)系來計算,平滑濾波的目的在于消除混雜在圖像中的干擾因素,強化圖像表現(xiàn)特征,銳化濾波的目的在于增強圖像邊緣,對圖像進行識別和處理。由于各種圖像增強算法的特點不同,對圖像增強的側(cè)重點也不同。在對圖像進行處理之前,首先分析不同圖像增強方法的優(yōu)缺點,再對具體圖像問題進行具體分析,然后選擇幾種增強方法結(jié)合使用,也許就可能達到預(yù)期的增強效果。比較典型的圖像增強方法主要有灰度變換、灰度直方圖、圖像平滑和邊緣增強等。4.5. 圖像復(fù)原圖像復(fù)原首先要從分析圖像退化機理著手,用數(shù)學(xué)模型描述圖像的退化過程,然后在退化模型的基礎(chǔ)上,通過

23、求其逆過程的模式計算,從退化圖像中較準(zhǔn)確的求出真實圖像,恢復(fù)圖像和原始信息,模糊或者退化圖像可以通過如下公式來使圖像復(fù)原:g=Hf+n,其中,g為模糊圖像(退化圖像);H為失真算子,也稱為點擴散函數(shù)(PSF);f為原始圖像,n為噪聲。圖像復(fù)原的方法有很多,例如維納濾波、盲解卷積算法和Lucy-Richardson算法。由于維納濾波和Lucy-Richardson都需要確知PSF,因此在圖像的復(fù)原中盲卷積的方法使用比較多,盲卷積恢復(fù)圖像的原理是,首先模擬模糊(退化)圖像,估計出引起模糊(退化)的因素(此因素與原始圖像卷積后導(dǎo)致了圖像了模糊或者退化),該因素可能為gaussianmotion、10

24、g等濾波器,然后初始化此PSF,一般選擇全1數(shù)組作為初始化PSF,利用權(quán)重改善復(fù)原的效果,權(quán)重是一個與輸入圖像大小相同的矩陣,最后利用deconvblind函數(shù)進行圖像復(fù)原。5 .圖像分割圖像分割就是把圖像分成若干個特定的、具有獨特性質(zhì)的區(qū)域,其中每一個區(qū)域都是像素的一個連續(xù)集。它是圖像處理到圖像分析的關(guān)鍵步驟。常用的分割方法主要分為基于區(qū)域的分割方法和基于邊緣的分割方法2類。止匕外,隨著各學(xué)科的發(fā)展出現(xiàn)了一些結(jié)合某種特定理論的分割方法。下面就對常用的幾類分割方法做以說明。5.1. 基于區(qū)域的分割方法10這類方法的基本思想是將圖像分割成若干不重疊的區(qū)域,使各區(qū)域內(nèi)部特征的相似性大于區(qū)域間特征的

25、相似性,各區(qū)域內(nèi)像素都滿足基于灰度、紋理等特征歡迎下載的某種相似性準(zhǔn)則。下面介紹幾種常見的區(qū)域分割法:閾值法閾值法圖像分割方法就是提取目標(biāo)物體與背景在灰度上的差異,把圖像分為具有不同灰度級的目標(biāo)區(qū)域和背景區(qū)域的組合。閾值分割算法主要有兩個步驟:其一,確定最佳分割閾值;其二,將像素灰度值與分割閾值比較,實現(xiàn)區(qū)域的歸屬劃分。其優(yōu)點是計算簡單,不僅壓縮數(shù)據(jù),減少存儲容量,而且能大大簡化其后的分析處理。區(qū)域生長法區(qū)域生長的基本思想是將具有相似性質(zhì)的像素集合起來構(gòu)成區(qū)域。首先對需要分割的區(qū)域找一個種子像素作為生長的起點,將種子像素周圍領(lǐng)域中與它有相同或相似性質(zhì)的像素,根據(jù)某種事先確定的生長或相似準(zhǔn)則來判

26、定,合并到種子像素所在的區(qū)域中,將這些新像素當(dāng)做新的種子像素繼續(xù)進行上面的過程,直到再沒有滿足條件的像素可被包括進來,這樣一個區(qū)域就生成了。區(qū)域生長法的固有缺點是往往會造成過度分割。分裂合并法分裂合并法是一種比較常用的區(qū)域分割方法,它利用了圖像數(shù)據(jù)的金字塔或四叉樹數(shù)據(jù)結(jié)構(gòu)的層次概念,將圖像劃分成一組任意不相交的初始區(qū)域,即可以從圖像的這種金字塔或四叉樹數(shù)據(jù)結(jié)構(gòu)的任一中間層開始,根據(jù)給定的均勻性檢測準(zhǔn)則進行分裂和合并這些區(qū)域,逐步改善區(qū)域劃分的性能,直至最后將圖像分成數(shù)量最少的均勻區(qū)域為止。分裂合并法對分割復(fù)雜的場景圖像比較有效。5.2. 基于邊緣的分割方法邊緣的主要表現(xiàn)為圖像局部特征的不連續(xù)性

27、,該方法首先檢出圖像中局部特性的不連續(xù)性或突變性,然后將它們連成邊界,這些邊界把圖像分成不同的區(qū)域。下面介紹幾種常見的邊緣分割法:微分算子法11圖像中相鄰的不同區(qū)域間總存在邊緣,邊緣處象素的灰度值不連續(xù),這種不連續(xù)性可通過求導(dǎo)數(shù)來檢測到。對于階躍狀邊緣,其位置對應(yīng)一階導(dǎo)數(shù)的極值點,對應(yīng)二階導(dǎo)數(shù)的過零點(零交叉點),因此常用微分算子進行邊緣檢測,它是一種并行邊界技術(shù)。常用的一階微分算子有Roberts、PrewittftSobel算子,二階歡迎下載微分算子有Laplace和Kirsh算子。由于邊緣和噪聲都是灰度不連續(xù)點,在頻域均為高頻分量,直接采用微分運算難以克服噪聲的影響。因此用微分算子檢測邊

28、緣前要對圖像進行平滑濾波。LOG算子和Canny算子是具有平滑功能的二階和一階微分算子,邊緣檢測效果較好。串行邊界技術(shù)串行邊界查找法是先檢測邊緣再串行連接成閉合邊界的方法。這種方法在很大程度上受起始點的影響。圖搜索是其中一種典型的方法,邊界點和邊界段可以用圖結(jié)構(gòu)表示。通過在圖中進行搜索對應(yīng)最小代價的路徑可以找到閉合邊界。它是一種全局的方法,在噪聲較大時效果仍很好,但這種方法比較復(fù)雜,計算量也很大。5.3. 區(qū)域和邊界技術(shù)相結(jié)合的分割方法在實際應(yīng)用中,為發(fā)揮各種方法的優(yōu)勢,克服它們的缺陷以獲得更好的分割效果。經(jīng)常把各種方法結(jié)合起來使用。例如,基于區(qū)域的分割方法往往會造成圖像的過度分割。而單純的基

29、于邊緣檢測方法有時不能提供較好的區(qū)域結(jié)構(gòu)。為此可將基于區(qū)域的方法和邊緣檢測的方法結(jié)合起來解決這個問題。5.4. 基于特定理論的分割方法圖像分割至今尚無通用的自身理論。隨著各學(xué)科許多新理論和新方法的提出,出現(xiàn)了許多與一些特定理論、方法相結(jié)合的圖像分割方法。基于模糊集理論的方法模糊理論具有描述事物不確定性的能力,適合于圖像分割問題。近年來,出現(xiàn)了許多模糊分割技術(shù),在圖像分割中的應(yīng)用日益廣泛。目前,模糊技術(shù)在圖像分割中應(yīng)用的一個顯著特點就是它能和現(xiàn)有的許多圖像分割方法相結(jié)合,形成一系列的集成模糊分割技術(shù),例如模糊聚類、模糊閾值、模糊邊緣檢測技術(shù)等。5.5. 波變換的方法小波變換是近年來得到了廣泛應(yīng)用

30、的數(shù)學(xué)工具。它在時域和頻域都具有良好的局部化性質(zhì),將時域和頻域統(tǒng)一于一體來研究信號。二進小波變換具有檢測二元函數(shù)的局部突變能力,因此可作為圖像邊緣檢測工具。圖像的邊緣出現(xiàn)在圖像局部灰度不連續(xù)處,對應(yīng)于二進小波變換的模極大值點。12基于聚類分析的方法歡迎下載特征空間聚類法進行圖像分割是將圖像空間中的像素用對應(yīng)的特征空間點表示,根據(jù)它們在特征空間的聚集對特征空間進行分割,然后將它們映射回原圖像空間,得到分割結(jié)果。其中,K均值、模糊C均值聚類(FCM)算法是最常用的聚類算法。基于神經(jīng)網(wǎng)絡(luò)的方法神經(jīng)網(wǎng)絡(luò)方法分割圖像的思想是用訓(xùn)練樣本集對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練以確定節(jié)點間的連接和權(quán)值,再用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分割

31、新的圖像數(shù)據(jù)。這種方法需要大量的訓(xùn)練數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)存在巨量的連接,容易引入空間信息。能較好地解決圖像中的噪聲和不均勻問題,選擇何種網(wǎng)絡(luò)結(jié)構(gòu)是這種方法要解決的主要問題?;跀?shù)學(xué)形態(tài)學(xué)的方法它的基本思想是用具有一定形態(tài)的結(jié)構(gòu)元素去量度和提取圖像中的對應(yīng)形狀以達到對圖像分析和識別的目的。6 .圖像描述將圖像分割為區(qū)域后,接下來通常要將分割區(qū)域加以表示與描述,以方便計算機處理。圖像描述也是圖像識別的必要前提。作為最簡單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。7 .圖像識別7.1. 圖像識別內(nèi)容圖像識別是利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標(biāo)和對象。主

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論