數字圖像處理課件(岡薩雷斯第三版)

上傳人：x*** IP屬地：湖南上傳時間：2024-12-29 格式：PPT 頁數：133 大?。?.86MB 積分：20 舉報 版權申訴

已閱讀5頁，還剩128頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

數字圖像處理

DigitalImageProcessing

合肥工業(yè)大學理學院信息與計算科學系二零零九年2021/6/271內容提要八周教學內容依次如下：第1、2章緒論、圖象處理的基本概念。第3、4章空域和頻域變換第5、8章圖象增強和圖象復原。第6章圖象編碼第7、9章圖象分割和形態(tài)學。第10章其他2021/6/272第1章緒論1.1 從圖象到圖像工程圖象和數字圖象圖象技術和圖象工程相關學科和領域1.2 圖象處理和分析圖象處理和分析系統(tǒng)圖象采集、顯示、存儲、通訊、處理和分析模塊圖象處理圖象分析圖象理解抽象程度數據量圖象基礎2021/6/2731.1.1圖象和數字圖象什么是圖象？圖象(image)是泛指照片、動畫等等形成視覺景象的事物。圖象與計算機圖形學中的圖形的區(qū)別是：計算機圖形學是從建立數學模型到生成圖形，而圖象通常是指從外界產生的圖形。客觀世界是三維空間，但一般圖象是二維的。二維圖象在反映三維世界的過程中必然丟失了部分信息。即使是記錄下來的信息也可能有失真，甚至于難以識別物體。因此，需要從圖象中恢復和重建信息，分析和提取圖象的數學模型，以至于形成人們對于圖象記錄下的事物有正確和深刻的認識。這個過程就成為圖象處理過程。1.1從圖象到圖像工程2021/6/274為什么需要數字圖象(digitalimage)？普通圖象包含的信息量巨大，需要使用計算機對圖象進行處理。因此，需要把普通圖象轉變成計算機能處理的數字圖象?，F(xiàn)在的數碼相機可以直接地把視覺圖象變成數字圖象。數字圖象類似于光柵圖形，由有限行和有限列組成。每個基本單元叫做一個象素(pixel)。三維圖象的象素又叫做體素(voxel)。通常的二維數字圖像是一個矩型，可以用一個二維數組I(x,y)來表示，其中x,y是二維空間中的某坐標系的坐標，I(x,y)表示圖像在該點處的灰度值等性質。彩色可以是紅綠藍三個單色的一定灰度值的合成。一般來說，這些坐標和灰度值是實數，不僅依賴于坐標系的選取，而且依賴于灰度值的度量單位。但是，數字計算機只可能表示有限字長的有限個數字。所以必須把灰度值離散化。簡單地說，數字圖象等同于一個整數值的有限矩陣。數字圖像是數字圖像處理和分析的對象。2021/6/275左邊的圖象是圖象處理技術中常用來檢驗計算機算法的實際效果的標準圖象。這幅圖象的名稱是lenna。它是由一組數字組成的。原圖象的寬和高都是256個象素，每象素有八位。它在BMP格式下有約66K字節(jié)的大小。2021/6/276數字圖象處理的簡史數字圖象的產生遠在計算機出現(xiàn)之前。最早有電報傳輸的數字圖象。六、七十年代，隨著計算機硬件的發(fā)展和快速傅立葉變換算法的發(fā)現(xiàn)使得用計算機能夠處理圖象。八十年代開始處理三維圖象，九十年代以來，隨著計算機性能的大幅提高和廣泛使用，圖象處理技術已經涉及社會的各個角落。圖象逐漸在傳播媒體中占據了主導地位，產生的許多的新行業(yè)新商機。未來圖象處理的發(fā)展是不可限量的。數字圖象處理屬于計算機科學，但是它的90%依賴于數學。從這個特點來看，對于本專業(yè)的學生來說，數字圖象處理技術是一個十分理想的發(fā)展方向。1.1.2圖象技術和圖象工程2021/6/277哪些屬于圖象技術？圖象技術是與圖象有關部門的技術的總稱。它是一類綜合技術工程。它包括圖象的采集、獲取、編碼、存儲和傳輸、圖象的生成、顯示和輸出、圖象的變換、增強、恢復和重建、圖象的分割、目標的檢測、表達和描述、特征的提取、圖象的分類、識別、圖象模型的建立和匹配、圖象和場景的理解。狹義的數字圖象處理是指圖象的增強、恢復和重建，操作的對象是圖象的象素，輸出的是圖象。2021/6/278什么是圖像工程？（廣義的數字圖像處理）它是由圖像處理、圖像分析和圖像理解三個系統(tǒng)所組成。圖像處理包括圖像采集和從圖像到圖像的變換，以改善主觀的視覺效果和為圖像分析和圖像理解作初步的處理。圖像分析是從圖像中取出感興趣的數據，以描述圖像中目標的特點。圖像理解是在圖像分析的基礎上研究各目標的性質和相互關系，以得出圖像內容的理解和對原場景的解釋。圖像處理、圖像分析和圖像理解是處在從低到高的三個不同的抽象程度上的過程。本課程著重于圖像處理和分析系統(tǒng)。圖像處理圖像理解圖像分析抽象程度數據量圖像數據符號2021/6/2791.1.3相關學科和領域圖象工程是一門系統(tǒng)地研究各種圖象理論、技術和應用的交叉學科。從它的研究方法看，它與數學、物理學、生物學、心理學、電子學、計算機科學可以互相借鑒，從它的研究范圍看，它與模式識別、計算機視覺、計算機圖形學等學科交叉。2021/6/27101.2圖象處理和分析1.2.1圖象處理和分析系統(tǒng) 圖像處理和分析系統(tǒng)包括如下模塊：圖像采集模塊、圖像顯示模塊、圖像存儲模塊、圖像通訊模塊和圖像處理和分析模塊。1.2.2模塊圖象采集模塊 CCD圖象顯示模塊 CRT，LCD圖象存儲模塊內存、幀緩存、硬盤圖象通訊模塊 LAN、WAN圖象處理和分析模塊2021/6/2711圖象文件的數據結構

一個完整的圖象處理程序的基本功能有:打開圖象文件、顯示圖象、對圖象文件進行指定的處理、存儲圖象文件。由于圖象文件比較大，通常需要在儲存前進行壓縮。所以打開和存儲圖象文件涉及到文件的格式。圖象文件的格式圖像文件指包含圖像數據的文件。文件內除圖像數據本身以外，一般還有圖像的描述信息，以便圖像的讀取和顯示。表示圖像常用矢量形式或光柵形式。矢量形式中圖像用一系列線段或線段的組合體來表示，線段的灰度可以不同，組合體的各部分可用不同的灰度來填充。矢量形式文件中有一系列的命令和數據，執(zhí)行的結果是畫出圖像來。2021/6/2712

圖像數據文件主要是用光柵形式,即圖像是一些圖像點的集合，比較適合變化復雜的圖像。它的主要缺點是缺少對象和像素點之間的聯(lián)系,且在伸縮圖像的過程中圖像會改變。例如，常見的圖象文件類型有bmp,jpg等等。圖象處理的程序必須考慮圖象文件的格式，否則無法正確地打開和保存圖象文件。

pgm格式美國的許多大學用pgm格式，避免使用壓縮文件格式，對初學者來說是很方便的。下面是一幅該格式的圖象。2021/6/2713這是一幅pgm格式的彩色照片2021/6/2714這是pgm格式彩色照片16進位制部分代碼。原代碼是不分行的字符串。這里寫成分行的形式(注意：LF=換行；SP=空格；#=注解行)：0x50

0x35

0x0A表示P5

(LF);0x230x200x200x49…0x0A表示#(SP)(SP)I…(LF);0x360x340x300x200x340x380x300x0A表示640(SP)480(LF);0x320x350x35

0x0A表示255(LF)0x270x27…表示23,23,…(像素灰度值)……………………………………2021/6/27152021/6/2716這幅圖象文件的解碼:P5#ImportedfromSUNimage:LEGGO_HOUSE_1.0.intensity6404802550x270x270x270x270x270x270x270x270x270x270x270x270x270x260x270x270x270x280x270x270x270x270x270x270x270x270x270x270x270x270x270x270x270x270x270x260x270x260x270x280x270x270x260x270x270x270x280x270x270x270x270x270x270x280x280x270x280x290x280x270x280x280x280x270x270x270x270x270x270x270x280x270x280x280x280x280x280x280x280x280x280x290x290x290x280x280x280x28………………...2021/6/2717

pgm格式的數字圖像文件是美國計算機科學專業(yè)圖像處理教學和研究的常用格式，雖然文件體積比較大，但是像素直接與數字相聯(lián)系，易于檢查和修改。它由兩部分組成：1、第一部分是文件頭，它由若干行組成：第一行說明文件的類型，例如，P2（表示黑白圖像）或P5（表示彩色圖像）；接著是以#開頭的注解行，在軟件打開圖像時不執(zhí)行注解行，可以沒有注解行，或有多個以#開頭的注解行；注解行后的第一行指定數字圖像的大小，例如，640480（寬640個像素，高480個像素，中間有一個空格）；接下來的一行指定圖像的灰度等級，例如，255。各行的結尾沒有標點符號。2、第二部分是不再分段的位圖列陣，例如，在256灰度的場合，P2類型是一個像素一個字節(jié)（8位），P5類型是一個像素三個字節(jié)（R、G、B各8位）。2021/6/2718bmp(Bitmap)格式BMP(Bitmap-File)圖形文件是Windows采用的圖形文件格式，在Windows環(huán)境下運行的所有圖象處理軟件都支持BMP圖象文件格式。Windows系統(tǒng)內部各圖像繪制操作都是以BMP為基礎的。Windows3.0以前的BMP圖文件格式與顯示設備有關，因此把這種BMP圖象文件格式稱為設備相關位圖DDB(device-dependentbitmap)文件格式。Windows3.0以后的BMP圖象文件與顯示設備無關，因此把這種BMP圖象文件格式稱為設備無關位圖DIB(device-independentbitmap)格式（注：Windows3.0以后，在系統(tǒng)中仍然存在DDB位圖，象BitBlt()這種函數就是基于DDB位圖的。2021/6/2719

bmp(Bitmap)格式

bmp格式又稱位圖文件。由三部分組成：位圖文件頭、位圖信息和位圖列陣。位圖文件頭有54個字節(jié)長，它給出文件的類型、大小和位圖的起始位置等。位圖信息給出圖像的長、寬和每個像素的位數（1，4，8，24）、壓縮方法、目標設備的水平和垂直分辨率。位圖列陣給出原始像素的值。另外，有一些常用的壓縮文件格式，如：GIF(8位)、TIFF、JPEG等等。下面是一個Matlab程序2021/6/2720%打開蝴蝶圖象,進行Fourier變換h=imread('butterfly.jpg'); %openanimagefigure; imshow(h);%因為圖像的格式uint8不能做加減法,%所以需要把格式uint8變成格式doubleh=double(h);[m,n,p]=size(h);hf=fftshift(fft2(h)); %2DFourier變換,得到2D復數值圖像hfa=log(abs(hf)); %模的圖像,用log來調整灰度的對比度%求出模的灰度最大值，從而把其灰度的值域變?yōu)閇0，255]m=max(max(max(hfa)));hfa=hfa*255/m;figure;imshow(uint8(hfa));Imwrite(uint8(hfa),’butterfly_fft.jpg’,’jpg’);2021/6/27212021/6/2722補充：圖象和視覺基礎2.1概論和綜述2.2人眼與亮度視覺2.3顏色視覺2.4光度學和成象模型2.5成象變換2.6采樣和量化2.7象素間聯(lián)系2.8算術和邏輯運算2.9坐標變換2021/6/2723第2章圖象和視覺基礎2.1概論和綜述該基礎包括視覺基礎、成像基礎和圖像基礎三部分：視覺基礎（人眼與亮度視覺，顏色視覺）成像基礎（模型、幾何和采樣量化）圖像基礎（像素間聯(lián)系、圖像運算和圖像坐標變換）注意：視覺：指光對感官的刺激和視覺系統(tǒng)的感覺。視知覺：指如何通過視覺形成關于外部世界的表象。2021/6/27242.2人眼與亮度視覺2.2.1人眼成象人的眼球是一個復雜的視覺器官。眼球的前部有晶狀體，相當于照相機的鏡頭。眼球內側的后部有視網膜。視網膜表面分布著兩種感光細胞：錐細胞和柱細胞。眼內有六、七百萬的錐細胞，它們對明亮的光和顏色很敏感。人眼借助于錐細胞來區(qū)分細節(jié)，因為每個錐細胞都連到神經末梢。錐細胞的視覺稱為適亮視覺。眼內有75萬到150萬柱細胞。它們分布面大，且?guī)讉€柱細胞連到一個神經末稍。分辨率低，主要提供整體視覺印象。雖然它們對顏色不敏感，但是對弱光較敏感。柱細胞的視覺稱為適暗視覺。視網膜的中心是中央凹，面積約1.5

1.5mm2，錐細胞的密度達到150000個/mm2,是眼內最敏感的區(qū)域。2021/6/2725人眼的構造2021/6/2726人眼成像錐細胞和柱細胞的密度和分布2021/6/27272.2.2亮度適應和區(qū)分主觀亮度和主觀適應性由于數字圖象以客觀亮度顯示圖象，人眼以主觀亮度感受取得視覺，所以人眼的亮度適應性影響了圖象處理的結果。人眼的視覺系統(tǒng)能適應的光的亮度等級從可以看見的昏暗到眩目相差能達到1010等級。但是人眼并不能同時在這么大的范圍內看清物體，而只能在同一時間內適應一個小的亮度變化范圍（106等級）。2021/6/2728在一定條件下，一個視覺系統(tǒng)當前的敏感度叫做亮度適應級。這個敏感度是用實驗來驗證的。在實驗中，逐漸增加光照射的強度I，改變量為

I，達到多個觀察者能感知的程度，當有一半的人感知增加時的

I/I成為Weberratio,作為視覺系統(tǒng)當前的敏感度。在很強的光下，需要改變較強的光照射才能使多個觀察者感知；相反，在某強度光照下，些微的光強度變換就會使人感知。2021/6/2729人眼的主觀亮度是非線性的，例如Mach帶2021/6/2730人眼的光學錯覺2021/6/27312.3顏色視覺2021/6/2732根據人眼的結構，所有的顏色是三種基本顏色的不同組合．2021/6/2733所有的顏色可以看作是三種基本顏色的迭加，也可以看作三種補色（從白色中除去某種顏色）的迭加2021/6/2734顏色的三種基本特征：灰度、色調和飽和度，后兩者又稱色度?；叶扰c物體的反射率成正比；色調與光照中主要光譜有關；飽和度與色調的純度有關。組成顏色C的三個刺激量X，Y，Z所占的百分比數為x,y,zx=X/(X+Y+Z),y=Y/(X+Y+Z),z=1–x–y.2021/6/27352021/6/27362.5成像變換設W(X,Y,Z)是3D空間中的任意點的坐標,Z>.根據相似三角形的性質，x/=X/(-Z), y/=Y/(-Z),x=X/(-Z), y=Y/(-Z)利用點wh齊次坐標(kX,kY,kZ,k),令

1000 P=0100 0010 00-1/

1ch=Pwh=P·(kX,kY,kZ,k)=(kX,kY,kZ,-(k/)Z+k）=(x,y,z,1)x=kX/(-k/Z+k)=X/(-Z),同理求得y和zxZ

(X,Y,Z)02021/6/2737wh=P-1ch 1000 P-1=0100 0010 001/

1wh=P-1·

(x,y,0,1)=(x,y,0,1).其中沒有坐標分量z，所以無法表示3D的點．如果能知道額外的深度信息z,那么就能表示3D的點，(X,Y,Z,1)=wh=P-1(x,y,z,1)=(x,y,z,z/+1).其中，X=x/(+z),Y=y/(+z),Z=z/(+z)2021/6/27382.6采樣和量化

一幅圖像需要經過離散化成為數字圖像后才能被計算機處理。圖像的空間坐標的離散化叫做空間采樣,灰度的離散化叫做灰度量化。采樣分為均勻采樣和量化和非均勻采樣和量化。假設圖像是一個長方形。在平面上取MN個大小相同的網格，并把灰度分成G個等級。取各網格中的某點處的灰度值最接近的整數作為該網格的灰度。通常，取M=2m,N=2n和G=2k。則存儲一幅圖像的需要的位數等于b=MNk。例如，一幅128128、64個灰度等級的圖像需要220位，512512、256個灰度等級的圖像需要226位。采樣的個數和灰度等級的選取與分辨率和儲存的能力兩者有關，需要綜合考慮。例如：圖像空間分辨率變化產生的效果。圖像灰度分辨率變化產生的效果。圖像空間和灰度分辨率同時變化產生的效果。2021/6/2739圖像空間分辨率變化產生的效果2021/6/2740圖像灰度分辨率變化產生的效果2021/6/2741圖像灰度分辨率變化產生的效果（2）2021/6/2742非均勻采樣和量化

對給定的空間分辨率，圖像的質量可以根據圖像特性利用自適應的采樣過程來改進。例如，在灰度變化顯著的有很多細節(jié)的區(qū)域應當采用較密的采樣。又例如，可以計算所有灰度值出現(xiàn)的頻率。若某范圍內的灰度值出現(xiàn)頻繁，而在其他范圍內灰度值出現(xiàn)較稀，則在該范圍內量化灰度就要較密，在其他范圍內較稀。2021/6/27432.7像素間聯(lián)系像素有四鄰域N4和八鄰域N8。像素的連通有4-連接、8-連接和混合連接(m-連接)。稱點r和p是混合連接，如果r和p是4-連接的，或者r與p是8-連通的但不是4-連通的?；旌线B接避免了8-連通所產生的歧義。2021/6/2744等價關系和傳遞閉包定義：在集合A上的二元關系R,記為aRb，a,bA,稱為等價關系，如果R具有如下性質：自反性對每個a,成立aRa; 對稱性aRb當且僅當bRa; 傳遞性aRb和bRc蘊涵著aRc?？梢杂沘Rb為(a,b).例如用R表示4-連接。則自反性蘊涵對角元都是一。例如R={(a,a),(a,b),(b,d),(d,b),(c,e)}可以得到二值矩陣的表示。由傳遞性，(a,b)和(b,d)蘊涵(a,d)。包涵這些隱含關系的集合稱為傳遞閉包記為R+ abcde 11000 a 00010 b R=00001 c 01000 d 00000 e2021/6/2745 abcde 11010 a 01010 b R+=00001 c 01010 d 00000 e例如R={(a,a),(a,b),(b,d),(d,b),(c,e)}時，R+=R

{(a,d),(b,b),(d,d)}一般地說，R+=R+RR+R(RR)+…+Rn．2021/6/2746距離量度

設有三個像素p,q,r，坐標分別為(x,y),(s,t),(u,v)。D是距離，滿足：（1）D(p,q)0,D(p,q)=0當且僅當p=q。（2）D(p,q)=D(q,p)．（3）D(p,r)D(o,q)+D(q,r)歐氏空間距離ＤE(p,q)=((x-s)2+(y-t)2)1/24-連通空間距離D4(p,q)=|x-s|+|y-t|8-連通空間距離D4(p,q)=max{|x-s|,|y-t|}m-連通空間距離Dm(p,q)與路徑有關。2021/6/27472.8算術和邏輯運算圖像的四則運算中是逐個像點進行的。加法常用來去除噪音，減法常用在醫(yī)學成像，乘除法常用來矯正圖像中的灰度陰影。常用的邏輯運算有（1）與（AND）（2）或（OR）（3）補（NOT)

以上運算既可用于整幅圖像的運算，也可以用于鄰域運算。例如，一點及其８-鄰域的算術平均作為該點的新值?，F(xiàn)在常用算術和邏輯運算的單元ALU來加速運算。2021/6/27482.9

坐標變換請復習已學過的教材．2021/6/2749第3章象素空間關系圖象是由象素組成。圖象以象素為單位建立坐標系。通常是x軸向左，y軸向下。圖象的坐標變換就是象素的坐標變換。所謂空間變換就是把象素從一個空間變換到另一個空間的坐標變換。坐標變換的一個應用是對圖象的幾何失真進行校正。2021/6/2750一個象素的鄰域是指該象素周圍的象素集合。一個象素p的周圍有八個象素，它們共同組成了該象素的8-鄰域N8(p)。一個象素與上下左右的四個象素組成了4-鄰域N4(p)。一個象素與四個角上的象素組成了對角鄰域ND(p)。同類灰度的象素間的鄰接，連接和連通問題：兩個象素彼此落在對方的4-鄰域內，稱為4-連接兩個象素彼此落在對方的8-鄰域內，稱為8-連接如果兩個象素或者是4-連接，或者不是4-連接但落在對方的對角鄰域ND(p)內，那么稱為混合連接（m-連接）。3.1象素間聯(lián)系2021/6/2751混合連接可以避免8-連接造成的多路問題。兩個象素集合的連通是指它們在指定的鄰域內有一條通路。例如圖中的左上角和右下角按4-連接是不連通的；按m-連接是連通的；按8-連接是連通的,但是道路不是唯一的。兩個象素p和q之間的距離即滿足下列三個條件的一個函數D：

D(p,q)0，當且僅當p=q時D(p,q)=0. D(p,q)=D(q,p), D(p,q)+D(q,r)D(p,r).2021/6/2752DE(p,q)表示p=(x_p,y_p)和q=(x_q,y_q)之間的歐氏距離

DE(p,q)=[(x_p–x_q)2+(y_p–y_q)2]1/2D4(p,q)表示1-范數下的距離

D4(p,q)=|x_p–x_q|+

|y_p–y_q|.D8(p,q)表示

-范數下的距離

D4(p,q)=max{|x_p–x_q|,|y_p–y_q|}.10111.411.41.41.4011112222011111111111111111111111最右邊的圖中象素到邊界的距離是多少？各象素到中心的距離D：2021/6/27533.2基本坐標變換在計算機圖形學中已經講過?；镜淖鴺俗儞Q是平移、伸縮、旋轉。

復雜坐標變換是它們的級連。錯切是三種基本變換的乘積嗎？2021/6/27543.3形態(tài)變換3.3.1變換體系1、形態(tài)變換及其分類形態(tài)變換是將平面區(qū)域映射到平面區(qū)域的變換。形態(tài)變換表、規(guī)則解析式非連續(xù)連續(xù)不光滑光滑線性非線性仿射變換歐氏變換剛體變換相似變換平移變換旋轉變換放縮變換2021/6/2755點p到q的投影變換可以寫成其中A是22矩陣。投影變換可以寫成非奇異三階齊次矩陣的形式。注意：一般地說，投影是二階的非線性變換，但是都可以寫成三階矩陣的齊次形式。

仿射變換是一個非奇異的線性變換接上一個平移變換：或寫成2021/6/2756仿射變換的性質

仿射變換把原點映射為(t1,t2,1)，一般不再是原點。所以一般的仿射變換不是線性變換。如果做一個平移變換，使上面公式中的t=0，那么仿射變換就是任何的非奇異矩陣A。另一方面，仿射變換的形式也說明它不包含投視投影。因此，它是三種基本變換的連乘，而具有如下的性質。（1）仿射變換將有限點映射成有限點。（2）仿射變換將直線變成直線。（3）仿射變換將平行直線映射成平行直線。（4）當區(qū)域P和Q是沒有退化的三角形時，有唯一的仿射變換A將P變成Q。2021/6/2757特殊的仿射變換：相似變換當上述仿射變換中A=sR時稱為相似變換，其中，s是實數，R是旋轉變換。當s=1和R為正交矩陣時上述仿射變換稱為剛體變換，屬于等距變換。當s=1和R為正交矩陣時上述仿射變換稱為歐氏變換。仿射變換的另一種說法：一個經過平移的非奇異線性變換。2021/6/27583.4幾何失真校正采樣的過程中圖象中象素之間的空間位置可能發(fā)生變化，產生幾何失真。我們需要校正幾何失真。設原圖象在(x,y)處的灰度為f(x,y)，失真后變成在(x

)處的灰度g(x

)。因此，校正幾何失真包括兩部分：（1）空間變換把點(x

)恢復到位置(x,y)（2）灰度插值把灰度g(x

)恢復到f(x,y)。2021/6/2759空間變換設點(x

)與(x,y)的關系是最簡單的情況是線性：較復雜的情況是二次的：如果知道s(x,y)和t(x,y)的解析表達式，就可以通過求反函數來得到x和y。2021/6/2760對于一個四邊形的空間變換，可以首先確定四個對應頂點，然后用雙線性插值的方法：問題：怎樣用兩次線性插值來作呢？如果幾何失真的面積比較大，那么如果用分塊來提高校正的效果呢？2021/6/2761灰度插值

盡管(x

)坐標分量是整數值，但是計算出來的新坐標(x,y)未必有整數分量，而且確定新坐標處的灰度值。有兩種方案：前向映射和后向映射前向映射：把從實際采集的失真圖象的象素灰度值賦給原始不失真圖象的象素。如果失真圖象的象素P映射到Q，Q落在四個原始不失真圖象的象素之間，就取這四點處的灰度值作雙線性插值，作為象素Q的灰度值。2021/6/2762后向映射：把灰度值從原始不失真圖象的象素P映射到實際采集的失真圖象的象素P

上。如果實際采集的象素Q落在四個象素P

（非整數點）之間，就取這四點P

的灰度值作雙線性插值，作為象素Q的灰度值。插值灰度的計算：-零階插值：取最近的點的灰度-雙線性插值：-三次線性插值：2021/6/2763雙線性插值：設(xi,yi),i=1,2,3,4,是按反時針方向包圍Q的矩形的四個象素。先作然后，2021/6/2764第4章空域增強技術圖象增強技術是使圖象的某種指定效果更好。例如，使X透視照片更清晰。分成兩大類：空域增強技術和頻域增強技術。其中，空域指象素組成的空間?？沼蛟鰪娂夹g直接作用于象素。可以表示為

g(x,y)=EH(f(x,y))

其中f和g分別是增強前后的圖象.這個變換不改變象素的位置，僅改變象素的灰度f(x,y)。2021/6/27654.1空間技術分類如果變換EH僅用一個點，稱EH為點運算（點處理）。如果變換EH還用到點(x,y)鄰域內的點,那么記變換EH為 g(x,y)=EH(f(x,y)，n)，稱為模板處理。點操作可以分為灰度操作和集合操作,它們僅根據該點的灰度和位置,分別改變原灰度為新灰度(稱為灰度變換或灰度映射)和原位置為新位置的象素.灰度操作可以把不同的灰度變成同一個灰度,集合操作可以把不同位置變成同一個位置.因此,它們可能不是可逆的變換.2021/6/27664.2圖象間運算4.2.1算術和邏輯運算算術運算一般用于兩個象素p,q: p+q,p-q,p*q和p/q.應用:圖象之間f(x,y)和h(x,y)的差異用減法求出

g(x,y)=f(x,y)–h(x,y).圖象之加法可以消去噪音e(x,y)。設圖象信號為f(x,y)加上噪音后變成gi(x,y)=f(x,y)+ei(x,y).假設噪音ei互不相關和E(ei)=0,那么n幅圖象的平均將壓制噪音:2021/6/2767邏輯運算補NOT,與AND,或OR,異XOR應用:檢測目標的邊界,向右移動一個象素后,依次作與運算、差運算得到左邊界。類似做出上、下、左邊的邊界。2021/6/2768直接灰度映射4.3.1灰度映射原理將圖象中的灰度值按某種規(guī)律映射成新灰度。在對于彩色圖象做灰度映射時應注意保持色調和飽和度相同，只改變亮度。（HSV）t0原灰度新灰度s2021/6/2769典型灰度映射圖象求反對圖象求反是將原圖象的灰度值反轉。例如，黑底的照片變成白底的照片。設灰度有L個等級。原灰度是d,新灰度是L-1-d。L-1L-10原灰度新灰度d2021/6/2770增強對比度增加圖象的各部分的反差。例如，圖象落在灰度s1和s2之間的部分是感興趣的部分，而其他部分不重要。那么可以把灰度s1和s2之間的部分的灰度反差變大。S1S2L-10L-12021/6/27712021/6/2772動態(tài)范圍壓縮原圖象的灰度范圍過大，因此，需要壓縮到可以顯示的堆度范圍。例如，t=Clog(1+|s|).C為尺度比例常數。st2021/6/2773灰分切分把某部分的灰度變得突出。st2021/6/2774直方圖變換直方圖和積累直方圖圖象的灰度統(tǒng)計稱為直方圖。假設圖象有n個象素，灰度等級有k=0,1,…,L-1個。sk為第k個等級的象素的灰度，設該象素在圖象中共有nk個，那么該象素出現(xiàn)的頻率是

為了規(guī)范化，把sk限制在0到1內。當k跑遍0,1,…,L-1時，就給出了一個函數圖形，稱為直方圖。直方圖是一個1D的離散函數。積累直方圖就是由前k等級之和所生成的積累直方圖。2021/6/2775L-1L-1Ps(sk)EH(sk)kk2021/6/2776直方圖均衡化

設ps(sk)=nk/n，0

1,k=0,1,…,L-1.即灰度sk的象素占全體象素的比例是ps(sk)。令

EH(sk)是單調增加函數，它等于灰度在sk以下的象素所占的比例?？梢詫懗龇春瘮担簊ktksktk假設tk=EH(sk)=1/4，那么，灰度sk映射到tk意味著tk=1/4以下的灰度占象素總數的1/4。如果tk=EH(sk)=1/2，那么tk=1/2以下的灰度占象素總數的1/2。即tk的直方圖是均勻分布。2021/6/2777直方圖的計算直方圖均衡化的計算：假設原圖象有L個灰度，不妨記sk就是灰度k。依次計算頻率p(k)＝nk/n,k=0,1,…,L-1.計算積累直方圖EH(k),k=0,1,…,L-1.用下式計算tk的近似值：由于tk在零與一之間，應該把tk映射到在[0,L-1]范圍內的一個整數，所以用L-1乘以tk后取整,即[(L-1)tk]。由此來確定灰度k到[(L-1)tk]的灰度映射關系。2021/6/2778的pk2021/6/2779直方圖的規(guī)定化規(guī)定化即把圖象的直方圖變成指定的直方圖。作法是先把它們都變成均衡化的直方圖，再把第一步得到的變換反轉過來使用。變換反轉需要確定對應的規(guī)則。SML選使下式最小的k和l:2021/6/2780GML使用組映射規(guī)則，設有一個整數函數Ｉ(l),l=0,…,N-1，使得0I(0)I(1)…I(N-1)M-1.現(xiàn)在確定能使最小的I(l)。如果l＝０，將i=0,…,I(0)的ps(si)對應到pu(u0),否則，將i=I(l-1)+1,…,I(l)的ps(si)對應到pu(ul).2021/6/27812021/6/2782４.5線性濾波器4.5.1技術分類和實現(xiàn)原理技術分類根據功能分成平滑濾波和銳化濾波。平滑濾波減弱和消除高頻分量，使圖象灰度平滑。銳化濾波減弱和消除低頻分量，是圖象反差增大。２.模板卷積方形模板在圖象中漫游，中心對準一個象素。2021/6/27834.5.2線性平滑濾波器1.鄰域平均

g(x,y)=模板中象素灰度的平均２.加權平均

g(x,y)=模板中象素灰度的加權平均。常用高斯分布來計算各系數值。常用小模板。１２１２４２１２１可選模板M=2n+1,n=2+1。也有用3作為窗口半徑。2021/6/27844.6非線性濾波

分成三個發(fā)展方向：邏輯、幾何和代數，分別基于集合、形狀和排序。下面介紹基于排序的方向。4.6.1非線性平滑濾波器1-D中值濾波原理非線性、基于模板。設模板尺寸Ｍ＝2r+1,r為半徑。給定一維信號{fi},I=1,2,…,N.則中值濾波的輸出為

gj=數組fj-r,fj-r+1,…,f0,…,fj+r-1,fj+r的中值。其中，fj的下標在0到N之間。這意味著對該數組排序，然后輸出一個數，使它既不大于又不小于其中的r+1個數。中值濾波能完全消除孤立的脈沖（零脈沖響應）和不影響理想的階躍響應。能被中值濾波完全除去的脈沖的最大長度依賴于濾波器的模板長度Ｍ。2021/6/2785２.２-D中值濾波原理取模板尺寸nn，對數組排序，然后取一個數，使它使它既不大于又不小于其中的n2/2個數。實際操作時，讓模板在圖象中游動。中值濾波能消除孤立的脈沖。鄰域平均濾波器在去掉孤立脈沖時模糊了圖象，中值濾波器在去掉孤立脈沖時不影響圖象。但是，中值濾波不能去掉服從高斯分布的噪音。３.中值濾波的模板效果與模板的大小有關，也與模板中參與運算的象素個數有關。用稀疏模板運算速度較快。2021/6/2786４.均值、中值和最頻值最頻值是出現(xiàn)頻率最高的值。如果圖象有單個峰值的對稱直方圖，那么均值、中值和最頻值相等。如果圖象有單個峰值的直方圖，那么最頻值對應最高峰，而中值比均值更接近最頻值。５.序統(tǒng)計濾波器中值濾波是序統(tǒng)計濾波器的特例，例如，最大值濾波器和最小值濾波器也是序統(tǒng)計濾波器。中點濾波器是最大值濾波器和最小值濾波器的平均。2021/6/27874.6.2非線性銳化濾波器１.微分方法可以銳化圖象。用兩個差商來代替微分：－１－１－１１１１１－１１－１１－１分別用１范數、２范數和

范數計算時2021/6/2788２.銳化濾波器的通用性質(1)零位移。銳化濾波器不改變邊緣的位置。應具有反對稱性。(2)消除均值。銳化濾波器均值為零。(3)無選擇性的微分。微分操作只對象素灰度敏感。(4)對稱性質。３.最大最小銳化變換最大最小銳化變換的迭代實現(xiàn)：2021/6/2789局部增強對圖象的一部分進行增強例如,將圖象分成一系列子圖象,并對子圖象進行直方圖等操作利用局部的均值m和均方差

g(x,y)=A(x,y)[f(x,y)-m(x,y)]+m(x,y),其中,A(x,y)=kM/(x,y)稱為局部增益函數,M為平均灰度,k為比例系數.g(x,y)右邊的第一項能放大圖象的局部變化,第二項恢復均值.2021/6/2790第5章基本圖象變換5.1基本圖象變換5.2可分離和正交圖象變換5.3傅里葉變換5.4沃爾什/哈達瑪變換5.5離散余弦變換5.6Radon變換圖象變換可分離變換統(tǒng)計變換傅氏變換其他變換霍特林變換2021/6/27915.2可分離和正交圖象變換1D變換:T(u)是f(x)的變換.g(x,u)稱為正向變換核.反變換是h(x,u)稱為反向變換核.2D變換:T(u,v)是f(x,y)的變換.2021/6/2792如果核具有下列性質,則稱g是可分離核:如果g1=g2,那么2D對稱可分離變換可以寫成兩個相繼的1D變換:分別記S(x,v),f(x,y),g(y,v)和T(u,v)組成的矩陣為S,F,A和T,那么,S(x,v)是A的第u行與F的第y列的乘積,即S=AF,而T(u,v)是S的第u行與G的第v列的乘積,即T=SA. T=SA=AFA.2021/6/2793其中,F是N

N圖象,A是N

N對稱.取B為A的逆矩陣,那么, BTB=BAFAB=F.如果B不等于A-1,那么F*=BAFAB是F的一個近似.2021/6/27945.3傅里葉變換離散的傅里葉變換和性質1、由1維傅里葉變換（FT）和逆變換的公式,

離散的1維傅里葉變換（DFT）和逆變換的公式是，u=0,1,…,N-1;，x=0,1,…,N-1.這里把f(x)理解為一個離散函數，

其中，除了x=0,1,…,N-1處以外f(x)等于零。2021/6/2795

因為F(u)是周期函數，u取值0,1,…,N-1時，exp[-2ju/N]以N為周期。所以F(u)是在整個頻率域內有定義的。取且僅取一個周期就包含了足夠的原來f(x)的信息。特別地，

離散的2維傅里葉變換（DFT）和逆變換的公式。其中記u=0,1,…,M-1,v=0,1,…,N-1;x=0,1,…,M-1,y=0,1,…,N-1.分別為2021/6/2796這些公式的推導如下。以間隔

x和

y，從圖像中取M

N個樣本，x=0,1,…,M;y=0,1,…,N。同樣地，在圖像的傅里葉變換的像中，以間隔

u和

v，取M

N個樣本，u=0,1,…,M;v=0,1,…,N；使得

u=1/M和

v=1/N。2021/6/2797這就完成了證明.另一方面,

2021/6/2798傅里葉變換的像是一個二維復數矩陣。它是值得注意的是：顯示器不能正確地顯示F(u,v)。這是因為傅里葉變換的像是一個復數矩陣。必須分別顯示它的實部和虛部，或它的模和幅角。二維DFT的性質：1、分離性2021/6/2799因此，二維DFT可以用相繼的兩個一維的DFT來計算：2、平移性2021/6/27100傅里葉變換象在零頻率處為，它的模反映了背景光照的強度，通常是比較亮的。但是，由于空間坐標是從左上角的(0,0)開始的，對應零頻率的點也就落在頻率窗口的左上角，造成左上角比較亮。再由于傅里葉變換的周期性，在窗口的四個角處都比較亮。其實這四個角的頂點是同一個點。因此，希望把傅里葉變換象的中心（零頻率）移到窗口中心去。注意到傅里葉變換的u和v是從低頻到高頻排列的。當取(u0,v0)為圖像作傅里葉變換后的像的中心時，即u0=M/2,v0=N/2時，根據上面的性質，2021/6/27101

所以，只要先對f(x,y)作變換f(x,y)(-1)x+y，然后作傅里葉變換，就可以把傅里葉變換象的零頻率移到窗口中心去。反過來，當把這樣的傅里葉變換后的像變回到原時間函數時，需要把所得到的f(x,y)再作變換f(x,y)(-1)x+y。這里有一個問題：圖象f(x,y)是灰度值，總是不小于零的。但是，f(x,y)(-1)x+y會交替的變號。如果用顯示器來顯示變號的灰度圖象，那么顯示的結果依賴于設備的設置。通常，顯示時負的灰度值自動取為零。進一步，一幅灰度范圍在0-100內的圖形未必比灰度范圍在0-255內的圖形暗淡。這是因為在前一種情況下，顯示器可能自動地把最高的亮度賦予100灰度。換句話說，顯示器的自動設置可能會改變圖象的顯示結果。

2021/6/271021

3、周期性和共扼對稱性設M和N分別是橫縱軸的周期。如果f是實函數，那么事實上，2021/6/27103如果f是實函數，那么4、旋轉性質

做變換

x=rcos

,y=rsin

,和u=wcos，v=wcos，那么事實上，2021/6/271045．

分配律6．

尺度變換7．

平均值是8．

一維卷積的平均值。2021/6/27105

例如，設f(z)=

[0,1](z),g(z)=0.5

[0,1](z)。那么，f(z)g(x-z)=0.5

[0,1](z)

[0,1](x-z)中，當且僅當z和x-z都落在區(qū)間[0,1]內的時候才是一，否則是零。0

1和

x-z

1。即當0

1時0

x；當1<x

2時x-1

1。當0

2時，f(z)g(x-z)=0.5，否則等于零。它們的卷積等于0x2021/6/27106卷積有下列性質：設F和G分別是f和g的傅里葉變換。則事實上，卷積經過傅里葉變換，2021/6/27107離散采樣的兩個函數的卷積問題需要考慮到周期的長度影響。假設兩個函數f和g有相同的周期M。根據卷積f*g的定義，該卷積也有相同的周期M。計算卷積時，只能使用f的一個周期內的數值和g的一個周期內的數值。如果f采樣A個f(0),f(1),…,f(A-1)，g采樣B個g(0),g(1),…,g(B-1)，隨著x的變化，乘積f(z)g(x-z)不等于零的長度是A+B-1。當M

A+B-1時，該乘積才不會越出一個周期的范圍而造成重疊取樣。此時，為了便于使用離散卷積公式，補充規(guī)定

f(x)=0當A

M-1, g(x)=0當B

M-1。離散卷積公式是：x=0,1,…,M-1。

2021/6/27108相關性

例如，設f(z)=

[0,1](z),g(z)=0.5[0,1](z)。那么，

f(z)g(x+z)=0.5[0,1](z)[0,1](x+z)，當且僅當0z

1和

0x+z

1時才是一，否則是零。即當-1x

0時-xz

1；當0<x1時0z

1-x。當-

1時f(z)g(x+z)=0.5，否則等于零。它們的卷積等于

2021/6/27109快速傅里葉變換我們推導快速傅里葉變換公式。假設N是2的冪，即N=2n。記N=2M。令。在已知WN的條件下，計算每一個F(

)至少需要作N次乘法和一次除法，計算所有的F()共需要作不少于N2次乘法。改寫變換：容易看出WN有“折半”的性質：2021/6/27110定義2021/6/27111

=0,1,…,M-1

我們還需要計算在

=M,M+1,…,N-1處的值。為此，注意到

=0,1,…,M-1

根據上面分析，我們只需要在M個點

=0,1,…,M-1處分別求出和的值，并且每次用乘以，就可以用公式(4)和(5)來計算在2M個點

=0,1,…,2M-1處的值。公式(4)和(5)就是一維的快速傅里葉變換公式。2021/6/27112

最后，我們證明FFT算法的時間復雜性是

(NlogN)。設計算一個有N個點的FFT算法的時間復雜性是T(N)。根據以上的公式，一個有N個點的FFT運算分成兩個各有N/2點的FFT運算，并且，其中的一個每次要與作一次乘法，共有

(N)次乘法，所以，

T(N)=2T(N/2)+(N)。依此可得

T(N)=T(2n)=2T(2n-1)+(2n) =22T(2n-2)+2(2n)=…=n(2n)=(NlogN)。2021/6/271132021/6/27114%openanimageh=imread('butterfly.jpg');figure;imshow(h);%因為圖像的格式uint8不能做加減法,所以需要把格式uint8變成double.h=double(h);[m,n,p]=size(h);%變成黑白圖像if(p>1)bw(:,:)=(h(:,:,1)+h(:,:,2)+h(:,:,3))/3;h=bw/3;end%調整灰度到0到255之間。否則maxValue=max(max(h));h1=h*255/maxValue;figure;imshow(uint8(h1));2021/6/27115%2DFourier變換和平移頻率0到中心,得到2D復數值圖像hf=fftshift(fft2(h));%畫出其模的圖像。如果直接用imshow(uint8(hf))將得到下面的圖象.hf

人人文庫> 全部分類> 專業(yè)文獻 > 工程機械

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數字圖像處理課件(岡薩雷斯第三版)

文檔簡介

溫馨提示

最新文檔

評論

數字圖像處理課件(岡薩雷斯第三版)

文檔簡介

溫馨提示

最新文檔

評論

相關文檔