基于學(xué)習(xí)的圖像增強技術(shù)章課件1_第1頁
基于學(xué)習(xí)的圖像增強技術(shù)章課件1_第2頁
基于學(xué)習(xí)的圖像增強技術(shù)章課件1_第3頁
基于學(xué)習(xí)的圖像增強技術(shù)章課件1_第4頁
基于學(xué)習(xí)的圖像增強技術(shù)章課件1_第5頁
已閱讀5頁,還剩157頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章圖像的基礎(chǔ)知識1.1圖像信號的基本概念1.2人眼的視覺原理1.3圖像質(zhì)量的評估標準與方法第一章圖像的基礎(chǔ)知識1.1圖像信號的基本概念

1.1圖像信號的基本概念

文字、語音和圖像信息是人們在日常的生活和工作中經(jīng)常接觸的信息形式。其中,語音和簡單的圖像(圖形)是人類早期用于信息交流的主要方式。人類從自然界獲得的信息大部分都來自于視覺(即圖像)。圖像與文字、語音相比,具有直觀生動、具體形象等許多顯著的優(yōu)點。

圖像是由光能量進入人的視覺系統(tǒng)所重現(xiàn)出來的視覺信息。光能量或者由發(fā)光物體直接發(fā)出,或者由光源發(fā)出后照射在物體上經(jīng)過反射、衍射、折射等形成。圖像來自于自然界或者人為的處理和合成,其原始的形態(tài)是連續(xù)變換的模擬量。與文字、語音信息相比較,圖像信息主要具有信息量大、直觀性強以及模糊性、實體性和形象化等特點。1.1圖像信號的基本概念

文字、語音和圖像1.1.1圖像的表示

一幅圖像實際上記錄的是物體輻射能量的空間分布(可以看做空間各點光強度的集合),這個分布是空間坐標、時間和波長的函數(shù)。圖像的亮度一般可以用多變量表示為

I=f(x,y,

z,λ,t)

(1-1)

當(dāng)一幅圖像為平面單色靜止圖像時,空間坐標變量z、波長λ和時間變量t可以從函數(shù)中去除,一幅圖像可以用二維函數(shù)f(x,y)來表示:

f(x,y)=i(x,y)r(x,y)

(1-2)

由于I表示的是物體的反射、投射或輻射能量,因此它是正的、有界的,即

0≤I≤Imax

(1-3)1.1.1圖像的表示

一幅圖像實際上記錄的是物體輻射式(1-1)是一個多變量函數(shù),不易于分析,需要采用一些有效的方法進行降維。由三基色原理知,I可表示為三個基色分量的和:

I=IR+IG+IB

(1-4)

式中,(1-5)式(1-1)是一個多變量函數(shù),不易于分析,需要采用一些有1.1.2圖像的數(shù)字化過程

一般的圖像(模擬圖像)無法直接用計算機進行處理,為此必須將各類模擬圖像轉(zhuǎn)化為數(shù)字圖像。數(shù)字圖像的生成過程如圖1-1所示。數(shù)字圖像可以理解為對二維函數(shù)f(x,y)進行采樣和量化(即離散處理)后得到的圖像,通常用二維矩陣來表示一幅數(shù)字圖像。對一幅圖像進行數(shù)字化的過程就是在計算機內(nèi)生成一個二維矩陣的過程。因此,采樣(選取一種離散的柵格去表示一幅圖像)和量化(將顏色和亮度映射成整數(shù))是圖像數(shù)字化的兩個主要過程。1.1.2圖像的數(shù)字化過程

一般的圖像(模擬圖像)無圖1-1數(shù)字圖像生成過程圖1-1數(shù)字圖像生成過程連續(xù)圖像數(shù)字化的結(jié)果,將產(chǎn)生能夠用于計算機處理的離散數(shù)據(jù)結(jié)構(gòu),一般為一個矩陣。假如一幅連續(xù)圖像f(x,y)被取樣,則產(chǎn)生的數(shù)字圖像有M行和N列。坐標(x,y)的值變成離散值,通常將這些離散坐標用整數(shù)表示(見圖1-2)。圖1-2圖像的坐標連續(xù)圖像數(shù)字化的結(jié)果,將產(chǎn)生能夠用于計算機處理的離散數(shù)據(jù)當(dāng)然,圖像數(shù)字化的過程與采樣間隔(頻率)有關(guān)。采樣頻率太低,則圖像會產(chǎn)生混疊現(xiàn)象而失真。另外,灰度或顏色數(shù)目的選取也與重建后的圖像質(zhì)量有關(guān)。一般地,數(shù)量級在8位(256色)的黑白圖像是比較好的,而高質(zhì)量的彩色圖像需要使用三基色疊加的辦法。

模擬圖像數(shù)字化后,二維矩陣的每一個位置稱為像素(Pixel),每個像素都包括位置信息和灰度。對于單色即灰度圖像而言,每個像素的亮度用一個數(shù)值來表示,通常數(shù)值范圍為0~255,即可用一個字節(jié)來表示,0表示黑,255表示白,而其它數(shù)值表示灰度級別,如圖1-3所示。當(dāng)然,圖像數(shù)字化的過程與采樣間隔(頻率)有關(guān)。采樣頻率圖1-3圖像的數(shù)字化過程圖1-3圖像的數(shù)字化過程

1.采樣

采樣(Sampling)就是對圖像空間坐標的離散化,它決定了圖像的空間分辨率(圖像中可分辨的最小細節(jié),主要由采樣間隔值決定)。用一個網(wǎng)格把待處理的圖像覆蓋,然后把每一小格上模擬圖像的各個亮度取平均值,作為該小方格的值;或者把方格的交叉點處模擬圖像的亮度值作為該方格交叉點上的值,如圖1-4所示。1.采樣

采樣(Sampling)就是對圖像空間坐圖1-4圖像采樣圖1-4圖像采樣圖像平面分割成離散點的集合,結(jié)果是一個樣點值陣列,故又叫點陣取樣。每個離散點即像素,可用離散坐標(i,j)表示。點陣采樣的數(shù)學(xué)描述為(1-6)(1-7)上式對二維離散函數(shù)f(x,y)進行均勻采樣,S(x,y)為二維離散采樣函數(shù),Δx和Δy為相應(yīng)方向上的采樣間隔,fp(x,y)為采樣函數(shù)。圖像平面分割成離散點的集合,結(jié)果是一個樣點值陣列,故又叫采樣函數(shù)的頻譜經(jīng)過傅立葉變換可以表示為(1-8)由二維采樣定理可知,如果二維信號f(x,y)的二維傅立葉頻譜F(u,v)滿足(1-9)其中,Uc、Vc對應(yīng)于空間位移變量x和y的最高截止頻率,則當(dāng)采樣間隔Δx、Δy滿足奈奎斯特準則(圖1-5):(1-10)采樣函數(shù)的頻譜經(jīng)過傅立葉變換可以表示為(1-8)由二時,可以由f(x,y)的采樣值f(iΔx,jΔy)唯一地恢復(fù)原圖像信號f(x,y)。圖1-5奈奎斯特準則時,可以由f(x,y)的采樣值f(iΔx,jΔy)唯一地

2.量化

把采樣后所得的各像素灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化(量化實例如圖1-6所示)。量化是對圖像幅度坐標的離散化,它決定了圖像的幅度分辨率。

量化的方法包括分層量化、均勻量化和非均勻量化。分層量化是把每一個離散樣本的連續(xù)灰度值分成有限多的層次。均勻量化是把原圖像灰度層次從最暗至最亮均勻分為有限個層次,如果采用不均勻分層就稱為非均勻量化。2.量化

把采樣后所得的各像素灰度值從模擬量到離散圖1-6圖像量化實例圖1-6圖像量化實例以均勻量化(圖1-7)為例,幅度坐標劃分為n個(即0,r1,r2,…,rn)量化電平(即量化級,一般灰度圖像為28,這樣一來,每個采樣可以用8bit來表示),將每一個采樣量化為離它最近的電平(即將取樣點或像素的灰度或亮度離散化,使之由連續(xù)量轉(zhuǎn)換為離散的整數(shù)值即灰度值)。以均勻量化(圖1-7)為例,幅度坐標劃分為n個(即0,圖1-7均勻量化圖1-7均勻量化劃分子區(qū)間和設(shè)定量化值,使量化造成的失真最小(圖1-8)。將[r0,rk)均分成k個子區(qū)間后,每個區(qū)間的長度為(1-11)各子區(qū)間以它的中心位置作為量化值:(1-12)劃分子區(qū)間和設(shè)定量化值,使量化造成的失真最小(圖1-8)圖1-8量化示意圖圖1-8量化示意圖對一幅圖像,當(dāng)量化級數(shù)一定時,采樣點數(shù)對圖像質(zhì)量有著顯著的影響。采樣點數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點數(shù)減少時,圖像上的塊狀效應(yīng)就逐漸明顯。當(dāng)圖像的采樣點數(shù)一定時,采用不同量化級數(shù)的圖像質(zhì)量也不一樣。量化級數(shù)越多,圖像質(zhì)量越好;量化級數(shù)越少,圖像質(zhì)量越差(圖1-9)。量化級數(shù)最小的極端情況就是二值圖像,圖像會出現(xiàn)假輪廓。對一幅圖像,當(dāng)量化級數(shù)一定時,采樣點數(shù)對圖像質(zhì)量有著顯著圖1-9量化級數(shù)與圖像質(zhì)量之間的關(guān)系圖1-9量化級數(shù)與圖像質(zhì)量之間的關(guān)系連續(xù)圖像經(jīng)過空間采樣—灰度量化后,變成了離散的數(shù)字圖像。通常可以用如下矩陣來表示一個數(shù)字圖像:(1-13)表示像素明暗程度的整數(shù)稱為像素的灰度級(灰度值或灰度)。一幅數(shù)字圖像中不同灰度級的個數(shù)稱為灰度級數(shù),用G表示。在數(shù)字圖像處理中一般將這些量取為2的整數(shù)冪,即G=2g,g表示存儲圖像像素灰度值所需的比特位數(shù)。一幅大小為M×N、灰度級數(shù)為G的圖像所需的存儲空間,即圖像的數(shù)據(jù)量,大小為M×N×g(bit)。例如:

128×128×6=98304(12KB)

512×512×8=2097152(256KB)連續(xù)圖像經(jīng)過空間采樣—灰度量化后,變成了離散的數(shù)字圖像。1.1.3數(shù)字圖像的基本類型

1.位圖

位圖是使用二維像素矩陣來表示的圖像,每個像素的亮度信息或顏色信息用灰度或RGB分量表示。每一個像素值所占的比特位數(shù)可以是1、4、8、16、24、32位等,位數(shù)越高,所包含的信息越豐富。位圖可以分為設(shè)備相關(guān)位圖(DDB)與設(shè)備無關(guān)位圖(DIB)。DDB沒有自己的調(diào)色板,顏色模式必須依賴于輸出設(shè)備,如256色以下的位圖中存儲的像素值是系統(tǒng)調(diào)色板的索引,其顏色依賴于系統(tǒng)調(diào)色板。DIB有自己的調(diào)色板信息,其顏色模式與設(shè)備無關(guān),可以永久地存儲圖像,常保存在經(jīng)*.BMP或*.DIB為反綴的文件中。1.1.3數(shù)字圖像的基本類型

1.位圖

位圖是

2.二值圖像

二值圖像由黑、白兩種顏色構(gòu)成,也叫黑白圖像,其圖像像素只存在0、1兩個值,0表示黑色,1表示白色。它相當(dāng)于圖像量化為2級,在計算機中用一位比特數(shù)表示。二值圖像有很多應(yīng)用,比如可用于圖像處理中的圖像前景和背景的分割,目標的形狀分析等。一幅典型的二值圖像如圖1-10所示。2.二值圖像

二值圖像由黑、白兩種顏色構(gòu)成,也叫圖1-10二值圖像圖1-10二值圖像

3.灰度圖像

二值圖像其實是灰度圖像的特殊情況?;叶葓D像在黑色和白色之間加入了2g-2個顏色深度(g表示比特位數(shù)),包含幾種不同的灰度級,如16級、64級,256級等。例如,當(dāng)像素灰度級用8bit表示時,每個像素的取值就是256種灰度中的一種,即每個像素的灰度值為0~255中的一個。通常,用0表示黑色,255表示白色,從0到255亮度逐漸增加。

I=f(x,y),0≤f(x,y)≤k-1

(1-14)

其中,(x,y)為空間坐標,k表示灰度級,I表示圖像的光強度。3.灰度圖像

二值圖像其實是灰度圖像的特殊情況。

4.索引圖像

所謂索引圖像就是把像素的值作為顏色的索引序號,根據(jù)這個序號能找到該像素對應(yīng)的實際顏色。用于存儲索引顏色的顏色表就是調(diào)色板,Windows位圖等許多圖像格式的圖像都應(yīng)用了調(diào)色板技術(shù)。調(diào)色板中包含了紅、綠、藍三種顏色的不同組合。表1-1中每一行記錄一種顏色的R、G、B值,當(dāng)表示一種顏色時,只需要指出它在顏色表中的索引,這樣16色只需要4位,且顏色表占用的內(nèi)存很小。調(diào)色板技術(shù)就是使用索引圖像顯示的一種技術(shù)。4.索引圖像

所謂索引圖像就是把像素的值作為顏色的表1-1常見的RGB顏色組合值/調(diào)色板表1-1常見的RGB顏色組合值/調(diào)色板

5.RGB彩色圖像

自然界中幾乎所有顏色都可以由三原色紅(R)、綠(G)、藍(B)組合而成,RGB圖像應(yīng)用了這一原理。RGB圖像中每一個像素的顏色由相應(yīng)的紅、綠、藍顏色分量共同決定,控制這三種顏色的合成比例就可正確顯示該像素的顏色。RGB圖像中的紅、綠、藍分量分別用8位表示,共24位,理論上可以合成224種不同的顏色。5.RGB彩色圖像

自然界中幾乎所有顏色都可以由三1.1.4顏色模式

1.光和彩色

光和各種射線都屬于電磁波,電磁波的波譜范圍很廣,包括無線電波、紅外線、可見光、紫外線、X射線、γ射線等,如圖1-11所示。其中人的眼睛能看到的那一部分叫可見光,可見光是攜帶能量的電磁輻射中的很小一部分,兼有波動特性和微粒特性。

可見光是由波長在380nm~770nm范圍內(nèi)的電磁波組成的。光源通常能發(fā)射某一波長范圍內(nèi)的能量,并且其強度可以在時間、空間上變化。光的彩色感覺決定于光譜成分(即它的波長組成)。1.1.4顏色模式

1.光和彩色

光和各種射線圖1-11可見光的波長范圍圖1-11可見光的波長范圍

1)亮度(Intensity)

亮度是指發(fā)光物體表面發(fā)光強弱的物理量(數(shù)字圖像處理中指高灰度級的概率)。一般來說,照射光越強,反射光也越強,看起來就越亮。顯然,如果彩色光的強度降到使人看不到了,在亮度標尺上它應(yīng)與黑色對應(yīng)。同樣,如果其強度變得很大,那么亮度等級應(yīng)與白色對應(yīng)。亮度是非彩色屬性,彩色圖像中的亮度對應(yīng)于黑白圖像中的灰度。需要注意的是,不同顏色的光,強度相同時照射同一物體也會產(chǎn)生不同的亮度感覺。

2)色調(diào)(Hue)

色調(diào)是一種或多種波長的光作用于人眼所引起的彩色感覺。它描述純色的屬性(純黃色、純橘色或純紅色)。1)亮度(Intensity)

亮度是指發(fā)光物體表

3)飽和度(Saturation)

飽和度是指顏色的純度即摻入白光的程度,或者是指顏色的深淺程度。飽和度的深淺與色光中白光的成分的多少有關(guān)。一種純彩色光中加入的白光成分越少,該彩色的飽和度越高;反之,白光成分越多,飽和度就越低。其數(shù)值為百分比,介于0~100%之間。純白光的色彩飽和度為0,而純彩色光的飽和度則為100%。飽和度反映了某種色光被白光沖淡的程度。對于同一色調(diào)的彩色光,飽和度越高,顏色越鮮明或者說越純,相反則越淡。

飽和度受亮度和對比度的雙重影響。白光或黑色光的成分過多都會使飽和度降低,一般亮度好、對比度高的圖像有很好的色飽和度。3)飽和度(Saturation)

飽和度是指顏色

2.圖像的三基色

所謂三基色原理就是自然界常見的各種顏色光,都可由紅(R)、綠(G)、藍(B)三種色光按照不同比例相配而成,同樣絕大多數(shù)顏色也可以分解成紅、綠、藍三種色光。這是色度學(xué)中的最基本原理。三基色的混色模式有兩種:增色模式(相加混色)和減色模式(相減混色)。

設(shè)組成某種顏色C所需的三個量分別用R、G、

B表示,每種量的比例系數(shù)為r、g、b,則有

C=rR+bB+gG

(1-15)(1-16)2.圖像的三基色

所謂三基色原理就是自然界常見的各

R、G、B

各用一個字節(jié)可表示28×28×28≈1677萬色。當(dāng)R、G、B全為1時為白色,R、G、B全為0時為黑色,R、G、B數(shù)值相等為灰色,R、G、B中哪個數(shù)值大就偏向哪種顏色。

照明光源的基色系通常包括紅色、綠色和藍色,稱為RGB基色,應(yīng)用于相加混色中。反射光源的基色系通常包括青色(Cyan)、深紅色(Magenta,也稱品紅色)和黃色(Yellow),稱為CMY基色,應(yīng)用于相減混色中。實際中,RGB基色和CMY基色是互補的,也就是說,混合一個色系中的兩種彩色會產(chǎn)生另外一個色系中的一種彩色。例如,紅色和綠色混合會產(chǎn)生黃色。可以用圖1-12表示這種關(guān)系。上述原理構(gòu)成了彩色攝取和顯示的基礎(chǔ)。(1-17)r+b+g=1

R、G、B各用一個字節(jié)可表示28×28×28≈1

3.圖像的彩色模型

彩色模型(彩色空間或彩色系統(tǒng))的用途是在某些標準下用通??山邮艿姆绞胶喕噬囊?guī)范。常用幾種不同的色彩空間表示圖形和圖像的顏色,以對應(yīng)于不同的場合和應(yīng)用。因此,數(shù)字圖像生成、存儲、處理及顯示時,若對應(yīng)不同的色彩空間就需要作不同的處理和轉(zhuǎn)換?,F(xiàn)在主要的彩色模型有RGB模型、CMY模型、YUV模型、YIQ模型、YCbCr模型、HSI模型等。3.圖像的彩色模型

彩色模型(彩色空間或彩色系統(tǒng))圖1-12RGB三原色疊加效果示意圖圖1-12RGB三原色疊加效果示意圖

1)RGB——加色混合色彩模型

RGB色彩模型就是模型中的各種顏色都是由紅、綠、藍三基色以不同的比例相加混合而產(chǎn)生的,即C=aR+b

G+cB。其中,C為任意彩色光,a、b、c為三基色R、G、B的權(quán)值。在CRT顯示中,將R、G、B的亮度值限定在一定范圍內(nèi),如0~1。每個像素的顏色都用三維空間的一個點來表示,就成為一個三維彩色模型,如圖1-13所示。1)RGB——加色混合色彩模型

RGB色彩模型就是圖1-13RGB立方體圖1-13RGB立方體

2)CMY——減色混合色彩模型

CMY色彩模型就是利用青色(Cyan)、品紅色(Magenta)、黃色(Yellow)這三種彩色按照一定比例來產(chǎn)生需要的彩色。CMY是RGB三基色的補色,所以存在如下的關(guān)系:(1-18)2)CMY——減色混合色彩模型

CMY色彩模型就是

3)YUV模型和YIQ模型——應(yīng)用于電視傳播系統(tǒng)的色彩模型

對于視頻信號的傳輸,為了減少所需的帶寬并與單色電視系統(tǒng)兼容,采用亮度/色度坐標系模型。但通常用于彩色顯示的RGB基色混合了光的亮度和色度屬性。1931年國際照明協(xié)會(CIE)規(guī)定了XYZ彩色坐標,但XYZ基色不能直接用于產(chǎn)生彩色,它主要用于定義其它的基色和彩色的數(shù)字說明,如用于傳輸彩色電視信號的YUV和YIQ彩色坐標。

在XYZ模型中,Y表示亮度(強度),X和Y共同反映顏色的色度特性(色調(diào)和飽和度)。除了能分離亮度和色度信息,XYZ另一個優(yōu)點是幾乎所有的可見彩色都能由非負的激勵值規(guī)定。XYZ坐標系中的(X,Y,Z)與RBG坐標系中的(R,G,B)的關(guān)系如下:(1-19)3)YUV模型和YIQ模型——應(yīng)用于電視傳播系統(tǒng)的色彩根據(jù)美國國家電視制式委員會的規(guī)定,當(dāng)白光的亮度用Y來表示時,它和紅、綠、藍三色光的關(guān)系可用如下的方程描述:

Y=0.299R+0.587G+0.114B

(1-20)

這就是常用的亮度公式。

色差U、V是由B-Y、

R-Y按不同比例壓縮而成的,即(1-21)其中,α、γ為壓縮系數(shù)。根據(jù)美國國家電視制式委員會的規(guī)定,當(dāng)白光的亮度用Y來表示

YUV色彩空間與RGB色彩空間的轉(zhuǎn)換關(guān)系如下:(1-22)如果要由YUV空間轉(zhuǎn)化成RGB空間,只要進行逆運算即可。在NTSC制中采用的是YIQ彩色模型,Y仍表示亮度,I和Q分量是U和V分量旋轉(zhuǎn)33°后的結(jié)果,即(1-23)YUV色彩空間與RGB色彩空間的轉(zhuǎn)換關(guān)系如下:(1-22對U和V分量進行旋轉(zhuǎn)后使得I對應(yīng)橙色到青色范圍的彩色,Q對應(yīng)綠色到紫色范圍。因為人眼對綠色到紫色范圍內(nèi)的變化與橙色到青色范圍內(nèi)的變化相比不敏感,因此Q分量可以比I分量采用更小的帶寬傳輸。YIQ值與RGB的關(guān)系是:(1-24)對U和V分量進行旋轉(zhuǎn)后使得I對應(yīng)橙色到青色范圍的彩色,Q

4)YCbCr顏色空間

YCbCr顏色空間是由YUV顏色空間派生的一種顏色空間,主要用于數(shù)字電視系統(tǒng),以及圖像、視頻壓縮標準中,如JPEG、MPEG系列、H.26x系列。在從RGB到Y(jié)CbCr的轉(zhuǎn)換中,輸入、輸出都是8位的二進制格式。

YCbCr與RGB的關(guān)系如下:(1-25)4)YCbCr顏色空間

YCbCr顏色空間是由YU

5)HSI——視覺彩色模型

前面討論的幾種彩色模型不是從硬件的角度就是從色度學(xué)的角度提出的,都不能很好地與肉眼的視覺特性相匹配。為此,根據(jù)肉眼的色彩視覺三要素(色調(diào)(Hue)、飽和度(Saturation)、亮度(Intensity))提出了HSI彩色模型。這種模型能把色調(diào)、亮度和飽和度的變化情形表現(xiàn)得很清楚。

HSI模型中,彩色信息的色調(diào)H和飽和度S可用圖1-14所示的光環(huán)來表示。其中,飽和度是色環(huán)的原點(圓心)到彩色點的半徑的長度;環(huán)的外圍圓周是純(飽和度為1)的顏色;中心是中性(灰色)色調(diào),即飽和度為0。色調(diào)由角度表示。假設(shè)色環(huán)的0°表示彩色為紅色,120°為綠色,240°為藍色,色調(diào)從0°~360°覆蓋了所有可見的光譜的彩色。假設(shè)光的強度I為色環(huán)的垂線,則H、S、I坐標將構(gòu)成一個柱形彩色空間?;叶壬{(diào)沿著軸線從底部的黑變到頂部的白。所以,最大亮度、最大飽和度的顏色位于圓柱的頂面的圓周上。5)HSI——視覺彩色模型

前面討論的幾種彩色模型圖1-14圓形彩色平面的HSI彩色模型圖1-14圓形彩色平面的HSI彩色模型從RGB到HSI模型的轉(zhuǎn)變關(guān)系是:

色調(diào)H分量為(1-26)其中,(1-27)飽和度S分量為(1-28)亮度I分量為(1-29)從RGB到HSI模型的轉(zhuǎn)變關(guān)系是:

色調(diào)H分量為(1

HSI到RGB的轉(zhuǎn)換,其轉(zhuǎn)化公式有些不同,它取決于要轉(zhuǎn)換的點落在原始色所分割的哪個扇區(qū)。(1-30)(1-31)HSI到RGB的轉(zhuǎn)換,其轉(zhuǎn)化公式有些不同,它取決于要轉(zhuǎn)

(1-32)采用RGB模型和HIS模型如圖1-15所示。(1-32)采用RGB模型和HIS模型如圖1-15所示。圖1-15色度學(xué)與彩色模型圖1-15色度學(xué)與彩色模型1.1.5圖像分辨率

圖像分辨率一般分為空間分辨率和灰度級分辨率。

由空間采樣率決定的分辨圖像最小細節(jié)的能力叫圖像的空間分辨率(有些地方簡稱分辨率),它直接取決于圖像的像素數(shù),一般用單位長度上采樣的像素數(shù)目或單位長度上的線對數(shù)目表示(單位為像素/厘米或線對數(shù)/厘米);也指精確測量和再現(xiàn)一定尺寸的圖像所必需的像素個數(shù)(單位為像素×像素),這是現(xiàn)在常用的表示方法。對于采樣來說,采樣間隔越小,圖像矩陣越大,空間分辨率越高,可觀察的細節(jié)越多;反之采樣間隔越大,空間分辨率越低。比如一幅用二維數(shù)組f(M,N)表示的數(shù)字圖像,像素總數(shù)M×N稱為圖像的空間分辨率,其中M為行分辨率,N為列分辨率。1.1.5圖像分辨率

圖像分辨率一般分為空間分辨率和前面說明采樣點數(shù)與圖像質(zhì)量之間的關(guān)系時也說過這個問題,如圖1-16所示,圖(a)到圖(d)的像素數(shù)依次減半,實際上是采樣間隔依次增加到前一幅圖像采樣間隔的兩倍,意味著圖像空間分辨率依次減少為前面的四分之一,結(jié)果使圖像細節(jié)逐漸消失,圖像所傳達的信息逐漸減少,直至完全不能表達信息。所以,要使數(shù)字圖像保有一定的空間分辨率,從而不丟失原連續(xù)圖像所表達的信息,圖像采樣間隔就必須依一定的規(guī)則選取合適的值。前面說明采樣點數(shù)與圖像質(zhì)量之間的關(guān)系時也說過這個問題,如圖1-16空間分辨率變化的不同效果圖1-16空間分辨率變化的不同效果

1.2人眼的視覺原理

1.2.1人眼結(jié)構(gòu)

人眼(圖1-17)是一個平均半徑為20mm的球狀器官。眼球壁由多層組成,最外層是堅硬的蛋白質(zhì)膜,它的正前方的1/6部分為有彈性的透明組織,稱為角膜,光線透過角膜進入眼內(nèi)。眼球外層其余5/6部分為白色不透明組織,稱為鞏膜,鞏膜主要起鞏固及保護眼球的作用。鞏膜里面的一層由虹膜和脈絡(luò)膜組成。脈絡(luò)膜含有豐富的色素細胞,呈現(xiàn)黑色,起著遮光作用。它既能避免外來多余光線的干擾,又能避免眼球內(nèi)部光線的亂反射。虹膜隨不同種族有不同顏色,如黑色、藍色、褐色等。在虹膜中間有一圓孔稱為瞳孔。瞳孔的大小可借助于虹膜的環(huán)狀肌肉組織來調(diào)節(jié),從而可以控制進入眼睛內(nèi)部的光通量,起著照相機中光圈的作用。眼球壁最里層為視網(wǎng)膜,它由大量光敏細胞所組成。1.2人眼的視覺原理

1.2.1人眼結(jié)圖1-17人眼結(jié)構(gòu)圖1-17人眼結(jié)構(gòu)光敏細胞按其形狀可分為桿狀細胞和錐狀細胞。人眼中大約有700萬個錐狀細胞,主要集中在黃斑區(qū)(正對瞳孔的視網(wǎng)膜中央?yún)^(qū)域)。黃斑區(qū)中沒有桿狀細胞。離黃斑區(qū)越遠,錐狀細胞越少,桿狀細胞越多,在接近邊緣區(qū)域,幾乎全是桿狀細胞。桿狀細胞只能感光,不能感色,也就是說,桿狀細胞在低光下工作,只能提取亮度信號,但感光靈敏度極高,是錐狀細胞感光靈敏度的10000倍。錐狀細胞既能感光,又能感色。錐狀細胞在亮光下能感受彩色色調(diào)。錐狀細胞有三種類型,它們在可見光譜上有重疊,三種類型的感光峰值分別位于紅色(570nm)、綠色(535nm)、藍色(445nm)附近波長上。綠色波長對亮度感覺的貢獻最大,其次是紅色波長,而藍色最小。光敏細胞按其形狀可分為桿狀細胞和錐狀細胞。人眼中大約有眼球的前室中充滿對可見光透明的水狀液體,這些液體能吸收一部分紫外線。玻璃質(zhì)液體是充滿了膠質(zhì)的透明結(jié)構(gòu)體,起著保護眼睛的濾光作用。眼睛觀看景物時,光線通過透明的角膜、前室水狀液體、水晶體以及玻璃質(zhì)液體,使影像聚焦在視網(wǎng)膜的中心部位——黃斑區(qū)。視網(wǎng)膜上的光敏細胞受到光刺激產(chǎn)生電脈沖,電脈沖沿著神經(jīng)纖維傳遞到視神經(jīng)中樞,由于各細胞產(chǎn)生的電脈沖不同,大腦就形成了一幅景象感覺。

人眼的視覺系統(tǒng)從外界獲取圖像,就是在眼睛視網(wǎng)膜上獲得周圍世界的光學(xué)成像(圖1-18),然后由視覺接收器(桿狀細胞和錐狀細胞),將光圖像信息轉(zhuǎn)化為視網(wǎng)膜的神經(jīng)活動電信息,最后通過視神經(jīng)纖維,把這些圖像信息傳送入大腦,由大腦獲得圖像感知。眼球的前室中充滿對可見光透明的水狀液體,這些液體能吸收一圖1-18用眼睛看物體的成像圖解圖1-18用眼睛看物體的成像圖解1.2.2相對視敏度

人眼對輻射功率相同而波長不同的光產(chǎn)生的亮度感覺是不同的。1933年國際照明委員會(CIE)經(jīng)過大量實驗和統(tǒng)計,給出人眼對不同波長的光亮度感覺的相對靈敏度,稱為相對視敏度。圖1-19所示為相對視敏函數(shù)曲線,它說明人眼對各種波長光的亮度感覺靈敏度是不同的。在同一亮度環(huán)境中,輻射功率相同的條件下,人眼對波長等于555nm的黃綠光的亮度感覺最大,并令其亮度感覺靈敏度為1;人眼對其它波長光的亮度感覺靈敏度均小于黃綠光(555nm),故其它波長光的相對視敏度V(λ)都小于1。例如波長為660nm的紅光的相對視敏度V(660)=0.061,所以,這種紅光的輻射功率應(yīng)比黃綠光(555nm)大16倍(即1/0.061=16),才能給人相同的亮度感覺。1.2.2相對視敏度

人眼對輻射功率相同而波長不同的圖1-19相對視敏函數(shù)曲線圖1-19相對視敏函數(shù)曲線1.2.3明暗視覺

人眼的相對視敏函數(shù)曲線表明的是在白天正常光照下人眼對各種不同波長光的敏感程度,故又稱為明視覺視敏函數(shù)曲線(如圖1-20中虛線所示)。明視覺過程主要是由錐狀細胞完成的,它既產(chǎn)生亮度感覺,又產(chǎn)生彩色感覺,因此,這條曲線主要反映錐狀細胞對不同波長光的亮度敏感特性。在弱光條件下,人眼的視覺過程主要由桿狀細胞完成,而桿狀細胞對各種不同波長光的靈敏程度將不同于明視覺視敏函數(shù)曲線,表現(xiàn)為對波長短的光的敏感度有所增大,即曲線向左移,這條曲線稱暗視覺視敏函數(shù)曲線,如圖1-20中實線所示。在弱光條件下,桿狀細胞只有明暗感覺,而沒有彩色感覺。1.2.3明暗視覺

人眼的相對視敏函數(shù)曲線表明的是在圖1-20暗視覺、明視覺相對視敏函數(shù)曲線圖1-20暗視覺、明視覺相對視敏函數(shù)曲線1.2.4對比靈敏度

人類視覺系統(tǒng)能夠適應(yīng)的亮度范圍是非常大的,從最暗到最亮可達1010的數(shù)量級。然而這并不是說視覺系統(tǒng)可同時工作于這樣大的亮度范圍。實際上,視覺系統(tǒng)是通過改變其對亮度的總靈敏度來適應(yīng)這個亮度范圍的,這個現(xiàn)象就叫做亮度適應(yīng)性。人類視覺系統(tǒng)能夠同時分辨的亮度范圍相對于整個適應(yīng)范圍是很小的,而且人眼對亮度光強變化的響應(yīng)是非線性的,通常把人眼主觀上剛剛可辨別亮度差別所需的最小光強差值稱為亮度的可見度閾值。也就是說,當(dāng)光的亮度I增大時,人眼在一定幅度內(nèi)感覺不出,必須變化到一定值I+ΔI時,人眼才能感覺到亮度有變化,ΔI/I就是對比靈敏度。1.2.4對比靈敏度

人類視覺系統(tǒng)能夠適應(yīng)的亮度范圍視覺系統(tǒng)很難正確判斷亮度的絕對大小。然而,當(dāng)判定兩個亮度中哪個更大時,視覺系統(tǒng)則有較好的能力,也就是說,人眼有較好的對比靈敏度。對比靈敏度的實驗如圖1-21所示。在亮度為I的均勻光場中央,放上一個亮度為I+ΔI的圓形目標,ΔI從零開始增加,直到剛好能鑒別出亮度差異,這時測得ΔI的值同背景光I有關(guān)。ΔI在很大范圍內(nèi)近似同I成正比,即ΔI/I近似為常數(shù),其值大約為0.02,此值稱為韋伯比。ΔI與I成正比意味著,人眼區(qū)分圖像亮度差別的靈敏度與其附近區(qū)域的背景亮度(平均亮度)有關(guān),背景亮度越高,靈敏度越低。視覺系統(tǒng)很難正確判斷亮度的絕對大小。然而,當(dāng)判定兩個亮度中圖1-21對比靈敏度實驗圖1-21對比靈敏度實驗1.2.5可見度閾值和馬赫帶效應(yīng)

可見度閾值指人眼剛好可以識別的干擾值,低于該閾值的干擾值是覺察不出來的。當(dāng)某像素的鄰近像素有較大的亮度變化時,可見度閾值會增加。對于一條亮度變化較大的邊緣,在邊緣處的閾值比離邊緣較遠的閾值要高。這就是說,邊緣“掩蓋”了邊緣鄰近像素的信號干擾。這種效應(yīng)稱為視覺掩蓋效應(yīng)。邊緣的掩蓋效應(yīng)與邊緣出現(xiàn)的時間長短、運動情況有關(guān)。當(dāng)出現(xiàn)的時間較長時,掩蓋效應(yīng)較顯著。當(dāng)圖像穩(wěn)定地出現(xiàn)在視網(wǎng)膜上時,掩蓋效應(yīng)就不那么明顯??梢姸乳撝岛脱谏w效應(yīng)對圖像編碼量化器的設(shè)計有重要作用。利用這一視覺特效,在圖像邊緣區(qū)域可以容忍較大的量化誤差,因而可使量化級減少,從而降低數(shù)碼率。1.2.5可見度閾值和馬赫帶效應(yīng)

可見度閾值指人眼剛對于圖像不同空間頻率的成分,人眼具有不同的靈敏度。視覺系統(tǒng)對空間低頻和空間高頻的敏感性較差,但是對空間中頻則有很高的敏感性,所以會在亮度突變的地方產(chǎn)生亮度過沖現(xiàn)象,這種過沖對人眼所見的景物有增強其輪廓的作用。這就是所謂的馬赫帶效應(yīng),如圖1-22所示。對于圖像不同空間頻率的成分,人眼具有不同的靈敏度。視覺圖1-22馬赫帶效應(yīng)圖1-22馬赫帶效應(yīng)

1.3圖像質(zhì)量的評估標準與方法

1.主觀評價

主觀評價是相對較為準確的圖像質(zhì)量評價方法,因為主觀評價直接反映人眼的感覺。主觀評價常用的指標是基于5級質(zhì)量制或5級損傷制的平均意見分(MOS分)。根據(jù)ITU-RBT.500的規(guī)定,在標準環(huán)境下對標準圖像(標準環(huán)境和標準圖像的定義詳見ITU-RBT.500標準)的質(zhì)量評估標準如表1-2所示。1.3圖像質(zhì)量的評估標準與方法

1.主觀評價表1-2在標準環(huán)境下對標準圖像的質(zhì)量評估標準表1-2在標準環(huán)境下對標準圖像的質(zhì)量評估標準

(1)雙刺激連續(xù)質(zhì)量分級法(DoubleStimulusContinuousQualityScale,DSCQS):將待評估的圖像序列和相應(yīng)的基準序列交替播放給評估者觀看,每個圖像持續(xù)時間為10s,按此播放順序在處理圖像的前后都有一個直接的質(zhì)量比較。每個圖像之后有2s的灰畫面間隔,評估者可在此期間打分。最后以所有分數(shù)的平均值作為該序列的測試值,如圖1-23所示。這樣做的好處是能夠最大程度地降低圖像場景、情節(jié)等對主觀評測的影響。(1)雙刺激連續(xù)質(zhì)量分級法(DoubleStimul圖1-23雙刺激連續(xù)質(zhì)量分級法圖1-23雙刺激連續(xù)質(zhì)量分級法最后評分為(1-33)

(2)單刺激連續(xù)質(zhì)量評價法(SingleStimulusContinuousQualityEvaluation,SSCQE):這種方法只把被評價的圖像序列播放給評估者觀看,評價時間長達30s,評估者在觀看的同時通過調(diào)節(jié)一個滑板的位置指向相應(yīng)的評價分值給出評分。最終的平均分通過公式(1-33)給出。最后評分為(1-33)(2)單刺激連續(xù)質(zhì)量評價法

2.客觀測量

客觀測量基于仿人眼視覺模型的原理對圖像質(zhì)量進行客觀評估,并給出客觀評價分。近幾年,隨著人們對人眼視覺系統(tǒng)研究的深入,客觀測量的方法和工具不斷被開發(fā)出來,其測量結(jié)果也與主觀評價較吻合。國際上成立了ITU-R視頻質(zhì)量專家組(VideoQualityExpertsGroup,ITU-RVQEG)專門研究和規(guī)范圖像質(zhì)量客觀測量的方法和標準。

VQEG規(guī)定了兩個簡單的技術(shù)參數(shù):均方差(MSE)和峰值信噪比(PSNR)。

均方差分為兩種:歸一化均方差(NMSE)和峰值均方差(PMSE)。2.客觀測量

客觀測量基于仿人眼視覺模型的原理對圖歸一化均方差(NMSE)定義為(1-34)峰值均方差(PMSE)定義為(1-35)峰值信噪比(PSNR)定義為(1-36)歸一化均方差(NMSE)定義為(1-34)峰值均方差此外,還有許多圖像質(zhì)量模型,這些模型在測量圖像質(zhì)量時都基于人眼視覺特性。圖1-24是一種典型的基于解碼圖像與基準圖像差值的圖像質(zhì)量客觀測量模型。圖1-24基于解碼圖像與基準圖像差值的質(zhì)量模型此外,還有許多圖像質(zhì)量模型,這些模型在測量圖像質(zhì)量時都基圖像質(zhì)量的客觀測量方法可分為相對評估(RelativeEvaluation)和絕對評估(AbsoluteEvaluation)兩類。

(1)相對評估:將處理過的視頻(壓縮或經(jīng)傳輸)與原始視頻比較以獲得相對評估的指標值,并根據(jù)這些指標值評估圖像質(zhì)量。相對評估一般用于片源制作時的質(zhì)量評估,準確性高。

(2)絕對評估:直接對處理過的視頻(壓縮或經(jīng)傳輸)進行評估以獲得絕對評估的指標值,并根據(jù)這些指標值評估圖像質(zhì)量。絕對評估一般是在線觀看測試,準確性不如相對評估。

采用客觀測量工具,不僅減少了對人力、物力的需求,而且測量時間大大縮短,甚至可做到實時監(jiān)測。圖像質(zhì)量的客觀測量方法可分為相對評估(Relative感謝感謝謝謝,精品課件資料搜集謝謝,精品課件資料搜集第一章圖像的基礎(chǔ)知識1.1圖像信號的基本概念1.2人眼的視覺原理1.3圖像質(zhì)量的評估標準與方法第一章圖像的基礎(chǔ)知識1.1圖像信號的基本概念

1.1圖像信號的基本概念

文字、語音和圖像信息是人們在日常的生活和工作中經(jīng)常接觸的信息形式。其中,語音和簡單的圖像(圖形)是人類早期用于信息交流的主要方式。人類從自然界獲得的信息大部分都來自于視覺(即圖像)。圖像與文字、語音相比,具有直觀生動、具體形象等許多顯著的優(yōu)點。

圖像是由光能量進入人的視覺系統(tǒng)所重現(xiàn)出來的視覺信息。光能量或者由發(fā)光物體直接發(fā)出,或者由光源發(fā)出后照射在物體上經(jīng)過反射、衍射、折射等形成。圖像來自于自然界或者人為的處理和合成,其原始的形態(tài)是連續(xù)變換的模擬量。與文字、語音信息相比較,圖像信息主要具有信息量大、直觀性強以及模糊性、實體性和形象化等特點。1.1圖像信號的基本概念

文字、語音和圖像1.1.1圖像的表示

一幅圖像實際上記錄的是物體輻射能量的空間分布(可以看做空間各點光強度的集合),這個分布是空間坐標、時間和波長的函數(shù)。圖像的亮度一般可以用多變量表示為

I=f(x,y,

z,λ,t)

(1-1)

當(dāng)一幅圖像為平面單色靜止圖像時,空間坐標變量z、波長λ和時間變量t可以從函數(shù)中去除,一幅圖像可以用二維函數(shù)f(x,y)來表示:

f(x,y)=i(x,y)r(x,y)

(1-2)

由于I表示的是物體的反射、投射或輻射能量,因此它是正的、有界的,即

0≤I≤Imax

(1-3)1.1.1圖像的表示

一幅圖像實際上記錄的是物體輻射式(1-1)是一個多變量函數(shù),不易于分析,需要采用一些有效的方法進行降維。由三基色原理知,I可表示為三個基色分量的和:

I=IR+IG+IB

(1-4)

式中,(1-5)式(1-1)是一個多變量函數(shù),不易于分析,需要采用一些有1.1.2圖像的數(shù)字化過程

一般的圖像(模擬圖像)無法直接用計算機進行處理,為此必須將各類模擬圖像轉(zhuǎn)化為數(shù)字圖像。數(shù)字圖像的生成過程如圖1-1所示。數(shù)字圖像可以理解為對二維函數(shù)f(x,y)進行采樣和量化(即離散處理)后得到的圖像,通常用二維矩陣來表示一幅數(shù)字圖像。對一幅圖像進行數(shù)字化的過程就是在計算機內(nèi)生成一個二維矩陣的過程。因此,采樣(選取一種離散的柵格去表示一幅圖像)和量化(將顏色和亮度映射成整數(shù))是圖像數(shù)字化的兩個主要過程。1.1.2圖像的數(shù)字化過程

一般的圖像(模擬圖像)無圖1-1數(shù)字圖像生成過程圖1-1數(shù)字圖像生成過程連續(xù)圖像數(shù)字化的結(jié)果,將產(chǎn)生能夠用于計算機處理的離散數(shù)據(jù)結(jié)構(gòu),一般為一個矩陣。假如一幅連續(xù)圖像f(x,y)被取樣,則產(chǎn)生的數(shù)字圖像有M行和N列。坐標(x,y)的值變成離散值,通常將這些離散坐標用整數(shù)表示(見圖1-2)。圖1-2圖像的坐標連續(xù)圖像數(shù)字化的結(jié)果,將產(chǎn)生能夠用于計算機處理的離散數(shù)據(jù)當(dāng)然,圖像數(shù)字化的過程與采樣間隔(頻率)有關(guān)。采樣頻率太低,則圖像會產(chǎn)生混疊現(xiàn)象而失真。另外,灰度或顏色數(shù)目的選取也與重建后的圖像質(zhì)量有關(guān)。一般地,數(shù)量級在8位(256色)的黑白圖像是比較好的,而高質(zhì)量的彩色圖像需要使用三基色疊加的辦法。

模擬圖像數(shù)字化后,二維矩陣的每一個位置稱為像素(Pixel),每個像素都包括位置信息和灰度。對于單色即灰度圖像而言,每個像素的亮度用一個數(shù)值來表示,通常數(shù)值范圍為0~255,即可用一個字節(jié)來表示,0表示黑,255表示白,而其它數(shù)值表示灰度級別,如圖1-3所示。當(dāng)然,圖像數(shù)字化的過程與采樣間隔(頻率)有關(guān)。采樣頻率圖1-3圖像的數(shù)字化過程圖1-3圖像的數(shù)字化過程

1.采樣

采樣(Sampling)就是對圖像空間坐標的離散化,它決定了圖像的空間分辨率(圖像中可分辨的最小細節(jié),主要由采樣間隔值決定)。用一個網(wǎng)格把待處理的圖像覆蓋,然后把每一小格上模擬圖像的各個亮度取平均值,作為該小方格的值;或者把方格的交叉點處模擬圖像的亮度值作為該方格交叉點上的值,如圖1-4所示。1.采樣

采樣(Sampling)就是對圖像空間坐圖1-4圖像采樣圖1-4圖像采樣圖像平面分割成離散點的集合,結(jié)果是一個樣點值陣列,故又叫點陣取樣。每個離散點即像素,可用離散坐標(i,j)表示。點陣采樣的數(shù)學(xué)描述為(1-6)(1-7)上式對二維離散函數(shù)f(x,y)進行均勻采樣,S(x,y)為二維離散采樣函數(shù),Δx和Δy為相應(yīng)方向上的采樣間隔,fp(x,y)為采樣函數(shù)。圖像平面分割成離散點的集合,結(jié)果是一個樣點值陣列,故又叫采樣函數(shù)的頻譜經(jīng)過傅立葉變換可以表示為(1-8)由二維采樣定理可知,如果二維信號f(x,y)的二維傅立葉頻譜F(u,v)滿足(1-9)其中,Uc、Vc對應(yīng)于空間位移變量x和y的最高截止頻率,則當(dāng)采樣間隔Δx、Δy滿足奈奎斯特準則(圖1-5):(1-10)采樣函數(shù)的頻譜經(jīng)過傅立葉變換可以表示為(1-8)由二時,可以由f(x,y)的采樣值f(iΔx,jΔy)唯一地恢復(fù)原圖像信號f(x,y)。圖1-5奈奎斯特準則時,可以由f(x,y)的采樣值f(iΔx,jΔy)唯一地

2.量化

把采樣后所得的各像素灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化(量化實例如圖1-6所示)。量化是對圖像幅度坐標的離散化,它決定了圖像的幅度分辨率。

量化的方法包括分層量化、均勻量化和非均勻量化。分層量化是把每一個離散樣本的連續(xù)灰度值分成有限多的層次。均勻量化是把原圖像灰度層次從最暗至最亮均勻分為有限個層次,如果采用不均勻分層就稱為非均勻量化。2.量化

把采樣后所得的各像素灰度值從模擬量到離散圖1-6圖像量化實例圖1-6圖像量化實例以均勻量化(圖1-7)為例,幅度坐標劃分為n個(即0,r1,r2,…,rn)量化電平(即量化級,一般灰度圖像為28,這樣一來,每個采樣可以用8bit來表示),將每一個采樣量化為離它最近的電平(即將取樣點或像素的灰度或亮度離散化,使之由連續(xù)量轉(zhuǎn)換為離散的整數(shù)值即灰度值)。以均勻量化(圖1-7)為例,幅度坐標劃分為n個(即0,圖1-7均勻量化圖1-7均勻量化劃分子區(qū)間和設(shè)定量化值,使量化造成的失真最小(圖1-8)。將[r0,rk)均分成k個子區(qū)間后,每個區(qū)間的長度為(1-11)各子區(qū)間以它的中心位置作為量化值:(1-12)劃分子區(qū)間和設(shè)定量化值,使量化造成的失真最小(圖1-8)圖1-8量化示意圖圖1-8量化示意圖對一幅圖像,當(dāng)量化級數(shù)一定時,采樣點數(shù)對圖像質(zhì)量有著顯著的影響。采樣點數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點數(shù)減少時,圖像上的塊狀效應(yīng)就逐漸明顯。當(dāng)圖像的采樣點數(shù)一定時,采用不同量化級數(shù)的圖像質(zhì)量也不一樣。量化級數(shù)越多,圖像質(zhì)量越好;量化級數(shù)越少,圖像質(zhì)量越差(圖1-9)。量化級數(shù)最小的極端情況就是二值圖像,圖像會出現(xiàn)假輪廓。對一幅圖像,當(dāng)量化級數(shù)一定時,采樣點數(shù)對圖像質(zhì)量有著顯著圖1-9量化級數(shù)與圖像質(zhì)量之間的關(guān)系圖1-9量化級數(shù)與圖像質(zhì)量之間的關(guān)系連續(xù)圖像經(jīng)過空間采樣—灰度量化后,變成了離散的數(shù)字圖像。通??梢杂萌缦戮仃噥肀硎疽粋€數(shù)字圖像:(1-13)表示像素明暗程度的整數(shù)稱為像素的灰度級(灰度值或灰度)。一幅數(shù)字圖像中不同灰度級的個數(shù)稱為灰度級數(shù),用G表示。在數(shù)字圖像處理中一般將這些量取為2的整數(shù)冪,即G=2g,g表示存儲圖像像素灰度值所需的比特位數(shù)。一幅大小為M×N、灰度級數(shù)為G的圖像所需的存儲空間,即圖像的數(shù)據(jù)量,大小為M×N×g(bit)。例如:

128×128×6=98304(12KB)

512×512×8=2097152(256KB)連續(xù)圖像經(jīng)過空間采樣—灰度量化后,變成了離散的數(shù)字圖像。1.1.3數(shù)字圖像的基本類型

1.位圖

位圖是使用二維像素矩陣來表示的圖像,每個像素的亮度信息或顏色信息用灰度或RGB分量表示。每一個像素值所占的比特位數(shù)可以是1、4、8、16、24、32位等,位數(shù)越高,所包含的信息越豐富。位圖可以分為設(shè)備相關(guān)位圖(DDB)與設(shè)備無關(guān)位圖(DIB)。DDB沒有自己的調(diào)色板,顏色模式必須依賴于輸出設(shè)備,如256色以下的位圖中存儲的像素值是系統(tǒng)調(diào)色板的索引,其顏色依賴于系統(tǒng)調(diào)色板。DIB有自己的調(diào)色板信息,其顏色模式與設(shè)備無關(guān),可以永久地存儲圖像,常保存在經(jīng)*.BMP或*.DIB為反綴的文件中。1.1.3數(shù)字圖像的基本類型

1.位圖

位圖是

2.二值圖像

二值圖像由黑、白兩種顏色構(gòu)成,也叫黑白圖像,其圖像像素只存在0、1兩個值,0表示黑色,1表示白色。它相當(dāng)于圖像量化為2級,在計算機中用一位比特數(shù)表示。二值圖像有很多應(yīng)用,比如可用于圖像處理中的圖像前景和背景的分割,目標的形狀分析等。一幅典型的二值圖像如圖1-10所示。2.二值圖像

二值圖像由黑、白兩種顏色構(gòu)成,也叫圖1-10二值圖像圖1-10二值圖像

3.灰度圖像

二值圖像其實是灰度圖像的特殊情況。灰度圖像在黑色和白色之間加入了2g-2個顏色深度(g表示比特位數(shù)),包含幾種不同的灰度級,如16級、64級,256級等。例如,當(dāng)像素灰度級用8bit表示時,每個像素的取值就是256種灰度中的一種,即每個像素的灰度值為0~255中的一個。通常,用0表示黑色,255表示白色,從0到255亮度逐漸增加。

I=f(x,y),0≤f(x,y)≤k-1

(1-14)

其中,(x,y)為空間坐標,k表示灰度級,I表示圖像的光強度。3.灰度圖像

二值圖像其實是灰度圖像的特殊情況。

4.索引圖像

所謂索引圖像就是把像素的值作為顏色的索引序號,根據(jù)這個序號能找到該像素對應(yīng)的實際顏色。用于存儲索引顏色的顏色表就是調(diào)色板,Windows位圖等許多圖像格式的圖像都應(yīng)用了調(diào)色板技術(shù)。調(diào)色板中包含了紅、綠、藍三種顏色的不同組合。表1-1中每一行記錄一種顏色的R、G、B值,當(dāng)表示一種顏色時,只需要指出它在顏色表中的索引,這樣16色只需要4位,且顏色表占用的內(nèi)存很小。調(diào)色板技術(shù)就是使用索引圖像顯示的一種技術(shù)。4.索引圖像

所謂索引圖像就是把像素的值作為顏色的表1-1常見的RGB顏色組合值/調(diào)色板表1-1常見的RGB顏色組合值/調(diào)色板

5.RGB彩色圖像

自然界中幾乎所有顏色都可以由三原色紅(R)、綠(G)、藍(B)組合而成,RGB圖像應(yīng)用了這一原理。RGB圖像中每一個像素的顏色由相應(yīng)的紅、綠、藍顏色分量共同決定,控制這三種顏色的合成比例就可正確顯示該像素的顏色。RGB圖像中的紅、綠、藍分量分別用8位表示,共24位,理論上可以合成224種不同的顏色。5.RGB彩色圖像

自然界中幾乎所有顏色都可以由三1.1.4顏色模式

1.光和彩色

光和各種射線都屬于電磁波,電磁波的波譜范圍很廣,包括無線電波、紅外線、可見光、紫外線、X射線、γ射線等,如圖1-11所示。其中人的眼睛能看到的那一部分叫可見光,可見光是攜帶能量的電磁輻射中的很小一部分,兼有波動特性和微粒特性。

可見光是由波長在380nm~770nm范圍內(nèi)的電磁波組成的。光源通常能發(fā)射某一波長范圍內(nèi)的能量,并且其強度可以在時間、空間上變化。光的彩色感覺決定于光譜成分(即它的波長組成)。1.1.4顏色模式

1.光和彩色

光和各種射線圖1-11可見光的波長范圍圖1-11可見光的波長范圍

1)亮度(Intensity)

亮度是指發(fā)光物體表面發(fā)光強弱的物理量(數(shù)字圖像處理中指高灰度級的概率)。一般來說,照射光越強,反射光也越強,看起來就越亮。顯然,如果彩色光的強度降到使人看不到了,在亮度標尺上它應(yīng)與黑色對應(yīng)。同樣,如果其強度變得很大,那么亮度等級應(yīng)與白色對應(yīng)。亮度是非彩色屬性,彩色圖像中的亮度對應(yīng)于黑白圖像中的灰度。需要注意的是,不同顏色的光,強度相同時照射同一物體也會產(chǎn)生不同的亮度感覺。

2)色調(diào)(Hue)

色調(diào)是一種或多種波長的光作用于人眼所引起的彩色感覺。它描述純色的屬性(純黃色、純橘色或純紅色)。1)亮度(Intensity)

亮度是指發(fā)光物體表

3)飽和度(Saturation)

飽和度是指顏色的純度即摻入白光的程度,或者是指顏色的深淺程度。飽和度的深淺與色光中白光的成分的多少有關(guān)。一種純彩色光中加入的白光成分越少,該彩色的飽和度越高;反之,白光成分越多,飽和度就越低。其數(shù)值為百分比,介于0~100%之間。純白光的色彩飽和度為0,而純彩色光的飽和度則為100%。飽和度反映了某種色光被白光沖淡的程度。對于同一色調(diào)的彩色光,飽和度越高,顏色越鮮明或者說越純,相反則越淡。

飽和度受亮度和對比度的雙重影響。白光或黑色光的成分過多都會使飽和度降低,一般亮度好、對比度高的圖像有很好的色飽和度。3)飽和度(Saturation)

飽和度是指顏色

2.圖像的三基色

所謂三基色原理就是自然界常見的各種顏色光,都可由紅(R)、綠(G)、藍(B)三種色光按照不同比例相配而成,同樣絕大多數(shù)顏色也可以分解成紅、綠、藍三種色光。這是色度學(xué)中的最基本原理。三基色的混色模式有兩種:增色模式(相加混色)和減色模式(相減混色)。

設(shè)組成某種顏色C所需的三個量分別用R、G、

B表示,每種量的比例系數(shù)為r、g、b,則有

C=rR+bB+gG

(1-15)(1-16)2.圖像的三基色

所謂三基色原理就是自然界常見的各

R、G、B

各用一個字節(jié)可表示28×28×28≈1677萬色。當(dāng)R、G、B全為1時為白色,R、G、B全為0時為黑色,R、G、B數(shù)值相等為灰色,R、G、B中哪個數(shù)值大就偏向哪種顏色。

照明光源的基色系通常包括紅色、綠色和藍色,稱為RGB基色,應(yīng)用于相加混色中。反射光源的基色系通常包括青色(Cyan)、深紅色(Magenta,也稱品紅色)和黃色(Yellow),稱為CMY基色,應(yīng)用于相減混色中。實際中,RGB基色和CMY基色是互補的,也就是說,混合一個色系中的兩種彩色會產(chǎn)生另外一個色系中的一種彩色。例如,紅色和綠色混合會產(chǎn)生黃色??梢杂脠D1-12表示這種關(guān)系。上述原理構(gòu)成了彩色攝取和顯示的基礎(chǔ)。(1-17)r+b+g=1

R、G、B各用一個字節(jié)可表示28×28×28≈1

3.圖像的彩色模型

彩色模型(彩色空間或彩色系統(tǒng))的用途是在某些標準下用通??山邮艿姆绞胶喕噬囊?guī)范。常用幾種不同的色彩空間表示圖形和圖像的顏色,以對應(yīng)于不同的場合和應(yīng)用。因此,數(shù)字圖像生成、存儲、處理及顯示時,若對應(yīng)不同的色彩空間就需要作不同的處理和轉(zhuǎn)換?,F(xiàn)在主要的彩色模型有RGB模型、CMY模型、YUV模型、YIQ模型、YCbCr模型、HSI模型等。3.圖像的彩色模型

彩色模型(彩色空間或彩色系統(tǒng))圖1-12RGB三原色疊加效果示意圖圖1-12RGB三原色疊加效果示意圖

1)RGB——加色混合色彩模型

RGB色彩模型就是模型中的各種顏色都是由紅、綠、藍三基色以不同的比例相加混合而產(chǎn)生的,即C=aR+b

G+cB。其中,C為任意彩色光,a、b、c為三基色R、G、B的權(quán)值。在CRT顯示中,將R、G、B的亮度值限定在一定范圍內(nèi),如0~1。每個像素的顏色都用三維空間的一個點來表示,就成為一個三維彩色模型,如圖1-13所示。1)RGB——加色混合色彩模型

RGB色彩模型就是圖1-13RGB立方體圖1-13RGB立方體

2)CMY——減色混合色彩模型

CMY色彩模型就是利用青色(Cyan)、品紅色(Magenta)、黃色(Yellow)這三種彩色按照一定比例來產(chǎn)生需要的彩色。CMY是RGB三基色的補色,所以存在如下的關(guān)系:(1-18)2)CMY——減色混合色彩模型

CMY色彩模型就是

3)YUV模型和YIQ模型——應(yīng)用于電視傳播系統(tǒng)的色彩模型

對于視頻信號的傳輸,為了減少所需的帶寬并與單色電視系統(tǒng)兼容,采用亮度/色度坐標系模型。但通常用于彩色顯示的RGB基色混合了光的亮度和色度屬性。1931年國際照明協(xié)會(CIE)規(guī)定了XYZ彩色坐標,但XYZ基色不能直接用于產(chǎn)生彩色,它主要用于定義其它的基色和彩色的數(shù)字說明,如用于傳輸彩色電視信號的YUV和YIQ彩色坐標。

在XYZ模型中,Y表示亮度(強度),X和Y共同反映顏色的色度特性(色調(diào)和飽和度)。除了能分離亮度和色度信息,XYZ另一個優(yōu)點是幾乎所有的可見彩色都能由非負的激勵值規(guī)定。XYZ坐標系中的(X,Y,Z)與RBG坐標系中的(R,G,B)的關(guān)系如下:(1-19)3)YUV模型和YIQ模型——應(yīng)用于電視傳播系統(tǒng)的色彩根據(jù)美國國家電視制式委員會的規(guī)定,當(dāng)白光的亮度用Y來表示時,它和紅、綠、藍三色光的關(guān)系可用如下的方程描述:

Y=0.299R+0.587G+0.114B

(1-20)

這就是常用的亮度公式。

色差U、V是由B-Y、

R-Y按不同比例壓縮而成的,即(1-21)其中,α、γ為壓縮系數(shù)。根據(jù)美國國家電視制式委員會的規(guī)定,當(dāng)白光的亮度用Y來表示

YUV色彩空間與RGB色彩空間的轉(zhuǎn)換關(guān)系如下:(1-22)如果要由YUV空間轉(zhuǎn)化成RGB空間,只要進行逆運算即可。在NTSC制中采用的是YIQ彩色模型,Y仍表示亮度,I和Q分量是U和V分量旋轉(zhuǎn)33°后的結(jié)果,即(1-23)YUV色彩空間與RGB色彩空間的轉(zhuǎn)換關(guān)系如下:(1-22對U和V分量進行旋轉(zhuǎn)后使得I對應(yīng)橙色到青色范圍的彩色,Q對應(yīng)綠色到紫色范圍。因為人眼對綠色到紫色范圍內(nèi)的變化與橙色到青色范圍內(nèi)的變化相比不敏感,因此Q分量可以比I分量采用更小的帶寬傳輸。YIQ值與RGB的關(guān)系是:(1-24)對U和V分量進行旋轉(zhuǎn)后使得I對應(yīng)橙色到青色范圍的彩色,Q

4)YCbCr顏色空間

YCbCr顏色空間是由YUV顏色空間派生的一種顏色空間,主要用于數(shù)字電視系統(tǒng),以及圖像、視頻壓縮標準中,如JPEG、MPEG系列、H.26x系列。在從RGB到Y(jié)CbCr的轉(zhuǎn)換中,輸入、輸出都是8位的二進制格式。

YCbCr與RGB的關(guān)系如下:(1-25)4)YCbCr顏色空間

YCbCr顏色空間是由YU

5)HSI——視覺彩色模型

前面討論的幾種彩色模型不是從硬件的角度就是從色度學(xué)的角度提出的,都不能很好地與肉眼的視覺特性相匹配。為此,根據(jù)肉眼的色彩視覺三要素(色調(diào)(Hue)、飽和度(Saturation)、亮度(Intensity))提出了HSI彩色模型。這種模型能把色調(diào)、亮度和飽和度的變化情形表現(xiàn)得很清楚。

HSI模型中,彩色信息的色調(diào)H和飽和度S可用圖1-14所示的光環(huán)來表示。其中,飽和度是色環(huán)的原點(圓心)到彩色點的半徑的長度;環(huán)的外圍圓周是純(飽和度為1)的顏色;中心是中性(灰色)色調(diào),即飽和度為0。色調(diào)由角度表示。假設(shè)色環(huán)的0°表示彩色為紅色,120°為綠色,240°為藍色,色調(diào)從0°~360°覆蓋了所有可見的光譜的彩色。假設(shè)光的強度I為色環(huán)的垂線,則H、S、I坐標將構(gòu)成一個柱形彩色空間?;叶壬{(diào)沿著軸線從底部的黑變到頂部的白。所以,最大亮度、最大飽和度的顏色位于圓柱的頂面的圓周上。5)HSI——視覺彩色模型

前面討論的幾種彩色模型圖1-14圓形彩色平面的HSI彩色模型圖1-14圓形彩色平面的HSI彩色模型從RGB到HSI模型的轉(zhuǎn)變關(guān)系是:

色調(diào)H分量為(1-26)其中,(1-27)飽和度S分量為(1-28)亮度I分量為(1-29)從RGB到HSI模型的轉(zhuǎn)變關(guān)系是:

色調(diào)H分量為(1

HSI到RGB的轉(zhuǎn)換,其轉(zhuǎn)化公式有些不同,它取決于要轉(zhuǎn)換的點落在原始色所分割的哪個扇區(qū)。(1-30)(1-31)HSI到RGB的轉(zhuǎn)換,其轉(zhuǎn)化公式有些不同,它取決于要轉(zhuǎn)

(1-32)采用RGB模型和HIS模型如圖1-15所示。(1-32)采用RGB模型和HIS模型如圖1-15所示。圖1-15色度學(xué)與彩色模型圖1-15色度學(xué)與彩色模型1.1.5圖像分辨率

圖像分辨率一般分為空間分辨率和灰度級分辨率。

由空間采樣率決定的分辨圖像最小細節(jié)的能力叫圖像的空間分辨率(有些地方簡稱分辨率),它直接取決于圖像的像素數(shù),一般用單位長度上采樣的像素數(shù)目或單位長度上的線對數(shù)目表示(單位為像素/厘米或線對數(shù)/厘米);也指精確測量和再現(xiàn)一定尺寸的圖像所必需的像素個數(shù)(單位為像素×像素),這是現(xiàn)在常用的表示方法。對于采樣來說,采樣間隔越小,圖像矩陣越大,空間分辨率越高,可觀察的細節(jié)越多;反之采樣間隔越大,空間分辨率越低。比如一幅用二維數(shù)組f(M,N)表示的數(shù)字圖像,像素總數(shù)M×N稱為圖像的空間分辨率,其中M為行分辨率,N為列分辨率。1.1.5圖像分辨率

圖像分辨率一般分為空間分辨率和前面說明采樣點數(shù)與圖像質(zhì)量之間的關(guān)系時也說過這個問題,如圖1-16所示,圖(a)到圖(d)的像素數(shù)依次減半,實際上是采樣間隔依次增加到前一幅圖像采樣間隔的兩倍,意味著圖像空間分辨率依次減少為前面的四分之一,結(jié)果使圖像細節(jié)逐漸消失,圖像所傳達的信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論