版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第二章
視覺特性與圖像制式信息工程學院管張均2.1圖像的表示圖像信號:圖像是一種可視化的信息,圖像信號是圖像信息的理論描述方法。圖像景物在某種成像介質(zhì)上再現(xiàn)的視覺信息圖:物體透射或反射光的分布像:人的視覺系統(tǒng)對圖的接收并在大腦形成的印象或認識具有明暗和色彩變化的許多單個像素信息的集合,以及接收者的感覺和心理狀態(tài)圖形?圖像?視頻?圖形是用幾何要素和操作過程(點、線、長方、橢圓、指定點填充等等)描述的圖,即由計算機繪制的直線、圓、矩形、曲線、圖表等。圖像是掃描儀、攝像機等輸入設備捕捉實際畫面產(chǎn)生的,用具有一定灰度級的點陣描述的圖。靜止圖像是與時間無關的相片圖像。運動圖像指的是人們所能見到的活動圖像(如電視、電影、錄像等)。由于要使圖像運動起來,需要每秒鐘內(nèi)有足夠多的幀數(shù)(如PAL制式電視每秒25幀,電影每秒24幀)。每一幀就是一幅單獨的靜止圖像。圖形:物理單元:點、直線、曲線等基本的幾何對象屬性:線寬、填充色、填充模式、對象間的空域關系等文件格式:PHIGS、GKS、IDS、EPS等圖像:
物理單元:像素屬性:編碼屬性---像素深度(pixeldepth)
顯示屬性---分辨率、尺寸等文件格式:GIF、TIFF、BMP、JPEG、PNG等視頻:物理單元:像素(pixel)、幀(frame)屬性:編碼屬性---像素深度顯示屬性---分辨率、尺寸、幀率等文件格式:M-JPEG、MPEG、WMV、ASF、AVI等2.2圖像的數(shù)字化傳統(tǒng)的遠程通信系統(tǒng)中,所傳送的信息一般是以模擬形式出現(xiàn)的,表現(xiàn)為一種時間連續(xù)的信號。而在計算機通信中,信號的傳送方式采用數(shù)字方式,把連續(xù)變化的模擬信號轉(zhuǎn)換為離散的數(shù)字信號。信號的數(shù)字化主要包括取樣、量化和編碼三大部分。數(shù)字化后的信號一般稱為PCM信號(脈沖編碼調(diào)制)。取樣是實現(xiàn)空間上的離散化。量化是實現(xiàn)幅度上的離散化。編碼是實現(xiàn)把離散化了的幅度用二進制碼型表示。圖像的數(shù)字化
電視信號的數(shù)字化和復原
(a)A/D變換(b)D/A變換
又稱抽樣或取樣,它把時間上連續(xù)的模擬信號變成時間上離散的有限個樣值的信號。這是模擬信號數(shù)字化過程中的第一步處理措施。采樣采樣定理根據(jù)傅立葉變換原理,在一定條件下,一個時間函數(shù)f(t)可以變換成一個相應的頻率函數(shù)F(w)。采樣定理是選擇采樣頻率的理論依據(jù)。其主要內(nèi)容為:對于一個最高頻率為f0的模擬信號,當選擇的取樣頻率fs滿足fs>=2f0時,經(jīng)過取樣后的離散信號能夠包含原模擬信號的全部信息。并且,經(jīng)過低通濾波和反變換,可以不失真地回復出原模擬信號。圖像的采樣
將物理圖像按行列掃描劃分后,每個小塊區(qū)域稱為像素(pixel)。測量每個像素位置上的值就稱為采樣。二維采樣定理圖像在采樣時,必須滿足二維采樣定理,確保無失真或有限失真地恢復原圖像。如果二維圖像信號f(x,y)的頻譜F(u,v)滿足其中Uc和Vc
為頻域最高截止頻率。則采樣圖像的頻譜為二維采樣定理當采樣周期Δx和Δy滿足通過采樣信號f(mΔx,nΔy)能唯一地恢復原圖像信號f(x,y),且有二維采樣定理(a)原圖像的頻譜(b)采樣信號的頻譜采樣信號的頻譜量化在時間軸上已變?yōu)殡x散的樣值脈沖,在幅度軸上仍會在動態(tài)范圍內(nèi)有連續(xù)值,即在幅度軸上仍是模擬信號的性質(zhì),故還必須用有限個電平等級來代表實際量值。量化是幅度上把連續(xù)值的模擬信號變?yōu)殡x散值的數(shù)字信號,也就是對每個樣點值數(shù)字化,使其和有限個可能電平中的一個對應。
另外,人的耳朵或眼睛都不可能辨別出微小的信號變化,所以也沒有必要對很小的幅度差別如實地傳送。這就是說,量化對于實現(xiàn)數(shù)字化不僅是必要的,而且也是可能的。目標:當幅值的概率分布為p(z),量化值為qi時,總誤差平方為最小時失真最小。圖像的量化量化可分為兩種:均勻量化非均勻量化
在輸入信號的動態(tài)范圍內(nèi),量化間距處處相等的量化稱為均勻量化或線性量化。均勻量化時信噪比隨輸入信號動態(tài)幅度的增加而增加。采用均勻量化,在強信號時固然可把噪聲淹沒掉,但在弱信號時,噪聲的干擾就十分顯著。為改善弱信號時的信噪比,量化間距應隨輸入信號幅度而變化,大信號時進行粗量化,小信號時進行細量化,也就是采用非均勻量化。
如圖所示,設信號的整個動態(tài)變化范圍為A,共分為M個量化等級;每個量化層距為?A,采用均勻量化,則有:?A=A/M。量化等級通常用二進制的位數(shù)b表示,它與十進制數(shù)M之間的關系為:M=2b或b=log2M。b通常稱為量化位數(shù)。例如,對于8位量化,相應的十進制量化等級M為:M=2b=256。MA?A123均勻量化將[z0,zk)均分成k個子區(qū)間后,每個區(qū)間的長度各子區(qū)間以它的中心位置作為量化值當待量化值在[z0,zk)區(qū)間內(nèi)均勻分布時主要思想:p(z)不等于常數(shù),使總誤差平方最??;樣本值在某個取值范圍內(nèi)較頻繁出現(xiàn),而在另外一些范圍內(nèi)出現(xiàn)不多;可對樣本值較頻繁出現(xiàn)的取值范圍采用較小的量化區(qū)間,而在其它地方用較大的量化區(qū)間;這樣就可在不增加量化級數(shù)k的條件下,降低平均誤差,減少量化噪聲。非均勻量化為使總誤差最小,令其對zi和qi的偏導數(shù)為0,可得步驟:初始化所有的量化電平qi;更新所有的判決電平zi,并計算總誤差的初始值;更新所有的量化電平qi;再次計算總誤差的值;如果兩次計算的總誤差之差小于某個閾值,則算法停止,否則轉(zhuǎn)入第2步。LloydMax量化器Max量化器在誤差平方和最小的意義上是最優(yōu)的。取樣點數(shù)和量化級數(shù)的選取假定一幅圖像取M×N個采樣點,對樣點值進行Q級分檔取整。那么對M、N和Q如何取值呢?首先,Q一般總是取2的整數(shù)次冪,如Q=2b,b為正整數(shù),通常稱為對圖像進行b比特量化。
M、N可以相等,也可以不等。若取相等,則圖像距陣為方陣,分析運算方便一些。其次,量化過程相當于由輸入值找到它所在的區(qū)間號,反量化過程相當于由量化區(qū)間號得到對應的量化電平值。量化處理是把一批輸入量化到一個輸出級上,量化區(qū)間總數(shù)遠遠小于輸入值的總數(shù),所以量化能實現(xiàn)數(shù)據(jù)壓縮。很明顯,反量化后并不能保證得到原來的值,因此量化過程是一個不可逆過程,用量化的方法來進行壓縮編碼是一種非信息保持型編碼。通常這兩個過程均可用查表法實現(xiàn)。對b來講,取值越大,量化區(qū)間總數(shù)越接近于輸入值總數(shù),所引起的量化失真就越小。在實際應用中,如果圖像的總比特數(shù)M×N×b給定,對M×N和b的分配往往是根據(jù)圖像的內(nèi)容和應用要求以及系統(tǒng)本身的技術指標來選定的。例如,若圖像中有大面積灰度變化緩慢的平滑區(qū)域(如人的特寫照片等),則M×N取樣點可以少些,而量化比特數(shù)b多些,這樣可使重建圖像灰度層次多些。若b太少,在圖像平滑區(qū)往往會出現(xiàn)“假輪廓”。反之,對于復雜景物圖像,如群眾場面的照片等,量化比特數(shù)b可以少些,而取樣點數(shù)M×N要多些,這樣就不會丟失圖像的細節(jié)。究竟M×N和b如何組合才能獲得滿意的結果很難講出一個統(tǒng)一的方案。不同采樣點數(shù)對圖像質(zhì)量的影響(a)256×256(b)128×128(c)64×64(d)32×32(e)16×16(f)8×8不同量化級別對圖像質(zhì)量的影響(a)256色
(b)64色
(c)32色(d)16色
(e)4色
(f)2色圖像處理時要考慮三個因素:分辨率、圖像深度和顯示深度。分辨率指圖像的清晰度。有屏幕分辨率、圖像分辨率和像素分辨率。屏幕分辨率:指計算機顯示器屏幕顯示圖像的最大顯示區(qū),以水平和垂直像素點表示。圖像分辨率:指數(shù)字化的圖像的大小,以水平和垂直像素點個數(shù)表示。例如:在640×480屏幕上顯示320×240個像素點的圖像。
像素分辨率:指像素的寬高比,一般為1:1。2.3圖像的基本屬性2.3圖像的基本屬性圖像深度(顏色深度):表示數(shù)字位圖圖像中每個像素上用于表示顏色的二進制數(shù)字位數(shù)。目前黑白圖像為8比特,彩色為24比特。顯示深度:表示顯示器上每個點用于顯示顏色的二進制數(shù)字位數(shù)。若顯示深度小于圖像深度,則圖像失真。圖像文件大小的計算(Byte):圖像數(shù)據(jù)量大小=像素總數(shù)×圖像深度÷8例如:一幅640×480的256色圖像為:
640×480×8÷8=307200Bytes2.3圖像的基本屬性真彩(Truecolor)彩色圖像直接采用包含R、G、B三基色分量的像素值。偽彩(Pseudocolor)Colorlook-uptable,原圖像的灰度值按一定的數(shù)學關系同各種顏色對應起來獲得彩色圖像的色調(diào)。直接色每個像素值分為R、G、B分量,這些分量再作為單獨索引值,通過相應的彩色變換表找出基本色調(diào)。這樣產(chǎn)生的RGB強度值構成的彩色稱為直接色。用這種系統(tǒng)產(chǎn)生顏色與真彩色系統(tǒng)相比,相同之處是都采用RGB分量決定基色強度,不同之處是后者的基色強度直接用RGB決定,而前者的基色強度由RGB經(jīng)變換后決定。因而這兩種系統(tǒng)產(chǎn)生的顏色就有差別。試驗結果表明,使用直接色在顯示器上顯示的彩色圖像看起來更真實自然。2.4數(shù)字圖像種類表達方法矢量圖(vectorgraphics)(圖形)點陣圖(bitmappedgraphics)
(圖像)
利用點、線、矩形、多邊形、圓和弧線等描述;采用數(shù)學計算方式,通過計算機語言編程表達簡單、小塊圖像時有效,適合做各種變換
用像素表示像素具有顏色、亮度和屬性掃描儀、攝像機、錄像機、激光視盤、視頻信號數(shù)字卡等獲得優(yōu)點:適合表現(xiàn)大量的圖像細節(jié),可以很好的反映明暗的變化、復雜的場景和顏色,表現(xiàn)逼真的圖像效果。缺點:文件比較大,放大時清晰度會降低并出現(xiàn)鋸齒。
通過數(shù)學公式計算獲得描述圖形的直線和曲線,文件一般較小,例如文字、線條。優(yōu)點:無論放大、縮小或旋轉(zhuǎn)等都不會失真。缺點:難以表現(xiàn)色彩層次豐富的逼真圖像效果,而且顯示矢量圖也需要花費一些時間。矢量圖點陣圖亮度等級二值圖像灰度圖像色調(diào)等級黑白圖像彩色圖像空間的維數(shù)平面二維圖像立體三維圖像2.4數(shù)字圖像種類灰度圖(gray-scaleimage)
256級灰度圖,每個像素1Byte二值圖,每個像素1bit256色彩色圖及其轉(zhuǎn)換的256級灰度圖24位真彩色圖及其轉(zhuǎn)換的256級灰度圖
彩色圖(colorimage)2.5彩色圖像信號的表示和編碼彩色的三參量(HIS)是視覺系統(tǒng)對一個區(qū)域呈現(xiàn)的顏色的感覺,即對物體輻射或者反射的光波波長的感覺。有一千萬種以上,顏色專業(yè)人士可辨認出三百至四百種顏色?;旌舷噜忣伾珪r,可以獲得在這兩種顏色之間連續(xù)變化的色調(diào)。色調(diào)(hue):表征各顏色(具有不同頻率或波長)飽和度是指色彩的鮮艷程度,即顏色的純潔性。當一種顏色滲入其它光(比如白光)成分愈多時,顏色愈不飽和。飽和度為零時,圖像變成一灰度圖像。飽和度(saturation):表征顏色的濃度亮度是視覺系統(tǒng)對可見物體輻射或者發(fā)光多少的感知屬性。
亮度是主觀感覺,例如,一根點燃的蠟燭在黑暗中看起來要比白熾光下亮。亮度的單位是坎德拉/平方米(cd/m2)亮度是用反映視覺特性的光譜敏感函數(shù)加權之后得到的輻射功率。亮度(intensity或brightness):表征總能量,明暗效果,與顏色無關。另外一個常見概念--對比度對比度指不同顏色之間的差異,對比度越大,兩種顏色之間的反差就越大。比如對一幅灰度圖像,提高對比度會更加黑白分明,反之,則得到一幅灰色的圖像。HIS顏色圓錐空間模型2.5.1彩色圖像信號的分量表示黑白圖像信號(灰度級,8比特,人眼對灰度的最大分辨力為26。)
彩色視頻信號(彩色的三基色原理,RGB混合而成,24比特,不便于傳輸和存儲。)
利用人的視覺特性降低彩色圖像的數(shù)據(jù)量,將RGB轉(zhuǎn)換到別的彩色空間,轉(zhuǎn)換后每一種彩色都產(chǎn)生一個亮度分量和兩個色度分量信號。
RGB
YUV,YIQ,YCbCr顏色空間(彩色空間)RGB型/計算機圖形顏色空間電視機和計算機的顏色顯示系統(tǒng)CMY型/彩色印刷及打印模型與RGB三基色互補YUV型/電視系統(tǒng)顏色空間(Luminanceandchrominance)廣播電視需求,以壓縮色度信息有效傳輸電視圖像
YCbCr(數(shù)字電視采用的顏色空間)XYZ型/CIE顏色空間國際照明委員會定義的國際性顏色空間標準,是YUV的前身RGB彩色空間
在多媒體計算機中,用得最多的是RGB彩色空間表示,因為顯示器的輸入需要RGB三個彩色分量。不管多媒體系統(tǒng)中使用什么彩色空間,最后輸出一定要轉(zhuǎn)換為RGB。配色方程:F=r[R]+g[G]+b[B],r、g、b為三色系數(shù)。白光的亮度公式:PAL,Y=0.22[R]+0.707[G]+0.071[B]NTSC,Y=0.299[R]+0.587[G]+0.114[B]系數(shù)不同是因為三基色波長選擇不同。RGB彩色空間
彩色圖像描述示例RGB彩色空間
自然界中任何一種光都可由R、G、B三基色按不同的比例相加混合而成,當三基色分量都為0(最弱)時混合為黑色光,當三基色分量都為k(最強)時混合為白色光。任一顏色F是這個三維坐標中的一點,調(diào)整三色系數(shù)r、g、b中的任一系數(shù)都會改變F的坐標值,也即改變了F的色值。RGB顏色空間采用物理三基色表示,因而物理意義很清楚,適合彩色顯像管工作。然而這一體制并不適應人的視覺特點,因而產(chǎn)生了其他不同的顏色空間表示法。
RGB圖像亮度信號Y和色差信號U、V亮度信號表示了單位面積上反射光線的強度色差信號(所謂色差信號,就是指基色信號中的三個分量信號R、G、B與亮度信號之差)決定了彩色圖像信號的色調(diào)。最后發(fā)送端將Y、U、V三個信號進行編碼,用同一信道發(fā)送出去,這就是在PAL(德、英、中、朝)彩色電視制式中使用的YUV彩色空間。YUV彩色空間úúú?ùêêê?éúúú?ùêêê?é----=úúú?ùêêê?éBGRVUY100.0515.0615.0436.0289.0147.0114.0587.0299.0YUV與RGB彩色空間變換Y=0.299[R]+0.587[G]+0.114[B]Y和U、V相互獨立。即黑白灰度圖與單色圖是相互獨立的,因此可以對這些單色圖分別進行編碼。這也解決了彩色電視機與黑白電視機的兼容問題。降低數(shù)字彩色圖像數(shù)據(jù)量。利用人眼視覺特性可把幾個相鄰像素不同的色彩值當做相同的色彩值來處理(即大面積著色原理),從而減少了所需的數(shù)據(jù)量。在PAL彩色電視制式中,亮度信號的帶寬為4.43MHz,用以保證足夠的清晰度,而把色差信號的帶寬壓縮為1.3MHz,達到了減少帶寬的目的。優(yōu)點視頻采集卡得到的圖像Y和U、V分別采用不同的采樣頻率。目前常用的Y、U、V采樣頻率的比例有4∶4∶4、4∶2∶2、4:1:1、4:2:0。如要存儲RGB彩色圖像,每分量用8個比特表示,圖像的大小為640×480像素,那么所需要的存儲容量為640×480×3×8/8=921600字節(jié);如果用Y∶U∶V=4∶1∶1來表示,對于Y每個像素仍用8比特表示,而對于色差信號U、V,每4個像素用8比特表示,則存儲量變?yōu)?40×480×(8+2+2)/8=460800字節(jié)。盡管數(shù)據(jù)量減少了一半,但人眼察覺不出有明顯變化。YUV圖像在NTSC彩色電視制式中選用YIQ彩色空間,其中Y表示亮度,I、Q是兩個彩色分量。
I、Q與U、V是不相同的。人眼的彩色視覺特性表明,人眼對紅、黃之間顏色變化的分辨能力最強;而對藍、紫之間顏色變化的分辨能力最弱。所以把相角為123度的橙色(紅黃之間的顏色)及其相反相角303度的青色定義為I軸。與I正交的色度信號軸叫Q軸。即色彩信號I表示人眼最敏感的色軸,Q表示人眼最不敏感的色軸。YIQ彩色空間úúú?ùêêê?éúúú?ùêêê?é---=úúú?ùêêê?éBGRQIY311.0523.0212.0321.0275.0596.0114.0587.0299.0YIQ與RGB彩色空間變換的對應關系:在NTSC制式(美、加)中,傳送人眼分辨能力較強的I信號時,用較寬的頻帶(1.3~1.5MHz);而傳送人眼分辨能力較弱的Q信號時,用較窄的頻帶(0.5MHz)。Y分量的帶寬是4.2MHz。YCbCr彩色空間是由ITU-R(國際電聯(lián)無線標準部,原國際無線電咨詢委員會CCIR)制定的彩色空間。按照CCIR601-2標準,將非線性的RGB信號編碼成(數(shù)字化)YCbCr,編碼過程開始是先采用符合SMPTE-CRGB(它定義了三種熒光粉,即一種參考白光,應用于演播室監(jiān)視器及電視接收機標準的RGB)的基色作為r校正信號。YCbCr彩色空間YCbCr與RGB彩色空間變換的對應關系如下所示。YCbCr是針對數(shù)字圖像壓縮提出的彩色空間。實際上很多時候,我們是把YUV和YIQ/YCrCb模型混為一談的。YUV模型用于PAL制式的電視系統(tǒng),Y表示亮度,UV并非任何單詞的縮寫。YIQ模型與YUV模型類似,用于NTSC制式的電視系統(tǒng)。YIQ顏色空間中的I和Q分量相當于將YUV空間中的UV分量做了一個33度的旋轉(zhuǎn)。YCbCr顏色空間是由YUV顏色空間派生的一種顏色空間,主要用于數(shù)字電視系統(tǒng)中。從RGB到YCbCr的轉(zhuǎn)換中,輸入、輸出都是8位二進制格式。úúú?ùêêê?é+úúú?ùêêê?é-----=úúú?ùêêê?éBG081.0419.0500.0500.0331.0169.0114.0587.0299.0RCCYrbúúú?ùêêê?é1281280CMY顏色空間彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機或彩色打印機就只能使用一些能夠吸收特定的光波而反射其他光波的油墨或顏料。油墨或顏料的三基色是青(Cyan)、品紅(Magenta)和黃(Yellow),簡稱為CMY。青色對應藍綠色,品紅對應紫紅色。理論上說,任何一種由顏料表現(xiàn)的顏色都可以用這三種基色按不同的比例混合而成,這種顏色表示方法稱為CMY顏色空間表示法。彩色打印機和彩色印刷系統(tǒng)都采用CMY顏色空間。CMY顏色空間相減混色:它減少了為視覺系統(tǒng)識別顏色所需要的反射光。在CMY相減混色中,三基色等量相減時得到黑色;等量黃色(Y)和品紅(M)相減而青色(C)為0時,得到紅色(R);等量青色(C)和品紅(M)相減而黃色(Y)為0時,得到藍色(B);等量黃色(Y)和青色(C)相減而品紅(M)為0時,得到綠色(G)。RGB空間與CMY空間的互補關系CMY空間正好與RGB空間互補,也即用白色減去RGB空間中的某一顏色值就等于同樣顏色在CMY空間中的值。2.5.2彩色圖像信號編碼對于彩色圖像信號數(shù)字壓縮編碼,可以采用兩種不同的編解碼方案:一種是復合編碼,它直接對復合圖像信號進行采樣、編碼和傳輸;另一種是分量編碼,它首先把復合圖像中的亮度和色度信號分離出來,然后分別進行取樣、編碼和傳輸。分量編碼是圖像信號壓縮編碼的主流(圖像壓縮國際標準)。Q:什么是彩色的三參量,什么是彩色的三基色,RGB、YUV、YIQ、CMY等彩色空間那些實現(xiàn)了亮色分離?彩色圖像信號分量編碼系統(tǒng)的基本框圖為了便于國際節(jié)目的交換及數(shù)字設備的互操作,CCIR(ITU-R)頒布了分量電視信號數(shù)字編碼標準ITU-RBT.601(CCIR601)(俗稱D1,標清)。組成:亮度、色差信號8比特均勻量化采樣頻率13.5MHZPAL:fs=625(行/幀)25(幀/s)864(樣點數(shù)/行)NTSC:fs=52529.97858每一行有效樣本數(shù)均為720個2.6數(shù)字視頻的分量傳輸ITU-RBT.601推薦亮度采樣結構2.6.1圖像子采樣4:2:2(ITU-RBT.601推薦)Y:Cb:Cr:取樣點的位置:525行系統(tǒng):
M=720,N=480,60Hz刷新頻率Y=720480,Cb=Cr=360480625行系統(tǒng):
M=720,N=576,50Hz刷新頻率
Y=720576,Cb=Cr=36057612345M水平像素123N垂直像素像素
電視演播室應用的國際標準4:2:0123N垂直像素12345M水平像素像素與4:2:2具有相同亮度分辨率,色度分辨率降低為前者一半隔行掃描用于數(shù)字廣播電視525行系統(tǒng):Y=720480,Cb=Cr=360240625行系統(tǒng):Y=720576,Cb=Cr=360288問題:這兩種采樣格式下,彩色電視信號數(shù)字化后,存儲每幀所需的存儲容量及1小時電視/電影所需的存儲容量?SIF(源中間格式)水平和垂直分辨率為4:2:0格式的一半(亞取樣)刷新速率(時間分辨率)減半:30/25Hz接收時進行插值計算主要用于存儲CIF(通用中間格式)結合625行系統(tǒng)的空間分辨率、525行系統(tǒng)的時間分辨率Y=352288,Cb=Cr=176144,30Hz取樣點與SIF同主要用于電視會議為轉(zhuǎn)換到CIF格式,則525行系統(tǒng)需要行頻轉(zhuǎn)換器,而625行系統(tǒng)需要幀頻轉(zhuǎn)換器。QCIF(四分之一通用中間格式)水平和垂直分辨率為CIF的1/2時間分辨率為CIF的1/2或1/4Y=176144,Cb=Cr=8872,15Hz/7.5Hz用于可視電話S-QCIF(標準四分之一通用中間格式)更低分辨率用于調(diào)制解調(diào)器和PSTN提供的信道Y=12896,Cb=Cr=64482.7.1傅里葉變換二維連續(xù)傅里葉變換定義:設f(x,y)是獨立變量x和y的函數(shù),且在±∞上絕對可積,則定義積分 為二維連續(xù)函數(shù)f(x,y)的傅里葉變換,并定義
為F(u,v)的逆變換。f(x,y)和F(u,v)為傅里葉變換對。2.7圖像信號變換2.7.1傅里葉變換二維離散傅里葉變換尺寸為M×N的離散圖像函數(shù)f(x,y)的DFT反變換可以通過對F(u,v)求IDFT獲得
2.7.1傅里葉變換二維離散傅里葉變換
F(u,v)即為f(x,y)的頻譜,通常是復數(shù):幅度譜
相位譜
2.7.1傅里葉變換幅度譜的特點
①頻譜的直流成分為,說明在頻譜原點的傅里葉變換F(0,0)等于圖像的平均灰度級。②幅度譜|F(u,v)|關于原點對稱,即
。③圖像f(x,y)平移后,幅度譜不發(fā)生變化,僅有相位發(fā)生變化。2.7.1傅里葉變換
(a)原始圖像(b)圖像的頻譜圖(c)中心化的頻譜圖傅里葉變換2.7.2離散余弦變換一維離散余弦變換
保證變換基的規(guī)范正交性,引入常量C(k),定義:其中DCT逆變換為2.7.2離散余弦變換
二維離散余弦變換
正變換:逆變換:線性組合2.7.2離散余弦變換二維離散余弦變換
(a)wpeppers2圖像(b)wpeppers2圖像的DCT系數(shù)
離散余弦變換
2.7.3沃爾什-哈達瑪變換
哈達瑪矩陣:元素僅由+1和-1組成的正交方陣。正交方陣:指它的任意兩行(或兩列)都彼此正交,或者說它們對應元素之和為零。哈達瑪變換要求圖像的大小為N=2n
。一維哈達瑪變換核為其中,bk(z)代表z的二進制表示的第k位值。2.7.3沃爾什-哈達瑪變換
一維哈達瑪正變換一維哈達瑪逆變換二維哈達瑪正變換二維哈達瑪逆變換2.7.3沃爾什-哈達瑪變換
正反變換都可通過兩個一維變換實現(xiàn)。高階哈達瑪矩陣可以通過如下遞推公式求得:N=8的哈達瑪矩陣為2.8.1基本統(tǒng)計分析量2.8圖像的統(tǒng)計特性圖像熵圖像的灰度平均值(mean)2.8.2直方圖2.8圖像的統(tǒng)計特性直方圖的橫坐標是圖像的各灰度級,縱坐標是各個灰度出現(xiàn)的像素個數(shù)。歸一化的直方圖(histogram)定義為灰度級出現(xiàn)的相對頻率。即
式中,N表示像素的總數(shù);nk表示灰度級為k的像素的數(shù)目。2.8.2直方圖2.8圖像的統(tǒng)計特性直方圖(a)lena圖像(b)lena圖像的直方圖2.9.1空域增強2.9圖像增強技術灰度分段線性變換對整個灰度區(qū)間進行分段,采用分段線性函數(shù)進行變換。這種變換突出了感興趣的目標或灰度區(qū)間,相對抑制那些不感興趣的灰度區(qū)間。常用的是三段線性變換。三段線性變換為了將圖像灰度級的整個范圍或一段范圍擴展或壓縮到記錄或顯示設備的動態(tài)范圍內(nèi),可以采用灰度變換方法,使圖像動態(tài)范圍增大,圖像對比度擴展。2.9.1空域增強2.9圖像增強技術灰度分段線性變換對灰度區(qū)間[a,b]進行了線性拉伸,而灰度區(qū)間[0,a]和[b,fmax]則被壓縮。調(diào)整折線拐點的位置并控制分段直線的斜率,可以對圖像的任一灰度區(qū)間進行拉伸或壓縮。在遙感圖像分類中,感興趣的地貌特征可能有明顯的灰度變化,而那些過黑或過白的像素往往對應于玄武巖、水、冰等。2.9.1空域增強2.9圖像增強技術灰度分段線性變換三段線性變換實例
(a)原始圖像(b)增強效果2.9.1空域增強2.9圖像增強技術灰度非線性變換
當用某些非線性函數(shù)如對數(shù)、指數(shù)函數(shù)等作為映射函數(shù)時,可實現(xiàn)灰度的非線性變換。對數(shù)變換的一般表達式為:
g
=a+clg(f+1)對數(shù)變換可以增強低灰度級的像素,擴展低灰度區(qū),壓制高灰度級的像素,使灰度分布與人的視覺特性相匹配。2.9.1空域增強2.9圖像增強技術灰度非線性變換
對數(shù)變換后的Couple圖像2.9.1空域增強2.9圖像增強技術直方圖均衡化
通過對原圖像進行某種變換,使得圖像的直方圖變?yōu)榫鶆蚍植嫉闹狈綀D?;叶燃夁B續(xù)的灰度圖像:當變換函數(shù)是原圖像直方圖的累積分布函數(shù)時,能達到直方圖均衡化的目的。對于灰度級離散的數(shù)字圖像,用頻率來代替概率。2.9.1空域增強2.9圖像增強技術直方圖均衡化
直方圖均衡2.9.1空域增強2.9圖像增強技術均值濾波
大部分的噪聲都可以看作是隨機信號,對圖像的影響可以看作是孤立的。某一像素,如果它與周圍像素點相比,有明顯的不同,則可以認為該點被噪聲感染了。圖像f(x,y)鄰域S的平均g(x,y)可以表示為
2.9.1空域增強2.9圖像增強技術均值濾波
3×3模板平滑處理示意圖2.9.1空域增強2.9圖像增強技術均值濾波
常用的模板
2.9.1空域增強2.9圖像增強技術均值濾波
平滑處理的實例
(a)原始圖像(b)有噪聲的圖像(c)用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自動售貨機產(chǎn)品供應鏈分析
- 工業(yè)物聯(lián)網(wǎng)行業(yè)相關項目經(jīng)營管理報告
- 人造琥珀制小雕像產(chǎn)品供應鏈分析
- 手表修理或保養(yǎng)行業(yè)相關項目經(jīng)營管理報告
- 健身指導課程行業(yè)相關項目經(jīng)營管理報告
- 光電轉(zhuǎn)換器產(chǎn)品供應鏈分析
- 電源電纜項目運營指導方案
- 廢水處理工程行業(yè)相關項目經(jīng)營管理報告
- 紡織品清棉機細分市場深度研究報告
- 危險物質(zhì)倉庫儲存行業(yè)營銷策略方案
- 2024-2030年中國盾構機行業(yè)發(fā)展趨勢與投資策略建議報告
- 2024年重慶高考化學試題卷(含答案解析)
- 堅持人民至上以人民為中心心得體會三篇
- 2024年新人教版數(shù)學七年級上冊 3.2 求代數(shù)式的值 教學課件
- 2025屆四川省綿陽市高三第一次調(diào)研測試物理試卷含解析
- 初中足球運球技術教案
- 2024-2030年中國原油行業(yè)發(fā)展趨勢及發(fā)展前景研究報告
- 2024年秋季學期新人教版生物七年級上冊課件 第三章 微生物 2.3.4 病毒
- 04S519小型排水構筑物(含隔油池)圖集
- 統(tǒng)編版(2024)道德與法治七年級上冊:第1-13課全冊教案(共26課時)
- 2024-2030年中國磚瓦行業(yè)發(fā)展分析及發(fā)展前景與投資研究報告
評論
0/150
提交評論