第四章靜止圖像編碼_第1頁
第四章靜止圖像編碼_第2頁
第四章靜止圖像編碼_第3頁
第四章靜止圖像編碼_第4頁
第四章靜止圖像編碼_第5頁
已閱讀5頁,還剩114頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章靜止圖像編碼4.1概述

4.2二值圖像編碼4.3灰度圖像編碼4.4靜止圖像編碼標準

作業(yè)4.1概述所謂靜止圖像,是相對于運動圖像而言,指觀察到的圖像內(nèi)容和狀態(tài)是不變化的。靜止圖像有兩種情況,一種是信源為靜止的;另一種是從運動圖像中截取的某一幀圖像形成的,有時也稱為“凝固”圖像。靜止圖像是不動的,可以用較長的時間間隔對其進行抽樣。4.1概述利用現(xiàn)有的電話信道和電視信道進行窄帶靜止圖像的傳輸沒有增加線路的費用,這一特點是靜止圖像的優(yōu)勢。

4.1概述靜止圖像數(shù)字傳輸系統(tǒng)的一般結(jié)構(gòu)

4.1概述靜止圖像傳輸?shù)奶囟ㄒ螅河捎趫D像是靜止的,人眼易于觀察圖像中的細節(jié),因此要求所傳輸?shù)膱D像具有更高的清晰度。在窄帶信道中傳輸時往往需要幾十秒鐘才能傳完一幅完整的圖像,現(xiàn)在多采用逐漸浮現(xiàn)的編碼方式。4.2二值圖像編碼二值圖像是指只有黑白兩個亮度值的圖像,因此有時又稱為黑白圖像。很少有自然存在的二值圖像,它們大都是人為產(chǎn)生的,如文件圖像、建筑工程繪圖、電路設(shè)計圖等?;叶葓D像經(jīng)比特平面分解或抖動處理后也成為二值圖像。4.2二值圖像編碼二值圖像只有兩個亮度值,所以采集時每像素用一個比特表示,用“1”代表黑,“0”代表白,或者反之,這通常稱為直接編碼。直接編碼時,代表一幀圖像的碼元數(shù)對于該圖像的像素數(shù)。4.2二值圖像編碼目前傳輸二值圖像最常用、最典型的通信方式是傳真。ITU-T已經(jīng)為傳真建議了一些國際標準。首先,它選出了8張標準文件樣本作為標準的測試圖像;其次,它根據(jù)對傳真文件的質(zhì)量要求,規(guī)定一幅A4大小的文件應該有1188條(或2376條)掃描線,相當于3.85(或7.7)條線/毫米,每條掃描線上有1728個像素。4.2二值圖像編碼1、游程長度編碼(RLC編碼)也叫行程長度編碼,其基本思想是:當按照二值圖像從左到右的掃描順序去觀察每一行時,一定數(shù)量的連續(xù)白點和一定數(shù)量的連續(xù)黑點總是交替出現(xiàn)。4.2二值圖像編碼若干取相同值的連續(xù)像素的數(shù)目叫做游程長度,簡稱游長,把連續(xù)白點和黑點的數(shù)目分別叫做“白長”和“黑長”。對不同長度的白長和黑長按其不同的出現(xiàn)概率分配以不同長度的碼字,就是游程長度編碼。4.2二值圖像編碼游程長度編碼先對每一行交替出現(xiàn)的白長和黑長進行統(tǒng)計,然后進行變長編碼。在進行變長編碼時,經(jīng)常采用哈夫曼編碼,在大量統(tǒng)計的基礎(chǔ)上,得到每種白長和黑長的發(fā)生概率。概率可分為兩種情況:一種是白長和黑長各自發(fā)生的概率分布;另一種是游長的概率分布,而不區(qū)分黑長和白長。4.2二值圖像編碼游長編碼主要應用于ITU為傳真制定的G3標準中,在該標準中,對黑長和白長分別建立了哈夫曼碼表,并且規(guī)定每一行總以白長開始,且其長度可以是0,而以一個一維的EOL碼(行尾碼)結(jié)束。4.2二值圖像編碼

設(shè)游程長度編碼的信息符號集由長度為1,2,…,N的各種游長組成。這里N是一條掃描線上的像素總數(shù)。如果不分黑、白游長而進行統(tǒng)一編碼,并設(shè)pi為長度為i的游長出現(xiàn)的概率,則游長的熵H和平均游長分別為:4.2二值圖像編碼于是游程長度的符號熵(即平均每個像素的熵)為:4.2二值圖像編碼當游長的分布是短游長出現(xiàn)的概率大,長游長的概率小時,可以采用所謂線性碼,這種碼的碼長近似與游長成正比,常稱為Ai碼。這里i代表碼字固定的長度遞增單位(比特)。A3碼表示15種游長4.2二值圖像編碼2、二值圖像的方塊編碼跳過白色塊(WBS)編碼的基本思想:在實際中,大多數(shù)二值圖像都是白色背景占大部分,黑像素只占圖像像素總是的很少一部分,因此,若能跳過白色區(qū)域,只對黑色像素編碼,就能減少傳輸?shù)臄?shù)碼率。4.2二值圖像編碼(1)一維WBS編碼

一維WBS編碼是把每一掃描行分成若干段,每段包含N個像素。若該段N個像素全是白色,那么只用1比特的碼字0來表示;若不全是白色,即使只包含一個黑色像素,也都用(N+1)比特的碼字來表示。這(N+1)bit的碼字中,第一個比特用1代表,其余的N比特采用直接編碼,即白色用0,黑色用1代表。

4.2二值圖像編碼【例】假如某段像素值是“黑白白黑”,那么相應的一維WBS編碼是什么?110014.2二值圖像編碼一維WBS編碼的平均碼字長度為:PN為某段出現(xiàn)全白的概率。對常見的典型二值文件圖像,N一般約為10。4.2二值圖像編碼(2)二維WBS編碼二維WBS編碼是把要傳送的圖像分成若干塊,每塊含有M×N個像素。全白像素的塊用一比特的碼字0表示,而非全白塊用(MN+1)bit的碼字表示,其中第一比特為1,其余的MN個比特采用直接編碼。4.2二值圖像編碼在實際中,人們常常根據(jù)圖像的局部結(jié)構(gòu)或同級特性改變段或子塊的大小,進行自適應編碼,則編碼效果會得到進一步改善。4.2二值圖像編碼【例】下圖是一種一維自適應WBS。設(shè)一行像素為1024個,編碼時將1024個像素分成幾段,每段長度分別為1024,64,16,4,所涉及的碼字如圖(b)所示。自適應WBS舉例4.3灰度圖像編碼在灰度圖像中,每一像素可呈現(xiàn)多種亮度值。對灰度圖像的編碼通??煞譃閮深?,一類是直接對灰度圖像的亮度值進行編碼,常用的方法有方塊編碼、逐漸浮現(xiàn)圖像的編碼、幀間編碼和內(nèi)插法編碼。4.3灰度圖像編碼另一類是將灰度圖像轉(zhuǎn)化為二值圖像,然后再對所得的二至圖像編碼,常用的方法有比特平面編碼和抖動編碼。4.3灰度圖像編碼一、抖動編碼

抖動編碼是將灰度圖像轉(zhuǎn)換為二值圖像,然后再對二值圖像進行編碼的方法。抖動其實是一種圖像處理技術(shù),它將灰度圖像的矩陣與一個和空間位置有關(guān)的閾值矩陣做比較。當輸入值超過閾值時輸出為1,反之,為0。這樣所建立的二值圖像由于黑、白像素的空間密度不同,就產(chǎn)生出灰度圖像的視覺。4.3灰度圖像編碼閾值矩陣稱為抖動矩陣,它是一個m×m的模板,每個元素值均不相同,取值為0,1,…,2m-1,表示0到2m-1個灰度級別的值。4.3灰度圖像編碼【抖動編碼的過程】

將抖動矩陣在整幅灰度圖像上做周期性移動,并與灰度圖像作比較,當圖像的像素值大于對應抖動矩陣的像素值時輸出為1,反之輸出為0,這樣就可獲得二值圖像。抖動法建立二值圖像的過程灰度圖像的抖動處理4.3灰度圖像編碼二、逐漸浮現(xiàn)圖像的編碼(漸進編碼)基本思想:在發(fā)送端首先傳輸一幅低分辨率的圖像,然后隨著傳輸過程的進行,逐漸傳送細節(jié)部分;在接收端,解碼器可以快速顯示一整幅低質(zhì)量的圖像,雖然圖像不甚清晰,但接收者可以較快地看到圖像的大致輪廓;隨著接收和解壓的圖像越來越多,顯示質(zhì)量逐漸提高,最后看到一幅清晰的圖像。4.3灰度圖像編碼漸進編碼的好處:如果在顯示過程中,接收者覺得不用收看更為仔細的部分,就可以通知發(fā)送端立即停止發(fā)送后續(xù)的細節(jié)部分,從而提高了傳輸?shù)男省?/p>

如果圖像經(jīng)過多次壓縮,并需在不同分辨率的設(shè)備上顯示時,解碼器可以根據(jù)需要確定解碼過程,當圖像達到特定輸出設(shè)備的分辨率時即停止解碼。

4.3灰度圖像編碼1、四叉樹漸進編碼方式原理:對于圖像中任意一個像素,其相鄰的幾個像素值有可能與其非常相似甚至相同。因此,當我們用相鄰幾個像素的平均值代替這幾個像素時,仍然可以看出原圖的輪廓。4.3灰度圖像編碼4.3灰度圖像編碼假設(shè)一幅2n×2n像素的圖像(n為正整數(shù))A,可以將A分成四個方陣A0、A1、A2和A3,它們的大小均為N/2×N/2,這一過程可以遞歸的重復n次,直至達到單個像素級。我們可以把A的圖像稱為0級,A0、A1、A2和A3四個方陣的圖像稱為1級,最后的單個像素為n級。某一個方陣可以標記為符號0、1、2、3中的一個,該方陣與它的前一級方陣的標記相連。4.3灰度圖像編碼可以把圖像的這種遞歸安排表示為樹。樹的根相當于整個圖像,樹的葉相當于單個像素。樹的結(jié)點相當于方陣,每個結(jié)點往下都是四條分枝,因而稱這樣的樹為四叉樹。N=4的四叉樹4.3灰度圖像編碼四叉樹所包含的全部結(jié)點數(shù):為了要存儲所有的方陣,以便傳輸?shù)浇邮斩艘垣@得逐漸浮現(xiàn)的圖像,所需要的存儲量大約增加了1/3。4.3灰度圖像編碼在逐漸浮現(xiàn)的圖像傳輸中,先傳輸0級圖像,它的值是所有像素亮度值的平均值,再傳輸1級圖像,它在四個方陣中的值為各方陣中所含像素亮度值的平均值,這樣,開始傳輸?shù)募墧?shù)低的圖像反映了圖像的概貌,隨著級數(shù)的增加,就浮現(xiàn)出越來越清晰的圖像。4.3灰度圖像編碼【記錄四叉樹的方法】4.3灰度圖像編碼對一幅圖像按照2×2的子塊進行分割?,F(xiàn)在考慮圖像中的第一個2×2的子塊,f0、f1、f2和f3為它的4個灰度值,計算它們的均值和差值di:i=1,2,3。4.3灰度圖像編碼于是有:4.3灰度圖像編碼由上面的式子可見,利用圖像子塊的一個均值和三個差值,可以恢復出該子塊的4個像素值,因此可以用均值和差值di作為存儲數(shù)據(jù),具體算法如下。4.3灰度圖像編碼第一步,置圖像級數(shù)k=n,即代表像素級,此時分辨率最高;第二步,將第k級圖像分為2×2的子塊,對每個子塊計算其均值和三個差值d1~d3;第三步,將計算的均值構(gòu)成第k-1級圖像,而差值記為差值數(shù)組D(k+1)。如果k>0,則k=k-1,轉(zhuǎn)第二步;否則,結(jié)束。4.3灰度圖像編碼【例】通過四叉樹算法對4×4的矩陣進行編碼。4.3灰度圖像編碼【解】首先置k=2,將2×2個像素組成一個子塊,共劃分出4個子塊。4.3灰度圖像編碼首先計算左上角的4個像素f00,f01,f02和f03的均值,再依次計算其他三個塊的均值,最終得到如圖(b)所示的結(jié)果。經(jīng)過第一次的處理后,顯示的第k-1級(即第1級)圖像如圖(c)所示,用每個子塊的均值代替4個像素的原灰度值。4.3灰度圖像編碼然后,計算差值數(shù)組。因為此時是計算第一級的差值,所以用D(1)表示該數(shù)組,它實際包括4組數(shù)據(jù),分別是D10、D11、D12和D13。4.3灰度圖像編碼接著進行第二次處理。此時利用圖(b)的上圖的4個像素,,和計算出均值,如圖(d)所示。顯示時,用代替4個像素的值,最終得到的第0級圖像亮度值為圖(e)所示。同時存儲差值D(0)。4.3灰度圖像編碼4.3灰度圖像編碼在建立各級圖像的過程中,只需要存儲各級圖像對應的差值數(shù)組,而各級圖像只用于建立上一級圖像和相應的差值數(shù)組,以后就不需要存儲了。最終得到的全部數(shù)據(jù)為I(0),D(0),D(1),…,D(n-1),其中I(0)為根圖像,它是整幅圖像的均值,實際上只有一個灰度值,D(0),D(1),…,D(n-1)為各級的差值數(shù)組,總數(shù)據(jù)量與原圖像像素數(shù)相同,為4n。4.3灰度圖像編碼發(fā)送端依次傳輸I(0),D(0),D(1),…,D(n-1),接收端就可以先在N×N大小的整幅畫面上顯示I(0),然后,隨著D(0),D(1),…,D(n-1)的接收,恢復出I(1),I(2),…,I(n),顯示的圖像越來越清晰,直到顯示原圖像。4.3灰度圖像編碼2、偽隨機掃描方法偽隨機掃描方法是一種對整幅畫面進行偽隨機抽樣顯示的方式。開始時,只能顯示少量像素位置上的亮度值,其他像素位置上不顯示。這些少量像素的位置不是規(guī)則的,而是在整幅畫面時隨機狀分布的。隨后顯示的像素越來越多,直至所有像素都顯示出來。4.4靜止圖像編碼標準目前,圖像壓縮標準化工作主要由國際標準化組織(ISO)、國際電工委員會(IEC)和國際電信聯(lián)盟(ITU-T)進行。4.4靜止圖像編碼標準一、二值圖像編碼標準二值圖像編碼最常用、最典型的例子是傳真。為此,ITU-T先后制定了G3和G4標準,其中G3使用MR(ModifiedREAD)編碼算法。而G4是G3的改進型,使用MMR(ModifiedMR)算法。4.4靜止圖像編碼標準另一個二值圖像壓縮標準是JBIG,JBIG(JointBi-levelImageCodingExpertsGroup)是聯(lián)合二值圖像專家組的縮寫。JBIG于1988年成立,1991年該標準獲得通過,其國家標準號為ISO/IEC11544,也稱ITU-TT.82建議。4.4靜止圖像編碼標準二、靜止圖像壓縮標準JPEGJPEG是聯(lián)合圖像專家組(JointPhotographicExpertsGroup)的簡稱,它是一個由國際標準組織ISO和國際電信聯(lián)盟ITU所建立的,從事靜態(tài)圖像壓縮標準制定的委員會?,F(xiàn)在人們也用JPEG表示靜態(tài)圖像壓縮標準,其國際標準號為ISO/IEC10918。4.4靜止圖像編碼標準JPEG標準的目標和適應性:適用于任何連續(xù)色調(diào)的數(shù)字圖像,對彩色空間、分辨率、圖像內(nèi)容等沒有任何限制。采用先進的算法,圖像的壓縮比及保真度可在較大范圍內(nèi)調(diào)節(jié),由用戶根據(jù)應用情況進行選擇。壓縮/還原的算法復雜度適中,使軟件實現(xiàn)時能達到一定的性能,硬件實現(xiàn)時成本不太高。4.4靜止圖像編碼標準有多種操作模式可供設(shè)計和使用時選擇:無損壓縮編碼模式:該模式保證準確恢復數(shù)字圖像的所有樣本數(shù)據(jù),與原數(shù)字圖像相比不會產(chǎn)生任何失真?;贒CT的順序編碼模式:它以DCT變換為基礎(chǔ),按照從左到右、從上到下的順序?qū)υ瓐D像數(shù)據(jù)進行壓縮編碼。圖像還原時,也是按照上述順序進行。4.4靜止圖像編碼標準基于DCT的漸進編碼模式:以DCT變換為基礎(chǔ),但使用多次掃描的方法對圖像數(shù)據(jù)進行編碼,以由粗到細逐步累加方式進行。解碼時,在屏幕上可以先看到圖像的大致面貌,然后逐步細化直到全部還原出來為止?;贒CT的分層編碼模式:以多種分辨率進行圖像編碼,先從低分辨率開始,逐步提高分辨率直到與原圖像分辨率相同為止。解碼時,重建圖像的過程也是如此。4.4靜止圖像編碼標準1、無損壓縮編碼JPEG選擇差分脈沖調(diào)制(DPCM)作為無損壓縮編碼的方法。4.4靜止圖像編碼標準預測器采用3-鄰域預測法,用三個相鄰采樣點(A、B和C)對當前編碼采樣點X進行預測,如圖所示。4.4靜止圖像編碼標準在無損編碼的模式下提供了7種預測器供用戶選擇:4.4靜止圖像編碼標準2、基于DCT的順序編碼模式先對源圖像中的所有8×8子圖像進行DCT變換,然后再對DCT系數(shù)進行量化,并分別對量化以后的系數(shù)進行差分編碼和游程長度編碼,最后再進行熵編碼。基于DCT的順序編碼過程基于DCT的順序解碼過程4.4靜止圖像編碼標準數(shù)據(jù)單元在編碼前,輸入圖像的每個分量被分割成相互不重疊的8×8的子塊,塊內(nèi)的64個數(shù)據(jù)組成一個數(shù)據(jù)單元(DU),如果圖像的行數(shù)或列數(shù)不是8的倍數(shù),則復制底行和最右邊一列至所需的倍數(shù)。4.4靜止圖像編碼標準雖然JPEG可以壓縮通常的RGB分量,但在亮度/色度空間(YUV空間)的壓縮效果更好。RGB與YUV之間的轉(zhuǎn)換并不包含在編解碼器中,而是應用程序在編碼之前和解碼之后根據(jù)需要完成。4.4靜止圖像編碼標準8×8的DCT

JPEG采用8×8大小的子圖像塊進行二維的離散余弦變換:正變換:反變換:其中:4.4靜止圖像編碼標準將F(u,v)寫成矩陣形成,則可以表示為:4.4靜止圖像編碼標準當f(x,y)為8bit像素,它的取值范圍為0~255,由此可以求出DC系數(shù)F(0,0)的取值范圍為0~2040。在進行變換之前,要將數(shù)字圖像采樣數(shù)據(jù)從無符號整數(shù)轉(zhuǎn)換到帶正負號的整數(shù),即把范圍為[0,28-1]的整數(shù)映射為[-28-1,28-1-1]范圍內(nèi)的整數(shù)。變換的方法是將輸入數(shù)據(jù)減去28-1。

4.4靜止圖像編碼標準量化量化過程就是將每個DCT系數(shù)除以各自的量化步長并取整,得到量化系數(shù)正變換:S(u,v)是一張量化表,給出8×8子塊中每個像素的量化步長,±0.5是對量化結(jié)果進行四舍五入。4.4靜止圖像編碼標準反量化是在解碼器中由量化系數(shù)恢復DCT系數(shù)的過程,根據(jù)下面的式子完成:JPEG標準沒有規(guī)定缺省的量化表,但它給出了一些指導性的量化表。JPEG推薦的亮度和色度量化步長表4.4靜止圖像編碼標準DC系數(shù)和AC系數(shù)掃描考慮到DCT變換后,直流DC系數(shù)反映了8×8子塊內(nèi)64個像素均值的度量,包含了整個圖像總能量的重要部分,因此將DC系數(shù)和其余63個交流AC系數(shù)分別編碼。4.4靜止圖像編碼標準DC系數(shù)使用一維前值預測,即用前一個子塊的DC系數(shù)預測當前子塊的DC系數(shù),而后將預測誤差進行編碼。4.4靜止圖像編碼標準采用游程編碼方法對AC系數(shù)進行編碼,并建議在8×8矩陣中按照“Z”形次序進行掃描。4.4靜止圖像編碼標準熵編碼

JPEG建議的熵編碼方法有兩種:哈夫曼編碼和自適應二進制算術(shù)編碼,前者使用哈夫曼碼表,后者使用算術(shù)碼的條件碼表。

JPEG在具體實現(xiàn)哈夫曼編碼時采用了查表方式,在大量實際圖像測試結(jié)果的基礎(chǔ)上生成了哈夫曼碼表,編碼時只需直接查表即可。4.4靜止圖像編碼標準編碼時,DC系數(shù)與AC系數(shù)分別使用不同的哈夫曼編碼表,亮度與色度也需要不同的哈夫曼編碼表,所以一共需要4個編碼表。4.4靜止圖像編碼標準直流系數(shù)編碼采用“前綴碼(SSSS)+尾碼”的形式:前綴碼指明尾碼的有效位數(shù)(設(shè)為B位),用標準的哈夫曼編碼;尾碼則直接采用B位自然二進制碼。對于8bit精度的JPEG基本系統(tǒng),SSSS的取值范圍為0~11,SSSS的碼表共有12項。圖像分量為8位時DC系數(shù)差值的典型哈夫曼編碼表4.4靜止圖像編碼標準根據(jù)Diff的幅度范圍由表查出其前綴碼字和尾碼的位數(shù)后,可以按以下規(guī)則直接寫出尾碼碼字:尾碼為Diff的B位4.4靜止圖像編碼標準【例】對于Diff=17的亮度差值進行編碼?!窘狻坎楸戆l(fā)現(xiàn)Diff落入(-31,…,31)的區(qū)間,所以得SSSS=5,其前綴碼字為110;同時尾碼的長度是5,并且采用17的自然二進制碼表示,即10001,從而Diff=17的編碼為“11010001”。4.4靜止圖像編碼標準交流系數(shù)編碼

JPEG利用之字形掃描,將二維量化系數(shù)矩陣轉(zhuǎn)換成一維數(shù)組ZZ。ZZ中的每一個非零的AC系數(shù)都表示為:“NNNNSSSS+尾碼”。其中,4位的“NNNN”給出了當前這個非零系數(shù)相對于前一個非零系數(shù)的位置(即非零系數(shù)之間的零系數(shù)游程長度ZRL),其范圍規(guī)定為0~15。4.4靜止圖像編碼標準當ZRL超過15時,先用“F/0”表示游程長度16,并對余下的游程按前面的原則處理。4位“SSSS”及尾碼的含義與DC系數(shù)類似?!癗NNNSSSS”組合為一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論