數(shù)字圖像處理:圖像的壓縮編碼_第1頁
數(shù)字圖像處理:圖像的壓縮編碼_第2頁
數(shù)字圖像處理:圖像的壓縮編碼_第3頁
數(shù)字圖像處理:圖像的壓縮編碼_第4頁
數(shù)字圖像處理:圖像的壓縮編碼_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

圖像的壓縮編碼

1

圖像壓縮編碼基礎(chǔ)

2

熵編碼

3

預(yù)測編碼

4

變換編碼

5圖像壓縮編碼國際標準1算術(shù)編碼圖像壓縮編碼熵編碼預(yù)測編碼變換編碼混合編碼行程編碼香農(nóng)-范諾編碼哈夫曼編碼自適應(yīng)預(yù)測編碼最佳線性預(yù)測編碼DPCM編碼原理MPEG標準JPEG標準圖7.0本章圖像壓縮編碼的主要結(jié)構(gòu)27.1圖像壓縮編碼基礎(chǔ)

7.1.1圖像壓縮編碼的必要性

隨著信息技術(shù)的發(fā)展,圖像信息已經(jīng)成為通信和計算機系統(tǒng)中一種重要的處理對象,圖像的最大特點也是最大難點就是海量數(shù)據(jù)的表示與傳輸,如果不對數(shù)據(jù)進行壓縮處理,數(shù)量巨大的數(shù)據(jù)就很難在計算機系統(tǒng)及其網(wǎng)絡(luò)上存儲、處理和傳輸。圖像編碼與壓縮從本質(zhì)上來說就是對要處理的圖像源數(shù)據(jù)按一定的規(guī)則進行變換和組合,從而達到以盡可能少的代碼(符號)來表示盡可能多的數(shù)據(jù)信息。

3為什么要進行圖像壓縮?

數(shù)字圖像通常要求很大的比特數(shù),這給圖像的傳輸和存儲帶來相當大的困難。要占用很多的資源,花很高的費用。如一幅512x512的灰度圖象的比特數(shù)為

512x512x8=276k

再如一部90分鐘的彩色電影,每秒放映24幀。把它數(shù)字化,每幀512x512象素,每象素的R、G、B三分量分別占8bit,總比特數(shù)為4

90x60x24x3x512x512x8bit=95,200M。如一張CD光盤可存600兆字節(jié)數(shù)據(jù),這部電影光圖像(還有聲音)就需要160張CD光盤用來存儲。

對圖像數(shù)據(jù)進行壓縮顯得非常必要。

5

7.1.2

圖像壓縮編碼的可能性

數(shù)據(jù)是用來表示信息的,如果不同的方法為表示給定量的信息使用了不同的數(shù)據(jù)量,那么使用較多數(shù)據(jù)量的方法中,有些數(shù)據(jù)必然是代表了無用的信息,或者是重復(fù)地表示了其他數(shù)據(jù)已經(jīng)表示的信息,這就是數(shù)據(jù)冗余的概念。由于圖像數(shù)據(jù)本身固有的冗余性和相關(guān)性,使得將一個大的圖像數(shù)據(jù)文件轉(zhuǎn)換成較小的圖像數(shù)據(jù)文件成為可能,圖像數(shù)據(jù)壓縮就是要去掉信號數(shù)據(jù)的冗余性,一般來說,圖像數(shù)據(jù)中存在著以下幾種冗余:

6(1)空間冗余(像素間冗余、幾何冗余):這是圖像數(shù)據(jù)中所經(jīng)常存在的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面是有序的而不是完全雜亂無章的排列)的表面物理特性具有相關(guān)性,這些相關(guān)性的光成像結(jié)果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。(2)時間冗余:在序列圖像(電視圖像、運動圖像)中,相鄰兩幀圖像之間有較大的相關(guān)性。如圖7.1.1所示,F(xiàn)l幀中有一個小汽車和一個路標,在時間T后的F2圖像中仍包含以上兩個物體,只是小車向前行駛了一段路程,此時F1和F2中的路標和背景都是時間相關(guān)的,小車也是時間相關(guān)的,因而F2和Fl具有時間冗余。

7

(a)F1幀

(b)F2幀圖7.1.1

時間冗余示例8(3)信息熵冗余:也稱為編碼冗余,如果圖像中平均每個像素使用的比特數(shù)大于該圖像的信息熵,則圖像中存在冗余,稱為信息熵冗余。例:如果用8位表示該圖像的像素,我們就說該圖像存在著編碼冗余,因為該圖像的像素只有兩個灰度,用一位即可表示。9(4)結(jié)構(gòu)冗余:有些圖像存在較強的紋理結(jié)構(gòu),如墻紙、草席等圖像,稱之存在結(jié)構(gòu)冗余。10(5)知識冗余:有許多圖像的理解與某些基礎(chǔ)知識有相當大的相關(guān)性,例如人臉的圖像有固定的結(jié)構(gòu),比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等等,這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,稱此類冗余為知識冗余。11(6)心理視覺冗余:人類的視覺系統(tǒng)對于圖像場的注意是非均勻和非線性的,特別是視覺系統(tǒng)并不是對于圖像場的任何變化都能感知,即眼睛并不是對所有信息都有相同的敏感度,有些信息在通常的視覺感覺過程中與另外一些信息相比來說并不那么重要,這些信息可認為是心理視覺冗余的,去除這些信息并不會明顯地降低所感受到的圖像的質(zhì)量。心理視覺冗余的存在是與人觀察圖像的方式有關(guān)的,由于每個人所具有的先驗知識不同,對同一幅圖像的心理視覺冗余也就因人而異。

12

7.1.3

圖像壓縮編碼的分類

圖像編碼壓縮的方法目前有很多,其分類方法根據(jù)出發(fā)點不同而有差異。(1)根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差,圖像編碼壓縮分為無損(亦稱無失真、無誤差、信息保持型)編碼和有損(有失真、有誤差、信息非保持型)編碼兩大類。無損壓縮:這類壓縮算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息,因此在解壓縮時能精確恢復(fù)原圖像。無損壓縮用于要求重建后圖像嚴格地和原始圖像保持相同的場合,例如復(fù)制、保存十分珍貴的歷史、文物圖像等。有損壓縮:這類算法把不相干的信息也刪除了,因此在解壓縮時只能對原始圖像進行近似的重建,而不能精確的復(fù)原,有損壓縮適合大多數(shù)用于存儲數(shù)字化了的模擬數(shù)據(jù)。

13

※無損壓縮算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息,因此在解壓縮時能精確恢復(fù)原圖像,無損壓縮的壓縮比很少有能超過3:1的。常用于要求高的場合。14※有損壓縮是通過犧牲圖像的準確率以實現(xiàn)較大的壓縮率,如果容許解壓圖像有一定的誤差,則壓縮率可顯著提高。有損壓縮在壓縮比大于30:1時仍然可重構(gòu)圖像,而如果壓縮比為10:1到20:1,則重構(gòu)的圖像與原圖幾乎沒有差別15(2)根據(jù)編碼原理圖像編碼分為熵編碼、預(yù)測編碼、變換編碼和混合編碼等。熵編碼:這是純粹基于信號統(tǒng)計特性的編碼技術(shù),是一種無損編碼。熵編碼的基本原理是給出現(xiàn)概率較大的符號賦予一個短碼字,而給出現(xiàn)概率較小的符號賦予一個長碼字,從而使最終的平均碼長很小。常見的熵編碼方法有哈夫曼編碼、算術(shù)編碼和行程編碼。預(yù)測編碼:它是基于圖像數(shù)據(jù)的空間或時間冗余特性,用相鄰的已知像素(或像素塊)來預(yù)測當前像素(或像素塊)的取值,然后再對預(yù)測誤差進行量化和編碼。預(yù)測編碼可分為幀內(nèi)預(yù)測和幀間預(yù)測,常用的預(yù)測編碼有差分脈碼調(diào)制(DifferentialPulseCodeModulation,

DPCM)和運動補償法。16變換編碼:通常是將空間域上的圖像經(jīng)過正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個變換系數(shù)上,再采用適當?shù)牧炕挽鼐幋a就可以有效地壓縮圖像?;旌暇幋a:是指綜合了熵編碼、變換編碼或預(yù)測編碼的編碼方法,如JPEG標準和MPEG標準。(3)從圖像的光譜特征出發(fā),將壓縮編碼分為單色圖像編碼、彩色圖像編碼和多光譜圖像編碼。(4)從圖像的灰度層次上,壓縮編碼可分為多灰度編碼和二值圖像編碼。

17

7.1.4

圖像壓縮編碼的系統(tǒng)評價

在圖像編碼中,編碼質(zhì)量是一個非常重要的概念,怎樣以盡可能少的比特數(shù)來存儲或傳輸一幅圖像,同時又讓接收者感到滿意,這是圖像編碼的目標。對于圖像編碼的質(zhì)量評價主要體現(xiàn)在基于壓縮編碼參數(shù)的評價、基于保真度(逼真度)準則的評價、算法的適用范圍、算法的復(fù)雜度等四個方面。

18

1.壓縮比壓縮比是衡量數(shù)據(jù)壓縮程度的指標之一,到目前為止,尚無壓縮比的統(tǒng)一定義,目前常用的壓縮比定義為:

其中:為源代碼長度;為壓縮后的代碼長度。壓縮比的物理意義是被壓縮掉的數(shù)據(jù)占源數(shù)據(jù)的百分比,一般的講,壓縮比大,則說明被壓縮掉的數(shù)據(jù)量多,當壓縮比接近100%時,壓縮效率最理想。192.基于保真度(逼真度)準則的評價

在圖像壓縮編碼中,解碼圖像與原始圖像可能會有差異,因此,需要評價壓縮后圖像的質(zhì)量。描述解碼圖像相對原始圖像偏離程度的測度一般稱為保真度(逼真度)準則。常用的準則可分為兩大類:客觀保真度準則和主觀保真度準則。

(1)客觀保真度準則

最常用的客觀保真度準則是原圖像和解碼圖像之間的均方根誤差和均方根信噪比兩種,令f(x,y)表示原圖像,表示f(x,y)先壓縮又解壓縮后得到的的近似,對任意x和y,f(x,y)和之間的誤差定義為:

(7.1.7)20若f(x,y)和均為M×N,則它們之間的均方根誤差為:(7.1.8)如果將看做原始圖像f(x,y)和噪聲圖像e(x,y)的和,則解壓縮圖像的均方信噪比為:

(7.1.9)若對上式求平方根,則得到均方根信噪比。

21(2)主觀保真度準則

盡管客觀保真度準則提供了一種簡單方便的信息損失的方法,但是很多解壓圖像最終是供人觀看的,有時單用某一個或幾個解析式來度量圖像品質(zhì),甚至得到與主觀評估相反的結(jié)果,這樣就造成采用這些解析公式得到的定量的逼真度的可信度低,造成逼真度不能從理論上完滿解決的根本原因在于人眼視覺感知得到的信息傳輸?shù)缴窠?jīng)系統(tǒng)的處理、判別過程不清楚,而這又涉及到生物物理學(xué)、生物化學(xué)以及生態(tài)光學(xué)等領(lǐng)域的成就,至今還不能提供這一過程的滿意回答(這也是當今計算機視覺的一個前沿課題,目前正在研究發(fā)展中)。22鑒于這樣的原因,目前對圖像品質(zhì)的度量仍停留在主觀評估上。所謂主觀評估就是聘請一些‘外行’或?qū)<?,通過對圖像的觀察來判別好壞。因而這是一種定性的評估。這種主觀評估可能是對一幅圖像而言,由觀察者對其總體印象估出優(yōu)劣,其等級標準見表7.1.1;或在一組圖像中進行比較,如表7.1.2所示。采用主觀評估的缺點是顯而易見的,對“外行”人來說,可能注意的是圖像的大體上的優(yōu)劣,而對“內(nèi)行”人即具有圖像處理經(jīng)驗的人來說,更多的是注意圖像中細節(jié)的退化程度,所以這種主觀評估法應(yīng)使“外行”和“內(nèi)行”分開進行。

23

表7.1.1

總體優(yōu)度標準

表7.1.2

分組優(yōu)度標準

7.優(yōu)4.良3.中2.可1.劣7.組內(nèi)最好6.比本組中等好7.比本組中等稍好4.本組中等3.比本組中等稍差2.比本組中等差1.組內(nèi)最差243.算法的適用范圍特定的圖像編碼算法具有其相應(yīng)的適用范圍,并不對所有的圖像都有效。一般說來,大多數(shù)基于圖像信息統(tǒng)計特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像;某些算法(如基于對象的圖像壓縮編碼方案),只能用于特定圖像場景(如人的頭肩像場景)的壓縮。4.算法的復(fù)雜度算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運算量和硬件實現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時一定要考慮圖像信源本身的統(tǒng)計特性、多媒體系統(tǒng)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標準。

25

7.1.7行程編碼

行程編碼(Run-lengthCoding)是相對簡單的編碼技術(shù),主要思路是將一個相同值的連續(xù)串用一個代表值和串長來代替。例如有一個字符串“aaabccddddd”,經(jīng)過行程編碼后可以用“3a1b2c5d”來表示。對圖像編碼來說,可以定義沿特定方向上具有相同灰度值的相鄰像素為一輪,其延續(xù)長度稱之為延續(xù)的行程,簡稱為行程或游程。例如,若沿水平方向有一串M個像素具有相同的灰度N,則行程編碼后,只傳遞兩個值(N,M)就可以代替M個像素的M個灰度值N。26行程編碼分為定長行程編碼和變長行程編碼兩種。定長行程編碼是指編碼的行程所使用的二進制位數(shù)固定,如果灰度連續(xù)相等的個數(shù)超過了固定二進制位數(shù)所能表示的最大值,則進行下一輪行程編碼。變長行程編碼是指對不同范圍的行程使用不同位數(shù)的二進制位數(shù)進行編碼,需要增加標志位來表明所使用的二進制位數(shù)。行程編碼一般不直接應(yīng)用于多灰度圖像,但比較適合于二值圖像的編碼。為了達到較好的壓縮效果,有時行程編碼和其他一些編碼方法混合使用。例如,在JPEG中,行程編碼和DCT及哈夫曼方法一起使用,先對圖像分塊處理,然后對分塊進行DCT,量化后的頻域圖像數(shù)據(jù)作Z形掃描,然后作行程編碼,對行程編碼的結(jié)果再進行哈夫曼編碼。27游程長度編碼RLE(RunLengthEncoding):

由于一幅圖像中有許多顏色相同的圖塊,用一整數(shù)對存儲一個像素的顏色值及相同顏色像素的數(shù)目(長度)。例如:(G,L)

長度顏色值編碼時采用從左到右,從上到下的排列,每當遇到一串相同數(shù)據(jù)時就用該數(shù)據(jù)及重復(fù)次數(shù)代替原來的數(shù)據(jù)串。000000003333333333222222222226666666111111111111111111111111777777777777888888888888888888777777777777773333222222222222222222(0,8)(3,10)(2,11)(6,7)(1,18)(1,6)(7,12)(8,18)(7,14)(3,4)(2,18)18*7的像素顏色僅用11對數(shù)據(jù)28RLE編碼——RunLengthEncoding分析:對于有大面積色塊的圖像,壓縮效果很好直觀,經(jīng)濟,是一種無損壓縮對于紛雜的圖像,壓縮效果不好,最壞情況下,會加倍圖像293031適合行程編碼的圖327.3

預(yù)測編碼

預(yù)測編碼是建立在信號(語音、圖像等)數(shù)據(jù)的相關(guān)性之上,根據(jù)某一模型利用以往的樣本值對新樣本進行預(yù)測,減少數(shù)據(jù)在時間和空間上的相關(guān)性,以達到壓縮數(shù)據(jù)的目的。預(yù)測方法有多種,本節(jié)將著重介紹差分脈沖編碼調(diào)制(DifferentialPulseCodeModulation,DPCM)的基本原理、最佳線性預(yù)測及其自適應(yīng)編碼方法。

7.3.1DPCM基本原理

由圖像的統(tǒng)計特性可知,相鄰像素之間有著較強的相關(guān)性,即相鄰像素的灰度值相同或相近,因此,某像素的值可根據(jù)以前已知的幾個像素值來估計、來猜測,正是由于像素間的相關(guān)性,才使預(yù)測成為可能。

33預(yù)測編碼的基本思想是通過僅提取每個像素中的新信息并對它們編碼來消除像素間的冗余,這里一個像素的新信息定義為該像素的當前值與預(yù)測值的差,利用這種具有預(yù)測性質(zhì)的差值,再量化、編碼、傳輸,其效果更佳,這一方法就稱為DPCM法。預(yù)測編碼通常不直接對信號編碼,而是對預(yù)測誤差編碼。DPCM系統(tǒng)原理框圖見圖7.3.1。

34圖7.3.1DPCM系統(tǒng)原理框圖

353.預(yù)測編碼的類型

若tN時刻之前的已知樣值與預(yù)測值之間的關(guān)系呈現(xiàn)某種函數(shù)形式,該函數(shù)一般分為線性和非線性兩種,所以預(yù)測編碼器也就有線性預(yù)測器和非線性預(yù)測編碼器兩種。

若估計值與x1,x2,…,xN-1樣值之間呈現(xiàn)為:

(7.3.4)

其中ai

(i=1,2,…,N-1)為常量,則稱之為線性預(yù)測,a1,a2,…,aN-1為預(yù)測系數(shù)。

若tN

時刻的信號樣本值xN

與tN

時刻之前的已知樣本值x1,x2,…,xN-1不是如式(7.3.4)的線性組合關(guān)系,而是非線性關(guān)系,則稱之為非線性預(yù)測。

36在圖像數(shù)據(jù)壓縮中,常用如下幾種線性預(yù)測方案:(1)前值預(yù)測:即(2)一維預(yù)測:即用xN

的同一掃描行中的前面已知的幾個采樣值xN

預(yù)測,其預(yù)測公式為。(3)二維預(yù)測:即不但用的同一掃描行以前的幾個采樣值(x1,

x7),如圖7.3.2所示,還要用xN

的以前幾行中的采樣值(x2,x3,x4)一起來預(yù)測。例如:

以上都是一幅圖像中像素點之間的預(yù)測,統(tǒng)稱為幀內(nèi)預(yù)測。

37圖7.3.2二維預(yù)測示意圖

38解碼圖像如圖7.3.3(b)所示。

(a)原始圖像

(b)解碼圖像

圖7.3.3

預(yù)測編碼程序運行結(jié)果圖397.4

變換編碼變換編碼的基本概念就是將原來在空間域上描述的圖像等信號,通過一種數(shù)學(xué)變換(常用二維正交變換如傅立葉變換、離散余弦變換、沃爾什變換等),變換到變換域中進行描述,達到改變能量分布的目的,即將圖像能量在空間域的分散分布變?yōu)樵谧儞Q域的能量的相對集中分布,達到去除相關(guān)的目的,再經(jīng)過適當?shù)姆绞搅炕幋a,進一步壓縮圖像。

40舉例DCT圖像經(jīng)DCT后,能量集中于頻率平面的左上角。DCT用于圖像數(shù)據(jù)壓縮。41統(tǒng)計分析表明,圖像經(jīng)過正交變換后,把原來分散在原空間的圖像數(shù)據(jù)在新的坐標空間中得到集中,對于大多數(shù)圖像,大量的變換系數(shù)很小,只要刪除接近于0的系數(shù),并且對較小的系數(shù)進行粗量化,而保留包含圖像主要信息的系數(shù),以此進行壓縮編碼。

在重建圖像進行解碼(逆變換)時,所損失的將是一些不重要的信息,幾乎不會引起圖像的失真,圖像的變換編碼就是利用這些來壓縮圖像的,這種方法可得到很高的壓縮比。

一個典型的變換編碼系統(tǒng)如圖7.4.1所示,編碼器執(zhí)行四個步驟:圖像分塊、變換、量化和編碼。

42圖7.4.1

變換編碼系統(tǒng)方框圖43變換編碼首先將一幅大小N×N的圖像分成(N/n)2個子圖像,然后對子圖像進行變換操作,解除子圖像像素間的相關(guān)性,達到用少量的變換系數(shù)包含盡可能多的圖像信息的目的;接下來的量化步驟是有選擇的消除或粗量化帶有很少信息的變換系數(shù),因為它們對重建圖像的質(zhì)量影響很小;最后是編碼,一般用變長碼對量化后的系數(shù)進行編碼,解碼是編碼的逆操作,由于量化是不可逆的,所以在解碼中沒有對應(yīng)的模塊,要注意的是壓縮并不是在變換步驟中取得的,而是在量化變換系數(shù)和編碼時取得的。

44在目前常用的正交變換中,DCT變換其性能接近最佳,僅次于K—L變換,所以DCT變換被認為是一種準最佳變換。另一方面,DCT變換矩陣與圖像內(nèi)容無關(guān),而且由于它是構(gòu)造成對稱的數(shù)據(jù)序列,從而避免了子圖像邊界處的跳躍和不連續(xù)現(xiàn)象,并且也有快速算法(FDCT),所以在圖像編碼的應(yīng)用中,往往都采用二維DCT。在JPEG基本系統(tǒng)中,就是采用二維DCT的算法作為壓縮的基本方法。45傅立葉變換是應(yīng)用最早的變換之一,也有快速算法,但它的不足之處在于子圖像的變換系數(shù)在邊界處的不連續(xù)而造成恢復(fù)的子圖像在其邊界也不連續(xù),于是由各恢復(fù)子圖像構(gòu)成的整幅圖像將呈現(xiàn)隱約可見的以子圖像的方塊狀結(jié)構(gòu),影響圖像質(zhì)量。沃爾什變換與DCT變換相比,其算法簡單(只有加法和減法),因而運算速度快,適用于高速實時系統(tǒng),而且也容易硬件實現(xiàn),但性能比DCT變換要差—些。

46如果將一幅圖像作為一個二維矩陣,則其正交變換的計算量也太大,難以實現(xiàn),所以在實用中變換編碼并不是對整幅圖像進行變換和編碼,而是將圖像分成若干個n×n的子圖像后分別處理,原因如下:

(1)小塊圖像的變換計算容易。(2)距離較遠的像素之間的相關(guān)性比距離較近的像素之間的相關(guān)性小。

2.子圖像尺寸的選擇

47實踐證明,子圖像取4×4、8×8、16×16適合圖像的壓縮,這是因為:(1)如果子圖像尺寸取得太小,雖然計算速度快,實現(xiàn)簡單,但壓縮能力有限。(2)如果子圖像尺寸取得太大,雖然去相關(guān)效果好,因為DFT、DCT等正弦類變換均漸近最佳性,但也漸趨飽和;若尺寸太大,由于圖像本身的相關(guān)性很小,反而使其壓縮效果不明顯,而且增加了計算的復(fù)雜性。

483.變換系數(shù)的選擇

對子圖像經(jīng)過變換后,變換后的系數(shù)保留哪些系數(shù)用作編碼和傳輸將直接影響信號恢復(fù)的質(zhì)量,變換系數(shù)的選擇原則是保留能量集中的、方差大的系數(shù)。系數(shù)選擇通常有變換區(qū)域編碼和變換閾值編碼兩種方法。(1)變換區(qū)域編碼變換區(qū)域編碼就是對設(shè)定形狀的區(qū)域內(nèi)的變換系數(shù)進行量化編碼,區(qū)域外的系數(shù)就被舍去。一般來說,變換后的系數(shù)值較大的都會集中在區(qū)域的左上部,即低頻率分量都集中在此部分,保留的也是這一部分。其他部分的系數(shù)被舍去,在恢復(fù)信號時再對它們補以零。這樣,由于保留了大部分圖像信號能量,在恢復(fù)信號后,其質(zhì)量不會產(chǎn)生顯著變化。491111100011110000111000001100000010000000000000000000000000000000圖7.4.2

典型的分區(qū)模板

圖7.4.3典型的分區(qū)比特分配

876432107674321067433110443321003332110022111000111000000000000050(2)變換閾值編碼變換閾值編碼就是根據(jù)實際情況設(shè)定某一大小幅度的閾值,若變換系數(shù)超過該閾值,則保留這些系數(shù)進行編碼傳輸,其余的補以零。這樣,多數(shù)低頻成分被編碼輸出,而且少數(shù)超過閾值的高頻成分也將被保留下來進行編碼輸出,這在一定程度上彌補了區(qū)域法的不足,但這種選擇系數(shù)的方法有兩個問題需要解決:一個是被保留下來進行編碼的系數(shù)在矩陣中的位置是不確定的,因此,尚需增加“地址”編碼比特數(shù),其碼率相對地要高一些;另一個問題是“閾值”需要通過實驗來確定,當然也可以根據(jù)總比特數(shù),進行自適應(yīng)閾值選擇,但需要一定的技術(shù),將增加編碼的復(fù)雜程度。

51圖7.4.4(a)為8×8原始圖像的灰度分布矩陣,經(jīng)過哈達瑪變換后,變換系數(shù)分布如圖7.4.4(b)所示。假定表示圖像像素位置的行號、列號均以4位表示,設(shè)閾值大于10,變換系數(shù)統(tǒng)一用7比特編碼,則對于圖7.4.4(b)來說,編碼輸出總碼長為47比特,具體編碼為000000000111101000100010011001011001100010101。

(a)原始圖像的灰度矩陣

(b)哈達瑪變換系數(shù)矩陣圖7.4.4閾值編碼示例52圖7.4.7

實驗運行結(jié)果537.7

圖像壓縮編碼國際標準

7.7.1靜止圖像壓縮標準JPEG

JPEG(JointPhotographicExpertsGroup)是聯(lián)合圖像專家小組的縮寫,所謂聯(lián)合是指國際標準化組織(ISO)和國際電報電話咨詢委員會(CCITT)的聯(lián)合,聯(lián)合圖像專家小組1986年成立,任務(wù)是開發(fā)研制出連續(xù)色調(diào)、多級灰度、靜止圖像的數(shù)字圖像壓縮編碼標準,使之滿足以下要求:(1)必須將圖像質(zhì)量控制在可視保真度高的范圍內(nèi),同時編碼器可被參數(shù)化,允許用戶設(shè)置壓縮或質(zhì)量水平。(2)壓縮標準可以應(yīng)用于任何一類連續(xù)色調(diào)數(shù)字圖像,并不應(yīng)受到維數(shù)、顏色、畫面尺寸、內(nèi)容、影調(diào)的限制。54(3)壓縮標準必須從完全無損到有損范圍內(nèi)可選,以適應(yīng)不同的存儲、CPU和顯示要求。此外,JPEG標準是為連續(xù)色調(diào)圖像的壓縮提供的公共標準,連續(xù)色調(diào)圖像并不局限于單色調(diào)圖像,該標準可適用于各種多媒體存儲和通信應(yīng)用所使用的灰度圖像、攝影圖像及靜止視頻壓縮文件。

JPEG標準包括圖像編碼和解碼過程以及壓縮圖像數(shù)據(jù)的編碼表示,它提供了三種壓縮算法:基本系統(tǒng)(BaselineSystem)、擴展系統(tǒng)(ExtendedSystem)和無失真壓縮(Lossless),所有的JPEG編碼器和解碼器必須支持基本系統(tǒng),另外兩種壓縮算法適用于特定的應(yīng)用。55JPEG總共有四種工作模式:(1)順序型編碼工作模式:圖像的所有8×8像素的圖像子塊從左到右、從上到下依次輸入。圖像子塊經(jīng)DCT變換后形成8×8的DCT系數(shù)陣列,每一個系數(shù)陣列被量化后立即進行熵編碼并作為壓縮圖像數(shù)據(jù)的一部分輸出,從而盡可能地降低了對系數(shù)存儲的要求。如圖7.7.1所示。56(2)漸進式DCT方式:基于DCT,對圖像分層次進行處理,從模糊到清晰地傳輸圖像,如圖7.7.2所示。有兩種實現(xiàn)方法:一種是頻譜選擇法,即按Z形掃描的序號將DCT量化序數(shù)分成幾個頻段,每個頻段對應(yīng)一次掃描,每塊均先傳送低頻掃描數(shù)據(jù),得到原圖概貌,再依次傳送高頻掃描數(shù)據(jù),使圖像逐漸清晰。另一種是逐次逼近法,即每次掃描全部DCT量化序數(shù),但每次的表示精度逐漸提高。(3)無失真編碼工作模式:被編碼的圖像可以保證恢復(fù)到與源圖像數(shù)據(jù)完全一致。(4)分層方式:在空間域?qū)⒃磮D像以不同的分辨率表示,每個分辨率對應(yīng)一次掃描,處理時可以基于DCT或預(yù)測編碼,可以是漸進式,也可以是順序式,如圖7.7.3所示。

57

圖7.7.1順序型編碼工作模式

圖7.7.2漸進型編碼工作模式

58順序型漸進型順序型漸進型59

圖7.7.3分層編碼工作模式60JPEG基本系統(tǒng)的編解碼方框圖如圖7.7.4所示。

圖7.7.4JPEG基本系統(tǒng)的編解碼方框圖

61

1.

顏色空間轉(zhuǎn)換、數(shù)據(jù)分塊及采樣

在彩色圖像中,JPEG分別壓縮圖像的每個彩色分量。雖然JPEG可以壓縮通常的紅綠藍分量,但在YCbCr空間的壓縮效果會更好,這是因為色彩的變化不如亮度的變化重要,因而對色彩的編碼可以比對亮度的編碼粗糙些,這主要體現(xiàn)在不同的采樣頻率和量化精度上,因此,編碼前一般先將圖像從RGB空間轉(zhuǎn)換到Y(jié)CbCr空間。在對圖像采樣時,可以采用不同的采樣頻率,這種技術(shù)稱為二次采樣。由于亮度比色彩更重要,因而對Y分量的采樣頻率可高于對Cb、Cr的采樣頻率,這樣有利于節(jié)省存儲空間。常用的采樣方案有YUV422和YUV411。62

2.離散余弦變換(DCT)

圖像數(shù)據(jù)塊分割后,即以MCU為單位順序?qū)U進行二維離散余弦變換。對以無符號數(shù)表示的具有P位精度的輸入數(shù)據(jù),在DCT前要減去2P-1,轉(zhuǎn)換成有符號數(shù),而在IDCT后,應(yīng)加上2P-1,轉(zhuǎn)換成無符號數(shù)。對每個8×8的數(shù)據(jù)塊DU進行DCT后,得到的64個系數(shù)代表了該圖像塊的頻率成分,其中低頻分量集中在左上角,高頻分量分布在右下角。系數(shù)矩陣左上角的叫做直流(DC)系數(shù),它代表了該數(shù)據(jù)塊的平均值,其余63個叫交流(AC)系數(shù)。63

3.系數(shù)量化在DCT處理中得到的64個系數(shù)中,低頻分量包含了圖像亮度等主要信息。在從空間域到頻域的變換中,圖像中的緩慢變化比快速變化更易引起人眼的注意,所以在重建圖像時,低頻分量的重要性高于高頻分量。因而在編碼時可以忽略高頻分量,從而達到壓縮的目的,這也是量化的根據(jù)和目的。64

4.Z形掃描

DCT系數(shù)量化后,構(gòu)成一個稀疏矩陣,用Z(Zigzag)形掃描將其變成一維數(shù)列,將有利于熵編碼。Z形掃描的順序如圖7.7.7所示。

圖7.7.7DCT系數(shù)的Z形掃描順序

65

7.DC系數(shù)編碼

DC系數(shù)反映了一個8×8數(shù)據(jù)塊的平均亮度,一般與相鄰塊有較大的相關(guān)性。JPEG對DC系數(shù)作差分編碼,即用前一數(shù)據(jù)塊的同一分量的DCj-1系數(shù)作為當前塊的預(yù)測值,再對當前塊的實際值DCj與預(yù)測值DCj-1的差值作哈夫曼編碼,如圖7.7.8所示。

圖7.7.8DC系數(shù)差分編碼66

7.7.2

活動圖像壓縮標準MPEG簡介1.MPEG標準

MPEG是MovingPictureExpertsGroup的英文縮寫,其含義是“活動圖像專家組”,它是對活動的視頻圖像壓縮的國際標準的簡稱。該專家組成立于1988年,它的工作不僅局限于活動圖像編碼,還把伴音和圖像的壓縮聯(lián)系在一起,并且根據(jù)不同的應(yīng)用場合,定義了不同的標準。

MPEG-1是1993年8月正式通過的技術(shù)標準,其全稱為“適用于約1.7Mbit/s以下數(shù)字存儲媒體的運動圖像及伴音的編碼“。這里所指的數(shù)字存儲媒體包括CD-ROM、DAT、硬盤、可寫光盤等,同時利用該標準也可以在ISDN或局域網(wǎng)中進行遠程通信。67

MPEG-2是1994年11月發(fā)布的“活動圖像及伴音通用編碼”標準,該標準可以應(yīng)用于2.048Mbit/s~20Mbit/s的各種速率和各種分辨率的應(yīng)用場合之中,如多媒體計算機、多媒體數(shù)據(jù)庫、多媒體通信、常規(guī)數(shù)字電視、高清晰度電視以及交互電視等。

MPEG-4的情況是:1999年1月公布了該標準的V1.0版本,同年12月公布了V2.0版本。該標準主要應(yīng)用于超低速系統(tǒng)之中,例如多媒體Internet、視頻會議和視頻電視等個人通信、交互式視頻游戲和多媒體郵件、基于網(wǎng)絡(luò)的數(shù)據(jù)業(yè)務(wù)、光盤等交互式存儲媒體、遠程視頻監(jiān)視及無線多媒體通信。特別是它能夠滿足基于內(nèi)容的訪問和檢索的多媒體應(yīng)用,且其編碼系統(tǒng)是開放的,可隨時加入新的有效算法模塊。68

MPEG-5是2000年11月頒布的稱為“多媒體內(nèi)容描述接口”的標準。定義該標準的目的是制定出一系列的標準描述符來描述各種媒體信息。這種描述與多媒體信息的內(nèi)容有關(guān),這樣將便于用戶進行基于內(nèi)容和對象的視聽信息的快速搜索。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論