光電圖像處理-圖像編碼_第1頁
光電圖像處理-圖像編碼_第2頁
光電圖像處理-圖像編碼_第3頁
光電圖像處理-圖像編碼_第4頁
光電圖像處理-圖像編碼_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

光電圖像處理

(六)圖像編碼電子工程學院光電子技術系16.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容26.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容36.1

圖像編碼概述6.1.1

圖像編碼技術的研究背景

6.1.2圖像編碼基本原理

6.1.3圖像編碼的方法

6.1.4圖像編碼新技術

6.1.5圖像編碼評價4

6.1.1圖像編碼技術的研究背景通信方式的改變

文字+語音

圖像+文字+語音通信對象的改變

人與人

人與機器,機器與機器1.信息傳輸方式發(fā)生了很大的改變5

(a)彩色視頻信息對于電視畫面的分辨率640

480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為:

640

480

24

30=221.184Mbit

所以播放時,需要221Mbps的通信回路。參考數(shù)據(jù):寬帶網(wǎng)為512K,電話線為56K。存儲時,1張CD可存640M,則僅可以存放2.89秒的數(shù)據(jù)。2.圖像傳輸與存儲需要的信息量空間6

(b)傳真數(shù)據(jù)如果只傳送2值圖像,以200dpi的分辨率傳輸,一張A4稿紙的內(nèi)容的數(shù)據(jù)量為:3888768bit

按目前14.4K的電話線傳輸速率,需要傳送的時間是:270秒(4.5分)

按每分鐘4元計算:18元

由于通信方式和通信對象的改變帶來的最大問題是:

傳輸帶寬、速度、存儲器容量的限制。給我們帶來的一個難題,也給了我們一個機會:

如何用軟件的手段來解決硬件上的物理極限。7圖像信息源圖像預處理圖像信源

編碼信道編碼調(diào)制信道傳輸解調(diào)信道解碼圖像信源

解碼顯示圖像

圖像通信系統(tǒng)模型81.數(shù)字圖像的冗余的概念6.1.2圖像編碼基本原理

你的妻子,Helen,將于明天晚上6點零5分在上海的虹橋機場接你。

(23

2+10=56個半角字符)

你的妻子將于明天晚上6點零5分在虹橋機場接你。

(20

2+3=43個半角字符)

Helen將于明晚6點在虹橋接你。

(10

2+7=27個半角字符)結論:只要接收端不會產(chǎn)生誤解,就可以減少承載信息的數(shù)據(jù)量。9描述語言

(1)“這是一幅2

2的圖像,圖像的第一個像素是紅的,第二個像素是紅的,第三個像素是紅的,第四個像素是紅的”。

(2)“這是一幅2

2的圖像,整幅圖都是紅色”。

由此我們知道,整理圖像的描述方法可以達到壓縮的目的。10圖像冗余無損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來的16

3

8=384bits壓縮為:(1+3)

8=32bits11圖像冗余有損壓縮的原理3635343434343432343433373034343434343434343534343134343434343434343434343434343434343434343434343434253412

空間冗余:圖像內(nèi)部相鄰像素之間存在較強的相關性所造成的冗余。

時間冗余:視頻圖像序列中的不同幀之間的相關性所造成的冗余。視覺冗余:是指人眼不能感知或不敏感的那部分圖像信息。2.數(shù)字圖像冗余的分類13信息熵冗余:也稱編碼冗余,如果圖像中平均每個像素使用 的比特數(shù)大于該圖像的信息熵,則圖像中存在冗 余,這種冗余稱為信息熵冗余。結構冗余:是指圖像中存在很強的紋理結構或自相似性。知識冗余:是指在有些圖像中還包含與某些先驗知識有關的信 息。圖像編碼的目的:充分利用圖像中存在的各種冗余信息,特別是空間冗余、時間冗余以及視覺冗余,以盡量少的比特數(shù)來表示圖像。14幾種常見應用的碼率15有損壓縮:存在信息損耗,不能精確重建原始圖像,存在一定程度的失真。包括哈夫曼編碼、行程編碼和算術編碼無損壓縮:不存在信息損失,解壓縮時能夠從壓縮數(shù)據(jù)精確地恢復原始圖像。包括預測編碼、變換編碼等等。6.1.3圖像編碼的方法

1.根據(jù)編碼過程是否存在信息損耗16熵編碼:基于信號統(tǒng)計特性的編碼技術,無損編碼。基本原理是給出現(xiàn)概率較大的符號賦予一個短碼字,而給出現(xiàn)概率較小的符號賦予一個長碼字,從而使得最終的平均碼長很小。包括行程編碼(RunLengthEncoding)、哈夫曼編碼和算術編碼等。預測編碼:基于圖像數(shù)據(jù)的空間或時間冗余特性,用相鄰的已知像素(或像素塊)來預測當前像素(或像素塊)的取值,然后再對預測誤差進行量化和編碼??煞譃閹瑑?nèi)預測和幀間預測,常用的預測編碼有差分脈沖碼調(diào)制(DifferentialPulseCodeModulation,DPCM)和運動補償法。2.根據(jù)編碼原理17變換編碼:是將空間域上的圖像經(jīng)過正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個變換系數(shù)上,采用適當?shù)牧炕挽鼐幋a就可以有效地壓縮圖像?;旌暇幋a:混合編碼是指綜合了熵編碼、變換編碼或預測編碼的編碼方法,如JPEG標準和MPEG標準。18信息保持編碼:也稱無失真編碼,它要求在編解碼過程中保證圖像信息不丟失,從而可以完整地重建圖像。保真度編碼:利用人眼的視覺特性,在允許的失真(Lossy)條件下或一定的保真度準則下,最大限度地壓縮圖像。特征提取:在圖像識別、分析和分類等技術中,往往并不需要全部圖像信息,而只要對感興趣的部分特征信息進行編碼即可壓縮數(shù)據(jù)。3.根據(jù)對壓縮編碼后的圖像進行重建的準確程度196.1.4

圖像編碼新技術

分形編碼(FractalCoding):最大限度地利用了圖像在空間域上的自相似性(即局部與整體之間存在某種相似性),通過消除圖像的幾何冗余來壓縮數(shù)據(jù)。小波編碼(WaveletCoding):經(jīng)過小波變換后的圖像,具有良好的空間方向選擇性,而且是多分辨率的,能夠保持原圖像在各種分辨率下的精細結構,與人的視覺特性十分吻合。模型編碼(ModelBasedCoding):在編、解碼兩端分別建立起相同的模型,編碼時利用先驗模型抽取圖像中的主要信息并用模型參數(shù)的形式表示,解碼時則利用所接收的模型參數(shù)重建圖像。

206.1.5

圖像編碼評價

1.

算法的編碼效率2.

編碼圖像的質(zhì)量3.

算法的適用范圍4.

算法的復雜程度

一般來說,評價圖像壓縮算法的優(yōu)劣主要有以下4個參數(shù):21R——平均碼字長度r——圖像的壓縮比(rate)bps——每秒鐘所需的傳輸比特數(shù)(bitspersecond)η——圖像熵與平均碼長之比1.

算法的編碼效率

22

設一幅灰度級為N的圖像,圖像中第k級灰度出現(xiàn)的概率為Pk,圖像大小為Nx

Ny,每個像素用d比特表示,每兩幀圖像間隔Δt。

對于一種圖像編碼方法,設第k級灰度的碼字長度為Bk,則該圖像的平均碼字長度R為:則按信息論中信息熵的定義,則數(shù)字圖像的熵H為:由此可見,圖像熵H表示各灰度級比特數(shù)的統(tǒng)計平均值。23編碼效率η為:

每秒鐘所需的傳輸比特數(shù)bps為:壓縮比r為:

由于同一壓縮算法對不同圖像的編碼效率會有所不同,因此常需定義一些“標準圖像”,一般通過測量不同壓縮算法對同一組“標準圖像”的編碼性能來評價各圖像壓縮算法的編碼效率。

未壓縮前信源的碼長242.編碼圖像的質(zhì)量圖像質(zhì)量評價可分為:客觀質(zhì)量評價和主觀質(zhì)量評價。最常用的客觀質(zhì)量評價指標是:均方誤差(MSE)和峰值信噪比(PSNR)。25

主觀質(zhì)量評價是指:由一批觀察者對編碼圖像進行觀察并打分,然后綜合所有人的評判結果,給出圖像的質(zhì)量評價??陀^質(zhì)量評價能夠快速有效地評價編碼圖像的質(zhì)量,但符合客觀質(zhì)量評價指標的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評價能夠與人的視覺效果相匹配,但其評判過程緩慢費時。

26

特定的圖像編碼算法具有其相應的適用范圍,并不對所有圖像都有效。一般說來,大多數(shù)基于圖像信息統(tǒng)計特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像。

3.算法的適用范圍27

算法的復雜度即指完成圖像壓縮和解壓縮所需的運算量和硬件實現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時一定要考慮圖像信源本身的統(tǒng)計特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應能力、應用環(huán)境以及技術標準。4.算法的復雜程度

286.1圖像編碼概述

6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容296.2哈夫曼編碼

1.哈夫曼編碼的理論基礎

R≥H——總可設計出一種無失真編碼;R>>H時,表明該編碼方法效率很低;R等于或很接近于H時——最佳編碼,無失真;R<H時,壓縮比較高,但會引起圖像失真。

30設D為編碼所使用的數(shù)制,則變長最佳編碼的平均碼字長度R的范圍為:

變長最佳編碼定理:在變長編碼中,如果碼字長度嚴格按照對應符號出現(xiàn)的概率大小逆序排列,則其平均碼字長度為最小,這就是變長最佳編碼定理。變長最佳編碼定理是哈夫曼編碼的理論基礎。31

2.哈夫曼編碼算法

首先,統(tǒng)計信源中各符號出現(xiàn)的概率,按符號出現(xiàn)的概率從大到小排序。把最小的兩個概率相加合并成新的概率,與剩余的概率組成新的概率集合。對新的概率集合重新排序,再次把其中最小的兩個概率相加,組成新的概率集合。如此重復進行,直到最后兩個概率的和為1。32

分配碼字。碼字分配從最后一步開始反向進行,對于每次相加的兩個概率,給大的賦“0”,小的賦“1”(也可全部相反)讀出時由該符號開始一直走到最后的概率和“1”,將路線上所遇到的“0”和“1”按最低位到最高位的順序排好,就是該符號的哈夫曼編碼。33

例:設一幅灰度級為8(分別用S0、S1、S2、S3、S4、S5、S6、S7表示)的圖像中,各灰度所對應的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。現(xiàn)對其進行哈夫曼編碼:

34035下面來看一下哈夫曼編碼的編碼效率。平均碼長R為:36數(shù)字圖像的熵H為:

則哈夫曼編碼的編碼效率η為:

37

對不同概率分布的信源,哈夫曼編碼的編碼效率有所差別。根據(jù)信息論中信源編碼理論,對于二進制編碼,當信源概率為2的負冪次方時,哈夫曼編碼的編碼效率可達100%,其平均碼字長度也很短,而當信源概率為均勻分布時,其編碼效果明顯降低。38哈夫曼編碼在不同概率分布下的編碼效果對比39哈夫曼編碼的特點:1)哈夫曼編碼構造出來的編碼值不是唯一的。原因是在給兩個最小概率的圖像的灰度值進行編碼時,可以是大概率為“0”,小概率為“1”,也可相反。當兩個灰度值的概率相等時,“0”、“1”的分配也是人為定義的,這就造成了編碼的不唯一性。但不影響解碼的正確性。

2)當圖像灰度值分布很不均勻時,哈夫曼編碼的效率就高。當信源概率是2的負冪次方時,編碼效率為100%,而在圖像灰度值的概率分布比較均勻時,其編碼效果最差。

3)哈夫曼編碼必須先計算出圖像數(shù)據(jù)的概率特性,再形成編碼表后,才能對圖像數(shù)據(jù)編碼,因此,哈夫曼編碼缺乏構造性。即不能使用某種數(shù)學模型建立信源符號與編碼之間的對應關系,而必須通過查找的方法,建立起他們之間的對應關系。如果信源符號很多,那么碼表就會很大,這勢必會影響到存儲與傳輸。40Step1:精確地統(tǒng)計出原始圖像中每個灰度值出現(xiàn)的概率;Step2:建立哈夫曼樹并進行編碼。在計算哈夫曼編碼表時需要對原始的圖象掃描兩遍:

由于需要建立二叉樹并遍歷二叉樹生成編碼,數(shù)據(jù)壓縮和還原速度都較慢。但是該編碼方法簡單有效,而且編碼效率相當高,因而應用非常廣泛。41

我們知道,對一幅圖像進行編碼時,如果圖像的大小大于256時,這幅圖像的不同的碼字就有可能是很大,例如極限為256個不同的碼字。對整幅圖直接進行Huffman編碼時,小分布的灰度值,就有可能具有很長的編碼。如:100位以上,這樣不但達不到壓縮的效果反而會使數(shù)據(jù)量加大,應該如何處理?Question??42

常用的且有效的方法是:將圖像分割成若干的小塊,對每塊進行獨立的Huffman編碼。例如:分成8×8的子塊,就可以大大降低不同灰度值的個數(shù)(最多是64而不是256)。436.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容446.3

香農(nóng)-范諾編碼

香農(nóng)-范諾(Shannon-Fannon)編碼也是一種常見的可變字長編碼。與哈夫曼編碼相似,當信源符號出現(xiàn)的概率正好為2-i(i>0)時,采用香農(nóng)-范諾編碼同樣能夠達到100%的編碼效率。香農(nóng)-范諾編碼的理論基礎是符號的碼字長度Ni完全由該符號出現(xiàn)的概率來決定,即式中,D為編碼所用的數(shù)制。

45香農(nóng)-范諾編碼的步驟如下:

(1)將信源符號按其出現(xiàn)概率從大到小排序;(2)計算出各概率對應的碼字長度Ni;(3)計算累加概率Ai,即

Ai=Ai-1+Pi-1i=1,2,…,N-1;A0=0

(4)把各個累加概率Ai由十進制轉化為二進制,取該二進制數(shù)的前Ni位作為對應信源符號的碼字。46香農(nóng)-范諾編碼47二分法香農(nóng)-范諾編碼方法:

(1)首先統(tǒng)計出每個符號出現(xiàn)的概率;(2)對上述概率從大到小排序;(3)從這個概率集合中的某個位置將其分為兩個子集合,并盡量使兩個子集合的概率和近似相等,給前面一個子集合賦值為0,后面一個子集合賦值為1;(4)重復步驟3,直到各個子集合中只有一個元素為止;(5)將每個元素所屬的子集合的值依次串起來,即可得到各個元素的香農(nóng)-范諾編碼。48二分法香農(nóng)-范諾編碼496.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼

6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容506.4

行程編碼

將具有相同值的連續(xù)串用其串長和一個代表值來代替,該連續(xù)串就稱為行程,串長稱為行程長度。例如

aaaa

bbb

cc

d

eeeee

fffffff(共22

8=176bits)

4a3b2c1d5e7f

(共12

8=96bits)

1.行程編碼基本原理和方法

行程編碼——行程長度編碼(RunLengthEncoding,RLE)51

定長編碼:編碼的行程長度所用的二進制位數(shù)固定。

變長行程編碼:對不同范圍的行程長度使用不同位數(shù)的二進制位進行編碼。使用變長行程編碼需要增加標志位來表明所使用的二進制位數(shù)。

2.行程編碼的分類3.

行程編碼的應用1)行程編碼比較適合于二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場合,用行程來表示連零碼。

2)如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的,那么采用行程編碼可以達到很高的壓縮比。

3)如果圖像中的數(shù)據(jù)非常分散,則行程編碼不但不能壓縮數(shù)據(jù),反而會增加圖像文件的大小。這時一般和其他編碼結合使用。52傳真件中一般都是白色比較多,而黑色相對比較少。所以可能常常會出現(xiàn)如下的情況:

600w3b100w12b4w3b200w

上面的行程編碼所需用的字節(jié)數(shù)為:7

因為:512<600<1024

所以:計數(shù)值必須用10bit來表示

10

7=70bit在傳真中的應用53

現(xiàn)在我們就希望對其有一個改善。白色:10bit,黑色:4bit

600W3b100w12b4w3b200w

所需字節(jié)數(shù)為:

4

10+3

4=52bit

比原來的方式10

7=70bit減少了18bit54PCX文件:文件頭+圖像壓縮數(shù)據(jù)+256色調(diào)色板。文件頭全長128字節(jié),包含了圖像的大小和顏色以及PCX文件的版本標識等信息。圖像壓縮數(shù)據(jù)緊跟在文件頭之后。按顏色平面和掃描行存儲。如果沒有使用調(diào)色板,那么圖像壓縮數(shù)據(jù)存儲的是實際像素值;否則,存儲的是調(diào)色板的索引值。4.PCX文件中的行程編碼PCX格式是ZSOFT公司在開發(fā)圖像處理軟件Paintbrush時開發(fā)的一種格式,基于PC的繪圖程序的專用格式,一般的桌面排版、圖形藝術和視頻捕獲軟件都支持這種格式。PCX支持256色調(diào)色板或全24位的RGB,圖像大小最多達64K

64K像素。不支持CMYK或HSI顏色模式,photoshop等多種圖像處理軟件均支持PCX格式。PCX壓縮屬于無損壓縮。551)圖像數(shù)據(jù)以字節(jié)為單位進行編碼的,每行填充到偶數(shù)字節(jié).2)PCX文件規(guī)定編碼時的最大行程長度為63,如果行程長度大于63,則必須分多次存儲。對于長度大于1的行程,編碼時先存入其行程長度(長度L加上192即0xC0),再存入該行程的代表值,行程長度和行程的代表值分別占一字節(jié)。

3)如果遇到不重復的像素值,如果該像素值小于等于0xC0,則直接存入該像素值。否則首先存入一個0xC1,然后再存入該像素值。這樣做是為了避免該像素值被誤認為是數(shù)據(jù)長度。

4)對于連續(xù)重復的像素值,統(tǒng)計其連續(xù)出現(xiàn)的次數(shù)iCount(最大取值為63),先存入長度信息(iCount|0xC0),然后再存入像素值。如果連續(xù)次數(shù)超過63次,則必須分多次處理。例如,連續(xù)132個0x98,編碼時必須分三次處理,編碼結果為:0xFF0x980xFF0x980xC60x98。編碼原則:56從壓縮數(shù)據(jù)部分讀取一個字節(jié),判斷該值是否大于0xC0如果大于0xC0,則表明該字節(jié)是行程長度信息,取其低六位(相當于減去0xC0)作為行程長度L,讀取下一個字節(jié)作為像素值并重復L次存入圖像數(shù)據(jù)緩沖區(qū)如果小于等于0xC0,直接將該字節(jié)存入圖像數(shù)據(jù)緩沖區(qū)。256色PCX文件解碼:雖然幾乎所有的圖像應用軟件都支持PCX文件格式,但由于它的壓縮比不高,因而現(xiàn)在用得不是很多。576.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容586.5LZW編碼

LZW(Lempel-Ziv&Welch)——又稱字串表編碼,無損編碼。

LZW編碼與行程編碼類似,也是對字符串進行編碼從而實現(xiàn)壓縮,但它在編碼的同時還生成了特定字符串以及與之對應的索引字符串表。59對文件進行編碼的同時,生成了特定字符序列的表以及它們對應的代碼。比如8位圖像編成12位碼,除了256代表原來8位字符,其他代碼分配給在壓縮過程中出現(xiàn)的字符串。(如字符對)當表中沒有的字符串第一次出現(xiàn)的時候,原樣保存,同時將分配它的代碼也一起保存。只有如果這個字符串再次出現(xiàn),只存儲代碼。字符串表在壓縮中動態(tài)生成,而且也不用存儲,解壓時可以由壓縮文件中信息重構它。LZW編碼原則:60

GIF(GraphicsInterchangeFormat)是由CompuServe公司開發(fā)的一種壓縮位圖格式。它可支持多達256種的顏色,具有極佳的壓縮效率,已成為Internet上一種流行的文件格式。GIF圖像文件采用的是一種改良的LZW壓縮算法,通常稱為GIF-LZW壓縮算法。GIF-LZW壓縮編碼61S1、S2——兩個存放字符串的臨時變量LZW_CLEAR——字符表初始化標志LZW_EOI編碼結束標志設:(1)根據(jù)圖像中使用的顏色數(shù)初始化一個字串表,字串表中的每個顏色對應一個索引。在初始字串表的末尾再添加兩個符號(LZW_CLEAR和LZW_EOI)的索引。設置字符串變量S1、S2并初始化為空。(2)接著輸出LZW_CLEAR在字串表中的索引。編碼步驟:62(3)從圖像數(shù)據(jù)流中第一個字符(假設數(shù)據(jù)以字符串表示)開始,每次讀取一個字符,將其賦給字符串變量S2。(4)判斷“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,則S1=S1+S2;否則,輸出S1在字串表中的索引,并在字串表末尾為“S1+S2”添加索引,同時,S1=S2。(5)重復第3和第4步,直到所有字符讀完為止。(6)輸出S1中的字符串在字串表中的索引,然后輸出結束標志LZW_EOI的索引,編碼完畢。63GIF-LZW解碼流程

64

設有一來源于4色(以a、b、c、d表示)圖像的數(shù)據(jù)流aabcabbbbd,現(xiàn)對其進行LZW編碼。編碼過程如下:編碼前,首先需要初始化一個字符串表。

LZW編碼實例字符串索引a0Hb1Hc2Hd3HLZW_CLEAR4HLZW_EOI5H65GIF-LZW編碼過程編碼結果:4001271B35(十六進制表示)b66GIF-LZW解碼過程676.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容686.6算術編碼

基于信源概率統(tǒng)計特性的固定編碼模式針對未知信源概率模型的自適應模式基本原理:將被編碼的數(shù)據(jù)序列表示成0和1之間的一個間隔(即一個小數(shù)范圍),該間隔的位置與輸入數(shù)據(jù)的概率分布有關。

算術編碼有兩種模式:69例:設一待編碼的數(shù)據(jù)序列(即信源)為“dacab”,信源中各符號出現(xiàn)的概率依次為P(a)=0.4,P(b)=0.2,P(c)=0.2,P(d)=0.2。首先,數(shù)據(jù)序列中的各數(shù)據(jù)符號在區(qū)間[0,1]內(nèi)的間隔(賦值范圍)設定為a=[0,0.4),b=[0.4,0.6),c=[0.6,0.8),d=[0.8,1.0)StartN=StartB+LeftC×L

EndN=StartB+RightC×L

70

第一個被壓縮的符號為“d”,其初始間隔為[0.8,1.0);第二個被壓縮的符號為“a”,由于前面的符號“d”的取值區(qū)間被限制在[0.8,1.0)范圍內(nèi),所以“a”的取值范圍應在前一符號間隔[0.8,1.0)的[0,0.4)子區(qū)間內(nèi),根據(jù)上式可知:StartN=0.8+0×(1.0-0.8)=0.8EndN=0.8+0.4×(1.0-0.8)=0.88即“a”的實際編碼區(qū)間在[0.8,0.88)之間。71

第三個被壓縮的符號為“c”,其編碼取值范圍應在[0.8,0.88)區(qū)間的[0.6,0.8)的子區(qū)間內(nèi),據(jù)上式可知

第四個被壓縮的符號為“a”,其編碼取值范圍應在[0.848,0.864)區(qū)間的[0,0.4)的子區(qū)間內(nèi)StartN=0.848+0×(0.864-0.848)=0.848

EndN=0.848+0.4×(0.864-0.848)=0.854472

第五個被壓縮的符號為“b”,其編碼取值范圍應在[0.848,0.8544)區(qū)間的[0.4,0.6)的子區(qū)間內(nèi)StartN=0.848+0.4×(0.8544-0.848)=0.85056

EndN=0.848+0.6×(0.8544-0.848)=0.85184至此,數(shù)據(jù)序列“dacab”已被描述為一個實數(shù)區(qū)間[0.85056,0.85184],或者說在此區(qū)間內(nèi)的任一實數(shù)值都唯一對應該數(shù)據(jù)序列。這樣,就可以用一個實數(shù)表示這一數(shù)據(jù)序列。我們把區(qū)間[0.85056,0.85184]用二進制形式表示為[0.110110011011,

0.110110100001]。73

在這個區(qū)間中,0.1101101位于這個區(qū)間內(nèi)并且其編碼最短,故把其作為數(shù)據(jù)序列“dacab”的編碼輸出。考慮到算術編碼中任一數(shù)據(jù)序列的編碼都含有“0.”,所以在編碼時,可以不考慮“0.”,于是把1101101作為本例中的數(shù)據(jù)序列的算術編碼。由此可見,數(shù)據(jù)序列“dacab”用7比特的二進制代碼就可以表示,平均碼長為1.4比特/字符。

746.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容756.7預測編碼預測:根據(jù)過去時刻的樣本序列,采用一種模型預測當前的樣本值;預測編碼的基本思想:通過僅提取每個像素中的新信息并對它們編碼來消除像素間的相關性和冗余性。1個象素的新信息——該像素的當前或現(xiàn)實值與預測值的差。前提:像素間具有相關性。1.無損預測編碼2.有損預測編碼76輸入圖像預測器整數(shù)舍入符號編碼器fn+-en壓縮圖像1.無損預測編碼預測器符號解碼器fn+en壓縮圖像+解壓圖像772.

有損預測編碼輸入圖像預測器符號編碼器fn+-en壓縮圖像量化器++預測器符號編碼器+壓縮圖像+解壓圖像786.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術編碼6.7預測編碼6.8圖像編碼的國際標準主要內(nèi)容796.8圖像編碼的國際標準1.靜止圖像壓縮標準

JPEG2.運動圖像壓縮標準

MPEG

近十年來,圖像編碼技術得到了迅速發(fā)展和廣泛應用,并且日臻成熟,其標志就是幾個圖像壓縮國際標準的制定。即關于靜止圖像的編碼標準JPEG和JPEG2000、關于電話/會議電視的視頻編碼標準H.261,H.263和關于活動圖像的編碼標準MPEG-1,MPEG-2,

MPEG-4和H.264等。JPEG(JointPhotographicExpertGroup);MPEG(MotionPictureExpertsGroup)80圖像壓縮國際標準標準標題起止日期目標比特率應用場合主要編碼技術JPEG連續(xù)色調(diào)靜態(tài)圖像1986.3~1992.10壓縮比為2~30·因特網(wǎng)·數(shù)字照相·圖像/視頻編輯·DCT·知覺量化·霍夫曼編碼·算術編碼JPEG2000新一代靜態(tài)圖像編碼標準1996.2~2000.12壓縮比為2~50·因特網(wǎng)·移動通信·數(shù)字照相·遙感·傳真·數(shù)字圖書館·JPEG所有技術·小波變換·EBCOTROI編碼·可擴展編碼81標準標題目標比特率應用場合主要編碼技術MPEG-1運動圖像及其伴音不超過1.5Mb/s·光盤存儲·VCD·視頻監(jiān)控·JPEG所有技術·自適應量化·運動補償預測MPEG-2運動圖像及其伴音1.5~35Mb/s·數(shù)字高清晰度電視·高品質(zhì)視頻·衛(wèi)星/有線電視·地面廣播·MPEG-1所有技術·基于幀/場的運動補償·擴展編碼·容錯編碼82標準標題目標比特率應用場合主要編碼技術MPEG-4音視頻對象的通用編碼8kb/s~35Mb/s·因特網(wǎng)·交互式視頻·2D/3D計算機圖形·移動通信·MPEG-2所有技術·小波變換·運動估計/補償·可擴展編碼·位圖形狀編碼·對象編碼·動態(tài)網(wǎng)絡編碼MPEG-7多媒體描述接口·多媒體數(shù)據(jù)庫等MPEG-21多媒體框架83標準標題目標比特率應用場合主要編碼技術H.261Px64kb/s的音視頻服務Px64kb/s(p:1~30)·ISDN視頻會議·DCT·自適應量化·運動補償預測·運動估計·霍夫曼編碼H.263低比特率通信的視頻編碼8kb/s~1.5Mb/s·POTS視頻電話·桌面視頻電話·移動視頻電話·H.261所有技術·雙向運動補償·半像素運動估計·高級運動估計·重疊運動補償·算術編碼84JPEG(jointpictureexpertgroup)——面向靜態(tài)圖像編碼的標準。在相同圖像質(zhì)量條件下,JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應用于多媒體和網(wǎng)絡程序中,是現(xiàn)今萬維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮,即在壓縮過程中會丟失數(shù)據(jù),每次編輯JPEG圖像后,圖像就會被重復壓縮一次,損失就會有所增加。

1.靜止圖像壓縮標準——JPEG851)順序式(Sequential)DCT方式

2)漸進式(Progressive)DCT方式JPEG允許的四種編碼模式:

頻譜選擇法逐次逼近法3)無失真(Lossless)方式

4)分層(Hierarchical)方式861)順序式(Sequential)DCT方式:從左到右、從上到下對圖像順序進行基于離散余弦變換(DCT)的編碼。DCT理論上是可逆的,但在計算時存在誤差,因而基于DCT的編碼模式是一種有損編碼。2)漸進式(Progressive)DCT方式:基于DCT,對圖像分層次進行處理,從模糊到清晰地傳輸圖像(與GIF文件的交錯方式類似)。有兩種實現(xiàn)方法,一種是頻譜選擇法,即按Z形掃描的序號將DCT量化序數(shù)分成幾個頻段,每個頻段對應一次掃描,每塊均先傳送低頻掃描數(shù)據(jù),得到原圖概貌,再依次傳送高頻掃描數(shù)據(jù),使圖像逐漸清晰;另一種是逐次逼近法,即每次掃描全部DCT量化序數(shù),但每次的表示精度逐漸提高。873)無失真(Lossless)方式:使用線性預測器,如DPCM,而不是基于DCT。4)分層(Hierarchical)方式:在空間域將源圖像以不同的分辨率表示,每個分辨率對應一次掃描,處理時可以基于DCT或預測編碼,可以是漸進式,也可以是順序式。差分脈沖編碼調(diào)制88

1)基本系統(tǒng)(BaselineSystem)

2)擴展系統(tǒng)(ExtendedSystem)

3)無失真壓縮系統(tǒng)(LosslessSystem)一個符合JPEG標準的編解碼器至少要滿足基本系統(tǒng)的技術指標?;镜腏PEG算法屬于變換類編碼,下面針對基于DCT的順序式基本系統(tǒng)編碼來說明JPEG的編碼方法。

JPEG定義了三種系統(tǒng):89JPEG編碼/解碼的流程圖

熵編碼即編碼過程中按熵原理不丟失任何信息的編碼。信息熵為信源的平均信息量(不確定性的度量)。常見的熵編碼有:香農(nóng)(Shannon)編碼、哈夫曼(Huffman)編碼和算術編碼(arithmeticcoding)。在視頻編碼中,熵編碼把一系列用來表示視頻序列的元素符號轉變?yōu)橐粋€用來傳輸或是存儲的壓縮碼流。輸入的符號可能包括量化后的變換系數(shù),運動向量,頭信息(宏塊頭,圖像頭,序列的頭等)以及附加信息(對于正確解碼來說重要的標記位信息)。901)數(shù)據(jù)分塊

將圖像從RGB空間轉換到YCbCr空間。將每個分量圖像分割成不重疊的8×8像素塊——DU(DataUnit)。在YCbCr空間中壓縮圖像的每個彩色分量。二次采樣——采用不同的采樣頻率對圖像采樣。由于亮度比色彩更重要,因而對Y分量的采樣頻率可高于對Cb、Cr的采樣頻率,這樣有利于節(jié)省存儲空間。YCbCr其中Y是指亮度分量,Cb指藍色色度分量,而Cr指紅色色度分量。

91把采樣頻率最低的分量圖像中一個DU所對應的像區(qū)上覆蓋的所有各分量上的DU按順序編組為一個最小編碼單元(MCU)。

對灰度圖像而言,只有一個Y分量,MCU就是一個數(shù)據(jù)單元。對彩色圖像而言,以4:1:1的采樣方案為例,則一個MCU由4個Y分量的DU、1個Cb分量的DU和1個Cr分量的DU組成。92

以MCU為單位順序將DU進行二維離散余弦變換。對以無符號數(shù)表示的具有P位精度的輸入數(shù)據(jù),在DCT前要減去2P-1,轉換成有符號數(shù),而在IDCT后,應加上2P-1,轉換成無符號數(shù)。對每個8×8的數(shù)據(jù)塊DU進行DCT后,得到的64個系數(shù)代表了該圖像塊的頻率成分,其中低頻分量集中在左上角,高頻分量分布在右下角。系數(shù)矩陣左上角的叫做直流(DC)系數(shù),它代表了該數(shù)據(jù)塊的平均值,其余63個叫交流(AC)系數(shù)。2)DCT處理93

在DCT處理中得到的64個系數(shù)中,低頻分量包含了圖像亮度等主要信息。在從空間域到頻域的變換中,圖像中的緩慢變化比快速變化更易引起人眼的注意,所以在重建圖像時,低頻分量的重要性高于高頻分量。因而在編碼時可以忽略高頻分量,從而達到壓縮的目的,這也是量化的根據(jù)和目的。3)系數(shù)量化94亮度量化表色度量化表95DCT系數(shù)量化后,構成一個稀疏矩陣,用Z(Zigzag)形掃描將其變成一維數(shù)列,將有利于熵編碼。Z形掃描的順序如圖所示。DCT系數(shù)的Z形掃描順序

4)Z形掃描

96DC系數(shù)反映了一個8×8數(shù)據(jù)塊的平均亮度,一般與相鄰塊有較大的相關性。

JPEG對DC系數(shù)作差分編碼,即用前一數(shù)據(jù)塊的同一分量的DC系數(shù)作為當前塊的預測值,再對當前塊的實際值與預測值的差值作哈夫曼編碼。

5)DC系數(shù)編碼97

若DC系數(shù)的動態(tài)范圍為-1024~+1024,則差值的動態(tài)范圍為-2047~+2047。如果為每個差值賦予一個碼字,則碼表過于龐大。采用“前綴碼(SSSS)+尾碼”來表示。前綴碼指明了尾碼的有效位數(shù)B,可以根據(jù)DIFF(DC系數(shù)的差值)從對應表中查出前綴碼對應的哈夫曼編碼。尾碼的取值取決于DC系數(shù)的差值和前綴碼。如果DC系數(shù)的差值DIFF大于等于0,則尾碼的碼字為DIFF的B位原碼;否則,取DIFF的B位反碼。98

經(jīng)Z形排列后的AC系數(shù),更有可能出現(xiàn)連續(xù)0組成的字符串,——行程編碼將有利于壓縮數(shù)據(jù)。

JPEG將一個非零DC系數(shù)及其前面的0行程長度(連續(xù)0的個數(shù))的組合稱為一個事件。將每個事件編碼表示為“NNNN/SSSS+尾碼”,

NNNN——0行程的長度

SSSS——尾碼的有效位數(shù)B(即當前非0系數(shù)所占的比特數(shù)),如果非零AC系數(shù)大于等于0,則尾碼的碼字為該系數(shù)的B位原碼,否則,取該系數(shù)的B位反碼。6)AC系數(shù)編碼992.運動圖像壓縮標準H.261:主要為電視會議等應用制訂。也稱P×64標準??稍试S通過T1線路(帶寬為1.544Mbit/s)以小于150ms的延遲傳輸運動視頻。

MPEG-1:娛樂質(zhì)量的視頻壓縮標準,主要用于數(shù)字媒體上壓縮圖像數(shù)據(jù)的儲存和提取。

MPEG-2:用于視頻傳輸?shù)膲嚎s標準,適用于從普通電視直到高清晰度電視的帶寬范圍。

MPEG-4:適應在窄帶寬上對動態(tài)圖像進行傳輸?shù)囊???蓪Ω鞣N音頻視頻AV進行有效的編碼,同時支持固定碼流和變碼流。100一、MPEG-1視頻壓縮標準

MPEG-1是由ISO/IEC于1991年提出的,正式名稱為“用于數(shù)字存儲媒體的1.5Mbit/s以下的活動圖像及相關音頻編碼”(ISO/IEC11172)。其中的數(shù)字存儲媒體包括光盤(CD),視頻光盤(VCD),其中分配比特的方案是在1.5Mbps的數(shù)據(jù)傳輸中1.2Mbps用于編碼視頻,256Kbps用于立體聲。MPEG-1包括五個部分:系統(tǒng)、視頻、音頻、一致性、及軟件。在MPEG-1只采用逐行掃描方式,采用4:2:0的亞采樣格式,其源輸入格式是SIF,有352x288x25和352x288x30兩種格式。101MPEG-1采用兩種壓縮方法:幀內(nèi)壓縮算法:采用與JPEG壓縮算法大致相同的方法,即基于DCT的變換編碼技術,用以減少空間冗余信息。幀間壓縮算法:采用運動補償算法、預測編碼方法、以及差補法等編碼方法。幀間編碼技術可以減少時間冗余信息。102MPEG-1視頻壓縮編碼算法在MPEG-1編碼中,為了支持隨機訪問與高效壓縮的要求,定義了四種編碼類型:

I幀圖像編碼(幀內(nèi)圖像)、

P幀圖像編碼(預測圖像)、

B幀圖像編碼(差補圖或雙向預測圖像)。

D幀圖像編碼(直流分量圖像)這四種類型的幀按某種方式組織在一起就構成了GOP。103I幀圖像的編碼

I幀圖像是利用圖像的空間相關性進行壓縮,其壓縮編碼采用類似JPEG壓縮算法,同時I幀圖像又是P幀圖像和B幀圖像的參考圖像,所以I幀圖像壓縮率不高,壓縮倍數(shù)在8倍左右。

幀內(nèi)圖像I不參照任何過去的或者將來的其它圖像幀,壓縮編碼采用類似JPEG壓縮算法:如果電視圖像是用RGB空間表示的,則首先把它轉換成YCrCb空間表示的圖像。每個圖像平面分成8×8的圖塊,對每個圖塊進行離散余弦變換DCT。DCT變換后經(jīng)過量化的交流分量系數(shù)后進行Z掃描,然后再使用無損壓縮技術進行編碼。104DCT變換后經(jīng)過量化的直流分量系數(shù)采用差分脈沖編碼DPCM,交流分量系數(shù)采用游程編碼RLE,然后再采用哈夫曼(Huffman)編碼或者用算術編碼。105P幀圖像的編碼

P幀圖像是參考過去的I幀圖像(幀內(nèi)圖像)或者過去的預測得到P幀圖像用運動補償預測技術進行編碼,這些預測圖像通常作為進一步預測的參考幀,預測圖像的編碼效率較高。

P幀圖像的編碼也是以圖像宏塊為基本編碼單元。預測編碼的基礎是運動估值,它將直接影響到整個系統(tǒng)的編碼效率和壓縮性能,因此希望找到一種預測精度高同時計算量又小的運動估值算法。106P幀編碼時,編碼器需要對每一個宏塊作以下選擇:(1)決定是否作運動補償(MC/No-MC),即是將運動矢量發(fā)送出去,還是設其為0。在許多情況下,使用非零的運動矢量并不比使用零值的運動矢量所形成的誤差少多少。而非零運動矢量需要額外的編碼比特,因此這時可設運動矢量為0,這樣可以提高編碼效率。(2)決定采用幀內(nèi)編碼還是幀間編碼,即是采用幀內(nèi)宏塊編碼還是利用運動矢量預測編碼。在許多情況下,某些宏塊采用幀內(nèi)編碼方式也許會用更少的比特。這通常發(fā)生在由于運動十分劇烈而導致運動估計失敗的情況。107(3)決定宏塊要不要編碼。有時在量化后,宏塊中所有的DCT系數(shù)都是0,這種宏塊就不需要被編碼。在對這種宏塊解碼時,只需要從過去的幀中把對應的宏塊復制到這個宏塊就行了。(4)決定量化等級是否符合要求,是否需要改變。108B幀圖像的編碼

B幀圖像(或稱雙向圖)在預測時,既可使用前向預測方式,也可使用后向預測方式,或同時使用雙向預測后取平均方式(雙向幀間預測),取決于哪一種方式下表示該宏塊所需的信息量為最少。使用雙向預測后,可以使那些在前一幀中預測不到的內(nèi)容很好地在后一幀中預測到,而且通過預測后取平均,非常有效地減少了預測噪聲的影響。它的壓縮效率最高,但雙向預測圖像不作為預測的參考圖像。109類似于P幀,B幀在編碼前同樣要作一系列的決定,其流程如下:(1)決定運動補償模式,即前向,后向及插值

運動補償中哪個能達到最佳。

宏塊運動補償模式的選擇是基于代價函數(shù)的最小值。代價函數(shù)是運動補償宏塊和當前宏塊的亮度差的均方誤差。解碼器通過一種簡單的方法為前向運動補償計算最佳運動補償宏塊。然后再為后向運動補償計算最佳運動補償宏塊。最后再求兩種運動補償

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論