第11章-圖像壓縮編碼20160830

上傳人：c*** IP屬地：湖北上傳時間：2024-12-09 格式：PPT 頁數(shù)：62 大?。?6.58MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩57頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

第十一章圖像壓縮(yāsuō)編碼

Chapter11共六十二頁Contents信息論基礎(chǔ)圖像壓縮基本概念與模型統(tǒng)計(tǒngjì)編碼變換編碼預(yù)測編碼圖像壓縮編碼國際標準共六十二頁信息論基礎(chǔ)(jīchǔ)信息論基礎(chǔ)：信息論是圖像編碼的基礎(chǔ)。信息論認為(rènwéi)可以將信息的產(chǎn)生模擬成一個概率事件，可以用隨機過程描述信息論中的信源模型。信息熵：隨機變量的熵是描述隨機變量不確定度的統(tǒng)計量，設(shè)隨機變量X的概率密度函數(shù)為

，

，熵H(X)定義為，式中，

稱為自信息。通常在二元概率空間中規(guī)定等概率時的熵為單位熵，對數(shù)底為2時，熵的單位為比特(bit)；以e為底時，熵的單位為奈特(nat)；以10為底時，熵的單位為哈特利(Hartley)。隨機變量X的熵函數(shù)H(X)具有如下的基本性質(zhì)：

(非負性)；H(X)是X的凹函數(shù)(凹性)；當隨機變量X服從均勻分布時，其熵達到最大值，其中，

m為X可能取值的個數(shù)。共六十二頁信息論基礎(chǔ)(jīchǔ)相對熵：設(shè)隨機變量的概率分布

服從均勻分布，即所有取值的概率(gàilǜ)相等

，

，則有，

式中，

表示兩個概率分布

和

之間的相對熵，給出的是兩個隨機變量概率分布之間距離的度量。二元概率空間的熵函數(shù)共六十二頁信息論基礎(chǔ)(jīchǔ)香農(nóng)(Shannon)定理：關(guān)于隨機變X的信源編碼(biānmǎ)C是從X的取值空間

到

的一個映射，其中

表示D進制碼元表

中有限長度的符號序列所構(gòu)成的集合。設(shè)C表示x的碼字，

表示

的碼字

的長度，信源編碼C的期望長度L(C)定義為，若編碼將X的取值空間

中的每一個元素映射到不同的編碼序列，則稱這個編碼是非奇異的。非奇異碼可以保證了X取值的明確性，但只有在兩個碼字之間添加間斷碼，才能確保其可譯性。編碼C的擴展C*是從

中有限長度的符號序列到D進制碼元表

中有限長碼元序列的映射，。若一個編碼的擴展編碼是非奇異的，則稱該編碼是惟一可譯碼。若碼中無任何碼字是其他碼字的前綴，則稱該編碼為前綴碼。香農(nóng)第一定理(最優(yōu)前綴碼定理)：設(shè)

是關(guān)于信源概率分布

的D進制編碼的一組最優(yōu)碼字長度，L*為最優(yōu)碼的期望長度()，則有

。最優(yōu)編碼就是使碼字長度L(C)接近下界

。若L(C)遠大于

，則效率過低；若，則必然丟失信息。

共六十二頁圖像壓縮基本概念與模型(móxíng)圖像壓縮基本概念與模型：圖像信息具有直觀、形象的優(yōu)點，但數(shù)據(jù)量龐大。圖像壓縮的目的是消減圖像數(shù)據(jù)中的冗余信息，從而更加有效地傳輸和存儲圖像。圖像熵與編碼效率：將像素的灰度看作隨機變量(suíjībiànliànɡ)X，其概率分布率為

，

為灰度級，k=0,1,…,L-1，L為灰度級數(shù)。根據(jù)信息論中熵的定義，圖像熵H(X)定義為，通常采用編碼效率和冗余度來度量圖像壓縮編碼方法的性能，編碼效率

定義為，；冗余度

與編碼效率

之間的關(guān)系為，。壓縮率通常用于度量圖像編碼的數(shù)據(jù)壓縮程度。設(shè)源圖像的比特數(shù)為No，壓縮數(shù)據(jù)的比特數(shù)為Nc，圖像編碼的壓縮率

定義為，。共六十二頁圖像壓縮基本概念與模型(móxíng)圖像信息的冗余：數(shù)字圖像的冗余包括空間(kōngjiān)冗余、時間冗余、信息熵冗余、結(jié)構(gòu)冗余和心理視覺冗余等?？臻g冗余和時間冗余統(tǒng)稱為統(tǒng)計冗余?？臻g冗余是指，由于同一物體上各采樣點的顏色之間通常在空間上是均勻的、連續(xù)的，因此大量相鄰像素的數(shù)值是相同或相近的，存在著空間連貫性。時間冗余是指序列圖像中的相鄰幀之間的相關(guān)性所引起的數(shù)據(jù)冗余。信息熵冗余是從編碼技術(shù)的角度在圖像編碼時由于編碼效率不高所引起的數(shù)據(jù)冗余，也稱為編碼冗余。結(jié)構(gòu)冗余是指圖像中存在重復(fù)出現(xiàn)的相同或相似的紋理結(jié)構(gòu)。人類視覺系統(tǒng)對圖像的敏感性是非均勻和非線性的，在正常的視覺處理過程中，各種信息的相對重要程度不同，由此就產(chǎn)生了心理視覺冗余，包括：(1)人眼對亮度變化敏感，而對色度變化相對不敏感；(2)人眼的辨別能力與物體周圍的背景亮度成反比；(3)人眼對圖像中灰度發(fā)生急劇變化的邊緣區(qū)域敏感，而對非邊緣區(qū)域相對不敏感；(4)人眼對整體結(jié)構(gòu)敏感，而對局部細節(jié)相對不敏感

；(5)大多數(shù)情況下灰度圖像采用8位表示、共28種灰度，彩色圖像采用24位表示、共224種顏色，而人眼至多可以辨認出26級灰度和216種顏色。共六十二頁圖像壓縮基本概念與模型(móxíng)保真度準則：保真度是指圖像壓縮系統(tǒng)編解碼器的輸出信號再現(xiàn)輸入信號的相似程度，分主觀與客觀兩方面。主觀保真度準則：取決于人類的視覺感受，采用由人來評價的主觀方法。通過向觀察者呈現(xiàn)重構(gòu)圖像，然后將觀察者的評分進行平均，以此(yǐcǐ)作為圖像質(zhì)量的主觀評價。人是圖像和視頻的最終觀察者，因此主觀評價是最直接、最可靠的方法；其問題是需多次重復(fù)實驗，耗時費力，易受觀察者個人因素的影響，且無法將主觀評價方法嵌入到應(yīng)用系統(tǒng)中。值等級描述1極好圖像質(zhì)量極高2好圖像質(zhì)量高，感覺良好，干擾可以接受3過得去圖像質(zhì)量可以接受，干擾不是不可接受4勉強可以圖像質(zhì)量較低，希望能加以改善，在某種程度上難以接受干擾5差圖像質(zhì)量很差，尚能觀看，具有明顯不可接受的干擾6不可用圖像質(zhì)量非常差，無法觀看電視圖像的絕對等級量表共六十二頁圖像壓縮基本概念與模型(móxíng)客觀保真度準則：以壓縮編碼前后圖像的誤差來度量(dùliàng)的，采用由算法評價的客觀方法。源圖像與重構(gòu)圖像間的誤差可表為，設(shè)源圖像

和重構(gòu)圖像

的尺寸為M×N，

均方誤差MSE定義為圖像總體平方誤差的平均值，可表示為，若將源圖像與重構(gòu)圖像之間的誤差看作是噪聲，則重構(gòu)圖像

可表示為，

，信噪比SNR定義為圖像信號功率與噪聲功率

之比，可表示為，由于大多數(shù)信號具有很寬的動態(tài)范圍，通常以對數(shù)尺度來表示信噪比，單位為分貝。在這種情況下，信噪比SNRdB的定義為，共六十二頁圖像壓縮基本概念與模型(móxíng)圖像壓縮系統(tǒng)：圖像壓縮系統(tǒng)是由編碼(biānmǎ)器和解碼器兩個部分組成。編碼(biānmǎ)器是對源數(shù)據(jù)經(jīng)過編碼(biānmǎ)進行壓縮，由信源編碼(biānmǎ)器和信道編碼(biānmǎ)器組成；解碼器是對編碼(biānmǎ)生成的壓縮數(shù)據(jù)進行解壓縮，由與編碼(biānmǎ)器相對應(yīng)的信道解碼器和信源解碼器組成。信源編碼器和信源解碼器：信源編碼器用于減少或消除輸入信號的數(shù)據(jù)冗余，包含了映射器、量化器和符號編碼器3個級聯(lián)的操作；信道編碼器用于增強信源編碼器輸出符號的抗噪能力。信道編碼器和信道解碼器：當信道中含有噪聲或容易產(chǎn)生誤差時，信道編碼通過將可控制的冗余加入信源編碼的碼字以減少信道噪聲的影響，提高信息傳輸時的抗干擾能力。信源編碼器信源解碼器圖像壓縮系統(tǒng)共六十二頁統(tǒng)計(tǒngjì)編碼統(tǒng)計編碼：統(tǒng)計編碼是利用數(shù)據(jù)的統(tǒng)計冗余進行的可變碼字長度編碼，也稱為熵編碼。由源符號映射到可變長度的碼字稱為可變碼字長度編碼，如赫夫曼編碼。當待編碼的符號集合較大時，為了降低編解碼器的復(fù)雜度，采用準變長編碼，如香農(nóng)-費諾編碼。

對于信源符號的D進制前綴碼，設(shè)

是關(guān)于信源概率分布p的一組最優(yōu)碼長，碼長為

的編碼稱為香農(nóng)碼，步驟如下：統(tǒng)計每一個(yīɡè)信源符號出現(xiàn)的概率，將信源符號按其概率以遞減的順序排列，即：計算各個概率對應(yīng)的碼字長度：計算累積概率：將累積概率

由十進制小數(shù)轉(zhuǎn)換成二進制小數(shù)；截取二進制小數(shù)點后的前

位作為對應(yīng)信源符號的碼字。信源符號

概率

碼長

累積概率

的二進制表示碼字x30.4375200.0000000000x50.250020.43750.0111000001x40.187530.68750.10110000101x20.0625４0.8750.111000001110x10.062540.93750.111100001111香農(nóng)-費諾編碼的過程共六十二頁統(tǒng)計(tǒngjì)編碼費諾提出了一種構(gòu)造信源編碼的次優(yōu)方法—二分法香農(nóng)-費諾編碼方法，期望碼字長度可以達到

，具體編碼步驟(bùzhòu)如下：統(tǒng)計每一個信源符號出現(xiàn)的概率，將信源符號按其概率以遞減順序排列，，選取k使得

最??；從位置k將信源符號集合劃分為概率總和相等或近似相等的兩個子集，對概率較大的子集中的符號，加入0，對于概率較小的，加入1編碼；對每一個劃分出來的子集合重復(fù)2，直至子集中只剩余單個信源符號；依次連接每一個信源符號所屬子集的二進制編碼，組成所對應(yīng)的碼字。灰度值

xix3x5x4x2x1概率

0.43750.25000.18750.06250.0625第1次編碼01第2次編碼01第3次編碼01第4次編碼01信源符號

概率

碼長

碼字x30.43710x50.250021x40.18753110x20.062541110x10.062541111二分法香農(nóng)-費諾編碼的過程共六十二頁統(tǒng)計(tǒngjì)編碼赫夫曼編碼方法：赫夫曼樹是一種帶權(quán)路徑長度最短的二叉樹，也稱為最優(yōu)二叉樹。設(shè)根節(jié)點為0層，

為m個葉節(jié)點

對應(yīng)的權(quán)值，從根節(jié)點到葉節(jié)點的路徑長度為葉節(jié)點的層數(shù)，則樹的帶權(quán)路徑長度

的計算(jìsuàn)式為，赫夫曼編碼包括構(gòu)造赫夫曼樹和分配碼字兩步驟。構(gòu)造赫夫曼樹步驟如下：統(tǒng)計每一個信源符號出現(xiàn)的概率，并按其概率以遞減的順序排列；將最小概率的兩個符號合并成為一個節(jié)點，并將它們的概率之和作為該節(jié)點的概率，參與下一次的排序；按概率遞減順序重新排列新的節(jié)點，并重復(fù)2直至合并為一個總根節(jié)點。分配碼字步驟如下：對于每一個節(jié)點的分支，對概率大的符號0，對概率小的符號加入1編碼，從根節(jié)點到葉節(jié)點路徑分支上分配的編碼依次連接組成所對應(yīng)信源符號的碼字。共六十二頁統(tǒng)計(tǒngjì)編碼赫夫曼樹構(gòu)造(gòuzào)和碼字分配過程赫夫曼編碼的碼字信源符號

概率

碼長

碼字

x10.32200x40.22210x50.1811x60.163000x20.0840000x30.0440001共六十二頁統(tǒng)計(tǒngjì)編碼有關(guān)赫夫曼編碼的評論：赫夫曼編碼的實現(xiàn)問題：赫夫曼編碼在實際中存在的以下若干問題：1)當硬件實現(xiàn)時，概率值的最小存儲單元為1bit，不能精確到小數(shù)后多位，這樣會引起概率匹配不準確以及編碼效率的下降；2)由于碼字長度可變，因此(yīncǐ)赫夫曼編碼與解碼過程耗時；3)一幅灰度圖像一般達到256個灰度級，當對整幅圖像直接進行赫夫曼編碼時，就會產(chǎn)生很多不同的碼字，且小概率分布的灰度值可能有很長的編碼，這樣不僅達不到數(shù)據(jù)壓縮的目的反而會使數(shù)據(jù)量和復(fù)雜度增大。赫夫曼編碼與香農(nóng)碼：對于某個特定的符號，使用碼字長度為

的香農(nóng)碼，可能比最優(yōu)碼更差。例如，考慮兩個符號，其中一個符號發(fā)生的概率為0.9999，而另一個為0.0001。若使用香農(nóng)碼，則它們的碼字長度分別為1bit和14bit。然而，這兩個符號的赫夫曼編碼的最優(yōu)碼長都是1bit。因而，在香農(nóng)編碼中，不經(jīng)常發(fā)生的符號的碼字長度一般比最優(yōu)碼的碼字更長。對于單個符號來說，不論是香農(nóng)碼還是赫夫曼碼都可能有更短的碼字長度，但從平均意義上講，赫夫曼編碼具有更短的期望碼字長度。另外，從期望碼字長度衡量，香農(nóng)碼和赫夫曼碼的差別不超過1bit，兩者的期望碼字長度均在

H(X)與H(X)+1之間。共六十二頁統(tǒng)計(tǒngjì)編碼算術(shù)編碼：算術(shù)編碼將信源序列用0與1之間的小數(shù)進行編碼，可以用分數(shù)比特來表示單個信源符號。當信源序列的長度增加時，表示信源序列的編碼區(qū)間減小，信源序列表示該編碼區(qū)間所需的位數(shù)就會增加。具體來講，赫夫曼編碼每一次對一個符號進行編碼，將單個信源符號映射成一個整數(shù)位的碼字，而算術(shù)編碼將信源符號的整個序列映射成一個單獨的浮點數(shù)，給整個符號序列分配一個單一的碼字。在算術(shù)編碼中，根據(jù)信源中的每一個符號的概率來細分編碼區(qū)間，每輸入一個符號，將編碼區(qū)間縮小(suōxiǎo)至當前輸入符號的間隔。根據(jù)輸入信源符號的概率減小編碼區(qū)間[0,1)，信源符號的概率愈大對應(yīng)于間隔愈寬，需要使用較短的碼字表示；信源符號的概率愈小對應(yīng)于間隔愈窄，需要用較長的碼字表示。設(shè)一個離散無記憶信源X的符號集合為

，信源符號及其概率分布如表所示,信源的熵為1.5219bit。在算術(shù)編碼的開始，編碼區(qū)間為整個半開區(qū)間[0,1)，初始時根據(jù)每一個信源符號的概率將其劃分成3個間隔，符號x1對應(yīng)于間隔[0,0.4)，符號x2對應(yīng)于間隔[0.4,0.6)，符號x3對應(yīng)于間隔[0.6,1)。共六十二頁統(tǒng)計(tǒngjì)編碼算術(shù)編碼(biānmǎ)的過程算術(shù)編碼過程的步驟描述步驟輸入符號編碼判別編碼區(qū)間1x2符號x2的初始間隔為

[0.4,0.6)[0.4,0.6)2x1編碼區(qū)間[0.4,0.6)中符號x1的間隔為[0.4,0.48)

[0.4,0.48)

3x1編碼區(qū)間[0.4,0.48)中符號x1的間隔為[0.4,0.432)

[0.4,0.432)4x3編碼區(qū)間[0.4,0.432)中符號x3的間隔為[0.4192,0.432)[0.4192,0.432)5x3編碼區(qū)間[0.4192,0.432)中符號x3的間隔為[0.42688,0.432)

[0.42688,0.432)

共六十二頁統(tǒng)計(tǒngjì)編碼行程編碼：行程編碼是一種無損數(shù)據(jù)壓縮(shùjùyāsuō)的熵編碼方法，也稱為行程長度編碼。其基本原理是，將連續(xù)的符號序列用該序列的長度和單個符號來表示，連續(xù)的符號序列稱為行程，符號序列的長度稱為行程長度。例如，行程編碼將符號序列aabbbbccddddd表示為2a4b2c5d。行程編碼是一種針對二值圖像的有效編碼方法，對連續(xù)的黑色和白色像素數(shù)（行程）進行編碼。由于傳真文檔主要是二值文檔，行程編碼已成為傳真文檔壓縮編碼的標準方法。PCX圖像文件是最早支持彩色圖像的文件格式，最高可以支持256種彩色。此外，為了達到更高的壓縮率，一般不單獨使用行程編碼，而是與其他編碼方法結(jié)合使用。例如，在JPEG靜止圖像壓縮編碼標準中，綜合使用了變換編碼、預(yù)測編碼、行程編碼和熵編碼等編碼方法。共六十二頁變換編碼變換編碼：是將在空域描述的圖像信號轉(zhuǎn)換到變換域進行描述，然后再根據(jù)圖像信號在變換域中系數(shù)的特點和人類視覺特性進行編碼。變換編碼的原理：變換編碼將圖像像素矩陣經(jīng)過某種形式的正交變換轉(zhuǎn)換成一組變換系數(shù)，然后對這些變換系數(shù)進行量化和編碼。一般而言，正交變換后，大量變換系數(shù)都有較小的幅度，根據(jù)人類視覺特性對各個變換系數(shù)進行不同精度的量化，在保證一定圖像質(zhì)量的前提下，通過粗量化或完全(wánquán)拋棄較小的系數(shù)而幾乎不會發(fā)生視覺可察覺的圖像失真。這樣，能夠用少量的變換系數(shù)來表示圖像的大量信息，從而達到數(shù)據(jù)壓縮的目的。塊變換編碼是以圖像塊為基本單元的變換編碼技術(shù)，塊變換編碼依次執(zhí)行4個操作：圖像塊分解、正變換、量化器和符號編碼器。解碼器反序地執(zhí)行3個操作：符號解碼器、逆變換和圖像塊合并。編碼器解碼器共六十二頁統(tǒng)計(tǒngjì)編碼正交變換：正交變換是一維信號處理方法在二維空間的擴展，它能夠?qū)D像的大部分能量集中到相對少數(shù)幾個系數(shù)上，因此，可有效地消除像素之間的空間相關(guān)性。尺寸為M×N的數(shù)字圖像

，它與其正向離散變換

的關(guān)系為，

式中，

和

分別稱為正變換和逆變換的核函數(shù)或基函數(shù)。若變換的基函數(shù)為可分離的，則滿足。具有(jùyǒu)可分離基函數(shù)的二維變換可以分解為相應(yīng)的一維行(列)變換來計算。正變換和逆變換的基函數(shù)

決定了變換類型和總體計算的復(fù)雜性，傅里葉正變換的基函數(shù)以及傅里葉逆變換的基函數(shù)為，共六十二頁統(tǒng)計(tǒngjì)編碼離散余弦變換：離散余弦變換廣泛應(yīng)用于信號(xìnhào)和圖像的有損數(shù)據(jù)壓縮,二維離散余弦變換是一種圖像壓縮編碼領(lǐng)域中最常用的正交變換。一維離散余弦變換：離散余弦變換是一種與傅里葉變換有著內(nèi)在聯(lián)系的變換，離散余弦變換相當于是對一個實偶函數(shù)進行離散傅里葉變換。一維離散函數(shù)

，的離散余弦變換及其逆變換定義為：其中，一維離散余弦變換的基函數(shù)共六十二頁統(tǒng)計(tǒngjì)編碼二維離散余弦變換：對于尺寸為M×N的數(shù)字圖像

，二維離散余弦變換及其逆變換定義(dìngyì)為，其中，如同二維離散傅立葉變換，二維離散余弦變換也是作用于整幅圖像的變換，每一個

包含了所有

值。由于整幅圖像的離散余弦變換需要對全部像素進行計算，復(fù)雜度過高，因此，在實際的圖像編碼過程中，通常將整幅圖像劃分為8×8的圖像塊，以圖像塊為單元進行二維離散余弦變換，獲得8×8的變換系數(shù)矩陣，再將變換系數(shù)量化后進行熵編碼。共六十二頁統(tǒng)計(tǒngjì)編碼vuM=8、N=8時二維離散余弦(yúxián)變換的基圖像共六十二頁二維離散余弦(yúxián)變換(a)灰度圖像(túxiànɡ)

(b)對數(shù)DCT譜統(tǒng)計編碼共六十二頁統(tǒng)計(tǒngjì)編碼偽彩色表示的對數(shù)DCT譜，左上角紅色方框標出1/16、1/9和1/4的低頻(dīpín)成分區(qū)域共六十二頁(a)保留左上角1/16區(qū)域(qūyù)

(b)保留左上角1/9區(qū)域(c)保留左上角1/4區(qū)域(d)保留數(shù)值大于10的低頻DCT系數(shù)的低頻DCT系數(shù)的低頻DCT系數(shù)的DCT系數(shù)經(jīng)過DCT系數(shù)(xìshù)壓縮的重構(gòu)圖像及其誤差圖像統(tǒng)計編碼共六十二頁統(tǒng)計(tǒngjì)編碼DCT的矩陣形式：離散余弦變換是一種線性變換，一維序列

的離散余弦變換可用矩陣向量形式表示為，。其中，

為離散余弦變換矩陣，可表示為，一維離散余弦逆變換的矩陣向量形式可寫為：二維離散余弦變換具有(jùyǒu)行列可分離性，二維序列

的離散余弦變換及其逆變換的矩陣向量形式可寫為，式中，C1和C2分別為M×M維和N×N維離散余弦變換矩陣。共六十二頁統(tǒng)計(tǒngjì)編碼DCT和DFT的比較：與離散傅里葉變換相比，離散余弦變換能夠使分塊處理造成的塊效應(yīng)更弱。塊效應(yīng)是由圖像塊的邊界像素在拼接(pīnjiē)處構(gòu)成間斷造成的。離散傅里葉變換固有的N點周期性造成具有高頻特性的邊界間斷。當對DFT系數(shù)進行截斷或量化時，邊界點出現(xiàn)不正確的值，在圖像中表現(xiàn)為明顯的塊效應(yīng)。離散余弦變換固有的2N點周期不會產(chǎn)生固有的邊界間斷，因此，在很大程度上減少了這種塊效應(yīng)。DFTDCT一維DFT和DCT的固有周期圖釋共六十二頁

(b)DCT系數(shù)(xìshù)

(d)DFT系數(shù)的幅度

(a)斜坡(xiépō)信號(c)DCT重構(gòu)信號(e)DFT重構(gòu)信號斜坡信號的DFT和DCT表示統(tǒng)計編碼共六十二頁預(yù)測(yùcè)編碼預(yù)測編碼：是一種利用采樣信號之間存在的時間(shíjiān)和空間冗余來進行數(shù)據(jù)壓縮的編碼技術(shù)。無損預(yù)測編碼：由于相鄰像素之間具有較強的相關(guān)性，可以利用前面的像素值預(yù)測當前的像素值。由于預(yù)測誤差的熵小于像素值的熵，對預(yù)測誤差進行編碼所需的比特數(shù)少于直接對像素值編碼的比特數(shù)，從而能夠?qū)崿F(xiàn)更高的數(shù)據(jù)壓縮率。預(yù)測器的輸出經(jīng)過四舍五入到最接近的整數(shù)

，實際值

和預(yù)測值

之差為預(yù)測誤差，即，。符號編碼器通常采用變長編碼方法對預(yù)測誤差進行熵編碼，從而生成壓縮碼流。符號解碼器根據(jù)接收到的變長碼字解碼出預(yù)測誤差

，并通過反運算重構(gòu)源像素，即，。無損預(yù)測編解碼器系統(tǒng)框圖共六十二頁預(yù)測(yùcè)編碼從已知的

來預(yù)測，可以較準確地估計出

，即估計值近似等于，。其中，

為預(yù)測函數(shù)。最常用(chánɡyònɡ)的是線性預(yù)測編碼，根據(jù)前m個像素的線性組合預(yù)測當前像素，可表示為，對于二維函數(shù)數(shù)字圖像，有，源圖像預(yù)測誤差圖像灰度直方圖預(yù)測誤差直方圖共六十二頁預(yù)測(yùcè)編碼有損預(yù)測編碼：有損預(yù)測編碼的基礎(chǔ)是以損失圖像重構(gòu)的準確度為代價來換取壓縮率的提高。與無損預(yù)測編碼器不同的是，有損預(yù)測編碼器是在預(yù)測誤差與符號(fúhào)編碼器之間增加了一個量化器，對預(yù)測誤差進行量化。設(shè)

表示量化后的預(yù)測誤差，有損預(yù)測編碼器的預(yù)測器是在反饋環(huán)中，輸入

由預(yù)測值

與相應(yīng)的預(yù)測誤差量化值

相加產(chǎn)生，即，編碼器解碼器共六十二頁統(tǒng)計(tǒngjì)編碼有損預(yù)測編碼具體(jùtǐ)由如下5個步驟組成：預(yù)測器帶有存儲器，對前m個像素的輸出值

進行存儲，根據(jù)式

對當前輸入

進行預(yù)測，產(chǎn)生預(yù)測值

；計算當前輸入像素

與預(yù)測值

之差，產(chǎn)生預(yù)測誤差

；對預(yù)測誤差

進行量化，符號編碼器對預(yù)測誤差的量化值

進行編碼形成碼字發(fā)送；根據(jù)式

，解碼端將

與

相加重構(gòu)輸出信號

，由于量化引入了失真，根據(jù)式

，計算重構(gòu)誤差

；繼續(xù)輸入下一個像素

，重復(fù)上述過程。共六十二頁統(tǒng)計(tǒngjì)編碼增量調(diào)制：增量調(diào)制或增量脈碼調(diào)制系統(tǒng)只保留每一個采樣信號與其(yǔqí)預(yù)測值之差的符號，并采用一位二進制數(shù)編碼的差分脈沖編碼調(diào)制。這是一種簡單的有損預(yù)測編碼形式，其預(yù)測函數(shù)定義及量化器定義如下，式中，是通常小于1的預(yù)測系數(shù)，

是正常量。，設(shè)輸入采樣信號為，解碼器輸出的重構(gòu)信號為，DM量化和編碼示意圖DM編碼示例共六十二頁統(tǒng)計(tǒngjì)編碼最優(yōu)線性預(yù)測：在預(yù)測編碼中，設(shè)計最優(yōu)線性預(yù)測器最重要的是選擇合適的預(yù)測器階數(shù)m以及

個預(yù)測系數(shù)

，使得預(yù)測器達到最優(yōu)預(yù)測效果。最優(yōu)線性預(yù)測器的設(shè)計分為兩個部分：預(yù)測器階數(shù)的確定：由圖像的統(tǒng)計特性可知，一幅圖像中像素之間的相關(guān)系數(shù)在較小的范圍內(nèi)可以用指數(shù)衰減型曲線近似。當像素的距離增大時，其相關(guān)性急劇減弱，因此，預(yù)測器的階數(shù)無需取值過大。實驗(shíyàn)表明，對于大多數(shù)圖像，階數(shù)

的取值一般為3。預(yù)測系數(shù)的確定：將最優(yōu)預(yù)測器的預(yù)測系數(shù)選取問題轉(zhuǎn)換為關(guān)于一組預(yù)測系數(shù)的均方預(yù)測誤差最小化問題。根據(jù)二次凸優(yōu)化問題的一階KKT條件，滿足

使均方誤差最小化，即，將上式用法方程組的形式可表示為：通過解上式表示的線性方程組，求解出m個最優(yōu)預(yù)測系數(shù)

，使得均方預(yù)測誤差

達到最小值。共六十二頁統(tǒng)計(tǒngjì)編碼自適應(yīng)預(yù)測(yùcè)編碼

：差分脈沖編碼調(diào)制系統(tǒng)的預(yù)測器采用固定的預(yù)測系數(shù)和量化器參數(shù)，然而實際上圖像和視頻的局部時空特性是變化的，因此，采用固定參數(shù)達不到好的性能。自適應(yīng)預(yù)測編碼根據(jù)圖像和視頻的局部統(tǒng)計特征，自適應(yīng)地調(diào)整預(yù)測器的預(yù)測系數(shù)和量化器參數(shù)，進一步改善量化性能和提高壓縮率。自適應(yīng)DPCM系統(tǒng)包含自適應(yīng)量化和自適應(yīng)預(yù)測兩個部分。為了在一定的量化級下減小量化誤差或在同等的誤差條件下增大壓縮率，自適應(yīng)量化根據(jù)信號隨時間變化不均勻的特點，自適應(yīng)地改變量化階大小。使用較小的量化階編碼較小的差值，使用較大的量化階編碼較大的差值。自適應(yīng)預(yù)測依據(jù)信源特征，自適應(yīng)地選擇最優(yōu)預(yù)測系數(shù)。共六十二頁統(tǒng)計(tǒngjì)編碼幀間預(yù)測編碼：視頻幀同時具有空間相關(guān)性和時間相關(guān)性。幀間預(yù)測編碼是利用視頻幀間的相關(guān)性，來實現(xiàn)視頻圖像的壓縮。運動補償幀間預(yù)測：運動圖像是由時間上以幀周期為間隔的連續(xù)圖像構(gòu)成的時間序列圖像，相鄰幀間只有微小的細節(jié)(xìjié)變化，因此，運動圖像在時間上比在空間上具有更強的相關(guān)性。運動補償幀間預(yù)測編碼分為3個步驟：1)將圖像分解為相對靜止的背景區(qū)域和若干運動物體區(qū)域，通過運動估計獲得各個運動物體的運動向量；2)根據(jù)運動向量計算運動補償參考幀，作為當前幀的預(yù)測值；3)對預(yù)測誤差進行量化、編碼和傳輸，同時將運動向量和分解方式等信息發(fā)至接收端。DPCM/DCT視頻編解碼器的簡化系統(tǒng)框圖共六十二頁統(tǒng)計(tǒngjì)編碼塊匹配法：塊匹配法將圖像劃分為圖像塊，并假設(shè)圖像塊中的各個像素具有相同的運動，且只做平移運動。由于相鄰幀之間的相關(guān)性很強，圖像塊可以在前向幀和后向幀中對應(yīng)相近的位置找到相似的區(qū)域，因此，匹配搜索一般僅限制在一個有限范圍內(nèi)進行，稱之為搜索窗口。塊匹配法將當前幀第k幀劃分為圖像塊，對于每一個圖像塊，在前向幀第k-△k幀中的搜索窗口內(nèi)搜索最優(yōu)匹配塊，兩對應(yīng)圖像塊的相對位移(△x,△y)就是該圖像塊的運動向量。判別兩個圖像塊相似程度的準則，有最小均方誤差函數(shù)、最小平均絕對值差函數(shù)和最小絕對差分和函數(shù)等。作為固定搜索模式(móshì)，有二維對數(shù)搜索、三步搜索、叉形搜索、四步搜索、梯度下降搜索、菱形搜索、六邊形搜索、十字形菱形搜索等。參考幀當前幀共六十二頁預(yù)測(yùcè)編碼誤差曲面僅有一個(yīɡè)局部極小點誤差曲面有多個局部極小點固定搜索模式問題：當搜索模式的大小與序列中實際運動的程度不匹配時，就會出現(xiàn)過搜索和欠搜索；另一方面，運動較大序列(例如，全局運動)的運動向量靠近中心分布的假設(shè)不成立，因此，當搜索這樣的序列時，搜索步長太小會導(dǎo)致搜索路徑過長；此外，如果它的誤差曲面并非單峰，搜索甚至陷入誤差曲面上的局部極小點，導(dǎo)致匹配誤差偏大。共六十二頁預(yù)測(yùcè)編碼三步搜索算法：該算法從搜索窗口的原點(0,0)開始，以最大搜索長度的一半為步長，計算中心點及其周圍8個鄰點的塊匹配誤差，找到最小塊匹配誤差點；下一步以該點為中心，步長減半，在縮小的方形上的9個點中找最小塊匹配誤差點，直到搜索步長減為1。若搜索窗口的最大步長為7，則該算法以4、2、1為步長，三步完成搜索，因此稱為三步搜索算法。新三步搜索算法：三步搜索算法步長較大，對于運動較小的序列，易陷入局部極小點。由于運動向量的分布(fēnbù)具有靠近中心的特性，因此，新三步搜索算法在上述第一步中加入了以搜索窗口原點為中心的8個鄰點參與比較。三步搜索算法新三步搜索算法Tennis序列中9幀圖像的運動向量分布共六十二頁預(yù)測(yùcè)編碼四步搜索算法：針對三步搜索算法第一步的搜索步長過大提出的改進。第一步與三步搜索相同，但步長為2，若最小塊匹配誤差點落在了方形中心或到達搜索窗口邊界，則步長減為1，比較3×3方形上的9個點，獲得(huòdé)最優(yōu)匹配點；否則，以該最小塊匹配誤差點作為新的中心繼續(xù)，步長不變。梯度下降搜索算法：梯度下降搜索算法完全基于誤差場單調(diào)分布的假設(shè)。首先將3×3方形的中心放在搜索窗口的原點，計算其上9個點的塊匹配誤差。若最小塊匹配誤差點落在方形的中心或到達搜索窗口邊界，則算法終止；否則，以該點作為新的中心點，繼續(xù)搜索新形成的3×3方形。該算法總是沿著塊匹配誤差最速下降的方向搜索，因此稱之為梯度下降搜索。四步搜索算法搜索運動向量例梯度下降搜索算法搜索運動向量例共六十二頁統(tǒng)計(tǒngjì)編碼菱形搜索算法：菱形搜索算法有兩種搜索模式，分別為大菱形搜索模式(LDSP)和小菱形搜索模式(SDSP)。算法(suànfǎ)搜索過程如下：將LDSP中心放在搜索窗口的原點，比較LDSP上的9個點的塊匹配誤差。若LDSP中心點的塊匹配誤差最小，則轉(zhuǎn)向第3步，否則，轉(zhuǎn)向第2步。以上一步中的最小塊匹配誤差點為中心形成新的LDSP，每一次僅需再計算3個或5個點的塊匹配誤差。若LDSP中心的塊匹配誤差最小，則轉(zhuǎn)向第3步，否則，重復(fù)執(zhí)行第2步。將LDSP切換為SDSP，5個點中的最小塊匹配誤差點指向最優(yōu)匹配塊。LDSPSDSP菱形搜索算法搜索運動向量例共六十二頁預(yù)測(yùcè)編碼六邊形搜索算法：菱形搜索中菱形周圍的8個點到中心的距離相差較大，為了更好地近似圓形，因此設(shè)計了六邊形搜索算法。六邊形算法同樣有兩種搜索模式，大六邊形搜索模式(LHSP)和小六邊形搜索模式(SHSP)。十字形菱形搜索算法：超過96%的運動向量分布在中心5×5的十字形區(qū)域內(nèi)，因此采用十字形搜索窗口(CSP)可減少搜索次數(shù)。該算法將中心放在搜索窗口的原點，檢查其上的9個點，若中心是最小塊匹配誤差點，則終止；否則，加入距離最近的、且屬于LDSP上的2個點參與比較。若上一步(yībù)的最小塊匹配誤差點為(±1,±1)或(0,±1)，且此步和上一步的最小塊匹配誤差點相同，則終止；否則，搜索步驟與菱形搜索算法相同。菱形搜索算法十字形菱形搜索算法LHSPSHSPCSPLDSP和SDSP共六十二頁預(yù)測(yùcè)編碼有效三步搜索算法：由于運動向量的分布具有靠近中心的特性，有效三步搜索算法在3SS算法的第一步中加入了SDSP上的4個點。十字形菱形六邊形搜索算法：視頻序列中出現(xiàn)較多的是平移、縮放、搖攝、傾斜運動。實驗證明，若用菱形搜索算法，則有大部分塊的運動向量分布在菱形的頂點上，在菱形搜索模式之前，首先采用十字形搜索模式，以提前終止搜索，減少運動小的塊的搜索次數(shù)(cìshù)，再用六邊形搜索，以減少從菱形頂點開始搜索的額外開銷，因此提出了十字形菱形六邊形搜索算法。十字形菱形六邊形搜索算法小大十字形VF-HSPHF-HSPVT-HSPHT-HSP

SHSP共六十二頁預(yù)測(yùcè)編碼十字形菱形六邊形搜索算法搜索過程：開始：將SCSP的中心放在搜索窗口的原點，檢查SCSP上的5個搜索點，若中心點的塊匹配誤差(wùchā)最小，則終止。大叉形搜索：加入LCSP最外面的4個點(±2,0)和(0,±2)，參與比較，即比較中心在搜索窗口原點的LCSP上的9個搜索點。半菱形搜索：再加入距離LCSP的最小塊匹配誤差點最近的，且屬于以搜索窗口原點為中心的LDSP上的2個點，參與比較，若上一步的最小塊匹配誤差點在SCSP的端點上，且這一步的最小塊匹配誤差點和上一步SCSP上的最小塊匹配誤差點相同，則算法終止。搜索：(1)若上一步使用LDSP搜索，且菱形邊上的點是最小塊匹配誤差點，則將LDSP的中心移到上一步的最小塊匹配誤差點；(2)若上一步使用LDSP搜索，且菱形水平(或垂直)方向的頂點是最小塊匹配誤差點，則將水平(或垂直)方向的LHSP的中心移到上一步的最小塊匹配誤差點；(3)否則，將與上一步相同的LHSP的中心移到上一步的最小塊匹配誤差點。對于上述的任何一種情況(LDSP→LDSP、LDSP→LHSP或LHSP→LHSP)，每一次僅出現(xiàn)3個新的搜索位置。若LDSP或LHSP的中心是最小塊匹配誤差點，則轉(zhuǎn)向第5步，否則重復(fù)執(zhí)行第4步。結(jié)束：若上一步使用LDSP搜索，則切換為SDSP；若上一步使用LHSP搜索，則切換為SHSP。(SDSP和SHSP的形式相同)。這一步5個搜索點中的最小塊匹配誤差點指向最優(yōu)匹配塊。共六十二頁子帶編碼(biānmǎ)子帶編碼：子帶編碼是一種在頻率域中進行數(shù)據(jù)壓縮的方法。子帶編碼與解碼過程：編碼中，首先用一組帶通濾波器將圖像信號分解成若干個在不同頻段上的子帶信號，然后將這些子帶信號經(jīng)過(jīngguò)頻率搬移轉(zhuǎn)變成基帶信號，再對它們在奈奎斯特速率上分別重采樣。采樣后的信號經(jīng)過(jīngguò)量化和編碼，并合并成一個總的碼流傳輸給接收端。接收端首先將碼流分成與原來的各個子帶信號相對應(yīng)的子帶碼流，然后解碼、將頻譜搬移至原來的位置，最后經(jīng)帶通濾波器并相加，重構(gòu)出輸出信號。子帶編碼的3個方面優(yōu)勢：各個子帶內(nèi)的量化失真都控制在各自子帶內(nèi)，不會擴散到其他子帶，圖像經(jīng)過子帶編碼后，能量較弱的高頻頻帶中的信號不會被其他頻帶中量化失真所掩蓋；根據(jù)人類視覺特性控制不同頻帶的編碼，在各個子帶之間合理分配編碼位數(shù)，使之適應(yīng)人眼對不同頻帶失真的敏感程度，從而提高圖像的主觀視覺質(zhì)量；子帶編碼由于其本身具備的頻率分解特性，適合于分辨率可分級和質(zhì)量可分級的圖像編碼，也適合嵌入式的碼流結(jié)構(gòu)。共六十二頁子帶編碼(biānmǎ)編碼器解碼器共六十二頁圖像壓縮編碼(biānmǎ)國際標準圖像壓縮編碼國際標準：20世紀80年代以來，國際標準化組織(Internationalstandardorganization,ISO)和國際電信聯(lián)盟(Internationaltelecommunicationunion,ITU)陸續(xù)制定了一系列有關(guān)圖像通信方面(fāngmiàn)的多媒體壓縮編碼標準，極大地推動了圖像編解碼技術(shù)的發(fā)展與應(yīng)用。這些壓縮編碼標準可以歸為兩類：靜止圖像壓縮編碼標準和運動圖像壓縮編碼標準。靜止圖像壓縮編碼標準包括適用于二值圖像的JBIG標準(1991,ITU-TT.82,ISO/IEC11544)、適用于連續(xù)色調(diào)靜止圖像的JPEG標準(1991,ITU-TT.81,ISO/IEC10918)、JPEG-LS標準(1998,ITU-TT.87,ISO/IEC14495)和JPEG2000標準(2001,ISO/IEC15444)；運動圖像壓縮標準包括ITU-T制定的H.26x系列和ISO制定的運動圖像專家組格式MPEG-x系列，其中，適用于運動圖像的H.261標準(1990,ITU-TH.261)、適用于運動圖像及伴音的MPEG-1標準(1993,ISO/IEC11172)、適用于高質(zhì)量運動圖像的MPEG-2/H.262標準(1995,ITU-TH.262,ISO/IEC13818-2)、適用于運動圖像的H.263標準(1996,ITU-TH.263)、適用于運動圖像的H.263+標準(1998,ITU-TH.263+)、適用于多媒體音像數(shù)據(jù)的MPEG-4標準(2000，ISO/IEC14496)、適用于運動圖像的H.263++標準(2002,ITU-T)和適用于運動圖像的H.264標準(2003,ITU-TH.264)。共六十二頁圖像壓縮編碼(biānmǎ)國際標準JPEG壓縮編碼：JPEG標準是第一個靜止圖像壓縮編碼的國際標準(ɡuójìbiāozhǔn)。JPEG編碼器的基本系統(tǒng)是基于分塊DCT的有損壓縮編碼，它利用離散余弦變換將圖像從空域轉(zhuǎn)換到變換域，使用量化表對DCT系數(shù)進行量化，然后使用預(yù)測編碼和熵編碼對量化系數(shù)進行編碼。編碼器解碼器共六十二頁圖像壓縮編碼(biānmǎ)國際標準JPEG壓縮編碼主要步驟：離散余弦變換：將圖像分解成尺寸為

的圖像塊，圖像塊之間不重疊，對每一個圖像塊獨立進行離散余弦變換，產(chǎn)生DCT系數(shù)矩陣，矩陣中第一行第一列元素為圖像塊的平均亮度，稱為直流系數(shù)，其余63個元素稱為交流系數(shù)。量化：量化操作是在保證視覺保真度的前提下消減高頻成分。量化表規(guī)定64個變換系數(shù)的量化精度，量化是產(chǎn)生信息損失的根源。Z字形掃描：將DCT的量化系數(shù)進行Z字形重排列，增加行程中連續(xù)0的個數(shù)，以此(yǐcǐ)提高后續(xù)行程編碼的壓縮率。差分脈沖編碼調(diào)制：DC系數(shù)具有兩個特點：DC系數(shù)的數(shù)值較大；相鄰兩個圖像塊的DC量化系數(shù)之間的差值很小。根據(jù)這兩個特點，使用差分脈沖編碼調(diào)制對DC系數(shù)進行單獨編碼。行程編碼：Z字形掃描的AC量化系數(shù)的特點是行程中包含很多零值系數(shù)，并且很多零值是連續(xù)的，因此使用行程編碼對Z字形掃描的AC量化系數(shù)進行編碼。赫夫曼編碼：最后，對經(jīng)過差分脈沖編碼調(diào)制的DC量化系數(shù)和行程編碼的AC量化系數(shù)進行赫夫曼編碼，從而進一步提高壓縮率。為了便于傳輸、存儲和解碼器進行譯碼，將各種標記符和編碼后的圖像數(shù)據(jù)組成逐幀的數(shù)據(jù)，這樣組織的數(shù)據(jù)通常稱為JPEG位數(shù)據(jù)流。共六十二頁

(a)質(zhì)量級別(jíbié)為高的JPEG壓縮圖像(b)質(zhì)量級別為中的JPEG壓縮圖像(c)量級別為低的JPEG壓縮圖像不同(bùtónɡ)質(zhì)量級別的JPEG壓縮圖像：重構(gòu)圖像、誤差圖像與誤差概率直方圖圖像壓縮編碼國際標準共六十二頁圖像壓縮編碼(biānmǎ)國際標準JPEG2000壓縮編碼標準：JPEG采用以離散余弦變換為主的塊編碼方式，而JPEG2000采用以小波變換為主的多分辨率編碼方式。其主要特點(tèdiǎn)如下：高壓縮率：JPEG2000編碼比JPEG有更高的壓縮率，編碼中所采用的小波變換避免了JPEG編碼中的塊效應(yīng)，通過對碼流的率失真優(yōu)化能保持整體壓縮性能，圖像質(zhì)量優(yōu)于同等壓縮率的JPEG格式圖像。同時支持無損和有損壓縮：由于JPEG2000采用嵌入式可分級碼流，實現(xiàn)無損到有損的漸進解壓，可在同一碼流中同時支持有損和無損壓縮。漸進傳輸：JPEG2000格式圖像支持漸進傳輸，首先傳輸圖像的整體輪廓，然后再逐步傳輸圖像細節(jié)，使圖像由模糊到清晰顯示。感興趣區(qū)域編碼：JPEG2000支持感興趣區(qū)域編碼，即對感興趣區(qū)域進行低壓縮率甚至無損壓縮編碼獲得高質(zhì)量的重構(gòu)圖像，而對其他區(qū)域采用高壓縮率。編解碼器結(jié)構(gòu)共六十二頁圖像壓縮編碼(biānmǎ)國際標準JPEG2000壓縮編碼主要步驟：預(yù)處理：首先將源圖像分解為若干互不重疊的矩形區(qū)域，稱為拼接塊，對每一個拼接塊進行獨立的編碼操作。拼接塊的尺寸會影響重構(gòu)圖像的質(zhì)量，因此，需要選擇合適的拼接塊尺寸。分量變換：分量變換實際上是顏色空間轉(zhuǎn)換的過程，作用是消除各個分量之間的相關(guān)性，以減少數(shù)據(jù)的冗余度，提高后續(xù)編碼的壓縮率。JPEG2000定義了兩種變換：可逆分量和不可逆分量變換。小波變換：對各個分量以拼接塊為單位進行小波變換，作用是消除像素間的空間相關(guān)性，將信息集中到少數(shù)的變換系數(shù)上。JPEG2000將bior5.3小波和jpeg9.7小波用作缺省小波變換濾波器，通過整型5/3小波變換來實現(xiàn)可逆變換，通過浮點型9/7小波變換來實現(xiàn)不可逆變換，分解級數(shù)默認為6。量化：量化操作是將大量幅度較小的高頻小波系數(shù)衰減或截斷為零，從而使用(shǐyòng)更少的位數(shù)來表示非零的量化系數(shù)。嵌入式塊編碼：JPEG2000中的熵編碼采納了嵌入式塊編碼(EBCOT)，包括“塊編碼”與“位流組織”二個階段，第一階段是基于上下文的二進制算術(shù)編碼器，第二階段是通過率失真優(yōu)化對碼塊位流進行編碼控制，并組織生成壓縮碼流。共六十二頁圖像壓縮編碼(biānmǎ)國際標準嵌入式塊編碼(EBCOT)主要步驟：位平面編碼：經(jīng)過小波變換和系數(shù)量化，對拼接塊進行小波分解的子帶由整數(shù)系數(shù)組成。在嵌入式塊編碼算法中，將小波分解的每一個子帶圖像劃分為尺寸相同的碼塊，對每一個碼塊進行獨立的嵌入式編碼。碼塊的劃分是在每一個子帶圖像中獨立進行，對小波系數(shù)的分塊遵循如下原則：1)為了(wèile)保證塊編碼的獨立性，碼塊不能跨越子帶邊界；2)同一子帶圖像中碼塊的尺寸相同；3)碼塊的尺寸為16～4096個像素，碼塊的寬和高都為2的冪次，JPEG2000推薦尺寸為64×64或32×32。每一個碼塊又可分解成位平面。從碼塊的非零比特的最高位平面開始直到最低位平面結(jié)束逐平面進行編碼。位平面上4行構(gòu)成一個編碼帶，以條帶形式掃描碼塊，掃描過程從位平面左上角的數(shù)據(jù)開始，連續(xù)掃描當前編碼帶中第一列4個數(shù)據(jù)后，轉(zhuǎn)向掃描第二列4個數(shù)據(jù)，如此繼續(xù)，直至掃描最后一列4個數(shù)據(jù)；然后，轉(zhuǎn)向掃描下一個編碼帶；按照這樣的順序依次掃描整個位平面。共六十二頁圖像壓縮編碼(biānmǎ)國際標準碼塊示意圖位平面(píngmiàn)示意圖編碼帶掃描示意圖位平面掃描順序標號，碼塊的尺寸為32×32共六十二頁圖像壓縮編碼(biānmǎ)國際標準MQ算術(shù)編碼：JPEG2000所采用的MQ算術(shù)編碼是一種自適應(yīng)二進制算術(shù)編碼方法。MQ算術(shù)編碼器根據(jù)位平面的上下文標簽和編碼器內(nèi)部的狀態(tài)決定編碼的輸出，將待編碼的二進制數(shù)分成大概率符號(MPS)和小概率符號(LPS)。設(shè)A表示編碼區(qū)間的寬度，C表示起始位置。若輸入符號為MPS，則A←A(1-Qe)，C←C+AQe；若輸入符號為LPS，則C保持不變，A←AQe。為了有利于硬件實現(xiàn)，采用固定精度的整數(shù)運算進行操作，且使用整數(shù)代替小數(shù)(xiǎoshù)。通過在編碼過程中采用“重歸一化處理過程”，可以將編碼區(qū)間A保持在單位1附近，通過近似處理簡化上述運算過程。若輸入符號為MPS，則A←A-Qe，C←C+Qe；若輸入符號為LPS，則C保持不變，A←Qe。MQ算術(shù)編碼器系統(tǒng)框圖MQ算術(shù)編碼器輸入與編碼區(qū)間劃分共六十二頁圖像壓縮編碼(biānmǎ)國際標準位流組織：第二階段編碼過程實際上是分層打包形成碼流的過程，按照率失真最優(yōu)的原則分層組織，選取合適的截斷點截斷每一個碼塊的位數(shù)據(jù)流，形成不同質(zhì)量的層，對每一層用不同的碼流格式打包。在編碼過程中，需要對每一個截斷點進行率失真優(yōu)化的計算，使其在任意(rènyì)點截斷都可以獲得率失真最優(yōu)的質(zhì)量。然后將截斷點和失真度以壓縮的形式同碼塊位流保存在一起，形成碼塊的嵌入式壓縮位流。轄區(qū)與子帶之間的關(guān)系以及數(shù)據(jù)包掃描順序示意圖

JPEG

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第11章-圖像壓縮編碼20160830

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔