第6章圖像編碼

上傳人：6*** IP屬地：湖北上傳時(shí)間：2022-05-19 格式：PPTX 頁數(shù)：70 大?。?.54MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩65頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、6.1 圖像壓縮原理6.2 數(shù)據(jù)冗余6.3 編碼定理6.4 圖像保真度6.5 變長編碼6.6 位平面編碼*6.7 預(yù)測編碼6.8 變換編碼l 圖像編碼，也稱為圖像壓縮l 提出的原因：未經(jīng)編碼（壓縮）的圖像數(shù)據(jù)量巨大，不利于儲存和網(wǎng)絡(luò)傳輸。l 數(shù)據(jù)和信息是不同的概念：數(shù)據(jù)是信息的載體，對給定量的信息可以用不同的數(shù)據(jù)量來表示。l 對給定量的信息，設(shè)法減少表達(dá)這些信息的數(shù)據(jù)量稱為數(shù)據(jù)壓縮。l 壓縮數(shù)據(jù)的重要方法是消除冗余數(shù)據(jù)，從數(shù)學(xué)角度來看就是要將原始圖像轉(zhuǎn)化為從統(tǒng)計(jì)角度盡可能不相關(guān)的數(shù)據(jù)集。圖像壓縮的理論基礎(chǔ)是信息論。l 壓縮的數(shù)據(jù)恢復(fù)為原始數(shù)據(jù)的過程稱為解壓縮，或解碼。l 根據(jù)解碼結(jié)果對原始圖像

2、的保真程度，壓縮分為無損壓縮和有損壓縮。原始圖像編碼編碼結(jié)果存儲傳輸解碼解碼圖像圖像的編碼和解碼過程碼率（流量描述）l 碼率（也叫比特率）：表示經(jīng)過壓縮編碼后的視音頻數(shù)據(jù)每秒需要用多少個(gè)比特來表示，即把每秒顯示的圖像進(jìn)行壓縮后的數(shù)據(jù)量，一般采用的單位是kbps或Mbps【該指標(biāo)對圖像的傳輸有意義】。l 一般來說碼率越大，處理出來的文件就越接近原始文件，但文件體積與碼率是成正比的，所以幾乎所有的編碼格式重視的都是如何用最低的碼率達(dá)到最少的失真，圍繞這個(gè)核心衍生出來的CBR（固定碼率）與VBR（動態(tài)碼率）。l 固定碼率CBR（Constant Bitrate）：指文件從頭到尾都是一種碼率，這是以固

3、定文件大小為前提的壓縮方式。l 動態(tài)碼率VBR（Variable Bitrate）：指沒有固定的碼率，壓縮時(shí)根據(jù)視音頻數(shù)據(jù)即時(shí)確定使用什么碼率，這是以質(zhì)量為前提兼顧文件大小的壓縮方式。根據(jù)編碼原理可以將圖像編碼分為熵編碼預(yù)測編碼變換編碼混合編碼(1) 熵編碼。熵編碼是純粹基于信號統(tǒng)計(jì)特性的編碼技術(shù)，是一種無損編碼。熵編碼的基本原理是給出現(xiàn)概率較大的符號賦予一個(gè)短碼字，而給出現(xiàn)概率較小的符號賦予一個(gè)長碼字，從而使得最終的平均碼長很小。常見的熵編碼方法有行程編碼(Run Length Encoding)、哈夫曼編碼和算術(shù)編碼。(2) 預(yù)測編碼。預(yù)測編碼基于圖像數(shù)據(jù)的空間或時(shí)間冗余特性，用相鄰的已知

4、像素(或像素塊)來預(yù)測當(dāng)前像素(或像素塊)的取值，然后再對預(yù)測誤差進(jìn)行量化和編碼。預(yù)測編碼可分為幀內(nèi)預(yù)測和幀間預(yù)測。常用的預(yù)測編碼有差分脈碼調(diào)制(Differential Pulse Code Modulation，DPCM) 和運(yùn)動補(bǔ)償法。(3) 變換編碼。變換編碼通常將空間域上的圖像經(jīng)過正交變換映射到另一變換域上，使變換后的系數(shù)之間的相關(guān)性降低。典型的如DCT。(4) 混合編碼?；旌暇幋a是指綜合了熵編碼、變換編碼或預(yù)測編碼的編碼方法，如JPEG標(biāo)準(zhǔn)和MPEG標(biāo)準(zhǔn)。根據(jù)對壓縮編碼后的圖像進(jìn)行重建的準(zhǔn)確程度，可將常用的圖像編碼方法分為三類：(1) 信息保持編碼（也稱無失真編碼），要求在編、解碼

5、過程中保證圖像信息不丟失，從而可以完整地重建圖像。信息保持編碼的壓縮比較低，一般不超過31，主要應(yīng)用在圖像的數(shù)字存儲方面，常用于醫(yī)學(xué)圖像編碼中。(2) 保真度編碼, 主要利用人眼的視覺特性，在允許的失真(Lossy)條件下或一定的保真度準(zhǔn)則下，最大限度地壓縮圖像。保真度編碼可以實(shí)現(xiàn)較大的壓縮比，主要用于數(shù)字電視技術(shù)、靜止圖像通信、娛樂等方面。(3) 特征提取。在圖像識別、分析和分類等技術(shù)中，往往并不需要全部圖像信息，而只要對感興趣的部分特征信息進(jìn)行編碼即可壓縮數(shù)據(jù)。算法的編碼效率。算法的編碼效率通常有幾種表現(xiàn)形式：平均碼字長度圖像的壓縮比每秒鐘所需的傳輸比特?cái)?shù)(bits per second，

6、bps)圖像信息熵與平均碼長之比()這些表現(xiàn)形式很容易相互轉(zhuǎn)換。如果使用不同的數(shù)據(jù)量來表示給定的信息量，那么使用較多數(shù)據(jù)量的方法中，有些數(shù)據(jù)必然代表了無用的信息，或者重復(fù)地表示了其他數(shù)據(jù)已表示的信息，這就是數(shù)據(jù)冗余的概念。在圖像壓縮中，有三種基本的數(shù)據(jù)冗余：編碼冗余、像素間冗余、心理視覺冗余。如果能減少或消除其中的一種或多種冗余，就能取得數(shù)據(jù)壓縮的效果。(1)編碼冗余對圖像編碼需要建立以表達(dá)圖像數(shù)據(jù)。碼本：指用來表達(dá)一定量的信息或一組事件所需的一系列符號（如字母、數(shù)字等）。其中對每個(gè)信息或事件所賦的碼符號序列稱為，而每個(gè)碼字里的符號個(gè)數(shù)稱為。例自然碼和變長碼出現(xiàn)概率高的碼分配長度最短的編碼(

7、2)像素間相關(guān)冗余l(xiāng) 圖像中同一目標(biāo)的像素間一般均有相關(guān)性，即由某一個(gè)像素的性質(zhì)往往可以獲得其鄰域像素的性質(zhì)，換句話說，各像素的值可以比較方便地由其鄰近像素的值預(yù)測出來。l 這種由鄰近像素相關(guān)性預(yù)測的方法確定某像素值的過程，意味著存在像素相關(guān)冗余（稱為空間冗余或幾何冗余）。l 連續(xù)序列圖像中的幀間冗余l(xiāng) 單個(gè)獨(dú)立的像素自身攜帶的信息相對較少，因?yàn)榭捎善溧徲蛳袼仡A(yù)測出來具有相同的目標(biāo)（一系列圓環(huán)），直方圖相同，但是像素間的相關(guān)性不同(a)的中心行相關(guān)性曲線(b)的中心行相關(guān)性曲線呈現(xiàn)規(guī)律性，表示這樣的目標(biāo)和曲線并不需要給出所有的點(diǎn)某行的自相關(guān)系數(shù)為便于比較，自相關(guān)系數(shù)按下式進(jìn)行了歸一化：(3)心

8、理視覺冗余心理視覺冗余技術(shù)與人類的視覺感官密切相關(guān)對正常視覺感知過程來講不是必不可少的信息可以去除心理視覺冗余壓縮是有損的編解碼器模型l 映射器：通過變換輸入數(shù)據(jù)（信源符號碼字）以減少像素相關(guān)冗余l(xiāng) 量化器：通過減少映射器輸出精度，達(dá)到降低心理視覺冗余的效果l 符號編碼器：最短碼賦給最頻繁出現(xiàn)的量化器輸出值，以減少編碼冗余l(xiāng) 并不是所有的編碼器同時(shí)包括以上三個(gè)模塊1 信息論簡介信息論可以回答兩個(gè)有關(guān)圖像壓縮的基本問題：什么是圖像壓縮的最終極限熵（entropy）什么是圖像傳輸率的最終極限信道容量Claude Elwood Shannon (Apr. 30, 1916 Feb. 24, 20

9、01) was an American mathematician, electronic engineer, and cryptographer known as the father of information theory. Shannon is famous for having founded information theory with one landmark paper published in 1948.信息論是研究編解碼的理論基礎(chǔ)，創(chuàng)始人香農(nóng)（Shannon）。信息測量離散信源的熵表示對于一個(gè)離散信源，常分兩種類型考慮：無記憶和有記憶信源。無記憶信源即信源的當(dāng)前輸出與以

10、前的輸出是無關(guān)的，否則就是有記憶信源。確定信息的測量單位，如果底數(shù)為2，則單位是比特一個(gè)小概率的符號出現(xiàn)將帶來更大的信息量，即信息量與該符號的概率成反比。img = rgb2gray(imread(face1.jpg);r c = size(img);pi = imhist(img) / ( r * c ); % 直方圖分布數(shù)據(jù)I = -log(pi); % 自信息量灰度直方圖與自信息量的對比每個(gè)符號的平均自信息量為：1 物理學(xué)上指熱能除以溫度所得的商，標(biāo)志熱量轉(zhuǎn)化為功的程度。 2 科學(xué)技術(shù)上用來描述、表征系統(tǒng)不確定程度的函數(shù)。亦被社會科學(xué)用以借喻人類社會某些狀態(tài)的不確定程度。 3 傳播學(xué)中表

11、示一種情境的不確定性和無組織性熵的含義：是隨機(jī)變量的平均不確定性的一個(gè)測度它在數(shù)值上描述隨機(jī)變量所需的平均比特?cái)?shù)如，設(shè)一個(gè)隨機(jī)變量有16個(gè)概率相同的取值，對每個(gè)取值賦一個(gè)標(biāo)記，解釋：每個(gè)標(biāo)記需要4bit。該隨機(jī)變量的熵是4，與需要描述該隨機(jī)變量的bit數(shù)相同。解：求：信息量和熵圖像的信息熵一元灰度熵兩個(gè)隨機(jī)變量，它們之間的互信息是一個(gè)變量由于另一個(gè)變量而引起的不確定性減少的量度；條件信息熵是一個(gè)變量在給定另一個(gè)變量時(shí)的熵。信息系統(tǒng)信源信道信宿簡單的信息系統(tǒng)示意圖信道的容量，即傳遞信息的能力信源符號在信道傳輸時(shí)可能會出現(xiàn)差錯(cuò)則輸出符號集的概率分布可由下式計(jì)算，其中，互信息（）信道容量給出信息可靠

12、地通過信道傳輸?shù)淖畲笏俾?。含噪聲的二元對稱信道（Binary Symmetric Channel, BSC）由信道矩陣：2 基本編碼定理（）信源編碼是以提高通信的有效性為目的編碼。通常通過壓縮信源的冗余度來實(shí)現(xiàn)。采用的一般方法是壓縮每個(gè)信源符號的平均比特?cái)?shù)(信源的碼率)。信源編碼的基本途徑有兩個(gè)：使序列中的各個(gè)符號盡可能地互相獨(dú)立，即解除相關(guān)性；使編碼中各個(gè)符號出現(xiàn)的概率盡可能地相等，即概率均勻化(從而使從而使得每個(gè)碼符號所攜帶的信息量達(dá)到最大，進(jìn)而可以用盡量少的碼符號傳輸?shù)妹總€(gè)碼符號所攜帶的信息量達(dá)到最大，進(jìn)而可以用盡量少的碼符號傳輸信源信息。信源信息。)信源編碼的基礎(chǔ)是信息論中的

13、兩個(gè)編碼定理：可變長無失真信源編碼定理（香農(nóng)第一定理）率失真編碼定理無失真編碼只適用于離散信源；對于連續(xù)信源，只能在失真受限制的情況下進(jìn)行限失真編碼。無失真信源編碼要求精確地復(fù)現(xiàn)信源的輸出保證信源的全部信息無損的送給信宿無失真信源編碼器N次擴(kuò)展碼N次擴(kuò)展N次擴(kuò)展變長碼變長碼001001111000010001 111111二次擴(kuò)展碼實(shí)例平均碼長設(shè)編碼是唯一可譯碼，即信源符號與碼字一一對應(yīng)。信源碼字碼長定義為碼長的數(shù)學(xué)期望：對于定長碼，平均碼長單個(gè)碼字的碼長無損信源編碼的平均碼長度可以接近信源的熵，但不能小于信源的熵。這就是無損信源壓縮的極限。二階擴(kuò)展編碼效率比一階效率有提高圖像的有損壓縮，

14、需要對信息損失進(jìn)行測度，以描述解碼圖像相對于原始圖像的偏離程度，這些測度一般稱為保真度（逼真度）準(zhǔn)則?？陀^保真度準(zhǔn)則主觀保真度準(zhǔn)則客觀保真度準(zhǔn)則最常用的準(zhǔn)則是輸入圖和輸出圖之間的均方根（RMS）誤差，總誤差均方根誤差實(shí)際使用中常將SNR歸一化并用分貝（dB）表示：主觀保真度由于視覺的主觀特性，也可以用主觀保真度準(zhǔn)則來測量，即對一組精心挑選的觀察者的評價(jià)結(jié)果進(jìn)行平均得到綜合評價(jià)結(jié)果。圖像中灰度最大值主觀保真度準(zhǔn)則使用起來比較困難，另外，利用主觀保真度準(zhǔn)則與利用客觀保真度準(zhǔn)則還未得到很好的吻合。1 哈夫曼編碼哈夫曼編碼是以信源概率分布為基礎(chǔ)的，但一般無法事先知道信源的概率分布，通常采用對大量數(shù)據(jù)進(jìn)

15、行統(tǒng)計(jì)后得到的近似分布來代替，這樣會導(dǎo)致實(shí)際應(yīng)用時(shí)哈夫曼編碼無法達(dá)到最佳性能。哈夫曼編碼的一般算法如下：step 1：首先統(tǒng)計(jì)信源中各符號出現(xiàn)的概率，按符號出現(xiàn)的概率從大到小排序。step 2：把最小的兩個(gè)概率相加合并成新的概率，與剩余的概率組成新的概率集合。step 3：對新的概率集合重新排序，再次把其中最小的兩個(gè)概率相加，組成新的概率集合。如此重復(fù)進(jìn)行，直到最后兩個(gè)概率的和為1。step 4：分配碼字。碼字分配從最后一步開始反向進(jìn)行，對于每次相加的兩個(gè)概率，給大的賦“0”，小的賦“1”(也可以全部相反)；如果兩個(gè)概率相等，則從中任選一個(gè)賦“0”，另一個(gè)賦“1”即可。讀出時(shí)由符號開始一直走

16、到最后的概率和“1”，將路線上所遇到的“0”和“1”按最低位到最高位的順序排好，就是該符號的哈夫曼編碼。設(shè)一幅灰度級為8(分別用S0、S1、S2、S3、S4、S5、S6、S7表示)的圖像中，各灰度所對應(yīng)的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04?，F(xiàn)對其進(jìn)行哈夫曼編碼。2 香農(nóng)-范諾編碼3 算術(shù)編碼算術(shù)編碼是1980年代發(fā)展起來的一種熵編碼方法?；驹硎菍⒈痪幋a的數(shù)據(jù)序列表示成0和1之間的一個(gè)間隔(也就是一個(gè)小數(shù)范圍)，該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。信息越長，編碼表示的間隔就越小，因而表示這一間隔所需的二進(jìn)制位數(shù)就越多(由于間隔是用小數(shù)表

17、示的)。區(qū)間0.06752,0.0688用于描述輸出符號，可以用0.0688表示整個(gè)符號序列(有誤差)0.20.20.40.40.80.80.040.040.080.080.160.160.0480.0480.0560.0560.0720.072將多灰度值圖象分解成一系列二值圖對每一幅二值圖再用二元壓縮方法1 位平面分解位平面（bit plane）一幅圖像的高階比特面攜帶大量的可見相關(guān)細(xì)節(jié)，低階面分布著一些細(xì)小的細(xì)節(jié)b7b6b5b4b3b2b1b02 位平面編碼常數(shù)塊編碼（CAC） n 基本思想: 將一掃描行中顏色值相同的相鄰像素用兩個(gè)字節(jié)來表示, 第一個(gè)字節(jié)是一個(gè)計(jì)數(shù)值, 用于指定像素重復(fù)的

18、次數(shù); 第二個(gè)字節(jié)是具體像素的值。n 壓縮是通過消除空間冗余的一種簡單形式（即一組相同的灰度）來實(shí)現(xiàn)的。Example:有一表示顏色像素值的字符串RRRRRGGBBBBBB,用RLE壓縮方法壓縮后可用 5R2G6B 來代替n “病態(tài)”情況：RLE 壓縮算法對于數(shù)據(jù)重復(fù)量大的情況是非常高效率的。但是, 當(dāng)圖像像素的顏色值出現(xiàn)每個(gè)相鄰像素的顏色值均不同的特殊情況時(shí)，反而會使編碼擴(kuò)展。如：顏色字符串GBR, 則經(jīng)此方法壓縮后變成了 1G1B1Rn 改進(jìn)方法：對計(jì)數(shù)字節(jié)和圖像像素字節(jié)進(jìn)行了區(qū)分, 利用計(jì)數(shù)字節(jié)的高兩位作為壓縮的標(biāo) 志。對每個(gè) 相鄰像素的顏色值均不同的單個(gè) 像素數(shù) 據(jù) ：只有當(dāng)計(jì)數(shù)字節(jié)高 2位全1( 即 C0) 時(shí)才加 1 計(jì)數(shù), 否則直接輸出該像素值, 因此避免了壓縮后長度增加一倍的情況。l RLE所能獲得的壓縮比有多大，這主要是取決于圖像本身的特點(diǎn)。如果圖像中具有相同顏色的圖像塊越大，圖像塊數(shù)目越少，獲得的壓縮比就越高。反之， RLE對顏色豐富的自然圖像就顯得力不從心。JPEG編碼n JPEG靜態(tài)圖像壓縮的

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第6章圖像編碼

文檔簡介

溫馨提示

最新文檔

評論

第6章圖像編碼

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔