第四章 視頻編碼基礎(chǔ)課件_第1頁
第四章 視頻編碼基礎(chǔ)課件_第2頁
第四章 視頻編碼基礎(chǔ)課件_第3頁
第四章 視頻編碼基礎(chǔ)課件_第4頁
第四章 視頻編碼基礎(chǔ)課件_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章視頻編碼基礎(chǔ)4.1視頻編碼系統(tǒng)概述

4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)4.3統(tǒng)計(jì)編碼

4.4預(yù)測編碼4.5變換編碼第四章視頻編碼基礎(chǔ)4.1視頻編碼系統(tǒng)概述

4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)4.3統(tǒng)計(jì)編碼

4.4預(yù)測編碼4.5變換編碼4.1視頻編碼系統(tǒng)概述信源用戶信源編碼信源解碼信道編碼信道解碼調(diào)制解調(diào)傳輸通道噪聲信源編碼信道編碼圖4.1數(shù)字傳輸系統(tǒng)模型4.1視頻編碼系統(tǒng)概述

信源編碼:主要解決有效性問題,通

過對信源的壓縮、擾亂、加密等一系

列處理,力求用最少的數(shù)碼傳遞最大

的信息量,使信號更適宜傳輸。

信道編碼:主要解決可靠性問題,即

盡量使處理過的信號在傳輸過程中不

出錯(cuò)或少出錯(cuò),即使出了錯(cuò)也能自動(dòng)

檢錯(cuò)和盡量糾錯(cuò)。視頻數(shù)字信號壓縮編碼信源編碼將信源數(shù)字信號按信息的統(tǒng)計(jì)特性進(jìn)行變換,減少信號的冗余度,提高信號傳輸?shù)男剩诒WC傳輸質(zhì)量的前提下,用盡可能少的數(shù)字信號來表示信息。信源編碼是壓縮信號帶寬的編碼,壓縮后單位時(shí)間、單位頻帶內(nèi)傳輸?shù)男畔⒘吭龃蟆?.1.1視頻數(shù)據(jù)壓縮的必要性和可能性1、視頻數(shù)據(jù)壓縮的必要性數(shù)字信號有很多優(yōu)點(diǎn),但當(dāng)模擬信號數(shù)字化后其頻帶大大加寬,一路彩色電視未經(jīng)壓縮的視頻數(shù)據(jù)的數(shù)碼率將高達(dá)216Mbps,對儲(chǔ)存器容量要求很大,占有的帶寬將達(dá)108MHz左右,是模擬信號的18倍,這樣將使數(shù)字信號失去實(shí)用價(jià)值。數(shù)字壓縮技術(shù)很好地解決了上述困難,壓縮后信號所占用的頻帶大大低于原模擬信號的頻帶。因此說,圖像信號是有必要也有可能被壓縮,數(shù)字壓縮編碼技術(shù)是使數(shù)字信號走向?qū)嵱没年P(guān)鍵技術(shù)之一。表4-1各種應(yīng)用的碼率應(yīng)用種類比特?cái)?shù)/象素象素?cái)?shù)/行行數(shù)/幀幀數(shù)/秒亮色比比特/秒(壓縮前)比特/秒(壓縮后)HDTV819201080304:1:11.18Gbps20~25Mbps普通電視8720480304:1:1167Mbps4~8Mbps會(huì)議電視CIF8352288304:1:136.5Mbps1.5~2Mbps桌上電視QCF8176144304:1:19.1Mbps128Kbps電視電話8128112304:1:15.2Mbps56Kbps2、視頻數(shù)據(jù)壓縮的可能性從信息論觀點(diǎn)來看,圖像作為一個(gè)信源,描述信源的數(shù)據(jù)是信息量(信源熵)和信息冗余量之和。信息冗余量有許多種,如空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識冗余、視覺冗余等。

數(shù)據(jù)壓縮實(shí)質(zhì)上是減少冗余量。冗余量減少可減少數(shù)據(jù)量而不減少信源的信息量。另外在一些情況下,允許圖像有一定的失真,而并不妨礙圖像的實(shí)際應(yīng)用,因而數(shù)據(jù)量壓縮的可能性就更大了。3、視頻數(shù)據(jù)編碼原理(圖像數(shù)據(jù)壓縮基理)壓縮基理來自兩個(gè)方面:(1)圖像信號中存在大量冗余度可供壓縮,并且這種冗余度在解碼后還可無失真地恢復(fù)。(2)利用人的視覺特性,在不被主觀視覺察覺的容限內(nèi),通過減少表示信號的精度,以一定的客觀失真換取數(shù)據(jù)壓縮。4、圖像信號的冗余度空間冗余幀內(nèi)相鄰點(diǎn)的相關(guān)性圖像信號的冗余度存在于結(jié)構(gòu)和統(tǒng)計(jì)兩方面。

在一幅圖像中某一塊面積上相鄰像素的亮度和色度信息存在空間連貫性相似。一幅圖像的亮度和色度信息中基本相同,存在多余信息。圖3-1圖像信號的空間冗余相鄰像素/行變化小圖像信號幀內(nèi)相關(guān)性×8倍圖4-2圖像信號幀內(nèi)相關(guān)性圖像某一塊面積上的亮度和色度信息中相同。②時(shí)間冗余幀間相鄰點(diǎn)的相關(guān)性電視圖像序列中,相鄰兩幅圖像之間有較大的相關(guān)性。圖4-3圖像信號的時(shí)間冗余相鄰幀變化小,具有相關(guān)性

空間冗余、時(shí)間冗余屬于統(tǒng)計(jì)冗余,是由于一行中象素間、相鄰行及相鄰幀象素間存在著相關(guān)性決定的,取決于統(tǒng)計(jì)特性。

有些圖像的理解與某些知識有相當(dāng)大的相關(guān)性③知識冗余圖4-4圖像信號的知識冗余④結(jié)構(gòu)冗余圖4-5圖像信號幀內(nèi)的明顯紋理區(qū)圖像從大面積上看常存在有紋理(相似)結(jié)構(gòu),稱之為結(jié)構(gòu)冗余。⑤視覺冗余人眼的視覺系統(tǒng)對于圖像的感知是非均勻和非線性的,對圖像的變化并不都能察覺出來。圖4-6圖像的細(xì)節(jié)4.1.2.壓縮方法的分類1、從信息論角度分:編碼壓縮方法有許多種,從不同的角度出發(fā)有不同的分類方法。(1)無損壓縮:信息保持編碼或熵編碼。即解碼圖像和壓縮編碼前的圖像嚴(yán)格相同,沒有失真,僅僅刪除圖像數(shù)據(jù)中的冗余信息,回放壓縮文件時(shí),能夠準(zhǔn)確無誤地恢復(fù)原始數(shù)據(jù)。(2)有損壓縮:失真度編碼或熵壓縮編碼。即丟掉大量冗余信息來降低數(shù)字圖像所占的空間,解碼圖像和原始圖像是有差別的,允許有一定的失真。2、按壓縮編碼算法原理分類基于圖像統(tǒng)計(jì)特性基于人眼視覺特性(重要性)基于內(nèi)容(對象)基于模型(1)基于圖像信源統(tǒng)計(jì)特性的壓縮方法,有預(yù)測編碼、變換編碼、霍夫曼(Huffman)編碼、算術(shù)編碼、游程編碼等。(2)基于人眼視覺特性和基于內(nèi)容的壓縮方法,有亞采樣、多分辨率編碼、子帶編

碼、形狀編碼、矢量量化編碼、紋理編碼法等。(3)基于模型的壓縮方法,有語義編碼和基于模型基編碼等。衡量壓縮編碼方法優(yōu)劣的重要指標(biāo)(1)

壓縮比要高,有幾倍、幾十倍,也有幾百乃至幾千倍;(2)

壓縮與解壓縮要快,算法要簡單,硬件實(shí)現(xiàn)容易;(3)

解壓縮的圖像質(zhì)量要好?!虺S玫膲嚎s頻帶方法:預(yù)測編碼(主要消除時(shí)間冗余和生理冗余)變換編碼(主要消除空間冗余)其它壓縮碼率的措施第四章視頻編碼基礎(chǔ)4.1視頻編碼系統(tǒng)概述4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)4.3統(tǒng)計(jì)編碼

4.4預(yù)測編碼4.5變換編碼4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)衡量一個(gè)壓縮編碼方法優(yōu)劣的重要指標(biāo)是:壓縮比要高。解壓縮的圖像質(zhì)量要好。評價(jià)指標(biāo)為:主觀評價(jià)和客觀評價(jià)。

壓縮系統(tǒng)的復(fù)雜度和功能。壓縮與解壓縮速度要快,算法要簡單,硬

件實(shí)現(xiàn)容易。4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)1、香農(nóng)的信息論原理第一代編碼技術(shù)是以信息論和數(shù)字信號處理技術(shù)為理論基礎(chǔ),其中統(tǒng)計(jì)編碼的基本原理是給出現(xiàn)概率較大的符號一個(gè)短碼字,而給出現(xiàn)概率較小的符號一個(gè)長碼字,這樣使得最終的平均碼長很小。然而,按照香農(nóng)的理論,無論規(guī)定的碼字如何分配,其平均碼字的比特?cái)?shù)不可能小于原信息源的熵值。4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)和

熵的定義:設(shè)信息源S的符號集為,出現(xiàn)的概率為,則信息源的熵為:其中熵的單位為:比特?cái)?shù)/字符。熵值是信息不確定性的一個(gè)度量值,當(dāng)信息越不確定時(shí),信息量越多,香農(nóng)定義實(shí)際給出了實(shí)現(xiàn)無損編碼和有損編碼所需要的最低比特率的界限。=[例]

二元信源,若信源符號0和1等概率分布,且符號間無相關(guān)性,則其信源熵達(dá)到最大值:若發(fā)送12個(gè)符號,則12個(gè)符號含有的信息量為:若信源符號間有相關(guān)性,則信源熵達(dá)不到最大熵。若實(shí)際上為0.8比特/符號,則發(fā)送12個(gè)符號只能傳遞12*0.8=9.6比特的信息量。若要傳遞12比特的信息量,則需要

n=12/0.8=15個(gè)符號,有3個(gè)符號的冗余。4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)2、壓縮比壓縮比是衡量圖像壓縮系統(tǒng)的一個(gè)重要指標(biāo),無失真編碼不能取得很高的壓縮比,是因?yàn)樗艿叫旁幢旧淼南拗?,即香農(nóng)定理的最低比特率界限,因此無失真編碼也稱為熵編碼。用編碼效率和冗余度來衡量壓縮效率。冗余度的定義冗余度(剩余度)相對熵(編碼效率)H0:符號等概率且無相關(guān)性的理想離散信源熵[例]二元信源,若信源符號0和1等概率分布,且符號間無相關(guān)性,則其信源熵達(dá)到最大值:當(dāng)符號間有相關(guān)性時(shí),實(shí)際熵:信源相對熵:信源冗余度:[例]信源為26個(gè)英文字母和1個(gè)空格,分析其信源熵。英語字母出現(xiàn)概率英語字母出現(xiàn)概率英語字母出現(xiàn)概率A0.064

J

0.001S

0.051B

0.013K0.005T0.08C

0.022

L

0.032

U

0.023D0.032M0.020V0.008E

0.103N

0.057

W0.018F0.021O

0.063

X

0.001G

0.015

P

0.015Y

0.016H

0.047Q

0.001

Z

0.001I

0.058

R

0.048

空格

0.1891)若信源等概率分布,且無相關(guān)性,則信源熵:2)按實(shí)際概率分布,且無相關(guān)性,則信源熵:3)看成一階馬爾可夫信源,則信源熵:4)看成二階馬爾可夫信源,則信源熵:5)看成無窮階馬爾可夫信源,則信源熵:信源相對熵:信源冗余度:練習(xí):一個(gè)信源X和一個(gè)字母集合A如下

編成如下等長碼計(jì)算信源X的熵,平均碼長,編碼效率和冗余度?該信源的熵

比特/符號平均碼長可計(jì)算出平均碼長第四章視頻編碼基礎(chǔ)4.1視頻編碼系統(tǒng)概述4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)4.3統(tǒng)計(jì)編碼

4.4預(yù)測編碼4.5變換編碼4.3熵編碼是無損編碼,其基本原理是去除圖像信源在空間和時(shí)間上的相關(guān)性,去除圖像信源像素值的概率分布不均勻性,使編碼碼字的平均碼長接近信源的熵而不產(chǎn)生失真。(EntropyCoding)熵編碼多用可變字長編碼VLC實(shí)現(xiàn),即對信源中出現(xiàn)概率大的符號賦予短碼,對出現(xiàn)概率小的符號賦予長碼,從而在統(tǒng)計(jì)上獲得較短的平均碼長。熵編碼有基于圖像信源概率分布特性的霍夫曼編碼、算術(shù)編碼和基于圖像相關(guān)性的游程編碼RLC(RunLengthCoding)等。1、Huffman編碼(1)編碼步驟:1)將待編碼的信源符號按出現(xiàn)概率的值由大到小的順序排列,對兩個(gè)概率最小的符號分別分配以“0”和“1”,即確定概率最小的兩個(gè)符號的最后一位碼元。2)對兩個(gè)概率最小的符號概率相加作為一個(gè)新的輔助符號的概率,將這個(gè)新的輔助符號與其他符號一起重新按概率大小順序排列;是一種可變長編碼(VLC),是一種分組編碼。1、Huffman編碼3)重復(fù)步驟2),直至最終只剩兩個(gè)概率為止,概率達(dá)到1.0。4)從最后一個(gè)概率為1,0的節(jié)點(diǎn)開始,沿著到達(dá)信源的每個(gè)符號,將一路遇到的二進(jìn)制碼“0”或“1”順序排列起來,就是端點(diǎn)所對應(yīng)的信源符號的碼字?;舴蚵幋a實(shí)際上構(gòu)造了一個(gè)碼樹,碼樹從最上層的端點(diǎn)開始構(gòu)造,直到樹根結(jié)束。這里舉個(gè)例子說明如何生成霍夫曼樹。假設(shè)對由a1、a2、a3、a4、a5、a6、a7、a8八個(gè)信源符號組成的源信息字符串:“a1a1a2a2a3a3a3a4a4a4a4a5a5a5a6a6a6a7a7a8”進(jìn)行霍夫曼編碼。首先應(yīng)對信息中各數(shù)字出現(xiàn)的次數(shù)進(jìn)行統(tǒng)計(jì)如后:

1、Huffman編碼碼值a1a2a3a4a5a6a7a8次數(shù)22343331概率0.10.10.150.20.150.150.10.05熵H=-0.1*log2(0.1)-0.1*log2(0.1)-0.15*log2(0.15)-0.2*log2(0.2)-0.15*log2(0.15)-0.15*log2(0.15)-0.1*log2(0.1)-0.05*log2(0.05)=2.9087(bit)具體過程是這樣的,先將所有符號排成一行,構(gòu)成8個(gè)最底層節(jié)點(diǎn)。首先將這些節(jié)點(diǎn)中最小兩個(gè)概率值相加:0.05+0.1=0.15,得到新的節(jié)點(diǎn)這時(shí)擁有的概率值為0.2,0.1,0.1,0.15,0.15,0.15,0.15。再將兩個(gè)最小的概率值相加得到新的節(jié)點(diǎn)......直到得到根節(jié)點(diǎn)概率為1.0為止。相加時(shí),對于概率值相等的多個(gè)節(jié)點(diǎn),可以任意選取。除根節(jié)點(diǎn)外,設(shè)節(jié)點(diǎn)左邊分支為0,右邊分支為1(也可以反過來)。這樣,生成的霍夫曼樹如下圖所示:對于各值(碼值)的代碼(碼字)就是從根節(jié)點(diǎn)出發(fā)到底層節(jié)點(diǎn)所經(jīng)歷的分支序列。如a4的代碼(碼字)為00,a6的碼字為111......通常a4和a6等稱為碼值,00和111等稱為碼字。所有碼值和碼字對應(yīng)關(guān)系如下表所示:將所有碼值和碼字的關(guān)系整理成一張表,為了整字節(jié)輸出碼字,表中還含有各碼字的長度。這種表就稱為霍夫曼表。本例霍夫曼表如表所示:

進(jìn)行壓縮編碼時(shí),只要將碼值用碼字代替即可。所以源符a1a1a2a2a3a3a3a4a4a4a4a5a5a5a6a6a6a7a7a8編碼為:0100100110111011011010000000011011011010000100001001。平均碼長B=0.1*3+0.1*3+0.15*3+0.2*2+0.15*3+0.15*3+0.1*4+0.05*4=2.95(b)熵H=2.9087編碼效率N=H/B=2.9087/2.95=98.6%100.61100.11100.26100.35100.39s10.20s20.19s30.18s40.17s50.15s60.10s70.01101.0011l=210l=2011l=3010l=3001l=30001l=40000l=4Huffman編碼舉例實(shí)例:設(shè)輸入圖像的灰度級{y1,y2,y3,y4,y5,y6,y7,y8}出現(xiàn)的概率分別為0.40,0.18,0.10,0.10,0.07,0.06,0.05,0.04。進(jìn)行哈夫曼編碼,并計(jì)算編碼效率、冗余度。Huffman編碼舉例5.3統(tǒng)計(jì)編碼實(shí)例(2)Huffman編碼性質(zhì)1)Huffman算法確定,但構(gòu)造的碼不是唯一。②當(dāng)兩個(gè)消息的概率相等時(shí),0,1分配也是隨意的。這將得到不同的編碼,但不影響Huffman編碼的平均碼長和編碼效率。主要有兩個(gè)原因:①在兩個(gè)符號概率相加給兩條支路分配“0”和“1”時(shí),這一選擇是任意的。這將得到不同的編碼,但不影響各符號碼長;2)Huffman編碼依據(jù)信源概率分布。對不同的信源,其編碼效率是不同的。2、算術(shù)編碼Huffman編碼的每個(gè)代碼都要使用一個(gè)整數(shù)位,如果一個(gè)符號只需要用2.5位就能表示,但在Huffman編碼中卻必須用3個(gè)符號表示,因此它的效率較低。與其相比,算術(shù)編碼并不是為每個(gè)符號產(chǎn)生一個(gè)單獨(dú)的代碼,而是使整條信息共用一個(gè)代碼,增加到信息上的每個(gè)新符號都遞增地修改輸出代碼。算術(shù)編碼中常用二進(jìn)制小數(shù)表示概率,每個(gè)符號所對應(yīng)的概率區(qū)間都是半開區(qū)間,如s2對應(yīng)[0.001,0.011)。算術(shù)編碼所產(chǎn)生的碼字實(shí)際上是一個(gè)二進(jìn)制小數(shù)值的指針,該指針指向所編的符號對應(yīng)的概率區(qū)間左邊界值。算術(shù)編碼算術(shù)編碼:將整個(gè)信源輸出的符號序列對應(yīng)于實(shí)數(shù)軸[0,1)中的一個(gè)小區(qū)間,該小區(qū)間的長度等于序列出現(xiàn)的概率。本質(zhì)是為整個(gè)輸入流分配一個(gè)碼字,而不是給輸入流中的每個(gè)字符分別指定碼字。原理:根據(jù)符號概率,區(qū)間遞進(jìn)。從第一個(gè)符號確定的初始區(qū)間(0,1)開始,逐個(gè)字符地讀入輸入流,在每一個(gè)新的字符出現(xiàn)后遞歸地劃分當(dāng)前區(qū)間。劃分的根據(jù)是各個(gè)字符的概率,將當(dāng)前區(qū)間按照各個(gè)字符的概率劃分成若干子區(qū)間,將當(dāng)前字符對應(yīng)的子區(qū)間取出,作為處理下一個(gè)字符時(shí)的當(dāng)前區(qū)間。處理完最后一個(gè)字符后,得到最終區(qū)間,在最終區(qū)間中任意挑選一個(gè)數(shù)作為輸出。range=high-lowlowi=lowi-1+rangei-1xcum_freq[yil]highi=lowi-1+rangei-1xcum_freq[yih]R2=H2–L2L2=L1+R1xcum_freq[y1l]H2=L1+R1xcum_freq[y1h]舉例:概率范圍圖:設(shè)輸入序列為abaca:(1)初始范圍:(2)當(dāng)?shù)谝粋€(gè)字符a被傳送時(shí),范圍:0cba10.750.501對a編碼后,編碼范圍[0,1)變?yōu)閇0,0.5)(3)當(dāng)?shù)诙€(gè)字符b被傳送時(shí),范圍:由概率表,b概率范圍[0.50,0.75),H=0.75,L=0.50L2=L1+R1*L=0.25H2=L1+R1*H=0.375R2=H2-L2對ab編碼后,編碼范圍[0,0.5)變?yōu)閇0.25,0.375)00.50.250.375L1H1R1H2L2R2依次類推:(4)對aba編碼后,編碼范圍為[0.25,0.3125)(5)對abac編碼后,編碼范圍為[0.296785,0.3125)(6)對abaca編碼后,編碼范圍為[0.296785,0.3046875)最后輸出的碼字為:0.3046875。即用浮點(diǎn)數(shù)0.3046875代替abaca解碼過程如下:根據(jù)各符號出現(xiàn)的概率范圍圖(1)接收到浮點(diǎn)數(shù)0.3046875,在概率范圍圖內(nèi)查得第一個(gè)字符為a,其概率0.5(2)從接收值減去a在概率范圍圖中的L,并除以P(a),得:(0.3046875-0.00)/0.5=0.609375該值為下一字符概率范圍內(nèi)的值。(3)0.609375在概率范圍圖[0.50,0.75)之間,所以為b減去b在概率范圍中的L,并除以P(b),得:(0.609375-0.50)/0.25=0.4375該值為下一字符概率范圍內(nèi)的值。依此類推,解碼得到序列abaca實(shí)例設(shè)一待編碼的數(shù)據(jù)序列(即信源)為“dacab”,信源中各符號出現(xiàn)的概率依次為P(a)=0.4,P(b)=0.2,P(c)=0.2,P(d)=0.2。請對其進(jìn)行算術(shù)編碼,并輸出編碼結(jié)果。編碼步驟:1、首先,數(shù)據(jù)序列中的各數(shù)據(jù)符號在

區(qū)間[0,1]內(nèi)的間隔(賦值范

圍)設(shè)定為a=[0,0.4),b=

[0.4,0.6),c=[0.6,0.8),

d=[0.8,1.0)2、第一個(gè)被壓縮的符號為“d”,其初始

間隔為[0.8,1.0);3、第二個(gè)被壓縮的符號為“a”,由于前

面的符號“d”的取值區(qū)間被限制在[

0.8,1.0)范圍內(nèi),所以“a”的取值范圍

應(yīng)在前一符號間隔[0.8,1.0)的[0,

0.4)子區(qū)間內(nèi),根據(jù)上式可知range=1.0-0.8=0.2low=0.8+0×0.2=0.8high=0.8+0.4×0.2=0.88即“a”的實(shí)際編碼區(qū)間在[0.8,0.88)之間4、第三個(gè)被壓縮的符號為“c”,其編碼

取值范圍應(yīng)在[0.8,0.88)區(qū)間的

[0.848,0.864)的子區(qū)間內(nèi),據(jù)上式

可知

range=0.88-0.8=0.08low=0.8+0.6×0.08=0.848high=0.8+0.8×0.08=0.8645、第四個(gè)被壓縮的符號為“a”,其編碼

取值范圍應(yīng)在[0.848,0.864)區(qū)間的

[0.848,0.8544)的子區(qū)間內(nèi),據(jù)上式

可知

range=0.864-0.848=0.016low=0.848+0×0.016=0.848high=0.848+0.4×0.016=0.85445、第五個(gè)被壓縮的符號為“b”,其編碼

取值范圍應(yīng)在[0.848,0.8544)區(qū)間的

[0.84856,0.85144)的子區(qū)間內(nèi),據(jù)上式可知range=0.8544-0.848=0.0064Low=0.848+0.4×0.0064=0.84856High=0.848+0.6×0.0064=0.85144至此,數(shù)據(jù)序列“dacab”已被描述為一個(gè)實(shí)數(shù)區(qū)間[0.84856,0.85144],或者說在此區(qū)間內(nèi)的任一實(shí)數(shù)值都惟一對應(yīng)該數(shù)據(jù)序列。這樣,就可以用一個(gè)實(shí)數(shù)表示這一數(shù)據(jù)序列。我們把區(qū)間[0.84856,0.85144]用二進(jìn)制形式表示為[0.110110011011,0.110110100001]。3、游程編碼例3:RLC(RunLengthCoding)是一種十分簡單的壓縮方法,它改變數(shù)據(jù)流中連續(xù)出現(xiàn)的相同字符的表達(dá)方式,以降低碼長。RLC的壓縮率不高,但編、解碼速度快,因而仍得到廣泛應(yīng)用,特別是在變換編碼及進(jìn)行Z字形(zigzag)掃描后,再進(jìn)行游程編碼,有很好效果。字符串:5310000000000110000000012000000000000可壓縮為5310―10110―08120―12,其中,“―”后面2個(gè)數(shù)字是“―”前面數(shù)字的連續(xù)個(gè)數(shù)。當(dāng)剩下的所有系數(shù)都為零時(shí),用一個(gè)符號EOB(EndofBlock)來代表。連續(xù)零的長度即游程待編碼字符為(39,-3,2,1,-1,1,0,0,0,0,0,-1,EOB)。EOB表示塊結(jié)束,接收端收到EOB后自動(dòng)將64個(gè)元素中余下的元素補(bǔ)零。例4:39-321-1105-1EOB第四章視頻編碼基礎(chǔ)4.1視頻編碼系統(tǒng)概述4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)和圖像質(zhì)量的評判標(biāo)準(zhǔn)4.3統(tǒng)計(jì)編碼4.4預(yù)測編碼4.5變換編碼4.3預(yù)測編碼利用圖像信號的空間或時(shí)間相關(guān)性,用已傳輸?shù)南袼貙Ξ?dāng)前的像素進(jìn)行預(yù)測,即只對預(yù)測值與真實(shí)值的差——預(yù)測誤差進(jìn)行編碼(處理和傳輸)。預(yù)測編碼器預(yù)測解碼器目前用得較多的是線性預(yù)測方法,其全稱為差值脈沖編碼調(diào)制

DPCM

(DifferentialPulseCodeModulation)。==-==一階預(yù)測器:二階預(yù)測器:三階預(yù)測器:預(yù)測編碼的分類:一維預(yù)測、二維預(yù)測以及三維預(yù)測幀內(nèi)預(yù)測編碼、幀間預(yù)測編碼運(yùn)動(dòng)補(bǔ)償一維預(yù)測:用同一行中前幾個(gè)抽樣值來預(yù)測當(dāng)前值。二維預(yù)測:用同一行和上幾行中的幾個(gè)抽樣值來預(yù)測當(dāng)前值。用前一幀圖像的抽樣像素來預(yù)測當(dāng)前幀圖像,為幀間預(yù)測編碼。三維預(yù)測:一維預(yù)測、二維預(yù)測為幀內(nèi)預(yù)測編碼。4.3.1DPCM原理(a)DPCM編碼器(b)DPCM解碼器DPCM編、解碼系統(tǒng)方框圖編碼單元主要包括線性預(yù)測器和量化器。編碼器的輸出不是圖像像素的樣值f(i,

j),而是該樣值與預(yù)測值的差值的量化后再編碼M(i,j)。DPCM解碼器,其原理和編碼器剛好相反。DPCM預(yù)測編碼中采用非均勻量化。

DPCM特點(diǎn)主要缺點(diǎn)是抗御誤碼能力差。若傳輸中出現(xiàn)誤碼,就會(huì)出現(xiàn)發(fā)、收不一致,此時(shí)接收端無法發(fā)現(xiàn)錯(cuò)誤,并會(huì)將誤差擴(kuò)散到圖象中較大的一個(gè)區(qū)域。因此,DPCM對信道質(zhì)量要求高,所以一般要增加信道編碼,并用糾錯(cuò)進(jìn)行保護(hù)。算法簡單,易于硬件實(shí)現(xiàn)。預(yù)測誤差概率分布集中在0附近較窄的范圍內(nèi),0值出現(xiàn)概率最大。DPCM預(yù)測誤差概率分布1、幀內(nèi)預(yù)測編碼JPEG是典型的幀內(nèi)編碼方案,大多用于靜止圖像處理。

利用幀內(nèi)(像素間、行間)相關(guān)性的DPCM。若對亮度和色差信號分別進(jìn)行DPCM編碼,即對亮度信號采用較高取樣率和較多位數(shù)編碼,對色差信號用較低取樣率和較少位數(shù)編碼,則構(gòu)成時(shí)分復(fù)合信號后再進(jìn)行DPCM編碼,數(shù)碼率可以更低。2、幀間預(yù)測編碼若上述兩種DPCM組合起來,再配上VLC技術(shù),能獲得較好的壓縮效果。MPEG采用幀間編碼方法,主對運(yùn)動(dòng)圖像的處理。

利用幀間(鄰近幀的時(shí)間)相關(guān)性的DPCM,因幀間相關(guān)性大于幀內(nèi)相關(guān)性,其編碼效率更高。幀間預(yù)測4.3.2運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償預(yù)測編碼對變化緩慢的圖像,幀間相關(guān)性強(qiáng),宜采用幀間預(yù)測;當(dāng)景物的運(yùn)動(dòng)增大時(shí),幀間相關(guān)性減弱,幀內(nèi)相關(guān)性反而有所增加。因此應(yīng)進(jìn)行幀內(nèi)、幀間自適應(yīng)編碼。對運(yùn)動(dòng)物體,估計(jì)出物體在相鄰幀的相對位移,用上一幀中物體的圖像對這一幀的物體進(jìn)行預(yù)測,將預(yù)測的差值部分編碼,可壓縮這部分圖像的碼率。這種考慮對應(yīng)區(qū)域的位移或運(yùn)動(dòng)的預(yù)測方式稱為運(yùn)動(dòng)補(bǔ)償預(yù)測編碼。幀間預(yù)測是運(yùn)動(dòng)補(bǔ)償預(yù)測在運(yùn)動(dòng)矢量為零時(shí)的特殊情況。1、運(yùn)動(dòng)估計(jì)(MotionEstimation,ME)是對運(yùn)動(dòng)物體的位移作出估計(jì),即估計(jì)出運(yùn)動(dòng)物體從上一幀到當(dāng)前幀的位移方向和位移量,也就是估計(jì)出運(yùn)動(dòng)矢量。運(yùn)動(dòng)物體的幀間位移

運(yùn)動(dòng)矢量2、運(yùn)動(dòng)補(bǔ)償是按照運(yùn)動(dòng)矢量將上一幀作位移基準(zhǔn),求出當(dāng)前幀的運(yùn)動(dòng)結(jié)果。對運(yùn)動(dòng)物體的補(bǔ)償后的位移幀差信號以及運(yùn)動(dòng)矢量等進(jìn)行編碼傳輸。

(MotionCompensation,MC)3、幀間運(yùn)動(dòng)補(bǔ)償原理圖8-13運(yùn)動(dòng)處理過程①當(dāng)前幀在過去幀的窗口中尋找匹配部分,從中找到運(yùn)動(dòng)矢量;②根據(jù)運(yùn)動(dòng)矢量,將過去幀位移,求得對當(dāng)前幀的估計(jì);③將這個(gè)估計(jì)和當(dāng)前幀相減,求得估計(jì)的誤差值;④將運(yùn)動(dòng)矢量和估計(jì)的誤差值送到接收機(jī)端去。接收端根據(jù)收到的運(yùn)動(dòng)矢量將過去幀作位移(即對當(dāng)前幀的估計(jì)),再加上接收到的誤差值,就是當(dāng)前幀。4、運(yùn)動(dòng)估計(jì)的方法--塊匹配法BMA(BlockMatchingAlgorithm)塊匹配法是最常用的一種方法。多個(gè)國際標(biāo)準(zhǔn)都采用這種方法,包括:H.261,MPEG-2等。又稱全搜索算法。估計(jì)像素的位移(運(yùn)動(dòng))時(shí),取以該像素為中心的一個(gè)子塊,在前一幀圖像中尋找一個(gè)與之最匹配(相關(guān)最大)的子塊,匹配子塊中心與當(dāng)前像素的位移即為估計(jì)的位移(運(yùn)動(dòng))矢量。(1)塊匹配法設(shè)子塊圖像是由N×N個(gè)像素組成的像塊,并假設(shè)一個(gè)像塊內(nèi)的所有像素作一致的平移運(yùn)動(dòng),得到運(yùn)動(dòng)矢量的估值(dx,dy)運(yùn)動(dòng)位移估計(jì)①估值塊大小(M×N)

估值小時(shí),塊內(nèi)像素運(yùn)動(dòng)一致性好,估計(jì)準(zhǔn)確度較高,但運(yùn)動(dòng)矢量碼率會(huì)增大,計(jì)算量也增大;應(yīng)該綜合考慮圖像細(xì)節(jié)構(gòu)成和計(jì)算量等因素。不高,不能進(jìn)行有效的運(yùn)動(dòng)補(bǔ)償預(yù)測。一般M、N取16,有時(shí)也取4、8或32。

估值大時(shí),計(jì)算量減小,運(yùn)動(dòng)矢量的碼率變小,但塊內(nèi)像素運(yùn)動(dòng)一致性變差,運(yùn)動(dòng)估計(jì)準(zhǔn)確度②最佳匹配準(zhǔn)則在全搜索條件下,塊匹配算法達(dá)到最優(yōu),缺點(diǎn)是運(yùn)算量大,在實(shí)際應(yīng)用場合常采用性能略低但運(yùn)算量少的快速算法。最小均方誤差:最小絕對值誤差:(2)快速搜索法三步法搜索TSS(ThreeStepSearch)即在上一幀以當(dāng)前子塊為原點(diǎn),將當(dāng)前子塊在其上下左右距離為一定值的搜索范圍內(nèi)按一定規(guī)則移動(dòng),每移動(dòng)到一個(gè)位置,取出同樣大小的子塊與當(dāng)前子塊進(jìn)行匹配計(jì)算??蓽p少搜索次數(shù)。圖3-15運(yùn)動(dòng)估計(jì)快速搜索法問題:采用什么預(yù)測器?使編碼預(yù)測誤差的碼率最小比特率一定時(shí),量化誤差取決于信號方差,最小化量化誤差=最小化預(yù)測誤差的方差我們只討論線性預(yù)測4.3.3最佳預(yù)測器線性最小均方差(MSE)估計(jì)器預(yù)測誤差:最佳系數(shù)應(yīng)滿足:估計(jì)理論中也稱為正交化原理由此可以導(dǎo)出一組線性方程:矩陣形式用矩陣形式表述上面的線性方程為:或

[R]a=r最佳預(yù)測系數(shù)是:a=[R]-1r第四章視頻編碼基礎(chǔ)4.1視頻編碼系統(tǒng)概述4.2數(shù)字視頻壓縮的評價(jià)指標(biāo)和圖像質(zhì)量的評判標(biāo)準(zhǔn)4.3統(tǒng)計(jì)編碼4.4預(yù)測編碼4.5變換編碼3.4變換編碼原理

圖像空間存在相關(guān)性,在變換域中,各空間頻率分量是不均勻的,即空間頻率低的區(qū)域信號幅度大,高頻區(qū)域信號幅度小。據(jù)統(tǒng)計(jì)特性,低頻部分編長碼,高頻部分編短碼(與均勻量化+VLC類似),則平均碼長和總碼率都會(huì)下降,達(dá)到壓縮碼率目的。將空間域描述的圖像經(jīng)某種變換(如傅立葉變換、離散余弦變換等),即將空間域分散分布的圖像能量變?yōu)樽儞Q域的相對集中分布,便于用Z字形掃描、自適應(yīng)量化、變長編碼等進(jìn)一步處理,完成對圖像信息的有效壓縮。變換編碼將空域(時(shí)域)的圖像信號變換到另一個(gè)正交矢量空間,并對產(chǎn)生的變換系數(shù)進(jìn)行編碼處理。經(jīng)過正交變換后為什么能夠壓縮數(shù)據(jù)量??進(jìn)行正交變換后,相關(guān)圈正好處在y1上下,且相關(guān)圈越扁長,在y1上的投影越大,而在y2上的投影越小,這意味著y1和y2趨于統(tǒng)計(jì)獨(dú)立。原坐標(biāo)系能量分布比較均勻和分散;而在變換后能量的分布向y1軸集中。準(zhǔn)最佳正交變換:離散傅里葉變換(DFT)、KLT變換、哈爾變換(HRT)、WalshHadamard變換(WHT)、斜變換(SLT)、離散余弦變換(DCT)、離散正弦變換(DST)等。從變換后的能量集中程度的優(yōu)劣來看,各種正交變換的由優(yōu)至劣的順序?yàn)椋篕LT→DCT→SLT→DFT→WHT→HRT若從運(yùn)算量的大小,它們由小到大的順序依次為HRT→WHT→SLT→DCT→DFT→KLT離散余弦變換一維DCT正變換和反變換為:n=0n≠0其中,s(k)為信號樣值,c(n)為變換系數(shù)練習(xí)一維DCT正變換和反變換為:n=0n≠0其中,s(k)為信號樣值,c(n)為變換系數(shù)寫出n=0和n=1時(shí)的一維DCT正變換?考慮信號:x[n]的DFT頻譜:x[n]的DCT譜:可以看出,DCT主要能量比DFT更集中在低頻,這樣,就可以舍棄較高序段,實(shí)現(xiàn)信號的壓縮。離散余弦變換的能量壓縮特性4.4.1離散余弦變換DCT(DiscretecosineTransform)

DCT是先將整體圖像分成N×N像素塊,然后對N×N像素塊逐一進(jìn)行DCT變換。由于大多數(shù)圖像的高頻分量較小,相應(yīng)于圖像高頻成分的系數(shù)經(jīng)常為零,加上人眼對高頻成分的失真不太敏感,所以可用更粗的量化,因此傳送變換系數(shù)所用的數(shù)碼率要大大小于傳送圖像像素所用的數(shù)碼率。到達(dá)接收端后再通過反離散余弦變換回到樣值,雖然會(huì)有一定的失真,但人眼是可以接受的。

DCT變換的作用:消除空間域圖像子塊中像素間相關(guān)性。1.二維離散余弦變換(DCT)

(1)二維N×N圖像塊的DCT變換1)正變換DCT圖像樣值2)反變換IDCT其中u,v=0,1,…,N-1。(2)二維DCT的物理意義

N代表像素?cái)?shù),一般N=8,8×8的二維數(shù)據(jù)塊經(jīng)DCT后變成8×8個(gè)變換系數(shù)。F(u,v)表示變換域的高頻成分,也稱為交流系數(shù);F(0,0)表示變換域中的低頻成分,也稱為直流系數(shù)。f(i,j)為二維基圖像樣值系數(shù)(DCT系數(shù))。a(i,j,u,v)表示基圖像樣值;i表示基圖像水平方向,j表示基圖像垂直方向;u表示基圖像水平方向上的空間頻率,v表示基圖像垂直方向上的空間頻率。練習(xí)已知a(i,j,u,v)表示8×8塊的基圖像樣值,計(jì)算以下情況的基圖像樣值表達(dá)式?(1)u,v均為0(2)

u=1,v=0(3)u=0,v=1二維DCT的基圖像0675432101234567uvija(i,j,7,7)二維變換核函數(shù)a(i,j;u,v)按i,j,u,v分別展開后得到的是N×N個(gè)N×N點(diǎn)的像塊組,又稱為基圖像。一個(gè)8×8DCT基圖像如圖所示。圖3-178×8的DCT基圖像示意圖8910111412512611510596971151311471491351231131141341591781751641491371211431771962011891651501191411752012071861621441071301651891921711441259711914917117214511796881071361561551299775直流DC基函數(shù)水平方向頻率增加垂直方向頻率增加DCT變換2.二維正交余弦變換編碼原理

(1)正交余弦變換編碼框圖二維正交余弦變換編碼(2)圖像的DCT編碼算法:

①將量化精度為8位的待壓縮圖像分成若干個(gè)88樣值子塊,做基于88子塊的DCT。②據(jù)最佳視覺特性構(gòu)造量化表,設(shè)計(jì)自適應(yīng)量化器并對DCT的頻率系數(shù)進(jìn)行量化。

③為增加連續(xù)的0系數(shù)的個(gè)數(shù),對量化后的系數(shù)進(jìn)行Z字形重排。

④用Huffman碼或游程碼作變字長熵編碼器對量化系數(shù)進(jìn)行編碼,進(jìn)一步壓縮數(shù)據(jù)量。1)圖像分塊

把一幅圖像中的亮度分量Y和色差分量Cr、Cb按4∶2∶2色度格式順序地分割成一系列8×8的子塊,然后依次將每個(gè)方塊內(nèi)的8×8個(gè)樣點(diǎn)同時(shí)送入變換器進(jìn)行變換運(yùn)算。2)DCT變換例1:DCT變換

8×8圖像塊中,像素值變化緩慢,具有較低空間頻率。進(jìn)行二維8×8DCT變換可將圖像塊的能量集中在極少數(shù)系數(shù)上。DCT的(0,0)元素是塊的平均值(直流),其它元素表明每個(gè)空間頻率下的譜能。離原點(diǎn)(0,0)越遠(yuǎn),元素衰減得越快,頻率越高。(a)背景部分圖像塊的DCT塊DCT變換(b)細(xì)節(jié)部分圖像塊的DCT例2:DCT變換及壓縮編碼8×8圖像亮度數(shù)據(jù)及其DCT系數(shù)DCT變換器將輸入的8×8點(diǎn)像塊由原空間域變換到頻率域中,映射成同樣大小的8×8點(diǎn)的變換系數(shù),經(jīng)變換后的系數(shù)更有利于壓縮。DCT系數(shù)F(u,v)1260-1-12-52-2-11-23-17-6-3-300-1-11-9-220-1-10-7-2011000-1-1120-1112020-111-1-100-1021-1-32-4-221-10139144149153155155155155144151153156159156156156150155160163158156156156159161162160160159159159159160161162162155155155611611611611601571571571621621611631621571571571621621611611631581581588×8圖像亮度數(shù)據(jù)f(i,j)DC3)量化1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399DCT系數(shù)塊中系數(shù)有低頻、高頻,量化應(yīng)用不同步長。人眼對低頻比對高頻分量易感變化,尤其是直流分量--基本色調(diào),若和鄰塊相比易察覺。所以量化步長要符合人眼的特性,對高頻系數(shù)粗量化,對低頻細(xì)量化。亮度量化表SY色度量化表SC17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999

亮度量化數(shù)據(jù)及量化后DCT系數(shù)亮度量化表SYDCT系數(shù)F(u,v)1260-1-12-52-2-11-23-17-6-3-300-1-11-9-220-1-10-7-2011000-1-1120-1112020-111-1-100-1021-1-32-4-221-10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論