第3章多媒體數(shù)據(jù)壓縮編碼技術(shù)1_第1頁
第3章多媒體數(shù)據(jù)壓縮編碼技術(shù)1_第2頁
第3章多媒體數(shù)據(jù)壓縮編碼技術(shù)1_第3頁
第3章多媒體數(shù)據(jù)壓縮編碼技術(shù)1_第4頁
第3章多媒體數(shù)據(jù)壓縮編碼技術(shù)1_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多媒體技術(shù)電子教學(xué)課件第3章1/19/20251陳文華第3章多媒體數(shù)據(jù)

壓縮編碼技術(shù)3.1多媒體數(shù)據(jù)壓縮編碼的重要性3.2預(yù)測編碼技術(shù)3.3哈夫曼編碼技術(shù)3.4行程(游程)RLE編碼技術(shù)3.5靜態(tài)圖像壓縮編碼國際標(biāo)準(zhǔn)—JPEG3.6運(yùn)動(dòng)圖像壓縮編碼國際標(biāo)準(zhǔn)—MPEG1/19/20252陳文華第3章多媒體數(shù)據(jù)

壓縮編碼技術(shù)3.1多媒體數(shù)據(jù)壓縮編碼的重要性

3.1.1數(shù)據(jù)冗余類型

3.1.2數(shù)據(jù)壓縮技術(shù)的分類

1/19/20253陳文華第3章

多媒體數(shù)據(jù)

壓縮編碼技術(shù)3.1媒體數(shù)據(jù)壓縮編碼的重要性

信息時(shí)代的重要特征是信息的數(shù)字化。早期的計(jì)算機(jī)系統(tǒng)采用模擬方式表示信息,但存在著明顯的缺點(diǎn):

①經(jīng)常會(huì)產(chǎn)生噪音和信號(hào)丟失,并且在復(fù)制過程中逐步積累噪音和誤差。②模擬信號(hào)不適合數(shù)字計(jì)算機(jī)加工處理。1/19/20254陳文華3.1

媒體數(shù)據(jù)壓縮

編碼的重要性

數(shù)字化后未經(jīng)壓縮的視頻和音頻等媒體信息的數(shù)據(jù)量是非常大的1.圖像數(shù)據(jù)量的大小可用下面的公式來計(jì)算:

圖像數(shù)據(jù)量=圖像的總像素×色彩深度÷8(單位為Byte,簡寫為B)

例如,一幅640×480、24位(bit)真彩色的圖像,其文件大小為:

640×480×24÷8=921.6KB1/19/20255陳文華3.1媒體數(shù)據(jù)壓縮

編碼的重要性2.雙通道立體聲激光唱盤,采用脈沖碼調(diào)制采樣,采樣頻率為44.1KHz,采樣精度16位,其一秒鐘時(shí)間內(nèi)的采樣數(shù)據(jù)量為:

44.1×1000×16×2÷8=176.4KB

一個(gè)650MB的CD—ROM,大約可存1小時(shí)的音樂。1/19/20256陳文華3.1媒體數(shù)據(jù)壓縮

編碼的重要性3.對動(dòng)態(tài)圖形和視頻圖像。例如對于彩色電視信號(hào),設(shè)代表光強(qiáng)Y的帶寬為4.2MHz、色彩I為1.5MHz和色飽和度Q為0.5MHz,采樣頻率>2倍原始信號(hào)頻率,各分量均被數(shù)字量化為8位,從而1秒鐘電視信號(hào)的數(shù)據(jù)量為:(4.2+1.5+0.5)×2×8×1000000÷8=12.4MB1/19/20257陳文華3.1媒體數(shù)據(jù)壓縮

編碼的重要性

容量為650MB的CD—ROM僅能存1分鐘的原始電視數(shù)據(jù)。若為高清晰度電視(HDTV)其1秒鐘數(shù)據(jù)量約為150MB(1.2Gbps÷8),一張CD—ROM還存不下5秒鐘的HDTV圖像。

巨大數(shù)字化信息的數(shù)據(jù)量對計(jì)算機(jī)存儲(chǔ)資源和網(wǎng)絡(luò)帶寬有很高的要求,解決的辦法就是要對視、音頻的數(shù)據(jù)進(jìn)行大量的壓縮。播放時(shí),傳輸少量被壓縮的數(shù)據(jù),接收后再對數(shù)據(jù)進(jìn)行解壓縮并復(fù)原。1/19/20258陳文華3.1.1數(shù)據(jù)冗余類型1.空間冗余

基于離散像素采樣來表示物體顏色的方式通常沒有利用景物表面顏色的這種空間相關(guān)性,這些相關(guān)性的光成像結(jié)構(gòu)在數(shù)字化圖像中就表現(xiàn)為空間冗余。我們可以通過改變物體表面顏色的像素存儲(chǔ)方式來利用空間相關(guān)性,達(dá)到減少數(shù)據(jù)量的目的。1/19/20259陳文華3.1.1數(shù)據(jù)冗余類型2.時(shí)間冗余

時(shí)間冗余反映在圖像序列中的相鄰幀圖像(電視圖像、動(dòng)畫)之間有較大的相關(guān)性,一組連續(xù)畫面中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,把一幀圖像中的某物體或場景可以由其他幀圖像中的物體或場景進(jìn)行處理后重構(gòu)出來,可以大大減少時(shí)間冗余。1/19/202510陳文華3.1.1數(shù)據(jù)冗余類型3.結(jié)構(gòu)冗余

有些圖像具有較強(qiáng)的相似性的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,方格狀的地板圖案等,我們稱此為結(jié)構(gòu)冗余。4.知識(shí)冗余

有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性,這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱此類冗余為知識(shí)冗余。根據(jù)已有的知識(shí),我們可以構(gòu)造圖像物體的基本模型,并創(chuàng)建圖像庫。1/19/202511陳文華3.1.1數(shù)據(jù)冗余類型5.視覺冗余

人的接收系統(tǒng)如視覺系統(tǒng)和聽覺系統(tǒng)是有一定限度的,人眼并不能察覺圖像場的所有變化,如人類視覺系統(tǒng)分辨能力約為64灰度等級(jí),而一般圖像量化采用256灰度等級(jí),這類冗余我們稱為視覺冗余。6.聽覺冗余

人耳的敏感性不能察覺所有頻率的變化,存在聽覺冗余。1/19/202512陳文華3.1.2數(shù)據(jù)壓縮技術(shù)

的分類

根據(jù)多媒體數(shù)據(jù)冗余類型的不同,解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致、質(zhì)量有無損失來進(jìn)行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。

無失真壓縮法也稱無損壓縮,無失真壓縮的特點(diǎn)是壓縮比較小,大約在2∶l至5∶l之間,主要用于文本數(shù)據(jù)、程序代碼和某些要求嚴(yán)格不丟失信息的環(huán)境中,常用的無失真壓縮編碼有如哈夫曼編碼等。1/19/202513陳文華3.1.2數(shù)據(jù)壓縮技術(shù)

的分類

有失真壓縮法也稱有損壓縮,有失真壓縮法的冗余壓縮取決于初始信號(hào)的類型、前后的相關(guān)性、信號(hào)的語義內(nèi)容等,壓縮比可以從幾到幾百倍,常用的有失真壓縮編碼技術(shù)有預(yù)測編碼、變換編碼、模型編碼、混合編碼方法等。主要用于壓縮圖像、聲音等信息。1/19/202514陳文華

常用的圖像和視頻壓縮方法如圖3-1所示:

圖像和視頻壓縮方法哈夫曼編碼行程編碼算術(shù)編碼LZW編碼DCT編碼小波變換子帶編碼無失真壓縮有失真壓縮預(yù)測編碼變換編碼模型編碼運(yùn)動(dòng)補(bǔ)償混合編碼分形編碼JPEGMPEGH.2613.1.2數(shù)據(jù)壓縮技術(shù)

的分類1/19/202515陳文華3.2預(yù)測編碼技術(shù)

根據(jù)離散信號(hào)之間存在著一定的相關(guān)性的特點(diǎn),利用圖像像素的以往樣本值(前面一個(gè)或幾個(gè)點(diǎn)的數(shù)據(jù))對于新樣本值(下一個(gè)點(diǎn)的數(shù)據(jù))進(jìn)行預(yù)測,然后將樣本的實(shí)際值與其預(yù)測值相減得到一個(gè)誤差值(較小),這樣可以用比較少的數(shù)碼進(jìn)行編碼得到較大的數(shù)據(jù)壓縮結(jié)果,達(dá)到壓縮數(shù)據(jù)的目的,因此預(yù)測編碼技術(shù)是一種有失真編碼方法。1/19/202516陳文華

最常用的是差值脈沖編碼調(diào)制法,簡稱為DPCM。圖3-2所示的是DPCM編、解碼系統(tǒng)原理圖傳輸信道輸入預(yù)測器量化器編碼器解碼器預(yù)測器XnenXn″e(cuò)n′輸出Xn′Xn′en′Xn″3.2預(yù)測編碼技術(shù)1/19/202517陳文華3.2預(yù)測編碼技術(shù)

設(shè)xn為tn時(shí)刻的亮度取樣值,預(yù)測器根據(jù)tn時(shí)刻之前的樣本值x1,x2…,xn-1對xn作預(yù)測,得到預(yù)測值xn′,xn

與xn′之間的誤差為:

en=xn-xn′(3-1)

接收端恢復(fù)的輸出信號(hào)為xn″是xn的近似值,兩者的誤差是:△xn=xn-xn″=xn′十en-(xn′十en′)=en-en′(3-2)1/19/202518陳文華3.2預(yù)測編碼技術(shù)

在預(yù)測編碼中,量化器的量化對像是預(yù)測誤差en-en′分布在零值附近,正負(fù)兩邊的分布一般是對稱的,圖3-3預(yù)測誤差分布特性示意圖。概率預(yù)測誤差圖3-3預(yù)測誤差分布示意圖1/19/202519陳文華量化輸出輸入電平非均勻量化間隔非均勻量化器1/19/202520陳文華3.2預(yù)測編碼技術(shù)

非均勻量化器對于具有相同的輸入信號(hào)動(dòng)態(tài)范圍、相同的圖像主觀評(píng)價(jià)質(zhì)量下,輸出的比特?cái)?shù)較低。預(yù)測編碼系統(tǒng)的缺點(diǎn):

預(yù)測誤差的量化是造成圖像質(zhì)量下降的主要原因,比如在圖像邊界斜率過載,表現(xiàn)為圖像輪廓變模糊;因最小量化電平不夠小(量化位數(shù)不夠高),使圖像灰度緩變區(qū)產(chǎn)生顆粒噪聲。

1/19/202521陳文華3.3哈夫曼編碼技術(shù)

假設(shè)一個(gè)信息源能產(chǎn)生的事件序列中的事件取自一個(gè)有限事件集,事件集S中的任一事件Si發(fā)生的概率為P(Si)都相等,即P(Si)=1/S,則其所能攜帶的信息量I(Si)定義為:

I(Si)=-log21/S=-log2P(Si)(3-3)

這里P(Si)是信息源產(chǎn)生的事件為Si的概率。等式右邊加一負(fù)號(hào)的目的是保證I(Si)的數(shù)值不為負(fù)值。定義中用2為底的對數(shù),并規(guī)定信息量I(Si)的計(jì)量單位為比特(bit)。1/19/202522陳文華3.3哈夫曼編碼技術(shù)

如果一個(gè)信息源發(fā)出的是由8個(gè)二值數(shù)(0,1)表示的組合信息。如果這種組合是等概率的,即P(Si)=1/256,(i=0,1,2,…255),則此8個(gè)數(shù)字提供的信息量按(3-3)式計(jì)算:

I(Si)=-log21/256=-log21十log2256

=8(bit)(3-4)

組合的總數(shù)是256種可能,每一種可能的組合為8比特。如果上述256種可能組合中是非等概率的,可以證明信息量I(Si)將小于8(bit)的。1/19/202523陳文華3.3哈夫曼編碼技術(shù)

離散無記憶(不受其前面事件出現(xiàn)與否的影響)信息源中一個(gè)事件所攜帶的平均信息量H(S)定義為:

(3-5)

平均信息量又稱為信息熵,熵實(shí)際上是信源事件集中各事件所攜帶的信息量的數(shù)學(xué)期望。熵值的單位是比特。

數(shù)據(jù)壓縮的另一個(gè)基本途徑則是去清除聯(lián)合信源中各信源間的相關(guān)性。1/19/202524陳文華3.3哈夫曼編碼技術(shù)

哈夫曼編碼利用了以上原理,屬于一種變字長碼,把信息源事件按概率大小順序排列,對出現(xiàn)概率大的信息源事件賦予短碼字,而對于概率小的信息源事件賦予長碼,只要碼字長度按照信息出現(xiàn)的概率大小逆順序排列,可通過數(shù)學(xué)證明這一結(jié)論:平均碼字長度一定小于其它任何事件順序的排列方式。1/19/202525陳文華3.3哈夫曼編碼技術(shù)

哈夫曼編碼一般過程如下:

1.把事件(消息)按出現(xiàn)的概率由大到小排成一個(gè)序列。如P(1)>P(2)>P(3)>…>P(Sm-1)>P(Sm),即將信息源事件按概率遞減順序排列。2.把其中兩個(gè)最小的概率P(Sm-1),P(Sm)挑出來,且將事件“1”賦給其中最小的,即P(Sm)→1;事件“0”賦給另一稍大的即P(Sm-1)→0。

1/19/202526陳文華3.3哈夫曼編碼技術(shù)

3.把兩個(gè)最小概率相加作為新事件的概率,即求出P(Sm-1),P(Sm)之和P(Si):

P(Si)=P(Sm-1)十P(Sm)

設(shè)P(Si)是對應(yīng)于一個(gè)新的消息的概率。4.將P(Si)與上面未處理的(m-2)個(gè)消息P(Sm-2)的概率重新由大到小再排列,構(gòu)成一個(gè)新的概率序列。5.重復(fù)步驟2),3),4),在每次合并信息源時(shí),將被合并的信源分別賦“0”和“1”直到所有m個(gè)事件的概率均已全部合并處理為止。1/19/202527陳文華3.3哈夫曼編碼技術(shù)

6.尋找從每一個(gè)信息源事件到概率總和為1處的路徑,對每一信息源事件寫出“1”、“0”序列(從樹根到信息源事件節(jié)點(diǎn))作為碼字。

Huffman編碼的平均碼字長度可以用下列公式求出:

(3-6)

這里的ni,為第i個(gè)消息事件的碼字長度,P(Si)為第i個(gè)消息出現(xiàn)的概率。舉一例子來說明這一編碼過程。

表3-1信息源消息事件及其對應(yīng)的概率

1/19/202528陳文華3.3哈夫曼編碼技術(shù)圖3-5哈夫曼編碼全過程:F1/19/202529陳文華3.3哈夫曼編碼技術(shù)

根據(jù)哈夫曼的編碼規(guī)則,我們得到如表3-2所示:

由于8個(gè)消息事件A,B,C…,H的每個(gè)概率為已知,則哈夫曼碼的平均長度L可按公式(3-6)計(jì)算為:

L=1×0.4十3×(0.18+0.10)+4×(0.10十0.06十0.07)十5×(0.05十0.04)=2.61比特

1/19/202530陳文華3.3哈夫曼編碼技術(shù)

圖像的熵H(S)可按公式(3-5)計(jì)算為:

定義編碼效率為熵值H(S)與平均碼長L的比值,即:編碼效率(3-7)

=2.55/2.61=97.8%

哈夫曼編碼有它的不足之處:

必須先得到信息源碼元(消息)的統(tǒng)計(jì)概率,才能進(jìn)行編碼。折中的方法是根據(jù)經(jīng)驗(yàn)值人為地給出Huffman碼表,但這樣的編碼無法達(dá)到最佳。1/19/202531陳文華3.4行程(游程)

RLE

編碼技術(shù)

行程編碼主要思路是用編碼器不斷比較信息源符號(hào)相鄰元素值的變化幅度,一旦發(fā)現(xiàn)有明顯的變化,就開始一個(gè)行程。編碼器檢測每一個(gè)行程起點(diǎn)位置開始的多次重復(fù)的比特或者字符序列,然后將一個(gè)相同值的連續(xù)串出現(xiàn)次數(shù)作為行程長度,并將行程長度轉(zhuǎn)換成代碼,再取用信息源符號(hào)的一個(gè)代表值作為代碼,這種編碼稱為行程編碼,或稱游程編碼,常用RLE表示。1/19/202532陳文華對一幅兩維圖像F(i,j)作水平掃描后得到的部分像素的像素值1/19/202533陳文華3.4行程(游程)

RLE

編碼技術(shù)

用RLE對這一行數(shù)據(jù)編碼后得到的碼字表:

RLE編碼壓縮編碼技術(shù)尤其適用于:

計(jì)算機(jī)生成的圖形圖像和黑白二值圖像的編碼,解壓縮速度很快。RLE的壓縮率的大小取決于圖像本身的特點(diǎn),可以得到較大的壓縮比。對復(fù)雜的圖像不適宜用RLE進(jìn)行編碼。1/19/202534陳文華3.5靜態(tài)圖像壓縮編碼

的國際標(biāo)準(zhǔn)--JPEG靜態(tài)圖像壓縮編碼JPEG概況

3.5.1JPEG壓縮編碼的基本系統(tǒng)(1)數(shù)據(jù)塊準(zhǔn)備(2)離散余弦正變換DCT(3)量化(4)DCT系數(shù)Z形掃描(5)DC系數(shù)編碼(6)AC系數(shù)編碼

3.5.2JPEG壓縮編碼的擴(kuò)展系統(tǒng)1/19/202535陳文華

3.5靜態(tài)圖像壓縮編碼的國際標(biāo)準(zhǔn)--JPEG

JPEG是國際上彩色、灰度、靜止圖像的第一個(gè)國際標(biāo)準(zhǔn)。用來在低分辨率到高分辨率的較寬范圍內(nèi)支持較高的圖像分辨率和量化精度。它不僅適用于黑白、彩色照片和印刷圖片等靜止圖像的壓縮,而且擴(kuò)大到了彩色傳真、電話會(huì)議、新聞圖片的傳送上,以及電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標(biāo)準(zhǔn)。1/19/202536陳文華3.5靜態(tài)圖像壓縮編碼

的國際標(biāo)準(zhǔn)--JPEG

變換編碼的基本思路:

1.編碼時(shí)略去某些能量很小的高頻分量以降低碼率。2.變換編碼還可以根據(jù)人眼對不同頻率分量的敏感程度而對不同系數(shù)采用不同的量化臺(tái)階,以進(jìn)一步提高壓縮比。

JPEG開發(fā)的壓縮編碼算法有三種工作方式:

1.基本系統(tǒng)(單次掃描)。2.?dāng)U展系統(tǒng)(常采用累進(jìn)編碼或分層編碼方式)。3.無損壓縮編碼。1/19/202537陳文華3.5.1

JPEG

壓縮編碼的基本系統(tǒng)

下面我們討論一個(gè)基于離散余弦正變換DCT的有失真JPEG編解碼的工作原理,圖3-7是基于DCT的JPEG編碼的過程框圖。

1/19/202538陳文華1.數(shù)據(jù)塊準(zhǔn)備

塊準(zhǔn)備將一幀(幅)圖像分成8×8的數(shù)據(jù)塊。對于彩色圖像,可以看作多分量(Y亮度信號(hào)分量和U和V色度信號(hào)分量)進(jìn)行壓縮處理。

假設(shè)圖像的大小為480行,每一行有640個(gè)像素。并假設(shè)按4∶l∶l取樣格式,即四個(gè)亮度分量,一個(gè)色差分量U,一個(gè)色差分量V,則亮度分量就是一個(gè)640×480的數(shù)值矩陣,色差分量是一個(gè)320×240的數(shù)值矩陣。

塊準(zhǔn)備必須劃分出4800個(gè)(640×480÷8)亮度塊和兩份1200個(gè)(320×240÷8)色差塊,共計(jì)7200個(gè)數(shù)據(jù)塊。1/19/202539陳文華2.離散余弦正變換DCT

若采樣精度為P位,采樣數(shù)據(jù)在范圍(0,2P-1),則變成在范圍(-2P-1,2P-1-l)內(nèi),以此作為DCT正變換的輸入。在解碼器的輸出端經(jīng)IDCT反變換后,得到一系列8×8的圖像數(shù)據(jù)塊,需將其數(shù)值范圍由(-2P-1,2P-1-l)再變回到(0,2P-1

)范圍內(nèi)的無符號(hào)整數(shù),才能重構(gòu)圖像。2.離散余弦正變換DCT

離散變換可以用矩陣表示。假設(shè)信源序列為一個(gè)n行k列的矩陣X,變換矩陣為T,經(jīng)過某種變換后得到輸出序列Y為:

Y=TX1/19/202540陳文華2.離散余弦正變換DCT

如果所采用的變換是正交變換,則T為正交矩陣,即有:

T-1T=I

其中I是單位矩陣。在接收端,進(jìn)行變換:

X=T-1Y

則可以恢復(fù)源信號(hào)序列X。

JPEG將8×8大小的子塊圖像進(jìn)行離散余弦DCT變換。1/19/202541陳文華2.離散余弦正變換DCT

下面是離散余弦正變換DCT和它的IDCT逆變換的數(shù)學(xué)表達(dá)式。

DCT變換為

1/19/202542陳文華2.離散余弦正變換DCT

將每個(gè)數(shù)據(jù)塊的數(shù)據(jù)從空間域變換到頻率域,輸出64個(gè)DCT變換系數(shù)。如圖3-8所示,64個(gè)像素變換為64個(gè)系數(shù)。

(a)像素塊(b)DCT系數(shù)陣列橫向頻率增加方向U縱向頻率增加方向VXY1/19/202543陳文華2.離散余弦正變換DCT

圖3-9為二維離散余弦變換的示意圖。幅度x

ya=f(x,y)DC系數(shù)DCT系數(shù)Fx

Fyc=g(Fx,F(xiàn)y)1/19/202544陳文華3.量化

量化是一種不可逆的、有失真的過程,在基于DCT的編碼器中,量化是引起信息丟失的主要原因。對DCT系數(shù)進(jìn)行量化有兩個(gè)作用:

①降低系數(shù)的幅值。②

增加系數(shù)中值為0的項(xiàng)數(shù)。1/19/202545陳文華3.量化

表3-4缺省的亮度Y分量量化表1/19/202546陳文華3.量化

表3-5缺省的色度U、V分量量化表。1/19/202547陳文華3.量化

JPEG的量化器的公式可定義為:

其中:DCT變換系數(shù)C(u,v);Q(u,v)是量化器步長,它是量化表的元素。1/19/202548陳文華4.DCT

系數(shù)Z形掃描圖3-10Z形掃描順序

其一維數(shù)組元素的位置順序如圖3-10。

ZZ(0)=C(0,0),ZZ(1)=C(0,l),ZZ(2)=C(l,0),…,ZZ(63)=C(7,7)。編碼順序依據(jù)ZZ的序號(hào)。01561415272824713162629423812172530414391118243140445310192332394552542022333846515560213437475056596135364849575862631/19/202549陳文華5.

DC系數(shù)編碼

對相鄰塊之間的DC系數(shù)的差值DIFF=Di-Di-1進(jìn)行編碼。

DIFF=ZZ(0)-PRED進(jìn)行無失真編碼。因輸入數(shù)據(jù)已偏移到零電平,已先行減去了2P-1,在掃描起點(diǎn)初始化時(shí)刻,規(guī)定PRED=0。Blocki-1Blocki圖3-11DC系數(shù)的差值DIFF=Di-Di-1DiDi-1┅┅┅┅1/19/202550陳文華5.

DC系數(shù)編碼

若后面的ZZ(0)的動(dòng)態(tài)范圍為-1023~+1023,則DIFF的動(dòng)態(tài)范圍可達(dá)-2047~+2047,這樣每個(gè)值賦予一個(gè)碼字則碼表過于龐大。因此,JPEG對碼表進(jìn)行簡化,采用“前綴碼(SSSS)+尾碼”。前綴碼表示尾碼的有效位數(shù)(設(shè)為B位),尾碼則直接采用B位自然二進(jìn)制碼。8位精度的SSSS值的范圍為0~11(12項(xiàng)),其碼表可參見表3-6原始圖像分量為8位精度時(shí)DC系數(shù)差值的典型哈夫曼編碼表所示。1/19/202551陳文華5.

DC系數(shù)編碼對于尾碼為DIFF的B位:當(dāng)DIFF≥0,用原碼,尾碼的最高位是“l(fā)”;當(dāng)DIFF<0,用反碼,尾碼的最高位是“0”;如設(shè)DIFF=12,SSSS=4,其前綴碼字為“101”,4位尾碼為“1100”,從而DIFF=12的編碼為“1011100”。如果DIFF=-12,4位尾碼為12反碼“0011”,從而DIFF=-12的編碼為“1010011”。解碼時(shí),由前綴碼“101”知尾碼有4位;若碼字是“1100”,因其最高位為“1”,立即可得DIFF=12;若碼字是“0011”,則因其最高位為“0”,知DIFF應(yīng)為負(fù)數(shù),尾碼是個(gè)反碼,取反后可得實(shí)際值DIFF=-12。1/19/202552陳文華6.AC系數(shù)的編碼

Z形掃描將二維量化系數(shù)矩陣轉(zhuǎn)換成一維數(shù)組ZZ中的“零游程/非零值”。

若最后一個(gè)“零游程/非零值”中只有零游程(ZRL),則直接傳塊結(jié)束碼字“EOB”結(jié)束本塊。

“零游程/非零值”編碼表示為“NNNN/SSSS+尾碼”。

其中:4位“NNNN”為相對于前一個(gè)非零值的零游程計(jì)數(shù),表示ZRL=0~15;

如果ZRL>15,則用“NNNN/SSSS”=“1111/0000”表示ZRL=16,再對ZRL=ZRL-16繼續(xù)編碼。1/19/202553陳文華6.AC系數(shù)的編碼

對于基本系統(tǒng),SSSS將不超過10,可參見

表3-7AC系數(shù)的尾碼位數(shù)賦值表。前綴碼的二維哈夫曼碼表的大小為NNNN×SSSS+2=162;亮度和色差各有自己的碼表(分別見表3-8亮度AC系數(shù)碼表和表3-9色差A(yù)C系數(shù)碼表)。1/19/202554陳文華6.AC系數(shù)的編碼

若ZZ(k)為非零AC系數(shù),則其編碼步驟與DC系數(shù)的類似:

①根據(jù)ZZ(k)的幅度范圍由表3-7查出尾碼的位數(shù)SSSS=B。②由ZRL計(jì)數(shù)值NNNN以及SSSS從表3-8或表3-9中查出前綴碼字。③按以下規(guī)則直接寫出尾碼的碼字,當(dāng)ZZ(k)≥0,用原碼,當(dāng)ZZ(k)<0,用反碼。1/19/202555陳文華6.AC系數(shù)的編碼

現(xiàn)以一實(shí)例說明其編碼過程。設(shè)某亮度圖像塊的量化系數(shù)矩陣按Z形掃描得到:

k01234567

ZZ(k)125-202000

k89~303132~63

ZZ(k)

10-10

假如其前一亮度塊的量化DC系數(shù)為12。1/19/202556陳文華6.AC系數(shù)的編碼

則編碼過程如下:第一步,DC系數(shù)編碼,因?yàn)镈IFF=ZZ(0)-PRED=12-12=0,由表3-6直接查得其前綴碼“00”。第二步,AC系數(shù)編碼。第1個(gè)非零值ZZ(1)=5,它與ZZ(0)之間無零系數(shù),故NNNN=0,因“5”落入表3-7中的第3組,故SSSS=3,而NNNN/SSSS=0/3,由表3-8查得為“100”,從而ZZ(1)=5的編碼為“100101”。第2個(gè)非零值ZZ(2)=-2,它與ZZ(1)之間無零系數(shù),故NNNN=0,因“-2”落入表3-7中的第2組,故SSSS=2,而NNNN/SSSS=0/2,由表3-8查得為“01”,而-2的反碼為“01”。從而ZZ(2)=-2的編碼為“0101”。1/19/202557陳文華6.AC系數(shù)的編碼

第3個(gè)ZZ(4)=2,NNNN/SSSS=1/2,查表3-8得碼字“11011”,而2的原碼為10,所以取ZZ(3)~ZZ(4)的編碼為“1101110”。第4個(gè)ZZ(8)=1,NNNN/SSSS=3/1,查表3-8得碼字“111010”,而1的原碼為1,所以取ZZ(5)~ZZ(8)的編碼為“1110101”。第5個(gè)ZZ(31)=-1,由于NNNN=30-9+1=22>15,故先編碼ZRL=16,由表3-8查得F/0(16進(jìn)制表示)的碼字為“11111111001”;此后有NNNN=22-16=6<15,故再編碼NNNN/SSSS=6/1,查出其碼字為“1111011”,而-1的反碼為0,從而ZZ(9)~ZZ(31)的編碼為“11111111001+1111011+0”。

1/19/202558陳文華6.AC系數(shù)的編碼

此后無非零值,直接用一個(gè)“EOB(0/0)”結(jié)柬本塊,查表3-7得其碼字為“1010”。

綜合以上兩個(gè)步驟,可知該圖像塊的編碼位流為:

“0010010101011101110111010111111111001111101101010”共用了49位,而原始圖像塊要用8×8×8=512位表示,故壓縮比為512∶49=10.45∶1。1/19/202559陳文華3.5.1JPEG

壓縮編碼

的基本系統(tǒng)

對于中等復(fù)雜程度的彩色圖像,其壓縮比與恢復(fù)圖像的質(zhì)量大致如表3-10所示。表3-10壓縮效果與恢復(fù)圖像質(zhì)量的關(guān)系

1/19/202560陳文華3.5.1JPEG

壓縮編碼

的基本系統(tǒng)

順序編碼運(yùn)行方式1/19/202561陳文華3.5.2

JPEG

壓縮編碼

的擴(kuò)展系統(tǒng)1.基于DCT的累進(jìn)編碼運(yùn)行方式

累進(jìn)編碼方式要掃描多次。1/19/202562陳文華3.5.2JPEG

壓縮編碼

的擴(kuò)展系統(tǒng)2.分層編碼運(yùn)行方式

水平方向和垂直方向分辨率以2的倍數(shù)因子下降(降低原始圖像的空間分辨率),導(dǎo)出若干低分辨率的原圖像,分層后再采用JPEG的壓縮編碼方法進(jìn)行編碼,隨后以上重復(fù)步驟,直到圖像達(dá)到完整的分辨率編碼為止。1/19/202563陳文華3.5.2JPEG壓縮編碼

的擴(kuò)展系統(tǒng)3.無損壓縮預(yù)測編碼運(yùn)行方式源圖像數(shù)據(jù)表說明預(yù)測器熵編碼器壓縮后圖像數(shù)據(jù)1/19/202564陳文華無損壓縮預(yù)測編碼

運(yùn)行方式

DPCM編碼簡單,易于用硬件實(shí)現(xiàn)。由于是無失真編碼,解碼后的圖像質(zhì)量很高。

Px1/19/202565陳文華3.6運(yùn)動(dòng)圖像壓縮編碼的國際標(biāo)準(zhǔn)—MPEG運(yùn)動(dòng)圖像壓縮編碼—MPEG概況

3.6.1MPEG標(biāo)準(zhǔn)簡介3.6.2幀間編碼技術(shù)3.6.3運(yùn)動(dòng)補(bǔ)償技術(shù)3.6.4MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)3.6.5MPEG音頻1/19/202566陳文華3.6運(yùn)動(dòng)圖像壓縮編碼的國際標(biāo)準(zhǔn)——MPEG

MPEG專家組工作將整個(gè)過程分為三步:

①要求

提出要求有雙重的目的:目標(biāo),競爭的原則。

②竟?fàn)?/p>

提出了14個(gè)不同的方案。

③集中

測試和評(píng)價(jià),并綜合出一個(gè)最佳方案。1/19/202567陳文華3.6.1MPEG

標(biāo)準(zhǔn)簡介1.MPEG—1標(biāo)準(zhǔn)

MPEG—1的標(biāo)準(zhǔn)名稱為“動(dòng)態(tài)圖像和伴音的編碼”—用于速率小于每秒約1.5Mbps的數(shù)字存儲(chǔ)媒體。

MPEG—1的最大壓縮比可達(dá)約1∶200。

MPEG—1標(biāo)準(zhǔn)有3個(gè)部分組成:

MPEG—1視頻(Video)MPEG—1音頻(Audio)MPEG—1系統(tǒng)(System)1/19/202568陳文華1.MPEG—1

標(biāo)準(zhǔn)

設(shè)計(jì)目標(biāo)是把每秒30幀、亮度信號(hào)的分辨率為360×240,色度信號(hào)分辨率為180×120,傳送壓縮成數(shù)據(jù)率為1.2Mbps的編碼圖像。

MPEG—1電視圖像的壓縮算法采用兩種基本壓縮技術(shù):①為減少時(shí)間冗余度,采用16×16個(gè)像素組成的圖像塊的運(yùn)動(dòng)補(bǔ)償技術(shù)。②為了減少空間冗余度,采用8×8圖像化的DCT變換技術(shù)。1/19/202569陳文華1.MPEG—1

標(biāo)準(zhǔn)

聲音壓縮編碼技術(shù)支持高壓縮的音頻數(shù)據(jù)流,其采樣率為48,44.l或22KHz,量化精度為16位的聲音壓縮。支持兩個(gè)聲道,可設(shè)置成單聲道(mono)、雙聲道(dual)或立體聲(stereo)。采用MPEG—1算法可以把位速率降到0.192Mbps。MPEG—1系統(tǒng)采用多路復(fù)合技術(shù),把數(shù)字電視圖像和聲音復(fù)合成單一數(shù)據(jù)位流,MPEG—1的數(shù)據(jù)位流分成內(nèi)外兩層,外層為系統(tǒng)層,內(nèi)層為壓縮層。1/19/202570陳文華

2.MPEG—2

標(biāo)準(zhǔn)

MPEG—2標(biāo)準(zhǔn)稱為“活動(dòng)圖像及有關(guān)聲音信息的通用編碼”標(biāo)準(zhǔn)。設(shè)計(jì)目標(biāo)是把以10Mbps速度傳送每秒30幀、分辨率為720×572高分辨率的廣播級(jí)視頻圖像,壓縮后的傳送數(shù)據(jù)率為3~15Mbps。MPEG—2標(biāo)準(zhǔn)是HDTV、DVD以及新型數(shù)字式交互有線網(wǎng)所采用的數(shù)字視頻壓縮標(biāo)準(zhǔn)。

MPEG—2標(biāo)準(zhǔn)是MPEG—1標(biāo)準(zhǔn)的擴(kuò)充、豐富和完善,并與MPEG—1標(biāo)準(zhǔn)相兼容。1/19/202571陳文華2.MPEG—2

標(biāo)準(zhǔn)

MPEG—2標(biāo)準(zhǔn)主要分為四部分:

第一部分:系統(tǒng)。第二部分:視頻。第三部分:音頻。第四部分:一致性測試。

MPEG—2標(biāo)準(zhǔn)使計(jì)算機(jī)處理全彩色、全屏幕、全動(dòng)態(tài)的視頻圖像,同時(shí)也能使有線、無線、CD-ROM等傳輸和存儲(chǔ)介質(zhì)有效地傳送視頻圖像,并且具有CD的音質(zhì),使多媒體技術(shù)與通信和廣播等技術(shù)結(jié)合起來。1/19/202572陳文華3.MPEG—4

標(biāo)準(zhǔn)

用來支持低比特率下的多媒體通信,還支持用于通信、訪問和數(shù)字視聽數(shù)據(jù)處理的新方法。注重多媒體系統(tǒng)的交互性和靈活性,以最少量的數(shù)據(jù)、極低的音頻/視頻壓縮碼率來顯示建立精確的畫面,達(dá)到具有高效編碼、高效存儲(chǔ)與傳播以及可交互操作的特性。1/19/202573陳文華4.MPEG—7

標(biāo)準(zhǔn)

正式名稱為多媒體內(nèi)容描述接口。

MPEG—7標(biāo)準(zhǔn)只規(guī)定信息內(nèi)容描述格式,而不規(guī)定如何從原始的多媒體資料中抽取內(nèi)容描述和查詢、檢索方法。MPEG—7標(biāo)準(zhǔn)不針對特定的應(yīng)用領(lǐng)域,而是盡可能支持廣泛的應(yīng)用領(lǐng)域。

主要用途:在數(shù)字圖書館、多媒體目錄服務(wù)、圖像分析、音樂詞典、教育、多媒體編輯、多媒體業(yè)務(wù)引導(dǎo)等多個(gè)領(lǐng)域。1/19/202574陳文華4.MPEG—7

標(biāo)準(zhǔn)

視頻壓縮算法用到了三項(xiàng)基本技術(shù):

①幀間編碼技術(shù)和基于塊的運(yùn)動(dòng)補(bǔ)償技術(shù)。②空間壓縮(也稱為幀內(nèi)壓縮)技術(shù)。③熵編碼,使用Huffman編碼技術(shù)。

MPEG標(biāo)準(zhǔn)所用的編碼模型與JPEG的編碼模型類似,分為5個(gè)階段:

幀間編碼和運(yùn)動(dòng)補(bǔ)償、變換編碼、量化、直流分量DC及交流分量AC的編碼和熵編碼。1/19/202575陳文華3.6.2幀間編碼技術(shù)

利用的時(shí)間相關(guān)性可進(jìn)一步消除視頻其相鄰幀之間具有冗余信息,提高壓縮比。將圖像分成三種類型:1.參考幀(I)以自身圖像的相關(guān)性進(jìn)行壓縮處理,必須要傳送。2.預(yù)測幀(P)

用前面的參考幀或預(yù)測幀作為參照圖像信息進(jìn)行預(yù)測編碼,并可作為下一個(gè)預(yù)測幀(B幀圖像或P幀圖像)的參照圖像信息。但因此可能引起預(yù)測誤差。1/19/202576陳文華3.6.2幀間編碼技術(shù)3.雙向預(yù)測幀(B)

又稱插補(bǔ)幀,在預(yù)測時(shí),既可以使用前面或后面的視頻幀(I參考幀,P預(yù)測幀)進(jìn)行雙向預(yù)測,也可以同時(shí)使用前后兩個(gè)視頻幀進(jìn)行預(yù)測編碼,但本身不能作為下一個(gè)預(yù)測幀的參照圖像信息。在編碼時(shí),先對參考幀進(jìn)行變換編碼,然后對預(yù)測幀進(jìn)行編碼,再對兩者之間的雙向預(yù)測幀進(jìn)行編碼,這個(gè)過程對隨后的下一個(gè)預(yù)測幀和雙向預(yù)測幀重復(fù),直到完成所有幀的編碼為止。1/19/202577陳文華3.6.2幀間編碼技術(shù)

采用下述四種預(yù)測技術(shù):①

幀內(nèi)編碼

前向預(yù)測③

后向預(yù)測④雙向預(yù)測

圖3-12顯示一個(gè)典型的視頻圖像序列次序。

I

B

B

P

B

B

P

B

B

P

B

B

P

B

B

I

B

B12

3

4

5

67

8

910

1112

13141516

1718

I幀和P幀間有兩個(gè)B幀每十五幀有一幅I幀圖像(0.5秒)1/19/202578陳文華3.6.2幀間編碼技術(shù)

編碼器的輸出視頻圖像序列排列順序。1423756108IPBB

P

BBP

B9131112161415……

BPBBIB

B……

發(fā)送端編碼器的輸出到接收端解碼器的輸入端,經(jīng)解碼器的輸出,又恢復(fù)為圖3-12編碼器輸入順序顯示。1/19/202579陳文華3.6.3運(yùn)動(dòng)補(bǔ)償技術(shù)

運(yùn)動(dòng)矢量選擇二維16×16像素塊作為一個(gè)的運(yùn)動(dòng)矢量處理。運(yùn)動(dòng)矢量又稱為宏塊,它有不同的類型:可以是I幀內(nèi)型,F(xiàn)前向預(yù)測型、B后向預(yù)測型A平均值(雙向預(yù)測)型。

概念:

當(dāng)前圖像可看作是前一幀圖像位移后的結(jié)果,其位移的內(nèi)容包括運(yùn)動(dòng)方向和運(yùn)動(dòng)幅度。運(yùn)動(dòng)補(bǔ)償方法是跟蹤畫面內(nèi)的運(yùn)動(dòng)情況并對其加以補(bǔ)償后,與當(dāng)前的圖像宏塊值相減得到預(yù)測誤差,再進(jìn)行編碼、傳送。1/19/202580陳文華3.6.3運(yùn)動(dòng)補(bǔ)償技術(shù)

討論預(yù)測器計(jì)算表達(dá)式,設(shè)前一參照幀為I0,后一參照幀為I2,當(dāng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論