多媒體數(shù)據(jù)壓縮技術(shù)_第1頁
多媒體數(shù)據(jù)壓縮技術(shù)_第2頁
多媒體數(shù)據(jù)壓縮技術(shù)_第3頁
多媒體數(shù)據(jù)壓縮技術(shù)_第4頁
多媒體數(shù)據(jù)壓縮技術(shù)_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章第四章 多媒體數(shù)據(jù)壓縮編碼技術(shù)多媒體數(shù)據(jù)壓縮編碼技術(shù)本章內(nèi)容4.1 多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展4.2 信息與數(shù)據(jù)信息與數(shù)據(jù)4.3 數(shù)據(jù)冗余及其類型數(shù)據(jù)冗余及其類型4.4 常用數(shù)據(jù)壓縮技術(shù)常用數(shù)據(jù)壓縮技術(shù)4.5 多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹4.6 聲音壓縮編碼技術(shù)聲音壓縮編碼技術(shù)習(xí)題習(xí)題本章內(nèi)容4.1 多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展4.2 信息與數(shù)據(jù)信息與數(shù)據(jù)4.3 數(shù)據(jù)冗余及其類型數(shù)據(jù)冗余及其類型4.4 常用數(shù)據(jù)壓縮技術(shù)常用數(shù)據(jù)壓縮技術(shù)4.5 多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹4.6 聲音壓

2、縮編碼技術(shù)聲音壓縮編碼技術(shù)習(xí)題習(xí)題4.1多媒體數(shù)據(jù)壓縮編碼技術(shù)多媒體數(shù)據(jù)壓縮編碼技術(shù) 數(shù)字化是今后通信產(chǎn)品和消費(fèi)電子產(chǎn)品的基礎(chǔ)技術(shù)。在對圖像和數(shù)字化是今后通信產(chǎn)品和消費(fèi)電子產(chǎn)品的基礎(chǔ)技術(shù)。在對圖像和語音等媒體上的信息進(jìn)行數(shù)字化的過程中,由于數(shù)據(jù)中存在著很多冗語音等媒體上的信息進(jìn)行數(shù)字化的過程中,由于數(shù)據(jù)中存在著很多冗余,所以,必須壓縮后再進(jìn)行存儲和傳輸。經(jīng)驗(yàn)表明,實(shí)用的壓縮方余,所以,必須壓縮后再進(jìn)行存儲和傳輸。經(jīng)驗(yàn)表明,實(shí)用的壓縮方法可以將運(yùn)動圖像數(shù)據(jù)壓縮法可以將運(yùn)動圖像數(shù)據(jù)壓縮30倍而不失真。倍而不失真。 1977年兩位以色列教授發(fā)明了年兩位以色列教授發(fā)明了Lempel-Ziv數(shù)據(jù)壓縮技術(shù)

3、,使用了數(shù)據(jù)壓縮技術(shù),使用了查找冗余字符串和將此字符串用較短的符號標(biāo)記替代的技術(shù),并對原查找冗余字符串和將此字符串用較短的符號標(biāo)記替代的技術(shù),并對原先設(shè)想的字符串為基礎(chǔ)的壓縮技術(shù)作了實(shí)驗(yàn)工作。哈夫曼提出將固定先設(shè)想的字符串為基礎(chǔ)的壓縮技術(shù)作了實(shí)驗(yàn)工作。哈夫曼提出將固定量的字符轉(zhuǎn)換為可變量的壓縮輸出字符的方法。量的字符轉(zhuǎn)換為可變量的壓縮輸出字符的方法。 1980年以來,國際標(biāo)準(zhǔn)化組織(年以來,國際標(biāo)準(zhǔn)化組織(ISO)、國際電工委員會()、國際電工委員會(IEC)和國際電信聯(lián)盟(和國際電信聯(lián)盟(ITU)下屬的國際電報(bào)電話咨詢委員會()下屬的國際電報(bào)電話咨詢委員會(CCITT)陸續(xù)完成了各種數(shù)據(jù)壓縮

4、與通信的標(biāo)準(zhǔn)和建議,如面向靜止圖像壓縮陸續(xù)完成了各種數(shù)據(jù)壓縮與通信的標(biāo)準(zhǔn)和建議,如面向靜止圖像壓縮的的CCITT T.81及及ISO 10918(JPEG)標(biāo)準(zhǔn),在運(yùn)動圖像方面用于視頻會)標(biāo)準(zhǔn),在運(yùn)動圖像方面用于視頻會議的議的CCITT H.261(Px64)標(biāo)準(zhǔn)、用于可視電話的)標(biāo)準(zhǔn)、用于可視電話的CCITT H.263標(biāo)準(zhǔn)、標(biāo)準(zhǔn)、用于用于VCD的的ISO 11172(MPEG-1)及用于廣播電視和)及用于廣播電視和DVD的的ISO/IEC 13818(MPEG-2)標(biāo)準(zhǔn)和適用于低傳輸速率的)標(biāo)準(zhǔn)和適用于低傳輸速率的MPEG-4方案。方案。 我國的信息科學(xué)工作者在上述領(lǐng)域進(jìn)行了很有成效的研究

5、我國的信息科學(xué)工作者在上述領(lǐng)域進(jìn)行了很有成效的研究與開發(fā)工作。在國家與開發(fā)工作。在國家863計(jì)劃和其它研究計(jì)劃、部門計(jì)劃的支持計(jì)劃和其它研究計(jì)劃、部門計(jì)劃的支持下,無論是在理論還是實(shí)踐方面都取得了很多研究成果與產(chǎn)品。下,無論是在理論還是實(shí)踐方面都取得了很多研究成果與產(chǎn)品。例如,例如,VCD首先在中國被設(shè)計(jì)出來,并得到最為普及的應(yīng)用。首先在中國被設(shè)計(jì)出來,并得到最為普及的應(yīng)用。中科院聲學(xué)所在中科院聲學(xué)所在MPEG-1解碼設(shè)備的設(shè)計(jì)與產(chǎn)業(yè)化方面做出了突解碼設(shè)備的設(shè)計(jì)與產(chǎn)業(yè)化方面做出了突出的貢獻(xiàn)。由哈工大和中科院計(jì)算所國家智能計(jì)算機(jī)研究開發(fā)出的貢獻(xiàn)。由哈工大和中科院計(jì)算所國家智能計(jì)算機(jī)研究開發(fā)中心聯(lián)

6、合完成的中心聯(lián)合完成的MPEG-2解碼設(shè)備已經(jīng)成功地應(yīng)用到了解碼設(shè)備已經(jīng)成功地應(yīng)用到了DVD和和數(shù)字衛(wèi)星電視接收機(jī)等產(chǎn)品中,并已進(jìn)入產(chǎn)業(yè)化階段。四川鼎數(shù)字衛(wèi)星電視接收機(jī)等產(chǎn)品中,并已進(jìn)入產(chǎn)業(yè)化階段。四川鼎天公司設(shè)計(jì)的具有實(shí)時天公司設(shè)計(jì)的具有實(shí)時MPEG-1和和MPEG-2解碼功能的多媒體計(jì)解碼功能的多媒體計(jì)算機(jī)于算機(jī)于1996年就已經(jīng)研制成功,并在當(dāng)年美國秋季計(jì)算機(jī)展覽年就已經(jīng)研制成功,并在當(dāng)年美國秋季計(jì)算機(jī)展覽會上公開亮相進(jìn)行了發(fā)布。會上公開亮相進(jìn)行了發(fā)布。 本章內(nèi)容4.1 多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展4.2 信息與數(shù)據(jù)信息與數(shù)據(jù)4.3 數(shù)據(jù)冗余及其類型數(shù)據(jù)冗余及

7、其類型4.4 常用數(shù)據(jù)壓縮技術(shù)常用數(shù)據(jù)壓縮技術(shù)4.5 多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹4.6 聲音壓縮編碼技術(shù)聲音壓縮編碼技術(shù)習(xí)題習(xí)題4.2.1信息與數(shù)據(jù)的概念信息與數(shù)據(jù)的概念 一個消息的可能性越小一個消息的可能性越小 , 其信息越多其信息越多; 消息的可能性越大消息的可能性越大 , 則信息越少。在數(shù)學(xué)上則信息越少。在數(shù)學(xué)上 , 所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。信息量是指從降函數(shù)。信息量是指從 N 個相等可能事件中選出一個事件所需個相等可能事件中選出一個事件所需要的信息度量或含量要的信息度量或含量 , 也就是在辨識也就是在辨識 N 個

8、事件中特定的一個事個事件中特定的一個事件的過程中所需要提問件的過程中所需要提問 是或否是或否 的最少次數(shù)。的最少次數(shù)。 例如例如, 要從要從 256 個數(shù)中選定某一個數(shù)個數(shù)中選定某一個數(shù) , 可以先提問可以先提問 是否大于是否大于 128? 不論回答是或否都消去了半數(shù)的可能事件不論回答是或否都消去了半數(shù)的可能事件, 這樣繼續(xù)問下去這樣繼續(xù)問下去 , 只要提問只要提問 8 次這類問題次這類問題 , 就能從就能從 256 個個 數(shù)中選定某一個數(shù)數(shù)中選定某一個數(shù) , 這是因?yàn)槊刻釂栆贿@是因?yàn)槊刻釂栆淮味紩玫酱味紩玫?1bit 的信息量。因此的信息量。因此 , 在在 256 個數(shù)中選定某一個數(shù)所需

9、要個數(shù)中選定某一個數(shù)所需要的信息量是的信息量是:log2256=8bit數(shù)據(jù):用來記錄和傳送信息,或者說數(shù)據(jù)是信息的載體。數(shù)據(jù):用來記錄和傳送信息,或者說數(shù)據(jù)是信息的載體。信息:真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。信息:真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。 設(shè)從設(shè)從N 個數(shù)中選定任一個數(shù)個數(shù)中選定任一個數(shù)x的概率為的概率為 p(x)。 假定選定任意一個假定選定任意一個 數(shù)的概率都相等數(shù)的概率都相等 , 即即 p(x)=1/N, 定義信息量為定義信息量為 : I(x)=log2N=log2(1/N)=log2p(x) =Ip(x) 如果將信源、所有可能事件的信息量進(jìn)行平均如果

10、將信源、所有可能事件的信息量進(jìn)行平均, 就得到了信息的就得到了信息的 熵熵 (entropy) 。熵就是平均信息量。信源。熵就是平均信息量。信源 X 的符號集為的符號集為xi(i=1、2 N), 設(shè)設(shè)xi出現(xiàn)的概率為出現(xiàn)的概率為 p( xi ), 則信息源則信息源 X 的熵為的熵為 : H(X)=p(xi)I p(xi) =p(xi)log2p(xi)4.2.2 信息的數(shù)據(jù)量和壓縮的必要性信息的數(shù)據(jù)量和壓縮的必要性對多媒體數(shù)據(jù)必須進(jìn)行壓縮編碼,因?yàn)椋簩Χ嗝襟w數(shù)據(jù)必須進(jìn)行壓縮編碼,因?yàn)椋海?)多媒體數(shù)據(jù)數(shù)字化后的海量性)多媒體數(shù)據(jù)數(shù)字化后的海量性多媒體數(shù)據(jù)包括文本、聲音、動畫、圖形、圖像以及視頻

11、等,信息從多媒體數(shù)據(jù)包括文本、聲音、動畫、圖形、圖像以及視頻等,信息從單一媒體被轉(zhuǎn)換成多種媒體,要表示、傳輸和處理大量的聲音、圖像單一媒體被轉(zhuǎn)換成多種媒體,要表示、傳輸和處理大量的聲音、圖像甚至影視信息,其數(shù)據(jù)量是非??捎^的。甚至影視信息,其數(shù)據(jù)量是非??捎^的?,F(xiàn)分別以文本、圖形、圖像、現(xiàn)分別以文本、圖形、圖像、音頻和視頻等信息為例計(jì)算其各自的信息量。音頻和視頻等信息為例計(jì)算其各自的信息量。(2)多媒體信號源及其表示方式呈多元化)多媒體信號源及其表示方式呈多元化多媒體信息源包括數(shù)字、文本、圖形、圖像、音頻和視頻等媒體,它多媒體信息源包括數(shù)字、文本、圖形、圖像、音頻和視頻等媒體,它們的獲取方法也

12、不盡相同。這些媒體的表示方式分為模擬和數(shù)字兩種。們的獲取方法也不盡相同。這些媒體的表示方式分為模擬和數(shù)字兩種。模擬信號指時間和幅度均是連續(xù)的信號,而數(shù)字信號則是時間和幅度模擬信號指時間和幅度均是連續(xù)的信號,而數(shù)字信號則是時間和幅度都為離散的信號。都為離散的信號。(3)多媒體信號在多種信號傳輸中同步控制實(shí)時性的要求高)多媒體信號在多種信號傳輸中同步控制實(shí)時性的要求高多媒體信號在多種信號傳輸中對同步控制地實(shí)時性要求很高,多媒體信號在多種信號傳輸中對同步控制地實(shí)時性要求很高,這給數(shù)據(jù)的存儲、傳輸以及加工處理帶來了巨大的壓力,也決這給數(shù)據(jù)的存儲、傳輸以及加工處理帶來了巨大的壓力,也決定了多媒體計(jì)算機(jī)必

13、需具有高速信號處理、大容量內(nèi)存、足夠定了多媒體計(jì)算機(jī)必需具有高速信號處理、大容量內(nèi)存、足夠的傳輸頻帶寬度等功能。的傳輸頻帶寬度等功能。本章內(nèi)容4.1 多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展4.2 信息與數(shù)據(jù)信息與數(shù)據(jù)4.3 數(shù)據(jù)冗余及其類型數(shù)據(jù)冗余及其類型4.4 常用數(shù)據(jù)壓縮技術(shù)常用數(shù)據(jù)壓縮技術(shù)4.5 多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹4.6 聲音壓縮編碼技術(shù)聲音壓縮編碼技術(shù)習(xí)題習(xí)題4.3.1 冗余的基本概念冗余的基本概念媒體數(shù)據(jù),尤其是圖像、音頻和視頻,其數(shù)據(jù)量非常大,但這么大的媒體數(shù)據(jù),尤其是圖像、音頻和視頻,其數(shù)據(jù)量非常大,但這么大的數(shù)據(jù)量并不完全等于

14、其所攜帶的信息量,其實(shí),表達(dá)它們所攜帶的信數(shù)據(jù)量并不完全等于其所攜帶的信息量,其實(shí),表達(dá)它們所攜帶的信息量并不需要這么大的數(shù)據(jù)量。能夠?qū)?shù)據(jù)進(jìn)行壓縮并大大減小其數(shù)息量并不需要這么大的數(shù)據(jù)量。能夠?qū)?shù)據(jù)進(jìn)行壓縮并大大減小其數(shù)據(jù)量是因?yàn)閿?shù)據(jù)存在大量的數(shù)據(jù)冗余。所謂數(shù)據(jù)冗余,就是數(shù)據(jù)量據(jù)量是因?yàn)閿?shù)據(jù)存在大量的數(shù)據(jù)冗余。所謂數(shù)據(jù)冗余,就是數(shù)據(jù)量(D)與其表達(dá)的信息量()與其表達(dá)的信息量(I)不相等的現(xiàn)象。設(shè)冗余量為)不相等的現(xiàn)象。設(shè)冗余量為 ,它們的關(guān),它們的關(guān)系可表示為:系可表示為: 如果如果du=0 , 表示數(shù)據(jù)不存在冗余,不需也不能對數(shù)據(jù)進(jìn)行壓縮。需表示數(shù)據(jù)不存在冗余,不需也不能對數(shù)據(jù)進(jìn)行壓縮。

15、需要并能夠?qū)?shù)據(jù)進(jìn)行有效壓縮的條件是要并能夠?qū)?shù)據(jù)進(jìn)行有效壓縮的條件是 du0。0duduDI(4-1)4.3.2 數(shù)據(jù)壓縮可行性數(shù)據(jù)壓縮可行性 因?yàn)橐曨l圖像或音頻信號等原始信號源存在著很大的冗余因?yàn)橐曨l圖像或音頻信號等原始信號源存在著很大的冗余度。由于人的視覺對亮度信息很敏感,而對邊緣的急劇變化不度。由于人的視覺對亮度信息很敏感,而對邊緣的急劇變化不敏感(視覺遮蓋效應(yīng)),同時聽覺也隊(duì)部分頻率的音頻信號不敏感(視覺遮蓋效應(yīng)),同時聽覺也隊(duì)部分頻率的音頻信號不敏感。因此視頻或音頻的數(shù)據(jù)壓縮后,再做解壓處理,人對恢敏感。因此視頻或音頻的數(shù)據(jù)壓縮后,再做解壓處理,人對恢復(fù)后的圖像或音頻信號仍有滿意的

16、主觀感覺,也就是說,人的復(fù)后的圖像或音頻信號仍有滿意的主觀感覺,也就是說,人的感覺能接受這種數(shù)據(jù)壓縮。感覺能接受這種數(shù)據(jù)壓縮。4.3.3數(shù)據(jù)冗余類型數(shù)據(jù)冗余類型多媒體數(shù)據(jù)在數(shù)字化后存在各種形式的數(shù)據(jù)冗余,常見的有以下幾種多媒體數(shù)據(jù)在數(shù)字化后存在各種形式的數(shù)據(jù)冗余,常見的有以下幾種類型:類型: (1)空間冗余。)空間冗余。規(guī)則物體和規(guī)則背景的表面物理特性都具有相關(guān)性,規(guī)則物體和規(guī)則背景的表面物理特性都具有相關(guān)性,數(shù)字化后表現(xiàn)為數(shù)字冗余。例如數(shù)字化后表現(xiàn)為數(shù)字冗余。例如: 當(dāng)拍攝桂林風(fēng)景的時候,就會發(fā)現(xiàn),當(dāng)拍攝桂林風(fēng)景的時候,就會發(fā)現(xiàn),風(fēng)景畫面的不少面積的顏色是完全相同的,也就是說,存在許多完全風(fēng)

17、景畫面的不少面積的顏色是完全相同的,也就是說,存在許多完全一樣的相鄰信息,完全一樣的數(shù)據(jù)當(dāng)然可以壓縮,而十分接近的數(shù)據(jù)一樣的相鄰信息,完全一樣的數(shù)據(jù)當(dāng)然可以壓縮,而十分接近的數(shù)據(jù)也可以壓縮,因?yàn)榛謴?fù)后人亦分辨不出它與原圖有什么區(qū)別,這種壓也可以壓縮,因?yàn)榛謴?fù)后人亦分辨不出它與原圖有什么區(qū)別,這種壓縮就是對空間冗余的壓縮。壓縮前后的對比如圖縮就是對空間冗余的壓縮。壓縮前后的對比如圖4-1所示。所示。壓縮前:壓縮前:3.2MB壓縮后:壓縮后:91.8KB圖圖 4-1 壓縮前后對比圖壓縮前后對比圖 (2)時間冗余。)時間冗余。序列圖像(如電視圖像和運(yùn)動圖像)和語音數(shù)據(jù)的前序列圖像(如電視圖像和運(yùn)動圖

18、像)和語音數(shù)據(jù)的前后有著很強(qiáng)的相關(guān)性,經(jīng)常包含著冗余。在播出該序列圖像時,時間后有著很強(qiáng)的相關(guān)性,經(jīng)常包含著冗余。在播出該序列圖像時,時間發(fā)生了推移,但若干幅畫面的同一部位沒有變化,變化的只是其中的發(fā)生了推移,但若干幅畫面的同一部位沒有變化,變化的只是其中的某些地方,這就形成了時間冗余。例如,有一個飛鳥在海上飛翔的動某些地方,這就形成了時間冗余。例如,有一個飛鳥在海上飛翔的動畫,播出時間為每秒鐘畫,播出時間為每秒鐘25幀,在第幀,在第1幀,第幀,第5幀,第幀,第10幀,第幀,第20幀,第幀,第30幀的畫面上,大海,山石等背景毫無變化,可見前后幀有很大的相幀的畫面上,大海,山石等背景毫無變化,可

19、見前后幀有很大的相關(guān)性,如圖關(guān)性,如圖4-2所示。所示。第第1幀幀第第5幀幀第第10幀幀第第20幀幀第第30幀幀圖圖4-2 相鄰幀圖像之間的相關(guān)性相鄰幀圖像之間的相關(guān)性 (3)統(tǒng)計(jì)冗余。)統(tǒng)計(jì)冗余??臻g冗余和時間冗余是把圖像信號看作概率信號時所空間冗余和時間冗余是把圖像信號看作概率信號時所反應(yīng)出的統(tǒng)計(jì)特性,因此,這兩種冗余也被稱為統(tǒng)計(jì)冗余。反應(yīng)出的統(tǒng)計(jì)特性,因此,這兩種冗余也被稱為統(tǒng)計(jì)冗余。 (4)信息熵冗余。)信息熵冗余。信息熵冗余也叫信息熵冗余也叫“編碼冗余編碼冗余”。所謂信息熵,是指。所謂信息熵,是指對一團(tuán)數(shù)據(jù)所攜帶的信息量,信息熵冗余則在一團(tuán)數(shù)據(jù)的內(nèi)部產(chǎn)生。對一團(tuán)數(shù)據(jù)所攜帶的信息量,信

20、息熵冗余則在一團(tuán)數(shù)據(jù)的內(nèi)部產(chǎn)生。信息量是指從信息量是指從 個相等的可能事件中選出一個事件所需要的信息度量和個相等的可能事件中選出一個事件所需要的信息度量和含量,即在含量,即在 個事件中辨識特定的一個事件的過程中需要提問個事件中辨識特定的一個事件的過程中需要提問“是或否是或否”的次數(shù)。將信源所有可能事件的信息量進(jìn)行平均,即為信息的的次數(shù)。將信源所有可能事件的信息量進(jìn)行平均,即為信息的“熵熵”(entropy),熵是平均信息量。信息熵可表示為:),熵是平均信息量。信息熵可表示為:)(log)(210ikiixpxpE(4-2) 式中,式中, 為信息熵,為信息熵, 為數(shù)據(jù)組中數(shù)據(jù)的種類或碼元數(shù),為數(shù)

21、據(jù)組中數(shù)據(jù)的種類或碼元數(shù), 為碼元為碼元 發(fā)生的發(fā)生的概率。概率。 一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼的二進(jìn)制位(一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼的二進(jìn)制位(bit)數(shù)(即編)數(shù)(即編碼長度)與該碼元出現(xiàn)的概率的乘積之和,即碼長度)與該碼元出現(xiàn)的概率的乘積之和,即式中,式中, 為數(shù)據(jù)量,為數(shù)據(jù)量, 和和 同上,同上, 為分配給碼元為分配給碼元 的比特?cái)?shù)。的比特?cái)?shù)。 若要求不存在數(shù)據(jù)冗余,即冗余量若要求不存在數(shù)據(jù)冗余,即冗余量 , 則需有則需有)()(10ikiixbxpD(4-3))(log)(2iixpxb(4-4) 由于實(shí)際中很難預(yù)估出由于實(shí)際中很難預(yù)估出 ,因此,為處理上簡單,一般把所有碼

22、元,因此,為處理上簡單,一般把所有碼元記錄成相同的二進(jìn)制位數(shù)記錄成相同的二進(jìn)制位數(shù) 。這樣所得的。這樣所得的 必然大于必然大于 ,即,即 。這種因碼元。這種因碼元編碼長度的不經(jīng)濟(jì)而引起的數(shù)據(jù)冗余稱做熵冗余,又叫編碼長度的不經(jīng)濟(jì)而引起的數(shù)據(jù)冗余稱做熵冗余,又叫編碼冗余編碼冗余。 (5)結(jié)構(gòu)冗余。)結(jié)構(gòu)冗余。數(shù)字化圖像中物體表面紋理等結(jié)構(gòu)往往存在著數(shù)字化圖像中物體表面紋理等結(jié)構(gòu)往往存在著數(shù)據(jù)冗余,這種冗余叫結(jié)構(gòu)冗余。當(dāng)一幅圖像中有很強(qiáng)的結(jié)構(gòu)數(shù)據(jù)冗余,這種冗余叫結(jié)構(gòu)冗余。當(dāng)一幅圖像中有很強(qiáng)的結(jié)構(gòu)特性,如布紋和草席圖像等,其紋理很規(guī)范清晰,于是它們在特性,如布紋和草席圖像等,其紋理很規(guī)范清晰,于是它們

23、在結(jié)構(gòu)上存在著極大的相似性,也就存在著較強(qiáng)的結(jié)構(gòu)冗余。結(jié)構(gòu)上存在著極大的相似性,也就存在著較強(qiáng)的結(jié)構(gòu)冗余。 (6)知識冗余。)知識冗余。由圖像的記錄方式與人對圖像的知識差異而產(chǎn)由圖像的記錄方式與人對圖像的知識差異而產(chǎn)生的冗余。人對許多圖像的理解與某些基礎(chǔ)知識有很大的相關(guān)生的冗余。人對許多圖像的理解與某些基礎(chǔ)知識有很大的相關(guān)性。許多規(guī)律性的結(jié)構(gòu)人可以由先驗(yàn)知識和背景知識得到。而性。許多規(guī)律性的結(jié)構(gòu)人可以由先驗(yàn)知識和背景知識得到。而計(jì)算機(jī)存儲圖像時還得把一個個像素信息存入,這就形成冗余。計(jì)算機(jī)存儲圖像時還得把一個個像素信息存入,這就形成冗余。 (7)視覺冗余。)視覺冗余。人類的視覺系統(tǒng)對于圖像場的

24、注意是非均勻和人類的視覺系統(tǒng)對于圖像場的注意是非均勻和非線性的,并不是對圖像中的任何變化都能感知,而在實(shí)際圖非線性的,并不是對圖像中的任何變化都能感知,而在實(shí)際圖像中存在大量的用于描述人類的視覺系統(tǒng)不能察覺的細(xì)節(jié)變化像中存在大量的用于描述人類的視覺系統(tǒng)不能察覺的細(xì)節(jié)變化的數(shù)據(jù)。事實(shí)上,人類的視覺系統(tǒng)的一般分辨能力為的數(shù)據(jù)。事實(shí)上,人類的視覺系統(tǒng)的一般分辨能力為106灰度級,灰度級,而一般圖像的量化采用的是而一般圖像的量化采用的是108灰度級。這種從人類視覺系統(tǒng)的灰度級。這種從人類視覺系統(tǒng)的分辨能力上看,圖像數(shù)據(jù)中存在的數(shù)據(jù)冗余,叫做視覺冗余。分辨能力上看,圖像數(shù)據(jù)中存在的數(shù)據(jù)冗余,叫做視覺冗余

25、。 (8)其它冗余。)其它冗余。除了前面所述的幾種數(shù)據(jù)冗余以外,由于圖像除了前面所述的幾種數(shù)據(jù)冗余以外,由于圖像空間的非定常特性而產(chǎn)生的冗余,以及其它種類的冗余,均屬空間的非定常特性而產(chǎn)生的冗余,以及其它種類的冗余,均屬于其它冗余之列。于其它冗余之列。本章內(nèi)容4.1 多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展4.2 信息與數(shù)據(jù)信息與數(shù)據(jù)4.3 數(shù)據(jù)冗余及其類型數(shù)據(jù)冗余及其類型4.4 常用數(shù)據(jù)壓縮技術(shù)常用數(shù)據(jù)壓縮技術(shù)4.5 多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹4.6 聲音壓縮編碼技術(shù)聲音壓縮編碼技術(shù)習(xí)題習(xí)題4.4 常用數(shù)據(jù)壓縮技術(shù)常用數(shù)據(jù)壓縮技術(shù) 數(shù)據(jù)壓縮包括兩個相

26、反的過程數(shù)據(jù)壓縮包括兩個相反的過程,其一其一是數(shù)據(jù)編碼,即對原是數(shù)據(jù)編碼,即對原始數(shù)據(jù)進(jìn)行編碼,形成壓縮編碼,以減小其數(shù)據(jù)量后進(jìn)行傳送始數(shù)據(jù)進(jìn)行編碼,形成壓縮編碼,以減小其數(shù)據(jù)量后進(jìn)行傳送和存儲;和存儲;另一個另一個是數(shù)據(jù)解碼,即將解碼數(shù)據(jù)還原成原始的表示是數(shù)據(jù)解碼,即將解碼數(shù)據(jù)還原成原始的表示形式。上述兩個過程是互逆的。形式。上述兩個過程是互逆的。4.4.1 根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致進(jìn)行分類否完全一致進(jìn)行分類(1)無損(失真)壓縮編碼:)無損(失真)壓縮編碼:無損壓縮是可逆的編碼方法,編碼數(shù)據(jù)無損壓縮是可逆的編碼方法,編碼數(shù)據(jù)解碼后的數(shù)據(jù)與編碼前的原始數(shù)

27、據(jù)完全相同,沒有任何偏差和失真。解碼后的數(shù)據(jù)與編碼前的原始數(shù)據(jù)完全相同,沒有任何偏差和失真。此類壓縮編碼的壓縮比大約在此類壓縮編碼的壓縮比大約在2:15:1之間。如之間。如Huffman編碼、算術(shù)編碼、算術(shù)編碼、行程長度編碼和詞典編碼等。編碼、行程長度編碼和詞典編碼等。(2)有損(失真)壓縮編碼:)有損(失真)壓縮編碼:有失真壓縮是不可逆編碼方法,編碼有失真壓縮是不可逆編碼方法,編碼數(shù)據(jù)解碼后的數(shù)據(jù)與編碼前的原始數(shù)據(jù)有一定偏差和失真,但視覺效數(shù)據(jù)解碼后的數(shù)據(jù)與編碼前的原始數(shù)據(jù)有一定偏差和失真,但視覺效果一般可被接受。壓縮比可以從幾倍到上百倍。如果一般可被接受。壓縮比可以從幾倍到上百倍。如PCM

28、(脈沖編碼調(diào)(脈沖編碼調(diào)制)、預(yù)測編碼、變換編碼(主要是離散余弦變換方法)、插值和外制)、預(yù)測編碼、變換編碼(主要是離散余弦變換方法)、插值和外推法(空域亞采樣、時域亞采樣、自適應(yīng))等等。推法(空域亞采樣、時域亞采樣、自適應(yīng))等等。圖圖4-3展示了這種數(shù)據(jù)壓縮方法的分類。展示了這種數(shù)據(jù)壓縮方法的分類。矢量量化矢量量化標(biāo)量量化標(biāo)量量化濾波濾波子采樣子采樣比特分配比特分配量化量化變換編碼變換編碼子帶編碼子帶編碼子波變換子波變換混合編碼混合編碼數(shù)據(jù)壓縮技術(shù)數(shù)據(jù)壓縮技術(shù)無損壓縮無損壓縮哈夫曼編碼哈夫曼編碼行程編碼行程編碼預(yù)測編碼預(yù)測編碼算術(shù)編碼算術(shù)編碼詞典編碼詞典編碼運(yùn)動補(bǔ)償運(yùn)動補(bǔ)償面向頻域面向頻域面

29、向重要性面向重要性有損壓縮有損壓縮H.261MPEGJPEG圖圖 4-3 壓縮方法分類壓縮方法分類4.4.2 根據(jù)數(shù)據(jù)壓縮的原理進(jìn)行劃分根據(jù)數(shù)據(jù)壓縮的原理進(jìn)行劃分 1、預(yù)測編碼、預(yù)測編碼 它是利用空間中相鄰數(shù)據(jù)的相關(guān)性它是利用空間中相鄰數(shù)據(jù)的相關(guān)性 , 利用過去和現(xiàn)在出現(xiàn)過的點(diǎn)的數(shù)利用過去和現(xiàn)在出現(xiàn)過的點(diǎn)的數(shù)據(jù)情況來預(yù)測未來點(diǎn)的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制據(jù)情況來預(yù)測未來點(diǎn)的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制 (DPCM) 和自適應(yīng)差分脈沖編碼調(diào)制和自適應(yīng)差分脈沖編碼調(diào)制 (ADPCM) 。 2、變換編碼、變換編碼該方法將圖像光強(qiáng)矩陣該方法將圖像光強(qiáng)矩陣 ( 時域信號時域信號 ) 變

30、換到頻域空間上進(jìn)行處理。變換到頻域空間上進(jìn)行處理。 在在時域空間上具有強(qiáng)相關(guān)的信號時域空間上具有強(qiáng)相關(guān)的信號 , 反映在頻域上是某些特定的區(qū)域內(nèi)能反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一起量常常被集中在一起 , 我們只需將主要注意力放在相對小的區(qū)域上我們只需將主要注意力放在相對小的區(qū)域上 , 從而實(shí)現(xiàn)壓縮。一般采用正交變換從而實(shí)現(xiàn)壓縮。一般采用正交變換 , 如離散余弦變換如離散余弦變換 (DCT) 、離散傅、離散傅立葉變換立葉變換 (DFT) 、Walsh-Hadamard 變換變換 (WHT)和小波變換和小波變換 (WT), 來實(shí)現(xiàn)壓縮算法。來實(shí)現(xiàn)壓縮算法。 3、量化與向量量化編碼、

31、量化與向量量化編碼對模擬信號進(jìn)行數(shù)字化時對模擬信號進(jìn)行數(shù)字化時 , 要經(jīng)歷一個量化的過程。要經(jīng)歷一個量化的過程。 為了使整體量化為了使整體量化失真最小失真最小 , 就必須依照統(tǒng)計(jì)的概率分布設(shè)計(jì)最優(yōu)的量化器。最優(yōu)量化就必須依照統(tǒng)計(jì)的概率分布設(shè)計(jì)最優(yōu)的量化器。最優(yōu)量化器一般是非線性的器一般是非線性的 , 已知最優(yōu)量化器是已知最優(yōu)量化器是 Max 量化器。我們對像元點(diǎn)進(jìn)量化器。我們對像元點(diǎn)進(jìn)行量化時行量化時 , 除了每次僅量化一個點(diǎn)的做法外除了每次僅量化一個點(diǎn)的做法外 , 也可以考慮一次量化多也可以考慮一次量化多個點(diǎn)的做法個點(diǎn)的做法 , 這種方法稱為向量量化。例如我們每次量化相鄰的兩個這種方法稱為向

32、量量化。例如我們每次量化相鄰的兩個點(diǎn)點(diǎn) , 將兩個點(diǎn)用一個量化碼字表示。向量量化的數(shù)據(jù)壓縮能力實(shí)際上將兩個點(diǎn)用一個量化碼字表示。向量量化的數(shù)據(jù)壓縮能力實(shí)際上與預(yù)測方法相近。與預(yù)測方法相近。 4、統(tǒng)計(jì)編碼、統(tǒng)計(jì)編碼(信息熵編碼信息熵編碼)這是根據(jù)信息熵原理這是根據(jù)信息熵原理 , 讓出現(xiàn)概率大的符號用短的碼字表達(dá)讓出現(xiàn)概率大的符號用短的碼字表達(dá) , 反之用反之用長的碼字表示。最常見的方法如長的碼字表示。最常見的方法如 Huffman 編碼、編碼、Shannon 編碼以及編碼以及算術(shù)編碼。算術(shù)編碼。 5、子帶、子帶 (subband) 編碼編碼將圖像數(shù)據(jù)變換到頻域后將圖像數(shù)據(jù)變換到頻域后 , 按頻域

33、分帶按頻域分帶 , 然后用不同的量化器進(jìn)行量然后用不同的量化器進(jìn)行量化化 , 從而達(dá)到最優(yōu)的組從而達(dá)到最優(yōu)的組合?;蛘叻植綕u近編嗎合?;蛘叻植綕u近編嗎 , 在初始時在初始時 , 對某一頻帶的對某一頻帶的 信號進(jìn)行解碼信號進(jìn)行解碼 , 然然后逐漸擴(kuò)展到所有頻帶。隨著解碼數(shù)據(jù)的增加后逐漸擴(kuò)展到所有頻帶。隨著解碼數(shù)據(jù)的增加 , 解碼圖像也逐漸變得解碼圖像也逐漸變得清晰。清晰。 6、模型編碼、模型編碼編碼時首先將圖像中的邊界、輪廓、紋理等結(jié)構(gòu)特征找出來編碼時首先將圖像中的邊界、輪廓、紋理等結(jié)構(gòu)特征找出來 , 然后保然后保存這些參數(shù)信息。解碼時根據(jù)結(jié)存這些參數(shù)信息。解碼時根據(jù)結(jié)構(gòu)和參數(shù)信息進(jìn)行合成構(gòu)和參

34、數(shù)信息進(jìn)行合成 , 恢復(fù)原圖像。具體方法有輪廓編碼、域分割恢復(fù)原圖像。具體方法有輪廓編碼、域分割編碼、分析合成編碼、識別合成編碼編碼、分析合成編碼、識別合成編碼基于知識的編碼和分形編碼等?;谥R的編碼和分形編碼等。本章內(nèi)容4.1 多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展多媒體數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展4.2 信息與數(shù)據(jù)信息與數(shù)據(jù)4.3 數(shù)據(jù)冗余及其類型數(shù)據(jù)冗余及其類型4.4 常用數(shù)據(jù)壓縮技術(shù)常用數(shù)據(jù)壓縮技術(shù)4.5 多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹4.6 聲音壓縮編碼技術(shù)聲音壓縮編碼技術(shù)習(xí)題習(xí)題 4.5多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹多媒體數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)介紹 多媒體計(jì)算機(jī)的關(guān)鍵問題是計(jì)算機(jī)實(shí)時

35、綜合處理聲、文、多媒體計(jì)算機(jī)的關(guān)鍵問題是計(jì)算機(jī)實(shí)時綜合處理聲、文、圖等信息。圖等信息。數(shù)字化的圖像(靜態(tài)圖像、視頻圖像)和聲音信號數(shù)字化的圖像(靜態(tài)圖像、視頻圖像)和聲音信號數(shù)據(jù)量是非常大的,要使實(shí)時處理和傳送這些數(shù)據(jù)成為可能,數(shù)據(jù)量是非常大的,要使實(shí)時處理和傳送這些數(shù)據(jù)成為可能,必須對這些多媒體數(shù)據(jù)進(jìn)行編碼或壓縮。從必須對這些多媒體數(shù)據(jù)進(jìn)行編碼或壓縮。從80年代開始,一些年代開始,一些國際標(biāo)準(zhǔn)組織協(xié)同工作,已建立起三個壓縮編碼標(biāo)準(zhǔn)架,即聯(lián)國際標(biāo)準(zhǔn)組織協(xié)同工作,已建立起三個壓縮編碼標(biāo)準(zhǔn)架,即聯(lián)合圖片專家組(合圖片專家組(Joint Photographic Experts Group)制定的)

36、制定的JPEG標(biāo)準(zhǔn),動態(tài)圖像專家組(標(biāo)準(zhǔn),動態(tài)圖像專家組(Moving Picture Experts Group)制定的制定的MPEG標(biāo)準(zhǔn)以及國際標(biāo)準(zhǔn)化組織標(biāo)準(zhǔn)以及國際標(biāo)準(zhǔn)化組織ISO和國際電話電報(bào)咨詢和國際電話電報(bào)咨詢委員會委員會CCITT制定的制定的ISO H.261或或CCITT P64標(biāo)準(zhǔn)。標(biāo)準(zhǔn)。4.5.1 靜態(tài)圖像壓縮編碼標(biāo)準(zhǔn)靜態(tài)圖像壓縮編碼標(biāo)準(zhǔn)JPEG 靜態(tài)圖像壓縮編碼標(biāo)準(zhǔn)靜態(tài)圖像壓縮編碼標(biāo)準(zhǔn)JPEG也叫多灰度連續(xù)色調(diào)靜態(tài)圖像也叫多灰度連續(xù)色調(diào)靜態(tài)圖像壓縮編碼是由壓縮編碼是由ISO聯(lián)合圖片專家組為單幀彩色圖像的壓縮編碼聯(lián)合圖片專家組為單幀彩色圖像的壓縮編碼而制定的標(biāo)準(zhǔn),是適用于彩

37、色和單色多灰度或連續(xù)色彩靜止數(shù)而制定的標(biāo)準(zhǔn),是適用于彩色和單色多灰度或連續(xù)色彩靜止數(shù)字圖像的壓縮標(biāo)注。它包括無損壓縮和基于離散余弦變換和字圖像的壓縮標(biāo)注。它包括無損壓縮和基于離散余弦變換和Huffman編碼的有損壓縮兩個部分。圖像尺寸可在編碼的有損壓縮兩個部分。圖像尺寸可在165535行行幀,幀,165535像素行的范圍內(nèi)。像素行的范圍內(nèi)。JPEG標(biāo)準(zhǔn)是一個適用范圍標(biāo)準(zhǔn)是一個適用范圍廣泛的通用標(biāo)準(zhǔn),它不僅適于靜圖像的壓縮,電視圖像序列的廣泛的通用標(biāo)準(zhǔn),它不僅適于靜圖像的壓縮,電視圖像序列的幀內(nèi)圖像的壓縮編碼,也常采用幀內(nèi)圖像的壓縮編碼,也常采用JPEG壓縮標(biāo)準(zhǔn)。壓縮標(biāo)準(zhǔn)。(1)JPEG算法壓縮

38、過程:算法壓縮過程:88塊原始數(shù)據(jù)FDCT正變換量化器熵編碼器表說明表說明編碼器(2)JPEG算法解壓縮過程:算法解壓縮過程:熵解碼器逆量化器IDCT逆變換恢復(fù)數(shù)據(jù)壓縮數(shù)據(jù)88塊表說明表說明解碼器(3)JEPG算法主要計(jì)算步驟算法主要計(jì)算步驟 DCT變換變換(離散余弦變換離散余弦變換): 在編碼過程中,源圖像在輸入到編碼器前,被分割成一系列在編碼過程中,源圖像在輸入到編碼器前,被分割成一系列順序排列的由順序排列的由88像點(diǎn)構(gòu)成的數(shù)據(jù)塊,同時把作為原始采樣數(shù)據(jù)的像點(diǎn)構(gòu)成的數(shù)據(jù)塊,同時把作為原始采樣數(shù)據(jù)的無符號整數(shù)要經(jīng)過電平移位轉(zhuǎn)換為有符號整數(shù)。無符號整數(shù)要經(jīng)過電平移位轉(zhuǎn)換為有符號整數(shù)。 對每一個

39、子塊,對每一個子塊,進(jìn)行進(jìn)行DCT變換,得到變換,得到DCT系數(shù)矩陣。系數(shù)矩陣。DCT變換,即離散余弦變化。變換,即離散余弦變化。DCT(x,y)= f(像素(像素(x,y)。)。 經(jīng)過經(jīng)過DCT變換后就得到頻域的變換后就得到頻域的64個離散余弦變換系數(shù),然后,要對這個離散余弦變換系數(shù),然后,要對這64個系數(shù)進(jìn)行量化,量化個系數(shù)進(jìn)行量化,量化是根據(jù)是根據(jù)“表說明表說明”也就是量化表進(jìn)行的。也就是量化表進(jìn)行的。 量化處理量化處理 量化實(shí)際上是試圖確定什么信息可以安全地消去,而沒有任量化實(shí)際上是試圖確定什么信息可以安全地消去,而沒有任何明顯的視覺保真度損失,是一種降低整數(shù)精度的過程,因此就減何明顯

40、的視覺保真度損失,是一種降低整數(shù)精度的過程,因此就減少了存儲整數(shù)所需的位數(shù)。少了存儲整數(shù)所需的位數(shù)。 量化處理是多到一的映射,是造成量化處理是多到一的映射,是造成DCT編解碼信息損失的主編解碼信息損失的主要原因。要原因。JPEG在在JPEG標(biāo)準(zhǔn)中采用線性均勻量化器。標(biāo)準(zhǔn)中采用線性均勻量化器。 系數(shù)的編碼和系數(shù)的編碼和 系數(shù)的行程編碼系數(shù)的行程編碼 量化后得到的仍是量化后得到的仍是64個系數(shù),量個系數(shù),量化并沒有改變系數(shù)的性質(zhì)?;]有改變系數(shù)的性質(zhì)。DCT變換變換是將數(shù)據(jù)域從時域變換到頻域,在頻是將數(shù)據(jù)域從時域變換到頻域,在頻域平面上變換系數(shù)是二維頻域變量域平面上變換系數(shù)是二維頻域變量 和和

41、的函數(shù)。對應(yīng)于的函數(shù)。對應(yīng)于 =0, =0的系數(shù)稱做的系數(shù)稱做直流分量,即直流分量,即 系數(shù)(位于系數(shù)(位于88塊的左塊的左上角),上角),88圖像塊經(jīng)過圖像塊經(jīng)過DCT變換之變換之后得到的后得到的DC直流系數(shù)有兩個特點(diǎn):一直流系數(shù)有兩個特點(diǎn):一是系數(shù)的數(shù)值比較大,二是相鄰是系數(shù)的數(shù)值比較大,二是相鄰88圖像塊的圖像塊的DC系數(shù)值變化不大,如圖系數(shù)值變化不大,如圖4-11所示。所示。 根據(jù)這個特點(diǎn),根據(jù)這個特點(diǎn),JPEG算法使用了差算法使用了差分脈沖編碼(分脈沖編碼(DPCM)技術(shù),對相鄰)技術(shù),對相鄰圖像塊之間量化圖像塊之間量化DC系數(shù)的差值系數(shù)的差值Delta進(jìn)行編碼。進(jìn)行編碼。 Delt

42、a DC(0,0)DC(0,0)k-1Blocki-1DCi-1Blocki-1DCiDIFF=DCi-1-DCi圖圖4-6 系數(shù)差分編碼系數(shù)差分編碼 其余其余63個系數(shù)稱做交流分量,即個系數(shù)稱做交流分量,即 系數(shù)。量化系數(shù)。量化AC系數(shù)的特點(diǎn)是系數(shù)的特點(diǎn)是164矢量中包含許多矢量中包含許多0系數(shù),并且許多系數(shù),并且許多0是連續(xù)的,因此使用非常簡單是連續(xù)的,因此使用非常簡單和直觀的游程長度編碼(和直觀的游程長度編碼(RLE)對它們進(jìn)行編碼。)對它們進(jìn)行編碼。JEPG使用了使用了1個字個字節(jié)的高節(jié)的高4位來表示連續(xù)位來表示連續(xù)0的個數(shù),而使用它的低的個數(shù),而使用它的低4位來表示編碼下一個位來表示

43、編碼下一個非非0系數(shù)所需要的位數(shù),跟在它后面的是量化系數(shù)所需要的位數(shù),跟在它后面的是量化AC系數(shù)的數(shù)值,如圖系數(shù)的數(shù)值,如圖4-12所示。所示。DCAC01AC07AC70AC77圖圖4-7 “Z”字形排列字形排列 熵編碼熵編碼 為了進(jìn)一步達(dá)到壓縮數(shù)據(jù)的目的,需對量化后的為了進(jìn)一步達(dá)到壓縮數(shù)據(jù)的目的,需對量化后的 系數(shù)和行系數(shù)和行程編碼后的程編碼后的 系數(shù)進(jìn)行基于統(tǒng)計(jì)特性的熵編碼。系數(shù)進(jìn)行基于統(tǒng)計(jì)特性的熵編碼。JPEG建議使用兩建議使用兩種熵編碼方法:哈夫曼(種熵編碼方法:哈夫曼(Huffman)編碼和自適應(yīng)二進(jìn)制算術(shù))編碼和自適應(yīng)二進(jìn)制算術(shù)編碼(編碼(Adaptive Binary Arit

44、hmetic Coding)。)。 在基本系統(tǒng)中,熵編碼采用可變長代碼(在基本系統(tǒng)中,熵編碼采用可變長代碼(VLC)和可變長)和可變長整數(shù)(整數(shù)(VCI)進(jìn)行。常見的變長代碼是哈夫曼代碼,用短代碼表)進(jìn)行。常見的變長代碼是哈夫曼代碼,用短代碼表示頻率出現(xiàn)的符號,用較長代碼表示偶然出現(xiàn)的符號。示頻率出現(xiàn)的符號,用較長代碼表示偶然出現(xiàn)的符號。組號系數(shù)哈夫曼碼哈夫曼表分組附加位圖圖4-8 DC系數(shù)編碼過程系數(shù)編碼過程 DC測生成的差分測生成的差分DC 系數(shù)因其高度的相關(guān)性而在數(shù)值上很系數(shù)因其高度的相關(guān)性而在數(shù)值上很小。每個小。每個D C 系數(shù)被編碼為一個系數(shù)被編碼為一個VLC和和VCI,VLC表示表

45、示DC 項(xiàng)有項(xiàng)有意義位的數(shù)量,意義位的數(shù)量,VCI表示其值本身。編碼表示其值本身。編碼VLC時,首先根據(jù)時,首先根據(jù) DC差分分組表確定差分分組表確定 有意義位的位長或組號有意義位的位長或組號 ,然后按位長或組號選,然后按位長或組號選擇擇 的的VLC表編碼,在該表編碼,在該VLC之后加一個表示差分之后加一個表示差分 系數(shù)的值系數(shù)的值(VCI)。哈夫曼編碼需要有一個哈夫曼表,用來記錄事件與其)。哈夫曼編碼需要有一個哈夫曼表,用來記錄事件與其編碼的對應(yīng)關(guān)系,有了哈夫曼表才能根據(jù)該表對事件進(jìn)行編碼編碼的對應(yīng)關(guān)系,有了哈夫曼表才能根據(jù)該表對事件進(jìn)行編碼或解碼?;蚪獯a。JPEG事先作大量統(tǒng)計(jì)形成哈夫曼表

46、,將該表固定在發(fā)事先作大量統(tǒng)計(jì)形成哈夫曼表,將該表固定在發(fā)送端和接收端,用查表法作編碼。送端和接收端,用查表法作編碼。DC 系數(shù)編碼過程如圖系數(shù)編碼過程如圖4-13所所示。示。01 2 3 4 13 14 150EOB(塊結(jié)束符)連續(xù)數(shù)0的個數(shù)1222131415ZRL(零游程)游程組號值圖圖4-9 游程編碼示意圖游程編碼示意圖 “Z”形掃描后的每一個非零形掃描后的每一個非零AC 系數(shù)都用系數(shù)都用 (二進(jìn)制)形式的一個(二進(jìn)制)形式的一個組合的組合的8位值表示,其中低位值表示,其中低4位位 表示表示“Z”形序列中非零形序列中非零 系數(shù)的大小所系數(shù)的大小所屬的分組號;高屬的分組號;高4位位AC表

47、示該系數(shù)相對前一個非零表示該系數(shù)相對前一個非零AC系數(shù)的零的個數(shù),系數(shù)的零的個數(shù),即零值游程,如圖即零值游程,如圖4-14所示。它們各占四位二進(jìn)制數(shù),兩者合為一個所示。它們各占四位二進(jìn)制數(shù),兩者合為一個字節(jié)。對字節(jié)。對0的游程采用變長方式,限制在四位二進(jìn)制數(shù)內(nèi),最大值為的游程采用變長方式,限制在四位二進(jìn)制數(shù)內(nèi),最大值為15,組號占用位和編碼前的分組一致。組號占用位和編碼前的分組一致。0游程采用游程采用4bits,這一方面是因?yàn)?,這一方面是因?yàn)?bits的游程加組號正好合成一個字節(jié),便于哈夫曼編碼;另一方面是的游程加組號正好合成一個字節(jié),便于哈夫曼編碼;另一方面是因?yàn)橐驗(yàn)椤癦”形掃描后相臨的形掃

48、描后相臨的“Z”形掃描序列是相臨的,最大固定長度形掃描序列是相臨的,最大固定長度不會超過不會超過63,且每一個,且每一個“Z”形塊內(nèi)的連續(xù)形塊內(nèi)的連續(xù)0的個數(shù)一般不超過的個數(shù)一般不超過32。基?;诖?,即主要是從用較少的比特位表示連續(xù)值的個數(shù)和便于哈夫曼編于此,即主要是從用較少的比特位表示連續(xù)值的個數(shù)和便于哈夫曼編碼的角度出發(fā),選擇這一作法。碼的角度出發(fā),選擇這一作法。AC 系數(shù)編碼過程如圖系數(shù)編碼過程如圖4-15所示。所示。附加位組號系數(shù)哈夫曼碼哈夫曼表分組“Z”形掃描游程編碼圖圖4-10 AC 系數(shù)編碼過程系數(shù)編碼過程4.5.2 運(yùn)動圖像壓縮標(biāo)準(zhǔn)運(yùn)動圖像壓縮標(biāo)準(zhǔn)MPEG 國際標(biāo)準(zhǔn)化組織國際

49、標(biāo)準(zhǔn)化組織ISO建立了一個制定有關(guān)動態(tài)圖像編碼壓縮標(biāo)準(zhǔn)建立了一個制定有關(guān)動態(tài)圖像編碼壓縮標(biāo)準(zhǔn)的組織的組織MPEG(Moving Picture Expert Group),),MPEG下設(shè)四個小下設(shè)四個小組:視頻組(組:視頻組(MPEG-Video),音頻組(),音頻組(MPEG-Audio),系統(tǒng)組),系統(tǒng)組(MPEG-System)和一致性測試組。視頻組主要研究壓縮傳輸速度)和一致性測試組。視頻組主要研究壓縮傳輸速度上限為上限為1.5Mbits/s的視頻信號,音頻組主要研究壓縮每信道的視頻信號,音頻組主要研究壓縮每信道64、128和和192Kbits/s的數(shù)字音頻信號,系統(tǒng)組則解決多道壓縮

50、視頻、音頻位流的數(shù)字音頻信號,系統(tǒng)組則解決多道壓縮視頻、音頻位流的同步和合成問題。該專家組開發(fā)的標(biāo)準(zhǔn)稱為的同步和合成問題。該專家組開發(fā)的標(biāo)準(zhǔn)稱為MPEG標(biāo)準(zhǔn),目前,已標(biāo)準(zhǔn),目前,已開發(fā)和正在開發(fā)的開發(fā)和正在開發(fā)的MPEG標(biāo)準(zhǔn)有標(biāo)準(zhǔn)有MPEG-1,MPEG-2,MPEG-4,MPEG-7,MPEG-21等,如表等,如表4-5所示所示。標(biāo)準(zhǔn)簡稱標(biāo)準(zhǔn)簡稱標(biāo)準(zhǔn)全稱標(biāo)準(zhǔn)全稱制定專家組制定專家組批準(zhǔn)時間批準(zhǔn)時間MPEG-1最高約最高約1.5Mbps數(shù)字存儲媒體的運(yùn)動圖像及數(shù)字存儲媒體的運(yùn)動圖像及伴音編碼(伴音編碼(Coding of Moving Picture and Associated Audio

51、for Digital Storage Media at up to about 1.5Mbps)標(biāo)準(zhǔn))標(biāo)準(zhǔn)運(yùn)動圖像專家運(yùn)動圖像專家組組(第(第1階段)階段)1988年開始制定,年開始制定,1992年年11月通過,作為月通過,作為ISO/IEC 11172號文件號文件MPEG-2運(yùn)動圖像及伴音編碼(運(yùn)動圖像及伴音編碼(Coding of Moving Pictures and Assodiated Audio)標(biāo)準(zhǔn)(視)標(biāo)準(zhǔn)(視頻碼率:頻碼率:410Mbps)運(yùn)動圖像專家運(yùn)動圖像專家組組(第(第2階段)階段)1990年年7月開始制定,月開始制定,1994年年11月通過,作月通過,作為為ISO/

52、IEC 13818號文件或號文件或ITU-TH.262建議建議MPEG-4視音頻對象的編碼(視音頻對象的編碼(Coding of Audio-Visual Object)標(biāo)準(zhǔn)(視頻碼率:)標(biāo)準(zhǔn)(視頻碼率:5kbps5Mbps)運(yùn)動圖像專家運(yùn)動圖像專家組組1993年年7月開始制定,月開始制定,1999年年5月通過,作為月通過,作為ISO/IEC 14496號文件號文件MPEG-7多媒體多媒體內(nèi)容描述接口(多媒體多媒體內(nèi)容描述接口(Multimedia Content Description Interface)標(biāo)準(zhǔn))標(biāo)準(zhǔn)運(yùn)動圖像專家運(yùn)動圖像專家組組1997年年7月開始制定,月開始制定,2001年

53、年12月產(chǎn)生標(biāo)準(zhǔn)月產(chǎn)生標(biāo)準(zhǔn)草案,作為草案,作為ISO/IEC 15938號文件號文件MPEG-21多媒體框架(多媒體框架(Multimedia Framework)標(biāo))標(biāo)準(zhǔn)準(zhǔn)運(yùn)動圖像專家運(yùn)動圖像專家組組1991年年10月形成多媒體框架理念,月形成多媒體框架理念,2000年年5月開始制定,原計(jì)劃月開始制定,原計(jì)劃2002年年2月完成月完成表表4-5 MPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn)1MPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn) 在設(shè)計(jì)動態(tài)圖像的編碼壓縮算法時,主要矛盾是:一方面僅靠幀在設(shè)計(jì)動態(tài)圖像的編碼壓縮算法時,主要矛盾是:一方面僅靠幀內(nèi)編碼的方法無法保證在良好的畫面質(zhì)量前提下而達(dá)到很高的壓縮比;內(nèi)編碼的方法無法保證在良好的畫面質(zhì)量

54、前提下而達(dá)到很高的壓縮比;另一方面用單一靜止的幀內(nèi)編碼方法又能最好地滿足隨機(jī)存取的要求。另一方面用單一靜止的幀內(nèi)編碼方法又能最好地滿足隨機(jī)存取的要求。為了同時滿足高壓縮比和隨機(jī)存取這兩方面的要求,為了同時滿足高壓縮比和隨機(jī)存取這兩方面的要求,MPEG推薦的標(biāo)推薦的標(biāo)準(zhǔn)化算法,必須使用幀間和幀內(nèi)編碼技術(shù)。準(zhǔn)化算法,必須使用幀間和幀內(nèi)編碼技術(shù)。MPEG標(biāo)準(zhǔn)統(tǒng)籌平衡幀內(nèi)標(biāo)準(zhǔn)統(tǒng)籌平衡幀內(nèi)編碼和幀間編碼、空間和時間冗余度、遞歸和非遞歸之間的關(guān)系。編碼和幀間編碼、空間和時間冗余度、遞歸和非遞歸之間的關(guān)系。MPEG標(biāo)準(zhǔn)采用的技術(shù)就是預(yù)測和內(nèi)插技術(shù),也就是用塊的補(bǔ)償技術(shù)標(biāo)準(zhǔn)采用的技術(shù)就是預(yù)測和內(nèi)插技術(shù),也就是

55、用塊的補(bǔ)償技術(shù)來減少時間上的冗余信息,用基于來減少時間上的冗余信息,用基于DCT變換的變換的ADCT技術(shù)來減少空間技術(shù)來減少空間上的冗余信息。運(yùn)動補(bǔ)償技術(shù)采用因果預(yù)測和非因果預(yù)測(內(nèi)插編碼)上的冗余信息。運(yùn)動補(bǔ)償技術(shù)采用因果預(yù)測和非因果預(yù)測(內(nèi)插編碼)技術(shù)。采用運(yùn)動補(bǔ)償技術(shù)對提高編碼壓縮比很有好處,尤其對于運(yùn)動技術(shù)。采用運(yùn)動補(bǔ)償技術(shù)對提高編碼壓縮比很有好處,尤其對于運(yùn)動部分只占整個畫面較小的會議電視和可視電話,可達(dá)到很高的壓縮比。部分只占整個畫面較小的會議電視和可視電話,可達(dá)到很高的壓縮比。運(yùn)動補(bǔ)償方法是跟蹤畫面內(nèi)的運(yùn)動情況對其加以補(bǔ)償之后再進(jìn)行幀間運(yùn)動補(bǔ)償方法是跟蹤畫面內(nèi)的運(yùn)動情況對其加以補(bǔ)

56、償之后再進(jìn)行幀間預(yù)測的一種方法。預(yù)測的一種方法。(1)MPEG-1視頻數(shù)據(jù)流視頻數(shù)據(jù)流MPEG將運(yùn)動圖像數(shù)據(jù)流定義成運(yùn)動圖像序列,運(yùn)動圖像序列將運(yùn)動圖像數(shù)據(jù)流定義成運(yùn)動圖像序列,運(yùn)動圖像序列是隨機(jī)訪問的單元,是隨機(jī)訪問的單元,MPEG動態(tài)圖像的數(shù)據(jù)流結(jié)構(gòu)包含表頭、動態(tài)圖像的數(shù)據(jù)流結(jié)構(gòu)包含表頭、一組或多組圖像和序列結(jié)束標(biāo)志碼。一組或多組圖像和序列結(jié)束標(biāo)志碼。MPEG還定義了塊、宏塊還定義了塊、宏塊圖像切片等,數(shù)據(jù)碼流結(jié)構(gòu)如圖圖像切片等,數(shù)據(jù)碼流結(jié)構(gòu)如圖4-11所示。所示。圖像組頭結(jié)束標(biāo)志運(yùn)動圖像序列圖像 圖像切片宏塊8像素塊8像素圖圖4-11 MPEG-1視頻數(shù)據(jù)流結(jié)構(gòu)視頻數(shù)據(jù)流結(jié)構(gòu) 運(yùn)動序列運(yùn)

57、動序列運(yùn)動序列包括一個表頭,一組或多組圖像和序列結(jié)束標(biāo)志碼。運(yùn)動序列包括一個表頭,一組或多組圖像和序列結(jié)束標(biāo)志碼。在圖像序列頭中包含了諸如圖像尺寸、圖像分辨率、幀速率、在圖像序列頭中包含了諸如圖像尺寸、圖像分辨率、幀速率、位速率、緩沖區(qū)大小等參數(shù),使得位速率、緩沖區(qū)大小等參數(shù),使得MPEG具有很大的靈活性。具有很大的靈活性。 圖像組(圖像組(GOP:Group Of Pictures)圖像組由一系列圖像和數(shù)據(jù)頭組成,可以從運(yùn)動序列中隨機(jī)存圖像組由一系列圖像和數(shù)據(jù)頭組成,可以從運(yùn)動序列中隨機(jī)存取。圖像組中每個圖像可以是取。圖像組中每個圖像可以是I-圖像、圖像、P-圖像或圖像或B-圖像,但是圖像,

58、但是其第一個圖像總為其第一個圖像總為I-圖像,它包含了一幅圖像的最基本內(nèi)容,圖像,它包含了一幅圖像的最基本內(nèi)容,其目的是給編輯提供接入點(diǎn)。其目的是給編輯提供接入點(diǎn)。 圖像圖像圖像是動態(tài)圖像序列中最原始的編碼圖像是動態(tài)圖像序列中最原始的編碼單位,對應(yīng)于視頻序列中的單個幀。單位,對應(yīng)于視頻序列中的單個幀。圖像信號由圖像信號由3部分組成:一個亮度信部分組成:一個亮度信號號 和兩個色度信號和兩個色度信號 , 。亮度信號。亮度信號 由由偶數(shù)個行和偶數(shù)個列組成,色度信偶數(shù)個行和偶數(shù)個列組成,色度信號號 ,分別取分別取 信號在水平和垂直方向的信號在水平和垂直方向的1/2。如圖如圖4-12所示,黑點(diǎn)代表色度所

59、示,黑點(diǎn)代表色度 , 的的位置,亮度位置,亮度 位置用白圈表示。位置用白圈表示。 塊塊塊是塊是MPEG編碼方案中最小的編碼單編碼方案中最小的編碼單元,一個塊由一個元,一個塊由一個88像素的亮度信像素的亮度信息或一個息或一個88像素的色度信息組成。像素的色度信息組成。一個色度只是相應(yīng)亮度塊顯示圖像大一個色度只是相應(yīng)亮度塊顯示圖像大小的小的1/4,一個塊是一個,一個塊是一個DCT變換單變換單元。元。圖圖4-12 Y與與U 、V 的位置關(guān)系的位置關(guān)系 宏塊。宏塊。宏塊是宏塊是MPEG編碼方案中的基本編碼編碼方案中的基本編碼單元,即進(jìn)行運(yùn)動補(bǔ)償?shù)幕締卧?。它由圖像單元,即進(jìn)行運(yùn)動補(bǔ)償?shù)幕締卧?。它由圖

60、像幀內(nèi)的幀內(nèi)的1616像素的亮度信息和兩個像素的亮度信息和兩個88像素的像素的色度信息(色度信息( 、 各一塊)及附加數(shù)據(jù)組成。如圖各一塊)及附加數(shù)據(jù)組成。如圖4-13所示,圖中數(shù)字標(biāo)明其中數(shù)據(jù)流的次序。所示,圖中數(shù)字標(biāo)明其中數(shù)據(jù)流的次序。附加數(shù)據(jù)包括宏塊的編號、宏塊的編碼類型、附加數(shù)據(jù)包括宏塊的編號、宏塊的編碼類型、量化參數(shù)、運(yùn)動矢量等信息。量化參數(shù)、運(yùn)動矢量等信息。 圖像切片。圖像切片。由一個或多個連續(xù)的宏塊構(gòu)成,由一個或多個連續(xù)的宏塊構(gòu)成,是是MPEG編碼方案中的基本處理單元。只有當(dāng)編碼方案中的基本處理單元。只有當(dāng)切片中的所有像素都有效時,塊和宏塊的編碼切片中的所有像素都有效時,塊和宏塊

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論