ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第1頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第2頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第3頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第4頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第5頁
已閱讀5頁,還剩113頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1多媒體技術(shù)基礎(chǔ)多媒體技術(shù)基礎(chǔ)蔡宇輝蔡宇輝湖南大學(xué)軟件學(xué)院湖南大學(xué)軟件學(xué)院rj_2第四章第四章 多媒體數(shù)據(jù)壓縮編碼技術(shù)多媒體數(shù)據(jù)壓縮編碼技術(shù)3第四章的內(nèi)容第四章的內(nèi)容1.多媒體數(shù)據(jù)壓縮編碼概述多媒體數(shù)據(jù)壓縮編碼概述重要性、可能性、分類重要性、可能性、分類2.脈沖編碼調(diào)制脈沖編碼調(diào)制PCM3.統(tǒng)計(jì)編碼:統(tǒng)計(jì)編碼:Huffman編碼、算術(shù)編碼編碼、算術(shù)編碼4.預(yù)測編碼:預(yù)測編碼:DPCM、ADPCM、幀間預(yù)測、幀間預(yù)測5.變換編碼變換編碼6.多媒體數(shù)據(jù)壓縮編碼的國際標(biāo)準(zhǔn)多媒體數(shù)據(jù)壓縮編碼的國際標(biāo)準(zhǔn)JPEG、MPEG4第一節(jié)第一節(jié) 數(shù)據(jù)壓縮編碼概述數(shù)據(jù)壓縮編碼概述1.1 多媒體數(shù)據(jù)壓縮編碼的重要性多

2、媒體數(shù)據(jù)壓縮編碼的重要性1.2 多媒體數(shù)據(jù)壓縮編碼的可能性多媒體數(shù)據(jù)壓縮編碼的可能性1.3 多媒體數(shù)據(jù)壓縮編碼的分類多媒體數(shù)據(jù)壓縮編碼的分類51.1 數(shù)據(jù)壓縮編碼的重要性數(shù)據(jù)壓縮編碼的重要性 在多媒體技術(shù)中,處理的多媒體數(shù)據(jù)都在多媒體技術(shù)中,處理的多媒體數(shù)據(jù)都應(yīng)是數(shù)字信號(hào),傳統(tǒng)的媒體信息需要進(jìn)應(yīng)是數(shù)字信號(hào),傳統(tǒng)的媒體信息需要進(jìn)行采樣和量化后方能在計(jì)算機(jī)中處理。行采樣和量化后方能在計(jì)算機(jī)中處理。ADC放大器放大器6 原始媒體信息數(shù)字化后的數(shù)據(jù)量巨大。原始媒體信息數(shù)字化后的數(shù)據(jù)量巨大。 例例1:一頁:一頁B5(180255mm)大小的文)大小的文件,以中等分辨率件,以中等分辨率300dpi、8位色

3、方式掃位色方式掃描,其數(shù)據(jù)量為描,其數(shù)據(jù)量為6.61MB。 保存一部保存一部鹿鼎記鹿鼎記 (1813頁)需要頁)需要11983.93M(650M的的CD得刻得刻19張)。張)。7 例例2:立體聲的激光唱盤,采樣頻率為:立體聲的激光唱盤,采樣頻率為44.1kHz,量化位數(shù)為,量化位數(shù)為16,則一秒鐘的音,則一秒鐘的音頻數(shù)據(jù)量就可達(dá)頻數(shù)據(jù)量就可達(dá)172KB。 650M的的CD只可存儲(chǔ)只可存儲(chǔ)1小時(shí)音樂。小時(shí)音樂。ADC8 對(duì)于視頻,數(shù)據(jù)量的問題則更加突出。對(duì)于視頻,數(shù)據(jù)量的問題則更加突出。 例例3:采用:采用PAL制式,采樣格式為制式,采樣格式為4:4:4,24位色,則一秒鐘的視頻數(shù)據(jù)量就可達(dá)位色

4、,則一秒鐘的視頻數(shù)據(jù)量就可達(dá)31.3MB。 電影電影龍騎士龍騎士(時(shí)長(時(shí)長100分鐘)需要約分鐘)需要約289張張650M的的CD存放。存放。采集卡采集卡9 由于多媒體信息的數(shù)據(jù)量十分龐大,給由于多媒體信息的數(shù)據(jù)量十分龐大,給存儲(chǔ)器的存儲(chǔ)容量、通信線路的帶寬資存儲(chǔ)器的存儲(chǔ)容量、通信線路的帶寬資源、傳輸速率以及計(jì)算機(jī)的處理速度都源、傳輸速率以及計(jì)算機(jī)的處理速度都增加了極大壓力。增加了極大壓力。 解決方法:解決方法: 從硬件設(shè)備入手:增加存儲(chǔ)器、帶寬資源;從硬件設(shè)備入手:增加存儲(chǔ)器、帶寬資源;研究新型線纜提高傳輸效率;使用快速的高研究新型線纜提高傳輸效率;使用快速的高檔計(jì)算機(jī)檔計(jì)算機(jī) 從信息內(nèi)容

5、入手:進(jìn)行數(shù)據(jù)壓縮編碼。從信息內(nèi)容入手:進(jìn)行數(shù)據(jù)壓縮編碼。根本的解決之道根本的解決之道10數(shù)據(jù)壓縮對(duì)多媒體應(yīng)用的意義數(shù)據(jù)壓縮對(duì)多媒體應(yīng)用的意義 通過數(shù)據(jù)壓縮技術(shù)可減少多媒體信息的通過數(shù)據(jù)壓縮技術(shù)可減少多媒體信息的數(shù)據(jù)量,其意義在于:數(shù)據(jù)量,其意義在于:111.2 數(shù)據(jù)壓縮編碼的可能性數(shù)據(jù)壓縮編碼的可能性 多媒體數(shù)據(jù)能否進(jìn)行壓縮?多媒體數(shù)據(jù)能否進(jìn)行壓縮? 研究表明,多媒體信息中存在大量的冗研究表明,多媒體信息中存在大量的冗余,去掉這些余,去掉這些冗余數(shù)據(jù)冗余數(shù)據(jù)便可實(shí)現(xiàn)數(shù)據(jù)的便可實(shí)現(xiàn)數(shù)據(jù)的壓縮。壓縮。12音頻中的冗余音頻中的冗余音頻中的冗余信息主要有:音頻中的冗余信息主要有:1. 時(shí)域冗余時(shí)域冗

6、余幅度的非均勻分布;樣本間的相關(guān)性;周期幅度的非均勻分布;樣本間的相關(guān)性;周期之間的相關(guān)性;基音之間的相關(guān)性;靜止系之間的相關(guān)性;基音之間的相關(guān)性;靜止系數(shù)(間隔);長時(shí)自相關(guān)函數(shù)。數(shù)(間隔);長時(shí)自相關(guān)函數(shù)。2. 頻域冗余頻域冗余非均勻的長時(shí)功率譜密度;語音特有的短時(shí)非均勻的長時(shí)功率譜密度;語音特有的短時(shí)功率譜密度。功率譜密度。3. 人耳的聽感覺分辨能力有限。人耳的聽感覺分辨能力有限。13圖像圖像/視頻中的冗余視頻中的冗余 圖像圖像/視頻信息中包含有大量的冗余,主視頻信息中包含有大量的冗余,主要有下列不同類型的冗余信息:要有下列不同類型的冗余信息: 空間冗余空間冗余 時(shí)間冗余時(shí)間冗余 結(jié)構(gòu)冗

7、余結(jié)構(gòu)冗余 知識(shí)冗余知識(shí)冗余 視覺冗余視覺冗余 圖像區(qū)域的相同性冗余圖像區(qū)域的相同性冗余 紋理的統(tǒng)計(jì)冗余紋理的統(tǒng)計(jì)冗余14a. 空間冗余空間冗余 空間冗余是靜態(tài)圖像中最主要的一種冗余。空間冗余是靜態(tài)圖像中最主要的一種冗余。 通常的圖像都描述了某個(gè)場景,其相鄰像素點(diǎn)通常的圖像都描述了某個(gè)場景,其相鄰像素點(diǎn)之間存在一定的空間連貫性。如果編碼時(shí)不考之間存在一定的空間連貫性。如果編碼時(shí)不考慮這一相關(guān)性,就會(huì)造成空間冗余。慮這一相關(guān)性,就會(huì)造成空間冗余。左邊的圖像顯示了一個(gè)規(guī)則左邊的圖像顯示了一個(gè)規(guī)則物體,其大量像素點(diǎn)的亮度、物體,其大量像素點(diǎn)的亮度、飽和度、色調(diào)等參數(shù)都一樣。飽和度、色調(diào)等參數(shù)都一樣。

8、 15b. 時(shí)間冗余時(shí)間冗余 時(shí)間冗余是視頻中常見的一種冗余。時(shí)間冗余是視頻中常見的一種冗余。 序列圖像中,相鄰幀往往包含有相同的背景和序列圖像中,相鄰幀往往包含有相同的背景和運(yùn)動(dòng)物體,只是運(yùn)動(dòng)物體的位置有所變化,因運(yùn)動(dòng)物體,只是運(yùn)動(dòng)物體的位置有所變化,因此相鄰兩幀的數(shù)據(jù)差別很小,具有時(shí)間上的連此相鄰兩幀的數(shù)據(jù)差別很小,具有時(shí)間上的連貫性。如果編碼時(shí)不考慮這一相關(guān)性,就會(huì)造貫性。如果編碼時(shí)不考慮這一相關(guān)性,就會(huì)造成時(shí)間冗余。成時(shí)間冗余。16c. 結(jié)構(gòu)冗余結(jié)構(gòu)冗余 有些圖像中有規(guī)則紋理,其像素值存在有些圖像中有規(guī)則紋理,其像素值存在明顯的分布模式,明顯的分布模式, 只要知道分布模式,便可通過某種

9、方法只要知道分布模式,便可通過某種方法生成圖像,這種數(shù)據(jù)冗余即結(jié)構(gòu)冗余。生成圖像,這種數(shù)據(jù)冗余即結(jié)構(gòu)冗余。規(guī)則的紋理圖像規(guī)則的紋理圖像17d. 知識(shí)冗余知識(shí)冗余 對(duì)圖像的理解有時(shí)與某些知識(shí)有相當(dāng)大的相關(guān)對(duì)圖像的理解有時(shí)與某些知識(shí)有相當(dāng)大的相關(guān)性,例如人臉的圖像就具有同樣的五官位置。性,例如人臉的圖像就具有同樣的五官位置。 可以根據(jù)已有的知識(shí)構(gòu)造基本模型,并創(chuàng)建特可以根據(jù)已有的知識(shí)構(gòu)造基本模型,并創(chuàng)建特征圖像庫,則只需提供少量的特征參數(shù)信息便征圖像庫,則只需提供少量的特征參數(shù)信息便可生成圖像,這種數(shù)據(jù)冗余即知識(shí)冗余??缮蓤D像,這種數(shù)據(jù)冗余即知識(shí)冗余。18e. 視覺冗余視覺冗余 視覺冗余是針對(duì)人

10、眼的視覺特性而言的。視覺冗余是針對(duì)人眼的視覺特性而言的。 人對(duì)圖像的敏感性是非均勻、非線性的,而一人對(duì)圖像的敏感性是非均勻、非線性的,而一般的編碼卻是線性方式,因此存在視覺冗余。般的編碼卻是線性方式,因此存在視覺冗余。 視覺系統(tǒng)對(duì)亮度比對(duì)色度敏感。視覺系統(tǒng)對(duì)亮度比對(duì)色度敏感。 視覺系統(tǒng)對(duì)低頻信號(hào)比對(duì)高頻信號(hào)敏感。視覺系統(tǒng)對(duì)低頻信號(hào)比對(duì)高頻信號(hào)敏感。 視覺系統(tǒng)對(duì)靜止圖像比對(duì)運(yùn)動(dòng)圖像敏感。視覺系統(tǒng)對(duì)靜止圖像比對(duì)運(yùn)動(dòng)圖像敏感。 視覺系統(tǒng)對(duì)水平、垂直線條比對(duì)斜線條敏感。視覺系統(tǒng)對(duì)水平、垂直線條比對(duì)斜線條敏感。 隨著亮度的增加,視覺系統(tǒng)對(duì)量化誤差的敏感度降隨著亮度的增加,視覺系統(tǒng)對(duì)量化誤差的敏感度降低。

11、(高光區(qū)可用較少的量化位數(shù))低。(高光區(qū)可用較少的量化位數(shù)) 視覺系統(tǒng)把圖像的邊緣和非邊緣區(qū)域分開處理。視覺系統(tǒng)把圖像的邊緣和非邊緣區(qū)域分開處理。 視覺系統(tǒng)總是把視網(wǎng)膜上的圖像分解成若干個(gè)空間視覺系統(tǒng)總是把視網(wǎng)膜上的圖像分解成若干個(gè)空間有向的頻率通道后,再做進(jìn)一步處理。有向的頻率通道后,再做進(jìn)一步處理。19f. 圖像區(qū)域的相同性冗余圖像區(qū)域的相同性冗余 有的圖像存在一些相同或相近的區(qū)域,有的圖像存在一些相同或相近的區(qū)域,從而產(chǎn)生數(shù)據(jù)的重復(fù)性存儲(chǔ),這就是圖從而產(chǎn)生數(shù)據(jù)的重復(fù)性存儲(chǔ),這就是圖像區(qū)域的相同性冗余。像區(qū)域的相同性冗余。 可以只記錄一個(gè)區(qū)域中各個(gè)像素的值,可以只記錄一個(gè)區(qū)域中各個(gè)像素的值

12、,與其相同或相近的區(qū)域則不必記錄。與其相同或相近的區(qū)域則不必記錄。 向量量化方法就是針對(duì)這種冗余進(jìn)行數(shù)向量量化方法就是針對(duì)這種冗余進(jìn)行數(shù)據(jù)壓縮的。據(jù)壓縮的。20g. 紋理的統(tǒng)計(jì)冗余紋理的統(tǒng)計(jì)冗余 有些紋理并不嚴(yán)格服從某一分布規(guī)律,有些紋理并不嚴(yán)格服從某一分布規(guī)律,但它在統(tǒng)計(jì)意義上又符合該規(guī)律,這種但它在統(tǒng)計(jì)意義上又符合該規(guī)律,這種數(shù)據(jù)冗余即紋理的統(tǒng)計(jì)冗余。數(shù)據(jù)冗余即紋理的統(tǒng)計(jì)冗余??兹赣鹈目兹赣鹈募y理分布紋理分布211.3 數(shù)據(jù)壓縮編碼的分類數(shù)據(jù)壓縮編碼的分類22多媒體數(shù)據(jù)壓縮編碼方法有很多種,根多媒體數(shù)據(jù)壓縮編碼方法有很多種,根據(jù)不同的依據(jù)可產(chǎn)生不同的分類:據(jù)不同的依據(jù)可產(chǎn)生不同的分類:

13、按照編碼算法的原理:分成脈沖編碼調(diào)制、按照編碼算法的原理:分成脈沖編碼調(diào)制、預(yù)測編碼、變換編碼、量化與向量量化編預(yù)測編碼、變換編碼、量化與向量量化編碼、統(tǒng)計(jì)編碼、子帶編碼、結(jié)構(gòu)編碼、模碼、統(tǒng)計(jì)編碼、子帶編碼、結(jié)構(gòu)編碼、模型編碼、混合編碼等等;型編碼、混合編碼等等;根據(jù)質(zhì)量有無失真:分成有損失編碼和無根據(jù)質(zhì)量有無失真:分成有損失編碼和無損失編碼;損失編碼;按照其作用域在空間或頻率上:分成空間按照其作用域在空間或頻率上:分成空間方法、變換方法和混合方法;方法、變換方法和混合方法;根據(jù)是否自適應(yīng):分成自適應(yīng)性編碼和非根據(jù)是否自適應(yīng):分成自適應(yīng)性編碼和非適應(yīng)性編碼。適應(yīng)性編碼。23無損編碼和有損編碼無

14、損編碼和有損編碼 實(shí)際上,信息進(jìn)行數(shù)字化時(shí),量化誤差是不可實(shí)際上,信息進(jìn)行數(shù)字化時(shí),量化誤差是不可避免的。此處的避免的。此處的“無損無損” 和和“有損有損”是針對(duì)編是針對(duì)編碼過程而言的。碼過程而言的。 無損編碼:也稱冗余壓縮法。將編碼后的數(shù)據(jù)進(jìn)行無損編碼:也稱冗余壓縮法。將編碼后的數(shù)據(jù)進(jìn)行解碼,所得數(shù)據(jù)和編碼前的原始數(shù)據(jù)嚴(yán)格一致,壓解碼,所得數(shù)據(jù)和編碼前的原始數(shù)據(jù)嚴(yán)格一致,壓縮比約為縮比約為2:15:1,常用的算法有:,常用的算法有:Huffman編碼、編碼、算術(shù)編碼、行程編碼算術(shù)編碼、行程編碼RLE、詞典編碼等。、詞典編碼等。 有損編碼:也稱熵壓縮法。解碼得到的還原數(shù)據(jù)與有損編碼:也稱熵壓縮

15、法。解碼得到的還原數(shù)據(jù)與原始數(shù)據(jù)之間存在一定的誤差,但并不影響人對(duì)原原始數(shù)據(jù)之間存在一定的誤差,但并不影響人對(duì)原始資料表達(dá)信息的理解,壓縮比從幾倍到上百倍。始資料表達(dá)信息的理解,壓縮比從幾倍到上百倍。2425壓縮軟件實(shí)際上就是使用上述這些算法進(jìn)行壓縮的。壓縮軟件實(shí)際上就是使用上述這些算法進(jìn)行壓縮的。26衡量編碼方法優(yōu)劣的指標(biāo)衡量編碼方法優(yōu)劣的指標(biāo) 衡量壓縮編碼方法優(yōu)衡量壓縮編碼方法優(yōu)劣的重要指標(biāo)有:劣的重要指標(biāo)有: 壓縮比要高;壓縮比要高; 壓縮與解壓的速度快;壓縮與解壓的速度快; 算法簡單,適合于硬件算法簡單,適合于硬件實(shí)現(xiàn);實(shí)現(xiàn); 解壓縮后還原信息的質(zhì)解壓縮后還原信息的質(zhì)量高。量高。27第

16、二節(jié)第二節(jié) 脈沖編碼調(diào)制脈沖編碼調(diào)制 脈沖編碼調(diào)制:脈沖編碼調(diào)制:PCM,即將連續(xù)模擬信,即將連續(xù)模擬信號(hào)數(shù)字化,包括采樣、量化號(hào)數(shù)字化,包括采樣、量化/編碼。編碼。 模擬量經(jīng)過模擬量經(jīng)過A/D轉(zhuǎn)換,得到二進(jìn)制碼的過轉(zhuǎn)換,得到二進(jìn)制碼的過程,也稱程,也稱PCM編碼。編碼。 其它的編碼方法都是其它的編碼方法都是在模擬信號(hào)經(jīng)過在模擬信號(hào)經(jīng)過PCM編碼后再進(jìn)行的壓縮編碼后再進(jìn)行的壓縮編碼方法。編碼方法。28PCM編碼過程編碼過程29第三節(jié)第三節(jié) 統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼 數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論,根據(jù)數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論,根據(jù)信息論的原理,可以找到最佳的數(shù)據(jù)壓縮信息論的原理,可以找到最佳的數(shù)

17、據(jù)壓縮編碼方法。編碼方法。 數(shù)據(jù)壓縮的理論極限是數(shù)據(jù)壓縮的理論極限是信息熵信息熵,統(tǒng)計(jì)編碼,統(tǒng)計(jì)編碼就是利用了信息熵原理,因此也稱作信息就是利用了信息熵原理,因此也稱作信息熵編碼、熵保存編碼或熵編碼。熵編碼、熵保存編碼或熵編碼。 統(tǒng)計(jì)編碼是一種無損的壓縮方法,如香農(nóng)統(tǒng)計(jì)編碼是一種無損的壓縮方法,如香農(nóng)編碼、編碼、 Huffman編碼、算術(shù)編碼等。編碼、算術(shù)編碼等。303.1 統(tǒng)計(jì)編碼的原理統(tǒng)計(jì)編碼的原理信息量和信息熵信息量和信息熵 熵是信息論中的概念,是信息量的度量方法。熵是信息論中的概念,是信息量的度量方法。 要理解什么是要理解什么是“信息熵信息熵”,先得了解,先得了解信息信息、信信息量息量

18、的含義。的含義。31 下面以信源編碼模型來說明。下面以信源編碼模型來說明。編碼器編碼器信源(消息集)信源(消息集)編碼輸出集編碼輸出集X=x1,xnZ=z1,zn符號(hào)集符號(hào)集Am=a1,am X為消息集,由為消息集,由n個(gè)信號(hào)單元個(gè)信號(hào)單元xj構(gòu)成構(gòu)成 Z為輸出集,由為輸出集,由n個(gè)碼字個(gè)碼字zj構(gòu)成,構(gòu)成,zj與與xj一一一一對(duì)應(yīng)。對(duì)應(yīng)。 Am 是符號(hào)集,由是符號(hào)集,由m個(gè)碼元個(gè)碼元 ai構(gòu)成,符號(hào)集構(gòu)成,符號(hào)集中間的碼元組成輸出碼字。中間的碼元組成輸出碼字。32 當(dāng)信源發(fā)出某個(gè)隨機(jī)事件(消息)當(dāng)信源發(fā)出某個(gè)隨機(jī)事件(消息)xj后,后,接收端收到一個(gè)相應(yīng)的碼字接收端收到一個(gè)相應(yīng)的碼字zj。

19、那么,接收到的這個(gè)碼字中包含了多少那么,接收到的這個(gè)碼字中包含了多少有用的信息呢?有用的信息呢? 信息是用不確定性的量度定義的。信息是用不確定性的量度定義的。 消息消息xj出現(xiàn)的可能性愈小,則其帶給人們出現(xiàn)的可能性愈小,則其帶給人們的信息就愈多;反之,消息出現(xiàn)的可能的信息就愈多;反之,消息出現(xiàn)的可能性愈大,則它能給人們提供的新信息性愈大,則它能給人們提供的新信息(有用信息)就愈少。(有用信息)就愈少。 在數(shù)學(xué)上,一條消息所傳輸?shù)男畔⑹瞧湓跀?shù)學(xué)上,一條消息所傳輸?shù)男畔⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。出現(xiàn)概率的單調(diào)下降函數(shù)。33信息量信息量 信息量:從信息量:從N個(gè)可能事件中選出一個(gè)事件個(gè)可能事件中選

20、出一個(gè)事件所需要的信息度量或含量。所需要的信息度量或含量。 對(duì)于計(jì)算機(jī)的二進(jìn)制編碼,可以這么理對(duì)于計(jì)算機(jī)的二進(jìn)制編碼,可以這么理解:從解:從N個(gè)事件中辨別出一個(gè)特定事件,個(gè)事件中辨別出一個(gè)特定事件,最少需要回答多少次最少需要回答多少次“yes or no”疑問。疑問。 事實(shí)上,每次提問都會(huì)得到一個(gè)事實(shí)上,每次提問都會(huì)得到一個(gè)“yes or no”的答復(fù),可以用的答復(fù),可以用0或或1表示,即表示,即1bit,如果提問如果提問n次,則信息量為次,則信息量為nbit。34示例示例 例一:從例一:從164的整數(shù)中選出一個(gè)數(shù)。的整數(shù)中選出一個(gè)數(shù)。 可先提問可先提問“是否大于是否大于32?”,以消除半數(shù)的

21、可能,然,以消除半數(shù)的可能,然后再進(jìn)行半數(shù)的詢問,這樣只需后再進(jìn)行半數(shù)的詢問,這樣只需6次便可確定一個(gè)數(shù),次便可確定一個(gè)數(shù),其信息量為其信息量為6bit。 例二:如果只要辨別某個(gè)數(shù)是否大于例二:如果只要辨別某個(gè)數(shù)是否大于32,則只,則只需詢問一次便可得出結(jié)論,其信息量只有需詢問一次便可得出結(jié)論,其信息量只有1bit。 從上兩例中可看出,大于或者小于從上兩例中可看出,大于或者小于32,這種情,這種情況的概率比具體等于某一個(gè)數(shù)的概率要大,但況的概率比具體等于某一個(gè)數(shù)的概率要大,但其信息量反而?。▎握{(diào)下降)。其信息量反而小(單調(diào)下降)。35信息量的數(shù)學(xué)表述信息量的數(shù)學(xué)表述 信息論定義了一種度量信息量

22、的方法:信息論定義了一種度量信息量的方法: 其中:其中: I(xj)是信源是信源X發(fā)出發(fā)出xj后,接收端接收到的信后,接收端接收到的信息量的量度。息量的量度。 P(xj)是信源是信源X發(fā)出發(fā)出xj的先驗(yàn)概率,有:的先驗(yàn)概率,有:njxPxIjj,.,3 , 2 , 1)(log)(2), 2 , 1(1011njppjnjj請(qǐng)用上述公式求例一的信息量。請(qǐng)用上述公式求例一的信息量。36信息熵信息熵 如果將信源所有可能事件的信息量進(jìn)行如果將信源所有可能事件的信息量進(jìn)行統(tǒng)計(jì)平均(即求其數(shù)學(xué)期望),就得到統(tǒng)計(jì)平均(即求其數(shù)學(xué)期望),就得到了信息熵。了信息熵。 信源信源X發(fā)出的發(fā)出的xj(j=1,2,n

23、),),xj出現(xiàn)的出現(xiàn)的概率為概率為P(xj),則信源,則信源X的熵為:的熵為: )(log)()()(211jnjjjnjjxPxPxIxPXH37示例示例 假設(shè)一幅由假設(shè)一幅由40個(gè)像素組成的灰度圖像,個(gè)像素組成的灰度圖像,共有共有5級(jí)灰度,每一級(jí)灰度都是一種信源級(jí)灰度,每一級(jí)灰度都是一種信源發(fā)出的符號(hào),分別用發(fā)出的符號(hào),分別用AE表示。表示。 40個(gè)像素中有個(gè)像素中有15個(gè)灰度為個(gè)灰度為A,7個(gè)灰度為個(gè)灰度為B,7個(gè)灰度為個(gè)灰度為C,6個(gè)灰度為個(gè)灰度為D,5個(gè)灰度個(gè)灰度為為E。 試求該灰度圖像的熵。試求該灰度圖像的熵。38 該灰度圖像的熵為該灰度圖像的熵為2.196bit。 196. 2

24、405log405406log406407log407407log4074015log4015)(log)()()(22222211jnjjjnjjxPxPxIxPXH39統(tǒng)計(jì)編碼的目的統(tǒng)計(jì)編碼的目的統(tǒng)計(jì)編碼就根據(jù)信源信號(hào)出現(xiàn)概率的分統(tǒng)計(jì)編碼就根據(jù)信源信號(hào)出現(xiàn)概率的分布特性進(jìn)行壓縮的。布特性進(jìn)行壓縮的。統(tǒng)計(jì)編碼的目的:統(tǒng)計(jì)編碼的目的:1. 在信源符號(hào)和碼字之間建立明確的一一對(duì)在信源符號(hào)和碼字之間建立明確的一一對(duì)應(yīng)關(guān)系;應(yīng)關(guān)系;2. 編碼過程中不丟失信息量(即信息熵的大編碼過程中不丟失信息量(即信息熵的大小不變),以便在恢復(fù)時(shí)能準(zhǔn)確地再現(xiàn)原小不變),以便在恢復(fù)時(shí)能準(zhǔn)確地再現(xiàn)原信號(hào),實(shí)現(xiàn)無損壓縮;

25、信號(hào),實(shí)現(xiàn)無損壓縮;3. 平均碼長或碼率應(yīng)盡量小。平均碼長或碼率應(yīng)盡量小。40熵和平均碼長熵和平均碼長 可用熵來衡量該編碼是否為最佳編碼:可用熵來衡量該編碼是否為最佳編碼: 當(dāng)當(dāng) ,有冗余,不是最佳;,有冗余,不是最佳; 當(dāng)當(dāng) ,不可能出現(xiàn);,不可能出現(xiàn); 當(dāng)當(dāng) ,是最佳編碼(,是最佳編碼( 稍大于稍大于 )其中其中 表示編碼器輸出碼字的平均碼長。表示編碼器輸出碼字的平均碼長。 可見,熵值是平均碼長的下限??梢?,熵值是平均碼長的下限。)(xHN )(xHN )(xHN N)(xHNnjjjLPN1413.2 Huffman編碼編碼 最佳編碼定理:最佳編碼定理: 在在變字長變字長碼中,對(duì)于出現(xiàn)概

26、率大的信息符號(hào)碼中,對(duì)于出現(xiàn)概率大的信息符號(hào)編以短字長的碼,對(duì)于出現(xiàn)概率小的信息符編以短字長的碼,對(duì)于出現(xiàn)概率小的信息符號(hào)編以長字長的碼。號(hào)編以長字長的碼。 如果碼字長度嚴(yán)格按照符號(hào)概率的大小的相如果碼字長度嚴(yán)格按照符號(hào)概率的大小的相反順序排列,則平均碼字長度一定小于按任反順序排列,則平均碼字長度一定小于按任何其他符號(hào)順序排列方式得到的碼字長度。何其他符號(hào)順序排列方式得到的碼字長度。 Huffman編碼:利用了最佳編碼定理,編碼:利用了最佳編碼定理,是最常用的一種統(tǒng)計(jì)編碼。是最常用的一種統(tǒng)計(jì)編碼。42 Huffman編碼方法先把信源符號(hào)按概率編碼方法先把信源符號(hào)按概率大小順序排列,并設(shè)法按逆次

27、序分配碼大小順序排列,并設(shè)法按逆次序分配碼字長度。字長度。 對(duì)于出現(xiàn)頻率大的符號(hào)用較少的位數(shù)來對(duì)于出現(xiàn)頻率大的符號(hào)用較少的位數(shù)來表示;對(duì)于出現(xiàn)頻率小的符號(hào)用較多的表示;對(duì)于出現(xiàn)頻率小的符號(hào)用較多的位數(shù)來表示。位數(shù)來表示。 Huffman編碼方法采用的碼字長度是可編碼方法采用的碼字長度是可變的,因此較難在壓縮編碼后的文件中變的,因此較難在壓縮編碼后的文件中進(jìn)行內(nèi)容的查找。進(jìn)行內(nèi)容的查找。43Huffman編碼的思路編碼的思路1. 把信源符號(hào)按概率大小順序排列,并設(shè)法按把信源符號(hào)按概率大小順序排列,并設(shè)法按逆次序分配碼字的長度。逆次序分配碼字的長度。2. 在分配碼字長度時(shí),首先將出現(xiàn)概率最小的在分

28、配碼字長度時(shí),首先將出現(xiàn)概率最小的兩個(gè)符號(hào)的概率相加合成一個(gè)概率。兩個(gè)符號(hào)的概率相加合成一個(gè)概率。3. 把這個(gè)合成概率看成是一個(gè)新組合符號(hào)地概把這個(gè)合成概率看成是一個(gè)新組合符號(hào)地概率,重復(fù)上述做法直到最后只剩下兩個(gè)符號(hào)率,重復(fù)上述做法直到最后只剩下兩個(gè)符號(hào)概率為止。概率為止。4. 完成以上概率順序排列后,再反過來逐步向完成以上概率順序排列后,再反過來逐步向前進(jìn)行編碼,每一次有二個(gè)分支各賦予一個(gè)前進(jìn)行編碼,每一次有二個(gè)分支各賦予一個(gè)二進(jìn)制碼,可以對(duì)概率大的賦為二進(jìn)制碼,可以對(duì)概率大的賦為0,概率小的,概率小的賦為賦為1。44Huffman編碼的步驟編碼的步驟1. 對(duì)每個(gè)信息符號(hào)進(jìn)行概率統(tǒng)計(jì);對(duì)每

29、個(gè)信息符號(hào)進(jìn)行概率統(tǒng)計(jì);2. 將信源符號(hào)按概率的遞減順序排列;將信源符號(hào)按概率的遞減順序排列;3. 將最后的兩個(gè)小概率相加作為新符號(hào)的概率,將最后的兩個(gè)小概率相加作為新符號(hào)的概率, 此時(shí)概率個(gè)數(shù)將減少一個(gè);此時(shí)概率個(gè)數(shù)將減少一個(gè);4. 重復(fù)第重復(fù)第2、3步,直到只剩兩個(gè)概率;步,直到只剩兩個(gè)概率;5. 將概率大的賦將概率大的賦“0”,概率小的賦,概率小的賦“1”;6. 逆順序往信源符號(hào)推,不是合并的編碼不變,逆順序往信源符號(hào)推,不是合并的編碼不變,如果是合并的,則在編碼后面按照第如果是合并的,則在編碼后面按照第5步的方步的方法添加法添加0或或1。45編碼實(shí)例編碼實(shí)例 信源信源X有有7個(gè)信息符號(hào)

30、,其概率為:個(gè)信息符號(hào),其概率為: 請(qǐng)對(duì)其進(jìn)行請(qǐng)對(duì)其進(jìn)行Huffman編碼,寫出其碼樹、編碼,寫出其碼樹、碼長,并計(jì)算平均碼長和熵。碼長,并計(jì)算平均碼長和熵。12345670.350.200.150.100.100.060.0446信息信息符號(hào)符號(hào)概率概率第第1步步第第2步步第第3步步第第4步步第第5步步10.350.350.350.350.400.6020.200.200.200.250.350.4030.150.150.200.200.2540.100.100.150.2050.100.100.1060.060.1070.0401100010001101100101101001100100

31、1001111011100100100111101110111147 碼字的平均碼長為:碼字的平均碼長為:bitLPLPNjjjnjjj55. 24)04. 006. 0(3)10. 010. 015. 0(2)20. 035. 0(711 熵為:熵為:bitxPxPxPxPHjjjnjjj4986. 2)04. 0log04. 006. 0log06. 010. 0log10. 010. 0log10. 015. 0log15. 020. 0log20. 035. 0log35. 0()(log)()(log)(22222227121248Huffman編碼小結(jié)編碼小結(jié) 平均碼長大于熵,小于

32、等長碼的碼長。平均碼長大于熵,小于等長碼的碼長。 Huffman編碼能保證解碼的唯一性,短碼字不編碼能保證解碼的唯一性,短碼字不會(huì)是長碼字的前綴。會(huì)是長碼字的前綴。 Huffman編碼沒有錯(cuò)誤保護(hù)功能。編碼沒有錯(cuò)誤保護(hù)功能。 使用使用Huffman編碼時(shí),接收端需保存一個(gè)與發(fā)編碼時(shí),接收端需保存一個(gè)與發(fā)送端完全相同的送端完全相同的Huffman碼表。碼表。 Huffman編碼在信源符號(hào)出現(xiàn)概率分布不均勻編碼在信源符號(hào)出現(xiàn)概率分布不均勻時(shí)編碼效率較高,若概率分別均勻時(shí)一般不采時(shí)編碼效率較高,若概率分別均勻時(shí)一般不采用用Huffman編碼。編碼。 Huffman編碼的壓縮比取決于信源符號(hào)出現(xiàn)的編碼

33、的壓縮比取決于信源符號(hào)出現(xiàn)的概率,越集中則壓縮比越高。概率,越集中則壓縮比越高。493.3 算術(shù)編碼算術(shù)編碼 20世紀(jì)世紀(jì)60年代初,年代初,Elias首次提出了算術(shù)首次提出了算術(shù)編碼的概念。編碼的概念。 1976年,發(fā)展了算術(shù)編碼的實(shí)用技術(shù)。年,發(fā)展了算術(shù)編碼的實(shí)用技術(shù)。 算術(shù)編碼方法比算術(shù)編碼方法比Huffman編碼復(fù)雜,但編碼復(fù)雜,但它不需要接收端保存一份它不需要接收端保存一份Huffman碼表,碼表,且具有自適應(yīng)能力。且具有自適應(yīng)能力。 算術(shù)編碼是目前實(shí)現(xiàn)高效壓縮數(shù)據(jù)中很算術(shù)編碼是目前實(shí)現(xiàn)高效壓縮數(shù)據(jù)中很有前途的編碼方法。有前途的編碼方法。50基本原理和編碼步驟基本原理和編碼步驟算術(shù)編

34、碼實(shí)際上是用一個(gè)浮點(diǎn)數(shù)代替一算術(shù)編碼實(shí)際上是用一個(gè)浮點(diǎn)數(shù)代替一個(gè)輸入流中的符號(hào)。個(gè)輸入流中的符號(hào)。1. 將實(shí)數(shù)半開區(qū)間將實(shí)數(shù)半開區(qū)間0, 1) 進(jìn)行分割,每一符號(hào)進(jìn)行分割,每一符號(hào)對(duì)應(yīng)對(duì)應(yīng)0, 1)上的一個(gè)子區(qū)間,區(qū)間長度為該上的一個(gè)子區(qū)間,區(qū)間長度為該符號(hào)出現(xiàn)的概率;符號(hào)出現(xiàn)的概率;2. 把要編碼的整段消息映射到把要編碼的整段消息映射到0, 1),根據(jù)這,根據(jù)這段消息符號(hào)的順序確定新的實(shí)數(shù)子區(qū)間;段消息符號(hào)的順序確定新的實(shí)數(shù)子區(qū)間;3. 最終得到一個(gè)最終得到一個(gè)0, 1)上的子區(qū)間,從中任選上的子區(qū)間,從中任選一個(gè)實(shí)數(shù),該實(shí)數(shù)就是對(duì)整段數(shù)據(jù)進(jìn)行編一個(gè)實(shí)數(shù),該實(shí)數(shù)就是對(duì)整段數(shù)據(jù)進(jìn)行編碼后的輸出

35、代碼。碼后的輸出代碼。51例:輸入例:輸入“eai”,最后得到的子區(qū)間為,最后得到的子區(qū)間為0.23, 0.236),取該區(qū)間的任一個(gè)數(shù)(一般,取該區(qū)間的任一個(gè)數(shù)(一般取最小的值),如取最小的值),如0.230即為即為”eai”的編碼。的編碼。52 在算術(shù)編碼中,一段消息是用在算術(shù)編碼中,一段消息是用0到到1之間之間的一個(gè)實(shí)數(shù)來編碼表示的。的一個(gè)實(shí)數(shù)來編碼表示的。 算術(shù)編碼方法用到了兩個(gè)基本的參數(shù):算術(shù)編碼方法用到了兩個(gè)基本的參數(shù):信源符號(hào)的概率和編碼間隔。信源符號(hào)的概率和編碼間隔。 信源符號(hào)的概率決定了壓縮編碼的效率,也信源符號(hào)的概率決定了壓縮編碼的效率,也決定了編碼過程中的間隔。決定了編碼

36、過程中的間隔。 編碼間隔最終決定了符號(hào)編碼后的輸出。編碼間隔最終決定了符號(hào)編碼后的輸出。 需要編碼的信息越長,則表示它的編碼需要編碼的信息越長,則表示它的編碼間隔就越小,實(shí)數(shù)的小數(shù)位就越多。間隔就越小,實(shí)數(shù)的小數(shù)位就越多。53編碼實(shí)例編碼實(shí)例 假設(shè)信源符號(hào)有假設(shè)信源符號(hào)有4個(gè)個(gè)(00, 01, 10, 11),其概率分,其概率分別為別為(0.1, 0.4, 0.2, 0.3)。 根據(jù)概率把間隔根據(jù)概率把間隔0, 1)分成分成4個(gè)子間隔:個(gè)子間隔:0, 0.1), 0.1, 0.5), 0.5, 0.7), 0.7, 1)。 消息序列的輸入為:消息序列的輸入為:10 00 11 00 10 11

37、 015455二進(jìn)制的算術(shù)編碼二進(jìn)制的算術(shù)編碼 計(jì)算機(jī)中任何消息都是由計(jì)算機(jī)中任何消息都是由0、1組合而成組合而成的,可以理解為信源符號(hào)只有的,可以理解為信源符號(hào)只有0和和1。 即:每次分割區(qū)間時(shí),只要分成兩個(gè)子即:每次分割區(qū)間時(shí),只要分成兩個(gè)子區(qū)間,一個(gè)對(duì)應(yīng)區(qū)間,一個(gè)對(duì)應(yīng)0,一個(gè)對(duì)應(yīng),一個(gè)對(duì)應(yīng)1。 例:已知二進(jìn)制符號(hào)中例:已知二進(jìn)制符號(hào)中0出現(xiàn)的概率為出現(xiàn)的概率為0.25,1出現(xiàn)的概率為出現(xiàn)的概率為0.75,試對(duì)輸入流,試對(duì)輸入流1011進(jìn)行算術(shù)編碼。進(jìn)行算術(shù)編碼。56 設(shè)設(shè)C為子區(qū)間的左端起始位置,為子區(qū)間的左端起始位置,L為子區(qū)間的為子區(qū)間的長度,則對(duì)于符號(hào)長度,則對(duì)于符號(hào)“0”,C=0

38、,L=0.25;對(duì)于;對(duì)于符號(hào)符號(hào)“1”,C=0.25,L=0.75。 算術(shù)編碼步驟如下:算術(shù)編碼步驟如下:步驟步驟 輸入符號(hào)輸入符號(hào)C L 1 1 0.25 0.75 2 0 0.25 0.75*0.25=0.1875 3 1 0.25+0.1875*0.25 0.1875*0.75=0.296875=0.140625 4 1 0. 296875+0.140625*0.750.140625*0.25=0.10546875=0.3320312557 當(dāng)當(dāng)4個(gè)字符輸入完后,最終得到的子區(qū)間個(gè)字符輸入完后,最終得到的子區(qū)間左端起始位置為左端起始位置為0.33203125,終止位置為,終止位置為C+

39、L=0.4375。 換算成二進(jìn)制為:換算成二進(jìn)制為: (0.33203125)d=(0.01010101) b (0.4375)d=(0.0111) b 在在0.01010101和和0.0111之間取一個(gè)數(shù),要之間取一個(gè)數(shù),要求其二進(jìn)制形式的長度最短,如本例中求其二進(jìn)制形式的長度最短,如本例中取取0.011,則該串輸入,則該串輸入“1011”最終可編碼最終可編碼成成011,數(shù)據(jù)量有所減少。,數(shù)據(jù)量有所減少。58幾個(gè)問題幾個(gè)問題1. 由于計(jì)算機(jī)的精度有限,算術(shù)編碼的計(jì)算過由于計(jì)算機(jī)的精度有限,算術(shù)編碼的計(jì)算過程中容易發(fā)生溢出,可以采用限制小數(shù)位數(shù)程中容易發(fā)生溢出,可以采用限制小數(shù)位數(shù)的方法來解決

40、。的方法來解決。 2. 算術(shù)編碼器對(duì)消息只產(chǎn)生一個(gè)碼字(在區(qū)間算術(shù)編碼器對(duì)消息只產(chǎn)生一個(gè)碼字(在區(qū)間0, 1)中的一個(gè)實(shí)數(shù)),譯碼器在接收到表示中的一個(gè)實(shí)數(shù)),譯碼器在接收到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。 3. 算術(shù)編碼對(duì)錯(cuò)誤很敏感,如果有一位發(fā)生錯(cuò)算術(shù)編碼對(duì)錯(cuò)誤很敏感,如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。59自適應(yīng)能力自適應(yīng)能力 事實(shí)上,由于人們事先無法知道精確的信源概事實(shí)上,由于人們事先無法知道精確的信源概率,因此編碼算法最好具有自適應(yīng)能力,解決率,因此編碼算法最好具有自適應(yīng)能力,解決這一問題最有效的方法是在編碼過程中進(jìn)

41、行估這一問題最有效的方法是在編碼過程中進(jìn)行估算(動(dòng)態(tài)建模)。算(動(dòng)態(tài)建模)。 算術(shù)編碼可以是靜態(tài)的,也可以是具有自適應(yīng)算術(shù)編碼可以是靜態(tài)的,也可以是具有自適應(yīng)能力的動(dòng)態(tài)編碼。能力的動(dòng)態(tài)編碼。 在靜態(tài)算術(shù)編碼中,信源符號(hào)的概率是固定的。在靜態(tài)算術(shù)編碼中,信源符號(hào)的概率是固定的。 在自適應(yīng)算術(shù)編碼中,將根據(jù)編碼時(shí)符號(hào)出現(xiàn)的頻在自適應(yīng)算術(shù)編碼中,將根據(jù)編碼時(shí)符號(hào)出現(xiàn)的頻繁程度動(dòng)態(tài)地修改信源符號(hào)的概率。繁程度動(dòng)態(tài)地修改信源符號(hào)的概率。 動(dòng)態(tài)建模是確定編碼器壓縮效率的關(guān)鍵。動(dòng)態(tài)建模是確定編碼器壓縮效率的關(guān)鍵。60算術(shù)編碼小結(jié)算術(shù)編碼小結(jié) 不必預(yù)先定義概率模型,具有自適應(yīng)能力,可不必預(yù)先定義概率模型,具有

42、自適應(yīng)能力,可根據(jù)當(dāng)前接收的數(shù)據(jù)不斷更改概率模型。根據(jù)當(dāng)前接收的數(shù)據(jù)不斷更改概率模型。 若信源符號(hào)的概率值都很接近時(shí),不宜使用若信源符號(hào)的概率值都很接近時(shí),不宜使用Huffman編碼,建議使用算術(shù)編碼。編碼,建議使用算術(shù)編碼。 算術(shù)編碼的實(shí)現(xiàn)較算術(shù)編碼的實(shí)現(xiàn)較Huffman編碼更復(fù)雜,但對(duì)編碼更復(fù)雜,但對(duì)多幅圖像進(jìn)行測試的結(jié)果表明,算術(shù)編碼較多幅圖像進(jìn)行測試的結(jié)果表明,算術(shù)編碼較Huffman編碼提高了編碼提高了5%左右的壓縮率,左右的壓縮率,JPEG擴(kuò)展系統(tǒng)中采用的就是算術(shù)編碼。擴(kuò)展系統(tǒng)中采用的就是算術(shù)編碼。613.4 游程編碼游程編碼 RLE:run length encoding,游程編

43、碼,游程編碼,也稱行程編碼。也稱行程編碼。用用RLE編碼方法得到的代碼為:編碼方法得到的代碼為:80315084180 623.5 詞典編碼詞典編碼 詞典編碼是根據(jù)數(shù)據(jù)本身包含有詞典編碼是根據(jù)數(shù)據(jù)本身包含有重復(fù)內(nèi)重復(fù)內(nèi)容容這一特性進(jìn)行壓縮的。這一特性進(jìn)行壓縮的。 詞典編碼是無損的。詞典編碼是無損的。 常見的詞典編碼算法有:常見的詞典編碼算法有:LZ77 算法、算法、LZ78算法、算法、LZW算法等。算法等。63指針式詞典指針式詞典如如LZ77 算法、算法、LZSS算法、算法、LZ78算法。算法。64索引式詞典索引式詞典如如LZW算法算法65第四節(jié)第四節(jié) 預(yù)測編碼預(yù)測編碼 預(yù)測編碼:先利用以往的

44、樣本值對(duì)新樣預(yù)測編碼:先利用以往的樣本值對(duì)新樣本進(jìn)行本進(jìn)行預(yù)測預(yù)測,再將新樣本的實(shí)際值和預(yù),再將新樣本的實(shí)際值和預(yù)測值相減得到一個(gè)測值相減得到一個(gè)誤差值誤差值,最后對(duì)該誤,最后對(duì)該誤差值進(jìn)行量化編碼傳送。差值進(jìn)行量化編碼傳送。 如果樣本的時(shí)間或空間相關(guān)性較強(qiáng),則如果樣本的時(shí)間或空間相關(guān)性較強(qiáng),則誤差值的變化范圍將遠(yuǎn)遠(yuǎn)小于原始信號(hào)誤差值的變化范圍將遠(yuǎn)遠(yuǎn)小于原始信號(hào)的變化范圍,量化等級(jí)可大量減少,從的變化范圍,量化等級(jí)可大量減少,從而實(shí)現(xiàn)數(shù)據(jù)壓縮。而實(shí)現(xiàn)數(shù)據(jù)壓縮。66 預(yù)測編碼主要是利用數(shù)據(jù)在時(shí)間或空間預(yù)測編碼主要是利用數(shù)據(jù)在時(shí)間或空間上的相關(guān)性來進(jìn)行預(yù)測的,廣泛適用于上的相關(guān)性來進(jìn)行預(yù)測的,廣泛

45、適用于音頻、圖像、視頻等媒體的編解碼。音頻、圖像、視頻等媒體的編解碼。 對(duì)于音頻,主要利用時(shí)間上的相關(guān)性,采用對(duì)于音頻,主要利用時(shí)間上的相關(guān)性,采用時(shí)間上的前幾個(gè)采樣值來做預(yù)測。時(shí)間上的前幾個(gè)采樣值來做預(yù)測。 對(duì)于靜止圖像,主要利用空間上的相關(guān)性,對(duì)于靜止圖像,主要利用空間上的相關(guān)性,如同一行上的前幾個(gè)采樣值,甚至可以是前如同一行上的前幾個(gè)采樣值,甚至可以是前幾行上的像素。幾行上的像素。 對(duì)于視頻,不僅可以利用時(shí)間上的相關(guān)性對(duì)于視頻,不僅可以利用時(shí)間上的相關(guān)性(幀間預(yù)測),還可以利用空間上的相關(guān)性(幀間預(yù)測),還可以利用空間上的相關(guān)性(幀內(nèi)預(yù)測)。(幀內(nèi)預(yù)測)。67684.1 DPCM 模擬信

46、號(hào)進(jìn)行采樣量化后,如果直接使模擬信號(hào)進(jìn)行采樣量化后,如果直接使用用PCM編碼,則數(shù)據(jù)量將很大,此時(shí)可編碼,則數(shù)據(jù)量將很大,此時(shí)可以使用預(yù)測編碼的思想來進(jìn)行二進(jìn)制編以使用預(yù)測編碼的思想來進(jìn)行二進(jìn)制編碼,常用的方法有碼,常用的方法有線性預(yù)測線性預(yù)測LPC和非線和非線性預(yù)測。性預(yù)測。 DPCM:差分:差分(值值)脈沖編碼調(diào)制,是線性脈沖編碼調(diào)制,是線性預(yù)測方法。預(yù)測方法。 DPCM編碼器記錄與傳送的不是樣本的編碼器記錄與傳送的不是樣本的真實(shí)值,而是它與預(yù)測值的真實(shí)值,而是它與預(yù)測值的差差。69DPCM的基本原理的基本原理轉(zhuǎn)入轉(zhuǎn)入f(i,j)f(i,j)e(i,j)e(i,j)量化器量化器預(yù)測器預(yù)測器

47、預(yù)測器預(yù)測器編碼器編碼器解碼器解碼器信信道道傳傳輸輸e e(i,j)(i,j)f f(i,j)(i,j)輸出輸出f(i,j)f(i,j)f(i,j)f(i,j)f(i,j)f(i,j)f(i,j)f(i,j)發(fā)送端發(fā)送端接收端接收端e e(i,j)(i,j)704.2 ADPCM ADPCM:自適應(yīng)差分脈沖編碼調(diào)制。:自適應(yīng)差分脈沖編碼調(diào)制。 在在ADPCM中,預(yù)測器的預(yù)測系數(shù)和量化器中,預(yù)測器的預(yù)測系數(shù)和量化器的量化參數(shù),都能夠根據(jù)原數(shù)據(jù)的區(qū)域分的量化參數(shù),都能夠根據(jù)原數(shù)據(jù)的區(qū)域分布特點(diǎn)自動(dòng)調(diào)整,具有自適應(yīng)能力。布特點(diǎn)自動(dòng)調(diào)整,具有自適應(yīng)能力。 自適應(yīng)預(yù)測:增加一個(gè)預(yù)測參數(shù),該參數(shù)可根自適應(yīng)

48、預(yù)測:增加一個(gè)預(yù)測參數(shù),該參數(shù)可根據(jù)預(yù)測值的大小自適應(yīng)調(diào)整;據(jù)預(yù)測值的大小自適應(yīng)調(diào)整; 自適應(yīng)量化:量化階距的大小可自適應(yīng)調(diào)整。自適應(yīng)量化:量化階距的大小可自適應(yīng)調(diào)整。 實(shí)踐證明,實(shí)踐證明,ADPCM與與DPCM相比,壓縮比相比,壓縮比更高,解碼后的質(zhì)量也更好。更高,解碼后的質(zhì)量也更好。714.3 幀間預(yù)測編碼幀間預(yù)測編碼 幀間預(yù)測編碼技術(shù)是專門針對(duì)視頻對(duì)象幀間預(yù)測編碼技術(shù)是專門針對(duì)視頻對(duì)象的,利用連續(xù)幾幀之間存在的時(shí)間相關(guān)的,利用連續(xù)幾幀之間存在的時(shí)間相關(guān)性來消除冗余。性來消除冗余。 常見的幀間預(yù)測編碼方法有:常見的幀間預(yù)測編碼方法有: 條件補(bǔ)充法條件補(bǔ)充法:若幀間各對(duì)應(yīng)像素的差值超過:若幀

49、間各對(duì)應(yīng)像素的差值超過閾值,則傳送;若沒超過閾值則不傳送,接閾值,則傳送;若沒超過閾值則不傳送,接收端使用上一幀相應(yīng)像素值代替。收端使用上一幀相應(yīng)像素值代替。 運(yùn)動(dòng)補(bǔ)償技術(shù)運(yùn)動(dòng)補(bǔ)償技術(shù):跟蹤畫面內(nèi)運(yùn)動(dòng)部分的位移:跟蹤畫面內(nèi)運(yùn)動(dòng)部分的位移情況,對(duì)其加以補(bǔ)償后再進(jìn)行幀間預(yù)測。情況,對(duì)其加以補(bǔ)償后再進(jìn)行幀間預(yù)測。72第五節(jié)第五節(jié) 變換編碼變換編碼 變換編碼技術(shù)較成熟,目前廣泛應(yīng)用于變換編碼技術(shù)較成熟,目前廣泛應(yīng)用于圖像、視頻的數(shù)據(jù)壓縮。圖像、視頻的數(shù)據(jù)壓縮。 算法思想:將空間域中的圖像信號(hào)映射算法思想:將空間域中的圖像信號(hào)映射變換到另一個(gè)正交的矢量空間中,產(chǎn)生變換到另一個(gè)正交的矢量空間中,產(chǎn)生一批一

50、批變換系數(shù)變換系數(shù),然后對(duì)這些變換系數(shù)進(jìn),然后對(duì)這些變換系數(shù)進(jìn)行編碼。行編碼。 如果變換的新正交空間選擇得好,則可如果變換的新正交空間選擇得好,則可以減少數(shù)據(jù)間的相關(guān)性,從而減少了數(shù)以減少數(shù)據(jù)間的相關(guān)性,從而減少了數(shù)據(jù)的冗余度,達(dá)到數(shù)據(jù)壓縮的目的。據(jù)的冗余度,達(dá)到數(shù)據(jù)壓縮的目的。73例子例子 有相鄰的兩個(gè)采樣有相鄰的兩個(gè)采樣值值x1和和x2,各用,各用3位位來表示,即有來表示,即有8種可種可能取值??紤]到樣能取值??紤]到樣值的相關(guān)性,值的相關(guān)性,x1和和x2同時(shí)出現(xiàn)相近幅度同時(shí)出現(xiàn)相近幅度的可能性最大,即的可能性最大,即圖中的直線陰影部圖中的直線陰影部分。分。 信源的相關(guān)性越大,信源的相關(guān)性越

51、大,陰影部分就越扁平。陰影部分就越扁平。74 若將坐標(biāo)系旋轉(zhuǎn)若將坐標(biāo)系旋轉(zhuǎn)45度,樣本值度,樣本值x1變換成變換成y1,x2變換成變換成y2。不管。不管y1在在07的可能等級(jí)內(nèi)如何變的可能等級(jí)內(nèi)如何變化,化,y2始終只在相當(dāng)小的范圍內(nèi)變化。始終只在相當(dāng)小的范圍內(nèi)變化。 可見,旋轉(zhuǎn)后可見,旋轉(zhuǎn)后y1和和y2的相關(guān)性減小了。的相關(guān)性減小了。 75變換編碼的原理圖變換編碼的原理圖子塊子塊 1子塊子塊 2子塊子塊 n.正變換正變換濾波濾波量化量化編編碼碼信道信道解解碼碼逆變換逆變換綜合綜合拼接拼接源圖像(源圖像(發(fā)送發(fā)送)恢復(fù)圖像(恢復(fù)圖像(接收接收)76常用的變換方法常用的變換方法 常用變換有:常用

52、變換有: 沃爾什沃爾什(Walsh)變換變換 傅立葉傅立葉(Fouries)變換變換 離散正弦離散正弦(DST)變換變換 離散余弦離散余弦(DCT)變換變換 哈爾哈爾(Haar)變換變換 斜斜(Slant)變換變換 K-L(Karhunen-Loeve)變換變換 小波小波(Wavelet)變換變換 77第六節(jié)第六節(jié) 多媒體數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn)多媒體數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn)6.1 靜態(tài)圖像壓縮編碼的國際標(biāo)準(zhǔn)靜態(tài)圖像壓縮編碼的國際標(biāo)準(zhǔn)JPEG6.2 動(dòng)態(tài)圖像壓縮編碼的國際標(biāo)準(zhǔn)動(dòng)態(tài)圖像壓縮編碼的國際標(biāo)準(zhǔn)MPEG-1MPEG-2MPEG-4MPEG-7MPEG-21786.1 JPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn) JPEG:Join

53、t Photograph Experts Group,聯(lián)合圖像專家組,于聯(lián)合圖像專家組,于1986年由年由CCITT和和ISO聯(lián)合成立。聯(lián)合成立。 JPEG標(biāo)準(zhǔn)即標(biāo)準(zhǔn)即多灰度連續(xù)色調(diào)靜態(tài)圖像壓縮多灰度連續(xù)色調(diào)靜態(tài)圖像壓縮編碼編碼,是適用于多級(jí)灰度、連續(xù)色調(diào)、靜,是適用于多級(jí)灰度、連續(xù)色調(diào)、靜態(tài)的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn)。態(tài)的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn)。 實(shí)際上,實(shí)際上,JPEG不僅適用于靜態(tài)圖像,視頻不僅適用于靜態(tài)圖像,視頻的幀內(nèi)壓縮就可采用的幀內(nèi)壓縮就可采用JPEG編碼。編碼。79 JPEG是一個(gè)適用范圍很廣的通用標(biāo)準(zhǔn),其是一個(gè)適用范圍很廣的通用標(biāo)準(zhǔn),其研發(fā)時(shí)的目標(biāo)如下:研發(fā)時(shí)的目標(biāo)如下:1. 算法在

54、圖像壓縮率方面應(yīng)接近當(dāng)前科學(xué)水平,算法在圖像壓縮率方面應(yīng)接近當(dāng)前科學(xué)水平,圖像的保真度在較寬的壓縮范圍里的評(píng)價(jià)是圖像的保真度在較寬的壓縮范圍里的評(píng)價(jià)是“很好很好”、“優(yōu)秀優(yōu)秀”到與原圖像到與原圖像“不能區(qū)別不能區(qū)別”。2. 算法可實(shí)際應(yīng)用于任何一類靜態(tài)數(shù)字圖像,對(duì)算法可實(shí)際應(yīng)用于任何一類靜態(tài)數(shù)字圖像,對(duì)圖像的大小、顏色空間、像素的長寬比、圖像圖像的大小、顏色空間、像素的長寬比、圖像的內(nèi)容、復(fù)雜程度、顏色數(shù)及統(tǒng)計(jì)特性等都不的內(nèi)容、復(fù)雜程度、顏色數(shù)及統(tǒng)計(jì)特性等都不加限制。加限制。3. 在計(jì)算的復(fù)雜程度方面可以調(diào)整,因而可根據(jù)在計(jì)算的復(fù)雜程度方面可以調(diào)整,因而可根據(jù)性能和成本要求來選擇用軟件執(zhí)行還是

55、用硬件性能和成本要求來選擇用軟件執(zhí)行還是用硬件執(zhí)行。執(zhí)行。4. 包括四種操作方式:順序編碼、累進(jìn)編碼、無包括四種操作方式:順序編碼、累進(jìn)編碼、無失真編碼和分層編碼。失真編碼和分層編碼。 80JPEG壓縮算法壓縮算法 為了保證通用性,為了保證通用性,JPEG專家組開發(fā)了兩專家組開發(fā)了兩種基本的壓縮算法:種基本的壓縮算法: 基于基于離散余弦變換離散余弦變換DCT的有損壓縮。的有損壓縮。 基于基于空間空間DPCM預(yù)測技術(shù)預(yù)測技術(shù)的無損壓縮。的無損壓縮。 實(shí)際上,實(shí)際上,JPEG專家組還研究了一種稱做專家組還研究了一種稱做JPEG 2000的標(biāo)準(zhǔn),其采用的壓縮算法為的標(biāo)準(zhǔn),其采用的壓縮算法為基于小波(

56、基于小波(wavelet)變換的變換編碼。)變換的變換編碼。81JPEG的組成部分的組成部分 JPEG系統(tǒng)可分成三個(gè)組成部分:系統(tǒng)可分成三個(gè)組成部分: 基本系統(tǒng)基本系統(tǒng):是實(shí)現(xiàn)離散余弦變換:是實(shí)現(xiàn)離散余弦變換DCT編碼編碼/解碼所需的最小功能集。解碼所需的最小功能集。 擴(kuò)展系統(tǒng)擴(kuò)展系統(tǒng):是為了滿足更為廣闊領(lǐng)域的應(yīng)用:是為了滿足更為廣闊領(lǐng)域的應(yīng)用要求而設(shè)置的。要求而設(shè)置的。 獨(dú)立功能獨(dú)立功能:相對(duì)于:相對(duì)于JPEG的基本系統(tǒng)和擴(kuò)展的基本系統(tǒng)和擴(kuò)展系統(tǒng)來說,使用空間系統(tǒng)來說,使用空間DPCM預(yù)測方法的部分預(yù)測方法的部分稱為獨(dú)立功能。稱為獨(dú)立功能。82基于基于DPCM的無損壓縮的無損壓縮 如圖,預(yù)測

57、器對(duì)原始數(shù)據(jù)如圖,預(yù)測器對(duì)原始數(shù)據(jù)X進(jìn)行預(yù)測,求得差進(jìn)行預(yù)測,求得差值后再對(duì)差值進(jìn)行無失真的熵編碼。值后再對(duì)差值進(jìn)行無失真的熵編碼。 熵編碼器常采用熵編碼器常采用Huffman編碼或算術(shù)編碼。編碼或算術(shù)編碼。83基于基于DCT的有損壓縮的有損壓縮 基于基于DPCM預(yù)測編碼的壓縮比僅能達(dá)到預(yù)測編碼的壓縮比僅能達(dá)到2:1,而,而DCT編碼的壓縮比可高達(dá)編碼的壓縮比可高達(dá)10:1100:1。 當(dāng)壓縮比小于當(dāng)壓縮比小于40:1時(shí),還原的圖像與原始圖像時(shí),還原的圖像與原始圖像相比主觀效果幾乎一樣。相比主觀效果幾乎一樣。壓縮效果(比特壓縮效果(比特/像素)像素)質(zhì)量質(zhì)量0.250.50中好中好0.500.

58、75好很好好很好0.751.5極好極好1.22.0與原始圖像分不出來與原始圖像分不出來8485DCT變換公式變換公式 88的子塊作為的子塊作為DCT變換的輸入。變換的輸入。DCT變換使用下式計(jì)算:變換使用下式計(jì)算:逆變換逆變換IDCT使用下式計(jì)算:使用下式計(jì)算:86基于基于DCT編碼的步驟編碼的步驟基于基于DCT編碼的計(jì)算步驟為:編碼的計(jì)算步驟為:1. 分割子塊:通常順序分割成分割子塊:通常順序分割成88的子塊。的子塊。2. 對(duì)子塊進(jìn)行正向的離散余弦變換對(duì)子塊進(jìn)行正向的離散余弦變換FDCT。3. 對(duì)獲得的對(duì)獲得的DCT系數(shù)進(jìn)行量化處理。系數(shù)進(jìn)行量化處理。4. 將量化后的將量化后的DCT系數(shù)進(jìn)行

59、系數(shù)進(jìn)行Z字形編排。字形編排。5. 對(duì)直流系數(shù)對(duì)直流系數(shù)DC進(jìn)行進(jìn)行DPCM編碼。編碼。6. 對(duì)交流系數(shù)對(duì)交流系數(shù)AC進(jìn)行進(jìn)行RLE游程編碼。游程編碼。7. 熵編碼。熵編碼。876.2 MPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn) MPEG:Moving Pictures Experts Group,運(yùn)動(dòng),運(yùn)動(dòng)圖像專家組,于圖像專家組,于1988年由年由ISO與與IEC聯(lián)合成立,聯(lián)合成立,致力于運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn)化。致力于運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn)化。 MPEG標(biāo)準(zhǔn)包括三個(gè)部分:標(biāo)準(zhǔn)包括三個(gè)部分: MPEG視頻:如視頻:如VCD、SVCD、DVD就是采就是采用這部分標(biāo)準(zhǔn)制作的電子產(chǎn)品。用這部分標(biāo)準(zhǔn)制作的電子產(chǎn)品。

60、 MPEG音頻:如音頻:如mp3。 MPEG系統(tǒng):負(fù)責(zé)視頻和音頻的同步。系統(tǒng):負(fù)責(zé)視頻和音頻的同步。88 最初,最初,MPEG專家組的工作項(xiàng)目是專家組的工作項(xiàng)目是3個(gè):個(gè): MPEG-1:在:在1.5Mbps傳輸速率下對(duì)圖像編碼。傳輸速率下對(duì)圖像編碼。 MPEG-2:在:在l0Mbps傳輸速率下對(duì)圖像編碼。傳輸速率下對(duì)圖像編碼。 MPEG-3:在:在40Mbps傳輸速率下對(duì)圖像編碼。傳輸速率下對(duì)圖像編碼。 l992年,年,MPEG-2的適用范圍擴(kuò)大到的適用范圍擴(kuò)大到HDTV(高清電視),能支持(高清電視),能支持MPEG-3的所有功能,的所有功能,于是便取消了于是便取消了MPEG-3。 到目前

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論