數(shù)字化后的視頻和音頻等媒體信息具有海量性_第1頁
數(shù)字化后的視頻和音頻等媒體信息具有海量性_第2頁
數(shù)字化后的視頻和音頻等媒體信息具有海量性_第3頁
數(shù)字化后的視頻和音頻等媒體信息具有海量性_第4頁
數(shù)字化后的視頻和音頻等媒體信息具有海量性_第5頁
已閱讀5頁,還剩76頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

數(shù)字化后的視頻和音頻等媒體信息具有海量性,與當前計算機所提供的計算機存儲資源和網(wǎng)絡帶寬之間有很大差距,這樣對多媒體信息的存儲造成很大困難。因此,多媒體信息以壓縮的形式進行存儲和傳播成為必要,同時因為多媒體數(shù)據(jù)之間存在大量冗余現(xiàn)象,如空間冗余、時間冗余、結(jié)構(gòu)冗余、知識冗余、視覺冗余、圖像區(qū)域的相同性冗余和紋理統(tǒng)計冗余,使得多媒體數(shù)據(jù)壓縮成為可能。本章主要介紹了數(shù)據(jù)壓縮的基本原理和方法,以及數(shù)據(jù)壓縮的編碼原理和壓縮標準。

第7章多媒體壓縮技術(shù)

7.1數(shù)據(jù)壓縮的基本原理和方法

根據(jù)多媒體不同的表現(xiàn)形式和不同場合以及質(zhì)量方面的應用需求,必須有針對性地進行設計。而各種壓縮方法應該符合一定范圍內(nèi)的性能指標,以滿足實際應用的領域的需要。

7.1.1數(shù)據(jù)壓縮方法的分類

數(shù)據(jù)壓縮技術(shù)自從1948年提出以來,經(jīng)過50多年的發(fā)展。

根據(jù)解碼后的數(shù)據(jù)與壓縮之前的原始數(shù)據(jù)是否完全一致,可以分為無損壓縮編碼和有損壓縮編碼。無損壓縮編碼具有可恢復性和可逆性。該編碼在壓縮時不丟失任何數(shù)據(jù),即把所有的數(shù)據(jù)都作為比特序列,解壓后的數(shù)據(jù)與原始數(shù)據(jù)完全一致。

有損壓縮編碼不具有可恢復性和可逆性,該編碼在壓縮時舍棄冗余的數(shù)據(jù),例如人眼較難分辨的顏色或人耳難以分辨的方向源信號,實際取決于初始信號的類型、信號的相關(guān)性以及語義等內(nèi)容。這些被舍去的信息值是無法再找回的,所以還原后的數(shù)據(jù)與原始數(shù)據(jù)存在差異。

統(tǒng)計編碼:屬于無失真編碼。根據(jù)信源符號出現(xiàn)概率的分布特性進行編碼,讓概率大的信源符號用短碼字表示,讓概率小的信源符號用長碼字表示,從而去除數(shù)據(jù)之間的冗余而達到壓縮的目的。預測編碼:根據(jù)離散信號之間存在一定的相關(guān)性特點,利用前面的一個或多個信號對下一個信號進行預測,然后對實際值和預測值的差值進行編碼。

如果所有的信源符號出現(xiàn)的概率相同,則說明平均信息量最大,也就不存在信源的冗余。根據(jù)數(shù)據(jù)壓縮的原理可以分為:統(tǒng)計編碼、預測編碼、變換編碼、分析-合成編碼和其他編碼。

變換編碼:屬于有失真的編碼。變換編碼是將原始數(shù)據(jù)從初始空間或時間域進行數(shù)學變換,變換為更適合于壓縮的抽象域。關(guān)鍵的是要尋找一個最佳變換,使信息中最重要的部分易于識別。變換本身是可逆的無損的,為了取得更好的效果,忽略了一些編碼位數(shù)較長的系數(shù)而成為了有損編碼。變換編碼一般經(jīng)過變換、變換域采樣和量化三個步驟分析/合成編碼:是基于某種模型的編碼方法,這些模型可以是聲道模型、語音模型、人體模型等。通過分析模型的具體特征,確定與之匹配的編碼。

其他編碼方法常見的有: 混合編碼(HybridCoding)、 矢量量化(VectorQuantize,VQ)、 LZW算法等。還有近年來新出現(xiàn)的編碼方法: 人工神經(jīng)元網(wǎng)絡(ArtificialNeuralNetwork,ANN)算法、 分形(Fractal)算法、小波(Wavelet)算法、 基于對象(Object-Based)的算法、 基于模型(Model-Based)的算法等。

7.1.2數(shù)據(jù)壓縮的性能指標

衡量一種數(shù)據(jù)壓縮技術(shù)的重要性能指標有壓縮比、壓縮速度、壓縮質(zhì)量和計算量。

壓縮比

壓縮比是指原始數(shù)據(jù)量和壓縮后數(shù)據(jù)量的比值。有損壓縮有很高的壓縮比采用不同的壓縮編碼可得到不同的壓縮比。無損壓縮能實現(xiàn)的壓縮比,一般只有數(shù)倍,而且與被壓縮的對象有關(guān)。文字、圖像普遍采用無損壓縮。例如,MPGE是一種包含音頻和圖像在內(nèi)的壓縮技術(shù),利用MPEG-1、MPEG-2、MPEG-4三個方案,對音頻的感知編碼中,MPEG-1方案的音頻壓縮比是1:4,MPEG-2方案的音頻壓縮比是1:6…1:8,MPEG-4方案的音頻壓縮比是1:10…1:12。但是MPEG對圖像的壓縮算法,所提供的壓縮比可以高達200:1。利用JPEG也可以有多種圖像的壓縮比,甚至可以減小到原圖像的百分之一(壓縮比100:1)。

壓縮速度壓縮速度指編碼或解碼的快慢程度。不同的應用場合,對壓縮速度要求是不同的。對于一個壓縮系統(tǒng)而言,有對稱壓縮和非對稱壓縮之分。

所謂對稱壓縮,就是壓縮和解壓縮都需要實時進行的。例如:電視會議的圖形傳輸。

非對稱壓縮常常在解壓縮方面要求是實時的,但壓縮可以不是實時的。例如,多媒體CD-ROM的制作過程可以不是實時的,但解壓縮必須是實時的,否則用戶看到的就不是連續(xù)的圖像。

壓縮質(zhì)量

壓縮質(zhì)量是指壓縮以后對媒體的感知效果。有損壓縮才可能影響人對媒體的感知效果。壓縮質(zhì)量的好壞與壓縮算法、數(shù)據(jù)內(nèi)容和壓縮比有密切的關(guān)系。

例如,使用JPEG編碼時,當壓縮比為20:1時,能看到圖像稍微有點變化,當壓縮比大于20:1時,一般圖像質(zhì)量開始變壞。但使用MPEG編碼時,可以得到很好的數(shù)據(jù)壓縮而依然保持CD聲音質(zhì)量的原樣。在較高的壓縮比下,也能獲得較好的圖像質(zhì)量。

計算量

圖像數(shù)據(jù)壓縮需要進行大量計算,從目前的技術(shù)來看,壓縮的計算量比解壓縮計算量要大,例如動態(tài)圖象的壓縮編碼計算量約為解壓縮的計算量的4倍。

7.2統(tǒng)統(tǒng)計計編編碼碼統(tǒng)計計編編碼碼屬屬于于一一種種無無失失真真的的編編碼碼,,具具體體實實現(xiàn)現(xiàn)的的方方法法有有多多種種,,包包括括行行程程編編碼碼、、LZW編編碼碼、、Huffman編編碼碼、、算算術(shù)術(shù)編編碼碼。。本本節(jié)節(jié)在在介介紹紹了了統(tǒng)統(tǒng)計計編編碼碼的的基基本本思思想想之之后后,,為為讀讀者者引引見見LZW編編碼碼、、Huffman編編碼碼、、算算術(shù)術(shù)編編碼碼等等幾幾種種實實現(xiàn)現(xiàn)方方法法。。統(tǒng)計編碼又稱熵編碼。。根據(jù)信息論論的原理,我我們可以找到到最佳的壓縮縮編碼方法,,數(shù)據(jù)壓縮的的理論極限是是信息熵。也也就是說,信信息中可能存存在著冗余信信息,要去除除信息的冗余余部分,使編編碼后單位數(shù)數(shù)據(jù)量等于其其信息源的熵熵,就達到了了壓縮極限。。信息論指出,,如果一個事事件(例如收收到一個信號號)有n個等等可能性的結(jié)結(jié)局,那么結(jié)結(jié)局未出現(xiàn)前前的不確定程程度H與n的的自然對數(shù)成成正比,即有有:H=Clnn(C為常數(shù))如果一個消息息有10個可可能的結(jié)果,,不確定程度度就是Cln10。當人們收到到這個消息后后,就消除了了這種“不確確定”性。這這樣,一個消消息中所含有有的信息量,,就用表示有有多少個不確確定程度的H來定義,申申農(nóng)(香農(nóng)))把這個不確確定程度H稱為信息熵。信息論認為信信源中存在的的冗余度來自自于信源本身身的相關(guān)性和和信源概率分分布的不均勻勻性。熵編碼要解決決的問題,是是如何利用信信息熵理論減減少數(shù)據(jù)在存存儲和傳輸中中的冗余度。也就是要找找到去除信源源的相關(guān)性和和概率分布的的不均勻性的的方法。事件間的統(tǒng)計計特性與熵有這樣的關(guān)系系。事件發(fā)生的概概率越小,則則其熵值越大大,表示信息息量越大,而而發(fā)生的概率率越大,則其其熵值越小。。統(tǒng)計編碼就是根據(jù)信源源符號出現(xiàn)概概率的分布特特性而進行工工作的。統(tǒng)計編碼需要在信源符符號和碼字之之間確定嚴格格的一一對應應關(guān)系,以便便準確無誤地地在先原來信信源,同時使使平均碼長盡盡量小。統(tǒng)計編碼對于于出現(xiàn)概率比比較高的數(shù)據(jù)據(jù)分配短碼,,而對那些出出現(xiàn)概率比較較低的數(shù)據(jù)則則分配長碼。。該方法使總數(shù)數(shù)據(jù)量降低,,達到數(shù)據(jù)壓壓縮的目的。。常用的統(tǒng)計編編碼有LZW編碼、Huffman編碼和算術(shù)術(shù)編碼。編編碼LZW(LempelZivWelch)壓縮縮編碼是一種種壓縮效率較較高的無損數(shù)數(shù)據(jù)壓縮技術(shù)術(shù)。1977年,,兩位以色列列教授Lempel和Ziv提出了了查找冗余字字符和用較短短的符號標記記替代冗余字字符的概念,,稱為Lempel-Ziv壓縮技技術(shù)。1985年,美國國人Welch將Lempel-Ziv壓縮技技術(shù)從概念發(fā)發(fā)展到實際運運用階段,因因而被命名為為“LempelZivWelch”壓縮縮技術(shù),簡稱稱“LZW””技術(shù)。LZW被廣泛用用于圖像壓縮縮領域。LZW壓縮基基本原理LZW壓縮的的基本原理是是:LZW壓壓縮把每一個個第一次出現(xiàn)現(xiàn)的字符串用用一個數(shù)值來來編碼,在還還原程序中再再將這個數(shù)值值還成原來的的字符串。轉(zhuǎn)換表是在壓壓縮或解壓縮縮過程中動態(tài)態(tài)生成的表,,該轉(zhuǎn)換表只只在進行壓縮縮或解壓縮過過程中需要,,一旦壓縮或或解壓縮結(jié)束束,該表將不不再起任何作作用。壓縮過程生成成的轉(zhuǎn)換表,,記錄了代碼碼和數(shù)據(jù)的對對應關(guān)系,并并且只用于壓壓縮過程。在在解壓縮過程程中,LZW壓縮編碼會會生成另一個個用于解壓縮縮的轉(zhuǎn)換表,,該表與壓縮縮時產(chǎn)生的轉(zhuǎn)轉(zhuǎn)換表完全相相同,數(shù)據(jù)以以嚴格對應的的無損方式被被還原。例如用數(shù)值0x100代代替字符串““abccddeee””這樣每當出出現(xiàn)該字符串串時,都用0x100代代替。把數(shù)據(jù)據(jù)流中復雜的的數(shù)據(jù)用簡單單的代碼來表表示,就起到到了壓縮的作作用。并把代代碼和數(shù)據(jù)的的對應關(guān)系建建立一個轉(zhuǎn)換換表,又叫““字符串表””或“編碼對對照表”。LZW壓縮的的特點LZW壓縮技技術(shù)的處理過過程比其他壓壓縮過程復雜雜,但過程完完全可逆。對對于簡單圖像像和平滑且噪噪音小的信號號源具有較高高的壓縮比,,并且有較高高的壓縮和解解壓縮速度。。對機器硬件件條件要求不不高。LZW壓縮技技術(shù)可壓縮任任何類型和格格式的數(shù)據(jù)。。對于任意寬寬度和像素位位長度的圖像像,都具有穩(wěn)穩(wěn)定的壓縮過過程。常用于于GIF格式式的圖像壓縮縮,其平均壓壓縮比在2::1以上,最最高壓縮比可可達到3:1。LZW壓縮技技術(shù)還可以被被用于文本程程序等數(shù)據(jù)壓壓縮領域,對對于數(shù)據(jù)流中中連續(xù)重復出出現(xiàn)的字節(jié)和和字串,LZW壓縮技術(shù)術(shù)具有很高的的壓縮比。值得注意的是是,規(guī)則數(shù)據(jù)據(jù)具有可預測測性,即從一一個數(shù)據(jù)可預預測到下一個個將可能是什什么數(shù)據(jù)。但但LZW壓縮縮技術(shù)對于可可預測性不大大的數(shù)據(jù)具有有較好的處理理效果7.2.3Huffman編碼Huffman(哈夫曼)編碼碼是統(tǒng)計編碼的的一種,屬于于無損壓縮編編碼。該編碼碼是在1952年為文本本文件建立的的,編碼方法法簡單且有效效,因而得到到廣泛的應用用。現(xiàn)在已經(jīng)經(jīng)派生出很多多變體。Huffman編碼基本本原理Huffman編碼的基基本原理是用用較短的代碼碼代替出現(xiàn)概概率較高的數(shù)數(shù)據(jù),用較長長的代碼代替替出現(xiàn)概率較較低的數(shù)據(jù),,所有代碼都都采用二進制制碼,其碼的的長度是可變變的,且每個個數(shù)據(jù)的代碼碼各不相同。。例如,對于原原始數(shù)據(jù)序列列A、B、C、E、D這這五個字母,,假定對應于于每個字母出出現(xiàn)的概率分分別為0.30、0.25、0.22、0.15、和0.08,則可可以編碼為A(00)、、B(01)、C(10)、(D110)、(D111),壓縮后后為000110110111。由由此產(chǎn)生的全全部信息的總總碼長將小于于實際信息的的符號長度,,從而達到壓壓縮的目的。。整個編碼過程程實際上建立立二叉樹的過程,所所以編碼時需需要對原始數(shù)數(shù)據(jù)掃描兩遍遍,第一遍掃掃描要精確地地統(tǒng)計出原始始數(shù)據(jù)中的每每個值出現(xiàn)的的頻率,第二二遍是通過合合并最小概率率來建立霍夫夫曼樹,同時時還要進行編編碼。由于需需要對多層次次的二叉樹節(jié)節(jié)點進行編碼碼,因此數(shù)據(jù)據(jù)壓縮和還原原速度都較慢慢。編碼過程根據(jù)以上編碼碼原理,Huffman編碼的實際際編碼過程如如下:1.將信源符號按按照出現(xiàn)概率率遞減的順序序排列。2.將最小的兩個個概率進行相相加合并,得得到的結(jié)果作作為新符號的的出現(xiàn)的概率率。3.重復進行1和和2,直到概概率的和值等等于1。4.在進行消息概概率合并運算算時,可以對對概率大的符符號用編碼0表示,概率率小的符號用用編碼1表示示。也可以相相反表示,可可以對概率大大的符號用編編碼1表示,,概率小的符符號用編碼0表示。5.最后,記錄下下從概率為1處開始到當當前信源符號號之間的0、、1序列,從從而得到每個個符號的編碼碼。設信號源為::x={x1,,x2,x3,x4,x5}對應的概率為為:p={0.30,0.25,0.22,0.15,0.08}則編碼過程如如圖7-2所所示,其中第第一次將0.15和0.08概率進進行合并,結(jié)結(jié)果為0.23。繼續(xù)此過程,,歷遍所有信信號,直到概概率和為1.0。當前信號源X1X2X3X4X5概率0.230.450.551.0000001111碼字000110110111字長22233課后習題:設輸入圖像的的灰度級{a1,a2,a3,a4,a5,a6}出現(xiàn)的概率分分別是0.4、0.2、0.12、0.15、0.1、0.03。試進行哈夫夫曼編碼,并并計算平均碼碼長、編碼效效率。Avg==0.30×2+0.25×2+0.22×2+0.15×3+0.08×3=2.08計算該編碼的的平均字長為為2.08,,信息熵H((5)為1.6(假如常常數(shù)C為1)),那么編碼碼效率約為77%??梢娨娀舴蚵幋a碼是一種效率率較高的編碼碼方案。但要要指出的是,,由于“0””和“1”的的指定可以是是任意的,所所以上面所得得到的編碼不不是唯一的。。Huffman提出的這這種編碼也稱稱為最佳變長長碼,其優(yōu)點點是編碼的效效率高,但這這種編碼依賴賴于源的統(tǒng)計計特性,同時時我們看到,,Huffman編碼只只能通過查表表的方法建立立消息和碼字字之間的關(guān)系系,所以如果果消息數(shù)很大大,需要存儲儲的碼表也需需很大,從而而會影響存儲儲量、編碼以以及譯碼速度度等各個方面面的性能。算算術(shù)編碼算術(shù)編碼屬于于無損壓縮的的統(tǒng)計編碼,,常用于圖像像數(shù)據(jù)壓縮標標準(如JPEG,JBIG)中。。算術(shù)編碼基本本原理算術(shù)編碼的基基本原理是將將出現(xiàn)概率較較多的“事件件”(可以是是字符或字符符串),用盡盡可能少的位位或字節(jié)來表表示。算術(shù)編編碼是一種變變長碼,主要要針對出現(xiàn)的的概率高的事事件序列標識識的信息進行行壓縮。在算術(shù)編碼中中,將信源符符號表示成實實數(shù)軸上0和和1之間的間間隔,例如一一個信源符號號“10”可表示成[0.5,0.7]。。信息越長,,這個間隔就就越小,例如如一個較長的的信源符號可可表示成[0.514384,0.51442],顯然然表示這一間間隔所需的二二進制位數(shù)就就越多。也就就是說,算術(shù)術(shù)編碼用到兩兩個基本的參參數(shù)是符號的的概率和它的的編碼間隔。。信源符號的的概率決定壓壓縮編碼的效效率,也決定定編碼過程中中信源符號的的間隔,間隔隔則決定了符符號壓縮后的的輸出。算術(shù)編碼區(qū)別別于霍夫曼編編碼的是,它它是根據(jù)信源源符號估計出出各個元素的的概率,然后后進行迭代計計算。而不象象霍夫曼編碼碼必須預先得得知信源的出出現(xiàn)概率。7.3預測測編碼預測編碼是一一種有失真的的編碼,DPCM編碼和和ADPCM編碼是兩種種較典型的預預測編碼,它它們比較適用用于聲音和圖圖像數(shù)據(jù)的壓壓縮,下面我我們就來了解解一下預測的的基本概念,,以及DPCM編碼、ADPCM編編碼基本原理理。預預測編碼預測編碼是根據(jù)離散信信號之間存在在一定的相關(guān)關(guān)性的特點,,利用前面的的一個或多個個信號對下一一個信號進行行預測,然后后對實際值和和預測值的差差值進行編碼碼。預測編碼碼根據(jù)預測器器的設計分為為線性預測和和非線性預測測。但為了預預測的效率,,大多采用線線性預測。預測編碼非常常適用于聲音音和圖像方面面的壓縮。對對于聲音來講講,預測的對對象是聲波的的下一個幅度度、下一個音音色。對于圖圖像而言,預預測的對象是是下一個像點點、下一條線線或下一幀。。聲音和圖像像中通常都存存在冗余的信信號,而且在在相鄰的音色色或相鄰像點點之間的相關(guān)關(guān)性比較強,,它們的差值值比較小,這這樣任何音色色或像點都可可以通過已知知樣本值進行行預測。對于于連續(xù)的多幀幀圖像,上下下幀通常具有有一些相同的的部分內(nèi)容,,如背景和靜靜止的物體,,可以預計在在一定的時間間內(nèi)將不會發(fā)發(fā)生變化。主主要對其差值值進行編碼,,可以達到壓壓縮的目的。。預測編碼時首首先要存儲的的是當前內(nèi)容容,接著以把把當前內(nèi)容作作為樣板,預預測下一個信信號,將預測測所得的不同同內(nèi)容進行存存儲或傳輸,,如內(nèi)容相同同則是數(shù)據(jù)冗冗余,予以剔剔除。這樣數(shù)數(shù)據(jù)量將會大大幅度減少,,達到壓縮效效果。預測編碼常見見的方法有DPCM、ADPCM、、ΔM、Δ-∑M調(diào)制編碼。。預測編碼主主要采用壓縮縮圖像數(shù)據(jù)的的空間冗余和和時間冗余的的方法,簡捷捷且易于實現(xiàn)現(xiàn),但要求數(shù)數(shù)據(jù)傳輸速度度很高。另外外,預測編碼碼方法的壓縮縮能力有限。。為了進一步步提高數(shù)據(jù)壓壓縮的能力,,可采用其它它編碼方法,,例如變換編編碼。編編碼PCM是脈沖沖編碼調(diào)制,,它首先對原原始的模擬數(shù)數(shù)據(jù)進行采樣樣、量化,然然后作為數(shù)字字信號傳輸。。DPCM((DifferentialPulseCodeModulation))是差分脈沖沖編碼調(diào)制算算法。差分脈脈沖編編碼的的抽樣樣速率率通常常是與與PCM相相同,,因此此在編編碼器器中的的帶限限濾波波器和和解碼碼器中中的平平滑濾濾波器器基本本上與與PCM系系統(tǒng)中中的濾濾波器器是一一樣的的,但但是它它不是是對每每個采采樣值值進行行量化化的,,而是是根據(jù)據(jù)前一一個樣樣值預預測下下一個個樣值值,并并量化化實際際值和和預測測值之之間的的差值值。差差分脈脈沖編編碼的的基本本原理理如圖圖7-3所所示,,在發(fā)發(fā)送端端輸入入的采采樣信信號,,經(jīng)量量化器器后傳傳送到到編碼碼器,,DPCM編編碼器器將產(chǎn)產(chǎn)生不不同抽抽樣值值,簡簡單的的抽樣樣方法法就是是將前前一個個輸入入抽樣樣直接接存儲儲在抽抽樣保保持電電路中中,并并使用用模擬擬減法法器來來測試試抽樣樣有無無變化化。如如果信信號有有變化化,則則差值值被量量化、、被編編碼和和傳輸輸。差分脈脈沖編編碼的的基本本原理理其中有有關(guān)的的參數(shù)數(shù)含義義如下下:Xn——輸輸入信信號,,為每每個即即時時時刻的的樣本本值;;——預預測值值,根根據(jù)時時刻之之前的的采樣樣值x1,x2,…xn-1得到En——xn-En’’——En經(jīng)過量量化器器量化化后的的輸入入信號號Qn——量量化器器的量量化誤誤差產(chǎn)生的的誤差差為::Xn-Xn’=Xn-(+En’)=(Xn-)-En’=En-En’=qn量化器器預測器器XnEnEn’Xn’XnXnXnXnXnqn恰好就就是發(fā)發(fā)送端端的量量化誤誤差。。所以以,DCPM系統(tǒng)中中,量量化器器和預預測器器的設設計是是關(guān)鍵鍵,好好的預預測器器編碼碼應能能根據(jù)據(jù)信號號的局局部特特性,,調(diào)整整量化化器的的步長長和預預測器器的參參數(shù),,使得得許多多預測測值和和實際際值之之間差差值為為最小小。在接收收端,,經(jīng)過過和發(fā)發(fā)信端端的預預測完完全相相同的的操作作,可可以得得到量量化的的原信信號,,然后后再通通過低低通濾濾波便便可恢恢復與與原信信號近近似的的波形形。這這里就就不再再給出出原理理圖了了。7.3.3ADPCM編碼碼ADPCM(AdaptiveDifferentialPulseCodeModulation)自適適應差差分編編碼,,它具具有自自適應應編碼碼的特特性,,該編編碼包包括自自適應應量化化和自自適應應預測測兩種種形式式。ADPCM編碼的的方法法是針針對輸輸入樣樣值進進行自自適應應預測測,然然后對對預測測誤差差進行行量化化編碼碼。綜合了了APCM的自自適應應特性性和DPCM系系統(tǒng)的的差分分特性性,是是一種種性能能比較較好的的波形形編碼碼。它的核核心想想法是是:①①利用用自適適應的的思想想改變變量化化階的的大小小,即即使用用小的的量化化階(step-size)去編編碼小小的差差值,,使用用大的的量化化階去去編碼碼大的的差值值,②②使用用過去去的樣樣本值值估算算下一一個輸輸入樣樣本的的預測測值,,使實實際樣樣本值值和預預測值值之間間的差差值總總是最最小。。它的編編碼簡簡化框框圖如如圖3-10所所示。。ADPCM主要要用于于對中中等質(zhì)質(zhì)量的的音頻頻信號號進行行高效效率壓壓縮。。例如如語音音的壓壓縮、、調(diào)幅幅廣播播音質(zhì)質(zhì)的信信號壓壓縮等等。CCITT的32kbit//s語語音編編碼標標準G.721采用用ADPCM編編碼方方式,,每個個語音音樣值值相當當于用用4個個二進進制位位進行行編碼碼。7.4變變換換編編碼碼變換換編編碼碼是一一種種有有失失真真編編碼碼,,所所謂謂變變換換主主要要是是將將原原始始數(shù)數(shù)據(jù)據(jù)的的原原來來的的時時間間或或空空間間域域進進行行數(shù)數(shù)學學變變換換,,使使得得通通過過變變換換后后能能夠夠突突出出原原始始數(shù)數(shù)據(jù)據(jù)中中的的重重要要部部分分,,以以便便重重點點處處理理。。變變換換編編碼碼中中的的較較為為典典型型的的是是最最佳佳變變換換((K-L變變換換))編編碼碼和和離離散散余余弦弦變變換換((DCT))編編碼碼,,其其中中K-L變變換換是是在在均均方方誤誤差差最最小小意意義義下下導導出出的的,,其其基基向向量量是是輸輸入入數(shù)數(shù)據(jù)據(jù)向向量量協(xié)協(xié)方方差差矩矩陣陣的的特特征征向向量量,,這這種種變變換換矩矩陣陣將將隨隨著著輸輸入入數(shù)數(shù)據(jù)據(jù)的的不不同同而而不不同同,,因因此此難難于于實實現(xiàn)現(xiàn)。。而離散余余弦變換換(DCT)編編碼可對對某個固固定的像像素塊進進行變換換,變換換以后的的數(shù)據(jù)稱稱為DCT系數(shù)數(shù),由于于離散余余弦變換換的變換換核心可可固定,,使得變變換容易易實現(xiàn),,而且變變換的性性能近次次于K-L變換換,目前前已廣泛泛用于多多媒體壓壓縮標準準JPEG、MPEG、H.261、H.263等算法法中。變變換編碼碼變換編碼碼是一種重重要的編編碼類型型,屬于于有失真真的編碼碼,變換換編碼技技術(shù)起源源比較早早,理論論上和技技術(shù)上都都比較成成熟,被被廣泛應應用于單單色圖像像、彩色色圖像、、靜止圖圖像、運運動圖像像,以及及多媒體體計算機機技術(shù)中中的電視視幀內(nèi)圖圖像壓縮縮和幀間間圖像壓壓縮中。。變換編碼碼是指將將給定的的圖像變變換到另另一個數(shù)數(shù)據(jù)域((變換域域或頻域域)上,,使得大大量的信信息能用用較少的的數(shù)據(jù)來來表示。。變換編碼碼原理如如圖7-4所示示。圖中中,輸入入信號經(jīng)經(jīng)過適當當?shù)恼唤蛔儞Q到到另一個個頻域空空間,相相關(guān)性就就會明顯顯減少,,能量集集中在頻頻域的少少數(shù)低頻頻系數(shù)上上,這樣樣就達到到了數(shù)據(jù)據(jù)壓縮的的效果。。如果保保留頻域域中系數(shù)數(shù)大的元元素,忽忽略小的的系數(shù),,然后輔輔以非線線性量化化來提高高壓縮程程度,最最后進行行編碼,,可獲得得很高的的壓縮比比。也就是說說,它不不是直接接對空間間域圖像像信號編編碼,而而是首先先將當前前所表達達的空間間域圖像像信號經(jīng)經(jīng)過變換換映射到到另一個個正交矢矢量空間間,將得得到一系系列變換換系數(shù),,然后對對這些變變換系數(shù)數(shù)進行編編碼處理理。結(jié)果果是重要要的系數(shù)數(shù)在變換換到其他他空間域域后,其其編碼的的精確度度高于次次重要的的系數(shù)。。變換本本身是一一種無損損且可逆逆的技術(shù)術(shù),為了了能獲得得更好的的編碼效效果,忽忽略了一一些不重重要的系系數(shù),由由此成為為了有損損的技術(shù)術(shù)。7.5音音頻數(shù)數(shù)據(jù)壓縮縮標準音頻信號號可分為為電話質(zhì)量量的語音音、調(diào)幅幅廣播質(zhì)質(zhì)量的音音頻、高高保真立立體聲信信號,它們分分別對應應著不同的頻頻率范圍圍。音頻中中的聲波波文件所所占有大大量的空空間容量量,極大大地影響響著數(shù)字字音頻的的存儲和和傳輸,,因此,,壓縮音音頻極其其重要。??紤]到到聲波中中分有語語音和一一般聲音音,又考考慮到不不同應用用場合的的不同要要求,壓壓縮音頻頻可以采采用不同同方式的的編碼。。音頻編碼碼常采用用有損的的編碼,,主要分分為波形編碼碼、參數(shù)編碼碼和混合編碼碼:波形編碼碼方式是能能夠忠實實地表現(xiàn)現(xiàn)波形的的編碼方方式。語語音信號號的波形形編碼力力圖使重重建的語語音波形形保持原原語音信信號的波波形狀態(tài)態(tài)。這類類編碼器器通常是是將語音音信號作作為一般般的波形形信號來來處理,比如::脈沖編編碼調(diào)制制(PCM)、、自適應應增量調(diào)調(diào)制(ADM或或ΔM編編碼)、、自適應應差分編編碼(ADPCM)、、自適應應預測編編碼(APC))、自適適應子帶帶編碼((ASBC)、、自適應應變換編編碼(ATC))等都屬屬于這類類編碼器器。以上上幾種波波形編碼碼方式分分別在64kb/s~~16kb/s的速率率上能給給出高的的編碼質(zhì)質(zhì)量。當當速率進進一步降降低時,其性能能會下降降較快。。由于這這類編碼碼器通常常將語音音信號作作為一般般的波形形信號來來處理,所以它具具有適應應能力強強、話音音質(zhì)量好好、抗噪噪抗誤碼碼的能力力強等特特點,但但所需的的編碼速速率高,其中64kb/sPCM的的語音質(zhì)質(zhì)量成為為一個編編碼質(zhì)量量的參照照標準。。參數(shù)編碼碼是根據(jù)據(jù)聲音的的形成模模型,把把聲音變變換成參參數(shù)的編編碼方式式。其基基本方法法是通過過對語音音信號特特征參數(shù)數(shù)的提取取及編碼碼,力圖圖使重建建語音信信號具有有盡可能能的可懂懂性,即即保持原原語音的的語義。。而重建建的信號號的波形形同原語語音信號號的波形形可能會會有相當當大的差差別。參數(shù)編碼碼的優(yōu)點是:編碼速速率低,編碼速速率通常常小于4.8kb/s,可以以低至600b/s至至2.4kb/s。缺點是:合成語語音質(zhì)量量差,特特別是自自然度較較低,連連熟人之之間都不不一定能能聽出講講話人是是誰;另另外,這這類編碼碼器對講講話環(huán)境境噪聲較較敏感,需要安安靜的講講話環(huán)境境才能給給出較高高的可懂懂度,且且時延大大參數(shù)編碼碼的典型型例子語語音信號號的線性性預測編編碼(LPC))已被公公認為是是目前參參數(shù)編碼碼中最有有效的方方法,它它能夠在在2.4kb/s的低低比特速速率下獲獲得清晰晰、可懂懂的合成成音。并并且易于于硬件實實現(xiàn)。這這種方法法的優(yōu)點點是不但但能極為為精確地地估計參參數(shù),還還在于它它的計算算速度比比較快。。另外多多帶激勵勵(MBE)編編碼,余余弦變換換編碼((STC)均屬屬參數(shù)編編碼。由由于參數(shù)數(shù)編碼是是保護語語聲模型型,重建建清晰可可識別的的語聲,而不注注重波形形的擬合合,所以以這類編編碼技術(shù)術(shù)實現(xiàn)的的是合成成語聲質(zhì)質(zhì)量下的的低速或或極低速速的編碼碼。混合編碼碼是將波形形編碼與與參數(shù)編編碼結(jié)合合而產(chǎn)生生的一種種編碼方方式。使使語音編編碼技術(shù)術(shù)有了突突破性的的進展。。其中提提出了一一些非常常有效的的處理方方法,產(chǎn)產(chǎn)生了新新一代的的參數(shù)編編碼算法法,構(gòu)成成了新一一代的聲聲碼器。。混合編碼克克服了原有有波形編碼碼器與聲碼碼器的弱點點,而結(jié)合合了它們的的優(yōu)點,在在4~16kb/s速率上能能夠得到高高質(zhì)量合成成語音。在在本質(zhì)上具具有波形編編碼的優(yōu)點點,有一定定抗噪和抗抗誤碼的性性能,但時時延較大。?;旌暇幋a結(jié)結(jié)合了以上上兩種編碼碼方式的優(yōu)優(yōu)點,采用用線性技術(shù)術(shù)構(gòu)成聲道道模型,不不只傳輸預預測參數(shù)和和清濁音信信息,而是是將預測誤誤差信息和和預測參數(shù)數(shù)同時傳輸輸,在接收收端構(gòu)成新新的激勵參參數(shù)去激勵勵預測參數(shù)數(shù)構(gòu)成的合合成濾波器器,使得合合成濾波器器輸出的信信號波形與與原始語聲聲信號的波波形最大程程度的擬合合,從而獲獲得自然度度較高的語語聲。這種編碼技技術(shù)的關(guān)鍵鍵是:如何何高效地傳傳輸預測誤誤差信息。。依據(jù)對激激勵信息的的不同處理理,這類編編碼主要有有:多脈沖沖線性預測測編碼(MPLPC)、規(guī)則則脈沖激勵勵線性預測測編碼(RPELPC)、碼碼激勵線性性預測編碼碼(CELPC)、、低時延的的碼激勵線線性預測編編碼(LD-CELPC)。。7.5.1電話語語音壓縮標標準信號頻率規(guī)規(guī)定在300Hz~~3.4kHz,采采用標準的的脈沖編碼碼調(diào)制(PCM),,當采樣頻頻率為8kHz,進進行8bit量化時時,所得數(shù)數(shù)據(jù)速率為為64kb/s,即即一個數(shù)字字電話。1972年年CCITT為電話話質(zhì)量和語語音壓縮制制定了PCM標準G.711,其速率率為64Kb/s,,使用非線線性量化技技術(shù),主要要用于公共共電話網(wǎng)中中。在ISO公公布的ITU-T一一系列音頻頻編碼標準準中,用于于電話語音音壓縮的有有G.711、G.721、、G.723、G.728、、G.729和G.729A等標準。。在選擇語語音壓縮標標準時,應應綜合考慮慮帶寬、時時延、算法法復雜度等等各種因素素。標準編碼類型比特率(kbps)MOS復雜性時延(ms)G.711PCM644.310.125G.721ADPCM324.0100.125G.728LD-CELP164.0500.625GSMRPE_LPT133.7520G.729G.729ACSA-CELP84.030、1515G.723.1ACPLP6.33.82537.5G.723.1MP-MLQ5.3

USDodLPC-102.4合成語音1022.5表7-2給給出了幾個個語音編碼碼標準的比比特率、MOS(長長話質(zhì)量的的語音平均均意見得分分)、復雜雜性(以G.711為基準))和時延((幀大小,,即語音流流量的時間間長度及前前視時間))。表7-2中中的GSM編碼標準準是1983年歐洲洲數(shù)字移動動特別工作作組(GSM)制定定的一種移移動電話的的壓縮標準準,它壓縮縮的音質(zhì)不不如G.711系統(tǒng)統(tǒng)。在GSM-6.10標準準中,采用用RPL-LTP算算法,壓縮縮后的一路路話音數(shù)碼碼率為13Kbps。G.723協(xié)議G.723協(xié)議是一個雙速速率語音編編碼建議,其兩種速速率分別是是5.3kb/s和和6.3kb/s。。此協(xié)議是是一個數(shù)字字傳輸系統(tǒng)統(tǒng)概況協(xié)議議,適用于于低速率多多媒體服務務中語音或或音頻信號號的壓縮算算法。它作作為完整的的H.324系列標標準的一部部分,是其其中語音編編碼建議,主要配合合低速率圖圖像編碼H.263標準。在在IP電話話網(wǎng)中,G.723協(xié)議被用用來實現(xiàn)實實時語音編編碼解碼處處理。G.723.1協(xié)議議的編解碼碼算法中兩兩種速率的的編解碼基基本原理是是一樣的,只是激勵勵信號的量量化方法有有差別。對對高速率((6.3kbit/s)編碼碼器,其激激勵信號采采用多脈沖沖最大似然然量化(MP-MLQ)法進進行量化,對低速率率(5.3kbit/s)編編碼器,其其激勵信號號采用代數(shù)數(shù)碼激碼線線性預測((ACELP)法量量化。2.調(diào)幅廣廣播質(zhì)量的的音頻壓縮縮編碼技術(shù)術(shù)標準頻率在50Hz一7kHz范范圍。ITU于1986年年通過G.722標標準。G.722標準是采用16kHz采采樣,16bit量量化,信號號數(shù)據(jù)速率率為224kbit/s,采采用子帶編碼方方法,將輸入音音頻信號經(jīng)經(jīng)濾波器分分成高子帶帶和低子帶帶兩個部分分,分別進進行ADPCM編碼,再混合形形成輸出碼碼流,224kbit/s可可以被壓縮縮成64kbit//s,最后后進行數(shù)據(jù)據(jù)插入(最最高插入速速率達16kbit/s),,因此利用用G.722標準可可以在窄帶帶綜合服務務數(shù)據(jù)網(wǎng)N-ISDN中的一一個B信道道上傳送調(diào)調(diào)幅廣播質(zhì)質(zhì)量的音頻頻信號。G.722.1標準準中,采樣率率為16kHz和16bit量化時,,能夠在24或32kbps速率下提提供7kHz的音頻頻帶寬,是是普通電話話呼叫質(zhì)量量的兩倍多多,所用速速率僅為先先前標準的的一半,并并可提供了了近于FM廣播的音音頻質(zhì)量。。適合于一一些重要應應用領域包包括:IP電話、第第三代移動動通信、PSTN高高品質(zhì)電話話會議和商商務應用(包括點到到點和多點點)、語音音流、ISDN寬帶帶技術(shù)、ISDN可可視電話和和會議電視視等。G.722.2主要采用代代數(shù)編碼激激勵線性預預測技術(shù),,符合此標標準的編解解碼器也被被稱為AMR-WB編解碼器器,已被3GPP采采用,作為為應用于GSM和第第三代無線線W-CDMA的寬寬帶編解碼碼器。這標標志著無線線與有線業(yè)業(yè)務首次得得以采用同同一編解碼碼器。AMR-WB編解碼器器在語音質(zhì)質(zhì)量方面取取得了突破破性進展,,意味著3G與IP固定網(wǎng)絡絡之間的互互通更加容容易。7.5.3高保真真立體聲音音頻壓縮標標準高保真立體體聲音頻范范圍是50Hz~20kHz。由ISO和ITU-T聯(lián)聯(lián)合制訂的的標準被稱稱為MPEG-音頻頻,它是動動態(tài)圖像編編碼的國際際標準MPEG中的的一個部分分。MPEG音頻和和視頻已廣廣泛用于VCD、CD-I、、多媒體、、PC中。。MPEG音音頻標準基基于人的聽聽覺心理模模型,它利利用編碼技技術(shù)對源文文件重新進進行編碼壓壓縮,編碼碼時刪除了了聽覺中不不敏感的部部分,從而而縮減了文文件的大小小,由此會會造成一些些失真。MPEG-1音頻技技術(shù)MPEG-1音頻的的壓縮原理理如圖7-5所示。。采用的方方案是子帶帶壓縮技術(shù))),采用多多相正交分分解濾波器器組將數(shù)字字化的寬帶帶音頻信號號分成32個子帶,,同時對信信號進行頻頻譜分析。。通過子帶帶信號與頻頻譜同步計計算,得出出對各子帶帶的掩蔽特特性,然后后分配不同同的量化比比特數(shù)。加加上CRC校驗碼,,得到標準準的MPEG碼流。。解碼端的的過程是::解幀、子子帶樣值解解碼、映射射還原和輸輸出標準PCM碼流流。MP1壓縮縮比為1::4,典型型的位率為為每通道192Kbit/s。是VCD的音頻頻壓縮的方方案。MP2壓縮縮比為1::6~1::8,典型型的位率為為每通道128Kbit/s,即稱稱掩蔽模式式通用子帶帶集成編碼碼與多路復復用,廣泛泛應用于數(shù)數(shù)字音頻廣廣播、數(shù)字字演播室等等數(shù)字音頻頻專業(yè)的制制作、交流流、存儲和和傳送。MP3壓縮縮比率可以以達到1::10~1:12。。典型位率率為64Kbit/s,它它綜合了MP2和ASPEC的優(yōu)點,,可以48kHz、、44.1kHz、、32kHz取樣,,每聲道的的數(shù)碼率32Kbps~448Kbps。適合合CD-DA。由于于MP3格格式的復雜雜度相對較較高,因而而不適合進進行實時編編碼,只有有在數(shù)碼率率較低的情情況下才具具有較高品品質(zhì)的音質(zhì)質(zhì)。根據(jù)需要的的不同,人人們又定義義了不同的的壓縮比率率。MPEG-1壓縮格格式分為3層,分別別是MPEGAudioLayer-1、、Layer-2和和Layer-3((簡寫為MP1、MP2、MP3)。。MPEG-2音頻技技術(shù)MPEG-2音頻和和MPEG-2視頻頻標準并行行開發(fā),于于1994年11月月完成。實實質(zhì)上是在在MPEG-1音頻頻基礎上增增加了多通通道MC和和多語音ML編碼。。MPEG-2音頻增增加了5.1通道的的多通道功功能MC,,即可以支支持最多5個主音頻頻通道(左左,中,右右,左環(huán)繞繞,右環(huán)繞繞),其中中C(中置置)、LS(左環(huán)繞繞)和RS(右環(huán)繞繞)三個通通道是在立立體聲的基基礎上增加加的。同時時附加一個個額外的““低頻增強強(LowFrequencyExtension)”通道道,專供傳傳送低音信信號。MPEG-2音頻還還增加的多多語音ML技術(shù),多多語音是獨獨立于5個個通道的解解說(輔助助聲音)通通道,最多多允許包括括高達7個個以上的音音頻通道。。為了適應于于非常低的的比特率和和有限帶寬寬需要的應應用,MPEG-2標準進行行了“低采采樣率擴展展”,新的的LSF((低采樣頻頻率)增加加了24kHz、22.05kHz、、16kHz的采樣樣頻率三種種,由此可可以提高數(shù)數(shù)據(jù)的壓縮縮率,使數(shù)數(shù)據(jù)比特率率更加低,,可以低到到8Kbps。MPEG2音頻的最最大特征是是“向后兼兼容性”。。MPEG-2解碼碼器必須接接受任何MPEG-1音頻流流。一種用用MC/ML編碼的的數(shù)據(jù),即即使使用了了不具有MC/ML功能的MPEG音音頻解碼器器,這種數(shù)數(shù)據(jù)也可以以作為2通通道的立體體聲進行重重放。另一方面,,MPEG-1解碼碼器可以解解碼MPEG-2音音頻流主數(shù)數(shù)據(jù)區(qū)中的的音頻信號號,這被稱稱為“向前前兼容性””。所以,,MPEG-2音頻頻與MPEG-1音音頻具有很很好的互換換性,并與與MPEG-2視頻頻廣泛用于于數(shù)字視頻頻、高清晰晰電視HDTV和高高質(zhì)量數(shù)字字音頻廣播播。7.6圖圖像數(shù)據(jù)壓壓縮標準在國際標準準化協(xié)會ISO批準準制定的多多媒體國際際標準中,,用于圖像像數(shù)據(jù)壓縮縮的重要標標準有JPEG、MPEG和和H(H.261H.263)系列列三種。從從圖像壓縮縮編碼的發(fā)發(fā)展過程來來說,可以以分成三個個階段:第第一階段著著重于圖像像信息冗余余度的壓縮縮方法,第第二階段著著重于圖像像視覺冗余余信息的壓壓縮方法,,第三階段段基于模型型的圖像壓壓縮方法。。7.6.1靜態(tài)圖圖像數(shù)據(jù)壓壓縮標準靜態(tài)圖像數(shù)數(shù)據(jù)壓縮標標準主要指JPEG(JointPhotographicExpertGroup)標標準,它是是由聯(lián)合圖圖形專家組組開發(fā)的,,該專家小小組由國際際標準化組組織(ISO)和國國際電報電電話咨詢委委員會(CCITT)兩家聯(lián)聯(lián)合成立的的。該小組組一直致力力于建立研研究適用于于彩色和單單色的,多多灰度連續(xù)續(xù)色調(diào)的,,靜態(tài)數(shù)字字圖像壓縮縮的國際標標準。該標標準是于1991年年提出的,,并在1992年后后被廣泛采采納后成為為國際標準準。1.JPEG標準JPEG是一個適用用范圍很廣廣的靜態(tài)圖像數(shù)數(shù)據(jù)壓縮標標準,不僅適用用于靜止圖圖像的壓縮縮,也常常常被用于電電視圖像序序列的幀內(nèi)內(nèi)圖像壓縮縮編碼。目前JPEG專家組組開發(fā)了兩兩種基本的的壓縮算法法:一種是采用用以離散余余弦變換DCT為基基礎的有損損壓縮算法法;另一種種是采用以以預測技術(shù)術(shù)為基礎的的無損壓縮縮算法。使用有損壓壓縮算法時時,在壓縮縮比為25:1的情況下,,壓縮后還還原得到的的圖像和原原始圖像相相比較,非非圖像專家家難以找到到它們之間間的區(qū)別,,因此得到到了廣泛的的應用。例例如在V-CD和DVD-Video電視圖像壓壓縮技術(shù)中中,就使用用JPEG的有損壓縮縮算法來取取消空間方方向上的冗冗余數(shù)據(jù)。。JPEG標標準它的具體目標是是:1).用戶戶可以對壓壓縮比、質(zhì)質(zhì)量效果進進行選擇。。2).算法能適應應不同的數(shù)數(shù)字圖像參參數(shù)、大小小、圖像內(nèi)內(nèi)容、彩色色空間、統(tǒng)統(tǒng)計特性等等,但二值值圖像除外外。3).壓縮縮比高,圖圖像質(zhì)量保保真程度好好。4).算法法的復雜程程度應能夠夠滿足硬、、軟件實現(xiàn)現(xiàn)的計算需需求。5).支持持多種操作作方式。JPEG壓壓縮是有損損壓縮,它它利用了人人的視角系系統(tǒng)的特性性,使用量量化和無損損壓縮編碼碼相結(jié)合來來去掉視角角的冗余信信息和數(shù)據(jù)據(jù)本身的冗冗余信息。。JPEG算法框圖圖如圖4-9所示,,壓縮編碼碼大致分成成三個步驟驟:(1)使用用正向離散散余弦變換換(ForwardDiscreteCosineTransform,F(xiàn)DCT))把空間域域表示的圖圖變換成頻頻率域表示示的圖。(2)使用用加權(quán)函數(shù)數(shù)對DCT系數(shù)進行行量化,這這個加權(quán)函函數(shù)對于人人的視覺系系統(tǒng)是最佳佳的。(3)使用用哈夫曼可可變字長編編碼器對量量化系數(shù)進進行編碼。。JPEG編編碼的壓縮縮過程譯碼或者叫叫做解壓縮縮的過程與與壓縮編碼碼過程正好好相反。JPEG算算法與彩色色空間無關(guān)關(guān),因此““RGB到到Y(jié)UV變變換”和““YUV到到RGB變變換”不包包含在JPEG算法法中。JPEG算法法處理的彩彩色圖像是是單獨的彩彩色分量圖圖像,因此此它可以壓壓縮來自不不同彩色空空間的數(shù)據(jù)據(jù),如RGB、YCbCr和和CMYK。為了能用單單一的壓縮縮碼流提供供多種性能能、滿足范范圍更為廣廣泛的應用用,JPEG工作組組于1996年開始始探索一種種新的靜止止圖像壓縮縮編碼標準準,并且稱稱它為JPEG2000。。JPEG2000是JPEG工作組組制定的并并于2000年底陸陸續(xù)公布的的基于JPEG標準準的最新的的靜止圖像像壓縮編碼碼的國際標標準,它之之所以比JPEG標標準優(yōu)越,,主要是不不再采用離離散傅立葉葉變換DCT算法為為主的編碼碼方法,改改用以DWT(DiscreteWaveletTransformation,離散散小波變換換算法)為為主的多解解析編碼方方法。2.JPEG2000標準JPEG-2000(ISO15444)標準準技術(shù)的目目標是“高高壓縮、低低比特速率率”。它基基于小波變變換的靜止止圖像壓縮縮標準,不不僅有更優(yōu)優(yōu)秀的壓縮縮性能,而而且有更豐豐富的處理理功能。JPEG-2000可提供更更高的解像像度(相當當于圖像分分辨率,如如:解像度度為852×480,41萬萬像素),,其伸縮能能力可以為為一個文件件提供從無無損到有損損的多種畫畫質(zhì)和解像像選擇。因此,它被被認為是互互聯(lián)網(wǎng)和無無線接入應應用的理想想影像編碼碼解決方案案。JPEG-2000特點它與JPEG的基本本系統(tǒng)相比比有以下的的優(yōu)點:(1)既支支持有損壓壓縮,也支支持無損壓壓縮方式。。(2)在壓壓縮時,可可指定圖片片感興趣的的區(qū)域,并并指定壓縮縮質(zhì)量;在在解壓縮時時,對這些些區(qū)域指定定解壓縮順順序及解壓壓縮質(zhì)量。。(3)在高高壓縮比下下,仍能保保持較高的的圖像質(zhì)量量。在類似似質(zhì)量的前前提下,JPEG2000的壓縮比比比JPEG高10%~30%。(4)支持持漸進式傳傳輸,即開開始時顯示示一個模糊糊、不清晰晰且質(zhì)量低低的圖像,,隨著數(shù)據(jù)據(jù)進一步被被接收,圖圖像清晰度度和質(zhì)量逐逐步提高,,最后顯示示出一個高高清晰度且且高質(zhì)量的的圖像。JPEG2000在節(jié)約和和充分利用用有限帶寬寬方面顯得得更加優(yōu)越越。(5)在有有限帶寬上上進行文件件傳輸時,,有很強的的糾錯能力力,在用戶戶指定文件件尺寸時,,能保證較較高的再現(xiàn)現(xiàn)圖像質(zhì)量量,以致在在無線領域域得到廣泛泛應用。(6)可對對編碼流進進行隨機訪訪問和處理理,因為它它的塊編碼碼是獨立的的,且編碼碼流具有包包裹式結(jié)構(gòu)構(gòu)。(7)使用用Alpha通道,,以滿足圖圖形藝術(shù)和和Internet的發(fā)展和和需求;(8)在彩彩色圖像處處理方面,,JPEG2000可處理理256個個通道的信信息。JPEG-2000的重點技技術(shù)在編碼算法法上,JPEG-2000采采用以小波波變換為主主的多解析析編碼方式式,包括離離散小波變變換(DWT)和bitplain位簡易算算術(shù)編碼((MQcoder)。JPEG-2000在技術(shù)上上之所以主主要采用新新的小波變變換,原因因是因為余弦變變換考察的的是全局特特征。即考考察整個時時域過程的的頻域特征征或整個頻頻域過程的的時域特征征,因此比比較適合于于平穩(wěn)過程程,但不適適合于非平平穩(wěn)過程。。在JPEG中是靠靠丟棄頻率率信息來實實現(xiàn)壓縮的的,因而圖圖像的壓縮縮率越高,,頻率信息息被丟棄的的越多。在在極端情況況下,JPEG只保保留了反映映圖像輪廓廓的基本信信息,而損損失精細全全部的圖像像細節(jié)。而而小波變換換考察的是是局部特征征。既能考考察局部時時域過程的的頻域特征征,又能考考察局部頻頻域過程的的時域特征征,因此也也適合于非非平穩(wěn)過程程。它能將將圖像變換換為一系列列小波系數(shù)數(shù),這些系系數(shù)可以被被高效壓縮縮和存儲,,此外,小小波的粗略略邊緣可以以更好地表表現(xiàn)圖像,,因為它消消除了DCT壓縮普普遍具有的的方塊效應應。7.6.2動態(tài)圖圖像數(shù)據(jù)壓壓縮標準動態(tài)圖像數(shù)數(shù)據(jù)壓縮標標準主要包包括MPEG、H(H.261H.263))、DVI。MPEG(MovingPictureExportsGroup)是活動動圖像專家家組,由ISO與IEC于1988年年成立,致致力于運動動圖像(MPEG視視頻)及其其伴音編碼碼(MPEG音頻)標準化工工作。MPEG組織織制定的各各個標準都都有不同的的目標和應應用,目前前已提出MPEG-1、MPEG-2、MPEG-4、、MPEG-7和MPEG-21標準準。H系列是由CCITT(國際電電報電話咨咨詢委員會會)通過的的標準,這這種標準與與JPEG及MPEG標準間間有明顯的的相似性,,但關(guān)鍵區(qū)區(qū)別是它是是為動態(tài)使使用設計的的,并提供供完全包含含的組織和和高水平的的交互控制制。DVI(DigitalVideoInteractive)是一一種工業(yè)標標準,其視視頻圖像的的壓縮算法法的性能與與MPEG-1相當當,即圖像像質(zhì)量可達達到VHS的水平,,壓縮后的的圖像數(shù)據(jù)據(jù)率約為1.5Mb/s。為為了擴大DVI技術(shù)術(shù)的應用,,Intel公司又又推出了DVI算法法的軟件解解碼算法,,稱為Indeo技技術(shù),它能能將為壓縮縮的數(shù)字視視頻文件壓壓縮為五分分之一到十十分之一。下面將主要要介紹MPEG和H標準。MPEG-1MPEG-1標準((ISO/IEC11172)于制定定于1992年,1993年年8月公布布,用于多多媒體和廣廣播電視,,這種編碼碼一般可以以以1.5Mbps左右的數(shù)數(shù)據(jù)傳輸率率傳送數(shù)字字存儲媒體體運動圖像像及其伴音音。MPEG-1的的壓縮率相相當高,例例如它可以以把221Mbit/秒的NTSC圖圖像壓縮到到1.2Mbit/秒,壓縮縮率為200:1。。由五個部分分組成:(1)MPEG-1系統(tǒng):規(guī)定了了運動圖像像數(shù)據(jù)、聲聲音數(shù)據(jù)及及其他相關(guān)關(guān)數(shù)據(jù)的同同步。(2)MPEG-1視頻:規(guī)定了了視頻數(shù)據(jù)據(jù)的編碼和和解碼。(3)MPEG-1音頻:規(guī)定了了聲音數(shù)據(jù)據(jù)的編碼和和解碼。。(4)MPEG-1一一致性測試試:說明如何何測試比特特數(shù)據(jù)流和和解碼器是是否滿足MPEG-1前3個個部分中所所規(guī)定的要要求。(5)MPEG-1軟件模擬擬:這部分內(nèi)內(nèi)容是一個個技術(shù)報告告,給出了了用軟件執(zhí)執(zhí)行MPEG-1標標準前3個個部分的結(jié)結(jié)果。MPEG-1標準簡簡介MPEG-1的應用用領域包括括:光盤、、數(shù)字音頻頻磁帶(DAT)、、磁帶設備備以及通信信網(wǎng)絡(如如ISDN和局域網(wǎng)網(wǎng)等)。其典型的應用用是VCD,,99%的VCD都是用用MPEG-1格式壓縮縮的,使用MPEG-1的壓縮算法法,可以把一一部120分分鐘長的電影影(未壓縮視視頻文件)壓壓縮到1.2GB左右大大小。為了支持多種種應用,可由由用戶來規(guī)定定多種輸入?yún)?shù),包括靈靈活的圖像尺尺寸和幀頻。。MPEG-1標準提供供了一些錄像像機的功能,,包括正放、、圖像凍結(jié)、、快進、快倒倒和慢放,此此外,還提供供了隨機存取取的功能。MPEG-1的應用領域域MPEG-2標準MPEG-2標準MPEG工作組制制定的第二個個國際標準,,標準號是ISO/IEC13818。它是是一個直接與與數(shù)字電視廣廣播有關(guān)的高高質(zhì)量圖像和和聲音編碼標標準。特別適用于廣廣播級的數(shù)字字電視的編碼碼和傳送,被被認定為SDTV和HDTV的編碼碼標準和MPEG-1相比增加加了隔行掃描描電視的編碼碼,提供了位位速率的可變變性能(scalability))功能。MPEG-2要要達到的最基基本目標是::位速率為4Mb/s~~9Mb/s,最高達15Mb/s。MPEG-2在系統(tǒng)和傳傳送方面作了了更加詳細的的規(guī)定和進一一步的完善。。MPEG-2是針對3~10Mbps的數(shù)據(jù)據(jù)傳輸率制定定的的運動圖圖像及其伴音音編碼的國際際標準。。MPEG-2包含9個部部分:(1)MPEG-2系統(tǒng)統(tǒng)(1994年)規(guī)定電電視圖像數(shù)據(jù)據(jù)、聲音數(shù)據(jù)據(jù)及其他相關(guān)關(guān)數(shù)據(jù)的同步步。(2)MPEG-2視頻頻(1994年)規(guī)定了了視頻數(shù)據(jù)的的編碼和解碼碼算法。(3)MPEG-2音頻頻規(guī)定了聲音音數(shù)據(jù)的編碼碼和解碼,是是MPEG-1Audio的擴充充,支持多個個聲道。(4)MPEG-2一致致性測試。(5)MPEG-2參考考軟件。(6)MPEG-2數(shù)字字存儲媒體命命令和控制擴擴展協(xié)議。(9)MPEG-2DSM-CC一致性擴展展測試。(7)MPEG-2高級級音頻編碼是是多聲道聲音音編碼算法標標準。(8)MPEG-2系統(tǒng)統(tǒng)解碼器實時時接口擴展標標準。這是與傳輸數(shù)數(shù)據(jù)流的實時時接口(Real-TimeInterface,RTI)標準,,它可以用來來適應來自網(wǎng)網(wǎng)絡的傳輸數(shù)數(shù)據(jù)流,如圖圖。與MPEG-1標準相比比,MPEG-2的不同同特性主要表表現(xiàn)在:(1)MPEG-2有““按幀編碼””和“按場編編碼”兩種模模式。在MPEG-1中是沒有有電視幀的概概念,只支持持逐行掃描,,不支持隔行行掃描。在MPEG-2中,針對隔隔行掃描的常常規(guī)電視圖像像專門設置了了“按幀編碼碼”模式,相相應的運動補補償算法也有有擴充,分為為“按幀運動動補償”和““按場運動補補償”,其編編碼效率顯著著提高。4個等級由低低到高為低等等級(LowLevel)、主等等級(MainLevel)、1440等級級(High–1440Level)和高等等級(HighLevel)。配配置和等級之之間可能的組組合如表。配置等級簡單配置主要配置信噪比可變配置空間可變配置高級配置高等級##1440等級###主等級####低等級##(2)MPEG-2的類類與等級。MPEG-2提出了類與與等級的概念念。類是按視視頻編碼技術(shù)術(shù)的簡單還是是復雜而確定定的;對每個個類,根據(jù)編編碼參數(shù)的不不同,即圖像像格式的簡單單還是復雜,,進一步劃分分為不同的等等級。MPEG-2標準準中規(guī)定了5種類4個等等級。5個類依次為為簡單類、主主類(MainProfile))、信噪比可可伸縮類(SNRProfile)、空間分分辨率可伸縮縮類(SimpleProfile)、高級級類(HighProfile))。(3)MPEG-2增加加了分層編碼碼。MPEG-2可伸縮性體體現(xiàn)在:空間分層編碼碼:提供空間間分辨率不同同的圖像。時間分層編碼碼:提供空間間分辨率相同同,但幀速率率不同的視頻頻信號。信噪比分層編編碼:提供具具有相同空間間分辨率,但但編碼質(zhì)量不不同的視頻比比特流。數(shù)據(jù)分割編碼碼:將編碼比比特流分成兩兩個優(yōu)先級不不同的部分。。(4)MPEG-2擴充充了系統(tǒng)層語語法。MPEG-2對系統(tǒng)層語語法有了較大大的擴充,包包含了兩類數(shù)數(shù)據(jù)碼流:傳傳輸碼流

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論