




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第6
章
多媒體數(shù)據(jù)壓縮解碼技術(shù)引言6.1數(shù)據(jù)壓縮解碼概述6.1.1基本概念6.1.2數(shù)據(jù)壓縮條件6.1.3壓縮和解壓縮分類和衡量標準6.2數(shù)據(jù)壓縮算法6.2.1霍夫曼編碼6.2.2算術(shù)編碼6.2.3游程編碼RLE6.2.4詞典編碼6.2.5預測編碼6.2.6變換編碼6.3常見壓縮標準6.3.1靜態(tài)圖像壓縮標準JPEG6.3.2運動圖像壓縮標準MPEG6.3.3音頻壓縮編碼技術(shù)標準本章小結(jié)思考與練習引言數(shù)字化后的圖像、音頻和視頻等媒體信息具有海量性,與當前計算機所提供的存儲資源和網(wǎng)絡帶寬之間有很大的差距,這給存儲及傳輸多媒體信息帶來了很大的困難。為此人們嘗試了各種技術(shù)方法,其中數(shù)據(jù)壓縮解碼技術(shù)作為解決上述問題的有效途徑,成為了當今通信、廣播、存儲和多媒體娛樂等領(lǐng)域的一項必不可少的關(guān)鍵技術(shù)。
本章講述了數(shù)據(jù)壓縮的基本概念、壓縮條件和壓縮編碼分類,并介紹了幾種數(shù)據(jù)壓縮算法和常見的壓縮標準。6.1數(shù)據(jù)壓縮解碼概述數(shù)字化了的多媒體信號的數(shù)據(jù)量非常大。6.6.1基本概念從硬件和軟件兩方面考慮硬件方面:提高存儲介質(zhì)的容量、提高系統(tǒng)和網(wǎng)絡的傳輸速率。有局限性,現(xiàn)有硬件發(fā)展的速度和程度不能和當前多媒體應用的海量數(shù)據(jù)量需求相匹配。軟件方面:采用數(shù)據(jù)壓縮技術(shù)降低數(shù)據(jù)量,以壓縮形式存儲和傳輸數(shù)據(jù)。是行之有效的方法,既節(jié)約空間,又提高通信干線的傳輸效率。數(shù)據(jù)壓縮流程最初作為信息論研究中的一個重要課題,在信息論中被稱為信源編碼。近年已成為獨立的體系,主要研究數(shù)據(jù)的表示、傳輸和轉(zhuǎn)換方法,以減少數(shù)據(jù)存儲空間,方便傳輸和存儲。數(shù)據(jù)壓縮解碼技術(shù)
在不丟失信息的前提下,按照一定的算法對數(shù)據(jù)進行重新組織,減少數(shù)據(jù)冗余和存儲空間,提高傳輸、存儲和處理效率的一種技術(shù)方法。
其本質(zhì)是去掉數(shù)字信號數(shù)據(jù)中的冗余數(shù)據(jù),用盡可能少的比特數(shù)來表示源信號并能將其還原。1.數(shù)據(jù)壓縮
還原壓縮數(shù)據(jù)的過程。
按壓縮和解壓縮算法耗費代價的不同,分為對稱應用和非對稱應用。對稱應用:編碼和解碼代價應基本相同。如視頻會議系統(tǒng)。非對稱應用:解碼比編碼過程耗費代價小。2.數(shù)據(jù)解碼6.1.2數(shù)據(jù)壓縮條件人類感官的生理局限性2.多媒體數(shù)據(jù)的冗余
冗余:信息所具有的各種性質(zhì)中多余的無用空間。聽覺局限性:聽覺掩蔽效應等。又稱“認知冗余”,人類的視覺、聽覺系統(tǒng)存在著各種生理局限性。視覺局限性:對色彩的感知不如對亮度的感知敏感;對藍色敏感度差;只能識別幾百種顏色等。1.人類感官的生理局限性紋理結(jié)構(gòu)規(guī)則、相互重疊的結(jié)構(gòu)表面。結(jié)構(gòu)冗余人類可以憑借經(jīng)驗辨識事物,無需進行全面的比較和鑒別。但計算機則沒有經(jīng)驗可循,只能按部就班地掃描和處理數(shù)據(jù),這種與人類的差異所造成的數(shù)據(jù)冗余就是知識冗余。知識冗余多媒體數(shù)據(jù)中存在的數(shù)據(jù)冗余類型:2.多媒體數(shù)據(jù)的冗余空間冗余時間冗余信息熵冗余結(jié)構(gòu)冗余知識冗余靜態(tài)圖像中經(jīng)常存在。
圖像中,規(guī)則物體和背景的表面物理特征具有相關(guān)性??臻g冗余音頻視頻中經(jīng)常存在。如:圖像序列中的兩幅相鄰的圖像之間有較大的相關(guān)性,甚至幾乎完全相同。時間冗余信息熵冗余什么是信息熵?為了從N個相等的可能事件中挑選出一個事件所需的信息度量和含量,即在N個事件中辨識特定的一個事件要詢問“是或否”次數(shù)。信息量從256個數(shù)中選定某一個數(shù)。先問“是否大于128?”,從而消除半數(shù)的可能事件;這樣只需要8次即可選出某數(shù)。每次詢問對應一個1bit的信息量,在256個數(shù)中選定某數(shù)所需的信息量是:log2256=8bit例信息量和事件出現(xiàn)的概率有關(guān),概率越大信息量越小,概率越小,信息量越大。
如果將信源所有可能事件的信息量平均,就得到了“平均信息量”。而信息熵就是一組數(shù)據(jù)所攜帶的平均信息量,即信息熵=平均信息量。定義:
其中:H為信息熵;N為數(shù)據(jù)類數(shù)或碼元個數(shù);Pi為yi出現(xiàn)的概率。信息熵也稱“編碼冗余”。無失真編碼定理:無失真編碼極限=信源所含平均信息量(熵)信源編碼時,為使單位數(shù)據(jù)量d接近或等于信息熵H(達到壓縮極限),應使:其中:d為單位數(shù)據(jù)量;N為數(shù)據(jù)類數(shù)或碼元個數(shù);b(yi)是分配給碼元yi的比特數(shù),
b(yi)=-log2Pi。實際應用中個碼元的先驗概率很難預測,比特分配很難達到最佳,因此實際單位數(shù)據(jù)量d>信息熵H,即存在信息熵冗余。信息熵冗余也稱熵壓縮法。既減少數(shù)據(jù)量,又減少信息量。解壓縮后不能完全恢復原始數(shù)據(jù)。
包括:預測編碼、變換編碼、子帶編碼等。廣泛應用于語音、圖像和視頻的數(shù)據(jù)壓縮。去掉了數(shù)據(jù)中的冗余,但不減少信息量,解壓縮后能完全恢復原始數(shù)據(jù)。包括:霍夫曼編碼、游程編碼、算術(shù)編碼、香農(nóng)編碼、LZW編碼等。一般用于文本數(shù)據(jù)、特殊應用場合的圖像數(shù)據(jù)(如指紋圖像、醫(yī)學圖像等)及應用軟件的壓縮,壓縮率較低。6.1.3壓縮和解壓縮分類和衡量標準1.有損壓縮編碼和無損壓縮編碼有損壓縮編碼無損壓縮編碼多媒體數(shù)據(jù)壓縮技術(shù)2.定長編碼和變長編碼采用不相同的位數(shù)對數(shù)據(jù)進行編碼。
如霍夫曼編碼、香農(nóng)編碼。采用相同的位數(shù)對數(shù)據(jù)進行編碼。
如:ASCII碼,碼長為1字節(jié);
漢字國標碼,碼長為2字節(jié)。變長編碼定長編碼壓縮比:原始數(shù)據(jù)量和壓縮后數(shù)據(jù)量的比值,衡量數(shù)據(jù)壓縮器效率的質(zhì)量指標。定義:R=輸出流大小/輸入流大小R<1——壓縮R>1——擴大如:MPEG-1音頻壓縮比1:4;MPEG-2音頻壓縮比1:6~1:8;MPEG-4可達1:10~1:12;MPEG對圖像的壓縮比達1:200。3.壓縮編碼的技術(shù)指標壓縮速度:編碼或解碼的快慢程度。
不同的應用要求不同:對稱壓縮時,要求壓縮和解壓縮速度都快,即實時進行;而非對稱壓縮,壓縮速度沒有過高要求,但解壓縮速度則必須是實時的。計算量:壓縮的計算量比解壓縮計算量要大,如動態(tài)圖像壓縮編碼的計算量約為解壓縮的4倍。3.壓縮編碼的技術(shù)指標壓縮質(zhì)量:壓縮后對媒體的感知效果。
只有有損壓縮會影響人對媒體的感知效果。6.2數(shù)據(jù)壓縮算法屬統(tǒng)計編碼一種,按信源符號出現(xiàn)概率大小排序,概率大的分配短碼,概率小的分配長碼。變長編碼,無損壓縮編碼基于編碼樹技術(shù),算法步驟:(1)將信源根據(jù)符號出現(xiàn)概率的大小按遞減的順序進行排序。
(2)把概率最小的兩個符號之概率相加合并組成一個新符號(節(jié)點),新符號的概率等于這兩個符號概率之和。(3)重復進行第1步和第2步,直到概率的和值等于1為止。
(4)從編碼樹的根開始回溯到原始的符號,并將每一下分枝賦值為1,上分枝賦值為0。(5)最后記錄下從概率1開始到當前信源符號之間的0、1序列,得到每個符號的編碼。
6.2.1霍夫曼編碼
已知各信源數(shù)據(jù)出現(xiàn)的概率如下:P(A)=0.16,P(B)=0.51,P(C)=0.09,P(D)=0.13,P(E)=0.11求霍夫曼編碼。編碼過程:1、P(C)和P(E)概率值為最小的兩個,被排在第一棵二叉樹中作為樹葉。它們的根節(jié)點CE的組合概率為P(CE)=P(C)+P(E)=0.20。從CE到C的一邊被標記為1,從CE到E的一邊被標記為0。2、現(xiàn)在各節(jié)點相應的概率為:P(A)=0.16,P(B)=0.51,P(CE)=0.20,P(D)=0.13P(D)和P(A)為概率最小的兩個節(jié)點,將這兩個節(jié)點作為葉子組合成一棵新的二叉樹。根節(jié)AD的組合概率為P(AD)=P(A)+P(D)=0.29。由AD到A的一邊標記為1,由AD到D的一邊標記為0。例:霍夫曼編碼
3、剩下節(jié)點的概率如下:P(AD)=0.29,P(B)=0.51,P(CE)=0.20P(AD)和P(CE)兩節(jié)點的概率最小,再將它們生成一棵二叉樹。其根節(jié)點ADCE的組合概率為0.49。由ADCE到AD一邊標記為0,由ADCE到CE的一邊標記為1。4、最后兩個節(jié)點相應的概率如下:P(ADCE)=0.49,P(B)=0.51它們生成最后一棵根節(jié)點為ADCEB的二叉樹。由ADCEB到B的一邊記為1,由ADCEB到ADCE的一邊記為0。5、下圖為霍夫曼編碼。編碼結(jié)果被存放在一個表中:w(A)=001,w(B)=1,w(C)=011,w(D)=000,w(E)=010例:霍夫曼編碼例:霍夫曼編碼編碼長度可變,壓縮與解壓縮較慢。硬件實現(xiàn)困難。編碼效率取決于信號源的數(shù)據(jù)出現(xiàn)概率。編碼不唯一,當幾個節(jié)點的概率值相同時,選擇方式的不同和構(gòu)造新節(jié)點的兩個子節(jié)點位置關(guān)系不同都可以導致不同的編碼,但不同的編碼方案平均碼長基本一致。沒有錯誤保護功能,在譯碼時,但如果碼串中有錯誤,那怕僅僅是1位出現(xiàn)錯誤,也會引起一連串的錯誤?;舴蚵幋a特點屬統(tǒng)計編碼一種,無損壓縮編碼。某些方面優(yōu)于霍夫曼編碼,在JPEG標準的擴展系統(tǒng)中,算術(shù)編碼已經(jīng)取代了霍夫曼編碼。給定事件序列的算法步驟:編碼器在開始時將“當前間隔”[L,H)設(shè)置為[0,1)。
對每一事件,按步驟(a)和(b)進行處理
(a)將“當前間隔”分為子間隔,每一個事件一個。
(b)一個子間隔的大小與下一個將出現(xiàn)的事件的概率成比例,選擇子間隔對應于下一個確切發(fā)生的事件相對應,并使它成為新的“當前間隔”。
最后輸出的“當前間隔”的下邊界就是該給定事件序列的算術(shù)編碼。
6.2.2算術(shù)編碼設(shè)信源符號為{A,B,C,D},符號概率分別為:{0.1,0.4,0.2,0.3}如果二進制消息序列的輸入為:CADACDB算術(shù)編碼過程如下圖:算術(shù)編碼——例1:DCBACADACDB編碼過程譯碼過程適用于靜態(tài)圖像。基本編碼原則:重復的數(shù)據(jù)值序列(或稱為“流”)用一個重復次數(shù)和單個數(shù)據(jù)值來代替。常用格式三字節(jié)編碼:二字節(jié)編碼:6.2.3游程編碼RLE控制符
重復次數(shù)
被重復字符
設(shè)有字符串:“RTAAAASDEEEEE”三字節(jié)編碼為:RT*4ASD*5E
說明——“*”為控制符二字節(jié)編碼:1R1T4A1S1D5E游程編碼——例重復次數(shù)
被重復字符
詞典:用以前處理過的數(shù)據(jù)來表示編碼過程中遇到的重復部分。編碼思想:企圖查找正在壓縮的字符序列是否在前面的輸入數(shù)據(jù)中出現(xiàn)過,如果是,則用指向早期出現(xiàn)過的字符串的“指針”替代重復的字符串。代表算法:LZ77算法、LZSS算法無損壓縮編碼依據(jù)數(shù)據(jù)本身包含有重復代碼序列的特性。6.2.4詞典編碼第一類詞典編碼輸入數(shù)據(jù)流輸出數(shù)據(jù)流短語詞典:從輸入的數(shù)據(jù)中創(chuàng)建。編碼數(shù)據(jù)過程中,當遇到已經(jīng)在詞典中出現(xiàn)的“短語”時,編碼器就輸出這個詞典中的短語的“索引號”,而不是短語本身。代表算法:LZ78算法、LZW算法第二類詞典編碼輸入數(shù)據(jù)流輸出數(shù)據(jù)流6.2.5預測編碼根據(jù)離散信號之間存在著一定關(guān)聯(lián)性的特點,利用前面一個或多個信號預測下一個信號進行,然后對實際值和預測值的差(預測誤差)進行編碼。
1.預測編碼的原理預測編碼步驟:(1)建立一個供預測用的數(shù)學模型。(2)利用以往的樣本數(shù)據(jù)對新樣本值進行預測。(3)將預測值與實際值相減,對其差值進行預測。減少了數(shù)據(jù)時間和空間上的相關(guān)性如果預測比較準確,誤差就會很小較適合于聲音、圖像數(shù)據(jù)的壓縮直觀、簡捷、易于實現(xiàn),特別是用于硬件實現(xiàn),但壓縮能力有限,如DPCM只能壓縮到2~4bit像素幾種預測編碼:自適應脈沖編碼調(diào)制APCM、差分脈沖編碼調(diào)制DPCM、自適應差分脈沖編碼調(diào)制ADPCM等預測編碼特點在PCM系統(tǒng)中,原始的模擬信號經(jīng)過采樣后得到的每一個樣值都被量化成為數(shù)字信號。為了壓縮數(shù)據(jù),可以不對每一樣值都進行量化,而是預測下一樣值,并量化實際值與預測值之間的差值,這就是差分脈沖編碼調(diào)制DPCM。2.差分脈沖編碼調(diào)制DPCM先對信號進行某種函數(shù)變換,從一種信號(空間)變換到另一種(空間),然后再對信號進行編碼。一種間接編碼方法。它是將原始信號經(jīng)過數(shù)學上的正交變換后,得到一系列的變換系數(shù),再對這些系數(shù)進行量化、編碼、傳輸。6.2.6變換編碼編碼、解碼原理6.3常見壓縮標準6.3.1靜態(tài)圖像壓縮標準JPEG
JPEG(JointPhotographicExpertsGroup)是由國際標準化組織ISO和國際電工技術(shù)委員會IEC聯(lián)合組成的一個專家組,負責制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標準,這個專家組開發(fā)的算法稱為JPEG算法,已成為國際通用標準,因此又稱為JPEG標準。用JPEG標準編碼的圖像文件后輟名為“.jpg”或“.jpeg”,是一種支持8位和24位色彩的壓縮位圖格式,適合在網(wǎng)絡上傳輸。
JPEG簡介JPEG編碼處理過程圖像塊排序系數(shù)的Z形排序適用于連續(xù)色調(diào)的、多級灰度和彩色的靜止圖像??呻S意選擇期望的壓縮比值。平均壓縮比大約15:1;無損壓縮比大約為4:1;有損壓縮比在10:1~100:1之間。當壓縮比大于50倍時將可能出現(xiàn)方塊效應。適用于大部分通用的計算機平臺JPEG特點6.3.2運動圖像壓縮標準MPEG
ISO和IEC成立的運動圖像專家組(MPEG,MovingPictureExpertsGroup),研究和開發(fā)運動圖像和音頻的壓縮。MPEG標準是音頻、視頻解壓算法的綜合描述,它還對怎樣多路復合壓縮比特流和如何使解碼后的媒體同步等進行討論和規(guī)定。
MPEG簡介MPEG-1標準(信息技術(shù)——用于數(shù)據(jù)率1.5Mbit/s的數(shù)字存儲媒體的電視圖像和伴音編碼)。1991年制定,文件擴展名包括*.mpg、*.mlv、*.mpe、*.mpeg及VCD光盤中的.dat文件等。MPEG-2標準(信息技術(shù)——活動圖像和伴音信息的通用編碼)。1994年制定,設(shè)計目標為高級工業(yè)標準的圖像質(zhì)量以及更高的傳輸率。文件擴展名有.mpg、.mpe、.mpeg、.m2v及DVD上的.vob文件等。MPEG-4標準(甚低速率視聽編碼)。制定于1998年,為了播放流式媒體的高質(zhì)量視頻而專門設(shè)計。MPEG-7標準(多媒體內(nèi)容描述接口)MPEG-21標準(多媒體框架)已開發(fā)和正開發(fā)的MPEG標準6.3.3音頻壓縮編碼技術(shù)標準國際電報電話咨詢委員會(CCITT)和國際標準化組織(ISO)先后提出一系列有關(guān)音頻編碼的建議。G.711標準:主要應用于公共電話網(wǎng)。G.721標準:目前其應用包括電視會議的語音編碼、多媒體多路復用裝置、數(shù)字錄音電話及高質(zhì)量的語音合成器。G.722標準:主要用于高質(zhì)量語音通信會議等。G.723標準:應用于可視電話、IP電話等。G.728標準:為了進一步適應低速率語音通信的要求而制定的標準,主要用于公共電話。G.729.A標準:主要用于無線移動網(wǎng)、數(shù)字多路復用系統(tǒng)和計算機通信系統(tǒng)的應用。1.語音壓縮解壓標準語音壓縮/解壓標準應用在多媒體數(shù)字通信方面(包括電視會議等)的標準。2.H系列標準
MPEG-1音頻壓縮技術(shù)的數(shù)據(jù)速率為每聲道32~448kbit/s,適合于CD-DA光盤應用。MPEG-2音頻標準由兩部分組成:MPEG-2音頻和MPEG-2AAC(先進的音頻編碼,ISO/IEC13818-3)。MPEG-2音頻編碼標準是對MPEG-1后向兼容的、支持二至五聲道的后繼版本。MPEG-4Audio標準可集成從話音到高質(zhì)量的多通道聲音,從自然聲音到合成聲音。MPEG-7Audio標準提供了音頻描述工具。3.MPEG音頻標準本章小結(jié)數(shù)據(jù)壓縮技術(shù)一般分為有損壓縮和無損壓縮。
無損壓縮是指重構(gòu)壓縮數(shù)據(jù)(還原,解壓縮),而重構(gòu)數(shù)據(jù)與原來數(shù)據(jù)完全相同。典型的無損壓縮算法有:香農(nóng)編碼、哈夫曼編碼、算術(shù)編碼、行程程編碼等。
有損壓縮是重構(gòu)使用壓縮后的數(shù)據(jù),其重構(gòu)數(shù)據(jù)與原來數(shù)據(jù)有所不同,但不影響原始資料表達信息。常用的有損壓縮算法有預測編碼、變換編碼等。各類編碼算法衍生出不同的壓縮標準,包括:靜態(tài)圖像壓縮標準JPEG、運動圖像壓縮標準MPEG和音頻壓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- JIS D 9111-2010 自行車.分類和基本特性
- 別墅使用手冊
- 北師大版歷史七年級1至7課導學案
- (高清版)DB34∕T 5196-2025 生態(tài)濕地蓄洪區(qū)植被恢復技術(shù)導則
- 安全生產(chǎn)月工作總結(jié)
- 鼻炎膠囊改善鼻炎牙周病并發(fā)癥的療效
- 兒童飲食和營養(yǎng)要點
- 北京市豐臺區(qū)2024-2025學年高二下學期4月期中考試政治試題
- 小店區(qū)工程預算活動方案
- 布吉公司慶典活動方案
- 2025年重慶市中考數(shù)學試卷真題(含標準答案)
- 中醫(yī)基礎(chǔ)學課件護理情志
- 小學三年級科學下冊教案
- 2025年中小學教師師德知識競賽試題庫及答案
- 2025年河北省中考乾坤押題卷化學試卷B及答案
- 2025-2030中國美容美發(fā)行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025年中國不銹鋼蝕刻板數(shù)據(jù)監(jiān)測研究報告
- 浙江省諸暨市2025年5月高三適應性考試-地理+答案
- (統(tǒng)編版2025)歷史七年級下冊新教材變化及教學建議
- 蘋果店員入職試題及答案
- 配電室安全管理培訓課件
評論
0/150
提交評論