ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第1頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第2頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第3頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第4頁
ch4-多媒體數(shù)據(jù)壓縮編碼技術(shù)_第5頁
已閱讀5頁,還剩113頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1多媒體技術(shù)根底蔡宇輝湖南大學(xué)軟件學(xué)院rj_cyhhnu2第四章 多媒體數(shù)據(jù)緊縮編碼技術(shù)3第四章的內(nèi)容多媒體數(shù)據(jù)緊縮編碼概述重要性、能夠性、分類脈沖編碼調(diào)制PCM統(tǒng)計編碼:Huffman編碼、算術(shù)編碼預(yù)測編碼:DPCM、ADPCM、幀間預(yù)測變換編碼多媒體數(shù)據(jù)緊縮編碼的國際規(guī)范JPEG、MPEG4第一節(jié) 數(shù)據(jù)緊縮編碼概述1.1 多媒體數(shù)據(jù)緊縮編碼的重要性1.2 多媒體數(shù)據(jù)緊縮編碼的能夠性1.3 多媒體數(shù)據(jù)緊縮編碼的分類51.1 數(shù)據(jù)緊縮編碼的重要性在多媒體技術(shù)中,處置的多媒體數(shù)據(jù)都應(yīng)是數(shù)字信號,傳統(tǒng)的媒體信息需求進(jìn)展采樣和量化后方能在計算機(jī)中處置。ADC放大器6原始媒體信息數(shù)字化后的數(shù)據(jù)量宏大。

2、例1:一頁B5180255mm大小的文件,以中等分辨率300dpi、8位色方式掃描,其數(shù)據(jù)量為6.61MB。保管一部1813頁需求11983.93M650M的CD得刻19張。7例2:立體聲的激光唱盤,采樣頻率為44.1kHz,量化位數(shù)為16,那么一秒鐘的音頻數(shù)據(jù)量就可達(dá)172KB。650M的CD只可存儲1小時音樂。ADC8對于視頻,數(shù)據(jù)量的問題那么更加突出。例3:采用PAL制式,采樣格式為4:4:4,24位色,那么一秒鐘的視頻數(shù)據(jù)量就可達(dá)31.3MB。電影時長100分鐘需求約289張650M的CD存放。采集卡9由于多媒體信息的數(shù)據(jù)量非常龐大,給存儲器的存儲容量、通訊線路的帶寬資源、傳輸速率以及

3、計算機(jī)的處置速度都添加了極大壓力。處理方法:從硬件設(shè)備入手:添加存儲器、帶寬資源;研討新型線纜提高傳輸效率;運用快速的高檔計算機(jī)從信息內(nèi)容入手:進(jìn)展數(shù)據(jù)緊縮編碼。根本的處理之道10數(shù)據(jù)緊縮對多媒體運用的意義經(jīng)過數(shù)據(jù)緊縮技術(shù)可減少多媒體信息的數(shù)據(jù)量,其意義在于:提高了傳輸效率節(jié)約了存儲空間使計算機(jī)可以實時處置多媒體信息加快了處置速度111.2 數(shù)據(jù)緊縮編碼的能夠性多媒體數(shù)據(jù)能否進(jìn)展緊縮?研討闡明,多媒體信息中存在大量的冗余,去掉這些冗余數(shù)據(jù)便可實現(xiàn)數(shù)據(jù)的緊縮。冗余數(shù)據(jù)可用信息原始的多媒體數(shù)據(jù)12音頻中的冗余音頻中的冗余信息主要有:時域冗余幅度的非均勻分布;樣本間的相關(guān)性;周期之間的相關(guān)性;基音之

4、間的相關(guān)性;靜止系數(shù)間隔;長時自相關(guān)函數(shù)。頻域冗余非均勻的長時功率譜密度;語音特有的短時功率譜密度。人耳的聽覺得分辨才干有限。13圖像/視頻中的冗余圖像/視頻信息中包含有大量的冗余,主要有以下不同類型的冗余信息:空間冗余時間冗余構(gòu)造冗余知識冗余視覺冗余圖像區(qū)域的一樣性冗余紋理的統(tǒng)計冗余14a. 空間冗余空間冗余是靜態(tài)圖像中最主要的一種冗余。通常的圖像都描畫了某個場景,其相鄰像素點之間存在一定的空間銜接性。假設(shè)編碼時不思索這一相關(guān)性,就會呵斥空間冗余。左邊的圖像顯示了一個規(guī)那么物體,其大量像素點的亮度、飽和度、顏色等參數(shù)都一樣。 15b. 時間冗余時間冗余是視頻中常見的一種冗余。序列圖像中,相鄰

5、幀往往包含有一樣的背景和運動物體,只是運動物體的位置有所變化,因此相鄰兩幀的數(shù)據(jù)差別很小,具有時間上的銜接性。假設(shè)編碼時不思索這一相關(guān)性,就會呵斥時間冗余。16c. 構(gòu)造冗余有些圖像中有規(guī)那么紋理,其像素值存在明顯的分布方式,只需知道分布方式,便可經(jīng)過某種方法生成圖像,這種數(shù)據(jù)冗余即構(gòu)造冗余。規(guī)那么的紋理圖像17d. 知識冗余對圖像的了解有時與某些知識有相當(dāng)大的相關(guān)性,例如人臉的圖像就具有同樣的五官位置??梢愿鶕?jù)已有的知識構(gòu)造根本模型,并創(chuàng)建特征圖像庫,那么只需提供少量的特征參數(shù)信息便可生成圖像,這種數(shù)據(jù)冗余即知識冗余。18e. 視覺冗余視覺冗余是針對人眼的視覺特性而言的。人對圖像的敏感性是非

6、均勻、非線性的,而普通的編碼卻是線性方式,因此存在視覺冗余。視覺系統(tǒng)對亮度比對色度敏感。視覺系統(tǒng)對低頻信號比對高頻信號敏感。視覺系統(tǒng)對靜止圖像比對運動圖像敏感。視覺系統(tǒng)對程度、垂直線條比對斜線條敏感。隨著亮度的添加,視覺系統(tǒng)對量化誤差的敏感度降低。高光區(qū)可用較少的量化位數(shù)視覺系統(tǒng)把圖像的邊緣和非邊緣區(qū)域分開處置。視覺系統(tǒng)總是把視網(wǎng)膜上的圖像分解成假設(shè)干個空間有向的頻率通道后,再做進(jìn)一步處置。19f. 圖像區(qū)域的一樣性冗余有的圖像存在一些一樣或相近的區(qū)域,從而產(chǎn)生數(shù)據(jù)的反復(fù)性存儲,這就是圖像區(qū)域的一樣性冗余??梢灾挥涗浺粋€區(qū)域中各個像素的值,與其一樣或相近的區(qū)域那么不用記錄。向量量化方法就是針對

7、這種冗余進(jìn)展數(shù)據(jù)緊縮的。20g. 紋理的統(tǒng)計冗余有些紋理并不嚴(yán)厲服從某一分布規(guī)律,但它在統(tǒng)計意義上又符合該規(guī)律,這種數(shù)據(jù)冗余即紋理的統(tǒng)計冗余??兹赣鹈募y理分布211.3 數(shù)據(jù)緊縮編碼的分類22多媒體數(shù)據(jù)緊縮編碼方法有很多種,根據(jù)不同的根據(jù)可產(chǎn)生不同的分類:按照編碼算法的原理:分成脈沖編碼調(diào)制、預(yù)測編碼、變換編碼、量化與向量量化編碼、統(tǒng)計編碼、子帶編碼、構(gòu)造編碼、模型編碼、混合編碼等等;根據(jù)質(zhì)量有無失真:分成有損失編碼和無損失編碼;按照其作用域在空間或頻率上:分成空間方法、變換方法和混合方法;根據(jù)能否自順應(yīng):分成自順應(yīng)性編碼和非順應(yīng)性編碼。23無損編碼和有損編碼實踐上,信息進(jìn)展數(shù)字化時,量化誤

8、差是不可防止的。此處的“無損 和“有損是針對編碼過程而言的。無損編碼:也稱冗余緊縮法。將編碼后的數(shù)據(jù)進(jìn)展解碼,所得數(shù)據(jù)和編碼前的原始數(shù)據(jù)嚴(yán)厲一致,緊縮比約為2:15:1,常用的算法有:Huffman編碼、算術(shù)編碼、行程編碼RLE、詞典編碼等。有損編碼:也稱熵緊縮法。解碼得到的復(fù)原數(shù)據(jù)與原始數(shù)據(jù)之間存在一定的誤差,但并不影響人對原始資料表達(dá)信息的了解,緊縮比從幾倍到上百倍。2425緊縮軟件實踐上就是運用上述這些算法進(jìn)展緊縮的。26衡量編碼方法優(yōu)劣的目的衡量緊縮編碼方法優(yōu)劣的重要目的有:緊縮比要高;緊縮與解壓的速度快;算法簡單,適宜于硬件實現(xiàn);解緊縮后復(fù)原信息的質(zhì)量高。27第二節(jié) 脈沖編碼調(diào)制脈沖

9、編碼調(diào)制:PCM,即將延續(xù)模擬信號數(shù)字化,包括采樣、量化/編碼。模擬量經(jīng)過A/D轉(zhuǎn)換,得到二進(jìn)制碼的過程,也稱PCM編碼。其它的編碼方法都是在模擬信號經(jīng)過PCM編碼后再進(jìn)展的緊縮編碼方法。28PCM編碼過程29第三節(jié) 統(tǒng)計編碼數(shù)據(jù)緊縮技術(shù)的實際根底是信息論,根據(jù)信息論的原理,可以找到最正確的數(shù)據(jù)緊縮編碼方法。數(shù)據(jù)緊縮的實際極限是信息熵,統(tǒng)計編碼就是利用了信息熵原理,因此也稱作信息熵編碼、熵保管編碼或熵編碼。統(tǒng)計編碼是一種無損的緊縮方法,如香農(nóng)編碼、 Huffman編碼、算術(shù)編碼等。303.1 統(tǒng)計編碼的原理信息量和信息熵熵是信息論中的概念,是信息量的度量方法。要了解什么是“信息熵,先得了解信息

10、、信息量的含義。什么是“熵?31下面以信源編碼模型來闡明。編碼器信源音訊集編碼輸出集X=x1,xnZ=z1,zn符號集Am=a1,amX為音訊集,由n個信號單元xj構(gòu)成Z為輸出集,由n個碼字zj構(gòu)成,zj與xj一一對應(yīng)。Am 是符號集,由m個碼元 ai構(gòu)成,符號集中間的碼元組成輸出碼字。32當(dāng)信源發(fā)出某個隨機(jī)事件音訊xj后,接納端收到一個相應(yīng)的碼字zj。那么,接納到的這個碼字中包含了多少有用的信息呢?信息是用不確定性的量度定義的。音訊xj出現(xiàn)的能夠性愈小,那么其帶給人們的信息就愈多;反之,音訊出現(xiàn)的能夠性愈大,那么它能給人們提供的新信息有用信息就愈少。在數(shù)學(xué)上,一條音訊所傳輸?shù)男畔⑹瞧涑霈F(xiàn)概率

11、的單調(diào)下降函數(shù)。33信息量信息量:從N個能夠事件中選出一個事件所需求的信息度量或含量。對于計算機(jī)的二進(jìn)制編碼,可以這么了解:從N個事件中區(qū)分出一個特定事件,最少需求回答多少次“yes or no疑問。現(xiàn)實上,每次提問都會得到一個“yes or no的回答,可以用0或1表示,即1bit,假設(shè)提問n次,那么信息量為nbit。34例如例一:從164的整數(shù)中選出一個數(shù)??上忍釂枴澳芊翊笥?2?,以消除半數(shù)的能夠,然后再進(jìn)展半數(shù)的訊問,這樣只需6次便可確定一個數(shù),其信息量為6bit。例二:假設(shè)只需區(qū)分某個數(shù)能否大于32,那么只需訊問一次便可得出結(jié)論,其信息量只需1bit。從上兩例中可看出,大于或者小于3

12、2,這種情況的概率比詳細(xì)等于某一個數(shù)的概率要大,但其信息量反而小單調(diào)下降。35信息量的數(shù)學(xué)表述信息論定義了一種度量信息量的方法:其中:I(xj)是信源X發(fā)出xj后,接納端接納到的信息量的量度。P(xj)是信源X發(fā)出xj的先驗概率,有:請用上述公式求例一的信息量。36信息熵假設(shè)將信源一切能夠事件的信息量進(jìn)展統(tǒng)計平均即求其數(shù)學(xué)期望,就得到了信息熵。信源X發(fā)出的xjj=1,2,n,xj出現(xiàn)的概率為P(xj),那么信源X的熵為:37例如假設(shè)一幅由40個像素組成的灰度圖像,共有5級灰度,每一級灰度都是一種信源發(fā)出的符號,分別用AE表示。40個像素中有15個灰度為A,7個灰度為B,7個灰度為C,6個灰度為

13、D,5個灰度為E。試求該灰度圖像的熵。38 該灰度圖像的熵為2.196bit。39統(tǒng)計編碼的目的統(tǒng)計編碼就根據(jù)信源信號出現(xiàn)概率的分布特性進(jìn)展緊縮的。統(tǒng)計編碼的目的:在信源符號和碼字之間建立明確的一一對應(yīng)關(guān)系;編碼過程中不喪失信息量即信息熵的大小不變,以便在恢復(fù)時能準(zhǔn)確地再現(xiàn)原信號,實現(xiàn)無損緊縮;平均碼長或碼率應(yīng)盡量小。40熵和平均碼長可用熵來衡量該編碼能否為最正確編碼:當(dāng) ,有冗余,不是最正確;當(dāng) ,不能夠出現(xiàn);當(dāng) ,是最正確編碼 稍大于 其中 表示編碼器輸出碼字的平均碼長??梢?,熵值是平均碼長的下限。413.2 Huffman編碼最正確編碼定理:在變字長碼中,對于出現(xiàn)概率大的信息符號編以短字

14、長的碼,對于出現(xiàn)概率小的信息符號編以長字長的碼。假設(shè)碼字長度嚴(yán)厲按照符號概率的大小的相反順序陳列,那么平均碼字長度一定小于按任何其他符號順序陳列方式得到的碼字長度。Huffman編碼:利用了最正確編碼定理,是最常用的一種統(tǒng)計編碼。42Huffman編碼方法先把信源符號按概率大小順序陳列,并設(shè)法按逆次序分配碼字長度。對于出現(xiàn)頻率大的符號用較少的位數(shù)來表示;對于出現(xiàn)頻率小的符號用較多的位數(shù)來表示。Huffman編碼方法采用的碼字長度是可變的,因此較難在緊縮編碼后的文件中進(jìn)展內(nèi)容的查找。43Huffman編碼的思緒把信源符號按概率大小順序陳列,并設(shè)法按逆次序分配碼字的長度。在分配碼字長度時,首先將出

15、現(xiàn)概率最小的兩個符號的概率相加合成一個概率。把這個合成概率看成是一個新組合符號地概率,反復(fù)上述做法直到最后只剩下兩個符號概率為止。完成以上概率順序陳列后,再反過來逐漸向前進(jìn)展編碼,每一次有二個分支各賦予一個二進(jìn)制碼,可以對概率大的賦為0,概率小的賦為1。44Huffman編碼的步驟對每個信息符號進(jìn)展概率統(tǒng)計;將信源符號按概率的遞減順序陳列;將最后的兩個小概率相加作為新符號的概率, 此時概率個數(shù)將減少一個;反復(fù)第2、3步,直到只剩兩個概率;將概率大的賦“0,概率小的賦“1;逆順序往信源符號推,不是合并的編碼不變,假設(shè)是合并的,那么在編碼后面按照第5步的方法添加0或1。45編碼實例信源X有7個信息

16、符號,其概率為: 請對其進(jìn)展Huffman編碼,寫出其碼樹、碼長,并計算平均碼長和熵。12345670.350.200.150.100.100.060.0446信息符號概率第1步第2步第3步第4步第5步10.350.350.350.350.400.6020.200.200.200.250.350.4030.150.150.200.200.2540.100.100.150.2050.100.100.1060.060.1070.04011000100011011001011010011001001001111011100100100111101110111147碼字的平均碼長為:熵為:48Huff

17、man編碼小結(jié)平均碼長大于熵,小于等長碼的碼長。Huffman編碼能保證解碼的獨一性,短碼字不會是長碼字的前綴。Huffman編碼沒有錯誤維護(hù)功能。運用Huffman編碼時,接納端需保管一個與發(fā)送端完全一樣的Huffman碼表。Huffman編碼在信源符號出現(xiàn)概率分布不均勻時編碼效率較高,假設(shè)概率分別均勻時普通不采用Huffman編碼。Huffman編碼的緊縮比取決于信源符號出現(xiàn)的概率,越集中那么緊縮比越高。493.3 算術(shù)編碼20世紀(jì)60年代初,Elias初次提出了算術(shù)編碼的概念。1976年,開展了算術(shù)編碼的適用技術(shù)。算術(shù)編碼方法比Huffman編碼復(fù)雜,但它不需求接納端保管一份Huffma

18、n碼表,且具有自順應(yīng)才干。算術(shù)編碼是目前實現(xiàn)高效緊縮數(shù)據(jù)中很有出路的編碼方法。50根本原理和編碼步驟算術(shù)編碼實踐上是用一個浮點數(shù)替代一個輸入流中的符號。將實數(shù)半開區(qū)間0, 1) 進(jìn)展分割,每一符號對應(yīng)0, 1)上的一個子區(qū)間,區(qū)間長度為該符號出現(xiàn)的概率;把要編碼的整段音訊映射到0, 1),根據(jù)這段音訊符號的順序確定新的實數(shù)子區(qū)間;最終得到一個0, 1)上的子區(qū)間,從中任選一個實數(shù),該實數(shù)就是對整段數(shù)據(jù)進(jìn)展編碼后的輸出代碼。51例:輸入“eai,最后得到的子區(qū)間為0.23, 0.236),取該區(qū)間的任一個數(shù)普通取最小的值,如0.230即為eai的編碼。52在算術(shù)編碼中,一段音訊是用0到1之間的一

19、個實數(shù)來編碼表示的。算術(shù)編碼方法用到了兩個根本的參數(shù):信源符號的概率和編碼間隔。信源符號的概率決議了緊縮編碼的效率,也決議了編碼過程中的間隔。編碼間隔最終決議了符號編碼后的輸出。需求編碼的信息越長,那么表示它的編碼間隔就越小,實數(shù)的小數(shù)位就越多。53編碼實例假設(shè)信源符號有4個(00, 01, 10, 11),其概率分別為(0.1, 0.4, 0.2, 0.3)。根據(jù)概率把間隔0, 1)分成4個子間隔:0, 0.1), 0.1, 0.5), 0.5, 0.7), 0.7, 1)。音訊序列的輸入為:10 00 11 00 10 11 015455二進(jìn)制的算術(shù)編碼計算機(jī)中任何音訊都是由0、1組合而成

20、的,可以了解為信源符號只需0和1。即:每次分割區(qū)間時,只需分成兩個子區(qū)間,一個對應(yīng)0,一個對應(yīng)1。例:知二進(jìn)制符號中0出現(xiàn)的概率為0.25,1出現(xiàn)的概率為0.75,試對輸入流1011進(jìn)展算術(shù)編碼。56設(shè)C為子區(qū)間的左端起始位置,L為子區(qū)間的長度,那么對于符號“0,C=0,L=0.25;對于符號“1,C=0.25,L=0.75。算術(shù)編碼步驟如下:步驟 輸入符號C L 1 1 0.25 0.75 2 0 0.25 0.75*0.25=0.1875 3 1 0.25+0.1875*0.25 0.1875*0.75=0.296875=0.140625 4 1 0. 296875+0.140625*0.

21、750.140625*0.25=0.10546875=0.3320312557當(dāng)4個字符輸入完后,最終得到的子區(qū)間左端起始位置為0.33203125,終止位置為C+L=0.4375。換算成二進(jìn)制為:(0.33203125)d=(0.01010101) b(0.4375)d=(0.0111) b在0.01010101和0.0111之間取一個數(shù),要求其二進(jìn)制方式的長度最短,如本例中取0.011,那么該串輸入“1011最終可編碼成011,數(shù)據(jù)量有所減少。58幾個問題由于計算機(jī)的精度有限,算術(shù)編碼的計算過程中容易發(fā)生溢出,可以采用限制小數(shù)位數(shù)的方法來處理。 算術(shù)編碼器對音訊只產(chǎn)生一個碼字在區(qū)間0, 1

22、)中的一個實數(shù),譯碼器在接納到表示這個實數(shù)的一切位之前不能進(jìn)展譯碼。 算術(shù)編碼對錯誤很敏感,假設(shè)有一位發(fā)生錯誤就會導(dǎo)致整個音訊譯錯。59自順應(yīng)才干現(xiàn)實上,由于人們事先無法知道準(zhǔn)確的信源概率,因此編碼算法最好具有自順應(yīng)才干,處理這一問題最有效的方法是在編碼過程中進(jìn)展估算動態(tài)建模。算術(shù)編碼可以是靜態(tài)的,也可以是具有自順應(yīng)才干的動態(tài)編碼。在靜態(tài)算術(shù)編碼中,信源符號的概率是固定的。在自順應(yīng)算術(shù)編碼中,將根據(jù)編碼時符號出現(xiàn)的頻繁程度動態(tài)地修正信源符號的概率。動態(tài)建模是確定編碼器緊縮效率的關(guān)鍵。60算術(shù)編碼小結(jié)不用預(yù)先定義概率模型,具有自順應(yīng)才干,可根據(jù)當(dāng)前接納的數(shù)據(jù)不斷更改概率模型。假設(shè)信源符號的概率值

23、都很接近時,不宜運用Huffman編碼,建議運用算術(shù)編碼。算術(shù)編碼的實現(xiàn)較Huffman編碼更復(fù)雜,但對多幅圖像進(jìn)展測試的結(jié)果闡明,算術(shù)編碼較Huffman編碼提高了5%左右的緊縮率,JPEG擴(kuò)展系統(tǒng)中采用的就是算術(shù)編碼。613.4 游程編碼RLE:run length encoding,游程編碼,也稱行程編碼。用RLE編碼方法得到的代碼為:80315084180 623.5 詞典編碼詞典編碼是根據(jù)數(shù)據(jù)本身包含有反復(fù)內(nèi)容這一特性進(jìn)展緊縮的。詞典編碼是無損的。常見的詞典編碼算法有:LZ77 算法、LZ78算法、LZW算法等。63指針式詞典如LZ77 算法、LZSS算法、LZ78算法。64索引式詞

24、典如LZW算法65第四節(jié) 預(yù)測編碼預(yù)測編碼:先利用以往的樣本值對新樣本進(jìn)展預(yù)測,再將新樣本的實踐值和預(yù)測值相減得到一個誤差值,最后對該誤差值進(jìn)展量化編碼傳送。假設(shè)樣本的時間或空間相關(guān)性較強(qiáng),那么誤差值的變化范圍將遠(yuǎn)遠(yuǎn)小于原始信號的變化范圍,量化等級可大量減少,從而實現(xiàn)數(shù)據(jù)緊縮。66預(yù)測編碼主要是利用數(shù)據(jù)在時間或空間上的相關(guān)性來進(jìn)展預(yù)測的,廣泛適用于音頻、圖像、視頻等媒體的編解碼。對于音頻,主要利用時間上的相關(guān)性,采用時間上的前幾個采樣值來做預(yù)測。對于靜止圖像,主要利用空間上的相關(guān)性,好像一行上的前幾個采樣值,甚至可以是前幾行上的像素。對于視頻,不僅可以利用時間上的相關(guān)性幀間預(yù)測,還可以利用空間

25、上的相關(guān)性幀內(nèi)預(yù)測。67684.1 DPCM模擬信號進(jìn)展采樣量化后,假設(shè)直接運用PCM編碼,那么數(shù)據(jù)量將很大,此時可以運用預(yù)測編碼的思想來進(jìn)展二進(jìn)制編碼,常用的方法有線性預(yù)測LPC和非線性預(yù)測。DPCM:差分(值)脈沖編碼調(diào)制,是線性預(yù)測方法。DPCM編碼器記錄與傳送的不是樣本的真實值,而是它與預(yù)測值的差。69DPCM的根本原理轉(zhuǎn)入f(i,j)e(i,j)量化器預(yù)測器預(yù)測器編碼器解碼器信道傳輸e(i,j)f(i,j)輸出f(i,j)f(i,j)f(i,j)f(i,j)發(fā)送端接納端e(i,j)704.2 ADPCMADPCM:自順應(yīng)差分脈沖編碼調(diào)制。在ADPCM中,預(yù)測器的預(yù)測系數(shù)和量化器的量化

26、參數(shù),都可以根據(jù)原數(shù)據(jù)的區(qū)域分布特點自動調(diào)整,具有自順應(yīng)才干。自順應(yīng)預(yù)測:添加一個預(yù)測參數(shù),該參數(shù)可根據(jù)預(yù)測值的大小自順應(yīng)調(diào)整;自順應(yīng)量化:量化階距的大小可自順應(yīng)調(diào)整。實際證明,ADPCM與DPCM相比,緊縮比更高,解碼后的質(zhì)量也更好。714.3 幀間預(yù)測編碼幀間預(yù)測編碼技術(shù)是專門針對視頻對象的,利用延續(xù)幾幀之間存在的時間相關(guān)性來消除冗余。常見的幀間預(yù)測編碼方法有:條件補充法:假設(shè)幀間各對應(yīng)像素的差值超越閾值,那么傳送;假設(shè)沒超越閾值那么不傳送,接納端運用上一幀相應(yīng)像素值替代。運動補償技術(shù):跟蹤畫面內(nèi)運動部分的位移情況,對其加以補償后再進(jìn)展幀間預(yù)測。72第五節(jié) 變換編碼變換編碼技術(shù)較成熟,目前

27、廣泛運用于圖像、視頻的數(shù)據(jù)緊縮。算法思想:將空間域中的圖像信號映射變換到另一個正交的矢量空間中,產(chǎn)生一批變換系數(shù),然后對這些變換系數(shù)進(jìn)展編碼。假設(shè)變換的新正交空間選擇得好,那么可以減少數(shù)據(jù)間的相關(guān)性,從而減少了數(shù)據(jù)的冗余度,到達(dá)數(shù)據(jù)緊縮的目的。73例子有相鄰的兩個采樣值x1和x2,各用3位來表示,即有8種能夠取值。思索到樣值的相關(guān)性,x1和x2同時出現(xiàn)相近幅度的能夠性最大,即圖中的直線陰影部分。信源的相關(guān)性越大,陰影部分就越扁平。74假設(shè)將坐標(biāo)系旋轉(zhuǎn)45度,樣本值x1變換成y1,x2變換成y2。不論y1在07的能夠等級內(nèi)如何變化,y2一直只在相當(dāng)小的范圍內(nèi)變化??梢?,旋轉(zhuǎn)后y1和y2的相關(guān)性減

28、小了。 75變換編碼的原理圖子塊 1子塊 2子塊 n.正變換濾波量化編碼信道解碼逆變換綜合拼接源圖像發(fā)送恢復(fù)圖像接納76常用的變換方法常用變換有:沃爾什(Walsh)變換傅立葉(Fouries)變換離散正弦(DST)變換離散余弦(DCT)變換哈爾(Haar)變換斜(Slant)變換K-L(Karhunen-Loeve)變換小波(Wavelet)變換77第六節(jié) 多媒體數(shù)據(jù)緊縮編碼規(guī)范6.1 靜態(tài)圖像緊縮編碼的國際規(guī)范JPEG6.2 動態(tài)圖像緊縮編碼的國際規(guī)范MPEG-1MPEG-2MPEG-4MPEG-7MPEG-21786.1 JPEG規(guī)范JPEG:Joint Photograph Exper

29、ts Group,結(jié)合圖像專家組,于1986年由CCITT和ISO結(jié)合成立。JPEG規(guī)范即多灰度延續(xù)顏色靜態(tài)圖像緊縮編碼,是適用于多級灰度、延續(xù)顏色、靜態(tài)的數(shù)字圖像緊縮編碼規(guī)范。實踐上,JPEG不僅適用于靜態(tài)圖像,視頻的幀內(nèi)緊縮就可采用JPEG編碼。79JPEG是一個適用范圍很廣的通用規(guī)范,其研發(fā)時的目的如下:算法在圖像緊縮率方面應(yīng)接近當(dāng)前科學(xué)程度,圖像的保真度在較寬的緊縮范圍里的評價是“很好、“優(yōu)秀到與原圖像“不能區(qū)別。算法可實踐運用于任何一類靜態(tài)數(shù)字圖像,對圖像的大小、顏色空間、像素的長寬比、圖像的內(nèi)容、復(fù)雜程度、顏色數(shù)及統(tǒng)計特性等都不加限制。在計算的復(fù)雜程度方面可以調(diào)整,因此可根據(jù)性能和

30、本錢要求來選擇用軟件執(zhí)行還是用硬件執(zhí)行。包括四種操作方式:順序編碼、累進(jìn)編碼、無失真編碼和分層編碼。 80JPEG緊縮算法為了保證通用性,JPEG專家組開發(fā)了兩種根本的緊縮算法:基于離散余弦變換DCT的有損緊縮?;诳臻gDPCM預(yù)測技術(shù)的無損緊縮。實踐上,JPEG專家組還研討了一種稱做JPEG 2000的規(guī)范,其采用的緊縮算法為基于小波wavelet變換的變換編碼。81JPEG的組成部分JPEG系統(tǒng)可分成三個組成部分:根本系統(tǒng):是實現(xiàn)離散余弦變換DCT編碼/解碼所需的最小功能集。擴(kuò)展系統(tǒng):是為了滿足更為寬廣領(lǐng)域的運用要求而設(shè)置的。獨立功能:相對于JPEG的根本系統(tǒng)和擴(kuò)展系統(tǒng)來說,運用空間DPC

31、M預(yù)測方法的部分稱為獨立功能。82基于DPCM的無損緊縮如圖,預(yù)測器對原始數(shù)據(jù)X進(jìn)展預(yù)測,求得差值后再對差值進(jìn)展無失真的熵編碼。熵編碼器常采用Huffman編碼或算術(shù)編碼。83基于DCT的有損緊縮基于DPCM預(yù)測編碼的緊縮比僅能到達(dá)2:1,而DCT編碼的緊縮比可高達(dá)10:1100:1。當(dāng)緊縮比小于40:1時,復(fù)原的圖像與原始圖像相比客觀效果幾乎一樣。壓縮效果(比特/像素)質(zhì)量0.250.50中好0.500.75好很好0.751.5極好1.22.0與原始圖像分不出來8485DCT變換公式88的子塊作為DCT變換的輸入。DCT變換運用下式計算:逆變換IDCT運用下式計算:86基于DCT編碼的步驟基

32、于DCT編碼的計算步驟為:分割子塊:通常順序分割成88的子塊。對子塊進(jìn)展正向的離散余弦變換FDCT。對獲得的DCT系數(shù)進(jìn)展量化處置。將量化后的DCT系數(shù)進(jìn)展Z字形編排。對直流系數(shù)DC進(jìn)展DPCM編碼。對交流系數(shù)AC進(jìn)展RLE游程編碼。熵編碼。876.2 MPEG規(guī)范MPEG:Moving Pictures Experts Group,運動圖像專家組,于1988年由ISO與IEC結(jié)合成立,努力于運動圖像及其伴音的編碼規(guī)范化。 MPEG規(guī)范包括三個部分:MPEG視頻:如VCD、SVCD、DVD就是采用這部分規(guī)范制造的電子產(chǎn)品。MPEG音頻:如mp3。MPEG系統(tǒng):擔(dān)任視頻和音頻的同步。88最初,M

33、PEG專家組的任務(wù)工程是3個:MPEG-1:在1.5Mbps傳輸速率下對圖像編碼。MPEG-2:在l0Mbps傳輸速率下對圖像編碼。 MPEG-3:在40Mbps傳輸速率下對圖像編碼。 l992年,MPEG-2的適用范圍擴(kuò)展到HDTV高清電視,能支持MPEG-3的一切功能,于是便取消了MPEG-3。到目前為止,MPEG共包括5個工程:MPEG-1和MPEG-2。MPEG-4:針對低速率下的視頻、音頻編碼, 更注重多媒體系統(tǒng)的交互性和靈敏性。MPEG-7:支持多媒體基于內(nèi)容的檢索。MPEG-21:多媒體運用框架。896.2.1 MPEG-1規(guī)范MPEG-1的主要義務(wù):將視頻信號及其伴音信號以可接

34、受的重建質(zhì)量,緊縮到約1.5Mbps的碼率,并復(fù)合成一個單一的MPEG位流,同時保證音視頻的同步。MPEG-1主要用于在CD光盤上存儲視頻圖像(VCD),它針對規(guī)范分辨率的圖像進(jìn)展緊縮(NTSC制為352240,PAL制為352288),每秒30幀,具備CD音質(zhì)。90MPEG-1規(guī)范的組成MPEG-1規(guī)范包括了5個部分:MPEG系統(tǒng)(11172-1):定義音頻、視頻及有關(guān)數(shù)據(jù)的同步;MPEG視頻(11172-2):定義視頻信號的編解碼過程,亮度信號分辨率為360240,色度信號分辨率為180120;MPEG音頻(11172-3):定義音頻的編解碼過程;一致性測試(11172-4):規(guī)定如何測試

35、編解碼器,以確認(rèn)能否符合前三部分的要求;軟件模擬(11172-5):該部分并非規(guī)范,只是關(guān)于用軟件執(zhí)行前三部分的技術(shù)結(jié)果報告。91MPEG-1視頻MPEG-1規(guī)范中實現(xiàn)視頻緊縮編碼的根本思想:在空間上的幀內(nèi)緊縮:采用基于DCT變換的類JPEG算法;在時間上的幀間緊縮:采用基于塊的運動補償技術(shù)。在MPEG視頻中,宏塊是最根本的編碼單元。運動信息就包含在宏塊中,每個宏塊可有一至二個運動矢量。92MPEG視頻數(shù)據(jù)流的構(gòu)造運動圖像序列圖片組圖片圖片切片宏塊塊8像素8像素YUV采樣格式為4:2:093運動矢量運動矢量,也稱挪動矢量。運動矢量94MPEG視頻的圖像類型MPEG將視頻圖像分成3種類型:I圖像

36、:也稱幀內(nèi)圖,采用基于DCT的JPEG編碼技術(shù)緊縮,每像素緊縮后只需12bit。P圖像:也稱預(yù)測圖,用最近的前一個I圖像或P圖像預(yù)測得到(前向預(yù)測) ,也可以作為下一次預(yù)測的參照圖像。B圖像:也稱插補圖、雙向預(yù)測圖,預(yù)測時需求同時運用前后兩個I圖像或P圖像作為參照圖像(雙向預(yù)測)。95四種預(yù)測方法:幀內(nèi)預(yù)測、前向預(yù)測、后向預(yù)測、雙向預(yù)測96典型的圖像類型次序MPEG編碼器允許選擇I圖像的頻率和位置,普通1秒鐘運用2次I圖像。MPEG編碼器也允許選擇在一對參照圖像之間的B圖像的數(shù)目。1秒?yún)⒄諑g有2個B圖像 每0.5秒就有1幀I圖像 I B B P B B P B B P B B P B B I

37、 B B P B B P B B P B B P B B典型的圖像類型次序97傳輸順序假設(shè)接納端接納的17幀圖像順序不變,同樣為IBBPBBP,那么解碼第2幀B時,由于它是由第1幀I和第4幀P預(yù)測出的,但此時第4幀尚未恢復(fù),將無法解碼。為了便于解碼器,MPEG編碼器需對圖像重新排序后再傳輸,以保證參照圖像先于B圖像恢復(fù)。上述17幀傳輸?shù)拇涡驊?yīng)為:4213756IPBBPBB98I圖像的編碼幀內(nèi)圖像I不參照任何其他圖像,可采用類似JPEG的緊縮算法。99P圖像的編碼P圖像運用兩種類型的參數(shù)來表示:當(dāng)前要編碼的宏塊與參考宏塊之間的差值;宏塊的運動矢量。100B圖像的編碼101基于塊的運動補償技術(shù)在

38、MPEG方案中,運動補償技術(shù)在宏塊這一等級任務(wù),主要用來消除P圖像和B圖像在時間上的冗余?;趬K的運動補償技術(shù),即:在參照幀中尋覓符合一定條件、當(dāng)前被預(yù)測塊宏塊的最正確匹配塊。找到匹配塊后,可直接運用匹配塊作為被預(yù)測塊,也可以將匹配塊預(yù)測誤差采用ADCT編碼作為被預(yù)測塊。102搜索運動矢量103各種圖像類型的宏塊處置技術(shù)I圖像的數(shù)據(jù)量最大,B圖像的數(shù)據(jù)量最小。1046.2.2 MPEG-2規(guī)范MPEG-2規(guī)范于1993年發(fā)布,全稱為“信息技術(shù)電視圖像和伴音信息的通用編碼,是一個與數(shù)字電視廣播有關(guān)的、高質(zhì)量圖像和聲音的編碼規(guī)范。MPEG-2在MPEG-1的根本編碼算法根底上進(jìn)展了擴(kuò)展,添加了許多新功能,如對隔行掃描電視的編碼、可變位速率等。MPEG-2要到達(dá)的最根本目的是:位速率為49Mbit/s,最高達(dá)15Mbit/s。105MPEG-2可利用網(wǎng)絡(luò)提供的3100Mbps的數(shù)據(jù)傳輸率,來支持具有更高分辨率圖像的緊縮和更高的圖像質(zhì)量。MPEG-2是DVD的指定規(guī)范,其音頻編碼可提供5.1聲道甚至7.1聲道。MPEG-2規(guī)范定義了三種質(zhì)量不同的編

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論