版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、多 媒 體 技 術(shù)第4章1第3章 多媒體數(shù)據(jù)緊縮編碼技術(shù)3.1 概述3.2 數(shù)據(jù)緊縮的根本方法3.3 靜態(tài)圖像緊縮編碼國際規(guī)范JPEG3.4 運動圖像緊縮編碼國際規(guī)范MPEG3.5 音頻數(shù)字化與緊縮編碼技術(shù)2第3章 多媒體數(shù)據(jù)緊縮編碼技術(shù)多媒體數(shù)據(jù)緊縮編碼的重要性數(shù)據(jù)冗余類型數(shù)據(jù)緊縮技術(shù)的分類3第3章 多媒體數(shù)據(jù)緊縮編碼技術(shù)媒體數(shù)據(jù)緊縮編碼的重要性 信息時代的重要特征是信息的數(shù)字化。 早期的計算機系統(tǒng)采用模擬方式表示信息,但存在著明顯的缺陷: 經(jīng)常會產(chǎn)生噪音和信號喪失,并且在復制過程中逐漸積累噪音和誤差。 模擬信號不適宜數(shù)字計算機加工處置。4媒體數(shù)據(jù)緊縮編碼的重要性 數(shù)字化后未經(jīng)緊縮的視頻和音
2、頻等媒體信息的數(shù)據(jù)量是非常大的 1. 圖像數(shù)據(jù)量的大小可用下面的公式來計算: 圖像數(shù)據(jù)量圖像的總像素顏色深度8 單位為Byte,簡寫為B 例如,一幅640480、24位bit真彩色的圖像,其文件大小為:64048024 8 921.6KB5媒體數(shù)據(jù)緊縮編碼的重要性 2. 雙通道立體聲激光唱盤,采用脈沖碼調(diào)制采樣,采樣頻率為44.1KHz,采樣精度16位,其一秒鐘時間內(nèi)的采樣數(shù)據(jù)量為: 44.110001628176.4 KB 一個650MB的CDROM,大約可存1小時的音樂。6媒體數(shù)據(jù)緊縮編碼的重要性 3. 對動態(tài)圖形和視頻圖像。例如對于彩色電視信號,設代表光強Y的帶寬為4.2MHz、顏色I為
3、1.5MHz和色飽和度Q為0.5MHz,采樣頻率2倍原始信號頻率,各分量均被數(shù)字量化為8位,從而1秒鐘電視信號的數(shù)據(jù)量為: 4.21.50.5281000000812.4 MB7媒體數(shù)據(jù)緊縮編碼的重要性 容量為650MB的CDROM僅能存1分鐘的原始電視數(shù)據(jù)。假設為高明晰度電視HDTV其1秒鐘數(shù)據(jù)量約為150MB1.2Gbps8,一張CDROM還存不下5秒鐘的HDTV圖像。 宏大數(shù)字化信息的數(shù)據(jù)量對計算機存儲資源和網(wǎng)絡帶寬有很高的要求,處理的方法就是要對視、音頻的數(shù)據(jù)進展大量的緊縮。播放時,傳輸少量被緊縮的數(shù)據(jù),接納后再對數(shù)據(jù)進展解緊縮并復原。8數(shù)據(jù)冗余類型 1. 空間冗余 基于離散像素采樣來
4、表示物體顏色的方式通常沒有利用景物外表顏色的這種空間相關(guān)性,這些相關(guān)性的光成像構(gòu)造在數(shù)字化圖像中就表現(xiàn)為空間冗余。我們可以經(jīng)過改動物體外表顏色的像素存儲方式來利用空間相關(guān)性,到達減少數(shù)據(jù)量的目的。9數(shù)據(jù)冗余類型 2. 時間冗余 時間冗余反映在圖像序列中的相鄰幀圖像電視圖像、動畫之間有較大的相關(guān)性,一組延續(xù)畫面中的相鄰幀往往包含一樣的背景和挪動物體,只不過挪動物體所在的空間位置略有不同,把一幀圖像中的某物體或場景可以由其他幀圖像中的物體或場景進展處置后重構(gòu)出來,可以大大減少時間冗余。10數(shù)據(jù)冗余類型 3. 構(gòu)造冗余 有些圖像具有較強的類似性的紋理構(gòu)造,例如布紋圖像和草席圖像,方格狀的地板圖案等,
5、我們稱此為構(gòu)造冗余。 4. 知識冗余 有許多圖像的了解與某些根底知識有相當大的相關(guān)性,這類規(guī)律性的構(gòu)造可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。根據(jù)已有的知識,我們可以構(gòu)造圖像物體的根本模型,并創(chuàng)建圖像庫。11數(shù)據(jù)冗余類型 5. 視覺冗余 人的接納系統(tǒng)如視覺系統(tǒng)和聽覺系統(tǒng)是有一定限制的,人眼并不能覺察圖像場的一切變化,如人類視覺系統(tǒng)分辨才干約為64灰度等級,而普通圖像量化采用256灰度等級,這類冗余我們稱為視覺冗余。 6. 聽覺冗余 人耳的敏感性不能覺察一切頻率的變化,存在聽覺冗余。12數(shù)據(jù)緊縮技術(shù) 的分類 根據(jù)多媒體數(shù)據(jù)冗余類型的不同,解碼后數(shù)據(jù)與原始數(shù)據(jù)能否完全一致、質(zhì)量有無損
6、失來進展分類,緊縮方法可被分為有失真編碼和無失真編碼兩大類。 無失真緊縮法也稱無損緊縮,無失真緊縮的特點是緊縮比較小,大約在2l至5l之間,主要用于文本數(shù)據(jù)、程序代碼和某些要求嚴厲不喪失信息的環(huán)境中,常用的無失真緊縮編碼有如哈夫曼編碼等。13數(shù)據(jù)緊縮技術(shù) 的分類 有失真緊縮法也稱有損緊縮,有失真緊縮法的冗余緊縮取決于初始信號的類型、前后的相關(guān)性、信號的語義內(nèi)容等,緊縮比可以從幾到幾百倍,常用的有失真緊縮編碼技術(shù)有預測編碼、變換編碼、模型編碼、混合編碼方法等。主要用于緊縮圖像、聲音等信息。14 常用的圖像和視頻緊縮方法如圖3-1所示:圖像和視頻緊縮方法哈夫曼編碼行程編碼算術(shù)編碼LZW編碼DCT編
7、碼小波變換子帶編碼無失真緊縮有失真緊縮預測編碼變換編碼模型編碼運動補償混合編碼分形編碼JPEGMPEGH. 261數(shù)據(jù)緊縮技術(shù) 的分類15行程游程RLE 編碼技術(shù) 行程編碼主要思緒是用編碼器不斷比較信息源符號相鄰元素值的變化幅度,一旦發(fā)現(xiàn)有明顯的變化,就開場一個行程。編碼器檢測每一個行程起點位置開場的多次反復的比特或者字符序列,然后將一個一樣值的延續(xù)串出現(xiàn)次數(shù)作為行程長度,并將行程長度轉(zhuǎn)換成代碼,再取用信息源符號的一個代表值作為代碼,這種編碼稱為行程編碼,或稱游程編碼,常用RLE表示。16對一幅兩維圖像Fi,j作程度掃描后得到的部分像素的像素值17行程游程RLE 編碼技術(shù) 用RLE對這一行數(shù)據(jù)
8、編碼后得到的碼字表: RLE編碼緊縮編碼技術(shù)尤其適用于: 計算機生成的圖形圖像和黑白二值圖像的編碼,解緊縮速度很快。RLE的緊縮率的大小取決于圖像本身的特點,可以得到較大的緊縮比。對復雜的圖像不適宜用RLE進展編碼。18哈夫曼編碼技術(shù) 假設一個信息源能產(chǎn)生的事件序列中的事件取自一個有限事件集,事件集S中的任一事件Si發(fā)生的概率為P(Si)都相等,即P(Si) 1/S,那么其所能攜帶的信息量I(Si)定義為: I(Si)log2 1/S log2 P(Si) 33 這里P(Si)是信息源產(chǎn)生的事件為Si的概率。等式右邊加一負號的目的是保證I(Si的數(shù)值不為負值。定義中用2為底的對數(shù),并規(guī)定信息量
9、I(Si)的計量單位為比特bit。19哈夫曼編碼技術(shù) 哈夫曼編碼屬于一種變字長碼,把信息源事件按概率大小順序陳列,對出現(xiàn)概率大的信息源事件賦予短碼字,而對于概率小的信息源事件賦予長碼,只需碼字長度按照信息出現(xiàn)的概率大小逆順序陳列,可經(jīng)過數(shù)學證明這一結(jié)論:平均碼字長度一定小于其它任何事件順序的陳列方式。20哈夫曼編碼技術(shù) 哈夫曼編碼普經(jīng)過程如下: 1. 把事件音訊按出現(xiàn)的概率由大到小排成一個序列。如P(1)P(2)P(3)P(Sm-1)P(Sm) ,即將信息源事件按概率遞減順序陳列。 2. 把其中兩個最小的概率P(Sm-1) ,P(Sm)挑出來,且將事件“1賦給其中最小的,即P(Sm)1;事件“
10、0賦給另一稍大的即P(Sm-1) 0。21哈夫曼編碼技術(shù) 3. 把兩個最小概率相加作為新事件的概率,即求出P(Sm-1) ,P(Sm)之和P(Si): P(Si) = P(Sm-1) 十P(Sm)設P(Si)是對應于一個新的音訊的概率。 4. 將P(Si)與上面未處置的m2個音訊P(Sm-2的概率重新由大到小再陳列,構(gòu)成一個新的概率序列。 5. 反復步驟2,3,4,在每次合并信息源時,將被合并的信源分別賦“0和“1直到一切m個事件的概率均已全部合并處置為止。22哈夫曼編碼技術(shù) 6. 尋覓從每一個信息源事件到概率總和為1處的途徑,對每一信息源事件寫出“1、“0序列從樹根到信息源事件節(jié)點作為碼字。
11、Huffman編碼的平均碼字長度可以用以下公式求出: 這里的ni ,為第i個音訊事件的碼字長度,P(Si)為第i個音訊出現(xiàn)的概率。舉一例子來闡明這一編碼過程。23哈夫曼編碼技術(shù)圖3-5 哈夫曼編碼全過程:F24哈夫曼編碼技術(shù) 根據(jù)哈夫曼的編碼規(guī)那么,我們得到如表3-2所示: 由于8個音訊事件A,B,C,H的每個概率為知,那么哈夫曼碼的平均長度L可按公式3-6) 計算為:L10.4十30.180.1040.10十0.06十0.07十50.05十0.042.61比特25哈夫曼編碼技術(shù) 圖像的熵HS可按公式3-5) 計算為: 定義編碼效率為熵值HS與平均碼長L的比值,即: 編碼效率 3-7 =2.5
12、5/2.61 97.8 % 哈夫曼編碼有它的缺乏之處: 必需先得到信息源碼元音訊的統(tǒng)計概率,才干進展編碼。折中的方法是根據(jù)閱歷值人為地給出Huffman碼表,但這樣的編碼無法到達最正確。26第4章 數(shù)字音頻、視頻信號的緊縮 41緊縮編碼根底 411 莫爾斯碼 電報碼:是采用“ 和“來表示26個英文字母的變字長編碼。編碼思想:(1) 常用字母用短碼表示如E用“ 表示,T用“表示(2) 不常用的字母用長碼表示(如Z用 “-表示; j用“-表示)編碼方法:經(jīng)過變字長編碼方式。對常用英文單詞進展的大量統(tǒng)計。找出各字母出現(xiàn)的概率,最后確定: 27第4章 數(shù)字音頻、視頻信號的緊縮 41緊縮編碼根底 411
13、莫爾斯碼 討論: (1)要用固定碼長方式那么需求25 =32,即5bit來表示。 (2)莫爾斯碼編碼規(guī)律:先找出統(tǒng)計規(guī)律,然后對出現(xiàn)概率大的用短碼,反之用長碼。 (3)緊縮對信息質(zhì)量的影響: 而這種緊縮對于信息無任何損壞,屬無損緊縮。 28LZW編碼LZW編碼是由Lemple和Ziv提出并經(jīng)Welch擴展而構(gòu)成的無損緊縮專利技術(shù)。它采用了一種先進的串表緊縮,將每個第一次出現(xiàn)的串放在一個串表中,用一個數(shù)字來表示串,緊縮文件只存貯數(shù)字,那么不存貯串,從而使圖象文件的緊縮效率得到較大的提高。奇妙的是,不論是在緊縮還是在解緊縮的過程中都能正確的建立這個串表,緊縮或解緊縮完成后,這個串表又被丟棄。29L
14、ZW編碼例如例如:現(xiàn)有來源于二色系統(tǒng)的圖像數(shù)據(jù)源假設數(shù)據(jù)以字符串表示:aabbbaabb,試對其進展LZW編碼及解碼。 根據(jù)圖像中運用的顏色數(shù)初始化一個字符串表,字符串表中的每個顏色對應一個索引。在初始字符串表的LZW_CLEAR和LZW_EOI分別為字符表初始化標志和編碼終了標志。30設置字符串變量S1、 S2并初始化為空。 最后的編碼結(jié)果為 :3001646331LZW編碼LZW算法的適用范圍是原始數(shù)據(jù)串最好是有大量的子串多次反復出現(xiàn),反復的越多,緊縮效果越好。反之那么越差,能夠真的不減反增了 32圖像緊縮預處置技術(shù)圖像數(shù)據(jù)緊縮的義務是在不影響或少影響圖像質(zhì)量的前提下,盡量減少圖像的數(shù)據(jù)量
15、。圖像預處置技術(shù): 二次抽樣 人的視覺對圖像亮度分量的敏感程度高于色差分量。因此亮度值應以最大分辨率進展編碼。 33圖像緊縮預處置技術(shù)濾波器 能有選擇地刪除、衰減或放大信息量化 用整數(shù)碼替代采樣值,真實值和量化值間的誤差是分辨率和噪聲的混合預測編碼 統(tǒng)計冗余改良緊縮。對預測值和真實值之間的誤差進展編碼34圖像緊縮預處置技術(shù)運動補償 用二維圖像位移矢量來預測鄰域圖像的位移值變長碼 根據(jù)出現(xiàn)概率高低決議碼字長度圖像內(nèi)插法 允許產(chǎn)生中間圖像,因此臨近的圖像可以產(chǎn)生中間像,減少數(shù)據(jù)傳輸和存儲量。35采 樣香農(nóng)定理對于一個包含最高頻率f0的模擬信號,但選擇的采樣頻率f 滿足 f= 2f0時,經(jīng)過取樣后的
16、離散信號可以包含原模擬信號的全部信息,并且,經(jīng)過反變換和低通濾波,可以不失真地恢復出原始信號。 36量 化量化是在幅度軸上把延續(xù)值的模擬信號變成為離散值的數(shù)字信號,在時間軸上已變?yōu)殡x散的樣值脈沖,在幅度軸上仍會在動態(tài)范圍內(nèi)有延續(xù)值,能夠出現(xiàn)恣意幅度,即在幅度軸上仍是模擬信號的性質(zhì),故還必需用有限電平等級來替代實踐量值 37設信號的整個動態(tài)變化范圍為A,共分為M個量化等級;每個量化等級為 A ,那么有:A =A/M。量化級通常用二進制的位數(shù)n表示, 例如,對于 8 位 (bit) 量化,相應的十進制量化等級M為 :M=28=256.量化的過程是把取樣后信號的電平歸并到有限個電平等級上,并以一個相
17、應的數(shù)據(jù)來表示。 38數(shù)據(jù)緊縮算法的評價緊縮倍數(shù)1緊縮前和緊縮后的總的數(shù)據(jù)量之比2平均比特數(shù)bpdp)表示圖像質(zhì)量 重建圖像質(zhì)量信噪比SNR(Signal Noise Ration),即信號與噪聲的方差之比。首先計算圖象一切象素的部分方差,將部分方差的最大值以為是信號方差,最小值是噪聲方差,求出它們的比值. 39數(shù)據(jù)緊縮算法的評價緊縮和解緊縮的速度對稱緊縮非對稱緊縮緊縮的計算量40有損緊縮編碼技術(shù)預測編碼技術(shù)JPEGMPEG41預測編碼技術(shù) 根據(jù)離散信號之間存在著一定的相關(guān)性的特點,利用圖像像素的以往樣本值前面一個或幾個點的數(shù)據(jù)對于新樣本值下一個點的數(shù)據(jù)進展預測,然后將樣本的實踐值與其預測值相
18、減得到一個誤差值(較小),這樣可以用比較少的數(shù)碼進展編碼得到較大的數(shù)據(jù)緊縮結(jié)果,到達緊縮數(shù)據(jù)的目的,因此預測編碼技術(shù)是一種有失真編碼方法。42 最常用的是差值脈沖編碼調(diào)制法,簡稱為DPCM。傳輸信道輸入預測器量化器編碼器解碼器預測器XnenXnen輸出XnXnenXn預測編碼技術(shù)43預測編碼技術(shù) 設xn為tn時辰的亮度取樣值,預測器根據(jù)tn時辰之前的樣本值x1,x2,xn-1對xn作預測,得到預測值xn,xn 與xn之間的誤差為: enxnxn 接納端恢復的輸出信號為xn是xn的近似值,兩者的誤差是:xnxnxnxn十enxn十enenen 44預測編碼技術(shù) 在預測編碼中,量化器的量化對像是預
19、測誤差 enen分布在零值附近,正負兩邊的分布普通是對稱的,圖3-3 預測誤差分布特性表示圖。概率預測誤差圖3-3 預測誤差分布表示圖45量化輸出輸入電平非均勻量化間隔非均勻量化器46預測編碼技術(shù) 非均勻量化器對于具有一樣的輸入信號動態(tài)范圍、一樣的圖像客觀評價質(zhì)量下,輸出的比特數(shù)較低。 預測編碼系統(tǒng)的缺陷: 預測誤差的量化是呵斥圖像質(zhì)量下降的主要緣由,比如在圖像邊境斜率過載,表現(xiàn)為圖像輪廓變模糊;因最小量化電平不夠小量化位數(shù)不夠高,使圖像灰度緩變區(qū)產(chǎn)生顆粒噪聲。 47靜態(tài)圖像緊縮編碼的國際規(guī)范-JPEG 靜態(tài)圖像緊縮編碼JPEG概略JPEG緊縮編碼的根本系統(tǒng)1 數(shù)據(jù)塊預備2 離散余弦正變換DC
20、T3 量化4 DCT系數(shù)Z形掃描5 DC系數(shù)編碼6 AC系數(shù)編碼JPEG緊縮編碼的擴展系統(tǒng)48靜態(tài)圖像緊縮編碼的國際規(guī)范-JPEG JPEG是國際上彩色、灰度、靜止圖像的第一個國際規(guī)范。用來在低分辨率到高分辨率的較寬范圍內(nèi)支持較高的圖像分辨率和量化精度。它不僅適用于黑白、彩色照片和印刷圖片等靜止圖像的緊縮,而且擴展到了彩色、會議、新聞圖片的傳送上,以及電視圖像序列的幀內(nèi)圖像的緊縮編碼也常采用JPEG緊縮規(guī)范。49靜態(tài)圖像緊縮編碼的國際規(guī)范-JPEG 變換編碼的根本思緒: 1編碼時略去某些能量很小的高頻分量以降低碼率。 2變換編碼還可以根據(jù)人眼對不同頻率分量的敏感程度而對不同系數(shù)采用不同的量化臺
21、階,以進一步提高緊縮比。 JPEG開發(fā)的緊縮編碼算法有三種任務方式: 1根本系統(tǒng)單次掃描。 2擴展系統(tǒng)常采用累進編碼或分層編碼方式。 3無損緊縮編碼。50JPEG 緊縮編碼的根本系統(tǒng) 下面我們討論一個基于離散余弦正變換DCT的有失真JPEG編解碼的任務原理,圖3-7是基于DCT的JPEG編碼的過程框圖。 511. 數(shù)據(jù)塊預備 塊預備將一幀幅圖像分成88的數(shù)據(jù)塊。對于彩色圖像,可以看作多分量Y亮度信號分量和U和V色度信號分量進展緊縮處置。 假設圖像的大小為480行,每一行有640個像素。并假設按4ll取樣格式,即四個亮度分量,一個色差分量U,一個色差分量V,那么亮度分量就是一個640480的數(shù)值
22、矩陣,色差分量是一個320240的數(shù)值矩陣。 塊預備必需劃分出4800個6404808亮度塊和兩份1200個3202408色差塊,合計7200個數(shù)據(jù)塊。同時將原始圖象的無符號整數(shù)變?yōu)橛蟹栒麛?shù)522. 離散余弦正變換 DCT2. 離散余弦正變換DCT DCT變換是一種正交變化,主要是把時域變換為頻域,變換本身并不進展數(shù)據(jù)緊縮。它只是把信號映射到另一個域上,使信號在變換域里容易進展緊縮,變換后的樣值更加獨立和有序533. 量化 量化是一種不可逆的、有失真的過程,在基于DCT的編碼器中,量化是引起信息喪失的主要緣由。 對DCT系數(shù)進展量化有兩個作用: 降低系數(shù)的幅值。 添加系數(shù)中值為0的項數(shù)。54
23、4. DCT 系數(shù)Z形掃描圖3-10 Z形掃描順序 其一維數(shù)組元素的位置順序如圖3-10。 ZZ0C0,0,ZZ1C0,l,ZZ2Cl,0,ZZ63C7,7。編碼順序根據(jù) ZZ的序號。 0 1 5 6 14 15 27 28 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63555. DC 系數(shù)編碼 對相鄰塊之間的DC系數(shù)的差
24、值DIFFDiDi1進展編碼。 Blocki1Blocki圖 3-11 DC系數(shù)的差值DIFFDiDi1DiDi1566. AC 系數(shù)的編碼 Z形掃描將二維量化系數(shù)矩陣轉(zhuǎn)換成一維數(shù)組ZZ中的“零游程/非零值。 假設最后一個“零游程/非零值中只需零游程ZRL,那么直接傳塊終了碼字“EOB 終了本塊。57JPEG 緊縮編碼的根本系統(tǒng) 對于中等復雜程度的彩色圖像,其緊縮比與恢復圖像的質(zhì)量大致如表3-10所示。 表3-10緊縮效果與恢復圖像質(zhì)量的關(guān)系58JPEG 緊縮編碼的根本系統(tǒng) 順序編碼運轉(zhuǎn)方式59JPEG 緊縮編碼的擴展系統(tǒng) 1. 基于DCT的累進編碼運轉(zhuǎn)方式累進編碼方式要掃描多次。60JPEG
25、 緊縮編碼的擴展系統(tǒng)2. 分層編碼運轉(zhuǎn)方式 程度方向和垂直方向分辨率以2的倍數(shù)因子下降降低原始圖像的空間分辨率,導出假設干低分辨率的原圖像,分層后再采用JPEG的緊縮編碼方法進展編碼,隨后以上反復步驟,直到圖像到達完好的分辨率編碼為止。61JPEG 緊縮編碼的擴展系統(tǒng) 3. 無損緊縮預測編碼運轉(zhuǎn)方式源圖像數(shù)據(jù)表闡明預測器熵編碼器緊縮后圖像數(shù)據(jù)62無損緊縮預測編碼運轉(zhuǎn)方式 DPCM編碼簡單,易于用硬件實現(xiàn)。由于是無失真編碼,解碼后的圖像質(zhì)量很高。 Px63運動圖像緊縮編碼的國際規(guī)范MPEG 運動圖像緊縮編碼MPEG概略MPEG 規(guī)范簡介幀間編碼技術(shù)運動補償技術(shù)MPEG視頻緊縮數(shù)據(jù)流構(gòu)造MPEG音
26、頻64運動圖像緊縮編碼的國際規(guī)范MPEG MPEG專家組任務將整個過程分為三步: 要求 提出要求有雙重的目的:目的, 競爭的原那么。 竟爭 提出了14個不同的方案。 集中 測試和評價,并綜合出一個最正確方案。65MPEG 規(guī)范簡介 1. MPEG1規(guī)范 MPEG1的規(guī)范稱號為“動態(tài)圖像和伴音的編碼用于速率小于每秒約1.5Mbps的數(shù)字存儲媒體。 MPEG1的最大緊縮比可達約1200。 MPEG1規(guī)范有3個部分組成: MPEG1視頻Video MPEG1音頻Audio MPEG1系統(tǒng)System661. MPEG1 規(guī)范 設計目的是把每秒30幀、亮度信號的分辨率為360240,色度信號分辨率為1
27、80120,傳送緊縮成數(shù)據(jù)率為1.2Mbps的編碼圖像。 MPEG1電視圖像的緊縮算法采用兩種根本緊縮技術(shù): 為減少時間冗余度,采用1616個像素組成的圖像塊的運動補償技術(shù)。 為了減少空間冗余度,采用88圖像化的DCT變換技術(shù)。671. MPEG1 規(guī)范 聲音緊縮編碼技術(shù)支持高緊縮的音頻數(shù)據(jù)流,其采樣率為48,44.l或22KHz,量化精度為16位的聲音緊縮。 支持兩個聲道,可設置成單聲道m(xù)ono、雙聲道dual或立體聲stereo。采用MPEG1算法可以把位速率降到 0.192 Mbps。 MPEG1系統(tǒng)采用多路復合技術(shù),把數(shù)字電視圖像和聲音復合成單一數(shù)據(jù)位流,MPEG1的數(shù)據(jù)位流分成內(nèi)外兩
28、層,外層為系統(tǒng)層,內(nèi)層為緊縮層。68 2. MPEG2 規(guī)范 MPEG2規(guī)范稱為“活動圖像及有關(guān)聲音信息的通用編碼規(guī)范。 設計目的是把以10Mbps速度傳送每秒30幀、分辨率為720572高分辨率的廣播級視頻圖像,緊縮后的傳送數(shù)據(jù)率為315Mbps。 MPEG2規(guī)范是HDTV、DVD以及新型數(shù)字式交互有線網(wǎng)所采用的數(shù)字視頻緊縮規(guī)范。 MPEG2規(guī)范是MPEG1規(guī)范的擴展、豐富和完善,并與MPEG1規(guī)范相兼容。692. MPEG2 規(guī)范 MPEG2規(guī)范主要分為四部分: 第一部分:系統(tǒng)。 第二部分:視頻。 第三部分:音頻。 第四部分:一致性測試。 MPEG2規(guī)范使計算機處置全彩色、全屏幕、全動態(tài)的
29、視頻圖像,同時也能使有線、無線、CDROM等傳輸和存儲介質(zhì)有效地傳送視頻圖像,并且具有CD的音質(zhì),使多媒體技術(shù)與通訊和廣播等技術(shù)結(jié)合起來。703. MPEG4 規(guī)范 用來支持低比特率下的多媒體通訊,還支持用于通訊、訪問和數(shù)字視聽數(shù)據(jù)處置的新方法。注重多媒體系統(tǒng)的交互性和靈敏性,以最少量的數(shù)據(jù)、極低的音頻/視頻緊縮碼率來顯示建立準確的畫面,到達具有高效編碼、高效存儲與傳播以及可交互操作的特性。714. MPEG7 規(guī)范 正式稱號為多媒體內(nèi)容描畫接口。 MPEG7規(guī)范只規(guī)定信息內(nèi)容描畫格式,而不規(guī)定如何從原始的多媒體資料中抽取內(nèi)容描畫和查詢、檢索方法。MPEG7規(guī)范不針對特定的運用領(lǐng)域,而是盡能夠
30、支持廣泛的運用領(lǐng)域。 主要用途:在數(shù)字圖書館、多媒體目錄效力、圖像分析、音樂詞典、教育、多媒體編輯、多媒體業(yè)務引導等多個領(lǐng)域。724. MPEG7 規(guī)范 視頻緊縮算法用到了三項根本技術(shù): 幀間編碼技術(shù)和基于塊的運動補償技術(shù)。 空間緊縮也稱為幀內(nèi)緊縮技術(shù)。 熵編碼,運用Huffman編碼技術(shù)。 MPEG規(guī)范所用的編碼模型與JPEG的編碼模型類似,分為5個階段: 幀間編碼和運動補償、變換編碼、量化、直流分量DC及交流分量AC的編碼和熵編碼。73幀間編碼技術(shù) 利用的時間相關(guān)性可進一步消除視頻其相鄰幀之間具有冗余信息,提高緊縮比。 將圖像分成三種類型: 1. 參考幀I以本身圖像的相關(guān)性進展緊縮處置,必
31、需求傳送。 2. 預測幀P 用前面的參考幀或預測幀作為參照圖像信息進展預測編碼,并可作為下一個預測幀B幀圖像或P幀圖像的參照圖像信息。但因此能夠引起預測誤差。74幀間編碼技術(shù) 3. 雙向預測幀B 又稱插補幀,在預測時,既可以運用前面或后面的視頻幀I參考幀,P預測幀進展雙向預測,也可以同時運用前后兩個視頻幀進展預測編碼,但本身不能作為下一個預測幀的參照圖像信息。在編碼時,先對參考幀進展變換編碼,然后對預測幀進展編碼,再對兩者之間的雙向預測幀進展編碼,這個過程對隨后的下一個預測幀和雙向預測幀反復,直到完成一切幀的編碼為止。75幀間編碼技術(shù) 采用下述四種預測技術(shù): 幀內(nèi)編碼 前向預測 后向預測 雙向
32、預測 圖3-12顯示一個典型的視頻圖像序列次序。 I B B P B B P B B P B B P B B I B B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 I幀和P幀間有兩個B幀每十五幀有一幅I幀圖像0.5秒76運動補償技術(shù) 討論預測器計算表達式,設前一參照幀為I0,后一參照幀為I2,當前幀為I1的表示圖。77運動補償技術(shù) 表3-13給出了I幀內(nèi)塊、F前向預測塊、B后向預測塊和A平均值塊的預測器的計算表達式。78 MPEG2 視頻數(shù)據(jù)流的六層構(gòu)造圖圖像序列頭圖像組圖像組序列尾 圖像組圖像組頭圖象I、P、B圖象I、P、B圖像頭宏塊片宏塊片宏
33、塊片頭宏塊宏塊18828838848858868888視頻序列層圖像組層宏塊片層宏塊層YCb Cr圖像層塊層79視頻數(shù)據(jù)流之間的關(guān)系圖 圖像組層宏塊層88像素塊層 宏塊片層視頻序列層圖像層80MPEG視頻緊縮數(shù)據(jù)流構(gòu)造 1. 視頻序列層: 圖像序列頭包含了圖像寬度、高度、像素長寬比、幀率、位率、緩沖區(qū)尺寸、量化矩陣等信息。 2. 圖像組層: 圖像組頭包含時間代碼等信息,圖像組中的第一個圖像總是I圖像幀。 3. 圖像層: 由圖像頭及多個宏塊片構(gòu)成的。圖像頭包含該圖像的編碼類型及碼表選擇等信息。81MPEG視頻緊縮數(shù)據(jù)流構(gòu)造 4. 宏塊片層: 宏塊片由宏塊片頭和多個延續(xù)的宏塊以及附加數(shù)據(jù)組成。 5
34、. 宏塊層: MPEG算法中的根本編碼單元。它是圖像幀內(nèi)的一個1616像素的亮度信息和兩個88像素色差信號塊組成,附加數(shù)據(jù)包括宏塊的編號、宏塊的編碼類型、量化參數(shù)、運動矢量等信息。82宏塊構(gòu)造有三種格式 411格式: 422格式: 54460123570123 Y Cb Cr Y Cb Cr83宏塊構(gòu)造有三種格式 444格式: 0 1 2 3 4 8 6 10 5 9 7 11 Y Cb Cr846. 塊 層 MPEG算法中最小的編碼單元,它包含88像素,有三類圖像信息之一,亮度信號Y、色差信號U/V。 Y U V 1 2 3 4 5 6 88 88 85MPEG 音頻 MPEG音頻規(guī)范有以下
35、特點: 1. 音頻信號采樣率可以是22KHz,44.1 KHz或48KHz。 2. 緊縮后的比特流可以按以下3種方式之一支持單聲道或雙聲道:1提供應單音頻通道的單聲道方式。2提供應兩個獨立的單音頻通道的雙單聲道方式。3提供應立體聲通道的立體聲方式。86MPEG 音頻 3. 3個獨立的緊縮層次:1層1最簡單,運用比特率384Kbps。2層2的復雜度中等,運用比特率192Kbps左右,主要運用于數(shù)字廣播的音頻編碼。3層3最復雜,運用比特率64Kbps,音質(zhì)好,適用于ISDN上的音頻傳輸。 4. 編碼后的比特流支持循環(huán)冗余校驗CRC。 5. 還支持在比特流中攜帶附加信息。87幀間編碼技術(shù) 編碼器的輸出視頻圖像序列陳列順序。1 4 2 3 7 5 6 10 8I P B B P B B P B9 13 11 12 16 14 15 B P B B I B B 發(fā)送端編碼器的輸出到接納端解碼器的輸入端,經(jīng)解碼器的輸出,又恢復為圖3-12編碼器輸入順序顯示。88運動補償技術(shù) 運動矢量選擇二維1616像素塊作為一個的運動矢量處置。 運動矢量又稱為宏塊,它有不同的類型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 波型發(fā)生器課程設計
- 2025版設備采購咨詢合同3篇
- 磚混倉庫課程設計
- 2025版區(qū)塊鏈技術(shù)應用銷售合作合同范本2篇
- 2025版建筑設計與施工一體化合作意向書3篇
- 2025年grc裝飾線條綠色環(huán)保家居安裝合同3篇
- 2025版建筑垃圾運輸與處理服務合同3篇
- 2025版劇院租賃合同范本(含演出設備租賃與維護)3篇
- 金屬配件在游樂設施中的應用考核試卷
- 電池課程設計代寫
- 2024年地理知識競賽試題200題及答案
- 化學反應工程智慧樹知到期末考試答案章節(jié)答案2024年浙江工業(yè)大學
- 人生悟理-透過物理看人生智慧樹知到期末考試答案2024年
- 兒童劇劇本三只小豬
- 水上運輸大型構(gòu)件安全交底
- 《保障農(nóng)民工工資支付條例》口袋書課件
- 2020 新ACLS-PCSA課前自我測試-翻譯版玉二醫(yī)【復制】附有答案
- 危險化學品安全周知卡氧氣
- DB13∕T 5517-2022 大田作物病蟲草害防控關(guān)鍵期植保無人飛機作業(yè)技術(shù)規(guī)程
- 《編譯原理》考試試習題及答案(匯總)
- 贏在執(zhí)行力:團隊執(zhí)行力-下
評論
0/150
提交評論