圖像與視頻編碼_第1頁
圖像與視頻編碼_第2頁
圖像與視頻編碼_第3頁
圖像與視頻編碼_第4頁
圖像與視頻編碼_第5頁
已閱讀5頁,還剩83頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、課程內(nèi)容圖像壓縮的基本概念圖像壓縮算法圖像壓縮編碼標準為什么需要壓縮?舉例1:一張A4(210mm297mm) 大小的照片,若用中等分辨率(300dpi)的掃描儀按真彩色掃描,其數(shù)據(jù)量為多少?(注:dpi表示每英寸像素,1英寸25.4mm)若按每像素3個字節(jié)計算,上述結果為約26M舉例2:目前的WWW包含大量的圖像信息,如果圖像信息的數(shù)據(jù)量太大,會使本來就已經(jīng)非常緊張的網(wǎng)絡帶寬變得更加不堪重負(WWW變成了World Wide Wait)視頻數(shù)據(jù)量:對于電視畫面的分辨率640*480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為:640*480*24*30=221.12M實時傳輸:在10M帶寬網(wǎng)上

2、實時傳輸?shù)脑?,需要壓縮到原來數(shù)據(jù)量的0.045存儲: 1張CD可存640M,如果不進行壓縮,1張CD則僅可以存放2.89秒的數(shù)據(jù)可見,單純依靠增加存儲器容量和改善信道帶寬無法滿足需求,必須進行壓縮數(shù)據(jù)冗余設:n1和n2是指原始圖像和編碼后圖像每個像素的平均比特數(shù)壓縮率(壓縮比)用于描述圖像壓縮效果CR = n1 / n2其中,n1是壓縮前的數(shù)據(jù)量,n2是壓縮后的數(shù)據(jù)量相對數(shù)據(jù)冗余:RD = 1 1/CR=(n1-n2)/n2編碼冗余如果一個圖像的灰度級編碼,使用了多于實際需要的編碼符號,就稱該圖像包含了編碼冗余例:如果用8位表示下面圖像的像素,我們就說該圖像存在著編碼冗余,因為該圖像的像素只有

3、兩個灰度,用一位即可表示。像素冗余由于任何給定的像素值,原理上都可以通過它的相鄰像素預測到,單個像素攜帶的信息相對是小的。對于一個圖像,很多單個像素對視覺的貢獻是冗余的。這是建立在對鄰值預測的基礎上。例:原圖像數(shù)據(jù):234 223 231 238 235壓縮后數(shù)據(jù):234 11 -8 -7 3,我們可以對一些接近于零的像素不進行存儲,從而減小了數(shù)據(jù)量視覺信息冗余一些信息在一般視覺處理中比其它信息的相對重要程度要小,這種信息就被稱為視覺心理冗余。33K15K保真度標準評價壓縮算法的標準客觀保真度標準:圖像壓縮過程對圖像信息的損失能夠表示為原始圖像與壓縮并解壓縮后圖像的函數(shù)。一般表示為輸出和輸入之

4、差:兩個圖像之間的總誤差:均方根誤差:主觀保真度標準:通過視覺比較兩個圖像,給出一個定性的評價,如很粗、粗、稍粗、相同、稍好、較好、很好等,可以對所有人的感覺評分計算平均感覺分來衡量),(),(),(yxfyxfyxe 1010),(),(MxNyyxfyxf2/110102),(),(1 MxNyrmsyxfyxfMNe下表給出一種對電視圖像質(zhì)量進行評價打分的分級準則。評分評 價說 明1優(yōu)秀圖像質(zhì)量非常好,如同人能想象出的最好質(zhì)量。2良好圖像質(zhì)量高,觀看舒服,有干擾但不影響觀看。3可用圖像質(zhì)量可接受,有干擾但不太影響觀看。4剛可看圖像質(zhì)量差,干擾有些妨礙觀看,觀察者希望改進。5差圖像質(zhì)量很差

5、,妨礙觀看的干擾始終存在,幾乎無法觀看。6不能用圖像質(zhì)量極差,不能使用。圖像傳輸模型信源編碼:完成原數(shù)據(jù)的壓縮。信道編碼:為了抗干擾,增加一些容錯、校驗位、版權保護,實際上是增加冗余。信道:如Internet、廣播、通訊、可移動介質(zhì)。信源信源編碼編碼信源信源解碼解碼圖像壓縮的分類圖像壓縮有損壓縮無損壓縮行程編碼LZW編碼哈夫曼編碼算術編碼無損預測編碼位平面編碼有損預測編碼分形編碼子帶編碼神經(jīng)網(wǎng)絡編碼變換編碼K-L變換Haar變換Walsh.Hadamard變換離散余弦變換離散傅立葉變換斜變換小波變換行程編碼(RLE)行程:具有相同灰度值的像素序列編碼思想:將一行中顏色值相同的相鄰象素(行程)用

6、一個計數(shù)值(行程的長度)和該顏色值(行程的灰度)來代替,從而去除像素冗余。例:設重復次數(shù)為 iC, 重復像素值為 iP編碼為:iCiP iCiP iCiP編碼前:aaaaaaabbbbbbcccccccc 編碼后:7a6b8c行程編碼(RLE)對于有大面積色塊的圖像,壓縮效果很好對于紛雜的圖像,壓縮效果不好,最壞情況下(圖像中每兩個相鄰點的顏色都不同 ),會使數(shù)據(jù)量加倍,所以現(xiàn)在單純采用行程編碼的壓縮算法用得并不多,PCX文件算是其中之一二維行程編碼二維行程編碼要解決的核心問題是:將二維排列的像素,采用某種方式轉化成一維排列的方式。之后按照一維行程編碼方式進行編碼兩種典型的二維行程編碼的排列方

7、式二維行程編碼數(shù)據(jù)量:64*8=512(bit)130130130129134133129130130130130129134133130130130130130129132132130130129130130129130130129129127128127129131 129131 130127128127128127128132132125126129129127129133132127125128128126130131131f二維行程編碼如果按照方式(a)掃描的順序排列的話,數(shù)據(jù)分布為:130,130,130,130,130,130,130,130,130;129,129,129,12

8、9,130,130,129;127,128,127,129,131,130,132,134,134;133,133,132,130,129,128,127,128,127,128,127,125,126,129,129;127,129,133,132,131,129,130,130;129,130,130,130,129,130,132,132;131,131,130,126,128,128,127,127行程編碼為:數(shù)據(jù)量為:43*(3+8)=473(bit) (94.22%)(7,130),(),(2,130),(),(4,129),(),(2,130),(),(1,129);();(1,

9、127),),(1,128),(),(1,127),(),(1,129),(),(1,131),(),(1,130),(),(1,132),),(2,134),(),(2,133),(),(1,132),(),(1,130),(),(1,129),(),(1,128),),(1,127),(),(1,128),(),(1,127),(),(1,128),(),(1,127),(),(1,125),),(1,126),(),(2,129),(),(1,127),(),(1,129),(),(1,133),(),(1,132),),(1,131),(),(1,129),(),(2,130),(),

10、(1,129),(),(3,130),(),(1,129),),(1,130),(),(2,132),(),(2,131),(),(1,130),(),(1,126),(),(2,128),),(2,127)LZW編碼LZW是一種比較復雜的壓縮算法,壓縮效率較高基本原理:每一個第一次出現(xiàn)的字符串用一個數(shù)值來編碼,再將這個數(shù)值還原為字符串。例如:用數(shù)值0 x100代替字符串“abccddeee”,每當出現(xiàn)該字符串時,都用0 x100代替,從而起到了壓縮作用。數(shù)值與字符串的對應關系在壓縮過程中動態(tài)生成并隱含在壓縮數(shù)據(jù)中,在解壓縮時逐步得到恢復。LZW是無損的。GIF和Tiff圖像都采用了這種壓縮算

11、法。LZW算法由Unisys公司在美國申請了專利,以前要使用它首先要獲得該公司的認可哈夫曼編碼哈夫曼(Huffman)編碼是一種常用的壓縮編碼方法,是Huffman于1952年為壓縮文本文件建立的?;舅枷胪ㄟ^減少編碼冗余來達到壓縮的目的。統(tǒng)計符號的出現(xiàn)概率,建立一個概率統(tǒng)計表將最常出現(xiàn)(概率大的)的符號用最短的編碼,最少出現(xiàn)的符號用最長的編碼。例子:建立概率統(tǒng)計表和編碼樹符號 概率 1 2 3 4a2 0.4 0.4 0.4 0.4 0.6a6 0.3 0.3 0.3 0.3 0.4a1 0.1 0.1 0.2 0.3a4 0.1 0.1 0.1a3 0.06 0.1a5 0.04 例子的編

12、碼過程(思考編碼是否唯一):解碼過程符號 概率 編碼 1 2 3 4a20.4 1 0.4 1 0.4 1 0.4 1 0.6 0a60.3 01 0.3 01 0.3 01 0.3 01 0.4 1a10.1 001 0.1 001 0.2 001 0.3 00a40.1 0001 0.1 0001 0.1 000 a30.06 00001 0.1 0000 a50.04 0000000001 001 1 1 01a3 a1 a2 a2 a60.60.4 a20.3 a60.3 0.1 a10.2 0.1 a4 0.04 a50 .06 a30.1 0 1 0 1 0 1 0 1 0 1哈夫

13、曼編碼過程(1) 首先統(tǒng)計出每個符號出現(xiàn)的頻率,比如上例中a1到a6的出現(xiàn)頻率分別為0.1、0.4、0.06、0.1、0.04、0.3。(2) 從左到右把上述頻率按從小到大的順序排列。(3) 每一次選出最小的兩個值,作為二叉樹的兩個葉子節(jié)點,將和作為它們的根節(jié)點,這兩個葉子節(jié)點不再參與比較,新的根節(jié)點參與比較。(4)重復(3),直到最后得到和為1的根節(jié)點。(5)將形成的二叉樹的左節(jié)點標0,右節(jié)點標1。把從最上面的根節(jié)點到最下面的葉子節(jié)點途中遇到的0,1序列串起來,就得到了各個符號的編碼無損預測編碼預測編碼:根據(jù)數(shù)據(jù)在時間和空間上的相關性,根據(jù)統(tǒng)計模型利用已有樣本對新樣本進行預測線性預測的編碼思

14、想1) 去除像素冗余。2) 認為相鄰像素的信息有冗余。當前像素值可以用以前的像素值來獲得。3) 用當前像素值 ,通過預測器得到一個預測值 ,對當前值和預測值求差 ,對差編碼,作為壓縮數(shù)據(jù)流中的下一個元素。由于通常誤差值比樣本值小得多,因而可以達到數(shù)據(jù)壓縮的效果。大多數(shù)情況下, 是通過m個以前像素的線性組合來生成的:nfnfnf)(1miininfaroundfnnnffe預測編碼器如果沒有量化器,那么就是無損編碼如果有量化器,則是有損編碼+ -符號符號編碼編碼壓縮圖像輸入圖像enfn fn量化器量化器n預測器預測器預測解碼器+ +符號符號解碼解碼預測器預測器解壓縮圖像壓縮圖像 fn fnn修正

15、后的預測編碼器增加一個反饋環(huán),將量化誤差和過去預測函數(shù)相加,作為新的預測函數(shù)符號符號編碼編碼壓縮圖像+ -en輸入圖像fn量化器量化器n預測器預測器 fn+ +fn fn = n + fn量化器量化器基本思想:減少數(shù)據(jù)量的最簡單的辦法是將圖像量化成較少的灰度級,通過減少圖像的灰度級來實現(xiàn)圖像的壓縮。這種量化是不可逆的,因而解碼時圖像有損失如果輸入是256 個灰度級,對灰度級量化后輸出,只剩下4個層次,數(shù)據(jù)量被大大減少。sts1s2s3t1t2t3變換編碼基本思想:用一個可逆的、線性的變換(如傅立葉變換),把圖像映射到變換系數(shù)集合,原本比較分散的圖像數(shù)據(jù)在新的坐標空間中得到集中,然后對該系數(shù)集合

16、進行量化和編碼對于大多數(shù)自然圖像,重要系數(shù)的數(shù)量是比較少的,不重要系數(shù)幅度一般較小,經(jīng)過量化可減少數(shù)據(jù)量,且僅以較小的圖像失真為代價變換編碼例如,將原始圖像進行離散余弦變換(DCT)后,有用的信息集中到左上方,進行量化就可以大大壓縮數(shù)據(jù)量52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68

17、 65 76 78 94-415 -29 -6225 55 -20 -1 3 7 -21 -629 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 3 11 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1-1 0 -1變換編碼編碼器:變換編碼首先要將圖像分成若干個((N/n)2個)nn的子圖像后,再分別進行變換和編碼,這是因為小塊便于處理,而且小塊內(nèi)的像素相關性較大,存在的冗余度大解碼器:輸入圖像壓縮圖像壓縮圖像解壓圖像變換的選擇可以

18、選擇的變換K-L變換、離散傅立葉變換(DFT)、離散余弦變換(DCT)、Walsh-Hadamard變換(WHT)、小波變換對變換的評價按信息封裝能力排序:KLT,DCT,DFT,WHT,HaarT但KLT的基圖像是數(shù)據(jù)依賴的,因而很少使用。 DFT的塊效應嚴重。常用的是DCT,已被國際標準采納。其優(yōu)點有:基本沒有塊效應信息封裝能力強,把最多的信息封裝在最少的系數(shù)中子圖尺寸的選擇子圖尺寸的選擇要遵循的原則:如果n是子圖的維數(shù),n應該是2的整數(shù)次方。為便于降低計算復雜度。n一般選為88或1616。由實踐得到隨著n的增加,塊效應相應減少DCT變換編碼DCT變換和逆變換:編碼過程:解碼過程:DCT變

19、換原圖像除以量化系數(shù)取整壓縮圖像DCTDCT逆變換逆變換壓縮圖像壓縮圖像乘以量化系數(shù)乘以量化系數(shù)取整取整解壓解壓圖像圖像1010222) 12(cos) 12(cos),()()(),(MxNyMNMNcyxyxfccF1010222) 12(cos) 12(cos),()()(),(MNMNcMNyxFccyxf1)(21xc0 x1,.,2 , 1Nx其中:其中:DCT變換可見圖像信號被分解成為直流成分;以及從低頻到高頻的各種余弦成分;而DCT系數(shù)只是表示了該種成分所占原圖像信號的份額大小 在離散余弦變換的反變換式中,任何像塊都可以表示成64個系數(shù)的不同大小的組合。那么任何像元也可以看成由

20、64個不同幅度的基本圖像的組合。這與任何信號可以分解成基波和不同幅度的諧波的組合具有相同的物理意義。運動圖像壓縮基于如下基本假設:各連續(xù)幀之間存在著相關性。將連續(xù)幀圖像序列,分為參考幀和預測幀,參考幀用靜止圖像壓縮方法進行壓縮(幀內(nèi)編碼),預測幀對幀差圖像進行壓縮(幀間編碼)由于幀差圖像的數(shù)據(jù)量大大小于參考幀的數(shù)據(jù)量,從而可以達到很高的壓縮比幀間運動補償預測編碼技術壓縮圖像塊輸入圖像塊enfn fn運動補償預測幀間誤差圖像運動補償預測圖像幀間預測編碼I 幀:不進行預測、進行幀內(nèi)編碼(參考幀)P幀:通過向前預測得到的誤差編碼幀B幀:通過雙向預測得到的誤差編碼幀,因圖像序列存放在存儲器中,可以使用

21、下一幀向前預測雙向預測前一幀前一幀當前幀當前幀前一幀前一幀當前幀當前幀下一幀下一幀運動補償物體在空間上的位移,用有限的運動參數(shù)(如運動矢量)加以描述,并和預測誤差一同參與編碼實現(xiàn)時,畫面一般劃分成一些不連接的像素塊(在MPEGl和MPEG2標準中一個像素塊為1616像素),對于每一個這樣的像素塊,只估算一個運動矢量K幀K+l 幀塊查找窗口圖像壓縮技術標準視頻編碼發(fā)展簡史H.261(1988)MPEG-1(1993)H.263(1995)H.263+(1998)H.263+(2000)H.264( MPEG-4Part 10 )(2003)MPEG-4 v1(1999)MPEG-4 v2(200

22、0)MPEG-4 v3(2001) 1988 1990 1992 1994 1996 1998 2000 2002 2003ISO/IECJPEG(1992)ITU-TMPEG-2(H.262)(1994)AVS靜止圖像壓縮編碼標準JPEGJPEG是Joint Photographic Experts Group的縮寫,即聯(lián)合圖像專家組。該標準是一種適用于靜止圖像壓縮算法的國際標準。在JPEG算法中,共包含四種模式,其中一種是基于DPCM的無損壓縮算法,另外三種是基于DCT的有損壓縮算法。JPEG的編碼模式無損壓縮編碼模式:采用預測法和哈夫曼編碼(或算術編碼)以保證重建圖像與原圖像完全相同(設

23、均方誤差為零),可見無失真?;贒CT的順序編碼模式:根據(jù)DCT變換原理,從上到下,從左到右順序地對圖像數(shù)據(jù)進行壓縮編碼。信息傳送到接收端時,首先按照上述規(guī)律進行解碼,從而還原圖像。在此過程中存在信息丟失,因此這是一種有損圖像壓縮編碼。基于DCT的累進編碼模式:它也是以DCT變換為基礎的,但是其掃描過程不同。它是通過多次掃描的方法來對一幅圖像進行數(shù)據(jù)壓縮。其描述過程是由粗到細逐步累加的方式進行的。圖像還原時,在屏幕上首先看到的是圖像的大致情況,而后逐步地細化,直到全部還原出來為止?;贒CT的分層編碼模式:這種模式是以圖像分辨率為基準進行圖像編碼的。它首先是從低分辯率開始,逐步提高分辨率,直至

24、與原圖像的分辨率相同為止。圖像重建時也是如此。無損壓縮編碼在傳真機、靜止畫面的電話電視會議應用中,根據(jù)其特點JPEG采用DPCM(差分脈沖編碼調(diào)制)無損壓縮編碼方案,其編碼過程如圖所示。順序編碼模式圖像分量編碼要經(jīng)過多次掃描才完成。第一次掃描只進行一次粗糙圖像的掃描壓縮, 以相對于總的傳輸時間快得多的時間傳輸粗糙圖像, 并重建一幀質(zhì)量較低的可識別圖像; 在隨后的掃描中再對圖像作較細的壓縮, 這時只傳遞增加的信息,可重建一幅質(zhì)量提高一些的圖像。這樣不斷累進, 直到滿意的圖像為止。需在量化器的輸出與熵編碼的輸入之間,增加一個足以存儲量化后DCT系數(shù)的緩沖區(qū),對緩沖區(qū)中存儲的DCT系數(shù)多次掃描,分批

25、編碼。累進操作方式編碼累進編碼模式(1)把原始圖像空間分辨率降低。(2)對已降低分辨率的圖像采用基于DCT的順序方式、累進方式或無失真預測編碼中的任何一種編碼方法進行編碼。(3)對低分辨率的圖像解碼,重建圖像,使用插值濾波器,對它插值,恢復圖像的水平和垂直分辨率。(4)把分辨率已升高的圖像作為原始圖像的預測值,對它們的差值采用基于DCT的順序方式、累進方式或用無失真方式進行編碼。(5)重復(3)、(4)直到圖像達到完整的分辨率。 分層操作模式JPEG壓縮流程編碼流程:解碼流程:量化器DCT變換構造8x8的子圖輸入圖像符號編碼器壓縮數(shù)據(jù)量化表碼表壓縮數(shù)據(jù)符號解碼器DCT逆變換反量化器量化表輸出圖

26、像碼表(從壓縮數(shù)據(jù)中得到)顏色空間轉換JPEG使用的顏色空間不是RGB空間,而是YCbCr空間,在進行DCT變換之前完成,這是因為人眼對亮度信息更敏感,相互之間的轉換為:R = Y + 1.40200(Cr 128)G = Y 0.34414(Cb 128) 0.71414(Cr 128)B = Y + 1.77200(Cb 128)Y = 0.299R + 0.5870G + 0.1140BCb = 0.1787R 0.3313G +0.5000B +128Cr = 0.5000R 0.4187G 0.0813B + 128量化Y為亮度分量,需要細量化,CbCr為色度分量,可以粗量化,因此量

27、化表有2張),從而提高壓縮比DCT變換之后低頻分量集中在左上角,代表直流(DC)系數(shù),由于兩個相鄰的子塊DC系數(shù)相差很小,采用差分編碼(DPCM),可以提高壓縮比后面的63個元素為高頻分量,代表交流(AC)系數(shù),采用行程編碼,通過“之”字型(Zigzag)排列方法來保證低頻分量先出現(xiàn),高頻分量后出現(xiàn)熵編碼 使用熵編碼還可以對使用熵編碼還可以對DPCMDPCM編碼后的直流編碼后的直流DCDC系數(shù)和系數(shù)和RLERLE編碼后的交流編碼后的交流ACAC系數(shù)作進一步的系數(shù)作進一步的壓縮。壓縮。 JPEGJPEG標準規(guī)定了兩種熵編碼算法:哈夫標準規(guī)定了兩種熵編碼算法:哈夫曼編碼和自適應算術編碼。哈夫曼編碼

28、采用曼編碼和自適應算術編碼。哈夫曼編碼采用的一般是固定的哈夫曼編碼表,而不是臨時的一般是固定的哈夫曼編碼表,而不是臨時統(tǒng)計出來的,并且對亮度分量和色度分量采統(tǒng)計出來的,并且對亮度分量和色度分量采用了不同的哈夫曼表。用了不同的哈夫曼表。組織碼流JPEGJPEG編碼的最后一個步驟是把各種標記代編碼的最后一個步驟是把各種標記代碼和編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)碼和編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)據(jù),為了便于傳輸、存儲和譯碼,據(jù),為了便于傳輸、存儲和譯碼, 2000年12月公布的新的JPEG 2000標準(ISO 15444), 其目標是在高壓縮率的情況下, 如何保證圖像傳輸?shù)馁|(zhì)量。JPEG2000

29、與JPEG算法上的區(qū)別:采用了以小波變換為主的多分辨率編碼方式統(tǒng)一了面向灰度圖像和二值圖像的編碼方式JPEG2000(1)高壓縮率。JPEG和JPEG2000在壓縮率相同時, JPEG2000的信噪比將提高30左右;(3)漸進傳輸。JPEG2000可實現(xiàn)依分辨率或者精度的漸進傳輸;(4)感興趣區(qū)域壓縮。JPEG2000 支持所謂的“感興趣區(qū)域”。JPEG2000主要特點第一個視頻編碼國際標準H.261視頻數(shù)據(jù)格式采用CIF(通用中間格式)和QCIF格式(1/4CIF)作為視頻輸入格式。H.261的數(shù)據(jù)結構圖像數(shù)據(jù)層次結構123456789101112123幀幀QCIF1234567891011

30、12131415161718192021222324252627282930313233塊組塊組123456宏塊宏塊8CIF塊塊8圖像層是由幀首和12個塊組層構成。其中幀首包括一個20比特幀起始碼和其他標志信息,如幀數(shù)、視頻格式(CIF/QCIF)等。塊組層是由GOB首和33個宏塊構成,其中GOB首中包含16bit塊組編號、塊組量化步長等標志信號。 宏塊層是由宏塊首和其后面的6個數(shù)據(jù)塊構成,MB首包括宏塊地址、類型信息、運動矢量數(shù)據(jù)和編碼塊圖樣等信息。 塊層是由DCT系數(shù)(TCOEFT)和塊結束符(EOB)組成。每塊包含88個數(shù)據(jù)。H.263H.263標準是一種甚低碼率通信的視頻編碼方案。所謂

31、甚低碼率視頻編碼技術是指壓縮編碼后的碼率低于64kbit/s的各種壓縮編碼方案. H.263能夠支持更多圖像格式采用半精度像素的預測值基于語法的算術編碼提高數(shù)據(jù)壓縮效率MPEG系列MPEG是Moving Picture Experts Group的英文縮寫,其含義是活動圖像專家組。MPEG-1是1993年8月正式通過的技術標準,其全稱為“適用于約1.5Mbit/s以下數(shù)字存儲媒體的運動圖像及伴音的編碼”。MPEG-2是1994年11月發(fā)布的“活動圖像及其伴音通用編碼”標準,該標準可以應用于(2.048Mbit/s20Mbit/s)的各種速率和各種分辨率的應用場合之中。如多媒體計算機、多媒體數(shù)據(jù)

32、庫、多媒體通信、常規(guī)數(shù)字電視、高清晰度電視以及交互式電視等。MPEG-4,1999年1月公布了該標準的V1.0版本,同年12月公布了V2.0版本。該標準主要應用于超低速系統(tǒng)之中,例如視頻會議和視頻電視、交互式視頻游戲和多媒體郵件、基于網(wǎng)絡的數(shù)據(jù)業(yè)務、遠程視頻監(jiān)視及無線多媒體通信。特別是它能夠滿足基于內(nèi)容的訪問和檢索的多媒體應用,并且其編碼系統(tǒng)是開放的,可隨時加入新的有效算法模塊。MPEG-7是2000年11月頒布的稱為“多媒體內(nèi)容描述接口”的標準。定義該標準的目的是制定出一系列的標準描述符來描述各種媒體信息。這種描述與多媒體信息的內(nèi)容有關,這樣將便于用戶進行基于內(nèi)容和對象的視聽信息的快速搜索。

33、可見MPEG-7與其他MPEG標準的不同之處在于它只提供了與內(nèi)容有關的描述符,并不包括具體的視音頻壓縮算法,而且還未形成與內(nèi)容提交有關的所有標準的總框架。MPEG-21的全稱為“多媒體框架”。MPEG-1MPEG-1標準是由三個部分構成第二部分為視頻部分,主要規(guī)定了圖像壓縮編碼方法,編號為11172-2。第一部分是系統(tǒng)部分,編號為11172-1。它描述了幾種伴音和圖像壓縮數(shù)據(jù)的復用以及加入同步信號后的整個系統(tǒng)。第三部分為音頻部分,主要規(guī)定了數(shù)字伴音壓縮編碼,編號為11172-3。MPEG1的系統(tǒng)部分MPEG-1標準的系統(tǒng)部分主要按定時信息的指示,將視頻和音頻數(shù)據(jù)流同步復合成一個完整的MPEG-

34、1比特流,從而便于信息的存儲與傳輸。在此過程將向數(shù)據(jù)流中加入相關的識別與同步信息,這樣在接收端,可以根據(jù)這些信息,從接收數(shù)據(jù)流中分離出視頻與音頻數(shù)據(jù)流,并分別送往各自的解碼器進行同步解碼和播放。視頻部分MPEG1碼流結構MPEG1 的幀內(nèi)編碼塊匹配塊匹配法(Block Matching Algorithm)需要解決兩個關鍵問題:(1)匹配準則 (2)搜索算法BMA中常用的匹配準則:絕對值:均方誤差:平均絕對幀差:二維對數(shù)搜索法三步搜索法對偶搜索法P幀的編碼方法B幀的編碼方法幀類型的安排一個典型的I、P、B圖像安排如下圖所示。編碼參數(shù)為:幀內(nèi)圖像I的距離為N=15,預測圖像(P)的距離為M=3。

35、I I、P P和和B B圖像壓縮后,圖像壓縮后,I I幀圖像的數(shù)據(jù)量最大,而幀圖像的數(shù)據(jù)量最大,而B B幀圖幀圖像的數(shù)據(jù)量最小。像的數(shù)據(jù)量最小。MPEG-2MPEG-1MPEG-1MPEG-2 (MPEG-2 (基本型基本型) )標準化時間標準化時間19921992年年19941994年年主要應用主要應用CD-ROMCD-ROM上的數(shù)字電視,上的數(shù)字電視,VCDVCD數(shù)字數(shù)字TVTV,DVDDVD空間分辨率空間分辨率CIFCIF格式格式(1/4 TV)(1/4 TV),288 288 360 360像素像素 TVTV,576 576 720 720像素像素時間分辨率時間分辨率25 - 30 2

36、5 - 30 幀幀/ /秒秒 50-60 50-60 場場/ /秒秒 位速率位速率1.5 1.5 Mbit/sMbit/s15 15 Mbit/sMbit/s質(zhì)量質(zhì)量相當于相當于VHS VHS 相當于相當于NTSC/PALNTSC/PAL電視電視壓縮率壓縮率20 30 20 30 30 40 30 40 MPEG-4運動圖像專家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦確定,且于2000年年初正式成為國際標準。MPEG-4是一種第二代視音頻編碼技術。它是一種適用于各種多媒體應用的“視音頻對象編碼”標準。 (1)MPE

37、G-4與MPEG-1/2標準的根本區(qū)別:MPEG-4是基于內(nèi)容的壓縮編碼方法引入視頻對象VO(Viedo Object)和視頻對象平面VOP(Video Object Plane)概念(2)MPEG4提供:(1)基于內(nèi)容的交互性(2)高效的壓縮性 (3)通用的訪問性(1)基于內(nèi)容的交互性 MPEG-4提供了基于內(nèi)容的多媒體數(shù)據(jù)訪問工具,如索引、超級鏈接、上下載、刪除等。利用這些工具,用戶可以方便地從多媒體數(shù)據(jù)庫中有選擇地獲取自己所需的與對象有關的內(nèi)容,并提供了內(nèi)容的操作和位流編輯功能,可應用于交互式家庭購物,淡入淡出的數(shù)字化效果等。MPEG-4提供了高效的自然或合成的多媒體數(shù)據(jù)編碼方法。它可以把自然場景或?qū)ο蠼M合起來成為合成的多媒體數(shù)據(jù)。(2)高效的壓縮性 MPEG-4基于更高的編碼效率。同已有的或即將形成的其它標準相比,在相同的比特率下,它基于更高的視覺聽覺質(zhì)量,這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時MPEG-4還能對同時發(fā)生的數(shù)據(jù)流進行編碼。一個場景的多視角或多聲道數(shù)據(jù)流可以高效、同步地合成為最終數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論