L10-視頻壓縮MPEG標準(全)_第1頁
L10-視頻壓縮MPEG標準(全)_第2頁
L10-視頻壓縮MPEG標準(全)_第3頁
L10-視頻壓縮MPEG標準(全)_第4頁
L10-視頻壓縮MPEG標準(全)_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、多媒體技術(shù)公共課程中南大學信息科學與工程學院第 十講 (續(xù))視頻壓縮技術(shù)與標準陳科文 主講多媒體技術(shù):視頻壓縮技術(shù)與標準主 要 內(nèi) 容視頻圖像壓縮技術(shù)綜述視頻壓縮基本原理MPEG 1 標準MPEG 2 標準MPEG 4 標準多媒體技術(shù)公共課程中南大學信息科學與工程學院一、視頻圖像壓縮 技術(shù)綜述 多媒體技術(shù):視頻壓縮技術(shù)與標準1.1 視頻視頻(動態(tài)圖像動態(tài)圖像)壓縮編碼的基本方法壓縮編碼的基本方法信息冗余類別冗余性說明主要編碼方法統(tǒng)計特性空間冗余時間冗余像素間的相關(guān)性時間方向上前后圖片的相關(guān)性變換編碼、預(yù)測編碼幀間預(yù)測、運動補償構(gòu)造冗余知識冗余視覺冗余其它圖像本身的構(gòu)造特征收發(fā)兩端對人物的共有認

2、識人的視覺特性不確定性因素輪廓編碼、區(qū)域分割基于知識的編碼非線性量化、位分配多媒體技術(shù):視頻壓縮技術(shù)與標準1.1 視頻視頻(動態(tài)圖像動態(tài)圖像)壓縮編碼的基本方法壓縮編碼的基本方法圖像和視頻壓縮方法無失真壓縮有失真壓縮Huffman編碼行程編碼算術(shù)編碼詞典編碼如:LZW預(yù)測編碼運動補償變換編碼DCT變換小波變換子帶編碼模型編碼分形編碼基于重要性濾波子采樣矢量量化混合編碼JPEGMPEGH.261H.263多媒體技術(shù):視頻壓縮技術(shù)與標準1.2 視頻壓縮標準視頻壓縮標準 視頻壓縮的一個重要標準是視頻壓縮的一個重要標準是 MPEG系列系列,已推出,已推出了了 MPEG(或或MPEG 1)、)、MPEG

3、 2 、MPEG 4 、 MPEG 7 等系列標準,新的標準等系列標準,新的標準 MPEG-21 等也正在等也正在制定與完善之中。制定與完善之中。 另一個重要標準是另一個重要標準是 H 系列系列,包括,包括 H.261、H.263、H.26L等標準;此外等標準;此外, 還有還有 運動運動 JPEG 等壓縮標準。等壓縮標準。 多媒體技術(shù):視頻壓縮技術(shù)與標準1.3 MPEG 標準概述標準概述 MPEG 標準簡介標準簡介: MPEG 標準是面向 運動圖像壓縮運動圖像壓縮 的一系列國際標準( 包括:MPEG-1,-2,-4等,),它是由 ISO 和 IEC 兩個機構(gòu)聯(lián)合組成的一個運動圖像專家組(Mot

4、ion Picture Experts Group,簡稱 MPEG )制定的。 目前,已得到廣泛推廣應(yīng)用的 MPEG 1標準和MPEG 2 標準實際上就是數(shù)字影視節(jié)目的壓縮標準數(shù)字影視節(jié)目的壓縮標準,因此,它們不僅僅涉及運動圖像的壓縮,還包括聲音的壓縮,以及音頻、視頻同步等多方面內(nèi)容。多媒體技術(shù):視頻壓縮技術(shù)與標準1.3 MPEG 標準概述標準概述 (續(xù)續(xù)1)MPEG 系列標準簡介系列標準簡介 MPEG 1 標準(標準(ISO/IEC 11172)名稱:名稱:Information technology Coding of moving pictures and associated audi

5、o for digital storage media at up to about 1.5 Mbps.目標:主要是針對當時只有目標:主要是針對當時只有 1.5 Mb/s 以下速率的以下速率的CD-ROM 和網(wǎng)絡(luò)開發(fā)的,用于數(shù)字影視節(jié)目的存儲和網(wǎng)絡(luò)開發(fā)的,用于數(shù)字影視節(jié)目的存儲和傳輸。和傳輸。多媒體技術(shù):視頻壓縮技術(shù)與標準1.3 MPEG 標準概述標準概述 (續(xù)續(xù)2) MPEG 2 標準(標準(ISO/IEC 13818)名稱:名稱:Information technology Generic coding of moving pictures and associated audio inf

6、ormation. ( 運動圖像及其伴音通用編碼運動圖像及其伴音通用編碼 )目標:位速率為目標:位速率為 49 Mb/s (最高可達最高可達 15 Mb/s),可適應(yīng)各種應(yīng)用;它是一個直接與數(shù)字電視廣播有可適應(yīng)各種應(yīng)用;它是一個直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音的編碼標準。關(guān)的高質(zhì)量圖像和聲音的編碼標準。多媒體技術(shù):視頻壓縮技術(shù)與標準1.3 MPEG 標準概述標準概述 (續(xù)續(xù)3) MPEG 4 標準(標準(ISO/IEC DIS 14496)名稱:名稱:Very-low bit rate audio visual coding ( 甚低位速率視聽編碼甚低位速率視聽編碼 )目標:在異構(gòu)網(wǎng)絡(luò)

7、環(huán)境下能夠高度可靠地工作,目標:在異構(gòu)網(wǎng)絡(luò)環(huán)境下能夠高度可靠地工作,并且具有很強的交互功能;它是為音像數(shù)據(jù)的編碼并且具有很強的交互功能;它是為音像數(shù)據(jù)的編碼和交互播放而開發(fā)的、是一種數(shù)據(jù)速率很低的多媒和交互播放而開發(fā)的、是一種數(shù)據(jù)速率很低的多媒體通信標準。體通信標準。多媒體技術(shù):視頻壓縮技術(shù)與標準1.3 MPEG 標準概述標準概述 (續(xù)續(xù)4) MPEG 7 標準標準名稱:名稱:Multimedia Content Description Interface ( 多媒體內(nèi)容描述接口多媒體內(nèi)容描述接口 )目標:制定一套描述符標準,用來描述各種多媒目標:制定一套描述符標準,用來描述各種多媒體信息及它

8、們之間的關(guān)系,以便更快、更有效地檢體信息及它們之間的關(guān)系,以便更快、更有效地檢索多媒體信息;因此,它只規(guī)定了多媒體信息內(nèi)容索多媒體信息;因此,它只規(guī)定了多媒體信息內(nèi)容的描述格式。的描述格式。多媒體技術(shù):視頻壓縮技術(shù)與標準1.3 MPEG 標準概述標準概述 (續(xù)續(xù)5) MPEG 21 標準標準名稱:名稱:Multimedia Framework ( 多媒體集成框架多媒體集成框架 )目標:協(xié)調(diào)不同層次間的多媒體技術(shù)標準,建立目標:協(xié)調(diào)不同層次間的多媒體技術(shù)標準,建立一個交互式的通用多媒體框架,此框架能夠支持各一個交互式的通用多媒體框架,此框架能夠支持各種不同的應(yīng)用領(lǐng)域,允許不同用戶使用和傳遞不同種

9、不同的應(yīng)用領(lǐng)域,允許不同用戶使用和傳遞不同類型的媒體數(shù)據(jù),并且實現(xiàn)對知識產(chǎn)權(quán)的管理和數(shù)類型的媒體數(shù)據(jù),并且實現(xiàn)對知識產(chǎn)權(quán)的管理和數(shù)字媒體內(nèi)容的保護。字媒體內(nèi)容的保護。多媒體技術(shù)公共課程中南大學信息科學與工程學院二、MPEG 1 標準 多媒體技術(shù):視頻壓縮技術(shù)與標準2.1 MPEG 1 標準簡介標準簡介 MPEG 1 1 標準(標準(ISO/IEC11172)的的目標目標是以約是以約 1.5 Mbps 的速率傳輸電視質(zhì)量的視頻信號,其亮度信的速率傳輸電視質(zhì)量的視頻信號,其亮度信號的分辨率為號的分辨率為360 (352)240,色度信號的分辨率為,色度信號的分辨率為180(176)120,每秒,每

10、秒30幀。幀。 MPEG 1 標準包括四大部分:標準包括四大部分: MPEG系統(tǒng)(系統(tǒng)(ISO/IEC11172-1) MPEG視頻(視頻(ISO/IEC11172-2) MPEG音頻(音頻(ISO/IEC11172-3) 測試驗證測試驗證 (ISO/IEC11172-4)所以,所以,MPEG 涉及的問題是視頻壓縮、音頻壓縮及涉及的問題是視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流的復(fù)合和同步問題。多種壓縮數(shù)據(jù)流的復(fù)合和同步問題。多媒體技術(shù):視頻壓縮技術(shù)與標準2.1 MPEG 1 標準簡介標準簡介(續(xù)續(xù)) MPEG1 標準特點標準特點: 能夠傳輸用戶可以接受的視頻;能夠傳輸用戶可以接受的視頻; 能夠支持

11、對稱或者非對稱的壓縮能夠支持對稱或者非對稱的壓縮/解壓縮應(yīng)用;解壓縮應(yīng)用; 當需要時,可以控制壓縮當需要時,可以控制壓縮/解壓縮的延遲;解壓縮的延遲; 能夠支持視頻和音頻的同步工作;能夠支持視頻和音頻的同步工作; 能夠以靈活的格式支持窗口視頻演示;能夠以靈活的格式支持窗口視頻演示; 根據(jù)需要可以支持隨機存取;根據(jù)需要可以支持隨機存取; 支持多種工作方式支持多種工作方式 ( 播放、快進、快倒、快放等播放、快進、快倒、快放等); 能夠避免出現(xiàn)大的障礙;能夠避免出現(xiàn)大的障礙; 如果需要,可以具有編輯能力;如果需要,可以具有編輯能力; 不排斥使用價格低廉又能夠?qū)崟r編碼的芯片。不排斥使用價格低廉又能夠?qū)?/p>

12、時編碼的芯片。多媒體技術(shù):視頻壓縮技術(shù)與標準2.2 時間冗余量的減少時間冗余量的減少(1)時間冗余量的減少)時間冗余量的減少 (幀間壓縮)(幀間壓縮) 為了減少時間冗余量,為了減少時間冗余量,MPEG 將將1/30秒時間間隔秒時間間隔的幀序列電視圖像,以三種類型的圖像格式表示:的幀序列電視圖像,以三種類型的圖像格式表示:內(nèi)碼幀內(nèi)碼幀(I)、預(yù)測幀預(yù)測幀(P)和和 插補幀插補幀(B)。)。( 注:另有第四種類型幀是另有第四種類型幀是 D 幀,它是一種專用幀,它是一種專用幀格式,僅僅用于實現(xiàn)快速查詢中。幀格式,僅僅用于實現(xiàn)快速查詢中。)多媒體技術(shù):視頻壓縮技術(shù)與標準2.2 時間冗余量的減少時間冗余

13、量的減少(續(xù)續(xù)1) I 幀,又稱為內(nèi)碼幀,是完整的獨立編碼的圖像,是不能由其他幀構(gòu)造的幀,必須存儲或傳輸。 P 幀,也稱為預(yù)測幀,通過對它之前的I幀進行預(yù)測,對預(yù)測誤差作有條件的存儲和傳輸。 B 幀,又稱為雙向預(yù)測幀或插補幀,是根據(jù)其前后的 I 幀或者 P 幀的信息進行插值編碼而獲得。該過程有時也稱為雙向插值。多媒體技術(shù):視頻壓縮技術(shù)與標準2.2 時間冗余量的減少時間冗余量的減少(續(xù)續(xù)2)I BB P BB P BB P多媒體技術(shù):視頻壓縮技術(shù)與標準2.2 時間冗余量的減少時間冗余量的減少(續(xù)續(xù)3)運動補償有兩種算法:運動補償有兩種算法: 預(yù)測法預(yù)測法 畫面上的運動部分在幀與幀之間必然有連續(xù)性

14、,畫面上的運動部分在幀與幀之間必然有連續(xù)性,預(yù)測法根據(jù)這一特性,將當前的圖像畫面看作是前面預(yù)測法根據(jù)這一特性,將當前的圖像畫面看作是前面某時刻圖像的位移,位移的幅度和方向在圖像畫面的某時刻圖像的位移,位移的幅度和方向在圖像畫面的各處可有不同。各處可有不同。 插補法插補法 用插補的方法進行運動的補償,可以大幅度地壓用插補的方法進行運動的補償,可以大幅度地壓縮運動圖像的信息??s運動圖像的信息。 多媒體技術(shù):視頻壓縮技術(shù)與標準2.2 時間冗余量的減少時間冗余量的減少(續(xù)續(xù)3)最佳匹配塊判據(jù):絕對誤差 (AE) 最小均方誤差(MSE)最小平均絕對幀差(MAD)最小匹配塊搜索法:二維對數(shù)搜索法三步搜索法

15、1.對偶搜索法多媒體技術(shù):視頻壓縮技術(shù)與標準2.3 空間冗余量的減少空間冗余量的減少(2)空間冗余量的減少)空間冗余量的減少 (幀內(nèi)壓縮幀內(nèi)壓縮) MPEG視頻信息的幀內(nèi)圖和預(yù)測圖都有很高視頻信息的幀內(nèi)圖和預(yù)測圖都有很高的空域冗余度,用于減少這方面冗余的技術(shù)很多。在的空域冗余度,用于減少這方面冗余的技術(shù)很多。在正交變換中,正交變換中,DCT具有許多明顯的優(yōu)點,且相對來說具有許多明顯的優(yōu)點,且相對來說較易實現(xiàn),所以較易實現(xiàn),所以幀內(nèi)壓縮也采用基于幀內(nèi)壓縮也采用基于DCT的方法的方法。這。這和靜態(tài)圖像的壓縮標準和靜態(tài)圖像的壓縮標準JPEG相同,且實現(xiàn)的步驟也相同,且實現(xiàn)的步驟也一樣。只是在一樣。只

16、是在JPEG壓縮算法中,針對靜止圖像,對壓縮算法中,針對靜止圖像,對DCT系數(shù)采用等寬量化。而在系數(shù)采用等寬量化。而在MPEG中的視頻信號包中的視頻信號包含有靜止畫面(幀內(nèi)圖)和運動信息(幀間預(yù)測圖)含有靜止畫面(幀內(nèi)圖)和運動信息(幀間預(yù)測圖)等不同的內(nèi)容,量化器的設(shè)計需作特殊考慮。等不同的內(nèi)容,量化器的設(shè)計需作特殊考慮。多媒體技術(shù):視頻壓縮技術(shù)與標準2.4 I 圖的壓縮編碼圖的壓縮編碼BGRYCrCb顏色空間變換分塊DCT量化Z 掃描DPCMRLE熵編碼I 圖 壓縮編碼原理多媒體技術(shù):視頻壓縮技術(shù)與標準2.5 P 圖的壓縮編碼圖的壓縮編碼當前塊匹配塊求差值YCrCbDCT+量化+RLE 匹

17、配塊運動矢量Huffman 編碼P 圖 的壓縮編碼原理多媒體技術(shù):視頻壓縮技術(shù)與標準2.6 B 圖的壓縮編碼圖的壓縮編碼待編碼塊 (z) 后圖匹配塊 (y)前圖匹配塊 (x)求差值預(yù)測誤差(E)DCT + 量化 + RLEHuffman 編碼運動矢量E = z- (x+y)/2多媒體技術(shù):視頻壓縮技術(shù)與標準2.7 MPEG-1 數(shù)據(jù)流結(jié)構(gòu)數(shù)據(jù)流結(jié)構(gòu)(3)MPEG 的分層結(jié)構(gòu)和位流的分層結(jié)構(gòu)和位流 MPEG 視頻圖像數(shù)據(jù)流是一個分層結(jié)構(gòu),目的是視頻圖像數(shù)據(jù)流是一個分層結(jié)構(gòu),目的是把位流中邏輯上獨立的實體分開,防止語意模糊,并把位流中邏輯上獨立的實體分開,防止語意模糊,并減輕解碼過程的負擔。減輕解

18、碼過程的負擔。 MPEG 視頻位流分層結(jié)構(gòu)共包括六層,每一層支視頻位流分層結(jié)構(gòu)共包括六層,每一層支持一個確定的功能持一個確定的功能: 或是一個信號處理功能(或是一個信號處理功能(DCTDCT,運運動補償),或是一個邏輯功能(同步,隨機存取點)動補償),或是一個邏輯功能(同步,隨機存取點)等。等。每一個層的開始有一個頭,作為說明參數(shù)。在圖每一個層的開始有一個頭,作為說明參數(shù)。在圖像序列層的頭中,裝有視頻序列參數(shù),如圖像寬度、像序列層的頭中,裝有視頻序列參數(shù),如圖像寬度、圖像高度、象素長寬比、幀率、位率、緩沖區(qū)尺寸等。圖像高度、象素長寬比、幀率、位率、緩沖區(qū)尺寸等。多媒體技術(shù):視頻壓縮技術(shù)與標準2

19、.8 MPEG-1 數(shù)據(jù)流結(jié)構(gòu)數(shù)據(jù)流結(jié)構(gòu)(續(xù)續(xù)) 層次名稱層次名稱 功能功能圖像序列層圖像序列層 隨機存取單元:上下文隨機存取單元:上下文圖像組層圖像組層 隨機存取單元:視頻編碼隨機存取單元:視頻編碼圖像層圖像層 基本編碼單元基本編碼單元宏塊片層宏塊片層 重同步單元重同步單元宏塊層宏塊層 運動補償單元運動補償單元塊層塊層 DCT單元單元多媒體技術(shù)公共課程中南大學信息科學與工程學院三、MPEG 2 標準 多媒體技術(shù):視頻壓縮技術(shù)與標準3.1 MPEG 2 標準簡介標準簡介 2. MPEG 2 壓縮標準壓縮標準 MPEG 2 標準包括 10 部分內(nèi)容: (1) MPEG系統(tǒng)、(2) MPEG視頻、

20、(3) MPEG音頻、(4)一致性測試 、 軟件模擬、 數(shù)字存儲媒體命令和控制 (DSM-CC) 擴展協(xié)議、 高級聲音編碼 (AAC)、 解碼器實時接口擴展標準( 注:已暫停開發(fā)) 、 DSM-CC一致性擴展測試、 AAC 標準修訂版; MPEG-2 是運動圖像及其伴音的通用編碼國際標準,克服并解決了MPEG-標準不能滿足的日益增長的多媒體技術(shù)、數(shù)字電視技術(shù)、多媒體分辨率和傳輸率等方面的技術(shù)要求的缺陷。多媒體技術(shù):視頻壓縮技術(shù)與標準3.2 MPEG 2 系統(tǒng)系統(tǒng) (1) MPEG 2 系統(tǒng)系統(tǒng) MPEG 2 系統(tǒng)支持五項基本功能:系統(tǒng)支持五項基本功能: 解碼時多壓縮流的同步;解碼時多壓縮流的同

21、步; 將多個壓縮流交織成單個的數(shù)據(jù)流;將多個壓縮流交織成單個的數(shù)據(jù)流; 解碼時緩沖器初始化;解碼時緩沖器初始化; 緩沖區(qū)管理;緩沖區(qū)管理; 時間識別。時間識別。多媒體技術(shù):視頻壓縮技術(shù)與標準3.3 MPEG 2 視頻視頻 (2) MPEG 2 視頻視頻 MPEG 2 視頻體系要求保證與視頻體系要求保證與MPEG 1 視頻體視頻體系向下兼容,并且同時應(yīng)力求滿足數(shù)字存儲媒體、可系向下兼容,并且同時應(yīng)力求滿足數(shù)字存儲媒體、可視電話、數(shù)字電視、高清晰度電視(視電話、數(shù)字電視、高清晰度電視(HDTV)、)、通信通信網(wǎng)絡(luò)等領(lǐng)域的應(yīng)用。網(wǎng)絡(luò)等領(lǐng)域的應(yīng)用。MPEG 2 視頻體系的視頻分量的位速率范圍大視頻體系

22、的視頻分量的位速率范圍大約為約為2到到15Mbps。分辨率有低(分辨率有低(352288)、中()、中(720480)、次)、次高(高(14401080)、高()、高(19201080)等不同)等不同檔次檔次,壓縮編碼方法也從簡單到復(fù)雜有不同壓縮編碼方法也從簡單到復(fù)雜有不同等級等級。多媒體技術(shù):視頻壓縮技術(shù)與標準3.3 MPEG 2 視頻視頻 MPEG-視頻具有以下特色:視頻具有以下特色: 框架和級別框架和級別 MPEG-視頻壓縮編碼的數(shù)據(jù)結(jié)構(gòu)視頻壓縮編碼的數(shù)據(jù)結(jié)構(gòu) 圖像組塊層是由宏塊構(gòu)成,一個組塊可由多圖像組塊層是由宏塊構(gòu)成,一個組塊可由多個宏塊組成。宏塊結(jié)構(gòu)有三種格式。個宏塊組成。宏塊結(jié)構(gòu)

23、有三種格式。 視頻比特流的語義規(guī)則視頻比特流的語義規(guī)則 多媒體技術(shù)公共課程中南大學信息科學與工程學院四、MPEG 4 標準 多媒體技術(shù):視頻壓縮技術(shù)與標準4.1 MPEG 4 標準標準一、一、MPEG 4 標準簡介:標準簡介:MPEG 4 是“甚低碼率音視頻編碼” ( Very-low bitrate audio-visual coding ) 標準(v1 1998.11 ; v2 1999.12 )。它是針對低速率(64 Kbps)下的視頻、音頻編碼和交互播放開發(fā)的算法和工具,它更加注重多媒體系統(tǒng)的交互性、互操作性和靈活性。其主要目標是:保證多媒體系統(tǒng)在異構(gòu)網(wǎng)絡(luò)環(huán)境下能夠高度可靠地工作,并且

24、具有很強的交互功能,以支持更廣泛的應(yīng)用。MPEG 4 標準主要應(yīng)用于可視電話(Video Phone)、多媒體郵件、電子新聞、可視游戲(Visual Game)、交互式多媒體服務(wù)、遠程監(jiān)控等方面。多媒體技術(shù):視頻壓縮技術(shù)與標準4.1 MPEG 4 標準標準 MPEG 4 的主要特點: 壓縮效率高,數(shù)據(jù)速率很低(壓縮效率高,數(shù)據(jù)速率很低(4.864 Kbps);可用于在公用電話網(wǎng)、移動通信網(wǎng)和因特網(wǎng)上傳輸多媒體信息。(它 可被認為是一種低速率多媒體通信標準。) 基于內(nèi)容編碼,支持自然基于內(nèi)容編碼,支持自然/合成對象混合編碼;合成對象混合編碼; 采用以內(nèi)容為中心的表示方法,引入了視聽對象(AVO)

25、的概念, 對信息元的描述更加符合人的心理,不僅可以獲得比現(xiàn)有標準更為優(yōu)越的性能,還提供了一些新功能。 支持更廣泛的應(yīng)用。支持更廣泛的應(yīng)用。應(yīng)用包括有線、無線、移動通信和因特網(wǎng)等領(lǐng)域;并且更加注重多媒體系統(tǒng)的交互性、互操作性和靈活性。能滿足作者、服務(wù)提供商和最終用戶的需求。多媒體技術(shù):視頻壓縮技術(shù)與標準4.1 MPEG 4 標準標準MPEG 4 標準的組成:MPEG 4 系統(tǒng)場景描述、數(shù)據(jù)平面、緩沖區(qū)管理與實時識別MPEG 4 視頻編碼MPEG 4 音頻編碼MPEG 4 一致性測試MPEG 4 參考軟件MPEG 4 傳輸多媒體集成框架 (DMIF)最優(yōu)化視頻參考軟件 (*)1.MPEG-4內(nèi)容在

26、IP網(wǎng)絡(luò)上的傳輸 (*)多媒體技術(shù):視頻壓縮技術(shù)與標準4.2 MPEG 4: 視聽對象視聽對象 二、視聽對象 (AVO) AVO (Audio / Visual Objects)是 MPEG 4 音視頻編碼的基本單位。音像節(jié)目的場景(Scene) 由多個 AVO 組成。 AVO 具有高效編碼、高效存儲與傳輸?shù)奶匦裕⑹沟酶嗟慕换ゲ僮鞒蔀榭赡堋?MPEG 4 對 AVO 的操作主要有:采用AVO 來表示聽覺、視覺、或視聽組合內(nèi)容;組合已有的AVO來生成復(fù)合的AVO,并生成視聽場景;對AVO的數(shù)據(jù)靈活地多路合成與同步,以便選擇合適的網(wǎng)絡(luò)來傳輸這些AVO數(shù)據(jù);允許接收端的用戶在視聽場景中對AVO進

27、行交互操作。1.支持AVO知識產(chǎn)權(quán)的識別與保護。多媒體技術(shù):視頻壓縮技術(shù)與標準4.3 MPEG 4 視頻編碼視頻編碼一、一、MPEG 4 視頻編碼視頻編碼: MPEG 4 支持自然和合成的視覺對象 (VO) 的編碼。(合成的VO 包括:2D、3D動畫和人面部表情動畫等) 基于內(nèi)容的視頻編碼過程:VO的提?。合葟脑家曨l流中分割出VO。VO的編碼: 對各VO分別獨立編碼,即對不同VO的運動信息、形狀信息和紋理信息這三類信息分別編碼,分配不同的碼字。VO的復(fù)合: 將各個VO的碼流復(fù)合成一個符合MPEG 4 標準的位流。 注:在編碼和復(fù)合階段可以加入用戶的交互控制或由智能化算法進行控制。 多媒體技術(shù)

28、:視頻壓縮技術(shù)與標準4.3 MPEG 4 視頻編碼視頻編碼 MPEG 4 視頻編碼驗證模型采用針對任意形狀的圖像區(qū)(稱為VOP)的壓縮編碼算法 ,它是在MPEG-1和MPEG 2 Video 標準的基礎(chǔ)上開發(fā)的,使用混合DPCM 和變換編碼技術(shù)。 視頻對象區(qū) VOP (Video Object Plane ,或稱為VO平面)是某一時刻某一幀畫面的 VO。 VOP 編碼就是對某一時刻該幀畫面 VO 的形狀、運動和紋理等三類信息進行編碼。多媒體技術(shù):視頻壓縮技術(shù)與標準4.3 MPEG 4 視頻編碼視頻編碼視頻圖像序列+DCTQI DCTQ-1幀存儲預(yù)測器 1預(yù)測器 2預(yù)測器 3選擇開關(guān)運動估計形狀

29、編碼運動、紋理編碼視頻復(fù)合+-MPEG 4 視頻編碼算法原理示意圖多媒體技術(shù):視頻壓縮技術(shù)與標準4.2 MPEG 4 視頻編碼視頻編碼 形狀編碼二值灰度級 運動估計和運動補償 I VOP 、P VOP 、B VOP 紋理編碼 基于 DCT 注:MPEG 4 靜止紋理編碼 :基于DWT (離散小波變換) + 算術(shù)編碼多媒體技術(shù):視頻壓縮技術(shù)與標準4.3 MPEG 4 視頻編碼視頻編碼 分級擴展編碼 空間可分級性 時間可分級性 質(zhì)量(SNR)可分級性VO至少包含兩層數(shù)據(jù) (VOL-1、 VOL-2 ) VOL-1: 基本層 VOL-2: 增強層 (可有多層)多媒體技術(shù):視頻壓縮技術(shù)與標準4.3 MPEG 4 視頻編碼視頻編碼VS1VS2VSNVO1VO2VOMVOL1VOL2VOLkGOV1GOV2GOVmVOP1VOP2VOPnVideo SessionVideo ObjectVideo Object LayerGroup Of VOPsVideo Object Plane( VO Sequence )MPEG 4 視頻數(shù)據(jù)流的邏輯結(jié)構(gòu)視頻數(shù)據(jù)流的邏輯結(jié)構(gòu)多媒體技術(shù)公共課程中南大學信息科學與工程學院五、MPEG - 7 標準 多媒體技術(shù):視頻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論