




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、MPEG4視頻壓縮編碼技術(shù)詳解 MPEG全稱是Moving Pictures Experts Group,它是動(dòng)態(tài)圖象專家組的英文縮寫,該專家組成立于1988年,致力于運(yùn)動(dòng)圖像及其伴音的壓縮編碼標(biāo)準(zhǔn)化工作,原先他們打算開發(fā)MPEG1、MPEG2、MPEG3和MPEG4四個(gè)版本,以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。 目前,MPEG1技術(shù)被廣泛的應(yīng)用于VCD,而MPEG2標(biāo)準(zhǔn)則用于廣播電視和DVD等。MPEG3最初是為HDTV開發(fā)的編碼和壓縮標(biāo)準(zhǔn),但由于MPEG2的出色性能表現(xiàn), MPEG3只能是死于襁褓了。而我們今天要談?wù)摰闹鹘?MPEG4于1999年初正式成為國(guó)際標(biāo)準(zhǔn)。它是一個(gè)適用于低傳輸速
2、率應(yīng)用的方案。與MPEG1和MPEG2相比,MPEG4更加注重多媒體系統(tǒng)的交互性和靈活性。下面就讓我們一起進(jìn)入多彩的MPEG4世界。 MPEG4的技術(shù)特點(diǎn) MPEG1、MPEG2技術(shù)當(dāng)初制定時(shí),它們定位的標(biāo)準(zhǔn)均為高層媒體表示與結(jié)構(gòu),但隨著計(jì)算機(jī)軟件及網(wǎng)絡(luò)技術(shù)的快速發(fā)展,MPEG1.MPEG2 技術(shù)的弊端就顯示出來(lái)了:交互性及靈活性較低,壓縮的多媒體文件體積過(guò)于龐大,難以實(shí)現(xiàn)網(wǎng)絡(luò)的實(shí)時(shí)傳播。而MPEG4技術(shù)的標(biāo)準(zhǔn)是對(duì)運(yùn)動(dòng)圖像中的內(nèi)容進(jìn)行編碼,其具體的編碼對(duì)象就是圖像中的音頻和視頻,術(shù)語(yǔ)稱為AV對(duì)象,而連續(xù)的AV對(duì)象組合在一起又可以形成AV場(chǎng)景。因此,MPEG4標(biāo)準(zhǔn)就是圍繞著 AV對(duì)象的編碼、存儲(chǔ)
3、、傳輸和組合而制定的,高效率地編碼、組織、存儲(chǔ)、傳輸AV對(duì)象是MPEG4標(biāo)準(zhǔn)的基本內(nèi)容。 在視頻編碼方面,MPEG4支持對(duì)自然和合成的視覺(jué)對(duì)象的編碼。(合成的視覺(jué)對(duì)象包括2D、3D動(dòng)畫和人面部表情動(dòng)畫等)。在音頻編碼上,MPEG4可以在一組編碼工具支持下,對(duì)語(yǔ)音、音樂(lè)等自然聲音對(duì)象和具有回響、空間方位感的合成聲音對(duì)象進(jìn)行音頻編碼。由于MPEG4只處理圖像幀與幀之間有差異的元素,而舍棄相同的元素,因此大大減少了合成多媒體文件的體積。應(yīng)用MPEG4技術(shù)的影音文件最顯著特點(diǎn)就是壓縮率高且成像清晰,一般來(lái)說(shuō),一小時(shí)的影像可以被壓縮為350M左右的數(shù)據(jù),而一部高清晰度的DVD電影, 可以壓縮成兩張甚至一
4、張650M CD光碟來(lái)存儲(chǔ)。對(duì)廣大的平民計(jì)算機(jī)用戶來(lái)說(shuō), 這就意味著, 您不需要購(gòu)置 DVD-ROM就可以欣賞近似DVD質(zhì)量的高品質(zhì)影像。而且采用MPEG4編碼技術(shù)的影片,對(duì)機(jī)器硬件配置的要求非常之低,300MHZ 以上CPU,64M的內(nèi)存和一個(gè) 8M顯存的顯卡就可以流暢的播放。在播放軟件方面,它要求也非常寬松,你只需要安裝一個(gè) 500K左右的 MPEG4 編碼驅(qū)動(dòng)后,用 WINDOWS 自帶的媒體播放器就可以流暢的播放了(下面我們會(huì)具體講到)。 視頻編碼研究與MPEG標(biāo)準(zhǔn)演進(jìn) 人類獲取的信息中70%來(lái)自于視覺(jué),視頻信息在多媒體信息中占有重要地位;同時(shí)視頻數(shù)據(jù)冗余度最大,經(jīng)壓縮處理后的視頻質(zhì)量
5、高低是決定多媒體服務(wù)質(zhì)量的關(guān)鍵因素。因此數(shù)字視頻技術(shù)是多媒體應(yīng)用的核心技術(shù),對(duì)視頻編碼的研究已成為信息技術(shù)領(lǐng)域的熱門話題。 視頻編碼的研究課題主要有數(shù)據(jù)壓縮比、壓縮/解壓速度及快速實(shí)現(xiàn)算法三方面內(nèi)容。以壓縮/解壓后數(shù)據(jù)與壓縮前原始數(shù)據(jù)是否完全一致作為衡量標(biāo)準(zhǔn),可將數(shù)據(jù)壓縮劃分為無(wú)失真壓縮(即可逆壓縮)和有失真壓縮(即不可逆壓縮)兩類。 傳統(tǒng)壓縮編碼建立在仙農(nóng)信息論基礎(chǔ)之上的,以經(jīng)典集合論為工具,用概率統(tǒng)計(jì)模型來(lái)描述信源,其壓縮思想基于數(shù)據(jù)統(tǒng)計(jì),因此只能去除數(shù)據(jù)冗余,屬于低層壓縮編碼的范疇。伴隨著視頻編碼相關(guān)學(xué)科及新興學(xué)科的迅速發(fā)展,新一代數(shù)據(jù)壓縮技術(shù)不斷誕生并日益成熟,其編碼思想由基于像素和像
6、素塊轉(zhuǎn)變?yōu)榛趦?nèi)容 (content-based)。它突破了仙農(nóng)信息論框架的束縛,充分考慮了人眼視覺(jué)特性及信源特性,通過(guò)去除內(nèi)容冗余來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮,可分為基于對(duì)象(object-based)和基于語(yǔ)義(semantics-based)兩種,前者屬于中層壓縮編碼,后者屬于高層壓縮編碼。 與此同時(shí),視頻編碼相關(guān)標(biāo)準(zhǔn)的制定也日臻完善。視頻編碼標(biāo)準(zhǔn)主要由ITU-T和ISO/IEC開發(fā)。ITU-T發(fā)布的視頻標(biāo)準(zhǔn)有H.261、 H.262、 H.263、 H.263+、H.263+,ISO/IEC公布的MPEG系列標(biāo)準(zhǔn)有MPEG-1、MPEG-2 、MPEG-4 和 MPEG-7,并且計(jì)劃公布MPEG-2
7、1。 MPEG即Moving Picture Expert Group(運(yùn)動(dòng)圖像專家組),它是專門從事制定多媒體視音頻壓縮編碼標(biāo)準(zhǔn)的國(guó)際組織。 MPEG系列標(biāo)準(zhǔn)已成為國(guó)際上影響最大的多媒體技術(shù)標(biāo)準(zhǔn),其中MPEG-1和MPEG-2是采用以仙農(nóng)信息論為基礎(chǔ)的預(yù)測(cè)編碼、變換編碼、熵編碼及運(yùn)動(dòng)補(bǔ)償?shù)鹊谝淮鷶?shù)據(jù)壓縮編碼技術(shù);MPEG-4(ISO/IEC 14496)則是基于第二代壓縮編碼技術(shù)制定的國(guó)際標(biāo)準(zhǔn),它以視聽媒體對(duì)象為基本單元,采用基于內(nèi)容的壓縮編碼,以實(shí)現(xiàn)數(shù)字視音頻、圖形合成應(yīng)用及交互式多媒體的集成。MPEG系列標(biāo)準(zhǔn)對(duì)VCD、DVD等視聽消費(fèi)電子及數(shù)字電視和高清晰度電視(DTV&HDTV)、多媒
8、體通信等信息產(chǎn)業(yè)的發(fā)展產(chǎn)生了巨大而深遠(yuǎn)的影響。 MPEG-4視頻編碼核心思想及關(guān)鍵技術(shù) 核心思想 在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代壓縮編碼技術(shù),著眼于圖像信號(hào)的統(tǒng)計(jì)特性來(lái)設(shè)計(jì)編碼器,屬于波形編碼的范疇。第一代壓縮編碼方案把視頻序列按時(shí)間先后分為一系列幀,每一幀圖像又分成宏塊以進(jìn)行運(yùn)動(dòng)補(bǔ)償和編碼,這種編碼方案存在以下缺陷: 將圖像固定地分成相同大小的塊,在高壓縮比的情況下會(huì)出現(xiàn)嚴(yán)重的塊效應(yīng),即馬賽克效應(yīng); 不能對(duì)圖像內(nèi)容進(jìn)行訪問(wèn)、編輯和回放等*作; 未充分利用人類視覺(jué)系統(tǒng)(HVS,Human Visual System)的特性。 MPEG-
9、4則代表了基于模型/對(duì)象的第二代壓縮編碼技術(shù),它充分利用了人眼視覺(jué)特性,抓住了圖像信息傳輸?shù)谋举|(zhì),從輪廓、紋理思路出發(fā),支持基于視覺(jué)內(nèi)容的交互功能,這適應(yīng)了多媒體信息的應(yīng)用由播放型轉(zhuǎn)向基于內(nèi)容的訪問(wèn)、檢索及*作的發(fā)展趨勢(shì)。 AV對(duì)象(AVO,Audio Visual Object)是MPEG-4為支持基于內(nèi)容編碼而提出的重要概念。對(duì)象是指在一個(gè)場(chǎng)景中能夠訪問(wèn)和*縱的實(shí)體,對(duì)象的劃分可根據(jù)其獨(dú)特的紋理、運(yùn)動(dòng)、形狀、模型和高層語(yǔ)義為依據(jù)。在MPEG-4中所見的視音頻已不再是過(guò)去MPEG-1、MPEG-2中圖像幀的概念,而是一個(gè)個(gè)視聽場(chǎng)景(AV場(chǎng)景),這些不同的AV場(chǎng)景由不同的AV對(duì)象組成。AV對(duì)象
10、是聽覺(jué)、視覺(jué)、或者視聽內(nèi)容的表示單元,其基本單位是原始 AV對(duì)象,它可以是自然的或合成的聲音、圖像。原始AV對(duì)象具有高效編碼、高效存儲(chǔ)與傳輸以及可交互*作的特性,它又可進(jìn)一步組成復(fù)合AV對(duì)象。因此 MPEG-4標(biāo)準(zhǔn)的基本內(nèi)容就是對(duì)AV對(duì)象進(jìn)行高效編碼、組織、存儲(chǔ)與傳輸。AV對(duì)象的提出,使多媒體通信具有高度交互及高效編碼的能力,AV對(duì)象編碼就是MPEG-4的核心編碼技術(shù)。 MPEG-4不僅可提供高壓縮率,同時(shí)也可實(shí)現(xiàn)更好的多媒體內(nèi)容互動(dòng)性及全方位的存取性,它采用開放的編碼系統(tǒng),可隨時(shí)加入新的編碼算法模塊,同時(shí)也可根據(jù)不同應(yīng)用需求現(xiàn)場(chǎng)配置解碼器,以支持多種多媒體應(yīng)用。 MPEG-4 采用了新一代視
11、頻編碼技術(shù),它在視頻編碼發(fā)展史上第一次把編碼對(duì)象從圖像幀拓展到具有實(shí)際意義的任意形狀視頻對(duì)象,從而實(shí)現(xiàn)了從基于像素的傳統(tǒng)編碼向基于對(duì)象和內(nèi)容的現(xiàn)代編碼的轉(zhuǎn)變,因而引領(lǐng)著新一代智能圖像編碼的發(fā)展潮流。 關(guān)鍵技術(shù) MPEG-4除采用第一代視頻編碼的核心技術(shù),如變換編碼、運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償、量化、熵編碼外,還提出了一些新的有創(chuàng)見性的關(guān)鍵技術(shù),并在第一代視頻編碼技術(shù)基礎(chǔ)上進(jìn)行了卓有成效的完善和改進(jìn)。下面重點(diǎn)介紹其中的一些關(guān)鍵技術(shù)。 A. 視頻對(duì)象提取技術(shù) MPEG-4實(shí)現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對(duì)象或者把運(yùn)動(dòng)對(duì)象從背景中分離出來(lái),然后針對(duì)不同對(duì)象采用相應(yīng)編碼方法,以實(shí)現(xiàn)高效壓縮
12、。因此視頻對(duì)象提取即視頻對(duì)象分割,是MPEG-4視頻編碼的關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點(diǎn)和難點(diǎn)。視頻對(duì)象分割涉及對(duì)視頻內(nèi)容的分析和理解,這與人工智能、圖像理解、模式識(shí)別和神經(jīng)網(wǎng)絡(luò)等學(xué)科有密切聯(lián)系。目前人工智能的發(fā)展還不夠完善,計(jì)算機(jī)還不具有觀察、識(shí)別、理解圖像的能力;同時(shí)關(guān)于計(jì)算機(jī)視覺(jué)的研究也表明要實(shí)現(xiàn)正確的圖像分割需要在更高層次上對(duì)視頻內(nèi)容進(jìn)行理解。因此,盡管MPEG-4 框架已經(jīng)制定,但至今仍沒(méi)有通用的有效方法去根本解決視頻對(duì)象分割問(wèn)題,視頻對(duì)象分割被認(rèn)為是一個(gè)具有挑戰(zhàn)性的難題,基于語(yǔ)義的分割則更加困難。 目前進(jìn)行視頻對(duì)象分割的一般步驟是:先對(duì)原始視頻/圖像數(shù)據(jù)進(jìn)行簡(jiǎn)化以利于分割,
13、這可通過(guò)低通濾波、中值濾波、形態(tài)濾波來(lái)完成;然后對(duì)視頻/圖像數(shù)據(jù)進(jìn)行特征提取,可以是顏色、紋理、運(yùn)動(dòng)、幀差、位移幀差乃至語(yǔ)義等特征;再基于某種均勻性標(biāo)準(zhǔn)來(lái)確定分割決策,根據(jù)所提取特征將視頻數(shù)據(jù)歸類;最后是進(jìn)行相關(guān)后處理,以實(shí)現(xiàn)濾除噪聲及準(zhǔn)確提取邊界。 在視頻分割中基于數(shù)學(xué)形態(tài)理論的分水嶺(watershed)算法被廣泛使用,它又稱水線算法,其基本過(guò)程是連續(xù)腐蝕二值圖像,由圖像簡(jiǎn)化、標(biāo)記提取、決策、后處理四個(gè)階段構(gòu)成。分水嶺算法具有運(yùn)算簡(jiǎn)單、性能優(yōu)良,能夠較好提取運(yùn)動(dòng)對(duì)象輪廓、準(zhǔn)確得到運(yùn)動(dòng)物體邊緣的優(yōu)點(diǎn)。但分割時(shí)需要梯度信息,對(duì)噪聲較敏感,且未利用幀間信息,通常會(huì)產(chǎn)生圖像過(guò)度分割。 B. VOP
14、視頻編碼技術(shù) 視頻對(duì)象平面(VOP,Video Object Plane)是視頻對(duì)象(VO)在某一時(shí)刻的采樣,VOP是MPEG-4視頻編碼的核心概念。 MPEG-4在編碼過(guò)程中針對(duì)不同VO采用不同的編碼策略,即對(duì)前景VO的壓縮編碼盡可能保留細(xì)節(jié)和平滑;對(duì)背景VO則采用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對(duì)象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產(chǎn)生的方塊效應(yīng),而且使用戶可與場(chǎng)景交互,從而既提高了壓縮比,又實(shí)現(xiàn)了基于內(nèi)容的交互,為視頻編碼提供了廣闊的發(fā)展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。對(duì)于任意形狀視頻對(duì)象。對(duì)于極低比特率實(shí)時(shí)應(yīng)用,如
15、可視電話、會(huì)議電視,MPEG-4則采用VLBV(Very Low Bit-rate Video,極低比特率視頻)核進(jìn)行編碼。 傳統(tǒng)的矩形圖在MPEG-4中被看作是VO的一種特例,這正體現(xiàn)了傳統(tǒng)編碼與基于內(nèi)容編碼在MPEG-4中的統(tǒng)一。VO概念的引入,更加符合人腦對(duì)視覺(jué)信息的處理方式,并使視頻信號(hào)的處理方式從數(shù)字化進(jìn)展到智能化,從而提高了視頻信號(hào)的交互性和靈活性,使得更廣泛的視頻應(yīng)用及更多的內(nèi)容交互成為可能。因此VOP視頻編碼技術(shù)被譽(yù)為視頻信號(hào)處理技術(shù)從數(shù)字化進(jìn)入智能化的初步探索。 C. 視頻編碼可分級(jí)性技術(shù) 隨著因特網(wǎng)業(yè)務(wù)的巨大增長(zhǎng),在速率起伏很大的IP(Internet Protocol)網(wǎng)
16、絡(luò)及具有不同傳輸特性的異構(gòu)網(wǎng)絡(luò)上進(jìn)行視頻傳輸?shù)囊蠛蛻?yīng)用越來(lái)越多。在這種背景下,視頻分級(jí)編碼的重要性日益突出,其應(yīng)用非常廣泛,且具有很高的理論研究及實(shí)際應(yīng)用價(jià)值,因此受到人們的極大關(guān)注。 視頻編碼的可分級(jí)性(scalability)是指碼率的可調(diào)整性,即視頻數(shù)據(jù)只壓縮一次,卻能以多個(gè)幀率、空間分辨率或視頻質(zhì)量進(jìn)行解碼,從而可支持多種類型用戶的各種不同應(yīng)用要求。 MPEG-4通過(guò)視頻對(duì)象層(VOL,Video Object Layer)數(shù)據(jù)結(jié)構(gòu)來(lái)實(shí)現(xiàn)分級(jí)編碼。MPEG-4提供了兩種基本分級(jí)工具,即時(shí)域分級(jí)(Temporal Scalability)和空域分級(jí)(Spatial Scalabilit
17、y),此外還支持時(shí)域和空域的混合分級(jí)。每一種分級(jí)編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強(qiáng)層?;緦犹峁┝艘曨l序列的基本信息,增強(qiáng)層提供了視頻序列更高的分辨率和細(xì)節(jié)。 在隨后增補(bǔ)的視頻流應(yīng)用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精細(xì)可伸縮性)視頻編碼算法以及PFGS(Progressive Fine Granularity Scalable,漸進(jìn)精細(xì)可伸縮性)視頻編碼算法。 FGS編碼實(shí)現(xiàn)簡(jiǎn)單,可在編碼速率、顯示分辨率、內(nèi)容、解碼復(fù)雜度等方面提供靈活的自適應(yīng)和可擴(kuò)展性,且具有很強(qiáng)的帶寬自適應(yīng)能力和抗誤碼性能。但還存在編碼效率低于非可擴(kuò)展
18、編碼及接收端視頻質(zhì)量非最優(yōu)兩個(gè)不足。 PFGS則是為改善FGS編碼效率而提出的視頻編碼算法,其基本思想是在增強(qiáng)層圖像編碼時(shí)使用前一幀重建的某個(gè)增強(qiáng)層圖像為參考進(jìn)行運(yùn)動(dòng)補(bǔ)償,以使運(yùn)動(dòng)補(bǔ)償更加有效,從而提高編碼效率。 D. 運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償技術(shù) MPEG-4采用I-VOP、P-VOP、B-VOP三種幀格式來(lái)表征不同的運(yùn)動(dòng)補(bǔ)償類型。它采用了H.263中的半像素搜索(half pixel searching)技術(shù)和重疊運(yùn)動(dòng)補(bǔ)償(overlapped motion compensation)技術(shù),同時(shí)又引入重復(fù)填充(repetitive padding)技術(shù)和修改的塊(多邊形)匹配(modified
19、block (polygon)matching)技術(shù)以支持任意形狀的VOP區(qū)域。 此外,為提高運(yùn)動(dòng)估計(jì)算法精度,MPEG-4采用了MVFAST (Motion Vector Field Adaptive Search Technique)和改進(jìn)的PMVFAST (Predictive MVFAST)方法用于運(yùn)動(dòng)估計(jì)。對(duì)于全局運(yùn)動(dòng)估計(jì),則采用了基于特征的快速頑健的FFRGMET(Feature- based Fast and Robust Global Motion Estimation Technique)方法。 在MPEG-4視頻編碼中,運(yùn)動(dòng)估計(jì)相當(dāng)耗時(shí),對(duì)編碼的實(shí)時(shí)性影響很大。因此這里特別
20、強(qiáng)調(diào)快速算法。運(yùn)動(dòng)估計(jì)方法主要有像素遞歸法和塊匹配法兩大類,前者復(fù)雜度很高,實(shí)際中應(yīng)用較少,后者則在H.263和MPEG中廣泛采用。在塊匹配法中,重點(diǎn)研究塊匹配準(zhǔn)則及搜索方法。目前有三種常用的匹配準(zhǔn)則: (1)絕對(duì)誤差和(SAD, Sum of Absolute Difference)準(zhǔn)則; (2)均方誤差(MSE, Mean Square Error)準(zhǔn)則; (3)歸一化互相關(guān)函數(shù)(NCCF, Normalized Cross Correlation Function)準(zhǔn)則。 在上述三種準(zhǔn)則中,SAD準(zhǔn)則具有不需乘法運(yùn)算、實(shí)現(xiàn)簡(jiǎn)單方便的優(yōu)點(diǎn)而使用最多,但應(yīng)清楚匹配準(zhǔn)則的選用對(duì)匹配結(jié)果影響不大
21、。 在選取匹配準(zhǔn)則后就應(yīng)進(jìn)行尋找最優(yōu)匹配點(diǎn)的搜索工作。最簡(jiǎn)單、最可靠的方法是全搜索法(FS, Full Search),但計(jì)算量太大,不便于實(shí)時(shí)實(shí)現(xiàn)。因此快速搜索法應(yīng)運(yùn)而生,主要有交叉搜索法、二維對(duì)數(shù)法和鉆石搜索法,其中鉆石搜索法被MPEG-4校驗(yàn)?zāi)P停╒M, Verification Model)所采納,下面詳細(xì)介紹。 鉆石搜索(DS, Diamond Search)法以搜索模板形狀而得名,具有簡(jiǎn)單、魯棒、高效的特點(diǎn),是現(xiàn)有性能最優(yōu)的快速搜索算法之一。其基本思想是利用搜索模板的形狀和大小對(duì)運(yùn)動(dòng)估計(jì)算法速度及精度產(chǎn)生重要影響的特性。在搜索最優(yōu)匹配點(diǎn)時(shí),選擇小的搜索模板可能會(huì)陷入局部最優(yōu),選擇大
22、的搜索模板則可能無(wú)法找到最優(yōu)點(diǎn)。因此DS算法針對(duì)視頻圖像中運(yùn)動(dòng)矢量的基本規(guī)律,選用了兩種形狀大小的搜索模板。 大鉆石搜索模板(LDSP, Large Diamond Search Pattern),包含9個(gè)候選位置; 小鉆石搜索模板(SDSP, Small Diamond Search Pattern),包含5個(gè)候選位置。 DS算法搜索過(guò)程如下:開始階段先重復(fù)使用大鉆石搜索模板,直到最佳匹配塊落在大鉆石中心。由于LDSP步長(zhǎng)大,因而搜索范圍廣,可實(shí)現(xiàn)粗定位,使搜索不會(huì)陷于局部最小,當(dāng)粗定位結(jié)束后,可認(rèn)為最優(yōu)點(diǎn)就在LDSP 周圍8 個(gè)點(diǎn)所圍菱形區(qū)域中。然后再使用小鉆石搜索模板來(lái)實(shí)現(xiàn)最佳匹配塊的準(zhǔn)
23、確定位,以不產(chǎn)生較大起伏,從而提高運(yùn)動(dòng)估計(jì)精度。 此外Sprite視頻編碼技術(shù)也在MPEG-4中應(yīng)用廣泛,作為其核心技術(shù)之一。Sprite又稱鑲嵌圖或背景全景圖,是指一個(gè)視頻對(duì)象在視頻序列中所有出現(xiàn)部分經(jīng)拼接而成的一幅圖像。利用Sprite可以直接重構(gòu)該視頻對(duì)象或?qū)ζ溥M(jìn)行預(yù)測(cè)補(bǔ)償編碼。 Sprite視頻編碼可視為一種更為先進(jìn)的運(yùn)動(dòng)估計(jì)和補(bǔ)償技術(shù),它能夠克服基于固定分塊的傳統(tǒng)運(yùn)動(dòng)估計(jì)和補(bǔ)償技術(shù)的不足,MPEG-4正是采用了將傳統(tǒng)分塊編碼技術(shù)與Sprite編碼技術(shù)相結(jié)合的策略。 MPEG4的應(yīng)用領(lǐng)域 憑借著出色的性能,MPEG4技術(shù)目前在多媒體傳輸、多媒體存儲(chǔ)等領(lǐng)域得到了廣泛的應(yīng)用,下面我們就來(lái)看
24、看目前在那些領(lǐng)域MPEG4技術(shù)得到了大顯伸手的機(jī)會(huì)。 1、精彩的視頻世界精彩的視頻世界是MPEG4技術(shù)應(yīng)用最多也是最為廣大朋友所熟悉的的形式。目前它主要以兩種形式出現(xiàn),一種是DIVXMPEG4影碟(國(guó)內(nèi)市面上已出現(xiàn),且D版居多),另一種是網(wǎng)上MPEG4電影。 (1)、我們先來(lái)說(shuō)說(shuō)DIVXMPEG4影碟,DIVX視頻編碼技術(shù)實(shí)際上就是MPEG4壓縮技術(shù),它由微軟MPEG4V3修改而來(lái),使用的是 MPEG4壓縮算法,并同時(shí)分離視頻和音頻。它的核心部分便是由DivX對(duì)DVD音視頻進(jìn)行壓縮,生成Mpeg4視頻格式文件(也就是AVI格式)。小提示:筆者也是經(jīng)常被朋友所問(wèn)到:我看到的MPEG4電影片段明明
25、是avi(擴(kuò)展名)格式文件,并且Windows的媒體播放器也與之關(guān)聯(lián),但就是無(wú)法播放。其實(shí), MPEG4并沒(méi)有確定必須用什么擴(kuò)展名,它只是一種編碼方法而已。使用avi作為擴(kuò)展名,是一種習(xí)慣性的沿用。在計(jì)算機(jī)上播放MPEG4影音文件的方法目前有兩種:第一種是用諸如DivxPlayer等專門的播放軟件來(lái)播放;第二種播放方法是安裝MPEG4(Divx)插件后,用Windows自帶的媒體播放機(jī)來(lái)播放。 (2)、隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)上的視頻流應(yīng)用也成為了近幾年的熱門話題。目前,在互聯(lián)網(wǎng)上比較流行的幾種影像格式包括 Quicktime、RealPlay以及微軟的MediaPlayer等。MPEG
26、4技術(shù)出現(xiàn)之后,互聯(lián)網(wǎng)上又出現(xiàn)了MPEG4格式的電影,不過(guò)在觀看前,系統(tǒng)會(huì)提示你下載最新的MPEG4解碼軟件。小提示:大家平時(shí)在網(wǎng)上可能經(jīng)常會(huì)看見ASF格式的電影,其實(shí)它也是微軟公司開發(fā)出的一種可以直接在網(wǎng)上觀看視頻節(jié)目的壓縮格式。使用的也是MPEG4的壓縮算法,但因?yàn)樗且跃W(wǎng)上即時(shí)觀看電影的視頻流格式存在的,所以它的圖像質(zhì)量相對(duì)要差一些。 2、低比特率下的多媒體通信,目前,MPEG4技術(shù)已經(jīng)廣泛的應(yīng)用在如視頻電話、視頻電子郵件、移動(dòng)通信、電子新聞等多媒體通信領(lǐng)域。由于這些應(yīng)用對(duì)傳輸速率要求較低,一般在 4.864kbit/s之間,分辨率為176144左右。因此MPEG4技術(shù)完全可以充分的利用
27、網(wǎng)絡(luò)帶寬,通過(guò)幀重建技術(shù)壓縮和傳輸數(shù)據(jù),以最少的數(shù)據(jù)量獲得最佳的圖像質(zhì)量。 3、實(shí)時(shí)多媒體監(jiān)控。多媒體監(jiān)控領(lǐng)域原來(lái)一直是MPEG1技術(shù)擔(dān)當(dāng)重任,但近些年來(lái),它們也是城頭變換大王旗了。由于MPEG4壓縮技術(shù)原本是一種適用在低帶寬下進(jìn)行信息交換的音視頻處理技術(shù),它的特點(diǎn)是可以動(dòng)態(tài)的偵測(cè)圖像各個(gè)區(qū)域變化,基于對(duì)象的調(diào)整壓縮方法可以獲得比MPEG1更大的壓縮比,使壓縮碼流更低。因此,盡管MPEG4技術(shù)一開始并不是專為視頻監(jiān)控壓縮領(lǐng)域而開發(fā)的,但它高清晰度的視頻壓縮,在實(shí)時(shí)多媒體監(jiān)控上,無(wú)能是存儲(chǔ)量,傳輸?shù)乃俾?,清晰度都?MPEG1具有更大的優(yōu)勢(shì)。 4、基于內(nèi)容存儲(chǔ)和檢索的多媒體系統(tǒng)。由于MPEG4在壓縮方法上遠(yuǎn)遠(yuǎn)優(yōu)于MPEG1技術(shù),更是MJPEG技術(shù)所不能比擬的。 經(jīng)過(guò)專家的測(cè)試表明,在相同清晰度對(duì)應(yīng)MPEG1 (500Kbits/sec)碼流情況下, MPEG4比MPEG
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 出售園林鋪面合同范本
- 保潔物料供貨合同范本
- 企業(yè)策劃宣傳合同范本
- 農(nóng)機(jī)割臺(tái)租售合同范本
- 出口螺桿驗(yàn)貨合同范本
- 公司分期手機(jī)合同范本
- 企業(yè)職員培養(yǎng)合同范本
- 企業(yè)終止租賃合同范本
- 化糞池安裝合同范本
- 2024年深圳市南山區(qū)蓓蕾幼教集團(tuán)招聘考試真題
- 環(huán)境空氣氣態(tài)污染物(SO2、NO2、O3、CO)連續(xù)自動(dòng)監(jiān)測(cè)系統(tǒng)安裝驗(yàn)收技術(shù)規(guī)范(HJ 193-2013部分代替 HJ-T 193-2005)
- 《生活垃圾轉(zhuǎn)運(yùn)站技術(shù)規(guī)范+CJJT+47-2016》詳細(xì)解讀
- 總體國(guó)家安全觀-創(chuàng)新引領(lǐng)10周年全文課件
- 鳥類知識(shí)科普課件
- 中國(guó)通用電氣有限公司員工手冊(cè)
- 自建房培訓(xùn)課件甘肅
- 閩教版四年級(jí)下冊(cè)勞動(dòng)教案
- 汽車電氣設(shè)備構(gòu)造與維修(高職版)全套教學(xué)課件
- 中小學(xué)必背飛花令詩(shī)詞-(春、月、風(fēng)、花、山、江、人、日、動(dòng)物、顏色、數(shù)字)
- 緩刑解除矯正個(gè)人總結(jié)
- 北師大版小學(xué)數(shù)學(xué)六年級(jí)下冊(cè)全冊(cè)一課一練課課練(含答案)
評(píng)論
0/150
提交評(píng)論