![第五節(jié)-數(shù)字視頻壓縮基礎(chǔ)知識課件_第1頁](http://file4.renrendoc.com/view/0803b61eb63a7f22ab66cd67ae08fa9c/0803b61eb63a7f22ab66cd67ae08fa9c1.gif)
![第五節(jié)-數(shù)字視頻壓縮基礎(chǔ)知識課件_第2頁](http://file4.renrendoc.com/view/0803b61eb63a7f22ab66cd67ae08fa9c/0803b61eb63a7f22ab66cd67ae08fa9c2.gif)
![第五節(jié)-數(shù)字視頻壓縮基礎(chǔ)知識課件_第3頁](http://file4.renrendoc.com/view/0803b61eb63a7f22ab66cd67ae08fa9c/0803b61eb63a7f22ab66cd67ae08fa9c3.gif)
![第五節(jié)-數(shù)字視頻壓縮基礎(chǔ)知識課件_第4頁](http://file4.renrendoc.com/view/0803b61eb63a7f22ab66cd67ae08fa9c/0803b61eb63a7f22ab66cd67ae08fa9c4.gif)
![第五節(jié)-數(shù)字視頻壓縮基礎(chǔ)知識課件_第5頁](http://file4.renrendoc.com/view/0803b61eb63a7f22ab66cd67ae08fa9c/0803b61eb63a7f22ab66cd67ae08fa9c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第五節(jié)數(shù)字視頻壓縮基礎(chǔ)知識
當(dāng)今社會生活中,圖像信息和通信起著非常重要的作用。數(shù)字視頻壓縮的實際應(yīng)用是近10年來超大規(guī)模集成電路(VLSI)、比較好的壓縮算法、視覺生理研究和標(biāo)準(zhǔn)等方面顯著技術(shù)發(fā)展的結(jié)果。數(shù)字視頻壓縮廣泛應(yīng)用于視頻傳輸、計算機多媒體和數(shù)值存儲等方面。
一、數(shù)字視頻壓縮的概念(一)數(shù)字視頻壓縮1.?dāng)?shù)字視頻壓縮的優(yōu)勢
數(shù)字視頻有許多優(yōu)點,但是由于其占用帶寬太寬而限制了它的實際應(yīng)用。數(shù)字視頻壓縮技術(shù)的發(fā)展,推動了數(shù)字視頻的實際應(yīng)用。現(xiàn)以PAL制彩電的衛(wèi)星傳輸為例說明壓縮的作用和意義。我國PLA制彩電的視頻帶寬Fc=6.0MHz。根據(jù)奈斯特定理,取樣頻率Fs>2Fc.CCIR601建議書規(guī)定:亮度信號的取樣頻率為13.5MHz,色度信號的取樣頻率為6.75MHz,每個取樣8bit,則傳輸PAL制彩電所需要的傳輸速率為13.5MHz×8bit+6.75MHz×8bit=216MB/s(2-28)
這樣高的傳輸頻率,采用2PSK調(diào)制,所需傳輸帶寬大于200MHz,即使采用4PSK,所需傳輸帶寬也要100MHz以上。在現(xiàn)存的傳輸媒介中,要占用這樣寬的帶寬來傳送視頻不僅困難,同時也是不經(jīng)濟的。
第五節(jié)數(shù)字視頻壓縮基礎(chǔ)知識1使用數(shù)字視頻壓縮技術(shù),可以做到把216MB/s的速率壓縮到8MB/s左右,而解壓縮后的質(zhì)量可以達到廣播級。這樣,在現(xiàn)行傳輸l路模擬電視信號的1個36MHz衛(wèi)星轉(zhuǎn)發(fā)器中,可以傳輸46路廣播級壓縮后的電視信號。2.?dāng)?shù)字視頻壓縮的過程壓縮基本上是這樣一個過程:1個圖像序列中前后幀圖像之間存在著一定的相關(guān)性,這種相關(guān)性使得圖像中存在大量的冗余信息。一般就利用圖像之間的相關(guān)性來減少圖像或圖像組的內(nèi)容信息,只保留少量非相關(guān)信息進行傳輸,接收機就利用這些非相關(guān)信息,按照一定的解碼算法,可以在保證一定圖像質(zhì)量的前提下盡可能重現(xiàn)原始圖像。
一般地,數(shù)字視頻壓縮是從分量視頻表達開始的,此時信號是以1個亮度分量、2個色度分量來表達的。最廣為接受的數(shù)字分量視頻格式是CCIR601,該建議使用了共結(jié)點模型的4:2:2采樣結(jié)構(gòu)。所謂共結(jié)點,是指每個彩色像素點由3個采樣來描述:1個亮度采樣、2個色差形成的色度采樣,因為這3個采樣在時間上是重合的,所以稱為共結(jié)點。
在525行的系統(tǒng)中,每幀有483個有效行,每行有720個像素點;在625行的系統(tǒng)中,每幀有576個有效行。通過色度、亮度采樣的結(jié)合,在不損害圖像質(zhì)量的同時,減少所需帶寬得以實現(xiàn)。4:2:2中亮度信號的采樣頻率實際上是13.5MHz,色差信號Cb.Cr的采樣頻率剛好是亮度采樣頻率的一半,6.75MHz。因為625/50系統(tǒng)行頻和525/60系統(tǒng)行頻的最小公倍數(shù)是2.25MHz,所以將亮度信號和色差信號的取樣頻率數(shù)值取為2.25MHz的整數(shù)倍。使用數(shù)字視頻壓縮技術(shù),可以做到把216MB/s的速率壓縮到2信號的主要部分是有一定可預(yù)知性的。一個極端的例子是正弦波信號,它有高度的可預(yù)知性,因為每個周期都是相同的,且只有1個頻率,這樣就不需占用帶寬:另一個極端的例子是,噪聲信號完全不可預(yù)測。當(dāng)然,實際上所有的信號都介于這兩者之間。壓縮技術(shù)總的來說就是要識別并去除這些冗余,從而減少數(shù)據(jù)量和所需帶寬。(二)CCIR601號建議
自1948年提出視頻數(shù)字化的概念后,經(jīng)過40年的探索,國際無線電咨詢委員會(CCIR-ConsultativeCommitteeof
lnternationalRadio)于1982年提出了電視演播室數(shù)字編碼的國際標(biāo)準(zhǔn)CCIR601號建議,確定以亮度分量Y和兩個色差分量R-Y.B-Y為基礎(chǔ)進行編碼,以作為電視演播室數(shù)字編碼的國際標(biāo)準(zhǔn)。
國際無線電咨詢委員會成立于1927年,是國際電信聯(lián)盟(ITU)的常設(shè)機構(gòu)之一,其主要職責(zé)是研究無線電通信和技術(shù)業(yè)務(wù)問題,并對這類問題提出建議書。這些建議書實際上就是標(biāo)推。1993年,該委員會與國際頻率登記委員會(IFRB)合并,成為先進國際電信聯(lián)盟(ITU)無線電通信部門,簡稱ITU-R。信號的主要部分是有一定可預(yù)知性的。一個極端的例子是正弦波信31.CCIR601號建議的3個規(guī)定。
601號建議對彩色電視信號的編碼方式、取樣頻率、取樣結(jié)構(gòu)都作了明確的規(guī)定。
(1)規(guī)定彩色電視信號采用分量編碼。所謂分量編碼,就是彩色全電視信號在轉(zhuǎn)換成數(shù)字形式之前,先被分離成亮度信號和色差信號,然后對它們分別進行編碼。分量信號(Y、B-Y、R-Y)被分別編碼后,再合成數(shù)字信號。
(2)規(guī)定取樣頻率與取樣結(jié)構(gòu)。在4:2:2等級的編碼中,規(guī)定亮度信號和色差信號的取樣頻率分別為13.5MHz和6.75MHz,取樣結(jié)構(gòu)為正交結(jié)構(gòu),即按行、場、幀重復(fù),每行中R-Y積B-Y的取樣與奇次(I,3,5…)Y的取樣同位置,即取樣結(jié)構(gòu)是固定的,而取樣點在電視屏幕上的相對位置不變。
(3)規(guī)定編碼方式。對亮度信號和2個色差信號進行線性PCM編碼,每個取樣點取8bit量化。同時,規(guī)定在數(shù)字編碼時,不使用A/D轉(zhuǎn)換的整個動態(tài)范圍,只給亮度信號分配220個量化級,黑電平對應(yīng)于量化級16,白電平對應(yīng)于量化級235。為每個色差信號分配224個量化級,色差信號的零電平對應(yīng)于量化級128。
2.CCIR601號的初始建議
(1)亮度抽樣頻率為525/60和625/50三大制式行頻公倍數(shù)的2.25MHz的6倍,即Y、R-Y、B-Y三分量的抽樣頻率分別為13.5、6.75、6.75MHz?,F(xiàn)行電視制式亮度信號的最大帶寬是6MHz,13.5MHz>2×6MHz=12MHz,滿足奈奎斯特定理(抽樣頻率至少等于視頻帶寬的2倍)??紤]到抽樣的樣點結(jié)構(gòu)應(yīng)滿足正交結(jié)構(gòu)的要求,2個色差信號的抽樣頻率均為亮度信號抽樣頻率的一半。
(2)抽樣后采用線性量化,每個樣點的量化比特數(shù)用于演播室為10bit,用于傳輸為8bit。1.CCIR601號建議的3個規(guī)定。4(3)建議2種制式有效行內(nèi)的取樣點數(shù)亮度信號取720個,2個色度信號各取360個,這樣就統(tǒng)一了數(shù)字分量編碼標(biāo)準(zhǔn),使3種不同的制式便于轉(zhuǎn)換和統(tǒng)一。所以,有效行Y、R-Y、B-Y三分量樣點之間的比例為4:2:2(720:360:360)。3.CCIR601號的補充建議1983年召開的國際無線電咨詢委員會上又作了三點補充:
(1)明確規(guī)定編碼信號是經(jīng)過預(yù)校正的Y、R-Y、B-Y信號。
(2)相應(yīng)于量化級0和255的碼字專用于同步,1~244的量化級用于視頻信號。
(3)進一步明確了模擬與數(shù)字行的對應(yīng)關(guān)系,并規(guī)定了從數(shù)字有效行末尾至基準(zhǔn)時間樣點的間隔,對525/60和625/50兩種制式分別為16個和12個樣點。不論625行/50場或525行/60場,其數(shù)字有效行的亮度樣點數(shù)均為720,色差信號的樣點數(shù)均為360,以便于制式轉(zhuǎn)換。若亮度樣點數(shù)除以2,就得到色差信號的數(shù)據(jù)。
(3)建議2種制式有效行內(nèi)的取樣點數(shù)亮度信號取720個,25
二、壓縮算法與編碼
(一)壓縮算法的概念
壓縮算法就是通過一些運算將文件縮小的一系列運算方法,通常把數(shù)據(jù)經(jīng)過壓縮和解壓縮的過程稱為編碼和解碼。視頻壓縮的目標(biāo)是在盡可能保證視覺效果的前提下減少視頻數(shù)據(jù)率。視頻壓縮比一般指壓縮后的數(shù)據(jù)量與壓縮前的數(shù)據(jù)量之比。由于視頻是連續(xù)的靜態(tài)圖像,因此其壓縮編碼算法與靜態(tài)圖像的壓縮編碼算法有某些共同之處,但是,運動的視頻還有其自身的特性,因此在壓縮時還應(yīng)考慮其運動特性才能達到高壓縮的目標(biāo)。
1.有損數(shù)據(jù)壓縮和無損數(shù)據(jù)壓縮
無損數(shù)據(jù)壓縮(LosslessCompression)方法是指數(shù)據(jù)經(jīng)過壓縮后,信息不受損失,還能完全恢復(fù)到壓縮前的原樣。它和有損數(shù)據(jù)壓縮相對。這種壓縮的壓縮比通常小于有損數(shù)據(jù)壓縮的壓縮比。
有損數(shù)據(jù)壓縮(LossComl)ression)方法是經(jīng)過壓縮、解壓的數(shù)據(jù)與原始數(shù)據(jù)不同但非常接近的壓縮方法。有損數(shù)據(jù)壓縮又稱破壞型壓縮,即將次要的信息數(shù)據(jù)舍棄,犧牲一些質(zhì)量來減少數(shù)據(jù)量,使壓縮比提高。它是與無損數(shù)據(jù)壓縮對應(yīng)的壓縮方法。根據(jù)各種格式設(shè)計的不同,有損數(shù)據(jù)壓縮都會有生成損失(GenerationLoss),壓縮與解壓文件都會帶來漸進的質(zhì)量下降。這種方法經(jīng)常用于因特網(wǎng),尤其是流媒體及電話領(lǐng)域。二、壓縮算法與編碼6
有損數(shù)據(jù)壓縮意味著解壓縮后的數(shù)據(jù)與壓縮前的數(shù)據(jù)不一致,在壓縮的過程中要丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復(fù)。幾乎所有高壓縮的算法都采用有損數(shù)據(jù)壓縮,這樣才能達到低數(shù)據(jù)率的目標(biāo)。丟失的數(shù)據(jù)率與壓縮比有關(guān),壓縮比越小,丟失的數(shù)據(jù)越多,解壓縮后的效果一般越差。此外,某些有損數(shù)據(jù)壓縮算法采用多次重復(fù)壓縮的方式,這樣還會引起額外的數(shù)據(jù)丟失。
2.幀內(nèi)和幀間壓縮
幀內(nèi)(Intrafr·ame)壓縮也稱為空間壓縮(SpatialCompression)。當(dāng)壓縮1幀圖像時,僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息,這實際上與靜態(tài)圖像壓縮類似。幀內(nèi)一般采用有損數(shù)據(jù)壓縮算法,由于幀內(nèi)壓縮時各個幀之間沒有相互關(guān)系,因此壓縮后的視頻數(shù)據(jù)仍可以以幀為單位進行編輯。幀內(nèi)壓縮一般達不到很高的壓縮質(zhì)量。
幀間(Interframe)壓縮也稱為時間壓縮(TemporalCompression),它通過比較時間軸上不同幀之間的數(shù)據(jù)進行壓縮。幀間壓縮是基于許多視頻或動畫的連續(xù)前后兩幀具有很大的相關(guān)性,或說前后兩幀信息變化很小的特點,也即連續(xù)的視頻其相鄰幀之間具有冗余信息,根據(jù)這一特性,壓縮相鄰幀之間的冗余量就可以進一步提高壓縮量,減小壓縮比。
幀間壓縮一般是無損的。幀差值(FrameDifferencing)算法是一種典型的時間壓縮法,它通過比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少數(shù)據(jù)量。有損數(shù)據(jù)壓縮意味著解壓縮后的數(shù)據(jù)與壓縮前的數(shù)據(jù)不一致,在7
3.對稱和不對稱編碼
對稱性(Symmetric)是壓縮編碼的一個關(guān)鍵特征。對稱意味著壓縮和解壓縮占用相同的計算處理能力和時間;對稱算法適合于實時壓縮和傳送視頻,如視頻會議應(yīng)用就以采用對稱的壓縮編碼算法為好。而在電子出版和其他多媒體應(yīng)用中,一般是把視頻預(yù)先壓縮處理好,而后再播放,因此可以采用不對稱(Asymmetric)編碼。
不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視頻的時間比回放(解壓縮)該視頻的時間要多得多。例如,壓縮一段3min的視頻片斷可能需要10多分鐘的時間,而該片斷實時回放時間只有3min。
(二)壓縮算法的實現(xiàn)
1.壓縮算法的層次
壓縮算法通常分幾個層次完成壓縮。對于MPEG算法,是采用3個層次完成壓縮,即帶寬壓縮、匹配主觀的有損失壓縮和最后一層的無損失壓縮。
(1)帶寬壓縮:主要是源分解力和目標(biāo)比特率匹配及降低色度的分解力,達到主觀上滿意的程度。
(2)匹配主觀的有損失壓縮:壓縮算法本身是利用波形分析和主觀適配的量化來去掉空間冗余和時間冗余,在這個層次壓縮是有損失的。3.對稱和不對稱編碼8(3)最后一次的無損失壓縮:通過把固定長度和可變長度編碼進行句法組合,而無損失地把信息變換到比特流中去。
2.壓縮的基本算法
壓縮算法依賴于以下兩種基本方法:
(1)運動補償法。以像塊為基礎(chǔ)的運動補償,用于減少時間冗余。運動補償?shù)臅r間預(yù)測方法用來開拓視頻信號很強的時間相關(guān)法。時間預(yù)測既適用于有因果關(guān)系的預(yù)測器(即純預(yù)測編碼),也適用于無因果關(guān)系的預(yù)測器(即內(nèi)插編碼)。
(2)離散余弦變換法。以變換(離散余弦變換,DCT)為基礎(chǔ)的壓縮,用于減少空間冗余。減少空間冗余的方法(DCT方法)直接用于信源圖像及時間預(yù)測后的誤差信號上。
預(yù)測誤差信號可利用降低空間冗余(8×8DCT)進一步壓縮與運動有關(guān)的信息,以16×16的像塊為基礎(chǔ),并與空間信息一塊傳輸。目前用于數(shù)據(jù)壓縮的算法有多種,見表2-5。(3)最后一次的無損失壓縮:通過把固定長度和可變長度編碼9表2-5數(shù)據(jù)壓縮方法表2-5數(shù)據(jù)壓縮方法10
(三)圖像編碼
1.圖像編碼類型
圖像類型有時稱為幀類型,一般有4種:I圖像(I幀)、P圖像(P幀)、B圖像(B幀)、D圖像(D幀)。
I圖像或稱為內(nèi)圖像(內(nèi)碼幀),它們采用幀內(nèi)編碼,不參考任何其他幀而進行編碼,是完整的獨立編碼幀,必須存儲或傳輸。
P圖像或稱為預(yù)測圖像(預(yù)測幀),參照前一個I幀或P幀作運動補償編碼。
B圖像或稱為雙向預(yù)測圖像(雙向預(yù)測幀),參照前一個或后二個I幀或P幀作雙向運動補償編碼,即利用來自前一圖像和以后一圖像的內(nèi)插進行編碼。
D圖像或稱為直流圖像(直流幀),其中,僅低頻分量進行編碼,只用于快速向前搜索方式,是為快放功能設(shè)計的。其中,B和P圖像常稱為中間圖像(Interpictures)。
1個典型的編碼方案會含有I、P、B圖像的混合場,典型方案在每10~15個圖像會有1個I圖像,而在相鄰的I和P圖像之間會有2個B圖像。(三)圖像編碼11
2.視頻編碼原理
視頻圖像數(shù)據(jù)有極強的相關(guān)性,也就是說有大量的冗余信息。其中,冗余信息可分為空域冗余信息和時域冗余信息。壓縮技術(shù)就是將數(shù)據(jù)中的冗余信息去掉(去除數(shù)據(jù)之間的相關(guān)性);壓縮技術(shù)包含幀內(nèi)圖像數(shù)據(jù)壓縮技術(shù)、幀間圖像數(shù)據(jù)壓縮技術(shù)和熵編碼壓縮技術(shù)。
(1)去時域冗余信息。使用幀間編碼技術(shù)可去除時域冗余信息,它包括以下三部分:
1)運動補償。運動補償是通過先前的局部圖像來預(yù)測、補償當(dāng)前的局部圖像,它是減少幀序列冗余信息的有效方法。
2)運動表示。不同區(qū)域的圖像需要使用不同的運動矢量來描述運動信息。運動矢量通過熵編碼進行壓縮。
3)運動估計。運動估計是從視頻序列中抽取運動信息的一整套技術(shù)。通用的壓縮標(biāo)準(zhǔn)都使用基于塊的運動估計和運動補償。
(2)去空域冗余信息。主要使用幀間編碼技術(shù)和熵編碼技術(shù)去除空域冗余信息:
1)變換編碼。幀內(nèi)圖像和預(yù)測差分信號都有很高的空域冗余信息。變換編碼將空域信號變換到另一正交矢量空間,使其相關(guān)性下降、數(shù)據(jù)冗余度減小。
2)量化編碼。經(jīng)過變換編碼后,產(chǎn)生一批變換系數(shù),對這些系數(shù)進行量化,使編碼器的輸出達到一定的位率。這一過程將導(dǎo)致精度的降低。2.視頻編碼原理12
3)熵編碼。熵編碼是無損編碼,它對變換、量化后得到的系數(shù)和運動信息進行進一步的壓縮。
3.時間和空間壓縮編碼
如前所述,壓縮算法以兩項關(guān)鍵技術(shù)為基礎(chǔ),即時間壓縮和空間壓縮。時間壓縮依賴于相鄰圖像之間的相似性,并利用預(yù)測和運動補償;空間壓縮依賴于圖像各小范圍內(nèi)的冗余,并以DCT變換、量化和熵編碼技術(shù)為基礎(chǔ)。預(yù)測出的圖像是由運動補償來改進的前一圖像。運動矢量是對每一宏像塊計算出來的。運動矢量適用于宏像塊中的所有4個亮度像塊。用于2個色度像塊的運動矢量是從亮度矢量計算出來的。這種算法依賴于如下的設(shè)想:在一個宏像塊內(nèi),相鄰圖像之間的差異可以簡單地表示為矢量變換。內(nèi)插(或雙向預(yù)測)產(chǎn)生高度的壓縮,因為圖像簡單地表示為過去與未來I或P圖像之間的內(nèi)插(這又是在宏像塊一級上完成的)。圖像不是以顯示順序傳輸?shù)?,而是以解碼器要求圖像將比特流的解碼順序傳輸?shù)?,即該解碼器在任何內(nèi)插或預(yù)測的圖像可被解碼之前必須具有參考圖像??臻g壓縮技術(shù)與DCT、量化和熵編碼相似。壓縮算法利用了每一像塊內(nèi)(8×8像素)的冗余。所得出的壓縮數(shù)據(jù)流由最適合被壓縮圖像類型的空間和時間壓縮技術(shù)的組合構(gòu)成。解碼通過使用MPEG系統(tǒng)的編碼來控制,這些編碼被插入數(shù)據(jù)流中,以解釋如何重建圖像信息。3)熵編碼。熵編碼是無損編碼,它對變換、量化后得到的13
(四)視頻編解碼器1.視頻編解碼器的概念視頻編解碼器(Codec)是指能夠?qū)?個信號或1個數(shù)據(jù)流進行變換的設(shè)備或程序。這里指的變換既包括將信號或數(shù)據(jù)流進行編碼(通常是為了傳輸、存儲或者加密)或提取得到1個編碼流的操作,也包括為了觀察或者處理從這個編碼流中恢復(fù)適合觀察或操作的形式的操作。歷史上,視頻信號是以模擬形式存儲在磁帶上的。隨著CompactDisc的出現(xiàn)并進入市場,音頻信號以數(shù)字化方式進行存儲,視頻信號也開始使用數(shù)字化格式,一些相關(guān)技術(shù)也開始隨之發(fā)展起來。編解碼器經(jīng)常應(yīng)用在視頻數(shù)據(jù)處理的視頻監(jiān)控系統(tǒng)、視頻會議系統(tǒng)和流媒體等中。經(jīng)過編碼的音頻或視頻原始碼流經(jīng)常叫做Essence(本體),以區(qū)別于之后加入碼流的元信息和其他用以幫助訪問碼流和增強碼流魯棒性的數(shù)據(jù)。大多數(shù)視頻編解碼器是有損的,目的是為了得到更大的壓縮比和更小的文件大小。當(dāng)然也有無損的編解碼器,但是通常沒有必要為了一些幾乎注意不到的質(zhì)量損失大大增加編碼后文件的大小。除非該編碼的結(jié)果還將在以后進行下一步的處理,此時連續(xù)的有損編碼通常會帶來較大的質(zhì)量損失。(四)視頻編解碼器14
很多多媒體數(shù)據(jù)流需要同時包含音頻數(shù)據(jù)和視頻數(shù)據(jù),這時通常會加入一些用于音頻和視頻數(shù)據(jù)同步的元數(shù)據(jù)。這3種數(shù)據(jù)流可能會被不同的程序、進程或硬件處理,但是當(dāng)它們傳輸或者存儲時,通常是被封裝在一起的。通常,這種封裝是通過視頻文件格式來實現(xiàn)的,如常見的*.mpg、*.avi、*.mov、*mp4、*.rm、*.ogg或*.tta。這些格式中有的只能使用某些編解碼器,而更多的則可以以容器的方式使用各種編解碼器。
一個復(fù)雜的平衡關(guān)系存在于以下因素之間:視頻的質(zhì)量、用來表示視頻所需要的數(shù)據(jù)量(通常稱為碼率)、編碼算法和解碼算法的復(fù)雜度、針對數(shù)據(jù)丟失和錯誤的魯棒性(Robustness)、編輯的方便性、隨機訪問、編碼算法設(shè)計的完美性、端到端的延時及其他一些因素。
音頻和視頻都需要可定制的壓縮方法。
編解碼器對應(yīng)的英文Codec(Coder和Decoder簡化而成的合成詞語)和Decode通常指軟件;當(dāng)特指硬件時,通常使用Endec。
2.視頻編解碼器的應(yīng)用
日常生活中,視頻編解碼器的應(yīng)用非常廣泛,如在DVD(MPEG-2)、VCD(MPEG-1)、各種衛(wèi)星和陸上電視廣播系統(tǒng)中,以及在互聯(lián)網(wǎng)上。這些視頻素材通常是使用很多種不同的編解碼器進行壓縮的,為了能夠正確地瀏覽這些素材,用戶需要下載并安裝編解碼器包——一種為PC準(zhǔn)備的編譯好的編解碼器組件。很多多媒體數(shù)據(jù)流需要同時包含音頻數(shù)據(jù)和視頻數(shù)據(jù),這時15
由用戶自己來進行視頻的壓縮已經(jīng)隨著DVD刻錄機的出現(xiàn)而越來越風(fēng)行。由于商店中販賣的DVD通常容量比較大(雙層),而目前雙層DVD刻錄機還不太普及,因此用戶有時會對DVD的素材進行二次壓縮,使其能夠在一張單面DVD上完整地存儲。3.視頻編解碼器的設(shè)計。一個典型的數(shù)字視頻編解碼器是分4步完成編碼的,其解碼僅僅是編碼的反運算。(1)第一步是將從攝像機輸入的視頻從RGB色度空間轉(zhuǎn)換到Y(jié)CbCr色度空間。轉(zhuǎn)換到Y(jié)CbCr色度空間會帶來兩點好處;①這樣做部分解除了色度信號中的相關(guān)性,提高了可壓縮能力;②這樣做將亮度信號分離出來,而亮度信號對視覺感覺是最重要的,相對來說色度信號對視覺感覺就不是那么重要,可以抽樣到較低的分辨率(4:2:0或4:2:2)而不影響人觀看的感覺。(2)第二步是對空域或時域抽樣,以有效地降低原始視頻數(shù)據(jù)的數(shù)據(jù)量。在逐行掃描中,其色度抽樣生成4:2:0格式的視頻;在隔行掃描的情況下,其色度抽樣會采用4:2:2的抽樣方式。(3)第三步是將輸入的視頻圖像分割為宏塊,并分別進行編碼。宏塊的大小通常是16×16的亮度塊信息和對應(yīng)的色度塊信息。(4)第四步是使用分塊的運動補償從已編碼的幀對當(dāng)前幀的數(shù)據(jù)進行預(yù)測。使用塊變換或子帶分解來減少空域的統(tǒng)計相關(guān)性。最常見的變換是8×8的離散余弦變換(Discrete℃osineTransform,DCT)。變換的輸出系數(shù)接下來被量化,量化后的系數(shù)進行熵編碼并成為輸出碼流的一部分。由用戶自己來進行視頻的壓縮已經(jīng)隨著DVD刻錄機的出現(xiàn)16
實際上,在使用DCT變換時,量化后的二維系數(shù)通常使用Zig-zag掃描表示為一維,再通過對連續(xù)0系數(shù)的個數(shù)和非0系數(shù)的大小(Level)進行編碼得到一個符號,通常也有特殊的符號來表示后面剩余的所有系數(shù)全部等于O。這時的熵編碼通常使用變長編碼。解碼基本上執(zhí)行和編碼過程完全相反的過程。其中,不能被完全恢復(fù)原來信息的步驟是量化。這時,要盡可能接近的恢復(fù)原來的信息。這個過程被稱為反量化,盡管量化本身已經(jīng)注定是個不可逆過程。視頻編解碼器的設(shè)計通常是標(biāo)準(zhǔn)化的,也就是說,有發(fā)布的文檔來準(zhǔn)確地規(guī)范如何進行。實際上,為了使編碼的碼流具有互操作性(即由A編碼器編成的碼流可以由B解碼器解碼,反之亦然),僅對解碼器的解碼過程進行規(guī)范就足夠了。通常,編碼的過程并不完全被一個標(biāo)準(zhǔn)所定義,用戶有設(shè)計自己編碼器的自由,只要用戶設(shè)計的編碼器編碼產(chǎn)生的碼流是符合解碼規(guī)范的即可。因此,由不同的編碼器對同樣的視頻源按照同樣的標(biāo)準(zhǔn)進行編碼,再解碼后輸出圖像的質(zhì)量往往可能相差很多。實際上,在使用DCT變換時,量化后的二維系數(shù)通常使用17
三、分辨率與碼率(一)分辨率1.顯示分辨率(1)VGA的概念。VGA(ⅥdeoGraphicsArray)是IBM于1987年提出的一個使用模擬信號的電腦顯示標(biāo)準(zhǔn),該標(biāo)準(zhǔn)對現(xiàn)今的個人電腦市場已經(jīng)過時。即便如此,VGA仍然是最多制造商所共同支援的一個低標(biāo)準(zhǔn),個人電腦在加載自己的獨特驅(qū)動程式之前,都必須支援VGA的標(biāo)準(zhǔn)。例如,微軟Windows系列產(chǎn)品的開機畫面仍然使用VGA顯示模式,這也說明了其分辨率和載色數(shù)的不足。
VGA的主要技術(shù)規(guī)格如下:256KB的VideoRAM,16色和256色模式,共262144種顏色的色板(紅、綠、藍三色各6bit),最多720個水平像素,最多480條線,最高70Hz的更新頻率等。
在這里,VGA這個術(shù)語常常不論其圖形裝置,而直接用于指稱640×480的分辨率。
(2)基于VGA的其他分辨率。由此引發(fā)了VGA、SVGA、XGA、SXGA、SXGA+、UXGA、WSXGA、WSXGA+、QVGA、QXGA、QSXGA、QUXGA等一系歹0分辨率的劃分與代號。
SVGA為高級視頻圖形陣列(SuperVideoGraphicsArray或SuperVGA),由VESA為IBM兼容機推出的標(biāo)準(zhǔn)。分辨率為800×600(每像素4bit,16種顏色可選)。
XGA為擴展圖形陣列(ExtendedGraphicsA玎ay),是繼8514/A顯示模式之后,IBM于1990年發(fā)明的;XGA能以真彩色提供800×600像素的分辨率或以65536種色彩提供1024×768像素的分辨率。三、分辨率與碼率18SXGA為高級擴展圖形陣列(SupereXtendedGraphicsArray或SuperXGA),是一個分辨率為1280×1024的顯示標(biāo)準(zhǔn),每個像素用32bit表示(真彩
色)。這種被廣泛采用的顯示標(biāo)準(zhǔn)的縱橫比為5:4而不是常見的4:3。
SXGA+為增強型高級擴展圖形陣列(SupereXtendedGraphicsArrayPlus或SuperXGA+)。一個分辨率為1400×1050的顯示標(biāo)準(zhǔn),是SXGA的擴展。每個像素用32bit表示(真彩色)。UXGA為超級擴展圖形陣列(UltraeXtendedGraphicsArray,又稱UVGA)支持最大1600×1200的分辨率。目前,高端的移動工作站配備了這一類型的屏幕。
WSXGA為寬屏高級擴展圖形陣列(WidescreenSupereXtendedGraphicsArrayPlus或:WideVGA),是VGA的另一種形式,分辨率比VGA高,其分辨率為800×480的像素,即擴大了VGA(640×480)的分辨率,應(yīng)用于PDA和手機等;因為很多網(wǎng)頁的寬度都是800,以WVGA的屏幕會更加適合于瀏覽網(wǎng)頁,可以說是未來手持設(shè)備的分辨率的大趨勢。
WSXGA+為增強型寬屏高級擴展圖形陣列(WielescreenSupereXtendedGaphicsArrayPlus),淹SXGA+的寬屏擴展,分辨率為1680×1050的顯示標(biāo)準(zhǔn),每個像素用32bit表示(真彩色)。
QVGA即QuarterVGA,即VGA的四分之一尺寸,亦即在屏幕上輸出的分辨率為240×320像素。SXGA為高級擴展圖形陣列(SupereXtended19
2:圖像分辨率
1)CIF圖像格式。CIF(CommonIntermediateFormat)稱為常用的標(biāo)準(zhǔn)化圖像格式。H.323協(xié)議簇中,規(guī)定了視頻采集設(shè)備的標(biāo)準(zhǔn)采集分辨率為CIF=352×288像素。
1)電視圖像的空間分辨率為家用錄像系統(tǒng)(VideoHomeSystem,VHS)的分辨率,即352X288
2)使用非隔行掃描(Non-InterlacedScan)。
3)使用NTSC幀速率,電視圖像的最大幀速率為30000/1001≈29.97幅/S。
4)使用1/2的PAL水平分辨率,即288線。
5)對亮度和兩個色差信號(Y、Cb和Cr)分量分別進行編碼,它們的取值范圍同ITU-RBT.601,即黑色為16,白色為235,色差的最大值等于240、最小值等于16。
在CIF的基礎(chǔ)上,演繹出其他5種基于CIF的圖像格式,見表2-6。2:圖像分辨率20表2-65種基于CIF圖像格式的參數(shù)說明表2-65種基于CIF圖像格式的參數(shù)說明21
監(jiān)控行業(yè)中主要使用QCIF(176×144)、CIF(352×288)、HalfDl(704×288)、Dl(704×576)等幾種分辨率。目前,CIF錄像分辨率是主流分辨率,絕大部分產(chǎn)品均采用CIF分辨率。
(2)基于CIF的其他圖像格式。QCIF的優(yōu)點是存儲量低,可以在窄帶中使用,且使用這種分辨率的產(chǎn)品價格低廉;缺點是圖像質(zhì)量往往很差,不被用戶所接受。
Dl(4CIF)為標(biāo)清分辨率,它的優(yōu)點是圖像清晰;缺點是存儲量高,網(wǎng)絡(luò)傳輸帶寬要求很高,價格也較高。HalfDl(2CIF)分辨率可以提高清晰度,滿足高質(zhì)量的要求,但是以高碼流為代價的。由于704×288只是水平分辨率的提升,因此圖像質(zhì)量提高不是特別明顯。
CIF是目前監(jiān)控行業(yè)的主流分辨率,這是由于目前數(shù)碼監(jiān)控要求視頻碼流不能太高,視頻傳輸帶寬也有限制,且采用CIF分辨率,信噪比在32dB以上,因此一般用戶可以接受。它的優(yōu)點是存儲量較低,能在普通寬帶網(wǎng)絡(luò)中傳輸,價格也相對低廉,同時圖像質(zhì)量較好,被大部分用戶所接受;缺點是圖像質(zhì)量不能滿足高清晰的要求。(3)未來圖像格式的發(fā)展趨勢。在現(xiàn)階段市場接受CIF分辨率,未來會出現(xiàn)眾多非CIF格式的產(chǎn)品。目前,業(yè)內(nèi)人士正在嘗試用HalfDl來尋求CIF、Dl之間的平衡,用來解決CIF清晰度不夠高和4CIF存儲量高、價格高昂的缺點。經(jīng)過測試,發(fā)現(xiàn)另外一種2CIF分辨率528×384,比704×288能更好地解決CIF、4CIF的問題。特別是在512kbit/s~lMbit/s碼率之間,能獲得穩(wěn)定的高質(zhì)量圖像,滿足用戶較高圖像質(zhì)量的要求。監(jiān)控行業(yè)中主要使用QCIF(176×144)、CI22
未來,隨著單塊硬盤的容量達到1500GB甚至4000GB,而國內(nèi)的大部分DVR已經(jīng)可以做到連接8塊1500GB的硬盤,則D1也許會逐漸變成市場的主流。
3.電視畫面分辨率
電視的畫面分辨率以水平清晰度為單位。通俗地說,可以把電視上的畫面以水平方向分割成很多掃描線,分得越細(xì),這些畫面就越清楚,而水平線數(shù)的掃描線數(shù)量也就越多。分辨率(清晰度)的單位是電視行(TVLine),也稱線,即是從水平方向上看,相當(dāng)于將每行掃描線豎立起來,然后乘上4:3或者16:9的寬高比,從而構(gòu)成水平方向的總線數(shù)。
以下是幾種常見的電視掃描格式:
(1)Dl為480i格式,和NTSC模擬電視清晰度相同,525條垂直掃描線,483條可見垂直掃描線,4:3或16:9,隔行掃描60H,行頻為15.25kH。
(2)D2為480p格式,和逐行掃描DVI)規(guī)格相同,525條垂直掃描線,480條可見垂直掃描線,4:3或16:9,分辨率為640×480,逐行掃描60Hz,行頻為31.5kHz。未來,隨著單塊硬盤的容量達到1500GB甚至4000GB,23
(3)D3為1080i格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式,1125條垂直掃描線,1080條可見垂直掃描線,16:9,分辨率為1920×1080,隔行掃描60Hz,行頻為33.75kHz。
(4)D4為720p格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式,750條垂直掃描線,720條可見垂直掃描線16:9,分辨率為1280×720,逐行掃描60Hz,行頻為45kHz。、
(5)D5為1080p格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式,1125條垂直掃描線,1080條可見垂直掃描線,16:9,分辨率為1920×1080逐行掃描,專業(yè)格式。
此外,還有576i,即標(biāo)準(zhǔn)的PAL電視顯示模式,625條垂直掃描線,576條可見垂直掃描線,4:3或16:9,隔行掃描50H,記為576i或625i。
以上標(biāo)準(zhǔn)中“i”表示隔行,"p”表示逐行掃描)TV標(biāo)準(zhǔn)是高品質(zhì)視頻信號標(biāo)準(zhǔn),包括1080i、720p、1080p。要注意的是,對于電視機處理能力(如帶寬)的要求則是480i<480p<1080i<720p。
數(shù)字高清電視的720p、1080i和1080p是由美國電影電視工程師協(xié)會確定的高清標(biāo)準(zhǔn)格式。其中1080p被稱為目前數(shù)字電視的頂級顯示格式,這種格式的電視在逐行掃描下能夠達到1920×1080的分辨率。受存儲介質(zhì)限制(一部1080p的影片需要10GB以上的存儲空間),目前1080p的影片多數(shù)以藍光DVD的方式發(fā)行。(3)D3為1080i格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式,1124
(二)碼率
碼率是數(shù)據(jù)傳輸時單位時間傳送的數(shù)據(jù)位數(shù),單位—般為kbit/s,即千位每秒。碼率實質(zhì)上就是取樣率,單位時間內(nèi)取樣率越大,精度就越高,處理出來的文件就越接近原始文件。但是,文件體積與取樣率成正比,所以幾乎所有的編碼格式重視的都是如何用最低的碼孽達到最少的失真。
圍繞該核心衍生出來的固定碼率與可變碼率都是在這方面做的文章,不過事情總不是絕對的,從視頻方面來說,碼率越高,被壓縮的比例越小,畫質(zhì)損失越小,與視頻源的畫質(zhì)越接近。
1.固定碼率
固定碼率(ConstantBitRate,CBR)是用來形容通信服務(wù)質(zhì)量(ualityofService,QoS)的術(shù)語。當(dāng)解釋編解碼器工作時,CBR編碼是指編碼器的輸出碼率(或者解碼器的輸入碼率),應(yīng)是常數(shù)(固定值)。當(dāng)在一個帶寬受限的信道中進行多媒體通信時,CBR是非常有用,因為這時受限是最高碼率,CBR可以更好地使用這樣的信道。但是,CBR不適宜進行存儲,因為CBR將導(dǎo)致沒有足夠的碼率對復(fù)雜的內(nèi)容部分進行編碼(從而導(dǎo)致質(zhì)量下降);同時,在簡單的內(nèi)容部分會浪費一些碼率。(二)碼率25
大部分編碼方案的輸出都是可變長的碼字,如霍夫曼編碼或游程編碼(Run-lengthCoding),這使得編碼器很難做到完美的CBR。編碼器可以通過調(diào)整量化(進而調(diào)整編碼質(zhì)量)來部分解決這個問題,如果同時使用填充碼來完美地達到CBR。有時,CBR也指一種非常簡單的編碼方案,如將一個16位精度的音頻數(shù)據(jù)流通過抽樣得到一個8位精度的數(shù)據(jù)流。
2.可變碼率
可變碼率(VariableBitRate,VBR)也是用來形容通信服務(wù)質(zhì)量(QoS)的術(shù)語。當(dāng)解釋編解碼器工作時,VBR編碼是指編碼器的輸出碼率(或解碼器的輸入碼率)可以根據(jù)編碼器的輸入源信號的負(fù)責(zé)度自適應(yīng)地調(diào)整,目的是達到保持輸出質(zhì)量保持不變而不是保持輸出碼率不變。VBR適用于存儲(不太適用于流式傳輸),可以更好地利用有限的存儲空間:用比較多的碼字對復(fù)雜度高的段進行編碼,而用比較少的碼字對復(fù)雜度低的段進行編碼。例如,使用MP3格式的音頻編解碼器,音頻文件可以以8~320kbit/s的可變碼率進行壓縮,得到相對小的文件來節(jié)約存儲空間。MP3格式的文件格式是*.mp3。幾乎所有視頻編解碼器內(nèi)在的都是VBR的。*.mp3文件也可以以VBR的方式進行編碼。
3.平均碼率
平均碼率(AverageBitRate,ABR)通常是指數(shù)字音樂或視頻的平均碼率。例如,如果說一個MP3文件的平均碼率是128kbit/s,則就是說,平均而言,每秒鐘有128000位被傳輸與解碼。碼率并不是衡量音頻/視頻質(zhì)量的唯一標(biāo)準(zhǔn),一些其他的格式,都可以在和MP3文件同樣的平均碼率下提供更好的聲音質(zhì)量。大部分編碼方案的輸出都是可變長的碼字,如霍夫曼編碼或游程26
四、數(shù)字視頻壓縮標(biāo)準(zhǔn)
對于一些常見的視頻壓縮標(biāo)準(zhǔn)與協(xié)議,會在本節(jié)中進行概括性的講述。因為在視頻監(jiān)控系統(tǒng)中,H.263和MPEG-4是最為常見的視頻壓縮標(biāo)準(zhǔn)與協(xié)議、M-JPEG2000在未來會越來越多地出現(xiàn),所以將單列講解。視頻編碼方式就是指通過特定的壓縮技術(shù),將某個視頻格式的文件轉(zhuǎn)換成另一種視頻格式文件的方式。四、數(shù)字視頻壓縮標(biāo)準(zhǔn)27表2-7常見的多媒體壓縮格式表2-7常見的多媒體壓縮格式28(一)常見的視頻壓縮標(biāo)準(zhǔn)與協(xié)議很多視頻編解碼器可以很容易地在個人計算機和消費電子產(chǎn)品上實現(xiàn),這使得在這些設(shè)備上有可能同時實現(xiàn)多種視頻編解碼器,從而避免了由于兼容性的原因使得某種占優(yōu)勢的編解碼器影響其他編解碼器的發(fā)展和推廣。所以,可以說,并沒有哪種編解碼器可以替代其他所有的編解碼器。下面是一些常用的視頻編解碼器,按照它們成為國際標(biāo)準(zhǔn)的時間排序。
1.H.261協(xié)議H.26x系列視頻壓縮協(xié)議是國際電報電話咨詢委員會(ConsultativeCommitteeofTelecommunicationandTelegraphy,CCITT)發(fā)布的一系列建議,有H.261、H.262、H.263、H.264等。
國際電報電話咨詢委員會是國際電信聯(lián)盟(ITU)的常設(shè)機構(gòu)之一,其主要職責(zé)是研究電信的新技術(shù)、新業(yè)務(wù)和資費等問題,并對這類問題通過建議使全世界的電信標(biāo)準(zhǔn)化。1993年,國際電報電話咨詢委員會(CCITT)改組為國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門,簡稱ITU-T。
H.261也稱P×64,即采用P×64kbit/s聲像業(yè)務(wù)的圖像編解碼,是最早的數(shù)字視頻壓縮標(biāo)準(zhǔn),也是1984年ITU-T提出的第一個實用化的、適用于會議電視和可視電話要求的標(biāo)準(zhǔn)。因此,H.261主要在老的視頻會議和視頻電話產(chǎn)品中使用,所用的電話網(wǎng)絡(luò)為綜合業(yè)務(wù)數(shù)字網(wǎng)絡(luò)(ISDN),目標(biāo)是推薦一個圖像編碼標(biāo)準(zhǔn),因為圖像必須和語音密切配合,所以推薦的圖像編碼算法必須是實時處理的,并且要求延時最小。(一)常見的視頻壓縮標(biāo)準(zhǔn)與協(xié)議29
實質(zhì)上,之后的所有標(biāo)準(zhǔn)視頻編解碼器都是基于它設(shè)計的。它使用了常見的YCbCr顏色空間,4:2:0的色度抽樣格式,8位的抽樣精度,16X16的宏塊,分塊的運動補償,按8×8分塊進行的離散余弦變換、量化,對量化系數(shù)的Zig-zag掃描,run-level符號影射及霍夫曼編碼。H.261只支持逐行掃描的視頻輸入。
2.MPEG-1標(biāo)準(zhǔn)
活動圖像專家組MPEG(MovingPictureExpertGroup)是運動圖像和聲音的數(shù)字編碼標(biāo)準(zhǔn)。它是由標(biāo)準(zhǔn)化組織(ISO)和國際電工委員會(IEC)制定的。實際上,MPEG是一個標(biāo)準(zhǔn)系列,通常有MPEG-1、MPEG-2、MPEG-4和MPEG-7。
MPEG-1又稱為動態(tài)圖像和伴音的編碼(CodingofMovingPictureAndAssociatedAudio)標(biāo)準(zhǔn),可以處理各種類型的活動圖像。MPEG-1所支持的輸入圖像格式有兩種:352×240×30和352×288×25,其基本算法對于壓縮水平方向360個像素、豎直方向288個像素的空間分辨力,每秒24~30副畫面的運動圖像有很好的效果。MPEG-1標(biāo)準(zhǔn)中的一幀圖像是成逐行掃描的圖像。
MPEG-1標(biāo)準(zhǔn)采用了一系列的技術(shù)獲得高壓縮比:①對色差信號進行亞取樣以減少數(shù)據(jù)量;②采用運動補償技術(shù)減少時間冗余度;③作二維DCT變換去除空間相關(guān)性;④對DCT分量進行量化,將量化后的DCT分量按頻率重新排序;⑤將DCT分量進行變字長編碼;⑥對每數(shù)據(jù)塊的直流分量進行預(yù)測。實質(zhì)上,之后的所有標(biāo)準(zhǔn)視頻編解碼器都是基于它設(shè)計的。它使30
MPEG-1視頻壓縮策略:為了提高壓縮比,幀內(nèi)/幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時使用。
幀內(nèi)壓縮算法與JPEG壓縮算法大致相同,采用基于DCT的變換編碼技術(shù),用以減少空域冗余信息。幀間壓縮算法可采用預(yù)測法和插補法。預(yù)測誤差可在通過DCT變換編碼處理后進一步壓縮。幀間編碼技術(shù)可減少時間軸方向的冗余信息。MPEG-1第二部分主要使用在VCD上,有的在線視頻也使用這種格式。該編解碼器的質(zhì)量大致上和原有的VHS錄像帶相當(dāng),但VCD屬于數(shù)字視頻技術(shù),它不會像VHS錄像帶一樣隨著播放的次數(shù)和時間而逐漸損失質(zhì)量。如果輸入視頻源的質(zhì)量足夠好、編碼的碼率足夠高,VCD就可以給出從各方面看都比VHS高的質(zhì)量。但是,為了達到這樣的目標(biāo),VCD需要比VHS標(biāo)準(zhǔn)高的碼率。實際上,如果考慮到讓所有的VCD播放機都可以播放,高于1150kbit/s的視頻碼率或高于352×288的視頻分辨率都不能使用。大體來說,這個限制通常僅僅對一些單體的VCD播放機(包括一些DVD播放機)有效。
MPEG-1第三部分還包括了目前常見的MP3音頻編解碼器(MP3為MPEG-1AudioLayer3的縮寫)。如果考慮通用性,則MPEG-1的視頻/音頻編解碼器可以說是通用性最高的編解碼器,幾乎世界上所有的計算機都可以播放MPEG-1格式的文件。幾乎所有的DVD機也支持VCD的播放。從技術(shù)上來講,與H.261標(biāo)準(zhǔn)相比,MPEG-1增加了對半像素運動補償和雙向運動預(yù)測幀;和H.261-樣,MPEG-1只支持逐行掃描的視頻輸入MPEG-1視頻壓縮策略:為了提高壓縮比,幀內(nèi)/幀間圖像31
3.M-JPEG標(biāo)準(zhǔn)聯(lián)合圖像專家組JPEG(JointPhotographicExpertsGroup)是數(shù)字圖像壓縮的國際標(biāo)準(zhǔn)。它從1986年正式開始制定,是國際標(biāo)準(zhǔn)化組織(ISO)、國際電報電話咨詢委員會(CCITT)、國際電工委員會(IEC)合作的結(jié)果,所以它是ISO的標(biāo)準(zhǔn),同時也是CCITT推薦的標(biāo)準(zhǔn)。JPEG主要致力于制定連續(xù)色調(diào)、多級灰度、靜態(tài)圖像的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn)。常用的基于離散余弦變換(DCT)的編碼方法是JPEG算法的核心內(nèi)容。JPEG的關(guān)鍵技術(shù)還有變換可變長編碼、量化、差分編碼、運動補償、霍夫曼編碼和游程編碼等。
M-JPEG(Motion-JoinPhotographicExpertsGroup)技術(shù)即運動靜止圖像(或逐幀)壓縮技術(shù),其廣泛應(yīng)用于非線性編輯領(lǐng)域,可精確到幀編輯和多層圖像處理,把運動的視頻序列作為連續(xù)的靜止圖像來處理。這種壓縮方式單獨完整地壓縮每二幀,并在編輯過程中可隨機存儲每一幀,并可進行精確到幀的編輯。
M-JPEG用于空間連續(xù)變化的靜止圖像,包括灰度等級和顏色兩方面的連續(xù)變化。
M-JPEG的壓縮和解壓縮是對稱的,可由相同的硬件和軟件實現(xiàn)。但M-JPEG只對幀內(nèi)的空間冗余進行壓縮,不對幀間的時間冗余進行壓縮,故壓縮效率不高。采用M-JPEG數(shù)字壓縮格式,當(dāng)壓縮比為7:1時,可提供相當(dāng)于BetecamSP質(zhì)量圖像的節(jié)目。3.M-JPEG標(biāo)準(zhǔn)32
M-JPEG包含兩種基本壓縮方法,一種是以離散余弦變換(DCT)為基礎(chǔ)的壓縮方法;另一種是無損壓縮(又稱為預(yù)測壓縮方法)。由于M-JPEG沒有利用時間方向上的冗余,因此M-JPEG在幀內(nèi)編碼方式上提供了多種多樣的方法和選擇。
M-JPEG可以很容易地做到精確到幀的編輯,設(shè)備也比較成熟,但其壓縮效率不高。此外,M-JPEG這種壓縮方式并不是一個完全統(tǒng)一的壓縮標(biāo)準(zhǔn),不同廠家的編解碼器和存儲方式并沒有統(tǒng)一的規(guī)定格式。也就是說,每個型號的視頻服務(wù)器或編碼板有自M-JPEG版本,所以在服務(wù)器之間的數(shù)據(jù)傳輸、非線性制作網(wǎng)絡(luò)向服務(wù)器的數(shù)據(jù)傳輸都可能的。
4.MPEG-2標(biāo)準(zhǔn)
MPEG-2又稱活動圖像及有關(guān)聲音信息的通用編碼(GenericCodingofMovingPicAssociatedAudioInformation),是由MPEG開發(fā)的第二個標(biāo)準(zhǔn),1994年正式確定為國際標(biāo)在此標(biāo)準(zhǔn)制定期間,國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(ITU-T)成立了一個有關(guān)ATM的圖像編碼專家組。
MPEG-2標(biāo)準(zhǔn)特別使用于廣播級數(shù)字電視的編碼和傳送。它是針對數(shù)字電視和高清晰度電視在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細(xì)規(guī)定,并不是MPEG-1的簡單升級,而是在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進一步的完善,并兼顧了與ATM信元的適配問題。MPEG-2中的圖像類型分為四種:I幀(內(nèi)碼幀)、P幀(預(yù)測幀)、B幀(雙向預(yù)測幀)和D幀(直流幀)。
MPEG-2標(biāo)準(zhǔn)目前有9個部分,統(tǒng)稱為ISO/IEC13818國際標(biāo)準(zhǔn)。M-JPEG包含兩種基本壓縮方法,一種是以離散余弦變換(33
MPEG-2標(biāo)準(zhǔn)目前有9個部分,統(tǒng)稱為ISO/IEC13818國際標(biāo)準(zhǔn)。前6部分均已獲得通過,成為正式的國際標(biāo)準(zhǔn),并在數(shù)字電視領(lǐng)域得到了廣泛的實際應(yīng)用。ATM視頻編碼專家組與MPEG專家組將ISO/IEC13818標(biāo)準(zhǔn)的第一、二部分合并,因此,上述兩個部分也成為ITU-T的標(biāo)準(zhǔn),分別為ITU-TRec.H;220系統(tǒng)和ITU-TRec.H.262視頻。
MPEG-2第二部分等同于H.262,使用在DVD、SVCD和大多數(shù)數(shù)字視頻廣播系統(tǒng)和有線分布系統(tǒng)(CableDistributionSystems)中。當(dāng)使用在標(biāo)準(zhǔn)DVD上時,它支持很高的圖像質(zhì)量和寬屏;當(dāng)使用在SVCD時,其質(zhì)量不如DVD,但比VCD高出許多。不幸的是,SVCD最多能在1張CD光盤上容納40min的內(nèi)容,而VCD可以容納1h,也就是說,SVCD具有比VCD更高的平均碼率。MPEG-2也將被使用在新一代DVD標(biāo)準(zhǔn)HD-DVD和Blue-ray(藍光光盤)上。從技術(shù)上來說,與MPEG-1相比,MPEG-2最大的改進在于增加了對隔行掃描視頻的支持。
5.H.263協(xié)議
H.263是國際電信聯(lián)盟ITU-T的一個標(biāo)準(zhǔn)草案,是為低碼流通信而設(shè)計的。但實際上,這個標(biāo)準(zhǔn)可用在很寬的碼流范圍,而非只用于低碼流中,它在許多應(yīng)用中可以取代H.261。
H.263主要用在視頻會議、視頻電話和網(wǎng)絡(luò)視頻上。在對逐行掃描的視頻源進行壓縮的方面,H.263與之前的視頻編碼標(biāo)準(zhǔn)相比,在性能上有了較大的提升。尤其是在低碼率端,它可以在保證一定質(zhì)量的前提下大大節(jié)約碼率。MPEG-2標(biāo)準(zhǔn)目前有9個部分,統(tǒng)稱為ISO/IEC1334
H.263的編碼算法與H.261-樣,但其作了些改善和改變,以提高性能和糾錯能力.H.263標(biāo)準(zhǔn)在低碼率下能夠提供比H.261更好的圖像效果,兩者的區(qū)別有:
(1)H.263的運動補償使用半像素精度,而H.261則用全像素精度和循環(huán)濾波。
(2)數(shù)據(jù)流層次結(jié)構(gòu)的某些部分在H.263中是可選的,從而使得編解碼可以配置成更低的數(shù)據(jù)率或更好的糾錯能力。
MPEG-2標(biāo)準(zhǔn)特別使用于廣播級數(shù)字電視的編碼和傳送。它是針對數(shù)字電視和高清晰度電視在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細(xì)規(guī)定,并不是MPEG-1的簡單升級,而是在系統(tǒng)和MPEG面作了更加詳細(xì)的規(guī)定和進一步的完善,并兼顧了與刪信元的適配問題。
MPEG-2中的圖像類型分為四種:I幀(內(nèi)碼幀)、P幀(預(yù)測幀)、B幀(雙向預(yù)測幀)和D幀(直流幀)。
MPEG-2標(biāo)準(zhǔn)目前有9個部分,統(tǒng)稱為ISO/IEC13818國際標(biāo)準(zhǔn)。前6部分均已獲得通過,成為正式的國際標(biāo)準(zhǔn),并在數(shù)字電視領(lǐng)域得到了廣泛的實際應(yīng)用。
H.263的編碼算法與H.261-樣,但其作了些改善和35
MPEG-2第二部分等同于H.262,使用在DVD.SVCD和大多數(shù)數(shù)字視頻廣播系統(tǒng)和有線;手布系統(tǒng)(CableDistributionSystems)中。當(dāng)使用在標(biāo)準(zhǔn)DVD上時,它支持很高的圖像質(zhì)量和寬屏:當(dāng)使用在SVCD時,其質(zhì)量不如DVD,但比VCD高出許多。不幸的是,SVCD最多能在1張CD光盤上容納40min的內(nèi)容,而VCD可以容納1h,也就是說,SVCD具有比VCD更高的平均碼率。MPEG-2也將被使用在新一代DVD標(biāo)準(zhǔn)HD-DVD和Blue-ray(藍光光盤)上。從技術(shù)上來說,與MPEG-1相比,MPEG-2最大的改進在于增加了對隔行掃描視頻的支持。5.H.263協(xié)議H.263是國際電信聯(lián)盟ITU-T的一個標(biāo)準(zhǔn)草案,是為低碼流通信而設(shè)計的。但實際上,這個標(biāo)準(zhǔn)可用在很寬的碼流范圍,而非只用于低碼流中,它在許多應(yīng)用中可以取代H.261。H.263H主要用在視頻會議、視頻電話和網(wǎng)絡(luò)視頻上。在對逐行掃描的視頻源進行壓縮的方面,H.263與之前的視頻編碼標(biāo)準(zhǔn)相比,在性能上有了較大的提升。尤其是在低碼率端,它可以在保證一定質(zhì)量的前提下大大節(jié)約碼率。H.263的編碼算法與H.261一樣,但其作了些改善和改變,以提高性能和糾錯能力。H.263標(biāo)準(zhǔn)在低碼率下能夠提供比H.261更好的圖像效果,兩者的區(qū)別有:(1)H.263的運動補償使用半像素精度,而H.261則用全像素精度和循環(huán)濾波。
(2)數(shù)據(jù)流層次結(jié)構(gòu)的某些部分在H.263中是可選的,從而使得編解碼可以配置成更低的數(shù)據(jù)率或更好的糾錯能力。MPEG-2第二部分等同于H.262,使用在DVD.S36
(3)H.263包含4個可協(xié)商的選項以改善性能。
(4)H.263采用無限制的運動向量及基于語法的算術(shù)編碼。
(5)采用事先預(yù)測和與MPEG中的P-B幀一樣的幀預(yù)測方法。
(6)H.263支持5種分辨率,即除了支持H.261中所支持的QCIF和CIF外,還支持SQCIF、4CIF和16CIF,SQCIF相當(dāng)于QCIF一半的分辨率,而4CIF和16CIF分別為CIF的4倍和16倍。
1998年IUT-T推出的H.263+是H.263建議的第2版,它提供了12個新的可協(xié)商模式和其他特征,進一步提高了壓縮編碼性能,如H.263只有5種視頻源格式,而H.263+允許使用更多的視頻源格式,圖像時鐘頻率也有多種選擇,拓寬了應(yīng)用范圍;另一重要的改進是可擴展性,它允許多顯示率、多速率及多分辨率,增強了視頻信息在易誤碼、易丟包異構(gòu)網(wǎng)絡(luò)環(huán)境下的傳輸。
另外,H.263+對H.263中的不受限運動矢量模式進行了改進,加上12個新增的可選模式,不僅提高了編碼性能,而且增強了應(yīng)用的靈活性。目前,H.263已基本取代了H.261。
6.MPEG-4-標(biāo)準(zhǔn)運動圖像專家組MPEG于1999年2月正式公布了MPEG-4(ISO/IEC14496)標(biāo)準(zhǔn)第1版。同年年底,MPEG-4第2版亦告底定,且于2000年年初正式成為國際標(biāo)準(zhǔn)。(3)H.263包含4個可協(xié)商的選項以改善性能。37
MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對數(shù)字電視、交互式繪圖應(yīng)用(影音合成內(nèi)容)、交互式多媒體(WWW、資料擷取與分散)等整合及壓縮技術(shù)的需求而制定的國際標(biāo)準(zhǔn)。MPEG-4標(biāo)準(zhǔn)將眾多的多媒體應(yīng)用集成于一個完整的框架內(nèi),旨在為多媒體通信及應(yīng)用環(huán)境提供標(biāo)準(zhǔn)的算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應(yīng)用領(lǐng)域普遍采用的統(tǒng)一數(shù)據(jù)格式。
MPEG-4是為在國際互聯(lián)網(wǎng)絡(luò)上或移動通信設(shè)備(如移動電話)上實時傳輸音/視頻信號而制定的最新MPEG標(biāo)準(zhǔn),MPEG-4采用ObjectBased方式解壓縮,壓縮比指標(biāo)遠遠優(yōu)于以上幾種,壓縮倍數(shù)為450倍(靜態(tài)圖像可達800倍),分辨率輸入可從320×240到1280×1024,這是同質(zhì)量的MPEG-1和MJEPG的10倍多。MPEG-4標(biāo)準(zhǔn)同以前標(biāo)準(zhǔn)的最顯著的差別在于它是采用基于“面向?qū)ο蟆?Object-oriented)的編碼理念,即在編碼時,將一幅景物分成若干在時間和空間上相互聯(lián)系的視頻音頻對象,分別編碼后,再經(jīng)過復(fù)用傳輸?shù)浇邮斩?,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便對不同的對象采用不同的編碼方法和表示方法,又有利于不同數(shù)據(jù)類型間的融合,并且這樣也可以方便地實現(xiàn)對于各種對象的操作及編輯。例如,我們可以將一個卡通人物放在真實的場景中,或者將真人置于一個虛擬的演播室里,還可以在互聯(lián)網(wǎng)上方便地實現(xiàn)交互,根據(jù)自己的需要有選擇的組合各種視頻音頻及圖形文本對象。MPEG-4與MPEG-1和MPEG-2有很大的不同。M38
MPEG-4標(biāo)準(zhǔn)可以使用在網(wǎng)絡(luò)傳輸、廣播和媒體存儲上。與MPEG-2和第1版的H.263相比,MPEG-4標(biāo)準(zhǔn)的壓縮性能有所提高。當(dāng)然,它也引入了一些提高壓縮能力的技術(shù),包括一些H.263的技術(shù)和1/4像素的運動補償。和MPEG-2-樣,它同時支持逐行掃描和隔行掃描。
7.MPEG-7標(biāo)準(zhǔn)
MPEG-7標(biāo)準(zhǔn)被稱為多媒體內(nèi)容描述接口,它要解決的矛盾就是對日漸龐大的圖像、聲音信息的管理和迅速搜索;將對各種不同類型的多媒體信息進行標(biāo)準(zhǔn)化的描述,并將該描述與所描述的內(nèi)容相聯(lián)系,以實現(xiàn)快速有效的搜索,并允許快速和有效地查詢用戶感興趣的資料。它將擴展現(xiàn)有內(nèi)容識別專用解決方案的有限能力,同時還包括了更多的數(shù)據(jù)類型。換言之,MPEG-7規(guī)定了一個用于描述各種不同類型多媒體信息的描述符的標(biāo)準(zhǔn)集合,該標(biāo)準(zhǔn)于1998年10月提出。
由于該標(biāo)準(zhǔn)不包括對描述特征的自動提取,它也沒有規(guī)定利用描述進行搜索的工具或任何程序,因此,它可以獨立于其他MPEG標(biāo)準(zhǔn)使用,但MPEG-4中所定義的對音頻、視頻對象的描述仍然適用于MPEG-7,這種描述是分類的基礎(chǔ)。MPEG-4標(biāo)準(zhǔn)可以使用在網(wǎng)絡(luò)傳輸、廣播和媒體存儲上。與39MPEG-7的由來是MPEG-1+MPEG-2+MPEG-4(沒有MPEG-3、MPEG-5、MPEG-6)。MPEG-7是針對存儲形式(在線、離線)或流形式的應(yīng)用而指定的,并且可以在實時和非實時環(huán)境中操作。它的功能將和其他MPEG標(biāo)準(zhǔn)互為補充,MPEG-1、MPEG-2、MPEG-4是內(nèi)容本身的表示,而MPEG-7是有關(guān)內(nèi)容的信息,它是滿足特定需求的視聽信息的標(biāo)準(zhǔn)表示,并建立在其他MPEG標(biāo)準(zhǔn)的基礎(chǔ)之上。
MPEG-7只規(guī)定內(nèi)容描述格式,而不規(guī)定如何從原始的多媒體資料中抽取內(nèi)容描述的方法。MPEG-7是規(guī)定一個用于描述各種不同類型多媒體信息的描述符的標(biāo)準(zhǔn)集合,還將對定義其他描述符及其結(jié)構(gòu)(描述方案)以及它們之間的關(guān)系的方法進行標(biāo)準(zhǔn)化。這種描述(即描述符合描述方案的組合)將與內(nèi)容本身關(guān)聯(lián)起來,以便對用戶感興趣的素材進行快速高效的搜索。MPEG-7還將標(biāo)準(zhǔn)化一種用來定義描述方案的語言,即描述定義語言(DDL)。帶有與之相關(guān)的MPEG-7數(shù)據(jù)的AV素材,就可以加上索引,并可進行檢索。這些素材包括靜止的圖像、圖形、3D模型、音頻、視頻、語言及關(guān)于這些成分如何組成一個多媒體表述的信息。在這些通用數(shù)據(jù)類型中的特殊情況可能包括面部表情和個人特征。
MPEG-7的應(yīng)用范圍很廣泛,既可應(yīng)用于存儲(在線或離線),也可用于流式應(yīng)用(如廣播、將模型加入Internet等)。它還可以在實時或非實時環(huán)境下應(yīng)用,如數(shù)字圖書館(圖像目錄、音樂字典等)、多媒體名錄服務(wù)(如黃頁)、廣播媒體選擇(無線電信道、TV信道等)等。未來,它將在教育、新聞、導(dǎo)游信息、娛樂等各方面發(fā)揮巨大的作用。MPEG-7的由來是MPEG-1+MPEG-2+MPEG-440
MPEG-1的出現(xiàn)使VCD取代了錄像帶,MPEG-2的出現(xiàn)使數(shù)字電視逐步取代模擬電視,MPEG-4的出現(xiàn)使多媒體系統(tǒng)的交互性和靈活性大為增強,而MPEG-7的出現(xiàn)將會帶我們進入一個互動多媒體的網(wǎng)絡(luò)時代。
8.MPEG-21
MPEG-21即多媒體框架(MultimediaFramework),它是一個剛開始制定的國際標(biāo)準(zhǔn),其口號是:將標(biāo)準(zhǔn)集成起來支持和諧的技術(shù)以管理多媒體商務(wù)。
互聯(lián)網(wǎng)改變了物質(zhì)商品交換的商業(yè)模式(即電子商務(wù))。新的市場必然帶來新的問題,如何獲取數(shù)字視頻、音頻以及合成圖形等數(shù)字商品,如何保護多媒體內(nèi)容的知識產(chǎn)權(quán),如何為用戶提供透明的媒體信息服務(wù),如何檢索內(nèi)容,如何保證服務(wù)質(zhì)量等。此外,有許多數(shù)字媒體(圖片、音樂等)是由用戶個人生成、使用的。這些內(nèi)容供應(yīng)者同商業(yè)內(nèi)容供應(yīng)商一樣關(guān)心相同的事情:內(nèi)容的管理和重定位、各種權(quán)利的保護、非授權(quán)存取和修改的保護、商業(yè)機密與個人隱私的保護等。目前雖然建立了傳輸和數(shù)字媒體消費的基礎(chǔ)結(jié)構(gòu),并確定了與此相關(guān)的諸多要素,但這些要素、規(guī)范之間還沒有一個明確的關(guān)系描述方法,因此,迫切需要一種結(jié)構(gòu)或框架保證數(shù)字媒體消費的簡單性,很好地處理數(shù)字類消費中諸要素之間的關(guān)系。MPEG-21就是在這種情況下提出的。制定MPEG-21標(biāo)準(zhǔn)的目的是:
(1)將不同的協(xié)議、標(biāo)準(zhǔn)、技術(shù)等有機地融合在一起。
(2)制定新的標(biāo)準(zhǔn)。
(3)將這些不同的標(biāo)準(zhǔn)集成在一起。MPEG-1的出現(xiàn)使VCD取代了錄像帶,MPEG-2的出41
MPEG-21標(biāo)準(zhǔn)其實就是一些關(guān)鍵技術(shù)的集成,通過這種集成環(huán)境可對全球數(shù)字媒體資源,進行透明和增強管理,從而實現(xiàn)內(nèi)容描述、創(chuàng)建、發(fā)布、使用、識別、收費管理、產(chǎn)權(quán)保護、用戶隱私權(quán)保護、終端和網(wǎng)絡(luò)資源抽取、事件報告等功能。
目前,基于因特網(wǎng)的物品交易正在轉(zhuǎn)化為電子化的數(shù)字內(nèi)容分發(fā)和交易,在新的商業(yè)市場中,要將與媒體內(nèi)容相結(jié)合的不同的知識產(chǎn)權(quán)區(qū)分開是越來越困難了。所以,需要一種綜合性的解決方案,以一種協(xié)調(diào)的方式管理和發(fā)送不同的內(nèi)容形式,并且要對多媒體服務(wù)的用戶完全透明。為了支持這種新的商務(wù),需要一個多媒體的框架,這個框架需要一個由其結(jié)構(gòu)。就可理解的共享的模式,以保證發(fā)送電子內(nèi)容的系統(tǒng)可以互操作,并保證簡化交易。
總體來說,MPEG優(yōu)于其他壓縮/解壓縮方案。首先,由于在一開始它就是作為一個國際化的標(biāo)準(zhǔn)來研究制定的,因此,MPEG具有很好的兼容性;其次,MPEG能夠比其他算法提供更好的壓縮比,最高可達200:1;最重要的是,MPEG在提供高壓縮比的同時產(chǎn)生的圖像損失很小。MPEG-21標(biāo)準(zhǔn)其實就是一些關(guān)鍵技術(shù)的集成,通過這種集42
9.H.264協(xié)議
H.264是由國際電信聯(lián)盟(ITU-T)和國際標(biāo)準(zhǔn)化組織(ISO)的有關(guān)視頻編碼的專家聯(lián)合組建的聯(lián)合視頻組(JointVideoTeam:JVT)共同制定的新數(shù)字視頻編碼標(biāo)準(zhǔn)。所以,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高級視頻編碼(AdvancedVideoCoding,AVC),而且它將成為MPEG-4標(biāo)準(zhǔn)的第10部分。因此,不論是MPEG-4AVC、MPEG-4Part10,還是ISO/IEC14496-10,都是指H.264。
該標(biāo)準(zhǔn)是ITU-TVCEG和ISO/IECMPEG合作完成的性能最優(yōu)的視頻編碼標(biāo)準(zhǔn),并已得到了越來越多的應(yīng)用。它引入了一系列新的能夠大大提高壓縮性能的技術(shù),并能夠同時在高碼率端和低碼率端大大超越以前的諸標(biāo)準(zhǔn)。
H.264最大的優(yōu)勢是具有很高的數(shù)據(jù)壓縮比率,在同等圖像質(zhì)量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。舉個例子,原始文件的大小如果為88GB,則采用MPEG-2壓縮標(biāo)準(zhǔn)壓縮后變?yōu)?.5GB,壓縮比為25:1,而采用H.264壓縮標(biāo)準(zhǔn)壓縮后變?yōu)?79MB,即H.264的壓縮比達到102:1。
H.264的高壓縮比是低碼率(LowBitRate)起了重要的作用,和MPEG-2和MPEG-4ASP等壓縮技術(shù)相比,H.264壓縮技術(shù)將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費。尤其值得一提的是,H.264在具有高壓縮比的同時還擁有高質(zhì)量流暢的圖像。
H.264和H.261、H.263-樣,也采用了DCT變換編碼癡DPCM的差分編碼,即混合編碼結(jié)構(gòu)。同時,H.264在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,更貼近實際應(yīng)用。9.H.264協(xié)議43
H.264沒有煩瑣的選項,而是力求簡潔的“回歸基本”,它具有比H.263++更好的壓縮性能,又具有適應(yīng)多種信道的能力。H.264的應(yīng)用目標(biāo)廣泛,可滿足各種不同速率、不同場合的視頻應(yīng)用,具有較好的抗誤碼和抗丟包的處理能力。H.264的基本系統(tǒng)無需使用版權(quán),具有開放的性質(zhì),能很好地適應(yīng)lP和無線網(wǎng)絡(luò)的使用,這對目前因特網(wǎng)傳輸多媒體信息、移動網(wǎng)中傳輸寬帶信息等都具有重要意義。
10.AVS標(biāo)準(zhǔn)
AVS標(biāo)準(zhǔn)(AdvancedVideo-audeoStandard)是GB/T20090.2《信息技術(shù)先進音視頻編碼》系列標(biāo)準(zhǔn)的簡稱,它包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理等4個主要技術(shù)標(biāo)準(zhǔn)和一致性測試等支撐標(biāo)準(zhǔn)。AVS是支撐國家數(shù)字音視頻產(chǎn)業(yè)發(fā)展的基礎(chǔ)性標(biāo)準(zhǔn)。
AVS主要面向高清晰度和高質(zhì)量數(shù)字電視廣播、網(wǎng)絡(luò)電視、高密度數(shù)字存儲媒體和其他相關(guān)應(yīng)用,其具有以下特點:
(1)性能高,編碼效率是MPEG-2的2倍以上。
(2)復(fù)雜度低,算法復(fù)雜度明顯比H.264低,軟硬件實現(xiàn)成本都低于H.264。
(3)我國掌握主要知識產(chǎn)權(quán),專利授權(quán)模式簡單、費用低。
AVS是我國數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組基于我國自主創(chuàng)新技術(shù)和國際公開技術(shù)所、構(gòu)建的音視頻壓縮編碼標(biāo)準(zhǔn),故準(zhǔn)確來說,它不僅包括視頻編碼標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)最主要的目的是通過采用與H.264不同的專利授權(quán)方式來避免付出大筆的專利授權(quán)費用。技術(shù)上,AVS的視頻編碼部分采用的技術(shù)與H.264非常相似,但采取了一些簡化措施。這樣做,一方面可以回避一些非必要專利;另一方面,也可以在幾乎不影響編碼壓縮效率的基礎(chǔ)上,提高編解碼速度。H.264沒有煩瑣的選項,而是力求簡潔的“回歸基本”,44
AVS標(biāo)準(zhǔn)以當(dāng)前國際上最先進的MPEG-4AVC/H.264框架為基礎(chǔ),強調(diào)自主知識產(chǎn)權(quán),同時充分考慮了實現(xiàn)的復(fù)雜度。相對于MPEG-4AVC/H.264,AVS的主要特點有:
(1)8×8的整數(shù)變換與64級量化。
(2)亮度和色度幀內(nèi)預(yù)測都是以8×8塊為單位;亮度塊采用5種預(yù)測模式,色度塊采用4種預(yù)測模式。
(3)采用16×16、16×8、8×16和8×8共4種塊模式進行運動補償。
(4)在1/4像素運動估計方面,采用不同的四抽頭濾波器進行半像素插值和1/4像素插值。
(5)P幀可以利用最多2幀的前向參考幀,而B幀則采用前后各1個參考幀。
AVS是基于我國創(chuàng)新技術(shù)和部分公開技術(shù)的自主標(biāo)準(zhǔn),編碼效率比MPEG-2高2~3倍.與AVC相當(dāng),而且技術(shù)方案簡潔,芯片實現(xiàn)復(fù)雜度低,達到了第二代標(biāo)準(zhǔn)的最高水平;此外,AVS通過簡潔的一站式許可政策,解決了AVC專利許可問題的死結(jié),是開放式制定的國家,國際標(biāo)準(zhǔn),易于推廣。
同時,AVC僅是一個視頻編碼標(biāo)準(zhǔn),而AVS是一套包含系統(tǒng)、視頻、音頻、媒體版權(quán)管理在內(nèi)的完整標(biāo)準(zhǔn)體系,可為數(shù)字音視頻產(chǎn)業(yè)提供更全面的解決方案。AVS標(biāo)準(zhǔn)以當(dāng)前國際上最先進的MPEG-4AVC/H.45
11.Motion-JPEG2000標(biāo)準(zhǔn)
JPEG2000是JPEG的升級標(biāo)準(zhǔn),它提供了比JPEG更高效的壓縮效率,是針對靜止圖像提出的壓縮標(biāo)準(zhǔn)。ISO為了滿足對視頻圖像的壓縮要求,在JPEG2000中附加提出了Motion-JPEG2000,該補充的壓縮標(biāo)準(zhǔn)沿用了JPEG2000的各項優(yōu)越性,并且提出了對于視頻圖像壓縮的編碼和解碼標(biāo)準(zhǔn)。
JPEG2000以其特有的優(yōu)點彌補了現(xiàn)行JPEG標(biāo)準(zhǔn)的不足。離散小波變換算法中,圖像可以轉(zhuǎn)換成一系列可更加有效存儲像素模塊的子帶,因此,JPEG2000格式的圖像壓縮比可在現(xiàn)在的JPEG基礎(chǔ)上提高10%~30%,且壓縮后的圖像顯得更加細(xì)膩平滑。也就是說,在網(wǎng)上觀看采用JPEG2000壓縮的圖像時,不僅下載速率比采用JPEG格式的快近30%,而且品質(zhì)也將更好。對于目前的JPEG標(biāo)準(zhǔn),在同一個壓縮碼流中不能同時提供有損和無損壓縮,而在JPEG2000系統(tǒng)中,通過選擇參數(shù)能夠?qū)D像進行有損和無損壓縮,因此可滿足圖像質(zhì)量要求很高的醫(yī)學(xué)圖像、圖像庫等方面的處理需要。
現(xiàn)在,網(wǎng)絡(luò)上的JPEG圖像下載時是按“塊”傳輸?shù)?,因此只能逐行地顯示,而采用JPEG2000格式的圖像支持漸進傳輸,這就允許圖像按照所需的分辨率或像素精度進行重構(gòu),用戶根據(jù)需要,對圖像傳輸進行控制,在獲得所需的圖像分辨率或質(zhì)量要求后,便可終止解碼,而不必接收整個圖像的壓縮碼流。11.Motion-JPEG2000標(biāo)準(zhǔn)46
由于JPEG2000采用小波技術(shù),利用其局部分辨特性,因此,在不解壓的情況下,可隨機獲取某些感興趣的圖像區(qū)域(ROI)的壓縮碼流,對壓縮的圖像數(shù)據(jù)進行傳輸、濾波等操作。
隨著科技的發(fā)展,網(wǎng)絡(luò)已經(jīng)滲透到每個人的生活中。然而,受到網(wǎng)絡(luò)帶寬的限制,高質(zhì)量的圖像數(shù)據(jù)量很大,在網(wǎng)絡(luò)上的傳輸延遲也很大。因此,對于使用PC機、筆記本、掌上電腦或PDA,通過Modem接入因特網(wǎng)訪問圖像數(shù)據(jù)的用戶來說,允許根據(jù)需要選擇恰當(dāng)圖像分辨率進行瀏覽和傳輸是非常必要的。在軍事偵察和氣象預(yù)報中,由衛(wèi)星遙感得到的圖像必須通過遠距離無線信道傳輸,傳誤碼的出現(xiàn)不可避免。JPEG2000編碼器特有的碼流組織形式是輸出碼流具有有效抑制誤碼的能力。JPEG碼流通過無線衛(wèi)星通信信道發(fā)還給地面接收站后,地面接收站在解碼過程可以利用JPEG2000內(nèi)部的碼流組織形式來避免由于傳輸誤碼而造成的錯誤解碼。
此外,在安全確認(rèn),身份認(rèn)證及醫(yī)學(xué)領(lǐng)域,JPEG2000都有著
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度哈爾濱市住宅租賃合同范本
- 2025年度快速卷簾門系統(tǒng)采購安裝合同
- 2025年度回遷安置房租賃與買賣結(jié)合合同范本
- 2025年度農(nóng)產(chǎn)品加工企業(yè)員工勞動合同范本
- 2025年度土地承包經(jīng)營權(quán)出租合同示范文本
- 2025年度安全風(fēng)險評估與安保方案設(shè)計合同
- 2025年度大型企業(yè)集團員工培訓(xùn)服務(wù)合同
- 2025年婚后家暴離婚協(xié)議起草與審核服務(wù)合同
- 2025年國際貿(mào)易糾紛解決實訓(xùn)合同
- 2025年度婚姻家庭子女撫養(yǎng)權(quán)擔(dān)保合同
- 內(nèi)燃機車鉗工(中級)職業(yè)鑒定理論考試題及答案
- 長期處方管理規(guī)范-學(xué)習(xí)課件
- 高中英語外研版 單詞表 選擇性必修3
- 2024年人教版小學(xué)六年級數(shù)學(xué)(上冊)期末試卷附答案
- 2024-2025學(xué)年江蘇省南京鼓樓區(qū)五校聯(lián)考中考模擬物理試題含解析
- 標(biāo)準(zhǔn)作文稿紙模板(A4紙)
- 中小學(xué)校園突發(fā)事件應(yīng)急與急救處理課件
- 2024年山東省普通高中學(xué)業(yè)水平等級考試生物真題試卷(含答案)
- 2024年青海省西寧市選調(diào)生考試(公共基礎(chǔ)知識)綜合能力題庫匯編
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫及答案解析
- 廣州綠色金融發(fā)展現(xiàn)狀及對策的研究
評論
0/150
提交評論