第三章DVB-S系統(tǒng)信源編碼_第1頁
第三章DVB-S系統(tǒng)信源編碼_第2頁
第三章DVB-S系統(tǒng)信源編碼_第3頁
第三章DVB-S系統(tǒng)信源編碼_第4頁
第三章DVB-S系統(tǒng)信源編碼_第5頁
已閱讀5頁,還剩122頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第三章DVB-S系統(tǒng)3.1數(shù)字通信系統(tǒng)的基本知識

3.2DVB-S系統(tǒng)信源編碼

3.1數(shù)字通信系統(tǒng)的基本知識通信:指信息的傳輸與交換。通信的目的:傳遞消息中所包含的信息。消息(message):是物質(zhì)或精神狀態(tài)的一種反映,例如語音、文字、音樂、數(shù)據(jù)、圖片或活動圖像等。信息(information):是消息中包含的有效內(nèi)容。實現(xiàn)通信的方式和手段:非電的:如旌旗、消息樹、烽火臺…電的:如電報、電話、廣播、電視、遙控、遙測、因特網(wǎng)和計算機通信等。

單工通信:消息只能單方向傳輸?shù)墓ぷ鞣绞桨腚p工通信:通信雙方都能收發(fā)消息,但不能同時收發(fā)的工作方式全雙工通信:通信雙方可同時進行收發(fā)消息的工作方式

3.1.1

通信方式:單工、半雙工和全雙工通信并行傳輸和串行傳輸并行傳輸:將代表信息的數(shù)字信號碼元序列以成組的方式在兩條或兩條以上的并行信道上同時傳輸

優(yōu)點:節(jié)省傳輸時間,速度快:不需要字符同步措施 缺點:需要n條通信線路,成本高

串行傳輸:將數(shù)字信號碼元序列以串行方式一個碼元接一個碼元地在一條信道上傳輸

優(yōu)點:只需一條通信信道,節(jié)省線路; 缺點:速度慢,需要外加碼組或字符同步措施3.1.2數(shù)字通信系統(tǒng)主要性能指標有效性和可靠性有效性:指傳輸一定信息量時所占用的信道資源(頻帶寬度和時間間隔),或者說是傳輸?shù)摹八俣取眴栴}??煽啃裕褐附邮招畔⒌臏蚀_程度,也就是傳輸?shù)摹百|(zhì)量”問題。有效性:用傳輸速率和頻帶利用率來衡量。

碼元傳輸速率RB:定義為單位時間(每秒)傳送碼元的數(shù)目,單位為波特(Baud),簡記為B。式中T

表示一個碼元的持續(xù)時間(秒)

信息傳輸速率Rb:定義為單位時間內(nèi)傳遞的比特數(shù)或平均信息量,單位為比特/秒,簡記為b/s

,或bps

碼元速率和信息速率的關系

對于二進制數(shù)字信號:M=2,碼元速率和信息速率在數(shù)量上相等。

對于多進制,例如在八進制(M=8)中,若碼元速率為1200B,,則信息速率為3600b/s。頻帶利用率:定義為單位帶寬(1赫茲)內(nèi)的傳輸速率,即

或可靠性:常用誤碼率和誤信率表示。誤碼率誤信率,又稱誤比特率 在二進制中有η越大,ηb越大,有效性越好;采用多進制可以提高ηb解:

依題意

得系統(tǒng)的誤碼率

例1:

已知某八進制數(shù)字通信系統(tǒng)的信息速率為3000bit/s,在收端10分鐘內(nèi)測得出現(xiàn)18個錯誤碼元,試求該系統(tǒng)的誤碼率。

信道容量是指信道中信息無差錯傳輸?shù)淖畲笏俾?。編碼信道是一種離散信道,可以用離散信道的信道容量來表征。

離散信道容量

根據(jù)奈奎斯特(Nyquist)準則,帶寬為B的信道,所能傳送的信號最高碼元速率為2B波特(Baud)。因此,無噪聲離散信道的信道容量為

C=2Blog2L(bit/s)

3.1.3信道容量例2:一個四進制無噪聲數(shù)字信道,帶寬為3000Hz,求該信道的信道容量。解:C=2Blog2L=2×3000×log24=12000bit/s

3.2信源編碼壓縮的必要性以4:2:2信號格式為例,采用10比特編碼,標清信號的比特率達到270Mbit/s,因此要求信道提供135MHz的帶寬。信號的存儲困難,一個1GB容量的光盤,僅能存約半分鐘的標清電視數(shù)據(jù)。

HDTV系統(tǒng)中,一幀畫面1280×720點,24bit真彩色,60幀/s,每秒數(shù)據(jù)量:1280×720×3×60=166MB=1.33Gb目前數(shù)字傳輸能力,6MHz帶寬,只有30Mb/s的傳輸速率,需要壓縮比:1330/20=44.4結論:1)如果不降低數(shù)字電視數(shù)據(jù)量和數(shù)據(jù)碼率,就無法在普通的數(shù)據(jù)存儲設備有效地存儲數(shù)字電視信號;2)無法在適當?shù)男诺缼拑?nèi)有效地傳輸數(shù)字電視信號;

因此,要想降低數(shù)字電視的數(shù)據(jù)量和碼率,就需要對數(shù)字電視信號進行壓縮。通常,將對數(shù)字電視信號進行壓縮的過程稱為信源編碼。壓縮的可能性圖像數(shù)據(jù)的壓縮機理來自兩個方面:一是利用圖像中存在大量冗余度可供壓縮;二是利用人眼的視覺特性帶來的數(shù)據(jù)冗余。1.圖像數(shù)據(jù)的冗余度(幀內(nèi)和幀間)(1)空間冗余在一幅圖像中規(guī)則的物體和規(guī)則的背景都具有很強的相關性。例1靜止圖像信息的冗余

(相鄰像素間的空間冗余)例2活動圖像信息的冗余(相鄰幀間)圖像序列中不同幀之間存在相關性引起的時間冗余(2)時間冗余帆船在畫面中航行,前后兩幀圖像中只是帆船向前行駛了一段路程,背景基本不變,帆船也是時間相關的(3)結構冗余:圖像從大面積上看,存在著有規(guī)律的紋理結構,稱之為結構冗余。如太陽是圓的,樓房建筑多為長方形,人的身體具有對稱性等。

(4)知覺冗余:知覺冗余是指那些處于人們聽覺和視覺分辨力以下的視音頻信號,若在編碼時舍去這種信號,雖然產(chǎn)生一定失真,但并不能為人所感知。

視覺冗余

人眼的視覺效果是圖像質(zhì)量的最直接也是最終的檢驗標準,對于人眼難以識別的數(shù)據(jù)或對視覺效果影響甚微的數(shù)據(jù),都可認為是多余的數(shù)據(jù),可以省去。這些多余部分就是視覺冗余。4bit量化8bit量化空間分辨力

空間分辨力是指對一幅圖像相鄰像素的灰度和細節(jié)的分辨力,視覺對于不同圖像內(nèi)容的分辨力不同。對于靜止圖象,視覺具有較高的空間分辨力。對于活動圖象,視覺具有較低的空間分辨力,且隨著運動速度的提高而迅速下降。信源編碼的方框圖

消除空間與時間冗余消除知覺冗余降低結構冗余消除統(tǒng)計(熵)冗余幀內(nèi)預測幀間預測自適應預測運動補償預測K-L變換哈爾(Haar)變換離散余弦變換(DCT)沃爾什(Walsh)變換霍夫曼編碼算術編碼

MPEG標準

1988年,國際標準化組織(ISO)和國際電工委員會(IEC)共同組建了運動圖像專家組MPEG(MovingPictureExpertsGroup),對運動圖像的壓縮編碼標準進行了研究。

1992年和1994年分別通過了MPEG-1和MPEG-2壓縮編碼標準。針對不同的應用,MPEG現(xiàn)在已經(jīng)有了MPEG-1、MPEG-2、MPEG-3、MPEG-4、MPEG-7一系列標準。對高質(zhì)量的活動圖象、聲音實現(xiàn)壓縮主要用于廣播電視、活動圖象的壓縮編碼和解碼數(shù)據(jù)壓縮編碼方法的分類根據(jù)解壓重建后的圖像和原始圖像之間是否有誤差,可以分成兩類。

無損壓縮編碼(可逆壓縮編碼(ReversibleCoding))原始數(shù)據(jù)可完全從壓縮數(shù)據(jù)中恢復出來,即在壓縮和解壓縮過程中沒有信息損失。壓縮比2:1左右。有損壓縮編碼(不可逆壓縮編碼(Non-ReversibleCoding))

原始數(shù)據(jù)不能完全從壓縮數(shù)據(jù)中恢復出來,即恢復數(shù)據(jù)只是在某種失真度下的近似。如果視覺上能夠接受甚至覺察不出質(zhì)量的降低,則這種壓縮就是可行的。壓縮比1000:1。

根據(jù)壓縮機理的不同,數(shù)據(jù)壓縮編碼方法可以分成:預測編碼、變換編碼、熵編碼。1、預測編碼(PredictiveCoding)

(幀間編碼)

利用過去的樣值對當前樣值進行預測,然后當前樣值的實際數(shù)與預測值相減得到一個誤差值,只對這一預測誤差值進行編碼。編碼系統(tǒng)主要由加法器、預測器、量化器和編碼器構成。差分脈沖編碼調(diào)制(DPCM:DifferentialPulseCodeModulation)是預測編碼中最重要的一種編碼方法。

DPCM原理

DPCM原理任一像點的灰度值可由它前面出現(xiàn)的若干個像素進行估計(預測)數(shù)字圖像相鄰像素間存在較強的相關性

求出估計值與實際值的差值對差值進行量化、編碼、傳輸

設tk時刻的輸入信號取樣值為Xk;tk時刻前N個鄰近像素取樣序列為,現(xiàn)由此N個值估計,得估計值預測差值為,

對ek進行量化、編碼、傳輸可達到壓縮目的。

DPCM原理DPCM系統(tǒng)的性能決定于預測器與量化器的設計。DPCM系統(tǒng)的主要問題是存在誤碼擴散:若傳輸中產(chǎn)生誤碼,由于遞歸預測算法,對于幀間編碼會使誤差擴散到后續(xù)的若干幀中。注意:

因為靜止圖像前后幀空間位置對應像素完全一樣,簡單幀間預測對于靜止圖像畫面壓縮非常有效。存儲器存儲第一幀圖像數(shù)據(jù),其后連續(xù)幀可以反復讀出。對于活動圖像內(nèi)容,前后幀相應位置像素差值很大,量化后比特數(shù)仍然很大,壓縮效果不佳。

解決辦法:運動估計

(MotionEstimation)

運動補償塊效應(1)運動估計簡單說運動估計是對運動物體的位移作出估計。編碼圖象中的當前宏塊相對于參考圖象中的匹配宏塊所移動的距離和方向,就是運動矢量(MotionVector)。求運動矢量的過程稱為運動估計。abc當前幀后一幀運動矢量MV運動估計,找到匹配塊前一幀(2)運動補償最終預測圖象是用兩種類型的參數(shù)一起來表示:當前要編碼的圖象宏塊和參考圖象宏塊之間的差值;宏塊的運動矢量??紤]了運動估計而對圖像進行預測編碼稱為運動補償。2、變換編碼

變換編碼(TransformCoding)的基本思想是將在通常的空間域描寫的圖像信號變換到另外的向量空間(變換域)進行描寫,然后再根據(jù)圖像在變換域中系數(shù)的特點和人眼的視覺特性進行編碼。如將時域信號變換到頻域,因為聲音、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中。(1)一般來說圖像變換不是對整幅圖像一次進行,而是在存儲器中把一幅圖像分成許多像塊,然后依次將每個像塊內(nèi)的N×N個樣點同時送入變換器進行變換運算。(2)變換器把輸入的N×N點的像塊由原空間域變換到變換域中,映射成同樣大小的N×N點的變換系數(shù)矩陣,經(jīng)過變換后的系數(shù)矩陣更有利于壓縮。變換編碼流程(3)量化器用有限個值來表示變換后的系數(shù)矩陣,通過量化器舍棄一些小幅度的變換系數(shù)。(4)編碼器給量化器輸出的每一個符號指定一個二進制碼字,可以是定長碼也可以是變長碼。變換編碼流程變換編碼系統(tǒng)框圖分塊DCT變換量化編碼解碼反量化反DCT變換塊組合輸入數(shù)據(jù)接收輸出信道右圖為8×8DCT基圖像示意圖注:變換后的系數(shù)矩陣中,不同位置處的系數(shù)值對應不同空間頻率分量的大小,低頻分量處在左上角附近,高頻分量處在右下角附近。

變換之后需要對DCT系數(shù)進行量化,這時可利用人眼的視覺冗余性。可對系數(shù)矩陣左上角附近的系數(shù)進行細量化(量化比特數(shù)高)而對右下角附近的系數(shù)進行粗量化(量化比特數(shù)低),即對不同的DCT系數(shù)采用不同的量化間隔。不同的量化間隔DCT編碼是有損壓縮對圖像帶來失真的主要原因如下:(1)由于量化舍去高頻系數(shù)而使圖像輪廓產(chǎn)生模糊;(2)對某些系數(shù)采用粗量化引起圖像亮度緩變區(qū)在鄰近的兩個量化電平之間變化,造成顆粒狀的雜波;(3)像塊的劃分使相鄰像塊人為地造成亮度不連續(xù),即塊效應。例:把DCT變換后的系數(shù)按一定方式讀出。

Z形掃描游程編碼:(0,79),(1,-2),(0,-1),(0,-1),(0,-1),(2,-1),EOBZ形讀出:

3、游程編碼(RLC,RunLengthCoding)游程編碼的方法是將一維序列轉化為一個由二元數(shù)組(run,level)組成的數(shù)組序列,其中run表示連零的長度,level表示緊接在這串連零之后出現(xiàn)的非零值。當剩下的所有系數(shù)都為零時,用符號EOB(EndofBlock)來代表。

游程編碼(RLC,RunLengthCoding)注:游程編碼一般不直接使用,為了達到較好的壓縮效果,通常與其他編碼方法一起使用,如和正交變換一起使用。為解決連0的表達方式采用游程編碼。游程長度編碼(RLC)圖在量化的DCT交流(AC)系數(shù)中,將每一串連0系數(shù)與其后面的一個非0系數(shù)組成一個數(shù)組,并用一對符號表示:

符號1符號2

(游程長度Run,位長)(幅值)游程長度:非零系數(shù)前連0的個數(shù);位長為后續(xù)非“0”系數(shù)的編碼位長。

幅值:非零系數(shù)值。

DC和AC系數(shù)的統(tǒng)計量不一樣,它們采用不同的Huffman表。符號對由符號1和符號2組成。對于直流差分系數(shù),符號1中只有位長。符號2表示幅值,即不為0的AC系數(shù)值。其游程長度編碼結果:(25),(0,4)(10),(0,2)(3),(2,2)(-2),(0,2)(2),(7,1)(-1),(0,0)第一個數(shù)是直流(DC)系數(shù)。游程編碼使64個系數(shù)只需7對符號,用7個碼字表示即可。游程編碼后的熵編碼多用霍夫曼編碼(VLC)。編碼標準提供霍夫曼碼表,根據(jù)游程編碼得到的符號直接查表,得到相應的碼字。碼表是根據(jù)概率分布并對大量典型圖像素材進行統(tǒng)計制成的位長與DC差分值和AC系數(shù)對應表亮度和色度直流系數(shù)的Huffman碼表亮度交流系數(shù)的Huffman碼表色度交流系數(shù)的Huffman碼表幅度值的可變長二進制編碼表游程編碼后的熵編碼對符號1中的數(shù)據(jù),從亮度和色度的系數(shù)碼表查出霍夫曼編碼;符號2中的數(shù)據(jù)仍用自然二進數(shù)編碼,也稱可變長整數(shù)(VLI)編碼,碼字長度也是可變的;直流系數(shù)DC采用與相鄰像塊DC的差值編碼;對前面圖中的游程編碼結果進行熵編碼,結果是:11011001101110100111111110010101101111101001010壓縮比計算

以上由64個像點樣值編碼所得數(shù)據(jù)的總位數(shù)是47??捎贸闃游宦时硎緣嚎s程度,即用平均每個像點占用多少位來表示。對于此8×8像塊的抽樣位率計算如下:也可以用壓縮比CR來度量壓縮程度。本例按原圖象用8比特量化的8×8像塊計算,可得壓縮比為:4、熵編碼原理熵編碼(EntropyCoding)是一類無損編碼,編碼后的平均碼長接近信源的熵。

霍夫曼(Huffman)編碼:變長編碼,對出現(xiàn)概率大的信源符號分配較短的碼字,對出現(xiàn)概率小的信源符號分配較長的碼字,以獲得較短的平均碼長。

一、概率

概率通常是指某一事件發(fā)生的相對頻數(shù)。設信息源中有k個符號{a1,a2,...ak}從這組符號中任取n次符號,而在這n次選取的符號里,取得ai的次數(shù)為m,則當n很大時,比率m/n就稱為取出符號ai概率。用P(ai)表示,即

一、概率事件的概率總是正數(shù),并總是處在0與l之間,即

o<P(ai)<1。如果P(ai)=0,說明是不可能事件;

如果P(ai)=1,則說明是必然事件。

二、信息量所謂信息量,實際是對消息中所含信息多少的一種度量。消息中所含信息量的大小與消息發(fā)生的概率有密切關系。一件事發(fā)生的概率越小,越使人感到意外和驚奇,此消息所含的信息量就越大;若消息出現(xiàn)的概率P(ai)→0,其消息的信息量就趨于無窮大。當消息發(fā)生的概率P(ai)→l時,則說明是一個必然事件,其所含的信息量為零。

二、信息量在信息論中,消息所含的信息量I由下式表示

單位為比特。由該式可看出:當消息發(fā)生的概率P=1/2時,消息所含的信息量I=l比特;當P=1/4時,I=2比特。若要傳送8個等概率出現(xiàn)的消息之一,即P=1/8,I=3,至少需要三位二進制。這樣,所傳輸消息的信息量就與傳送所需要的最少二進制位數(shù)建立了一一對應關系。三、熵的概念設有2個編號為“1”的小球,編號為“1”的小球占總數(shù)6個球的1/3;有3個編號為“2”的小球,編號為“2”的小球占總數(shù)6個球的1/2;有1個編號為“3”的小球,編號為“3”的小球占總數(shù)6個球的1/6。求編號平均值方法一:求編號平均值方法二:三、熵的概念信源的平均信息量稱之為熵。設有n個信號電平a1,a2...an,其對應的概率分別為Pl,P2,…Pn,信號所攜帶的信息量分別是log(1/P1),log(1/P2)...,log(1/Pn)

比特,則熵便可由下式求出:三、熵的概念

即:

設信源輸出M個統(tǒng)計獨立的符號x1,x2,…,xM,它們出現(xiàn)的概率分別為P(x1),P(x2),…,P(xM),則每個符號所含信息量的統(tǒng)計平均值即離散信源的平均信息量為

H(x)=-(bit/符號)信源的平均信息量又稱“信源熵”??梢宰C明:最大信源熵發(fā)生在信源的每個符號等概獨立出現(xiàn)時,最大信源熵為Hmax(x)=log2M(bit/符號)例一個由字母A,B,C,D組成的字,對于傳輸?shù)拿恳粋€字母用二進制脈沖編碼,00代表A,01代表B,10代表C,11代表D,每個脈沖寬度為5ms。(1)不同的字母是等可能出現(xiàn)時,試計算傳輸?shù)钠骄畔⑺俾剩唬?)若每個字母的出現(xiàn)可能性分別為

試計算傳輸?shù)钠骄畔⑺俾省?/p>

解(1)每個字母的持續(xù)時間為2×5ms,所以字母傳輸速率為不同的字母等可能出現(xiàn)時,每個字母的平均信息量為

平均信息速率為(2)每個字母的平均信息量為

所以,平均信息速率為

三、熵的概念圖像信源編碼中:

信源的熵是壓縮編碼的一個理論極限,它表示無失真編碼所需的比特率的下限。

比特率是編碼表示一個像素所需的平均比特數(shù)。

編碼輸出的平均碼長要≥信源熵。

信源壓縮編碼的目的之一,是使平均碼長盡可能的接近信源的熵。平均碼長:m=20.25+20.25+20.20+30.15+40.10+40.05=2.45bit/符號熵:bit/符號編碼效率:

MPEG-1/MPEG-2的視頻結構

(1)視頻序列(VS)

視頻序列也稱圖像序列,它是隨機選取節(jié)目的一個基本單元。從節(jié)目內(nèi)容看,一個視頻序列大致對應于一個鏡頭,切換一個鏡頭,即表示開始一個新的序列。

(2)圖像組(GOP)

圖像組由幾幀連續(xù)圖像組成,簡稱為GOP。它是對編碼后的視頻碼流進行存取的基本單元。其第一幀總是I幀。大的圖像組包含10~15幀圖像。小圖像組只有2~3幀圖像。(3)圖像(P)

圖像是一個獨立的顯示單元,也是圖像編碼的基本單元。可分為IPB三種編碼圖像,分別對應三種壓縮編碼模式,即幀內(nèi)壓縮編碼(I幀編碼)前向預測編碼(P幀編碼)和雙向預測編碼(B幀編碼)。

(4)像條(SLICE)

像條由一系列連續(xù)的宏塊組成。就是行(5)宏塊(MB)

宏塊是運動估計的基本單元。運動估計以宏塊為單位得到最佳匹配宏塊的運動矢量。運動估計只對亮度數(shù)組進行,色差數(shù)組使用和亮度數(shù)組相同的運動矢量。

(6)塊

塊是DCT變換的基本單元。一幅圖像以亮度數(shù)據(jù)數(shù)組為基準被分成為若干個8×8像素的數(shù)組,簡稱為塊??梢允橇炼葔K或色差信號塊。

1234597116108124:2:0宏塊結構4:2:2宏塊結構4:4:4宏塊結構GOP1GOPSCGOP頭圖像1圖像2圖像3…圖像N圖像SC圖像頭條1條2條3…條m條SC條頭宏塊1宏塊2宏塊3…宏塊nY1宏塊編碼信息Y2Y3Y4C1C28×8系數(shù)塊序列層GOP層圖像層宏塊層像塊層序列SC序列擴展序列頭GOP2…序列EC0x000001B3視頻基本碼流結構MPEG標準中三種類型圖像I幀/P幀/B幀

I幀:幀內(nèi)編碼圖像,僅利用該幀圖像本身信息進行預測編碼,壓縮比不高;

幀內(nèi)預測編碼預測值由同一行前面的相臨像素和上面相臨行的相關像素來產(chǎn)生時,稱為二維預測。二維預測可去除空間冗余。預測精度越高,編碼效率越高。MPEG標準中三種類型圖像P幀:預測編碼圖像,根據(jù)前面最靠近的I幀或者另一個P幀進行預測,屬于前向預測;

由于使用運動補償,P幀比I幀壓縮更大,并可作為后面P/B幀的基準,會傳播誤碼。壓縮比大于I幀。B幀:雙向預測編碼圖像,它既用過去的幀作基準,也用后來的幀作基準,即前向和后向預測都有,預測精度較高。B幀壓縮最大,且不傳播誤碼;

I,P,B三種圖象的數(shù)據(jù)壓縮比:

2~5:1,5~10:1,20~30:1雙向預測B幀預測方式

I幀圖像:只由幀內(nèi)宏塊組成

P幀圖像:包含前向運動補償I或PB幀圖像:包含雙向運動補償I或P解碼時間標簽DTS(DecodingTimeStamp顯示時間標簽PTS(PresentationTimeStamp)MPEG-2碼流的解碼和顯示順序IBBPBBPIBBP傳輸流中的GOP結構傳輸幀序列與顯示幀序列不同MPEG-2傳輸層碼流分為:ES、PES、TS。ES(ElementaryStream):指只包含1個信源編碼器的數(shù)據(jù)流。即ES是編碼的視頻數(shù)據(jù)流,或編碼的音頻數(shù)據(jù)流,或其它編碼數(shù)據(jù)流的統(tǒng)稱。打包:為便于傳輸,實現(xiàn)時分復用,基本流ES必須“打包”,就是將順序、連續(xù)傳輸?shù)臄?shù)據(jù)流按一定的時間長度進行分割,分割的小段叫做“包”,因而打包也稱為分組。PES

(PacketizedElementaryStream):將ES流分組打包后,在每一個包前加包頭就構成了打包的基本流PES.(包頭用于區(qū)別不同性質(zhì)的ES的數(shù)據(jù)流識別碼,PTS和DTS)視頻PES一般一幀一個包,音頻PES一般一個包的數(shù)據(jù)量不超過64KB。多個打包后的數(shù)碼流再經(jīng)過復用器成為傳送流(TS流)。ES生成PESPES包頭信息中加入PTS(PresentationTimeStamp)和DTS(DecodeTimeStamp)用于視頻、音頻同步;同時加入數(shù)據(jù)流識別碼。打包器ESPESPES生成TS傳輸流是由一個或幾個不同的PES包經(jīng)傳輸復用器后組成傳輸流。TS流更適合在有干擾或誤碼的環(huán)境中傳輸。TS小包長度固定為188個字節(jié)。VPESTS復用

TS轉輸流APESDPES188B188B188B188BPES、PSI、SI調(diào)整字段包、PCRPID、計數(shù)器…視頻PES1音頻ES1數(shù)據(jù)流1打包器打包器視頻ES1音頻PES1節(jié)目復用器節(jié)目流播出視頻PES2音頻ES2數(shù)據(jù)流2打包器打包器視頻ES2音頻PES2傳輸復用器TS流數(shù)字電視碼流之間的層次關系多媒體圖象編碼壓縮國際標準多媒體圖象編碼壓縮國際標準靜態(tài)圖象壓縮標準JPEG視頻圖象壓縮標準MPEG面向對象通信的視頻圖象壓縮標準H.261(即P×64)P是參數(shù),1~30。傳輸率為64~384kbps。用于可視電話和視頻會議。為了適應各種為了在狹窄頻帶上實現(xiàn)高質(zhì)量的視頻圖象和高保真的聲音的傳遞。為了對復雜圖象(自然的具有連續(xù)灰度或連續(xù)色調(diào)的復雜的)進行壓縮。信道容量的數(shù)據(jù)傳輸,通過調(diào)整參數(shù)P來適應不同帶寬的信道,并提供交互控制。視頻圖象序列的幀內(nèi)圖象的壓縮編碼也常用JPEG壓縮標準面向通信的視頻圖象壓縮標準

H.263為了在傳輸率低于64kbps的情況下(如,模擬電話網(wǎng))傳輸視頻。JPEG標準的2類算法JPEG標準的2類算法JPEG標準定義了兩種相互獨立的算法:1、可逆編碼(無失真)。DPCM+熵編碼(哈夫曼/算術編碼)2、非可逆編碼(有失真)。DCT+DPCM+Z型掃描+熵編碼不常用 JPEG2000常用 JPEGJPEG標準之

基于DPCM的無失真編碼原始圖象數(shù)據(jù)DPCM預測熵編碼器哈夫曼或算術編碼無失真編碼器壓縮后的圖象數(shù)據(jù)優(yōu)點:無失真;容易用硬件實現(xiàn)缺點:壓縮比太低,只有約2∶1編碼表JPEG標準之

基本系統(tǒng)基于DCT的有失真編碼正向離散余弦變換FDCT量化器熵編碼器8×8塊源圖象數(shù)據(jù)壓縮后的圖象數(shù)據(jù)量化表編碼表編碼器MPEG-1的視頻壓縮編碼MPEG-1中視頻編碼的關鍵壓縮技術和H.261一樣,是DCT、運動補償和Huffman編碼。編碼器和解碼器的原理框圖也和H.261沒有區(qū)別。

MPEG-1的信源輸入格式是SIF(SourceInputFormat)。CCIR601格式的信源要轉換成SIF后進入MPEG-1編碼器,解碼器輸出也是SIF格式,顯示時要經(jīng)內(nèi)插,擴充為CCIR601格式。PAL/NTSC都作如此處理。SIF格式如表所示。SIF(525/625)格式

信號分量行數(shù)/幀象素數(shù)/行亮度(Y)240/288352色度(U)120/144176色度(V)120/144176

352×240352×288或每幀的分辨率為:MPEG-2與MPEG-1比較MPEG-1,數(shù)字電視標準,帶寬1.5Mbps,1993年發(fā)布。主要應用是VCD,它將圖象數(shù)據(jù)壓縮到1/25~1/200,聲音數(shù)據(jù)壓縮到1/65,并且圖象質(zhì)量還略優(yōu)于錄象帶。分辨率為352×240,播放頻率為30幀/秒MPEG-2,高清晰度數(shù)字電視標準。帶寬為3~100Mbps。典型應用為DVD和HDTV廣播。DVD采用可變速率1~10Mbps,速率大小根據(jù)圖象復雜程度和聲音多少而改變。分多個檔次,分辨率和播放頻率也隨之不同。DCT變換不僅可在幀內(nèi)進行,也可在場內(nèi)進行(1)MPEG-2是MPEG-1的兼容和擴展??蓮V泛用于多種速率和各種分辨率的情況。(2)在MPEG-2中,視頻序列可以是隔行掃描的,也可以是逐行掃描的,而在MPEG-1中視頻序列只能是逐行的。(3)在MPEG-2中圖像的色度格式還包括4:2:2和4:4:4格式,在MPEG-1中,圖像的色度格式是4:2:0。MPEG-2廣泛應用于DVD、SDTV和HDTV中。美國的ATSC歐洲的DVB日本的ISDB都已把MPEG-2作為信源編碼標準。我國制定的數(shù)字衛(wèi)星電視和數(shù)字有線電視的標準中,也已經(jīng)采用了MPEG-2標準。MPEG-2視頻部分MPEG-2標準規(guī)定了四種輸入圖像格式,稱為級(Levels),低級、主級、高1440級、高級,提供了靈活的信源格式。

MPEG-2按壓縮編碼方法劃分為:型(Profiles)共有五個型:簡單型、主型、高型、信噪比可分級型、空間可分級型。“級”與“型”的若干組合構成MPEG-2視頻編碼標準的子集:對某一輸入格式的圖像,采用特定集合的壓縮編碼工具,產(chǎn)生規(guī)定速率范圍內(nèi)的編碼碼流。在20種可能的組合中,目前有11種是已獲通過的,稱為MPEG-2適用點。H.261標準(簡稱為P×64)

的傳輸率P是參數(shù),1~30。傳輸率為64~384kbps。用于可視電話和視頻會議。為了適應各種信道容量的數(shù)據(jù)傳輸,通過調(diào)整參數(shù)P來適應不同帶寬的信道,并提供交互控制。當P=1或2時,碼率為64~128kbps。由于碼率太低,只能傳輸清晰度不太高的圖象,所以只適用于面對面的可視電話。當P≥6時,碼率384kbps,可傳輸清晰度良好的圖象,故可用于會議電視。圖像格式H.261標準的標準圖象格式352288176×144176×144176×14488×7288×72CIFQCIFYUVH.263與極低碼率視頻編碼技術為了在帶寬低于64kbps的情況下(如,模擬電話網(wǎng))傳輸視頻,實現(xiàn)可視電話通信。極低碼率視頻編碼技術:是編碼后的數(shù)據(jù)率低于64kbps的各種編碼技術的總稱。H.263就是極低碼率視頻編碼標準之一。H.263H.261和H.263

數(shù)據(jù)率比MPEG-1,-2更低的原因對H.261和H.263來說,每2幀之間,有3幀不傳(B圖);計算沒有傳輸?shù)腂圖時,H.261和H.263用簡單的插值法;而在MPEG-1,-2中,同P圖的編碼一樣,用基于運動補償?shù)念A測方法。盡管有相同點:在計算P圖時,都用基于運動補償?shù)念A測方法。但是下面2條不同點導致H.261和H.263的數(shù)據(jù)率更低

:JPEG和MPEG的差別MPEG視頻壓縮技術是針對運動圖像的數(shù)據(jù)壓縮技術。為了提高壓縮比,幀內(nèi)圖像數(shù)據(jù)和幀間圖像數(shù)據(jù)壓縮技術必須同時使用。MPEG通過幀運動補償有效地壓縮了數(shù)據(jù)的比特數(shù),它采用了三種圖像,幀內(nèi)圖、前向預測圖和雙向預測圖,有效地減少了冗余信息。對于MPEG來說,幀間數(shù)據(jù)壓縮、運動補償和雙向預測,這是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT幀內(nèi)圖像數(shù)據(jù)壓縮編碼。MPEG-4標準的產(chǎn)生背景

-------引例足球比賽轉播:球賽現(xiàn)場聲音

和解說員的聲音MPEG-4標準的產(chǎn)生背景

問題1未來的視聽系統(tǒng)是以嵌入式個人計算機為核心的軟件編碼的開放式系統(tǒng),電視也將由“純線性”推進到“非線性”階段。例如,迅速發(fā)展的計算機非線性編輯、交互式計算機游戲圖象顯示、交互式視頻點播(VOD)、交互式控制視音頻數(shù)據(jù)庫中的素材等,都表明電視從“純線性”到“非線性”的發(fā)展趨勢。為了增強非線性電視的交互性、靈活性,提高編碼效率,就需要制定一個對圖象內(nèi)容中的音視頻對象(AVO)進行編碼、組織和傳輸?shù)臏蕜t。視聽系統(tǒng)發(fā)展趨勢--------非線性和交互性MPEG-4標準的產(chǎn)生背景

問題1MPEG-1、MPEG-2及MHEG都不能解決非線性和交互性的問題MPEG-1和MPEG-2都以音頻幀、視頻幀為編碼對象,沒有交互功能(如果說有,也只是在“幀”這一級有)。MPEG-1和MPEG-2的音頻幀、視頻幀以及MHEG中的大范圍媒體對象,都不能再細分為更小的AV對象。故圖象中的音視頻對象(AVO)所組成的AV場景不能與人進行交互。MPEG-4標準的產(chǎn)生背景

問題2較窄帶寬上的視頻應用MPEG-1的數(shù)據(jù)率大約1.5Mbps,MPEG-2的數(shù)據(jù)率大約3~100Mbps隨著網(wǎng)絡的普及,基于網(wǎng)絡的音視頻多媒體應用越來越廣。在較窄帶寬上的音視頻應用產(chǎn)生了一個很大的市場。傳統(tǒng)編碼器------

編碼對象是幀(音頻幀、視頻幀)若干音頻幀若干視頻幀MPEG-4編碼器------

編碼對象是AO和VO將若干視頻幀中的對象分開MPEG-4的特點MPEG4的重要特點:(1)基于內(nèi)容的普遍性。MPEG4能夠直接選取音頻、視頻內(nèi)容進行編碼,并對其靈活地進行控制和顯示,用戶可以自行選擇場景中的物體的解碼質(zhì)量,進行家庭影視節(jié)目制作和編輯。(2)以AV為對象,增強了交互性和擴展性,從而提高了交互應用的靈活性。(3)將各種功能應用在自然的和合成的AV對象上,增強了節(jié)目編輯制作能力。(4)MPEG4在誤碼環(huán)境中,尤其是在惡劣誤碼條件下的低比特率應用中的抗誤碼性,有利于節(jié)目制作、分配和顯示。MPEG-4----傳統(tǒng)、內(nèi)容編碼的統(tǒng)一運動補償紋理DCT比特流運動補償紋理(DCT)比特流形狀(反DCT)(傳統(tǒng)編碼,類似于MPEG-1、MPEG-2和H.261、H.263)基于內(nèi)容的編碼通用MPEG-4內(nèi)核編碼器MPEG-4VLBV內(nèi)核編碼器MPEG-4和MPEG-1、-2的區(qū)別MPEG-4的應用領域MPEG4在多媒體傳輸、多媒體存儲等領域具有廣泛應用:(1)低比特率下的多媒體通信,如視頻電話、視頻電子郵件、移動多媒體通信、電子新聞等。這些應用對傳輸速率要求較低,在4.8~64kbit/s之間,分辨率為176×144。MPEG4利用很窄的帶寬,通過幀重建技術壓縮和傳輸數(shù)據(jù),以最少的數(shù)據(jù)量獲得最佳的圖像質(zhì)量(2)互聯(lián)網(wǎng)上的視頻流與可視游戲,如網(wǎng)上電影。(3)數(shù)字電視、動態(tài)圖像、萬維網(wǎng)(WWW)。(4)實時多媒體監(jiān)控。(5)基于內(nèi)容存儲和檢索的多媒體系統(tǒng)。(6)基于面部表情模擬的虛擬會議。(7)DVD上的交互多媒體應用。MPEG-4的常見應用(軟件)DIVX-MPEG-4影碟網(wǎng)上MPEG-4電影用MPEG-4技術來編碼、壓縮一部DVD,只需要兩張CD-ROMMPEG-4出臺后1年內(nèi),在計算機上播放DIVX-MPEG4文件的方法有兩種:1、用DivxPlayer等專門的播放軟件來播放;2、Windows自帶的媒體播放機中安裝一個MPEG4插件(Divx)?,F(xiàn)在很多播放器都已經(jīng)支持MPEG-4。MPEG-4格式的ASF流文件,或者AVI文件MPEG-4的常見應用(硬件)日本夏普公司推出的應用在互聯(lián)網(wǎng)上的數(shù)字攝像機VN-EZ1。這臺網(wǎng)絡攝像機利用MPEG4算法,可把影像文件壓縮為ASF(高級流格式),然后用戶只要利用微軟公司的MediaPlayer播放程序,就可以直接在電腦上進行播放。在移動多媒體通信領域,摩托羅拉公司,用手機看電影的技術。通過GPRS(通用數(shù)據(jù)包無線業(yè)務)移動數(shù)據(jù)網(wǎng)絡傳輸MPEG4格式圖像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論