第四章數(shù)字電視基礎(chǔ)_第1頁
第四章數(shù)字電視基礎(chǔ)_第2頁
第四章數(shù)字電視基礎(chǔ)_第3頁
第四章數(shù)字電視基礎(chǔ)_第4頁
第四章數(shù)字電視基礎(chǔ)_第5頁
已閱讀5頁,還剩207頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第四章數(shù)字電視基礎(chǔ)4.1數(shù)字電視技術(shù)概述

4.2音、視頻信號的數(shù)字化4.3數(shù)字電視標(biāo)準(zhǔn)4.1數(shù)字電視技術(shù)概述從70年代開始,隨著大規(guī)模集成電路、大容量半導(dǎo)體存儲器和計算機技術(shù)的飛速發(fā)展,數(shù)字技術(shù)被越來越多的用于模擬電視信號的處理,進入了模擬電視數(shù)字化的新階段。這一階段以電視演播室的數(shù)字化為先導(dǎo)、數(shù)字電視制式轉(zhuǎn)換器、幀同步機等相繼問世。數(shù)字電視代表著現(xiàn)代電視技術(shù)的發(fā)展潮流,日益成為現(xiàn)代電視系統(tǒng)的主流。世界電視技術(shù)發(fā)展經(jīng)歷了一下三個階段:第一代黑白電視,第二代模擬彩色電視,第三代高清晰度電視。下一頁返回4.1數(shù)字電視技術(shù)概述4.1.1什么是數(shù)字電視

數(shù)字電視最早誕生在90年代的德國,德國的ITT公司推出了世界上第一臺數(shù)字彩色電視機,但這臺數(shù)字彩色電視機成本很高。原因是它使用了幀存儲器,當(dāng)時集成電路的生產(chǎn)技術(shù)比較落后,電路密度很低,所以成本很高。這臺數(shù)字彩色電視機功能很簡單,但在技術(shù)上已達(dá)到了非常高的水平,如,用數(shù)字濾波技術(shù)進行Y/C分離和場閃爍處理。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述在此基礎(chǔ)上,后來人們發(fā)明了畫中畫(PIP)電視,而后又發(fā)明了插行電視機,或叫改善清晰度電視機IDTV(Improved-DefinitionTelevision),也就是現(xiàn)在的倍行、倍場等電視機。這些電視機都是只對視頻信號做一些很簡單的數(shù)字技術(shù)處理,圖像質(zhì)量并沒有明顯提高,但當(dāng)時被人們認(rèn)為是數(shù)字電視,我們國家也把這種電視機定義為數(shù)字電視機,并制訂了數(shù)字電視機標(biāo)準(zhǔn),這個標(biāo)準(zhǔn)一直沿用到2000年。國外的全數(shù)字信號電視機早已誕生,并于上個世紀(jì)90代就已開始進行數(shù)字信號廣播,如DVB、HDTV等。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述數(shù)字電視的發(fā)展,最早要追溯到60多年前的傅立葉變換理論,它奠定了數(shù)字電視技術(shù)的基礎(chǔ)。MPEG信源編碼技術(shù)標(biāo)準(zhǔn)的誕生,標(biāo)志著數(shù)字電視技術(shù)已經(jīng)基本成熟。MPEG信源編碼技術(shù)中最重要的兩項分別為:霍夫曼編碼(Huffmancoding),差動脈沖編碼調(diào)制(DPCM)。數(shù)字電視技術(shù)的基礎(chǔ)是:模數(shù)轉(zhuǎn)換A/D(Analog-to-DigitalConverter)和編碼(Coding)技術(shù)。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述什么是數(shù)字電視呢?“數(shù)字電視”的含義并不是指具體的電視機,而是指電視信號的處理、傳輸、發(fā)射和接收過程中使用數(shù)字信號的電視系統(tǒng)或電視設(shè)備。具體過程為:電視臺發(fā)出的圖像及聲音信號,經(jīng)數(shù)字壓縮和數(shù)字調(diào)制后,形成數(shù)字電視信號,由衛(wèi)星、地面無線廣播或有線電纜等方式傳送出去,由數(shù)字電視接收后,通過數(shù)字解調(diào)和數(shù)字音、視頻解碼處理還原出原來的圖像及伴音。在整個過程中沒有D/A和A/D轉(zhuǎn)換,僅在顯像管激勵終端和揚聲器推動終端用D/A轉(zhuǎn)換還原出負(fù)極性圖像信號和正弦波音頻信號;因為全過程均采用數(shù)字技術(shù)處理,因此,信號損失小,接收效果好。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述4.1.2數(shù)字電視的優(yōu)點傳統(tǒng)的模擬電視廣播存在一系列問題與缺陷,不能滿足人們對高品質(zhì)視聽生活的不斷追求。主要缺點如下:

1)模擬電視圖像清晰度差,存在亮色干擾、大面積閃爍現(xiàn)象,節(jié)目源不能多次復(fù)制。

2)模擬電視帶寬受限很大,模擬PAL制電視在8MHz帶寬內(nèi)只能傳送1路模擬視頻和模擬音頻信號,由于同頻及鄰頻干擾,增加新頻道難度很大。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述

3)模擬電視抗干擾能力差,接力傳輸產(chǎn)生噪聲使信噪比不斷惡化,圖像損傷越來越嚴(yán)重,不能實現(xiàn)遠(yuǎn)距離傳播。

4)模擬電視穩(wěn)定度及可靠性差,存在時域混疊、調(diào)整復(fù)雜、不便于集成及不易實現(xiàn)自動控制等缺點。數(shù)字電視具有以下優(yōu)點:

1)采用數(shù)字傳輸技術(shù),可提高信號的傳輸質(zhì)量,不會產(chǎn)生噪聲累積,信號抗干擾能力大大增強,接收端幾乎能無失真的復(fù)原。

2)彩色逼真,無串色,不會產(chǎn)生信號的非線性和相位失真的累積。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述

3)可實現(xiàn)不同分辨率等級(SDTV、HDTV)的接收,適合大屏幕及各種顯示器。

4)可移動接收,無重影。

5)可在一個頻道上傳播4-8路SDTV節(jié)目,可實現(xiàn)多路數(shù)字環(huán)繞立體聲,同時還有多語種功能。

6)易于實現(xiàn)加密/解密和加擾/解擾處理,便于開展各類收費業(yè)務(wù),這是數(shù)字電視的重要增值點,也是數(shù)字電視快速滾動式發(fā)展的基礎(chǔ)。

7)利用數(shù)字技術(shù)(如三維濾波、空間幾何變換)產(chǎn)生各種特技形式,增強了節(jié)目的藝術(shù)效果和視覺沖擊力。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述

8)具有可擴展性、可分級性和互操作性,便于在各類通信信道網(wǎng)絡(luò)中傳輸。4.1.3數(shù)字電視的發(fā)展(了解)1.國際發(fā)展概況數(shù)字電視技術(shù)最先出現(xiàn)在歐洲,自20世紀(jì)80年代開始,歐洲幾個電視技術(shù)較先進的國家,如德國、法國、英國,都開始研究數(shù)字電視技術(shù)。德國的ITT公司推出了世界上第一臺數(shù)字視頻處理彩色電視機。MAC1、MAC2、MAC3(多模上一頁下一頁返回4.1數(shù)字電視技術(shù)概述 擬分量分時傳輸技術(shù))等都是在歐洲誕生的。隨后開始了第三代數(shù)字衛(wèi)星電視節(jié)目廣播,當(dāng)時數(shù)字技術(shù)已十分先進,它已經(jīng)能夠同時傳播一路標(biāo)準(zhǔn)清晰度電視節(jié)目和多路伴音廣播,并于1992年通過衛(wèi)星進行了巴賽羅納奧運會的實況轉(zhuǎn)播。最早提出高清晰度電視這個概念的是日本,1984年日本NHK(日本廣播協(xié)會)宣布了世界上第一個高清晰度研究方案,首先在衛(wèi)星廣播中采用了模擬調(diào)頻技術(shù)的MUSE(多重亞抽樣編碼)系統(tǒng),并于1988年開始了漢城奧運會試播。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述

1990年美國的通用儀器公司(GeneralInstrument,GI)在電視傳播信號的數(shù)字壓縮方面取得了轟動世界的突破,實現(xiàn)了高清晰度電視廣播頻寬不超過6MHz的目標(biāo),這預(yù)示著美國全數(shù)字式HDTV電視研究的初步成功,同時也使美國在高清晰度電視技術(shù)上后來者居上,一舉超過了日本和歐洲。1998年11月,11家電視臺同時進行HDTV地面廣播。荷蘭在2006年底開始回收模擬頻譜,成為全球首個全數(shù)字電視國家。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述法國在西歐國家來說算是數(shù)字電視起步相對較晚的國家,其數(shù)字地面廣播平臺直到2005年才正式開播(英國為1998、德國2002、意大利為2003)。英國在2007年3月宣布回收模擬頻道,07年10月,一個稱為Cumbria的小鎮(zhèn)率先關(guān)閉模擬電視,直到2012年回收模擬頻譜工作。2.國內(nèi)發(fā)展概況我國數(shù)字電視的發(fā)展相比于國際比較落后,1995年中央電視臺開始利用數(shù)字電視系統(tǒng)播出加密頻道,利用衛(wèi)星向上一頁下一頁返回4.1數(shù)字電視技術(shù)概述有線電視臺傳送4套加密電視節(jié)目。1998年6月,我國第一臺自主研發(fā)的HDTV樣機問世,并于同年9月在中央電視塔進行HDTV節(jié)目試播,1999年10月1日成功進行50年國慶閱兵直播。2003年我國啟動廣播電視數(shù)字化,2005年開展了數(shù)字衛(wèi)星直播業(yè)務(wù)。2015年我國將停止模擬電視播出,實現(xiàn)數(shù)字電視有線、衛(wèi)星和無線的全國覆蓋。4.1.4數(shù)字電視的核心技術(shù)上一頁下一頁返回4.1數(shù)字電視技術(shù)概述1.信源編解碼技術(shù)所謂信源是指字、符號、圖形、圖像、音頻、視頻、動畫等各種數(shù)據(jù)。信源編解碼技術(shù)包括視頻壓縮編解碼和音頻壓縮編解碼技術(shù)。為什么要壓縮編解碼?如要顯示1920×1080i的高清節(jié)目圖像,其數(shù)字化后的碼率在傳輸中高達(dá)995Mbit/s,這比現(xiàn)行模擬電視的傳輸信息量大得多。因而高清數(shù)字電視的圖像不能直接傳輸,要對電視信號進行數(shù)字壓縮編碼。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述信源編碼的主要任務(wù)是解決圖像信號的壓縮和保存問題。在數(shù)字電視的視頻壓縮編解碼標(biāo)準(zhǔn)方面,國際上統(tǒng)一采用了MPEG2(活動圖像專家組)標(biāo)準(zhǔn)。在音頻壓縮編解碼方面,歐洲、日本采用了MPEG2標(biāo)準(zhǔn);美采用杜比AC-3標(biāo)準(zhǔn)。2.信道編碼技術(shù)經(jīng)過信源編碼產(chǎn)生的節(jié)目碼流,要通過傳輸媒介(傳輸信道)才能到達(dá)接收端。傳輸信道主要有三種:衛(wèi)星、有線和地面信道。通常,編碼碼流不能直接通過傳輸信道進行傳上一頁下一頁返回4.1數(shù)字電視技術(shù)概述輸,而要經(jīng)過各種處理,使之適合在規(guī)定信道中傳輸。通信原理上,這種處理稱為信道編碼與調(diào)制。信號經(jīng)過任何信道傳輸都會產(chǎn)生失真,這些失真導(dǎo)致接收端數(shù)字信號的誤碼(接收端1和0的錯誤判決)。為了克服傳輸過程中的誤碼,針對不同的傳輸信道,必須設(shè)計不同的信道編碼方案和調(diào)制方案。數(shù)字電視信道編碼及調(diào)制解調(diào)的目的是通過糾錯編碼、網(wǎng)格編碼、均衡技術(shù)等提高信號的抗干擾能力。例如數(shù)字電視系統(tǒng)采用RS編碼或卷積碼進行信道編碼。其原理如下:上一頁下一頁返回4.1數(shù)字電視技術(shù)概述數(shù)字彩色信號在傳輸過程中,一般不是按電視機的掃描順序來傳送信號的,因為如果信號按順序傳送,信號在傳輸過程中出錯時,則電視畫面上會在某個地方集中出現(xiàn)一大片馬賽克,使人看起來非常不舒服;如果信號不按順序傳送,而是按某種分布規(guī)律來傳送,同樣出錯時,馬賽克會被均勻地散布在整個畫面上,使人可以接受。這種錯位傳輸信號的方法稱為RS編碼或卷積碼。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述信道編碼的要求

(1)增加盡可能少的數(shù)據(jù)率而可獲得較強的檢錯和糾錯能力,即編碼效率高,抗干擾能力強;

(2)傳輸通道對于傳輸?shù)臄?shù)字信號內(nèi)容沒有任何限制;

(3)傳輸信號的頻譜特性與傳輸信道的通頻帶有最佳的匹配性;

(4)編碼信號內(nèi)包含有正確的數(shù)據(jù)定時信息和幀同步信息,以便接收端準(zhǔn)確地解碼;上一頁下一頁返回4.1數(shù)字電視技術(shù)概述

(5)編碼的數(shù)字信號具有適當(dāng)?shù)碾娖椒秶?/p>

(6)發(fā)生誤碼時,誤碼的擴散蔓延小。 其中,最主要的可概括為兩點。第一,附加一些數(shù)據(jù)信息以實現(xiàn)最大的檢錯糾錯能力,這就涉及到差錯控制編碼原理和特性。其二,數(shù)據(jù)流的頻譜特性要適應(yīng)傳輸通道的通頻帶特性,以求信號能量經(jīng)由通道傳輸時損失最小,有利于載波噪聲比(載噪比,C/N)的提高,發(fā)生誤碼的可能性小。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述4.1.5數(shù)字電視系統(tǒng)的組成數(shù)字電視系統(tǒng)的組成如圖4-1所示。發(fā)端由攝像機產(chǎn)生彩色電視圖像、音頻信號,經(jīng)A/D變換后,變?yōu)閿?shù)字音、視頻信號送入信源編碼中。信源編碼的目的是對圖像和音頻數(shù)據(jù)進行壓縮,去掉信號中的冗余部分,降低傳輸碼率。然后,壓縮后的數(shù)字視、音頻數(shù)據(jù)信號送入傳輸流復(fù)用,(傳輸流復(fù)用完成多套節(jié)目復(fù)用功能)。然后,送入信道編碼和調(diào)制器中,包括糾錯編碼和各種信號處理以及數(shù)字調(diào)制的功能,提高信號的抗干擾能力。因為數(shù)據(jù)碼流經(jīng)長距離傳輸后不可避免會混入噪聲而發(fā)生誤碼。上一頁下一頁返回4.1數(shù)字電視技術(shù)概述 經(jīng)編碼和調(diào)制后的信號再經(jīng)輸出接口電路送入傳輸線路。遠(yuǎn)距離傳輸線路,可以采用數(shù)字光纖、

數(shù)字衛(wèi)星,也可以采用數(shù)字微波線路,以接力傳輸方式,站與站的距離可達(dá)50公里。收端的過程與發(fā)端相反,接收端通過輸入接口電路把信號送入信道解碼和數(shù)字解調(diào)器,經(jīng)數(shù)字解調(diào)和信道解碼可糾正由傳輸所造成的誤碼,然后將信號送入解多路復(fù)用,最后再分別送入視頻、音頻解壓縮處理電路中,還原成模擬的視頻、音頻信號。返回上一頁4.2音視頻信號的數(shù)字化彩色模擬電視信號的數(shù)字化一般采用脈沖編碼調(diào)制(PCM)方式,又稱為編碼器,包括采樣、量化和編碼3個過程,是產(chǎn)生數(shù)字電視信號的主要方法。模擬信號數(shù)字化框圖如圖4-2所示,其中fc為濾波器的截止頻率,fs為取樣頻率。取樣是將時間上連續(xù)的模擬信號轉(zhuǎn)變?yōu)闀r間離散的信號。量化是將幅度連續(xù)信號轉(zhuǎn)換為幅度離散的信號。編碼是按照一定的規(guī)律,將時間和幅度上離散的信號編成二進制或多進制代碼。PCM編碼如加圖4-3所示。4.2.1取樣下一頁返回4.2音視頻信號的數(shù)字化1.取樣定理(奈奎斯特定理)如果對一個最高頻率為f

m的時間連續(xù)信號f(t)進行等時間間隔取樣,取樣時間間隔(取樣周期)為Ts,取樣頻率為fs=1/Ts,當(dāng)取樣頻率滿足 時,通過這些離散的樣點值可以不失真地恢復(fù)出原來的模擬信號。根據(jù)取樣定理

fs

≥2fm

(4.1)上一頁下一頁返回4.2音視頻信號的數(shù)字化為便于D/A后還原信號,根據(jù)實驗有:

fS≥2.2fm

(4.2)2.取樣結(jié)構(gòu)的選擇取樣結(jié)構(gòu)是指取樣點在空間與時間上的相對位置,有正交結(jié)構(gòu)和行交叉結(jié)構(gòu)等。在數(shù)字電視中一般采用正交結(jié)構(gòu),如圖4-3(a)所示。這種結(jié)構(gòu)在圖像平面上沿水平方向取樣點等間隔排列,沿垂直方向取樣點上下對齊排列,這樣有利于幀上一頁下一頁返回4.2音視頻信號的數(shù)字化 內(nèi)和幀間的信號處理。圖4-3(b)所示為行交叉結(jié)構(gòu),每行內(nèi)的取樣點數(shù)為整數(shù)加半個。CCIR(國際無線電咨詢委員會)601號建議要求采用分量信號Y、U、V進行編碼壓縮。在對數(shù)據(jù)壓縮之前,必須對分量信號進行正交抽樣。Y:U:V抽樣點結(jié)構(gòu)可分為三種:4:4:4;4:2:2;4:2:0,如圖4-4所示。圖4-4(a)為4:4:4采樣點結(jié)構(gòu),該結(jié)構(gòu)中每一個抽樣點都有亮度信號Y和兩個色差信號U、V;圖4-4(b)為4:2:2上一頁下一頁返回4.2音視頻信號的數(shù)字化 采樣點結(jié)構(gòu),該結(jié)構(gòu)中每一個抽樣點都有亮度信號Y,而在行方向每四個亮度Y樣點才分別有兩個色差信號U、V樣點。圖4-4(c)為4:2:0樣點結(jié)構(gòu),該結(jié)構(gòu)中每一個抽樣點都有亮度信號Y,而在上、下兩行每四個亮度Y樣點才分別有一個色差信號U、V樣點。3.取樣頻率的選擇在數(shù)字電視中,亮度信號取樣頻率的選擇應(yīng)該從以下4個方面考慮。(1)首先應(yīng)該滿足取樣定理,即取樣頻率應(yīng)該大于視頻帶寬的2倍。上一頁下一頁返回4.2音視頻信號的數(shù)字化(2)為保證取樣結(jié)構(gòu)正交,取樣頻率為行頻fH的整數(shù)倍,即(3)亮度信號取樣頻率的選擇還必須兼顧不同的掃描格式?,F(xiàn)行的掃描格式主要有625行/50場和525行/60場兩種,它們的行頻分別為15625Hz和15734.265Hz,其最小公倍數(shù)是2.25MHz,也就是說取樣頻率應(yīng)是2.25MHz的整數(shù)倍。即:

fs=m×2.25MHz上一頁下一頁返回4.2音視頻信號的數(shù)字化在CCIR601建議中,取m=6,則亮度信號取樣頻率為:

fs=13.5MHz在4∶2∶2格式中,色差信號U和V的取樣率均為亮度信號取樣頻率的一半,即:在4∶4∶4格式中,色差信號U和V的取樣率與亮度信號取樣頻率相同,即上一頁下一頁返回4.2音視頻信號的數(shù)字化在4∶2∶0格式中,色差信號U和V的取樣頻率均為亮度信號取樣頻率的四分之一,即:4.不壓縮時碼率的計算碼率=一幀圖像樣點數(shù)×每樣點比特數(shù)×每秒幀數(shù)(25Hz);一幀圖像樣點數(shù)=每行有效樣點數(shù)×一幀圖像有效行數(shù);對DVD圖像格式計算如下:(1)對Y信號計算一行樣點數(shù)=采樣頻率/行頻=13.5MHz/15.625kHz=864上一頁下一頁返回4.2音視頻信號的數(shù)字化一行有效樣點數(shù)=864×η=864×0.83=720(η為水平回掃率,即表示去掉行消隱后的有效樣點)一幀有效行數(shù)=625-50=575(即表示去掉消隱后的有效行數(shù),取576)一幀圖像樣點數(shù)=720×576=414720Y信號速率(碼率)為720×576×8bit×25Hz=82.944Mbit/s。(2)對U、V信號計算若按Y:U:V=4:2:2抽樣,U、V信號的速率計算如下:上一頁下一頁返回4.2音視頻信號的數(shù)字化U信號速率為

360×576×8bit×25Hz=41.472Mbit/sV信號速率為

360×576×8bit×25Hz=41.472Mbit/s合計為165.9Mbit/s。這種方法算出的數(shù)據(jù)速率不包括行、場消隱期間的樣點數(shù)據(jù)。如按MPEG-2ML@MP標(biāo)準(zhǔn)壓縮后的速率為8.448Mbit/s,則壓縮比約為20:1,大大節(jié)省了碼率。4.2.2量化上一頁下一頁返回4.2音視頻信號的數(shù)字化量化是把幅度上連續(xù)變化的信號變?yōu)槎M制離散信號。它相當(dāng)于用“四舍五入”的方法,把每一個連續(xù)量歸為某一臨近的整數(shù),它包括均勻量化和非均勻量化兩種方式。1.均勻量化均勻量化是指在整個量化范圍內(nèi),量化間距均相等。設(shè)量化的級數(shù)為M則(4.3)其中A為信號幅度,△A為量化間距。若采用二進制編碼,所需比特數(shù)為n,則:

M=2n。(4.4)上一頁下一頁返回4.2音視頻信號的數(shù)字化2.均勻量化時的信噪比(1)量化噪聲功率Nq

(4.5)從4.5式分析,量化間隔△A越小,量化誤差引起的失真功率也越小。(2)電視信號(單極性信號)的量化信噪比 (4.6)上一頁下一頁返回4.2音視頻信號的數(shù)字化用分貝表示: (4.7)結(jié)論:量化比特數(shù)n每增加1bit,則信噪比上升6dB;反之,每下降1bit,信噪比降低6dB。(3)聲音信號(雙極性信號)量化信噪比設(shè)聲音信號的最大幅度為A,它在+A到﹣A范圍內(nèi)變化。對它均勻量化成N級,有:上一頁下一頁返回4.2音視頻信號的數(shù)字化2A=N×△A

N=2n

(以二進制表示)量化信噪比:用分貝表示:

3.非均勻量化上一頁下一頁返回4.2音視頻信號的數(shù)字化由前述可知,電視信號的量化信噪比為: (4.8)聲音信號量化信噪比為: (4.9)

由上可見,當(dāng)均勻量化間距△A固定時,A上升,量化信噪比上升;反之信噪比下降。解決的辦法應(yīng)使量化間隔上一頁下一頁返回4.2音視頻信號的數(shù)字化 △A隨輸入信號幅度A而變化。即大信號時粗量化(加大△A),小信號時細(xì)量化(減小△A),也就是采用非均勻量化,可使信噪比保持恒定。上一頁下一頁返回4.2音視頻信號的數(shù)字化4.2.3編碼1.編碼方式對數(shù)字電視信號進行編碼可分為全信號編碼和分量信號編碼,如圖4-6所示。從4-6(a)全信號編碼圖可知,模擬全電視信號經(jīng)A/D變換,變?yōu)閿?shù)字信號,經(jīng)編碼壓縮后輸出,在接收端經(jīng)全信號解碼,再經(jīng)D/A送出全電視信號。此種方式的缺陷是易造成亮色干擾。上一頁下一頁返回4.2音視頻信號的數(shù)字化圖4-6(b)是分量信號編碼框圖,模擬全信號經(jīng)A/D變換后,再經(jīng)數(shù)字亮、色分離,分離成數(shù)字亮度Y信號和兩個數(shù)字色差信號U、V,分別送各自的編碼壓縮處理器中。在接收端經(jīng)分量信號解碼得到Y(jié)、U、V三個數(shù)字分離信號,再分別經(jīng)D/A變換和模擬矩陣電路輸出模擬全電視信號。該法增加了數(shù)字亮色分離,并且編碼壓縮也是對分量信號進行的,消除了亮色干擾現(xiàn)象,使圖像質(zhì)量提高。因此應(yīng)用較為廣泛。2.圖像分量信號量化比特數(shù)確定和碼電平分配1)量化前的歸一化處理上一頁下一頁返回4.2音視頻信號的數(shù)字化對模擬電視分量信號EY、E(R-Y)和E(B-Y)進行量化和編碼前,必須進行歸一化處理,使其有相同的動態(tài)范圍。由2.4式亮度方程可知,亮度信號和色差信號的關(guān)系如下:EY=0.299ER+0.587EG+0.114EB

(4.10)E(R-Y)=0.701ER-0.587EG-0.114EB

(4.11)E(B-Y)=-0.299ER-0.587EG+0.886EB

(4.12)令信號值歸一化(即最大電平為1.0V),則100%彩條信號的各值,如表4-2所示。上一頁下一頁返回4.2音視頻信號的數(shù)字化由表4-2可見,亮度信號EY

的動態(tài)取值在0~1之間;紅差信號E(R-Y)的動態(tài)取值在-0.701~0.701之間;藍(lán)差信號E(B-Y)的動態(tài)取值在-0.886~0.886之間。為使色差信號的動態(tài)取值范圍控制在±0.5之內(nèi),需要再次歸一化,對色差信號引入壓縮系數(shù),即:

KR=0.50÷0.701=0.713 KB=0.50÷0.866=0.564歸一化后的色差信號為:ECR=0.713E(R-Y)=0.500ER-0.419EG-0.081EB

(4.13)ECB

=0.564E(B-Y)=-0.169ER-0.331EG+0.500EB

(4.14)上一頁下一頁返回4.2音視頻信號的數(shù)字化2)碼電平的分配在對電視信號采用分量信號編碼時。亮度信號Y選取8bit四舍五入的均勻量化分為256個量化級,即碼電平從0~255,相當(dāng)于二進制的00000000~11111111,然后把各個等級用對應(yīng)的二進制碼來代替。在PCM編碼中,為防止過載把視頻信號調(diào)整在1VP-P范圍內(nèi),同時為避免圖像信號直流成分變動所引起的信號動態(tài)范圍的擴大而在量化前進行了箝位,但過載仍有可能發(fā)生。上一頁下一頁返回4.2音視頻信號的數(shù)字化 因此,在256的量化級中最大值以上留下20級,同步電平下端留下16級作為防止超越動態(tài)范圍的保護帶。碼電平的分配如圖4-7(a)所示,其中碼電平16為黑電平極限,碼電平235代表白電平極限。色差信號經(jīng)過壓縮信號處理以后的動態(tài)范圍為-0.5~+0.5,色差信號的零電平對應(yīng)的碼電平為256/2=128。色差信號總共分配224個量化級,上端和下端各留16個量化級,作為防止過載的保護帶,如圖4-7(b)、(c)所示。返回上一頁第四章增加圖像壓縮編碼原理 圖像壓縮方法在廣義上可以分成兩類。一類是無損壓縮,又稱為可逆編碼(ReversibleCoding),它要求壓縮圖像的比特數(shù)而不丟失任何信息或允許丟失一些人眼感覺不到的微量信息。另一類是有損壓縮,這時不需要圖像的全部細(xì)節(jié),只需保存圖像中感興趣的信息即可,又稱不可逆壓縮。如識別軍艦的類型、巡航導(dǎo)彈識別地形,只需輪廓信息就可以了。

返回上一頁第四章增加圖像壓縮編碼原理

4.1

壓縮編碼基礎(chǔ)

4.2

預(yù)測編碼

4.3

正交變換編碼

4.4

統(tǒng)計編碼返回上一頁第四章增加圖像壓縮編碼原理4.1

壓縮編碼基礎(chǔ) 圖像數(shù)據(jù)的壓縮機理來自兩個方面:一是:圖像中存在大量冗余度可供壓縮;二是利用人眼的視覺特性。1.圖像數(shù)據(jù)的冗余度

(1)空間冗余

在任何一幅圖像中,有許多灰度或顏色都比較接近的鄰近像素組成的局部區(qū)域,它們形成了一個性質(zhì)相同的集合塊,它們之間具有極強的空間相關(guān)性,在圖像中表現(xiàn)為空間冗余??臻g冗余存在于一幅圖像中規(guī)則的物體和規(guī)則的背景中。

返回上一頁第四章增加圖像壓縮編碼原理如果先去除冗余數(shù)據(jù)再進行編碼,則表示每個像素的平均比特數(shù)下降,這就是通常所說的圖像的幀內(nèi)編碼。

(2)時間冗余

時間冗余是活動圖像和語音中經(jīng)常包含的冗余。活動圖像序列中兩幅相鄰的圖像有較大相關(guān)性,這反映為時間冗余。通常用減少幀間傳輸?shù)臄?shù)目來減少時間冗余,采用運動估計和運動補償?shù)募夹g(shù)來滿足解碼重建圖像的質(zhì)量要求。返回上一頁第四章增加圖像壓縮編碼原理

(3)結(jié)構(gòu)冗余和知識冗余

圖像從大域上看存在著很強紋理結(jié)構(gòu),這種結(jié)構(gòu)的規(guī)律性通常稱為結(jié)構(gòu)冗余。例如,太陽是圓的,海面是平的,樓房建筑多為長方形,人的面部和身體具有對稱性。

(4)視覺冗余 人眼的視覺系統(tǒng)對于圖像的感知是非均勻和非線性的,對人眼難于識別部分的數(shù)據(jù),傳輸時可以省去,這些部分稱為視覺冗余。返回上一頁第四章增加圖像壓縮編碼原理2.人眼的視覺特性

(1)亮度辨別閾值當(dāng)景物的亮度在背景亮度基礎(chǔ)上增加很少時,人眼是辨別不出的,只有當(dāng)亮度增加到某一數(shù)值時,人眼才能感覺其亮度有變化。人眼剛剛能察覺的亮度變化值稱為亮度辨別閾值。返回上一頁第四章增加圖像壓縮編碼原理

(2)視覺閾值視覺閾值是指干擾或失真剛好可以被察覺的門限值,它是一個統(tǒng)計值。

(3)空間分辨力 空間分辨力是指對一幅圖像相鄰像素的灰度和細(xì)節(jié)的分辨力,視覺對于不同圖像內(nèi)容的分辨力不同。

(4)掩蓋效應(yīng) “掩蓋效應(yīng)”是指人眼對圖像中量化誤差的敏感程度,與圖像信號變化的劇烈程度有關(guān)。返回上一頁第四章增加圖像壓縮編碼原理3.?dāng)?shù)據(jù)壓縮編碼方法的分類 根據(jù)壓縮機理的不同,數(shù)據(jù)壓縮編碼方法大致可以分成為三類。

(1)基于圖像信源統(tǒng)計特性的壓縮方法,有預(yù)測編碼、變換編碼、矢量量化編碼、子帶-小波編碼和神經(jīng)網(wǎng)絡(luò)編碼法等。

(2)基于人眼視覺特性的壓縮方法,有基于方向濾波的圖像編碼和基于圖像輪廓-紋理的編碼法等。

(3)基于圖像景物特征的壓縮方法,有分形編碼法和基于模型的編碼方法等。返回上一頁第四章增加圖像壓縮編碼原理4.2預(yù)測編碼4.2.1預(yù)測編碼基本原理 預(yù)測編碼是數(shù)字電視信源編碼的主要方法之一,又稱差分脈沖編碼(DPCM)。它是根據(jù)某一模型過去的樣值對當(dāng)前樣值進行預(yù)測,然后將當(dāng)前樣值的實際值與預(yù)測值相減得到一個誤差值,只對這一預(yù)測誤差值進行編碼。加圖4-4為DPCM系統(tǒng)原理框圖。圖中輸入樣值信號為,接收端重建信號為,是輸入樣值信號的預(yù)測值,是輸入信號與預(yù)測信號的差值,為量化后的差值,c(n)是經(jīng)編碼后輸出的數(shù)字碼。

返回上一頁第四章增加圖像壓縮編碼原理

具體原理如下:在DPCM系統(tǒng)中不是直接傳送待傳送的像素,而是傳送它與預(yù)測值的差值,預(yù)測值是用與待傳送像素在空間和時間上相鄰的若干個像素的組合產(chǎn)生的,預(yù)測值充分反映了預(yù)測區(qū)中各像素的共性部分,是相當(dāng)準(zhǔn)確的。所以我們說預(yù)測差值基本去除了像素間的相關(guān)性。即預(yù)測差值的變化幅度比像素本身的幅度在統(tǒng)計上要小的多,因此可以用較少的位數(shù)進行量化和編碼,從而使圖像數(shù)據(jù)得到壓縮。

返回上一頁第四章增加圖像壓縮編碼原理在接收端,通過解碼得到量化后的差值信號,并用與發(fā)端相同的預(yù)測器得到,將兩者相加得到重構(gòu)像素值。重構(gòu)像素值與原始像素值的差僅在于量化器產(chǎn)生的量化誤差qn,理想情況下兩者相等。即返回上一頁第四章增加圖像壓縮編碼原理2.DPCM編碼過程

以兩位編碼(N=2)來說明DPCM的編碼過程。由于N=2,所以誤差信號的量化電平數(shù)M=2N=4。假設(shè)4個量化電平分別為,它們分別由二進制脈沖(雙極性信號)++,+-,-+,--表示。誤差信號的抽樣、量化和編碼過程如加圖4-5所示。(圖中的紅色空心圓點表示誤差信號的抽樣值,藍(lán)色實心圓點表示誤差信號量化后的值)。DPCM系統(tǒng)的輸出信噪比有所改善,所以性能優(yōu)于PCM系統(tǒng)。返回上一頁第四章增加圖像壓縮編碼原理4.2.2預(yù)測方法

1.幀內(nèi)預(yù)測 幀內(nèi)預(yù)測利用圖像信號的空間相關(guān)性來壓縮圖像的空間冗余,根據(jù)前面已傳送的同一幀內(nèi)的像素來預(yù)測當(dāng)前像素,被預(yù)測的像素一般不超過4個。2.幀間預(yù)測

電視圖像在相鄰幀之間存在很強的相關(guān)性,幀間預(yù)測編碼除了完成一幅圖像本身的去相關(guān)數(shù)據(jù)壓縮,還要對幀間相關(guān)性進行壓縮。所以,預(yù)測器可以是幀內(nèi)預(yù)測器和幀間預(yù)測器。返回上一頁第四章增加圖像壓縮編碼原理4.2.3圖像幀間編碼中的運動處理

為了更好運用幀內(nèi)及幀間編碼,我們將由一個個連續(xù)的電視畫面組成的視頻序列劃分為許多圖像組,每個圖像組有數(shù)幀圖像組成,這些圖像之間有很強的預(yù)測和生成關(guān)系。如加圖4-6所示,圖像組的第一幅圖像是采用幀內(nèi)編碼的圖像,稱為I圖像。后面可以包括數(shù)幀采用前向幀間預(yù)測編碼的圖像,稱為P圖像。在I圖像與P圖像之間或P圖像與P圖像之間可有數(shù)幀采用雙向預(yù)測編碼的圖像,稱為B圖像。

返回上一頁第四章增加圖像壓縮編碼原理1.運動估計和補償原理

在圖像的運動處理中主要有兩個過程。第一個過程為運動估計(MotionEstimation,ME)。運動估計是對運動物體的位移作出估計,即估計出運動物體從上一幀到當(dāng)前幀的位移方向和位移量,也就是估計出運動矢量。第二個過程為運動補償(MotionCompensation,MC)。運動補償是按照運動矢量(D表示從參考幀到當(dāng)前幀像素運動的方向和距離)將上一幀作位移,求出當(dāng)前幀的運動結(jié)果。 返回上一頁第四章增加圖像壓縮編碼原理2.運動估計的方法

采用預(yù)測編碼的方法消除序列圖像在時間上的相關(guān)性,即不直接傳送當(dāng)前幀的像素值,而是傳送x和其前一幀或后一幀的對應(yīng)像素x‘之間的差值,這稱為幀間預(yù)測,如加圖4-6

。

當(dāng)圖像中存在著運動物體時,簡單的預(yù)測不能收到好的效果,加圖4-6中,當(dāng)前幀與參考幀的背景完全一樣,只是小球平移了一個位置,如果簡單地以第k-1幀像素值作為k幀的預(yù)測值,則在實線和虛線所示的圓內(nèi)的預(yù)測誤差都不為零。返回上一頁第四章增加圖像壓縮編碼原理

如果已經(jīng)知道了小球運動的方向和速度,可以從小球在k-1幀的位置推算出它在k幀中的位置來,而背景圖像仍以前一幀的背景代替,將這種考慮了小球位移的k-1幀圖像作為k幀的預(yù)測值,就比簡單的預(yù)測準(zhǔn)確得多,從而可以達(dá)到更高的數(shù)據(jù)壓縮比。這種預(yù)測方法稱為具有運動補償?shù)膸g預(yù)測。具有運動補償?shù)膸g預(yù)測編碼是視頻壓縮的關(guān)鍵技術(shù)之一,它包括以下幾個步驟:返回上一頁第四章增加圖像壓縮編碼原理

首先,將圖像分解成相對靜止的背景和若干運動的物體,各個物體可能有不同的位移,但構(gòu)成每個物體的所有像素的位移相同,通過運動估值得到每個物體的位移矢量;然后,利用位移矢量計算經(jīng)運動補償后的預(yù)測值;最后對預(yù)測誤差進行量化、編碼、傳輸,同時將位移矢量和圖像分解方式等信息送到接收端。返回上一頁第四章增加圖像壓縮編碼原理

3.塊匹配法

在具有運動補償?shù)膸g預(yù)測編碼系統(tǒng)中,對圖像靜止區(qū)和不同運動區(qū)的實時完善分解和運動矢量計算是較為復(fù)雜和困難的。在實際實現(xiàn)時經(jīng)常采用的是簡化的塊匹配法。

塊匹配法是一種非常簡單的運動估值方法。它將圖像劃分為許多子塊,并認(rèn)為子塊內(nèi)所有像素的位移量是相同的,這意味著將每個子塊視為一個“運動物體”。返回上一頁第四章增加圖像壓縮編碼原理

對于當(dāng)前編碼幀圖像中的某一子塊如果在參考幀中可以找到若干與其十分相似的子塊,則稱其中最為相似的子塊為匹配塊,并認(rèn)為該匹配塊是編碼幀中相應(yīng)子塊位移的結(jié)果。位移矢量由兩幀中相應(yīng)子塊的坐標(biāo)決定。

考慮到一定時間間隔內(nèi)物體可能的運動速度、運動范圍和匹配搜索所需的計算量,在匹配搜索時一般僅在一個有限范圍內(nèi)進行。假設(shè)在給定時間間隔內(nèi)最大可能的水平和垂直位移為dh和dv個像素,則搜索范圍SR為:

其中M、N為子塊的水平和垂直像素數(shù)

返回上一頁第四章增加圖像壓縮編碼原理4.3正交變換編碼

變換編碼(TransformCoding)的基本思想是將在通常的空間域描寫的圖像信號變換到另外的向量空間(變換域)進行描寫,然后再根據(jù)圖像在變換域中系數(shù)的特點和人眼的視覺特性進行編碼。

(1)一般來說圖像變換不是對整幅圖像一次進行,而是在存儲器中把一幅圖像分成許多N×N的像塊,然后依次將每個像塊內(nèi)的N×N個樣點同時送入變換器進行變換運算。

返回上一頁第四章增加圖像壓縮編碼原理

(2)變換器把輸入的N×N點的像塊由原空間域變換到變換域中,映射成同樣大小的N×N點的變換系數(shù)矩陣,經(jīng)過變換后的系數(shù)矩陣更有利于壓縮。4.3.1正交變換的性質(zhì)1.能量守恒性

可以證明圖像在空間域中的數(shù)據(jù)平方和和圖像在變換域中的數(shù)據(jù)平方和存在能量守恒關(guān)系,即

返回上一頁第四章增加圖像壓縮編碼原理

2.能量集中性

大部分正交變換將圖像的大部分能量集中到相對少數(shù)幾個系數(shù)上,由于整個能量守恒,因此這意味著許多變換系數(shù)只含有很少的能量。

3.去相關(guān)性

當(dāng)輸入的像素高度相關(guān)時,變換系數(shù)趨向于不相關(guān)。4.3.2離散余弦變換(幀內(nèi))

1.二維DCT變換一個N×N像塊f(x,y)(x,y=0,1,…N-1)的二維DCT定義為

返回上一頁第四章增加圖像壓縮編碼原理正變換反變換

其中u,v=0,1…N-1;x,y=0,1…N-1返回上一頁

2.物理意義二維變換核函數(shù)a(x,y;u,v)按x,y,u,v分別展開后得到的是N×N個N×N點的像塊組,又稱為基圖像。一個8×8的DCT基圖像示意如加圖4-7所示。根據(jù)人眼對高頻幅度失真不太敏感的特點,在I幀中第四章增加圖像壓縮編碼原理返回下一頁

位于DCT系數(shù)矩陣左上角的部分對應(yīng)圖像的低頻成份,采用較小的量化間隔,對于右下角部分的系數(shù)對應(yīng)高頻成份,采用較大量化間隔。而對于P和B幀,由于處理的是幀間預(yù)測差值圖像,所以采用相同的量化間隔。也就是I幀P幀和B幀的量化加權(quán)矩陣不同。統(tǒng)計表明DCT系數(shù)矩陣的能量集中在左上角的低頻部分,所以量化以后大部分位于右下角的高頻分量系數(shù)被量化為0。這樣編碼是指傳送少量非零系數(shù),把二維系數(shù)矩陣變換為一維系列,從而達(dá)到數(shù)據(jù)壓縮。

第四章增加圖像壓縮編碼原理返回下一頁對于DCT系數(shù)的量化,根據(jù)量化加權(quán)矩陣和量化因子的不同,可有31種情況。

DCT編碼中對圖像帶來的失真主要有:

(1)舍去高頻系數(shù)而使圖像產(chǎn)生模糊;

(2)對某些系數(shù)采用粗量化而產(chǎn)生顆粒狀結(jié)構(gòu);

(3)像塊的劃分使相鄰像塊人為地造成亮度不連續(xù),即塊效應(yīng)。第四章增加圖像壓縮編碼原理返回下一頁第四章增加圖像壓縮編碼原理返回下一頁8910111412512611510596971151311471491351231131141341591781751641491371211431771962011891651501191411752012071861621441071301651891921711441259711914917117214511796881071361561551299775DCT下面以8x8像塊為例,來具體分析DCT變換第四章增加圖像壓縮編碼原理返回下一頁1125-32-185-72-1-22-22-1645-3-20-2-2-165321795-1-30-7-4022-1-12-20030021311-1-2020002-1-121-1031-121-20量化除16第四章增加圖像壓縮編碼原理返回下一頁8161922262729341616222427293437192227272934343822222627293437402226272932354048262729323540485826272934384656692729353846566983I幀量化加權(quán)矩陣第四章增加圖像壓縮編碼原理返回下一頁16161616161616161616161616161616161616161616161616161616161616161616161616161616161616161616161616161616161616161616161616161616P、B幀量化加權(quán)矩陣第四章增加圖像壓縮編碼原理返回下一頁70-2-1100000-1-1200000-1021000000000000000000000000000000000000000000000Z型掃描第四章增加圖像壓縮編碼原理“Z”字型掃描和游程編碼

DCT變換產(chǎn)生的是8×8的二維數(shù)組,為進行傳輸,還必須將其轉(zhuǎn)換為一維排列方式。從二維到一維的轉(zhuǎn)換方式(或稱掃描方式)有多種,其中“Z”字型掃描是最常用的一種。它是按二維頻率從低到高的順序讀出變換系數(shù)。由于經(jīng)量化后,大多數(shù)非零DCT變換系數(shù)集中于矩陣的左上角即低頻分量區(qū),經(jīng)過“Z”字型掃描后,這些非零DCT變換系數(shù)就集中于一維排列數(shù)組的前部,后面跟著長串的量化為零的DCT變換系數(shù),這些就為游程編碼創(chuàng)造了條件。返回下一頁第四章增加圖像壓縮編碼原理其中Z型掃描順序如下表所示。0156141527282471316262942381217253041439111824314044531019233239455254202233384651556021343747505659613536484957586263返回下一頁70-2-1100000-1-1200000-1021000000000000000000000000000000000000000000000Z型掃描順序表第四章增加圖像壓縮編碼原理返回上一頁經(jīng)Z型掃描變?yōu)槿缦乱痪S序列

70,-2,-1,-10,-1,-11,0,2,2,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0

第四章增加圖像壓縮編碼原理

游程編碼思想是,只有非零系數(shù)被編碼。一個非零系數(shù)的編碼由兩部分組成:前一部分表示非零系數(shù)前的連續(xù)零系數(shù)的數(shù)量(稱為游程),后一部分是非零系數(shù)。這樣就把“Z”字型掃描的優(yōu)點體現(xiàn)出來了,因為“Z”字型掃描在大多數(shù)情況下出現(xiàn)連零的機會比較多,游程編碼的效率就比較高。當(dāng)一維序列中的后部剩余的量化DCT變換系數(shù)都為零時,要用一個“塊結(jié)束”標(biāo)志(EOB)來指示,結(jié)束這一8×8變換系數(shù)塊的編碼,產(chǎn)生的壓縮效果非常明顯。返回上一頁第四章增加圖像壓縮編碼原理游程編碼

0,70,0,-2,0,-1,0,-10,0,

-1,0,-11,1,2,0,2,3,1,EOB返回上一頁第四章增加圖像壓縮編碼原理4.4統(tǒng)計編碼

4.4.1信息量和信息熵

1.信息量對于某一離散無記憶信源X的符號集xi(i=1,2,…,N),假設(shè)每個符號Xi是統(tǒng)計獨立的,出現(xiàn)的概率為p(xi),

則,則符號集xi所攜帶的信息量定義為

I(xi)=log2(1/p(xi))返回下一頁第四章增加圖像壓縮編碼原理如果將信源所有可能時間的信息量進行平均,就得到信源中每個符號的平均信息量,又稱為信息的“熵”,表示為熵編碼是一種無損編碼,多采用變字長編碼(即每個量化值以不同數(shù)目的比特表示),基本思想是對信源中出現(xiàn)概率大的符號賦以短碼,對出現(xiàn)概率小的符號賦以長碼,從而在統(tǒng)計上獲得較短的平均碼長,從而提高編碼效率。返回下一頁第四章增加圖像壓縮編碼原理

2.霍夫曼編碼霍夫曼編碼是在數(shù)字電視中應(yīng)用的一種可變長”熵“編碼。其步驟為:第一、將信源符號以出現(xiàn)概率作為結(jié)點由大到小排成一列,將最末兩個符號的概率結(jié)點用二叉樹相加合為一個結(jié)點。第二、將這個概率結(jié)點與其余符號的概率結(jié)點再按大小排列,并再將最末概率結(jié)點用二叉樹相加合為一個結(jié)點。重復(fù)上述步驟,直至最終將所有概率合成一個概率根結(jié)點“1”。下一頁返回第四章增加圖像壓縮編碼原理然后,從根結(jié)點出發(fā)逐步向前進行編碼,每遇到一個二叉樹,便對兩分支各賦予一個二進制碼,對指向概率大的結(jié)點的分支賦予碼元“0”。對另一個分支賦予碼元“1”,直到表示信源的概率符號為止。下面以六個符號的信源為例來分析霍夫曼編碼的過程。編碼過程如下:下一頁返回符號s1s2s3s4s5s6概率0.40.30.10.10.060.04霍夫曼碼10001101000101001011第四章增加圖像壓縮編碼原理S10.4______0.4_______0.4____0.4___S20.3______0.3_______0.3____0.3S30.1______0.1S40.1______0.1S50.06S60.04下一頁返回0.10.20.10.30.60.41.001010101104.3數(shù)字電視標(biāo)準(zhǔn)4.3.1視頻編碼標(biāo)準(zhǔn)1.視頻壓縮的必要性和可行性視頻信號經(jīng)數(shù)字化處理后具有易于加密、抗干擾能力強、可再生中繼等許多優(yōu)點,但數(shù)字化的視頻數(shù)據(jù)量十分巨大,不利于傳輸和存儲。這將成為數(shù)字電視視頻通信推廣的最大障礙,因此,必須進行視頻壓縮編碼。下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)以某路電視信號為例,設(shè)數(shù)字化后的圖像分辨率為720×560,幀頻為25幀/s,Y:U:V為4:2:2,量化精度為8bit,則數(shù)碼率為156.9Mbit/s。以64kbit/s作為一個數(shù)字話路,若不加壓縮,傳輸該路電視圖像需要占用2596個數(shù)字話路,這在實際應(yīng)用中難以接受。對于HDTV信號,若不加壓縮,數(shù)碼率可接近1Gbit/s。因此,壓縮編碼必不可少。數(shù)據(jù)壓縮不僅是必要的,而且是可行的。因為原始圖像中的視頻數(shù)據(jù)存在著極強的相關(guān)性,即存在著很大的冗余上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) 度。冗余數(shù)據(jù)造成比特數(shù)浪費,消除這些冗余可以節(jié)約碼率,也就達(dá)到了數(shù)據(jù)壓縮的目的。碼率壓縮系統(tǒng)的工作是去除傳輸之前編碼器輸入信號中的冗余信息,并在解碼器中恢復(fù)這些冗余信息。

1)空間冗余

2)時間冗余

3)結(jié)構(gòu)冗余

4)視覺冗余上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)研究表明,人眼對運動圖像內(nèi)容、灰度等級及圖像細(xì)節(jié)三者的分辨力是密切相關(guān)的。一般情況是,對亮度比對色度信號敏感,對低頻信號比對高頻信號敏感,對靜止圖像比對運動圖像敏感,對圖像的水平及垂直線條比對斜線條敏感。例如,觀察一匹站著不動的馬時,可以看清其顏色、眼睛和鼻子等,甚至一根根鬃毛也分得清清楚楚。但當(dāng)這匹馬奔馳而過時,這些細(xì)節(jié)卻難以分辨。另外,在觀察大面積的像塊時,對灰度等級分辨力很高,而對圖像細(xì)節(jié)的分辨力較低上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) 在第2章大面積涂色原理中描述過,這些情況均說明人眼接收綜合信息的速率有限。根據(jù)人眼的這種視覺特性,顯然可以合理選擇圖像幀頻率、量化電平及采樣頻率三個參數(shù),而不影響傳輸圖像的質(zhì)量。例如,當(dāng)傳送靜止圖像或運動很慢的圖像時,可以減少每秒傳送圖像幀數(shù)目;在對應(yīng)每幅圖像景物的邊沿輪廓等細(xì)節(jié)部分可選用高的抽樣頻率,同時降低量化比特數(shù);當(dāng)傳送快速運動物體圖像時,應(yīng)提高傳輸圖像速度,但同時降低量化電平比特數(shù)和抽樣頻率。這就是利用人眼的視覺冗余來實現(xiàn)碼率壓縮的依據(jù)。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)2.MPEG-2標(biāo)準(zhǔn)1)概述MPEG是活動圖像專家組(MovingPictureExpertsGroup)的縮寫。到目前為止,已經(jīng)制定和正在制定的MPEG標(biāo)準(zhǔn)有MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21。

MPEG專家組于1992年制定了第1個國際標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn),1993年8月公布。MPEG-1主要包括三個部分第一部分,是關(guān)于數(shù)字視頻、數(shù)字音頻和輔助數(shù)據(jù)等多路壓縮數(shù)據(jù)流復(fù)用和同步的規(guī)定。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)第二部分視頻,是關(guān)于位速率約為1.5Mbit/s的視頻信號的壓縮編碼的規(guī)定。第三部分音頻,是關(guān)于每通道位速率為64kbit/s,128kbit/s和192kbit/s的數(shù)字音頻信號的壓縮編碼的規(guī)定。MPEG-1標(biāo)準(zhǔn)的目標(biāo)如下:

(1)電視在圖像和聲音的質(zhì)量上必須高于可視電話和會議電視的聲像質(zhì)量。

(2)壓縮后的數(shù)碼率應(yīng)能存儲在光盤、數(shù)字錄音帶或可寫磁光盤等媒體中;上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)

(3)壓縮后的碼率應(yīng)與目前的計算機網(wǎng)絡(luò)傳輸碼率相適配,為1.2~1.5Mbit/s。

(4)在通信網(wǎng)絡(luò)上能適應(yīng)多種通信網(wǎng)絡(luò)傳輸。

MPEG-2是MPEG制定的第2個標(biāo)準(zhǔn),其正式名稱為活動圖像及伴音信息的通用編碼標(biāo)準(zhǔn)。MPEG-2標(biāo)準(zhǔn)已相當(dāng)完善,是國際上公認(rèn)DVB、DVD、ATSC的信源編碼的核心技術(shù)和標(biāo)準(zhǔn),廣泛應(yīng)用于數(shù)字電視節(jié)目的制作、播放及存儲。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)

MPEG-2所規(guī)定的圖像格式符合CCIR-601建議:704×576(PAL)和704×480(NTSC),傳輸?shù)拇a率為3~100Mbit/s;在6Mbit/s時具有模擬復(fù)合電視圖像的質(zhì)量,在9Mbit/s時具有模擬分量電視圖像的質(zhì)量,同時支持多聲道的音頻編碼。MPEG-2標(biāo)準(zhǔn)充分考慮了對MPEG-1的兼容和對圖像質(zhì)量以及傳輸速率的多次要求,因而具有可分級性、靈活性和廣泛的適應(yīng)性。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)編號為ISO/IECIS:13818。MPEG-2由9部分組成,其中主要的三個部分是: 第一部分系統(tǒng)(ISO/IEC13818-1),是關(guān)于多路音頻、視頻和數(shù)據(jù)的復(fù)用和同步的規(guī)定; 第二部分視頻(ISO/IEC13818-2),主要涉及各種比特率的數(shù)字視頻壓縮編解碼的規(guī)定;第三部分音頻(ISO/IEC13818-3),擴充了MPEG-1的音頻標(biāo)準(zhǔn),使之成為多通道音頻編碼系統(tǒng),可達(dá)到的環(huán)繞聲5.1聲道。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)

2)MPEG-1/MPEG-2標(biāo)準(zhǔn)中的3種編碼類型圖像

MPEG標(biāo)準(zhǔn)所規(guī)定的視頻編碼算法在實現(xiàn)高壓縮比的同時,又能獲得較高的重建圖像質(zhì)量,并且還要滿足能夠隨機存取的要求。如果只采用幀內(nèi)編碼,則不可能在高的壓縮比下獲得好的圖像質(zhì)量,所以必須采用幀間編碼,但要能隨機存取,則用幀內(nèi)編碼最容易實現(xiàn)。這就要在幀間和幀內(nèi)編碼之間仔細(xì)地平衡。不僅如此,MPEG視頻編碼算法在利用運動補償幀間預(yù)測來減少時間冗余時,采用雙向預(yù)測。所以,MPEG標(biāo)準(zhǔn)將編碼圖像分為3種類型:上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) 分別稱為I(Intra)幀、P(Predicated)幀和B(Bi-directional)幀。

I幀圖像采用幀內(nèi)DCT編碼,只利用了單幀圖像內(nèi)的空間相關(guān)性,而沒有利用時間相關(guān)性,所以I幀圖像的壓縮比相對較低。I幀圖像提供了隨機存取的插入點,另外I幀圖像可作為B幀和P幀圖像預(yù)測參考幀。I幀圖像是周期性出現(xiàn)在視頻序列中的,出現(xiàn)頻率可由編碼器選擇。

P幀圖像根據(jù)前面最近的I幀圖像或P幀圖像進行前向預(yù)測,采用帶運動補償?shù)膸g預(yù)測編碼方式,也同時利用了空間和時間上的相關(guān)性,所以P幀圖像的壓縮比較高。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)

B幀是雙向預(yù)測幀內(nèi)插幀,它既用在視頻序列中處于該幀前的“過去幀”作為預(yù)測參考幀,進行前向運動補償預(yù)測,又用后面的“后來幀”作預(yù)測參考幀,檢測后向運動補償測試。B幀不能用來作為對其他幀進行運動補償?shù)膮⒖紟?)MPEG-2的類和級

MPEG-2標(biāo)準(zhǔn)支持不同性能和不同復(fù)雜性的解碼器,覆蓋廣泛的應(yīng)用范圍,充分考慮了各種應(yīng)用的不同要求,有較強的通用性。

上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)

MPEG-2還規(guī)定了不同的壓縮處理方法,稱為類(Profile)?!邦悺币?guī)定的子集應(yīng)用起來有時覺得太大,于是在各類中又根據(jù)圖像分辨率的不同劃分為4“級(level)”。為了使用上的通用性和靈活性,MPEG-2規(guī)定的圖像編碼方法分為6類4級共24種(目前投入使用的為12種)規(guī)范化的碼率壓縮編碼方法。其中“類”規(guī)定了該類中用哪些算法,怎么用及其應(yīng)用范圍;而“級”則規(guī)定了該級中各種算法中元素的值怎樣選取。MPEG-2中6類4級的劃分及其組合如表4-3所示。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)表中“級”一欄根據(jù)圖像清晰度分高級、高-1440、主級、低級4個級別,其中數(shù)字表示圖像的有效像素。例如高級(HL)是1920像素/行、1080行/幀、30幀/s或1920像素/行、1152行/幀、25幀/s;低級是352像素/行、288行/幀,30幀/s。另外,主級即CCIR601建議的數(shù)字電視分辨率,低級即CCITTH.261建議的CIF的分辨率。表中“類”一欄中,SNR(信噪比)可分級類是指在多層次比特流中,只得用低層次(量化較粗)比特中的DCT系數(shù)進行二次量化,成為較高層次(量化變細(xì))的比特流。由于低比上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)特率在傳輸時誤碼率低,故取名為SNR可分級類。另外,4:2:2類是最新列入的,屬于主類的擴展類,主要用于4:2:2編碼規(guī)則。表格中間部分是投入應(yīng)用的12中組合的數(shù)據(jù)是指圖像碼元傳播速率,最高速率是100Mbit/s,最低速率是4Mbit/s。碼率越高,圖像質(zhì)量越好,占用的頻帶也越寬。碼率的選用與圖像內(nèi)容有很大關(guān)系,運動較多的圖像如體育節(jié)目,需要較高的碼率;電源和動畫片一類的節(jié)目,所需的碼率要小一些。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)MPEG-2的分級擴展包括空域分級、時域分級、SNR分級和數(shù)據(jù)分流。①空域分級用于實現(xiàn)不同大小圖像的兼容傳送,例如,從HDTV信號中可得到SDTV圖像。②時域分級主要用于不同幀頻圖像的兼容傳送。③SNR分級主要用于實現(xiàn)不同質(zhì)量的視頻服務(wù)兼容,接收條件差時可獲得降低質(zhì)量的圖像,而接收條件好時得到高質(zhì)量信號。④數(shù)據(jù)分流的基本思想是:將有關(guān)解碼的重要信息,例如控制信息、運動矢量、DCT低頻分量等放在一起,占用部分上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) 頻帶以較高的信噪比發(fā)射,以保證接收。在另外的頻帶中放置相對次要的數(shù)據(jù),以較低些的能量發(fā)射,從而降低總的發(fā)射功率。目前實際應(yīng)用最多的是主類,其中MP@ML已應(yīng)用于不同的場合,如普通數(shù)字電視、有線電視及DVB、DVD等;美國的HDTV使用MP@ML。4)MPEG視頻碼流的分層結(jié)構(gòu)為了便于進行A/D轉(zhuǎn)換、數(shù)據(jù)壓縮,并考慮到與MPEG-1兼容,MPEG-2的圖像信號劃分6層,自上而下依次為:圖像序列(videosequence)層、圖像組(groupofpicture)層、圖像(picture)層、宏塊(像)條上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) (slice)層、宏塊(macroblock)層、像塊(block)層,其特點及功能如表4-4所示。5)MPEG-2系統(tǒng)層的數(shù)據(jù)處理MPEG-2中定義了三種基本碼流。(1)基本碼流ES(ElementaryStream):按像塊層、宏塊層、像條層、圖像層、圖像組層、圖像序列層的順序依次編碼,并在除像塊和宏塊外的每一層的開始處加上起始碼和頭標(biāo)志,就形成MPEG-2的基本碼流。(2)節(jié)目碼流PS(ProgramStream):是由一個或多個視頻及音頻碼流組合而成的單一碼流。節(jié)目碼流應(yīng)用在相對無誤碼的環(huán)境中,其數(shù)據(jù)包可以是任意長度。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)(3)傳送碼流TS(TransportStream):是由一個或多個節(jié)目組成的單一碼流,而一個節(jié)目又是具有同一時基的多個基本碼流的集合。傳送碼流設(shè)計為應(yīng)用在相對存在誤碼的環(huán)境中,其數(shù)據(jù)小包具有188字節(jié)的固定長度。MPEG-2系統(tǒng)層數(shù)據(jù)處理的框圖如圖4-8所示。視頻信號和音頻信號經(jīng)編碼后生成各自的基本碼流ES。視頻和音頻的碼流分別按一定的格式在打包器中打包,構(gòu)成具有以某種格式打包的基本碼流PES,分別稱為視頻PES和音頻PES。將視頻、音頻的PES以及輔助數(shù)據(jù)按不同的格式再打包,然后進行復(fù)用,則分別生成T傳送碼流S和節(jié)目碼流PS。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)6)MPEG-2視頻編碼關(guān)鍵技術(shù)一幀圖像內(nèi)的像素之間在亮度和色度上存在一定的空間相關(guān)性;不同幀圖像間存在時間相關(guān)性。這兩種相關(guān)性使得圖像中存在大量的冗余信息,如果能將這些冗余信息去除,只保留少量非相關(guān)信息進行傳輸,就可大大節(jié)省傳輸帶寬。而接收機利用這些非相關(guān)信息,按照一定的解碼算法,可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。一個好的壓縮編碼方案能夠最大限度的去除圖像中的冗余信息。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)

MPEG的視頻編碼的原理框圖如圖4-9所示,采用帶運動補償?shù)膸g預(yù)測編碼和幀內(nèi)DCT編碼相結(jié)合的方案。在幀內(nèi)編碼的情況下,開關(guān)S1和S2均打開,待編碼圖像僅經(jīng)過DCT、量化器、Z型掃描和熵編碼器即生成編碼比特流,而不經(jīng)過運動補償?shù)念A(yù)測處理。DCT直接應(yīng)用于原始圖像數(shù)據(jù)。在幀間編碼的情況下,開關(guān)S1和S2均閉合,原始的圖像首先與幀存儲器器中的預(yù)測圖像進行比較,計算出運動矢量,由該運動矢量和參考幀圖像生成原始圖像的預(yù)測圖像。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) 然后,將原始圖像與預(yù)測圖像的像素差值所生成的差值圖像數(shù)據(jù)(預(yù)測誤差)進行DCT變換,再經(jīng)過量化器和熵編碼器生成輸出的編碼比特流。MPEG視頻壓縮方案中包含以下關(guān)鍵技術(shù)環(huán)節(jié)。(1)離散余弦變換(DCT)在MPEG中DCT以8×8的像塊為單位進行,生成的是8×8的DCT變換系數(shù)數(shù)據(jù)塊。DCT的最大特點是,對于大部分的圖像,能夠?qū)⑾駢K的能量集中在少量低頻DCT變換系數(shù)上。即8×8DCT變換矩陣左上角的少量低頻系數(shù)值較大,右下角的高頻系數(shù)的數(shù)值很小。這樣就可以只上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) 編碼和傳輸少數(shù)系數(shù)而不嚴(yán)重影響重建圖像質(zhì)量,為數(shù)據(jù)的壓縮創(chuàng)造了條件。(2)量化器量化是針對DCT變換系數(shù)進行的,DCT變換系數(shù)的量化是一步關(guān)鍵的操作。因為DCT本身不壓縮數(shù)據(jù),64個樣值經(jīng)DCT變換后仍是64個變換系數(shù),甚至所需的比特率增加了,只有通過對DCT變換系數(shù)進行量化處理后再結(jié)合游程編碼和熵編碼才能達(dá)到數(shù)據(jù)壓縮的目的。量化過程就是以某個量化步長去除DCT變換系數(shù),它實際上是用降低DCT變換系數(shù)精度的方法忽略掉不必要的DCT變換系數(shù),上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn) 從而降低傳輸碼率。不同的DCT變換系數(shù)對人類視覺感應(yīng)的重要性是不同的,因此,量化器的設(shè)計以人眼的視覺特性為根據(jù),對一個8×8的DCT變換系數(shù)塊中的64個DCT變換系數(shù)采用不同的量化步長(量化間隔)。MPEG標(biāo)準(zhǔn)對幀內(nèi)編碼和幀間編碼不同的DCT變換系數(shù)采用不同的量化表矩陣。由于預(yù)測誤差塊主要是高頻信號,因此可以采用粗量化,以降低數(shù)碼率。幀內(nèi)編碼塊的低頻信號采用細(xì)量化;高頻信號采用粗量化。這樣既可滿足圖像數(shù)碼率的要求,又能改變圖像質(zhì)量。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)3)“之”字型掃描和游程編碼

DCT變換產(chǎn)生的是8×8的二維數(shù)組,為進行傳輸,還須將其轉(zhuǎn)換為一維排列方式。從二維到一維的轉(zhuǎn)換方式(或稱掃描方式)有多種,其中“之”字型掃描是最常用的一種。它實際上是按二維頻率從低到高的順序讀出變換系數(shù)。由于經(jīng)量化后,大多數(shù)非零DCT變換系數(shù)集中于8×8二維矩陣的左上角,即低頻分量區(qū),經(jīng)過“之”字型掃描后,這些非零DCT變換系數(shù)就集中于一維排列數(shù)組的前部,后面跟著長串的量化為零的DCT變換系數(shù),這些就為游程編碼創(chuàng)造了條件。上一頁下一頁返回4.3數(shù)字電視標(biāo)準(zhǔn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論