mpeg2封裝格式和編碼_第1頁(yè)
mpeg2封裝格式和編碼_第2頁(yè)
mpeg2封裝格式和編碼_第3頁(yè)
mpeg2封裝格式和編碼_第4頁(yè)
mpeg2封裝格式和編碼_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、MPEG 是運(yùn)動(dòng)圖像組(Moving Picture Experts Group)的簡(jiǎn)稱,其實(shí)質(zhì)上的名稱為國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電工委員會(huì)(IEC)技術(shù)委員會(huì)(JTC)1 的第 29 分委員會(huì)的第 11 工作組,即 ISO/IECJTC1/SC29/WG11,成立于 1988 年。其任務(wù)是制定世界通用的視音頻編碼標(biāo)準(zhǔn)。因?yàn)?,廣播電視數(shù)字化所產(chǎn)生的海量數(shù)據(jù)對(duì)容量、傳輸帶寬、處理能力及頻譜利用率提出了不切合實(shí)際的要求,使數(shù)字化難以實(shí)現(xiàn)。為此,該組基于幀內(nèi)圖像相鄰像素間及相鄰行間的空間相關(guān)性和相鄰幀間運(yùn)動(dòng)圖像的時(shí)間相關(guān)性,采用壓縮編碼技術(shù),將那些對(duì)人眼視覺(jué)圖像和人耳聽(tīng)覺(jué)聲音不太重要的東西及冗

2、余成分拋棄,從而縮減了、傳輸和處理的數(shù)據(jù)量,提高了頻譜利用率,制定了如表 1 所示的一系列 MPEG 標(biāo)準(zhǔn),使數(shù)字化正在變?yōu)楝F(xiàn)實(shí)。其中,MPEG-2 是一組用于視音頻壓縮編碼及其數(shù)據(jù)流格式的國(guó)際標(biāo)準(zhǔn)。它定義了編技術(shù)及數(shù)據(jù)流的傳輸協(xié)議;制定了 MPEG-2器之間的共同標(biāo)準(zhǔn)(MPEG-2 編碼器之間尚無(wú)共同標(biāo)準(zhǔn))。本文以MPEG-2 的系統(tǒng)、MPEG-2 的編碼、及MPEG-2 的應(yīng)用為題,討論 MPEG-2 壓縮編碼技術(shù)。一、MPEG-2 的系統(tǒng)1.系統(tǒng)的定義MPEG-2 系統(tǒng)是將、音頻及其它數(shù)據(jù)基本流組一個(gè)或多個(gè)適宜于或傳輸?shù)臄?shù)據(jù)流的規(guī)范,如圖 1 所示。由圖 1 可見(jiàn),符合ITU-R. 60

3、1 標(biāo)準(zhǔn)的、幀次序?yàn)?I1B2B3P4B5B6P7B8B9I10 數(shù)字?jǐn)?shù)據(jù)和符合 AES/EBU 標(biāo)準(zhǔn)的數(shù)字音頻數(shù)據(jù)分別通過(guò)圖像編碼和聲音編碼之后,生成次序?yàn)?I1P4B2B3 P7B5B6I10 B8B9基本流(ES)和音頻 ES。在ES 中還要加入一個(gè)時(shí)間基準(zhǔn),即加入從信號(hào)中取出的 27MHz 時(shí)鐘。然后,再分別通過(guò)各自的數(shù)據(jù)包形成器,將相應(yīng)的 ES 打包成打包基本流(PES)包,并由 PES 包PES。最后,復(fù)用器和傳輸復(fù)用器分別將PES 和音頻 PES 組相應(yīng)的流(PS)傳輸流(TS)包,并由 PS 包PS 和由TS 包TS。顯然,不直接傳輸 PES,只傳輸PS 和TS;PES 只是

4、PS 轉(zhuǎn)換為 TS 或TS 轉(zhuǎn)換為 PS 的驟或橋梁,是 MPEG 數(shù)據(jù)流互的定義,可知MPEG-2 系統(tǒng)的任務(wù)。換的邏輯結(jié)構(gòu),本身不能參與交換和互操作。2.系統(tǒng)的任務(wù)MPEG-2 的標(biāo)準(zhǔn)由表 2 所示的 8 個(gè)文件組成,MPEG-2 系統(tǒng)是其關(guān)鍵部分。MPEG 以開(kāi)放系統(tǒng)互聯(lián)(O SI-Open System Interconnection)為目標(biāo),爭(zhēng)取全球標(biāo)準(zhǔn)化。在詳細(xì)規(guī)定視音頻編碼算法的基礎(chǔ)上,為傳輸和交換編碼數(shù)據(jù)流(比特流,碼流,流)創(chuàng)造統(tǒng)一條件。以利于接收端重建為指導(dǎo),按照既定的參數(shù)給數(shù)據(jù)流以一定程度的“包裝”。因此,MPEG-2 系統(tǒng)應(yīng)完成的任務(wù)有: 規(guī)定以包方式傳輸數(shù)據(jù)的協(xié)議;

5、為收發(fā)兩端數(shù)據(jù)流同步創(chuàng)造條件; 確定將多個(gè)數(shù)據(jù)流合并和分離(即復(fù)用和解復(fù)用)的原則; 提供一種進(jìn)行加密數(shù)據(jù)傳輸?shù)目赡苄?。的任?wù),可知完成任務(wù),系統(tǒng)應(yīng)具備的基礎(chǔ)。3.系統(tǒng)的要點(diǎn)根據(jù)數(shù)字通信信息量可以逐段傳輸?shù)臋C(jī)理,將已編碼數(shù)據(jù)流在時(shí)間上以一定重復(fù)周期結(jié)構(gòu)分割成不能再細(xì)分的最小信息單元,這個(gè)最小信息單元就定義為數(shù)據(jù)包,幾個(gè)小數(shù)據(jù)包(Data Packet)又可以打包成大數(shù)據(jù)包(Data Pack)。用數(shù)據(jù)包傳輸?shù)膬?yōu)點(diǎn)是:網(wǎng)絡(luò)中信息可占用不同的連接線路和簡(jiǎn)單暫存;通過(guò)數(shù)據(jù)包交織將多個(gè)數(shù)據(jù)流組合(復(fù)用)成一個(gè)新的數(shù)據(jù)流;便于器按照相應(yīng)順序?qū)?shù)據(jù)包進(jìn)行靈活地整理。從而,數(shù)據(jù)包為數(shù)據(jù)流同步和復(fù)用奠定了基礎(chǔ)

6、。因此,MPEG-2 系統(tǒng)規(guī)范不僅采用了 PS、TS 和PES 三種數(shù)據(jù)包,而且也涉及 PS 和TS 兩種可以互相轉(zhuǎn)換的數(shù)據(jù)流。顯然,以數(shù)據(jù)包形式流是MPEG-2 系統(tǒng)的要點(diǎn)。為此,MPEG-2 系統(tǒng)規(guī)范定義了三種數(shù)據(jù)包及兩種數(shù)據(jù)流:和傳送數(shù)據(jù)1) 打包基本流(PES)將MPEG-2 壓縮編碼的基本流(ES-Elementary Stream)數(shù)據(jù)分組為度可變的數(shù)據(jù)包,稱為打包基本流(PES- Packetized Elementary Stream)。廣而言之,PES 為打包了的、音頻、數(shù)據(jù)、同步、識(shí)別信息數(shù)據(jù)通道。所謂 ES,是指只包含 1 個(gè)信源編碼器的數(shù)據(jù)流。即 ES 是編碼的數(shù)據(jù)流,

7、或編碼的音頻數(shù)據(jù)流,或其它編碼數(shù)據(jù)流的統(tǒng)稱。每個(gè) ES 都由若干個(gè)存取單元(AU-Access Unit)組成,每個(gè)AU 或音頻AU 都是由頭部和編碼數(shù)據(jù)兩部分組成的。將幀順序?yàn)?I1P4B2B3P7B5B6 的編碼ES,通過(guò)打包,就將 ES 變成僅含有 1 種性質(zhì) ES 的 PES 包,如僅含的 PES 包,僅含其它 ES 的PES 包。PES 包的組成見(jiàn)圖 2。ES 的 PES 包,僅含音頻 ES由圖 2 可見(jiàn),1 個(gè) PES 包是由包頭、ES 特有信息和包數(shù)據(jù) 3 個(gè)部分組成。由于包頭和 ES 特有信息二者可1 個(gè)數(shù)據(jù)頭,所以可認(rèn)為 1 個(gè) PES 包是由數(shù)據(jù)頭和包數(shù)據(jù)(有效載荷)兩個(gè)部

8、分組成的。包頭由起始碼前綴、數(shù)據(jù)流識(shí)別及 PES信息 3 部分。包起始碼前綴是用 23 個(gè)連續(xù)“0”和 1 個(gè)“1”的,用于表示有用信息種類的數(shù)據(jù)流識(shí)別,是 1 個(gè) 8 bit 的整數(shù)。由二者1 個(gè)的包起始碼,可用于識(shí)別數(shù)據(jù)包所屬數(shù)據(jù)流(,音頻,或其它)的性質(zhì)及序號(hào)。例如:比特序 1 1 0 ×××××是號(hào)碼為××××的MPEG-2 音頻數(shù)據(jù)流;比特序 1 1 1 0 ××××是號(hào)碼為××××的MPEG-2數(shù)據(jù)流。PES用于識(shí)

9、別,表明在此字段后的字節(jié)數(shù)。如,PES識(shí)別為 2 B ,即 2×8 = 16 bit 字寬,包總長(zhǎng)為 216-1=65535 B,分給數(shù)據(jù)頭 9 B(包頭 6 B + ES 特有信息 3 B ),可變長(zhǎng)度的包數(shù)據(jù)最大容量為 65526 B。盡管PES 包最大長(zhǎng)度可達(dá)(216 -1)=65535 B(Byte),但在通常的情況下是組成 ES 的若干個(gè) AU 中的由頭部和編碼數(shù)據(jù)兩部分組成的 1 個(gè)AU 長(zhǎng)度。1 個(gè)AU 相當(dāng)于編碼的 1 幅圖像或 1 個(gè)音頻幀,參見(jiàn)圖 2 右上角從 ES 到 PES 的示意圖。也可以說(shuō),每個(gè)AU 實(shí)際上是編碼數(shù)據(jù)流的顯示單元,即相當(dāng)于的 1 幅圖像或

10、1 個(gè)音頻幀的取樣。ES 特有信息是由 PES 包頭識(shí)別標(biāo)志、PES 包頭長(zhǎng)信息、信息用于調(diào)整信息區(qū)可變的填充字信息、PE節(jié) 4 部分組成的 PES 包S 優(yōu)先級(jí)別指示、數(shù)據(jù)適配entation Time Stamp)/信息。其中,PES 包頭識(shí)別標(biāo)志由 12 個(gè)部分組成:PES 加擾指示符、有否指示、原版或拷貝指示、有否顯示時(shí)間標(biāo)記(PTS-Pres時(shí)間標(biāo)記(DTS-Decode Time Stamp)標(biāo)志、PES 包頭有否基本流時(shí)鐘基準(zhǔn)(ESCR-Elementary Stream Clock Reference)信息標(biāo)志、PES 包頭有否基本流速率信息標(biāo)志、有否數(shù)字存儲(chǔ)(DSM)特技方式

11、信息標(biāo)志、有否附加的拷貝信息標(biāo)志、PES 包頭有否循環(huán)冗余校驗(yàn)(CRC-Cyclic Redundancy Check)信息標(biāo)志、有否 PES 擴(kuò)展標(biāo)志。有擴(kuò)展標(biāo)志,表明還存在其它信息。如,在有傳輸誤碼時(shí),通過(guò)數(shù)據(jù)包計(jì)數(shù)器,使接收端能以準(zhǔn)確的數(shù)據(jù)恢復(fù)數(shù)據(jù)流,或借助計(jì)數(shù)器狀態(tài),識(shí)別出傳輸時(shí)是否有數(shù)據(jù)包丟失。其中,有否 PTS/DTS 標(biāo)志,是解決視音頻同步顯示、防止器輸入緩存器上溢或下溢的關(guān)鍵所在。因?yàn)?,PTS 表明顯示單元出現(xiàn)在系統(tǒng)目標(biāo)器(STD-System Target Decoder)的時(shí)間, DTS 表明將存取單元全部字節(jié)從 STD 的 ES緩存器移走的時(shí)刻。編碼圖像幀次序?yàn)?I1P4

12、B2B3P7B5B6I10B8B9 的ES,加入 PTS/DTS 后,打包成一個(gè)個(gè)PES 包。每個(gè) PES有一個(gè)包頭,用于定義 PES 內(nèi)的數(shù)據(jù)內(nèi)容,提供定時(shí)資料。每個(gè)I、P、B 幀的包頭一個(gè) PTS 和 DTS,但 PTS 與 DTS 對(duì) B 幀都是一樣的,無(wú)須標(biāo)出B 幀的 DTS。對(duì) I 幀和 P 幀,顯示前一定要于器的重新排序緩存器中,經(jīng)過(guò)器輸入的圖像幀次序?yàn)?I1P4B2B3延遲(重新排序)后再顯示,一定要分別標(biāo)明 PTS 和 DTS。例如,P7B5B6I10B8B9,依器輸出的幀次序,應(yīng)該 P4 比B2、B3 在先,但顯示時(shí) P4 一定要比 B2、B3 在后,即 P4 要在提前數(shù)據(jù)流

13、中的時(shí)間標(biāo)志指引下,經(jīng)過(guò)緩存器重新排序,以重建編碼前幀次序 I1B2B3P4B5B6P7B8B9I10。顯然,PTS/DTS 標(biāo)志表明對(duì)確定或確定的時(shí)標(biāo)的存在,依靠時(shí)標(biāo)器,可知道該確定或確定信息開(kāi)始或顯示的時(shí)刻。例如,PTS/DTS 標(biāo)志可用于確定編碼、多路復(fù)用、重建的時(shí)間。2)流(PS)將具有共同時(shí)間基準(zhǔn)的一個(gè)或多個(gè) PES 組合(復(fù)合)而成的單一的數(shù)據(jù)流稱為am)。PS 包的結(jié)構(gòu)如圖 3 所示。流(Program Stre由圖 3 可見(jiàn),PS 包由包頭、系統(tǒng)頭、PES 包 3 部分。包頭由 PS 包起始碼、系統(tǒng)時(shí)鐘基準(zhǔn)(SCR-System Clock Reference)的基本部分、SC

14、R 的擴(kuò)展部分和 PS 復(fù)用速率 4 部分組成。PS 包起始碼用于識(shí)別數(shù)據(jù)包所屬數(shù)據(jù)流的性質(zhì)及序號(hào)。SCR 的基本部分是 1 個(gè) 33 bit 的數(shù),由 MPEG-1 與MPEG-2 兼容共用。SCR 擴(kuò)展部分是 1 個(gè) 9 bit的數(shù),由MPEG-2 單獨(dú)使用。SCR 是為了解決壓縮編碼圖像同步問(wèn)題產(chǎn)生的。因?yàn)?,I、B、P 幀經(jīng)過(guò)壓縮編碼后,各幀有不同的字節(jié)數(shù);輸入器的壓縮編碼圖像的幀順序 I1P4B2B3P7B5B6I10B8B9 中的 P4、I10 幀,需要經(jīng)過(guò)重新排序緩存器延遲后,才能重建編碼輸入圖像的幀順序 I1B2B3P4B5B6P7B8B9I10;ES 與音頻 ES 是以前后不同

15、的與音頻的比例交錯(cuò)傳送的。以上 3 條均不利于視音頻同步。所以,為解決同步問(wèn)題,提出在統(tǒng)一系統(tǒng)時(shí)鐘(SSTC-Single System Time Clock)條件下,在 PS 包頭時(shí)間標(biāo)志 SCR 的方法。整個(gè) 42 bit 字寬的SCR,按照 MPEG 規(guī)定分布在寬為 33 bit 的 1 個(gè)基礎(chǔ)字及寬為 9 bit 的 1 個(gè)擴(kuò)展區(qū)中。由于MPEG-1 采用了相當(dāng)于 33 bit 字寬的 90kHz 的時(shí)間基準(zhǔn),考慮到兼容,對(duì)節(jié)目流中的 SCR 也只用 33 bit。為了提高 PAL 或 NTSC 已編碼再編碼的精確性,MPEG-2 將時(shí)間分解力由 90kHz 提高到 27MHz 光柵結(jié)

16、構(gòu),使通過(guò) TS 時(shí)標(biāo)中的 9 bit 擴(kuò)展區(qū)后,精確性會(huì)更高。具體方法是將9 bit 用作循環(huán)計(jì)數(shù)器,計(jì)數(shù)到 300 時(shí),迅速向 33 bit 基本區(qū)轉(zhuǎn)移,同時(shí)將擴(kuò)展區(qū)計(jì)數(shù)器復(fù)原,以便由基本區(qū)向擴(kuò)展區(qū)轉(zhuǎn)移時(shí)重新計(jì)數(shù)。將 42 bit 作為時(shí)間標(biāo)志PS 包頭的第 5 到第 10 個(gè)字節(jié),表明 SCR 字段最后 1 個(gè)字節(jié)離開(kāi)編碼器的時(shí)間。在系統(tǒng)目標(biāo)(STD-System Target Decoder)輸入端,通過(guò)對(duì) 27MHz 的統(tǒng)一系統(tǒng)時(shí)鐘(SSTC)取樣后提取。顯然,在編碼端,STC 不僅產(chǎn)生了表明視音頻正確的顯示時(shí)間 PTS 和時(shí)間 DTS,而且也產(chǎn)生了表明 STC 本身瞬時(shí)值的時(shí)間標(biāo)記

17、 SCR。在端,應(yīng)相應(yīng)地使時(shí)本地用 SCRSSTC 再生,并正確應(yīng)用時(shí)間標(biāo)志,即通過(guò)鎖相環(huán)路(PLL-Phase Lock Loop),用相位與輸入的瞬時(shí) SCR 相位鎖相比較,確定過(guò)程是否同步,若不同步,則用這個(gè)瞬時(shí) SCR 調(diào)整 27MHz 時(shí)鐘頻率。每個(gè) SCR 字段的大小各不相同,其值是由復(fù)用數(shù)據(jù)流的數(shù)據(jù)率和 SSTC 的 27MHz 時(shí)鐘頻率確定的??梢?jiàn),采用時(shí)間標(biāo)志 PTS、DTS 和 SCR,是解決視音頻同步、幀的正確顯示次序、STD 緩存器上溢或下溢的好方法。PS 復(fù)用速率用于指示其速率大小。系統(tǒng)頭頭起始碼、系統(tǒng)頭長(zhǎng)度、速率界限范圍、音頻界限范圍、各種標(biāo)志指示、界限范圍、數(shù)據(jù)流

18、識(shí)別、STD 緩存器界限標(biāo)度、STD 緩存器標(biāo)度、(,音頻,或數(shù)據(jù))流識(shí)別等 10 個(gè)部分組成。各種標(biāo)志部分由固定標(biāo)志指示、約束系統(tǒng)參數(shù)數(shù)據(jù)流(CSPS-Constrained System Parameter Stream)指示、系統(tǒng)音頻鎖定標(biāo)志指示、系統(tǒng)鎖定標(biāo)志指示 4 個(gè)部分組成。其中,CSPS 是對(duì)圖像、速率、運(yùn)動(dòng)矢量范圍、數(shù)據(jù)率等系統(tǒng)參數(shù)的限定指示。顯然,PS 的形成分兩步完成:其一是將ES、音頻 ES、其他 ES 分別打包成PES 包、音頻PES 包、其他 PES 包:使每個(gè) PES 包內(nèi)只能存在 1 種性質(zhì)的 ES;每個(gè) PES 包的第一個(gè) AU 的包頭可包含PTS 和 DTS;

19、每個(gè) PES 包的包頭用于區(qū)別不同性質(zhì) ES 的數(shù)據(jù)流識(shí)別碼。這一切,使解復(fù)用和不同 ES 之間同步重放成為可能。其二是通過(guò) PS 復(fù)用器將 PES 包復(fù)用成 PS 包,即將每個(gè) PES 包再細(xì)分為更小的 PS 包。PS 包頭含有從數(shù)字媒介(DSM-Digital storage Medium)進(jìn)入系統(tǒng)器各個(gè)字節(jié)的時(shí)標(biāo),即預(yù)定到達(dá)時(shí)間表,它是時(shí)鐘調(diào)整和緩存器管理的參數(shù)。典型 PS器如圖 4 所示,圖中示意了數(shù)字器輸出的、符合ITU-R. 601 標(biāo)準(zhǔn)的數(shù)據(jù)幀順序 I1B2B3P4B5B6P7B8B9I10,與數(shù)字編碼器輸出的數(shù)字編碼 ES 幀順序 I1P4B2B3P7B5B6I10B8B9 二

20、者之間的關(guān)系。圖中 PS 解復(fù)用器實(shí)際上是系統(tǒng)解復(fù)用器和拆的組合,即解復(fù)用器將MPEG-2 的 PS 分解成一個(gè)個(gè) PES 包,拆包器將 PES 包拆成頭共同ES 和音頻 ES,最后輸入各自的器。系統(tǒng)頭提供數(shù)據(jù)流的系統(tǒng)特定信息,包頭一幀,用于將 PES 包數(shù)據(jù)流分割成時(shí)間上連續(xù)的PS 包??梢?jiàn),一個(gè)經(jīng)過(guò) MPEG-2 編碼的源是由一個(gè)或多個(gè)ES 和音頻 ES的,由于各個(gè) ES 共用 1 個(gè) 27MHz 的時(shí)鐘,可保證解碼端視音頻的同步。例如,一套經(jīng)過(guò)MPEG-2 編碼,轉(zhuǎn)換成 1 個(gè)ES 和 4 個(gè)音頻 ES。顯然,PS信息的軟件處理及交互多應(yīng)用。但是,PS 包度比較長(zhǎng)且可變,用于無(wú)誤碼環(huán)境,

21、適合于。顯然,PS 用于越長(zhǎng),同步越;在丟包時(shí)數(shù)據(jù)的重新組成,也越(磁盤、磁帶等)、演播室CD-I、MPEG-1 數(shù)據(jù)流。3) 傳輸流(TS)將具有共同時(shí)間基準(zhǔn)或具有時(shí)間基準(zhǔn)的一個(gè)或多個(gè) PES 組合而成的單一的數(shù)據(jù)流稱為傳輸流(Transport Stream)。TS 實(shí)際是面向數(shù)字化分配媒介(有線、地面網(wǎng))的傳輸層接口。對(duì)具有共同時(shí)時(shí)間基準(zhǔn)的各個(gè)PS 進(jìn)行傳輸復(fù)用,即將間基準(zhǔn)的兩個(gè)以上的 PES 先進(jìn)行復(fù)用,然后再對(duì)相互可有每個(gè) PES 再細(xì)分為更小的TS 包,TS 包結(jié)構(gòu)如圖 5 所示。由圖 5 可見(jiàn),TS 包由包頭、自適應(yīng)包數(shù)據(jù) 3 部分組成。每個(gè)度為固定的 188 B,包頭長(zhǎng)度占4

22、B,自適應(yīng)包數(shù)據(jù)長(zhǎng)度占 184 B。184 B 為有用信息空間,用于傳送已編碼的視音頻數(shù)據(jù)流。當(dāng)節(jié)目時(shí)鐘基準(zhǔn)(PCR-Program Clock Reference)存在時(shí),包頭還包括可變長(zhǎng)度的自適應(yīng)區(qū),包頭的長(zhǎng)度就會(huì)大于 4 B??紤]到與通信的關(guān)系,整個(gè)傳輸包固定長(zhǎng)度應(yīng)相當(dāng)于 4 個(gè) ATM 包。考慮到加密是按照 8 B順序加擾的,代表有用信息的自適應(yīng)8 B =184 B。包數(shù)據(jù)的長(zhǎng)度應(yīng)該是 8 B 的整數(shù)倍,即自適應(yīng)包數(shù)據(jù)為 23×TS 包的包頭由的同步字節(jié)、傳輸誤碼指示符、有效載荷單元起始指示符、傳輸優(yōu)先、包識(shí)別(PID-Packet Identification)、傳輸加擾、

23、自適應(yīng)區(qū)和連續(xù)計(jì)數(shù)器 8 個(gè)部分組成。其中,可用同步字節(jié)位串的自動(dòng)相關(guān)特性,檢測(cè)數(shù)據(jù)流中的包限制,建立包同步;傳輸誤碼指示符,是指有不能消除誤碼時(shí),采用誤碼校正器可表示 1bit 的誤碼,但無(wú)法校正;有效載荷單元起始指示符,表示該數(shù)據(jù)包是否存在確定的起始信息;傳輸優(yōu)先,是給 TS 包分配優(yōu)先權(quán);PID 值是由用戶確定的,器根據(jù) PID 將TS 上從不同ES 來(lái)的TS 包區(qū)別出來(lái),以重建原來(lái)的 ES;傳輸加擾,可指示數(shù)據(jù)包內(nèi)容是否加擾,但包頭和自適應(yīng)區(qū)永遠(yuǎn)不加擾;自適應(yīng)區(qū),用 2 bit 表示有否自適應(yīng)區(qū),即(01)表示有有用信息無(wú)自適應(yīng)區(qū),(10)表示無(wú)有用信息有自適應(yīng)區(qū),(11)表示有有用信

24、息有自適應(yīng)區(qū),(00)無(wú)定義;連續(xù)計(jì)數(shù)器可對(duì) PID 包傳送順序計(jì)數(shù),據(jù)計(jì)數(shù)器讀數(shù),接收端可頭對(duì)TS 包具有同步、識(shí)別、檢錯(cuò)及加密功能。是否有包丟失及包傳送順序錯(cuò)誤。顯然,包TS 包自適應(yīng)區(qū)由自適應(yīng)區(qū)長(zhǎng)、各種標(biāo)志指示符、與標(biāo)志有信息和填充數(shù)據(jù) 4 部分組成。其中標(biāo)志部分由間斷指示符、隨機(jī)存取指示符、ES 優(yōu)化指示符、PCR 標(biāo)志、接點(diǎn)標(biāo)志、傳輸數(shù)據(jù)標(biāo)志、原始 PCR 標(biāo)志、自適應(yīng)區(qū)擴(kuò)展標(biāo)志 8 個(gè)部分組成。重要的是標(biāo)志部分的 PCR 字段,可給編器的 27MHz 時(shí)鐘提供同步資料,進(jìn)行同步。其過(guò)程是,通過(guò) PLL,用時(shí)本地用 PCR 相位與輸入的瞬時(shí) PCR相位鎖相比較,確定過(guò)程是否同步,若不

25、同步,則用這個(gè)瞬時(shí) PCR 調(diào)整時(shí)鐘頻率。因?yàn)椋瑪?shù)字圖像采用了復(fù)雜而不同的壓縮編碼算法,造成每幅圖像的數(shù)據(jù)各不相同,使直接從壓縮編碼圖像數(shù)據(jù)的開(kāi)始部分獲取時(shí)鐘信息成為不可能。為此,選擇了某些(而非全部)TS 包的自適應(yīng)區(qū)來(lái)傳送定時(shí)信息。于是,被選中的TS 包的自適應(yīng)區(qū),可用于測(cè)定包信息的bit 和重要的信息。自適應(yīng)區(qū)無(wú)須伴隨每個(gè),多少主要由選中的TS 包的傳輸時(shí)標(biāo)參數(shù)決定。標(biāo)志中的隨機(jī)存取指示接點(diǎn)標(biāo)志,在變動(dòng)時(shí),為隨機(jī)進(jìn)入I 幀壓縮的數(shù)據(jù)流提供隨機(jī)進(jìn)入點(diǎn),也為當(dāng)?shù)靥峁┓奖?。自適應(yīng)區(qū)中的填充數(shù)據(jù)是由于 PES不可能正好轉(zhuǎn)為TS 包的整數(shù)倍,最后的TS 包保留一小部分有用容量,通過(guò)填充字節(jié)加以填補(bǔ)

26、,這樣可以防止緩存器下溢,保持總碼率恒定不變。4)特定信息(PSI)由上述可知,1 個(gè)TS 包由固定的 188B 組成,用于傳送已編碼視音頻數(shù)據(jù)流的有用信息占用 184B 空間。但是,還需要傳輸隨帶信息及解釋有關(guān) TS 特定結(jié)構(gòu)的信息(元數(shù)據(jù)),即特定信息(PSI-Program Specific Information)。用于說(shuō)明:1 個(gè)是由多少個(gè) ES 組成的;1 個(gè)是由哪些個(gè) ES 組成的;在哪些個(gè) PID 情況下,1 個(gè)相應(yīng)的器能找到 TS 中的各個(gè)數(shù)據(jù)包。這對(duì)于由不同的數(shù)據(jù)流復(fù)用成 1 個(gè)的TS 是 1 個(gè)決定性的條件。為了重建原來(lái)的 ES,就要追蹤從不同 ES 來(lái)的TS 包及其 P

27、ID。因此,一些結(jié)構(gòu)(Mapping Mechanism),如源結(jié)合表(PAT)和源表(PMT)兩種結(jié)構(gòu),會(huì)以打包的形式存在于TS 上,即借助于 PSI 傳輸一串描述了各種 ES 的表格來(lái)實(shí)現(xiàn)。MPEG 認(rèn)為,可用4 個(gè)不同的表格作出區(qū)別:源結(jié)合表(PAT-Program Association Table):在每個(gè) TS 上一個(gè) PAT,用于定義源映射表。用 MPEG 指定的 PID(00)標(biāo)明,通常用 PID=0 表示 。 條件接收表(CAT-Conditional Access Table):用于準(zhǔn)備數(shù)據(jù)組用的信息,如標(biāo)識(shí)、存取權(quán)的分配、各個(gè)碼序的等。用 MPEG 指定的 PID(01)

28、標(biāo)明,通常用 PID=1 表示。表(PMT-Program Map Table):在 TS 上,每個(gè)源一個(gè)對(duì)應(yīng)的 PMT,是借助裝源入 PAT 中號(hào)推導(dǎo)出來(lái)的。用于定義每個(gè)在 TS 上的源(Program),即將 TS 上每個(gè)源的 ES及其對(duì)應(yīng)的 PID 信息、數(shù)據(jù)的性質(zhì)、數(shù)據(jù)流之間關(guān)系列在一個(gè)表里。器要知道分配的 ES 的總數(shù),因?yàn)镸PEG 總共256 個(gè)不同的描述符,其中 ISO 占用 64 個(gè),其余由用戶使用。 網(wǎng)絡(luò)信息表(NIT- Network Information Table):可傳送網(wǎng)絡(luò)數(shù)據(jù)和各種參數(shù),如頻帶、轉(zhuǎn)發(fā)信號(hào)、通道寬度等。MPEG 尚未規(guī)定,僅在源結(jié)合表(PAT)中保

29、留了 1 個(gè)既定號(hào)“0”(Program-0)。有了 PAT 及 PMT 這兩種表,器就可以根據(jù) PID 將TS 上從不同的 ES 來(lái)的TS 包分別出來(lái)。特定信息(PSI)的結(jié)構(gòu),如圖 6 所示。根據(jù) PID 將TS 上從不同的 ES 來(lái)的TS 包分別分兩步進(jìn)行:其一是從 PID=0 的 PAT 上找出帶有 PMT 的那個(gè)源,如 Program-1,或 Program-2;其二是從所選擇的 PMT 中找到組成該源的各個(gè) ES 的 PID,如從 Program-1 箭頭所指的PMT-1 中 ES-2 所對(duì)應(yīng)的 Audio-1 的 PID 為 48,或從 Program-2 箭頭所指的 PMT-2

30、 中 ES-1 所對(duì)應(yīng)的的 PID 為 16。同樣,Program-1 的 MAP 的PID 為 22,ES-1 所對(duì)應(yīng)的-2 所對(duì)應(yīng)的Audio-1 的 PID 為 81,ES-1 所對(duì)應(yīng)的的 PID 為 54;Program-2 的 PMT-2 中 ES的 PID 為 16,MAP 的 PID 為 33;PAT 的 PID為 0;CAT管理信息(EMM-Entitlement Management Message)的 PID 為 1。這樣,就追蹤到了TS 上從不同的 ES 來(lái)的TS 包及其 PID,如圖 6 所示的TS 上不同ES 的TS 包的 PID 分別為 48、16、22、21、54

31、、0、16、33、1。顯然,器根據(jù) PID 將TS 上從不同的ES 來(lái)的TS 包分別出來(lái)的過(guò)程,也可以從圖 7 的TS 雙層解復(fù)用結(jié)構(gòu)圖中得到解釋。要注意,MPEG-2 的 TS 是經(jīng)過(guò)復(fù)用和傳輸復(fù)用兩層完成的:在復(fù)用時(shí)加入了 PMT;在傳輸復(fù)用時(shí)加入 PAT。所以,在解復(fù)用時(shí),就可以得到 PMT,如圖 7 中的 ES (MAP) (PMT-1)和 ES (MAP) (PMT-2);在傳輸解復(fù)用時(shí),就可以得到 PAT,如圖 7 中的PS-MAP。將圖 6 與圖 7 對(duì)照,就可以知道(未完待續(xù))器是如何追蹤到TS 上從不同的 ES 來(lái)的TS 包及其 PID 的。4.系統(tǒng)的復(fù)用多個(gè)信號(hào)在同 1 個(gè)

32、信道傳輸而不相互干擾,稱為多路復(fù)用。如果將第一層的多個(gè)多路復(fù)用器先分別進(jìn)行傳輸復(fù)用,而后再進(jìn)行第二層的多傳輸復(fù)用,就形成了雙層復(fù)用。圖 8 是系統(tǒng)雙層復(fù)用原理圖。單由圖可見(jiàn),編碼器不僅有編碼器和音頻編碼器,還編碼器。第一層的每個(gè)多路單傳輸復(fù)用器輸入信號(hào)有:ITU -R.601 標(biāo)準(zhǔn)數(shù)字,如幀順序?yàn)?I1B2B3 P4B5B6 P7B8B9 I10;AES/EBU數(shù)字音頻數(shù)據(jù);信息 PSI 及系統(tǒng)時(shí)鐘 STC 1-N 等信號(hào)。其中編碼器、音頻編碼器和數(shù)據(jù)提供給系統(tǒng)編碼器的是基本流 ES,加入 PTS 及 DTS,并分別打包成ES 的幀順序?yàn)?I1P4B2B3P7B5B6I10B8B9。經(jīng)過(guò)系統(tǒng)編

33、碼器PES、音頻 PES,數(shù)據(jù)本身提供的就是 PES。PSI數(shù)據(jù)流,數(shù)據(jù)CR有調(diào)用權(quán)、編碼密鑰通過(guò)條件收視表MPEG-2 TS ,并將傳輸復(fù)用器從 STC 導(dǎo)出的P相應(yīng)區(qū)段。這些PES、音頻 PES、數(shù)據(jù) PES 及 PSI,經(jīng)過(guò)加入 PID 及 PCR 的傳輸復(fù)用器后,將輸入基本流 ES 分割成傳輸包片段,并為每個(gè)片段配備 1 個(gè)數(shù)據(jù)頭(Header),就形成了一系列的 TS包。然后,通過(guò)各個(gè)不同性質(zhì)的數(shù)據(jù)流的數(shù)據(jù)包交織后,輸出MPEG-2 TS,其包含相應(yīng)傳輸系統(tǒng)器所需要的所有數(shù)據(jù)。這樣,從第一層的N 個(gè)單復(fù)用器輸出N 股MPEG-2 TS,通過(guò)各自的傳輸鏈路輸入第二層多路多傳輸復(fù)用器。從

34、 N 路 MPEG-2 TS 中提取出N 個(gè) PCR,從而再生出 STC 1-N,最后產(chǎn)生出N 個(gè)第二層多路多傳輸復(fù)用器用的新 PCR。多傳輸復(fù)用器的任務(wù)是在分析的基礎(chǔ)上,對(duì)多套復(fù)用,對(duì)數(shù)據(jù)包時(shí)標(biāo)更新。因?yàn)椋琈PEG 只1 個(gè)TS 只能有 1 張?jiān)唇Y(jié)合表 PAT,多節(jié)目傳輸復(fù)用器需要對(duì) PSI 表進(jìn)行分析,以便建立對(duì)新數(shù)據(jù)流適用的 PAT,修正有關(guān)數(shù)據(jù)包中的時(shí)間標(biāo)志,完成時(shí)標(biāo)更新。經(jīng)過(guò)第二層多傳輸復(fù)用器復(fù)用后,輸出MPEG-2 TS,可以繼續(xù)通過(guò)傳輸鏈路傳輸?shù)浇鈴?fù)用器,也可以采用誤碼保護(hù)編碼、信道編碼、調(diào)制技術(shù)后,通過(guò)、有線電視、地面無(wú)線電視傳輸。例如,將第二層多傳輸復(fù)用的MPEG-2 TS,

35、經(jīng)過(guò) QPSK 信道調(diào)制上,地面用戶通過(guò)數(shù)字電視接收機(jī)的 QPSK 解調(diào)器、解復(fù)用器、器直接接收;有線前端將下行信號(hào)先后經(jīng)過(guò)解調(diào)器、解通過(guò) QAM 電纜解調(diào)器、復(fù)用器、再?gòu)?fù)用器、QAM 電纜調(diào)制器后,饋送至有線電視網(wǎng),用戶數(shù)字電視解復(fù)用器、器接收;地面無(wú)線將接收的信號(hào)先后經(jīng)過(guò)解調(diào)器、解復(fù)用器、再?gòu)?fù)用器、COFDM 電纜調(diào)制器后,饋送至地面發(fā)射臺(tái)發(fā)射,用戶可通過(guò)數(shù)字電視器接收。由上述可明白:的 COFDM 解調(diào)器、解復(fù)用器、1)數(shù)據(jù)流的分割將 1 個(gè)數(shù)據(jù)流逐段分割成多個(gè)數(shù)據(jù)包,便利于不同數(shù)據(jù)流的數(shù)據(jù)包交織。2)最小組合1 個(gè)電視是由多個(gè)不同性質(zhì)的數(shù)據(jù)流的 ES 組成的,1 個(gè)電視的最小組合為 1

36、 個(gè)流,1 個(gè)音頻流, 1 個(gè)帶字母、字符的數(shù)據(jù)流(Tele text),其它信息業(yè)務(wù)數(shù)據(jù)流。3)PS 與TS 區(qū)別流 PS 只能由 1 套的 ES 組成,傳輸流 TS 一般由多套的 ES 組成。由于在說(shuō)明 TS 的基本流時(shí)標(biāo)時(shí),總是R。某 1而言,因此 TS 選擇了時(shí)鐘基準(zhǔn) PCR 的概念,而不是系統(tǒng)時(shí)鐘基準(zhǔn) SC5.系統(tǒng)的由前述,MPEG-2 系統(tǒng)要解決的問(wèn)題是:1)系統(tǒng)的復(fù)用與解復(fù)用MPEG-2 采用時(shí)分多路復(fù)用技術(shù),讓多路信號(hào)在同一信道上占用不同的時(shí)隙進(jìn)行道利用率。和傳輸,以提高信2)聲音圖像要同步顯示由于時(shí)分多路復(fù)用中的位時(shí)隙、路時(shí)隙、幀之間具有嚴(yán)格的時(shí)間關(guān)系,這就是同步。區(qū)分各路信

37、號(hào)以此為據(jù)。為了恢復(fù),先對(duì) ES 進(jìn)行。聲音、圖像信號(hào)的重現(xiàn)需要同步顯示,從而要求收發(fā)兩端數(shù)據(jù)流要達(dá)到同步。為此,MPEG-2 系統(tǒng)規(guī)范通過(guò)在數(shù)據(jù)中時(shí)間標(biāo)志來(lái)實(shí)現(xiàn):SCR 或 PCR 為重建系統(tǒng)時(shí)間基準(zhǔn)的絕對(duì)時(shí)標(biāo);在有效 PS 和TS 產(chǎn)生前,已PES 的 DTS 和 PTS 為和重現(xiàn)時(shí)刻的相對(duì)時(shí)標(biāo)。3)緩存器無(wú)上下溢MPEG-2 系統(tǒng)是由視音頻編碼器、編碼緩存器、系統(tǒng)編碼器及復(fù)用器、信道網(wǎng)絡(luò)編器及環(huán)境編器、系統(tǒng)器及解復(fù)用器、緩存器和視音頻器。其中,編碼緩存器和緩存器延遲環(huán)境編器和從視/音頻編碼器輸入到視音頻是可變的;信道網(wǎng)絡(luò)編器及器輸出,延遲是固定的。這表明,輸入視/音頻編碼器的數(shù)字圖像和音

38、頻取樣,經(jīng)過(guò)固定的、不能變的點(diǎn)到點(diǎn)延遲后,應(yīng)該精確地同時(shí)出現(xiàn)在視音頻碼緩存器無(wú)上、下溢。器的輸出端。編碼及緩存器的可變延遲的范圍就應(yīng)該受到嚴(yán)格限制,使解為了解決復(fù)用、同步、無(wú)溢出問(wèn)題,需要定義 1 個(gè)系統(tǒng)目標(biāo)器(STD-System Target Decoder)模型。用于解釋傳輸流 TS并恢復(fù)基本流 ES 時(shí)的過(guò)程;用于在復(fù)用器數(shù)據(jù)包交織時(shí)確定某些時(shí)間的邊界條件。因此,每個(gè)相應(yīng)的MPEG-2 TS 必須借助于專門的碼器模型。器模型來(lái)。圖 9 為TS 的系統(tǒng)目標(biāo)解STD 與實(shí)際器的主要差別是:STD 對(duì)數(shù)據(jù)流的操作是瞬時(shí)完成的,無(wú)須時(shí)間延遲。而實(shí)際器圖像每是有延遲的。于是,可以利用這個(gè)差別,根

39、據(jù) STD 設(shè)計(jì)器的緩存器的容量。例如,PAL 制器。要完全移走 1 幀圖像,隔 1/25 s出 1 幀,壓縮以 4Mb/s 碼率到達(dá)器比 STD 的時(shí)間要延遲 1/25 s ,其緩存器容量要比 STD 規(guī)定容量大 4Mb/s×1/25s = 0.16Mb。相對(duì)于 STD,視頻及顯示有延遲,音頻及顯示也應(yīng)延遲同樣的時(shí)間,以便視音頻正確同步。要防止 STD 上溢或下溢,首先要確定延遲時(shí)間。為此,就要找出第一個(gè) DTS 字段值與起始 SCR字段值的差值。這個(gè)差值指出器第一個(gè)I 幀在復(fù)用數(shù)據(jù)流第一個(gè) SCR 字段的最后 1 個(gè)字節(jié)之后的的時(shí)刻。利用I 幀和P 幀編碼時(shí)間和顯示時(shí)間的不同,計(jì)

40、算出 PTS 與 DTS 之時(shí)間差,從而確定P 幀在重新排序緩存器中的時(shí)間,或P 幀在重新排序緩存器中停留多長(zhǎng)時(shí)間后開(kāi)始。只要在器開(kāi)始前,完全傳送完 1 個(gè)存取單元,就產(chǎn)生下溢。若每個(gè)存取單元在前瞬時(shí)的緩存器最大充滿度與 STD 數(shù)據(jù)流緩存器容量大小比較適配,就產(chǎn)生上溢。由圖 9 可見(jiàn),MPEG-2 TS 包含N 個(gè) ES 的數(shù)據(jù)。按照 PID 值,根據(jù)ES 的性質(zhì)是的還是音頻的或系統(tǒng)的,通過(guò)換向器,將每個(gè)相關(guān)數(shù)據(jù)包切換到相應(yīng)路徑,并分別傳送給各個(gè)傳輸緩存器(TB-TransportBuffer)。如ES 輸入到傳輸緩存器 TB-1,音頻 ES 輸入到傳輸緩存器TB-N,PSI 輸入到系統(tǒng)緩存

41、器 SB-PSI.從 STD 輸入端傳送到TB 或 SB 是瞬時(shí)的。TB 的容量略大于 2 個(gè)傳輸流包的相應(yīng)長(zhǎng)度,MPEG 規(guī)定為 512 B。有利于較高復(fù)用器碼率與較低器存取速度相適應(yīng),因緩存器讀出采用較低的 ES 速率就可以實(shí)現(xiàn)。之所以要采用 ES 速率,是因?yàn)橐档?%。硬件對(duì)處理器支持的 PSI 信息分析的復(fù)雜性,從而規(guī)定緩存器讀出速度最大不超過(guò)傳輸速率 0.基本數(shù)據(jù)流從TB-1 輸出時(shí),由于包頭再也不能識(shí)別TS 數(shù)據(jù)包結(jié)構(gòu),并已去除了全部相關(guān)傳輸信息,同時(shí)誤差指示器ES 包的凈負(fù)荷數(shù)據(jù)全部送到主1 是瞬時(shí)完成的。可能有的包誤差。因此,要拋棄 PES 包頭,并將所有在TB-1 中的P器

42、 1,以便為器 1 提供數(shù)據(jù)。凈負(fù)荷數(shù)據(jù)從TB-1 傳送到主器DTS 標(biāo)明從 STD 的 ES緩存器移走存取單元全部數(shù)據(jù)的時(shí)刻。對(duì)輸入到主器 1-N 的所有存取單元的數(shù)據(jù),都必須在 DTS 規(guī)定的瞬時(shí)移走。器 1-N 及系統(tǒng)器的是瞬時(shí)完成的。順便說(shuō)明的是:傳輸數(shù)據(jù)包的同時(shí),誤差信息傳送給器,以便對(duì)數(shù)據(jù)內(nèi)容解擾,至于對(duì)內(nèi)容的進(jìn)一步解碼,已不是傳輸碼系統(tǒng)的任務(wù)。器的事情。數(shù)據(jù)解壓縮、顯示單元重建及在正確的顯示時(shí)間顯示已同步的序列,是解PTS 標(biāo)明 STD 出現(xiàn)顯示單元(PU-Presentation Unit)的時(shí)間,顯示之前,I 幀和P 幀需要經(jīng)過(guò)重新排序緩存器的延遲。信息 PSI 包括源結(jié)合表

43、 PAT(PID=0)、條件接收表 CAT(PID=1)、源表 PMT。由于 PSI 的數(shù)據(jù)量比較小,系統(tǒng)緩存器 SB-PSI 的規(guī)模限制在 1536B。到器的 PSI 傳輸流,在該器中檢查所期望的相關(guān)器通過(guò) PSI 表了解來(lái)自數(shù)據(jù)流的哪些數(shù)據(jù)包,即數(shù)據(jù)中哪些 PID 應(yīng)繼續(xù)傳送,其余不期望的值,是用于檢測(cè)TS 內(nèi)所需要的數(shù)據(jù)包的。(數(shù)據(jù)包可忽略。顯然,在源表 PMT 中的 PID二、MPEG-2 的編碼編碼是MPEG-2 標(biāo)準(zhǔn)的內(nèi)容之一,其涉及到 MPEG-2流層結(jié)構(gòu)、MPEG-2 幀間編碼結(jié)構(gòu)、MPEG-2 的類與級(jí)、MPEG-2 運(yùn)動(dòng)估值等技術(shù)。1. MPEG-2流層結(jié)構(gòu)為了便利于誤碼處

44、理、隨機(jī)搜索及編輯,MPEG-2 用句法定義了 1 個(gè)層次性結(jié)構(gòu),用于表示編碼數(shù)Sequen據(jù)。MPEG-2 具體的流層結(jié)構(gòu)如圖 10 所示:將 MPEG-2流分為圖像序列層(VSL-ce Layer)、圖像組層 (GOPL-Group of Pictures Layer)、圖像層(PL-Picture Layer)、宏塊條層(SL-SliceLayer)、宏塊層(ML-Macroblock Layer)、塊層(BL-Block Layer)共 6 個(gè)部分,每層應(yīng)。確定的功能與其對(duì)1) 圖像序列層(VSL)VSL 是由數(shù)據(jù)頭及一系列圖像組(GOP)組成的數(shù)據(jù)包,具體是指一整個(gè)要處理的連續(xù)圖像。

45、用于定義整個(gè)序列結(jié)構(gòu),可采用逐行或隔行兩種掃描方式。其中,數(shù)據(jù)頭給出了有關(guān)圖像水平大小、垂直大小、寬高比、幀速率、碼率、緩存校驗(yàn)器的大小、量化矩陣、層號(hào)(Layer-id)、分級(jí)法(Scalable mode)等,為提供了重要依據(jù)。2) 圖像組層(GOPL)GOPL 是圖像序列層中若干圖像組的 1 組圖像,由數(shù)據(jù)頭和若干幅圖像組成,用于支持過(guò)程中的隨機(jī)存取功能。圖像分組是從有利于隨機(jī)存取及編輯出發(fā)的,不是 MPEG-2 結(jié)構(gòu)組成的必要條件,可在分組與否之間靈活選擇。其中,數(shù)據(jù)頭給出了圖像編碼類型、碼表選擇、圖像組頭部開(kāi)始碼、磁帶時(shí)間及幀。碼、涉及B 幀處理的 closed GOP、broken

46、 link。為了給編輯數(shù)據(jù)流提供接入點(diǎn),第 1 個(gè)總是I3)圖像層(PL)PL 由數(shù)據(jù)頭和 1 幀圖像數(shù)據(jù)組成,是圖像組層若干幅圖像中的 1 幅,包含了 1 幅圖像的全部編碼信息。MPEG-2 圖像掃描可有逐行或隔行兩種方式:當(dāng)為逐行時(shí),圖像為逐幀壓縮;當(dāng)為隔行時(shí),圖像為逐場(chǎng)或逐幀壓縮,即在運(yùn)動(dòng)多的場(chǎng)景采用逐場(chǎng)壓縮,在運(yùn)動(dòng)少的場(chǎng)景采用逐幀壓縮。因?yàn)?,從整個(gè)幀中去除的空間冗余度比從個(gè)別場(chǎng)中去除得多。其中,數(shù)據(jù)頭提供的基本部分有頭起始碼、圖像編號(hào)的時(shí)間基準(zhǔn)、圖像(I,B,P)幀類型、緩存檢驗(yàn)器延遲時(shí)間等,擴(kuò)展部分有圖像編碼擴(kuò)展、圖像顯示擴(kuò)展、圖像空間分級(jí)擴(kuò)展、圖像時(shí)間分級(jí)擴(kuò)展等。其中,基本部分由

47、MPEG-1 及MPEG-2 共用,擴(kuò)展部分由MPEG-2。一幅圖像是由亮度取樣值和色度取樣值組成的,而亮度與色度樣值比例的大小是由取樣頻率之比決定的。在 MPEG-2 中,亮度與色度之間的比例格式有 4:2:0(或 4:0:2)、4:2:2、4:4:4 三種。4) 宏塊條層(SL)SL 由附加數(shù)據(jù)和一系列宏塊組成,其最小長(zhǎng)度 = 1 個(gè)宏塊,當(dāng)長(zhǎng)度 = 圖像寬度時(shí),就成了 MPEG-2層面中最大宏塊條長(zhǎng)度。為了隱匿誤差,提高圖像質(zhì)量,將圖像數(shù)據(jù)分成由若干個(gè)宏塊或宏塊條組成的一條條位串。一旦某宏塊條發(fā)生誤差,器可跳過(guò)此宏塊條至塊條的位置,使塊條不受有誤差而無(wú)法糾正的宏塊條的影響,一個(gè)位串中的宏

48、塊條越多,隱匿誤差性能就越好。為此,附加數(shù)據(jù)部分定塊條在整個(gè)圖像中的位置、默認(rèn)的全局量化參數(shù)、變量?jī)?yōu)先切換點(diǎn)(PBP-Priority Break Point)。其中,PBP 用于指明數(shù)據(jù)流在何處,器要在兩個(gè)數(shù)據(jù)流的恰當(dāng)點(diǎn)處切換,以保證完整、正確的信息,確保完整無(wú)誤。注意,在離散余弦反變換(IDCT-Inverse Discrete Cosine Transform)時(shí),SL 可提供重新同步功能。5) 宏塊層(ML)ML 是宏塊條層中一系列宏塊中的 1 塊,由附加數(shù)據(jù)、亮度塊和色度塊共同組成。其中,亮度為 16×16像素塊,稱為宏塊。宏塊是碼率壓縮中運(yùn)動(dòng)補(bǔ)償?shù)幕締卧?,?4 個(gè) 8

49、×8 像素塊,用于消除 P 圖像與B 圖像之間的時(shí)間冗余度。色度塊由多少個(gè) 8×8 像素塊,取決于亮度與色度之間取樣頻率的比例格式。如MPEG-2 有 4:2:0、4:2:2、4:4:4 三種宏塊結(jié)構(gòu),取樣結(jié)構(gòu)如圖 11 所示。圖中 4:2:0 是由 4 個(gè) 8×8 亮度(Y)像素塊、2 個(gè) 8×8 紅色(Cr)像素塊及 0 個(gè) 8×8亮度(Y)像素塊、0 個(gè) 8×8 紅色(Cr)像素塊及 2 個(gè) 8×8(Cb)像素塊的,或 4:0:2 是由 4 個(gè) 8×8(Cb)像素塊的,4:2:0 與 4:0:2 是交替進(jìn)行的

50、,使垂直分解力降低(類似 4:1:1 使水平分解力降低),只含有 1/4 的色度信息。4:2:2 是由 4 個(gè)8×8 亮度(Y)像素塊、2 個(gè) 8×8 紅色(Cr)像素塊及 2 個(gè) 8×8(Cb)像素塊的,只含有 1/2 的色度信息。4:4:4 是由 4 個(gè) 8×8 亮度(Y)像素塊、4 個(gè) 8×8 紅色(Cr)像素塊及 4 個(gè) 8×8(Cb)像素塊的,是全頻寬 YCrCb。宏塊層 ML 包含P 幀及B 幀的運(yùn)動(dòng)矢量(MV-Motion Vectors)。附加數(shù)據(jù)包含的信息有:表明宏塊在宏塊條層中位置的宏塊地址、說(shuō)明宏塊編碼方法及內(nèi)容

51、的宏塊類型、宏塊量化參數(shù)、區(qū)別運(yùn)動(dòng)矢量類型及大小、表明以場(chǎng)離散余弦變換(DCT- Discrete Cosine Transform)還是以幀 DCT 進(jìn)行編碼的 DCT 類型。6) 塊層(BL)BL 是只包含 1 種類型像素的 8×8 像素塊,即是單一的 8×8 亮度(Y)像素塊,或是單一的 8×8 紅色(Cr)像素塊,或是單一的 8×8(Cb)像素塊。它是提供 DCT 系數(shù)的最小單元,即其功能是傳送直流分量系數(shù)和交流分量系數(shù)。若需要對(duì)宏塊進(jìn)行 DCT,也要先將宏塊分成像素塊后再進(jìn)行。2. MPEG-2 幀間編碼結(jié)構(gòu)為了在高效壓縮編碼的條件下、獲得可隨

52、機(jī)存取的高壓縮比、高質(zhì)量圖像,MPEG 定義了I、P、B 三種圖像格式,分別簡(jiǎn)稱為幀內(nèi)圖(Intra Picture)、圖(Predicted Picture)及雙向圖(Bidirec tional Picture),即 I 圖、P 圖及B 圖,用于表示 1/30s 時(shí)間間隔的幀序列畫面。因?yàn)?,要滿足隨機(jī)存取的要求,僅利用I 圖本身信息進(jìn)行幀內(nèi)編碼就可以了;要滿足高壓縮比和高質(zhì)量圖像的要求,單靠 I 圖幀內(nèi)編碼還不行,還要加上由P 圖和B 圖參與的幀間編碼,以及塊匹配運(yùn)動(dòng)補(bǔ)償,即用前一幀圖像當(dāng)前圖像的因果預(yù)測(cè)和用后一幀圖像當(dāng)前圖像的內(nèi)插。這就要求幀內(nèi)編碼與幀間編碼平衡,因果與內(nèi)插間的平衡。平衡

53、的結(jié)果是隨機(jī)存取的高壓縮比、高質(zhì)量圖像的統(tǒng)一。圖 12 是MPEG-2 幀間編碼結(jié)構(gòu)圖,其中:1) 幀內(nèi)編碼圖(ICP)I 圖為不要基準(zhǔn)圖像編碼作為基準(zhǔn)所產(chǎn)生的圖像,稱為幀內(nèi)編碼圖(ICP-Intra Coded Pictures)。特點(diǎn)是:數(shù)據(jù)量最大;幀內(nèi)中等程度壓縮;無(wú)運(yùn)動(dòng),可采用自相關(guān)性,即幀內(nèi)相鄰像素、相鄰行的亮度、色度信號(hào)都具有漸變的空間相關(guān)性,可作靜止圖像處理,無(wú)條件傳送;圖像可隨機(jī)進(jìn)入壓縮圖像數(shù)據(jù)序列,進(jìn)行編碼。2)編碼圖(PCP)P 圖是以最近的上一個(gè)I 圖或P 圖為基準(zhǔn)進(jìn)行運(yùn)動(dòng)補(bǔ)償所產(chǎn)生的圖像,稱為編碼圖(PCP-Predictive Coded Pictures)。P 圖的

54、特點(diǎn)是:本身是前 I 圖或P 圖的前向(FP-Forward Prediction)結(jié)果,也是產(chǎn)生下一個(gè)P 圖的基準(zhǔn)圖像;高編碼效率,與 I 圖相較,可提供更大的壓縮比;前一個(gè)P 圖是下一個(gè)P 圖補(bǔ)償?shù)幕鶞?zhǔn),如果前者存在誤碼,則后者會(huì)將編碼誤差積累起來(lái)、下去。3) 雙向編碼圖(BPCP)目前對(duì)B 圖有兩種趨同的理解:其一,B 圖是同時(shí)以前面的I 圖或 P 圖和后面的P 圖或I 圖為基準(zhǔn)進(jìn)行所產(chǎn)生的圖像,稱為雙向編碼圖(BPCP-Bidirectional Predictive Coded Picture)。前運(yùn)動(dòng)補(bǔ)償面的I 圖或 P 圖代表“過(guò)去信息”,后面的 P 圖或I 圖代表“未來(lái)信息”,

55、由于同時(shí)使用了“過(guò)去”和“未來(lái)”兩種信息,所以稱為雙向。其二,由于幀序列相鄰幀畫面間的運(yùn)動(dòng)部分具有連續(xù)到時(shí)間相關(guān)性,可將當(dāng)前畫面看一畫面某一時(shí)刻圖像的位移,當(dāng)然位移方向及幅值在幀內(nèi)各處未必相同,只要用前面最近時(shí)刻的I 圖或 P 圖及代表運(yùn)動(dòng)的位移信息,便可出當(dāng)前圖像,稱為前向(FP)。根據(jù)某時(shí)刻的圖像及反映位移信息的運(yùn)動(dòng)矢量,出某時(shí)刻以前的圖像,以便出前一幀中沒(méi)有顯露而現(xiàn)在出現(xiàn)的信息,稱為后向(BP-Backword Prediction)。B 圖是將前向(FP)與后向(BP)同時(shí)使用并取其平均值后所產(chǎn)生的圖像,稱為雙向圖或平均值圖。由圖 12 可見(jiàn),一個(gè) GOP 由I 為起始的一串 IBP 幀組成,GOP 的長(zhǎng)度是前一個(gè)I 幀到下一個(gè)I 幀之前的B 幀之間的間隔,如 I1B2B3P4B5B6P7B8B9I10 中從I1 到 B9 就是GOP 的長(zhǎng)度。GOP 越長(zhǎng),MPEG-2編碼越有效,而數(shù)據(jù)流的編輯及組接越。一般,最多由 12 幀

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論