數(shù)字媒體壓縮技術(shù)_第1頁
數(shù)字媒體壓縮技術(shù)_第2頁
數(shù)字媒體壓縮技術(shù)_第3頁
數(shù)字媒體壓縮技術(shù)_第4頁
數(shù)字媒體壓縮技術(shù)_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字媒體基礎(chǔ)第一頁,共六十二頁。數(shù)字媒體壓縮技術(shù)教學(xué)目標(biāo):(1)了解數(shù)字媒體數(shù)據(jù)壓縮的原因。(2)理解數(shù)字媒體數(shù)據(jù)壓縮技術(shù)的不同分類。(3)掌握通用的數(shù)據(jù)壓縮編碼算法。(4)了解各種數(shù)字媒體數(shù)據(jù)壓縮的標(biāo)準(zhǔn)。第二頁,共六十二頁。學(xué)習(xí)內(nèi)容:1數(shù)據(jù)壓縮及分類2通用的數(shù)據(jù)壓縮技術(shù)3數(shù)字媒體壓縮標(biāo)準(zhǔn)第三頁,共六十二頁。1.1壓縮的可能性與信息冗余

經(jīng)過數(shù)字化處理后的圖形、圖像、視頻和音頻等媒體信息的數(shù)據(jù)量非常大,如果不進(jìn)行數(shù)據(jù)壓縮,計(jì)算機(jī)系統(tǒng)就無法對(duì)它進(jìn)行存儲(chǔ)、交換和傳輸。1)數(shù)字圖像2)數(shù)字視頻3)數(shù)字音頻(數(shù)據(jù)量的計(jì)算)1數(shù)據(jù)壓縮及分類第四頁,共六十二頁。1.1壓縮的可能性與信息冗余

數(shù)據(jù)能夠被壓縮的主要原因在于媒體數(shù)據(jù)中存在數(shù)據(jù)的信息冗余。信息量包含在數(shù)據(jù)之中,一般的數(shù)據(jù)冗余主要體現(xiàn)在:

1)空間冗余

2)結(jié)構(gòu)冗余

3)時(shí)間冗余

4)視覺冗余

5)知識(shí)冗余

6)信息熵冗余1數(shù)據(jù)壓縮及分類第五頁,共六十二頁。1.2數(shù)據(jù)壓縮分類第六頁,共六十二頁。按信息壓縮前后比較是否有損失進(jìn)行劃分:無損壓縮指使用壓縮后的數(shù)據(jù)進(jìn)行重構(gòu)(還原或解壓縮),重構(gòu)后的數(shù)據(jù)與原來的數(shù)據(jù)完全相同。常用的無損壓縮算法有霍夫曼(Huffman)算法和LZW算法。也稱為可逆編碼。有損壓縮指使用壓縮后的數(shù)據(jù)進(jìn)行重構(gòu),重構(gòu)后的數(shù)據(jù)與原來的數(shù)據(jù)有所不同,但不影響人對(duì)原始資料表達(dá)的信息造成誤解。也稱為不可逆編碼。第七頁,共六十二頁。按數(shù)據(jù)壓縮編碼的原理和方法進(jìn)行劃分:統(tǒng)計(jì)編碼:主要針對(duì)無記憶信源,根據(jù)信息碼字出現(xiàn)概率的分布特征而進(jìn)行壓縮編碼,尋找概率與碼字長(zhǎng)度間的最優(yōu)匹配。預(yù)測(cè)編碼:是利用空間中相鄰數(shù)據(jù)的相關(guān)性來進(jìn)行壓縮數(shù)據(jù)的。變換編碼:是將圖像時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào)進(jìn)行處理。分析–合成編碼:是指通過對(duì)源數(shù)據(jù)的分析,將其分解成一系列更適合于表示的“基元”或從中提取若干更為本質(zhì)意義的參數(shù),編碼僅對(duì)這些基本單元或特征參數(shù)進(jìn)行。第八頁,共六十二頁。無記憶信源【無記憶信源】(1)存在一個(gè)或多個(gè)基本符號(hào)集;(2)將多個(gè)基本符號(hào)集做笛卡兒積,形成一定長(zhǎng)度的聯(lián)合概率空間;(3)運(yùn)用外力的功(電動(dòng)勢(shì))將單個(gè)符號(hào)或一定長(zhǎng)度的符號(hào)序列從隨機(jī)事件轉(zhuǎn)化成必然事件,或者說,將一個(gè)隨機(jī)系統(tǒng)轉(zhuǎn)化成一個(gè)必然系統(tǒng);并且回退到原始空間中來,該原始空間的概率分布不因?yàn)槭录陌l(fā)生而改變。【有記憶信源】(1)存在一個(gè)或多個(gè)基本符號(hào)集;(2)將多個(gè)基本符號(hào)集做笛卡兒積,形成一定長(zhǎng)度的聯(lián)合概率空間;(3)運(yùn)用外力的功(電動(dòng)勢(shì))將單個(gè)符號(hào)或一定長(zhǎng)度的符號(hào)序列從隨機(jī)事件轉(zhuǎn)化成必然事件,或者說,將一個(gè)隨機(jī)系統(tǒng)轉(zhuǎn)化成一個(gè)必然系統(tǒng);不能回退到原始空間中來,即原始空間的概率分布因?yàn)槭录陌l(fā)生而改變。第九頁,共六十二頁。按照媒體的類型進(jìn)行壓縮劃分:圖像壓縮標(biāo)準(zhǔn):JPEG等聲音壓縮標(biāo)準(zhǔn):MP3運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn):MPEG、H.26x系列、AVS目錄第十頁,共六十二頁。2通用的數(shù)據(jù)壓縮技術(shù)行程編碼字典編碼熵編碼等PCMDMDPCM

通用的壓縮方法具有壓縮比低、通用性強(qiáng)等特點(diǎn)無損壓縮技術(shù)有損壓縮技術(shù)目錄第十一頁,共六十二頁。2.1編碼的理論基礎(chǔ)數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論。根據(jù)信息論的原理,可以找到最佳數(shù)據(jù)壓縮編碼方法,數(shù)據(jù)壓縮的理論極限是信息熵。熵是信息量的度量方法,它表示某一事件出現(xiàn)的消息越多,事件發(fā)生的可能性就越小,數(shù)學(xué)上就是概率越小。第十二頁,共六十二頁。信息與信息量信息量是指信源中某種事件的信息度量或含量。一個(gè)事件出現(xiàn)的可能性愈小,其信息量愈多,反之亦然。若pi為第i個(gè)事件的概率為0≤pi≤1,則該事件的信息量為

一個(gè)信源包括的所有數(shù)據(jù)叫數(shù)據(jù)量,而數(shù)據(jù)量中包含有冗余信息。信息量=數(shù)據(jù)量-冗余量第十三頁,共六十二頁。信息熵信息熵就是將信源所有可能事件的信息量的平均。設(shè)從N個(gè)數(shù)中選定任一個(gè)數(shù)xj的概率為p(xj),假定選定任意一個(gè)數(shù)的概率都相等,即p(xj)=1/N,則I(xj)=log2N=-log21/N

=-log2p(xj)=I[p(xj)]

上式中,p(xj)是信源X發(fā)出xj的概率。I(xj)的含義是信源X發(fā)出xj這個(gè)消息(隨機(jī)事件)后,接收端收到信息量的量度。第十四頁,共六十二頁。信息熵(續(xù))信源X發(fā)出的xj(j=1,2,…,n)共n個(gè)隨機(jī)事件的信息量的統(tǒng)計(jì)平均,即H(X)=E{I(xj)}=

H(X)稱為信源X的“熵”,即信源X發(fā)出任意一個(gè)隨機(jī)變量的平均信息量。其中,等概率事件的熵最大,假設(shè)有N個(gè)事件,此時(shí)熵為:

H(X)==第十五頁,共六十二頁。信息熵(續(xù))當(dāng)P(x1)=1時(shí),P(x2)=P(x3)=…=P(xj)=0,此時(shí)熵為

H(X)=-P(x1)=0由上可得熵的范圍為:

0≤H(X)≤第十六頁,共六十二頁。信息熵(續(xù))在編碼中用熵值來衡量是否為最佳編碼。若以Lc表示編碼器輸出碼字的平均碼長(zhǎng),其計(jì)算公式為:

Lc=(j=1,2,…,n)其中:P(xj)是信源X發(fā)出xj的概率,L(xj)為xj的編碼長(zhǎng)。第十七頁,共六十二頁。信息熵(續(xù))平均碼長(zhǎng)與信息熵之間的關(guān)系為:Lc≥H(X)有冗余,不是最佳。Lc

<H(X)不可能。Lc

=H(X)最佳編碼(Lc稍大于H(X))熵值為平均碼長(zhǎng)Lc的下限。第十八頁,共六十二頁。2.2霍夫曼編碼霍夫曼編碼(Huffman)是運(yùn)用信息熵原理的一種無損編碼方法,這種編碼方法根據(jù)源數(shù)據(jù)各信號(hào)發(fā)生的概率進(jìn)行編碼。在源數(shù)據(jù)中出現(xiàn)概率大的信號(hào),分配的碼字越短;出現(xiàn)概率越小的信號(hào),其碼字越長(zhǎng),從而達(dá)到用盡可能少的碼表示源數(shù)據(jù)。第十九頁,共六十二頁?;舴蚵幋a的算法:初始化,根據(jù)符號(hào)概率的大小順序?qū)Ψ?hào)進(jìn)行排序。把概率最小的兩個(gè)符號(hào)組成一個(gè)新符號(hào)(節(jié)點(diǎn)),即新符號(hào)的概率等于這兩個(gè)符號(hào)概率之和。重復(fù)第2步,直到形成一個(gè)符號(hào)為止(樹),其概率和等于1。分配碼字。碼字分配從最后一步開始反向進(jìn)行,即從最后兩個(gè)概率開始逐漸向前進(jìn)行編碼,對(duì)于每次相加的兩個(gè)概率,給概率大的賦“0”,概率小的賦“1”(也可以全部相反,如果兩個(gè)概率相等,則從中任選一個(gè)賦“0”,另一個(gè)賦“1”)。第二十頁,共六十二頁?;舴蚵幋a構(gòu)造出來的編碼值不是唯一的。對(duì)不同信號(hào)源的編碼效率不同。由于編碼長(zhǎng)度可變,因此譯碼時(shí)間較長(zhǎng);編碼長(zhǎng)度的不統(tǒng)一,也使得硬件實(shí)現(xiàn)有難度?;舴蚵幋a的特點(diǎn):第二十一頁,共六十二頁。2.3行程編碼行程編碼又稱行程長(zhǎng)度編碼(RunLengthEncoding,RLE),是一種熵編碼。這種編碼方法廣泛地應(yīng)用于各種圖像格式的數(shù)據(jù)壓縮處理中。行程編碼的原理是在給定的圖像數(shù)據(jù)中尋找連續(xù)重復(fù)的數(shù)值,然后用兩個(gè)字符取代這些連續(xù)值。即將具有相同值的連續(xù)串用其串長(zhǎng)和一個(gè)代表值來代替,該連續(xù)串就稱為行程,串長(zhǎng)稱為行程長(zhǎng)度。第二十二頁,共六十二頁。2.3行程編碼假定一幅灰度圖像,第n行的像素值為:用RLE編碼方法得到的代碼為:4160841140。代碼斜黑體表示的數(shù)字是行程長(zhǎng)度,黑體字后面的數(shù)字代表像素的顏色值。第二十三頁,共六十二頁。行程編碼分類:定長(zhǎng)編碼定長(zhǎng)編碼是指編碼的行程長(zhǎng)度所用的二進(jìn)制位數(shù)固定不定長(zhǎng)編碼變長(zhǎng)行程編碼是指對(duì)不同范圍的行程長(zhǎng)度使用不同位數(shù)的二進(jìn)制位數(shù)進(jìn)行編碼。使用變長(zhǎng)行程編碼需要增加標(biāo)志位來表明所使用的二進(jìn)制位數(shù)。第二十四頁,共六十二頁。2.4詞典編碼

詞典編碼(dictionaryencoding)技術(shù)屬于無損壓縮技術(shù),主要是利用數(shù)據(jù)本身包含許多重復(fù)的字符串的特性??梢杂靡恍┖?jiǎn)單的代號(hào)代替這些字符串,就可以實(shí)現(xiàn)壓縮,實(shí)際上就是利用了信源符號(hào)之間的相關(guān)性。字符串與代號(hào)的對(duì)應(yīng)表就是詞典。第二十五頁,共六十二頁。詞典編碼的種類:第一種方法的思想是查找目前正在壓縮的字符序列在以前輸入的數(shù)據(jù)中是否出現(xiàn)過,然后用出現(xiàn)過的字符串代替重復(fù)的部分,它的輸出僅僅是指向早期出現(xiàn)過的字符串“指針”。這里所指的詞典是指用以前處理過的數(shù)據(jù)表示編碼過程中遇到的重復(fù)部分。這類編碼的所有算法都是以LZ77算法為基礎(chǔ)的。第二十六頁,共六十二頁。詞典編碼的種類:第二種算法的思想是從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)“短語詞典”,這類短語不一定有具體的含義,可以是任意字符的組合。在編碼過程中遇到在“短語詞典”中出現(xiàn)的短語是,編碼器就輸出這個(gè)詞典中的短語“索引號(hào)”,而不是短語本身。第二十七頁,共六十二頁。2.4.1LZ77算法LZ77是以以色列計(jì)算機(jī)專家AbrahamLempel和JakobZiv在1977年開發(fā)和發(fā)表的。此算法的一個(gè)改進(jìn)算法是由Storer和Szymanski在1982年開發(fā)的,稱為L(zhǎng)ZSS算法。LZ77算法在某種意義上又可以稱為“滑動(dòng)窗口壓縮”,該算法將一個(gè)虛擬的、可以跟隨壓縮進(jìn)程滑動(dòng)的窗口作為詞典,要壓縮的字符串如果在該窗口中出現(xiàn),則輸出其出現(xiàn)位置和長(zhǎng)度。第二十八頁,共六十二頁。LZ77算法中涉及的概念

輸入字符流(inputstream):要被壓縮的字符序列。字符(character):輸入數(shù)據(jù)流中的基本單元。編碼位置(codingposition):輸入數(shù)據(jù)流中當(dāng)前要編碼的字符位置,指前向緩沖存儲(chǔ)器中的開始字符。前向緩沖存儲(chǔ)器(Lookaheadbuffer):存放從編碼位置到輸入數(shù)據(jù)流結(jié)束的字符序列的存儲(chǔ)器。窗口(window):指包含W個(gè)字符的窗口,字符是從編碼位置開始向后數(shù)也就是最后處理的字符數(shù)。指針(pointer):指向窗口中的匹配串且含長(zhǎng)度的指針。第二十九頁,共六十二頁。LZ77算法具體步驟(1)把編碼位置設(shè)置到輸入數(shù)據(jù)流的開始位置。(2)找窗口中最長(zhǎng)的匹配串(3)以“(Pointer,Length)Characters”的格式輸出,其中Pointer是指向窗口中匹配串的指針,Length表示匹配字符的長(zhǎng)度,Characters是前向緩沖存儲(chǔ)器中的不匹配的第1個(gè)符。(4)如果前向緩沖存儲(chǔ)器不是空的,則把編碼位置和窗口向前移(Length+1)個(gè)字符,然后返回到步驟(2)。第三十頁,共六十二頁。2.4.2LZW算法LZW壓縮算法是一種新穎的壓縮方法,它采用了一種先進(jìn)的串表壓縮,將每個(gè)第一次出現(xiàn)的串放在一個(gè)串表中,用一個(gè)數(shù)字來表示串,壓縮文件只存貯數(shù)字,則不存貯串,從而使圖像文件的壓縮效率得到較大的提高。LZW編碼是圍繞稱為詞典的轉(zhuǎn)換表來完成的。第三十一頁,共六十二頁。LZW算法中的術(shù)語和符號(hào)前綴(Prefix):在一個(gè)字符之前的字符序列。綴-符串(String):前綴+字符。碼字(Codeword):碼字流(Codestream):詞典(Dictionary):綴-符串表。當(dāng)前前綴(Currentprefix):當(dāng)前字符(Currentcharacter):當(dāng)前碼字(Currentcodeword):第三十二頁,共六十二頁。LZW編碼算法執(zhí)行步驟開始時(shí)的詞典包含所有可能的根(Root),而當(dāng)前前綴P是空的;當(dāng)前字符(C):=字符流中的下一個(gè)字符;判斷綴-符串P+C是否在詞典中1)如果“是”:P:=P+C//(用C擴(kuò)展P);2)如果“否”:①把代表當(dāng)前前綴P的碼字輸出到碼字流;②把綴-符串P+C添加到詞典;③令P:=C//(現(xiàn)在的P僅包含一個(gè)字符C);判斷字符流中是否還有字符要編碼1)如果“是”,就返回到步驟2;2)如果“否”:①把代表當(dāng)前前綴P的碼字輸出到碼字流;②結(jié)束。第三十三頁,共六十二頁。2.5脈沖編碼調(diào)制脈沖編碼調(diào)制(PCM)就是將模擬調(diào)制信號(hào)的采樣值變換為脈沖碼組。PCM編碼包括如下三個(gè)過程:采樣,將模擬信號(hào)轉(zhuǎn)換為時(shí)間離散的樣本脈沖序列。量化,將離散時(shí)間連續(xù)幅度的抽樣信號(hào)轉(zhuǎn)換成為離散時(shí)間離散幅度的數(shù)字信號(hào)。編碼,用一定位數(shù)的脈沖碼組表示量化采樣值。第三十四頁,共六十二頁。PCM系統(tǒng)原理圖第三十五頁,共六十二頁。PCM編碼的優(yōu)點(diǎn)有很強(qiáng)的抗干擾性能方便的利用計(jì)算機(jī)編程,實(shí)現(xiàn)各種智能化設(shè)計(jì)。第三十六頁,共六十二頁。2.6增量調(diào)制(DM)增量調(diào)制也稱△調(diào)制(DM),它是一種預(yù)測(cè)編碼技術(shù),是PCM編碼的一種變形。DM是對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼,將極性變成“0”和“1”這兩種可能的取值之一。如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為“正”,則用“1”表示;相反則用“0”表示,或者相反。第三十七頁,共六十二頁。DM波形編碼的原理在開始階段增量調(diào)制器的輸出不能保持跟蹤輸入信號(hào)的快速變化,這種現(xiàn)象就稱為增量調(diào)制器的“斜率過載”。在輸入信號(hào)緩慢變化部分,即輸入信號(hào)與預(yù)測(cè)信號(hào)的差值接近零的區(qū)域,增量調(diào)制器的輸出出現(xiàn)隨機(jī)交變的“0”和“1”。這種現(xiàn)象稱為增量調(diào)制器的粒狀噪聲。第三十八頁,共六十二頁。2.7差分脈沖編碼調(diào)制差分脈沖編碼調(diào)制(DPCM)是利用樣本與樣本之間存在的信息冗余度來進(jìn)行編碼的一種數(shù)據(jù)壓縮技術(shù)。差值脈沖編碼調(diào)制是利用信號(hào)的相關(guān)性找出可以反映信號(hào)變化特征的一個(gè)差值量進(jìn)行編碼。第三十九頁,共六十二頁。DPCM的基本工作原理根據(jù)過去的樣本去估算(estimate)下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)。它與脈沖編碼調(diào)制(PCM)不同處在于,PCM是直接對(duì)采樣信號(hào)進(jìn)行量化編碼,而DPCM是對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼。第四十頁,共六十二頁。DPCM的原理圖量化器S(k)+逆量化器預(yù)測(cè)器d(k)I(k)Se(k-1)8比特PCM樣本kPCM樣本k-1Se(k-1)dq(k)Sr(k)++-目錄第四十一頁,共六十二頁。3數(shù)字媒體壓縮標(biāo)準(zhǔn)

3.1聲音壓縮標(biāo)準(zhǔn)

MP3是MPEG-1的標(biāo)準(zhǔn)草案中音頻編碼的Layer3。

MP3最大特點(diǎn)是能以較小的比特率、較大壓縮比達(dá)到近乎完美的CD音質(zhì),制作簡(jiǎn)單,交流方便。

MP3壓縮編碼是一個(gè)國(guó)際性全開放的編碼方案,其編碼算法流程大致分為時(shí)頻映射、心理聲學(xué)模型、量化編碼三大功能模塊,這三個(gè)功能模塊是實(shí)現(xiàn)MP3編碼的關(guān)鍵。第四十二頁,共六十二頁。MP3編碼框圖第四十三頁,共六十二頁。MP4MP4是MPEG-2AAC(ISO/IEC13818-7)技術(shù)(AdvancedAudioCoding)。MP4的特點(diǎn)是音質(zhì)更加完美而壓縮比更大。它增加了諸如對(duì)立體聲的完美再現(xiàn)、比特流效果音掃描、多媒體控制、降噪等MP3沒有的特性,使得在音頻壓縮后仍能完美的再現(xiàn)CD的音質(zhì)。第四十四頁,共六十二頁。3.2圖像壓縮標(biāo)準(zhǔn)JPEG是國(guó)際標(biāo)準(zhǔn)組織(ISO)和國(guó)際電工委員會(huì)(IEC)制定出的第一套國(guó)際靜態(tài)圖像壓縮標(biāo)準(zhǔn):ISO/IEC10918-1號(hào)標(biāo)準(zhǔn)“多灰度連續(xù)色調(diào)靜態(tài)圖像壓縮編碼”俗稱為JPEG,以其優(yōu)異的性能,該標(biāo)準(zhǔn)一直到當(dāng)前仍被因特網(wǎng)、數(shù)碼相機(jī)等很多領(lǐng)域廣泛應(yīng)用。JPEG包含兩種基本的壓縮算法:無損壓縮算法(基于差分脈沖調(diào)制)和有損壓縮算法(基于離散余弦變換)。

可達(dá)到15~20的壓縮比。第四十五頁,共六十二頁。JPEG算法框圖第四十六頁,共六十二頁。JPEG算法壓縮編碼步驟(1)使用正向離散余弦變換(FDCT)把信息從空間域變換成頻率域的數(shù)據(jù),并利用數(shù)據(jù)的頻率特性進(jìn)行處理;(2)使用加權(quán)函數(shù)對(duì)DCT系數(shù)進(jìn)行量化,這個(gè)加權(quán)函數(shù)對(duì)于人的視覺系統(tǒng)是最佳的;(3)使用霍夫曼可變字長(zhǎng)熵編碼器對(duì)量化系數(shù)進(jìn)行編碼。第四十七頁,共六十二頁。JPEG壓縮編碼算法的主要計(jì)算步驟(1)正向離散余弦變換(FDCT)。(2)量化(quantization)。(3)Z字形編碼(zigzagscan)。(4)使用差分脈沖編碼調(diào)制(DPCM)對(duì)直流系數(shù)(DC)進(jìn)行編碼。(5)使用行程長(zhǎng)度編碼(RLE)對(duì)交流系數(shù)(AC)進(jìn)行編碼。(6)熵編碼(entropycoding)。第四十八頁,共六十二頁。JPEG2000JPEG2000彌補(bǔ)了傳統(tǒng)JPEG壓縮技術(shù)缺陷,有以下優(yōu)點(diǎn):高壓縮率支持無損壓縮和有損壓縮漸進(jìn)傳輸對(duì)感興趣區(qū)域壓縮第四十九頁,共六十二頁。3.3運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)1、MPEG標(biāo)準(zhǔn)運(yùn)動(dòng)圖像專家組MPEG是由國(guó)際標(biāo)準(zhǔn)化組織ISO和國(guó)際電工委員會(huì)IEC聯(lián)合成立的,負(fù)責(zé)開發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步標(biāo)準(zhǔn)。這個(gè)專家組開發(fā)的標(biāo)準(zhǔn)稱為MPEG標(biāo)準(zhǔn)。第五十頁,共六十二頁。MPEG-1標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)于1993年公布,用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的編碼。該標(biāo)準(zhǔn)包括五個(gè)部分,分別為:系統(tǒng)、電視圖像、音頻、一致性測(cè)試和軟件模擬。MPEG-1的數(shù)據(jù)流包含:圖像流、伴音流和系統(tǒng)流三種成分。第五十一頁,共六十二頁。MPEG-1譯碼器方框圖圖像流包含畫面信息,伴音流包含聲音信息,系統(tǒng)流實(shí)現(xiàn)圖像和伴音的同步,所有播放MPEG圖像和伴音數(shù)據(jù)所需的時(shí)鐘信息都包含在系統(tǒng)流中。第五十二頁,共六十二頁。MPEG-2標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)包括了系統(tǒng)、電視圖像、音頻、一致性測(cè)試、軟件模擬、數(shù)字存儲(chǔ)媒體命令和控制擴(kuò)展協(xié)議、先進(jìn)聲音編碼、編碼器實(shí)時(shí)接口擴(kuò)展標(biāo)準(zhǔn)、DSM-CC一致性擴(kuò)展測(cè)試等。MPEG-2的主要特點(diǎn)是:1)MPEG-2解碼器兼容MPEG-1和MPEG-2標(biāo)準(zhǔn)。2)其視頻數(shù)據(jù)速率為3Mb/s~15Mb/s,基本分辨率為720×576像素,每秒可播放30幀畫面。3)可以30∶1或更低的壓縮比提供具有廣播級(jí)質(zhì)量的視頻圖像。4)允許在畫面質(zhì)量、存儲(chǔ)容量和帶寬之間選擇,在一定范圍內(nèi)改變壓縮比。第五十三頁,共六十二頁。MPEG-2的系統(tǒng)模型第五十四頁,共六十二頁。MPEG-4標(biāo)準(zhǔn)MPEG-4標(biāo)準(zhǔn)于1998年11月公布,是各種音頻/視頻對(duì)象的編碼,包括了系統(tǒng)、電視圖像、音頻、一致性測(cè)試和參考軟件、傳輸多媒體集成框架等。MPEG-4為多媒體數(shù)據(jù)壓縮編碼提供的是一種格式、一種框架,而不是具體算法,以建立一種更自由的通信與開發(fā)環(huán)境。MPEG-4的目標(biāo)是支持多種多媒體的應(yīng)用,特別是多媒體信息基于內(nèi)容的檢索和訪問,可以根據(jù)不同的應(yīng)用需求現(xiàn)場(chǎng)配置解碼器。其編碼系統(tǒng)也是開放的,可以隨時(shí)加入新的有效的算法模塊。第五十五頁,共六十二頁。MPEG-4系統(tǒng)示意圖第五十六頁,共六十二頁。MPEG-7標(biāo)準(zhǔn)MPEG-7標(biāo)準(zhǔn)于2001年公布,稱為多媒體內(nèi)容描述接口,包括系統(tǒng)、描述定義語言、電視圖像、音頻、多媒體描述框架、參考軟件以及一致性測(cè)試七個(gè)部分。MPEG-7標(biāo)準(zhǔn)的目的是產(chǎn)生一個(gè)描述多媒體內(nèi)容的標(biāo)準(zhǔn),支持對(duì)多媒體信息在不同程度層面上的解釋和理解,從而使其可以根據(jù)用戶的需要進(jìn)行傳遞和存取。MPEG-7注重的是提供視聽信息內(nèi)容的描述方案,并不包括針對(duì)不同應(yīng)用的特征提取方法和搜索引擎。第五十七頁,共六十二頁。MPEG-21標(biāo)準(zhǔn)MPEG-21基于兩個(gè)基本概念:分布和處理基本單元(DigitalItem,DI)以及DI與用戶間的互操作。MPEG-21可表述為以一種高效、透明和可以互操作的方式支持用戶交換、接入、使用甚至操作DI的技術(shù)。DI是MPEG-21框架中一個(gè)具有標(biāo)準(zhǔn)表示、身份認(rèn)證和相關(guān)元數(shù)據(jù)的數(shù)字對(duì)象。這個(gè)實(shí)體是框架中分布和處理的基本單元。用戶是指與MPEG-21進(jìn)行環(huán)境交互或者使用DI的任何實(shí)體。MPEG-21可以被看成是提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論