第2章 多媒體信息壓縮_第1頁
第2章 多媒體信息壓縮_第2頁
第2章 多媒體信息壓縮_第3頁
第2章 多媒體信息壓縮_第4頁
第2章 多媒體信息壓縮_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、p概述:概述: 本章主要講述了多媒體數(shù)據(jù)的壓縮技術(shù)。本章主要講述了多媒體數(shù)據(jù)的壓縮技術(shù)。 1、數(shù)據(jù)壓縮的基本原理和方法;、數(shù)據(jù)壓縮的基本原理和方法; 2、統(tǒng)計(jì)編碼、統(tǒng)計(jì)編碼 3、圖像壓縮編碼、圖像壓縮編碼 4、數(shù)字音頻壓縮編碼、數(shù)字音頻壓縮編碼 5、數(shù)字視頻壓縮編碼、數(shù)字視頻壓縮編碼 p為什么要進(jìn)行數(shù)據(jù)壓縮?為什么要進(jìn)行數(shù)據(jù)壓縮? p多媒體信息多媒體信息包括了文本、數(shù)據(jù)、聲音、動(dòng)畫、圖包括了文本、數(shù)據(jù)、聲音、動(dòng)畫、圖 形、圖像以及視頻等多種媒體信息。雖然經(jīng)過數(shù)形、圖像以及視頻等多種媒體信息。雖然經(jīng)過數(shù) 字化處理后其字化處理后其數(shù)據(jù)量是非常大的,如果不進(jìn)行數(shù)數(shù)據(jù)量是非常大的,如果不進(jìn)行數(shù) 據(jù)壓縮

2、處理,計(jì)算機(jī)系統(tǒng)就無法對(duì)它進(jìn)行存儲(chǔ)和據(jù)壓縮處理,計(jì)算機(jī)系統(tǒng)就無法對(duì)它進(jìn)行存儲(chǔ)和 交換。交換。另一個(gè)原因是圖像、音頻和視頻這些另一個(gè)原因是圖像、音頻和視頻這些媒體媒體 具有很大的壓縮潛力。具有很大的壓縮潛力。因?yàn)樵诙嗝襟w數(shù)據(jù)中,存因?yàn)樵诙嗝襟w數(shù)據(jù)中,存 在著空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、在著空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、 視覺冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì)視覺冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì) 冗余等。它們?yōu)閿?shù)據(jù)壓縮技術(shù)的應(yīng)用提供了可能冗余等。它們?yōu)閿?shù)據(jù)壓縮技術(shù)的應(yīng)用提供了可能 的條件。的條件。 p空間冗余:相鄰區(qū)域空間冗余:相鄰區(qū)域 p時(shí)間冗余:相鄰時(shí)間時(shí)間冗余

3、:相鄰時(shí)間 p結(jié)構(gòu)冗余:相鄰位置結(jié)構(gòu)冗余:相鄰位置 p知識(shí)冗余:知識(shí)推理知識(shí)冗余:知識(shí)推理 p視覺冗余:邊緣區(qū)域視覺冗余:邊緣區(qū)域 p相似性冗余:多個(gè)區(qū)域相似相似性冗余:多個(gè)區(qū)域相似 p聽覺冗余:較弱的聲音聽覺冗余:較弱的聲音 p數(shù)據(jù)壓縮技術(shù)的分類數(shù)據(jù)壓縮技術(shù)的分類 (1)根據(jù)質(zhì)量有無損失可分為)根據(jù)質(zhì)量有無損失可分為有損失有損失 編碼編碼和和無損失編碼。無損失編碼。 (2)根據(jù)數(shù)據(jù)壓縮算法,可以將數(shù)據(jù))根據(jù)數(shù)據(jù)壓縮算法,可以將數(shù)據(jù) 壓縮技術(shù)分為壓縮技術(shù)分為統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、 變換編碼、分析合成編碼和其他變換編碼、分析合成編碼和其他 編碼編碼。 p統(tǒng)計(jì)編碼:根據(jù)出現(xiàn)的概率

4、分布統(tǒng)計(jì)編碼:根據(jù)出現(xiàn)的概率分布 p預(yù)測(cè)編碼:原始信號(hào)取樣,量化存儲(chǔ)差值預(yù)測(cè)編碼:原始信號(hào)取樣,量化存儲(chǔ)差值 pPCM編碼:對(duì)連續(xù)語音進(jìn)行采樣編碼:對(duì)連續(xù)語音進(jìn)行采樣 p量化與向量化編碼:將模擬量轉(zhuǎn)化數(shù)字量化與向量化編碼:將模擬量轉(zhuǎn)化數(shù)字 p頻段劃分編碼:基于頻段劃分處理頻段劃分編碼:基于頻段劃分處理 p變換編碼:對(duì)信號(hào)進(jìn)行函數(shù)變換變換編碼:對(duì)信號(hào)進(jìn)行函數(shù)變換 p知識(shí)編碼:規(guī)則庫知識(shí)編碼:規(guī)則庫 p混合編碼:兩種以上編碼混合編碼:兩種以上編碼 冗余壓縮法(無損壓縮法)冗余壓縮法(無損壓縮法) 該方法在壓縮時(shí)去掉部分冗余信息,而該方法在壓縮時(shí)去掉部分冗余信息,而 這些被丟失信息經(jīng)過解壓后可以完整

5、的被恢這些被丟失信息經(jīng)過解壓后可以完整的被恢 復(fù)到壓縮前的狀態(tài),是一個(gè)復(fù)到壓縮前的狀態(tài),是一個(gè)可逆可逆的過程。因的過程。因 此,冗余壓縮法不會(huì)產(chǎn)生數(shù)據(jù)失真,一般用此,冗余壓縮法不會(huì)產(chǎn)生數(shù)據(jù)失真,一般用 于于文本、數(shù)據(jù)文本、數(shù)據(jù)的壓縮,以保證完全的恢復(fù)原的壓縮,以保證完全的恢復(fù)原 始數(shù)據(jù)。但這種方法的壓縮比較小,一般在始數(shù)據(jù)。但這種方法的壓縮比較小,一般在 2:15:1之間。之間。 熵壓縮法(有損壓縮法)熵壓縮法(有損壓縮法) 該方法壓縮時(shí)會(huì)丟失部分冗余信息,且該方法壓縮時(shí)會(huì)丟失部分冗余信息,且 這些被丟失信息不能被恢復(fù),是一個(gè)這些被丟失信息不能被恢復(fù),是一個(gè)不可逆不可逆 的過程。解壓后的數(shù)據(jù)存

6、在一定程度的失真。的過程。解壓后的數(shù)據(jù)存在一定程度的失真。 這種壓縮方法的壓縮比可達(dá)幾十到上百,常這種壓縮方法的壓縮比可達(dá)幾十到上百,常 用于用于圖像、聲音、動(dòng)態(tài)視頻圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓等數(shù)據(jù)的壓縮??s。 p數(shù)據(jù)壓縮技術(shù)的性能指標(biāo) (1)壓縮比壓縮比 :壓縮比例:壓縮比例 (2)壓縮、解壓縮速度壓縮、解壓縮速度 (3)壓縮質(zhì)量壓縮質(zhì)量 :感知效果:感知效果 p 統(tǒng)計(jì)編碼屬于無損壓縮編碼,是根統(tǒng)計(jì)編碼屬于無損壓縮編碼,是根 據(jù)信源符號(hào)出現(xiàn)概率的分布特性而據(jù)信源符號(hào)出現(xiàn)概率的分布特性而 進(jìn)行的壓縮編碼。進(jìn)行的壓縮編碼。 p其目的是在信源符號(hào)和碼字之間建其目的是在信源符號(hào)和碼字之間建 立明

7、確的一一對(duì)應(yīng)關(guān)系,以便在恢立明確的一一對(duì)應(yīng)關(guān)系,以便在恢 復(fù)時(shí)能準(zhǔn)確地再現(xiàn)原信號(hào),同時(shí)要復(fù)時(shí)能準(zhǔn)確地再現(xiàn)原信號(hào),同時(shí)要 使平均碼長(zhǎng)或碼率盡量小。使平均碼長(zhǎng)或碼率盡量小。 p 相關(guān)概念相關(guān)概念 p信息:信息:信息是用不確定性的量度定義的。信息是用不確定性的量度定義的。 p信息量:信息量:是指從是指從N個(gè)相等可能事件中選出一個(gè)相等可能事件中選出一 個(gè)事件所需要的信息度量或含量,也就是個(gè)事件所需要的信息度量或含量,也就是 在辯識(shí)在辯識(shí)N個(gè)事件中特定的一個(gè)事件的過程中個(gè)事件中特定的一個(gè)事件的過程中 所需要提問所需要提問“是或否是或否”的最少次數(shù)的最少次數(shù) p 相關(guān)概念相關(guān)概念 (3) 熵:熵:如果將信

8、源所有可能事件的信息如果將信源所有可能事件的信息 量進(jìn)行平均,就得到了信息熵量進(jìn)行平均,就得到了信息熵(entropy)。熵。熵 就是平均信息量。就是平均信息量。 p如果用如果用0 0和和1 1組成的二進(jìn)制數(shù)碼為含有組成的二進(jìn)制數(shù)碼為含有n n個(gè)符個(gè)符 號(hào)的某條信息編碼,假設(shè)符號(hào)號(hào)的某條信息編碼,假設(shè)符號(hào)FnFn在整條信在整條信 息中重復(fù)出現(xiàn)的概率為息中重復(fù)出現(xiàn)的概率為PnPn,則該符號(hào)的熵,則該符號(hào)的熵 也即表示該符號(hào)所需的位數(shù)為:也即表示該符號(hào)所需的位數(shù)為: pEn = En = loglog2 2(Pn)(Pn) p整條信息的熵,即表示整條信息所需的位整條信息的熵,即表示整條信息所需的位

9、 數(shù)為:數(shù)為:E = EnE = En p例如:對(duì)下面這條只出現(xiàn)了例如:對(duì)下面這條只出現(xiàn)了a a、b b、c c三個(gè)字符的字三個(gè)字符的字 符串:符串:aabbaccbaa aabbaccbaa ,字符串長(zhǎng)度為,字符串長(zhǎng)度為1010,字符,字符a a、b b、 c c分別出現(xiàn)了分別出現(xiàn)了5 5、3 3、2 2次,則次,則a a、b b、c c在信息中出現(xiàn)在信息中出現(xiàn) 的概率分別為的概率分別為0.50.5、0.30.3、0.20.2,他們的熵分別為:,他們的熵分別為: pEa=-logEa=-log2 2(0.5)=1(0.5)=1 pEb=-logEb=-log2 2(0.3)=1.737(0.

10、3)=1.737 pEc=-logEc=-log2 2(0.2)=2.322(0.2)=2.322 pE=EaE=Ea* *5+Eb5+Eb* *3+Ec3+Ec* *2=14.8552=14.855位位 最佳編碼定理 p在變字長(zhǎng)碼中,對(duì)于出現(xiàn)概率大的信息符在變字長(zhǎng)碼中,對(duì)于出現(xiàn)概率大的信息符 號(hào)編以短字長(zhǎng)的碼,對(duì)于出現(xiàn)概率小的信號(hào)編以短字長(zhǎng)的碼,對(duì)于出現(xiàn)概率小的信 息符號(hào)編以長(zhǎng)字長(zhǎng)的碼,如果碼字長(zhǎng)度嚴(yán)息符號(hào)編以長(zhǎng)字長(zhǎng)的碼,如果碼字長(zhǎng)度嚴(yán) 格按照符號(hào)概率的大小的相反順序排列,格按照符號(hào)概率的大小的相反順序排列, 則平均碼字長(zhǎng)度一定小于按任何其它符號(hào)則平均碼字長(zhǎng)度一定小于按任何其它符號(hào) 順序排列

11、方式得到的碼字長(zhǎng)度。順序排列方式得到的碼字長(zhǎng)度。 Huffman 編碼編碼 步驟:步驟: (1 1)概率統(tǒng)計(jì),得到)概率統(tǒng)計(jì),得到n n個(gè)不同概率的信息符號(hào);個(gè)不同概率的信息符號(hào); (2 2)將)將n n個(gè)信源信息符號(hào)的個(gè)信源信息符號(hào)的n n個(gè)概率,按概率大小排序;個(gè)概率,按概率大小排序; (3 3)將)將n n個(gè)概率中,最后兩個(gè)小概率相加,這時(shí)概率個(gè)數(shù)減個(gè)概率中,最后兩個(gè)小概率相加,這時(shí)概率個(gè)數(shù)減 為為n-1n-1個(gè);個(gè); (4 4)將)將n-1n-1個(gè)概率,按大小重新排序;個(gè)概率,按大小重新排序; (5 5)重復(fù)()重復(fù)(3 3),將新排序后的最后兩個(gè)小概率相加,相加),將新排序后的最后兩

12、個(gè)小概率相加,相加 和與其余概率再排序;和與其余概率再排序; (6 6)如此反復(fù)重復(fù))如此反復(fù)重復(fù)n-2n-2次,得到只剩兩個(gè)概率序列;次,得到只剩兩個(gè)概率序列; (7 7)以二進(jìn)制碼元()以二進(jìn)制碼元(0 0,1 1)賦值,構(gòu)成哈夫曼碼字,編碼)賦值,構(gòu)成哈夫曼碼字,編碼 結(jié)束。結(jié)束。 0 1 0.39 0 1 0.35 0 1 0.61 1 0 0 0.26 1 0 1 0.11 a1 a2 a3 a4 a5 a6 a7 0.20 0.19 0.18 0.17 0.15 0.10 0.01 10 11 000 001 010 0110 0111 信源符號(hào)信源符號(hào)概率概率HuffmanHuf

13、fman碼碼編碼過程編碼過程 HuffmanHuffman編碼過程編碼過程 x1 x2 x3 x4 x5 x6 x7 0.35 0.20 0.15 0.10 0.10 0.06 0.04 0.35 0.20 0.15 0.10 0.10 0.10 0.35 0.20 0.20 0.15 0.10 0.35 0.25 0.20 0.20 0.40 0.35 0.25 0.60 0.40 信源符號(hào)信源符號(hào) 概率概率 編碼過程編碼過程 第一步第一步第二步第二步第五步第五步第四步第四步第三步第三步 輸入輸入輸入輸入 HuffmanHuffman編碼步驟編碼步驟 圖圖4.8 Huffman4.8 Huf

14、fman碼字的構(gòu)成碼字的構(gòu)成 x1 x2 x3 x4 x5 x6 x7 0.35 0.20 0.15 0.10 0.10 0.06 0.04 0.35 0.20 0.15 0.10 0.10 0.10 0.35 0.20 0.20 0.15 0.10 0.35 0.25 0.20 0.20 0.40 0.35 0.25 0.60 0.40 第一步第一步第二步第二步第五步第五步第四步第四步第三步第三步碼長(zhǎng)碼長(zhǎng) 輸入輸入 哈夫曼碼哈夫曼碼 2 2 3 3 3 4 4 00 10 010 011 110 1110 1111 00 10 010 011 110 111 00 10 11 010 011

15、 00 01 10 11 1 00 01 0 1 x1 x2 x3 x4 x5 x6 x7 0.35 0.20 0.15 0.10 0.10 0.06 0.04 碼長(zhǎng)碼長(zhǎng)哈夫曼碼哈夫曼碼 2 2 3 3 3 4 4 00 10 010 011 110 1110 1111 信源符號(hào)信源符號(hào)概率概率編碼過程編碼過程 0 1 0.25 0 1 0.60 0 1 0.40 0 1 0 1 0.20 0 1 0.10 pelbits LPLPN j j jj n j j /55. 2 4)04. 006. 0( 3)10. 010. 015. 0(2)20. 035. 0( )( 7 11 碼字的平均碼

16、長(zhǎng)碼字的平均碼長(zhǎng)N按下式計(jì)算:按下式計(jì)算: Pj:信源符號(hào):信源符號(hào)Xj出現(xiàn)的概率出現(xiàn)的概率 Lj:編碼長(zhǎng)度:編碼長(zhǎng)度 0.35 0.20 0.15 0.10 0.10 0.06 0.04 碼長(zhǎng)碼長(zhǎng) 2 2 3 3 3 4 4 00 10 010 011 110 1110 1111 概率概率哈夫曼碼哈夫曼碼 行程編碼行程編碼 行程編碼的基本原理是:用一個(gè)符號(hào)值行程編碼的基本原理是:用一個(gè)符號(hào)值 或串長(zhǎng)代替具有相同值的連續(xù)符號(hào)(連或串長(zhǎng)代替具有相同值的連續(xù)符號(hào)(連 續(xù)符號(hào)構(gòu)成了一段連續(xù)的續(xù)符號(hào)構(gòu)成了一段連續(xù)的“行程行程”),), 使符號(hào)長(zhǎng)度少于原始數(shù)據(jù)的長(zhǎng)度。使符號(hào)長(zhǎng)度少于原始數(shù)據(jù)的長(zhǎng)度。 例如

17、:例如:55555577777333222211111115555557777733322221111111,其行程,其行程 編碼為:(編碼為:(5 5,6 6)()(7 7,5 5)()(3 3,3 3)()(2 2,4 4) (l l,7 7)。)。 算術(shù)編碼算術(shù)編碼 算術(shù)編碼從全序列出發(fā),采用遞推形式的算術(shù)編碼從全序列出發(fā),采用遞推形式的 連續(xù)編碼。它不是將單個(gè)信源符號(hào)映射成連續(xù)編碼。它不是將單個(gè)信源符號(hào)映射成 一個(gè)碼字,而是將整個(gè)輸入符號(hào)序列映射一個(gè)碼字,而是將整個(gè)輸入符號(hào)序列映射 為實(shí)數(shù)軸上的為實(shí)數(shù)軸上的00,11區(qū)間內(nèi)的一個(gè)間隔,區(qū)間內(nèi)的一個(gè)間隔, 其長(zhǎng)度就等于該序列的概率,并在該

18、間隔其長(zhǎng)度就等于該序列的概率,并在該間隔 內(nèi)選擇一個(gè)代表性的二進(jìn)制小數(shù),作為實(shí)內(nèi)選擇一個(gè)代表性的二進(jìn)制小數(shù),作為實(shí) 際的編碼輸出,使其平均碼長(zhǎng)逼近信源的際的編碼輸出,使其平均碼長(zhǎng)逼近信源的 熵,從而達(dá)到高效編碼的目的熵,從而達(dá)到高效編碼的目的 LZW編碼編碼 pLZW壓縮技術(shù)把數(shù)據(jù)流中復(fù)雜的數(shù)據(jù)用壓縮技術(shù)把數(shù)據(jù)流中復(fù)雜的數(shù)據(jù)用 簡(jiǎn)單的代碼來表示,并把代碼和數(shù)據(jù)的對(duì)簡(jiǎn)單的代碼來表示,并把代碼和數(shù)據(jù)的對(duì) 應(yīng)關(guān)系建立一個(gè)轉(zhuǎn)換表,又叫應(yīng)關(guān)系建立一個(gè)轉(zhuǎn)換表,又叫“字符串字符串 表表”。 p轉(zhuǎn)換表是在壓縮或解壓縮過程中動(dòng)態(tài)生成轉(zhuǎn)換表是在壓縮或解壓縮過程中動(dòng)態(tài)生成 的表,該表只在進(jìn)行壓縮或解壓縮過程中的表,

19、該表只在進(jìn)行壓縮或解壓縮過程中 需要,一旦壓縮和解壓縮結(jié)束,該表將不需要,一旦壓縮和解壓縮結(jié)束,該表將不 再起任何作用。再起任何作用。 p圖像壓縮的基本方法圖像壓縮的基本方法 p預(yù)測(cè)編碼預(yù)測(cè)編碼 p預(yù)測(cè)編碼是根據(jù)某一模型利用以往的預(yù)測(cè)編碼是根據(jù)某一模型利用以往的 樣本值對(duì)于新樣本進(jìn)行預(yù)測(cè),然后將樣本值對(duì)于新樣本進(jìn)行預(yù)測(cè),然后將 樣本的實(shí)際值與預(yù)測(cè)值相減得到一個(gè)樣本的實(shí)際值與預(yù)測(cè)值相減得到一個(gè) 誤差值,對(duì)這一誤差值進(jìn)行編碼。誤差值,對(duì)這一誤差值進(jìn)行編碼。 pDPCM p它是利用圖像信號(hào)的相關(guān)性找出可反映信 號(hào)變化特性的一個(gè)差值編碼。是對(duì)模擬信 號(hào)幅度抽樣的差值進(jìn)行量化編碼的調(diào)制方 式。這種方式是

20、用已經(jīng)過去的抽樣值來預(yù) 測(cè)當(dāng)前的抽樣值,對(duì)它們的差值進(jìn)行編碼 。差值編碼可以提高編碼頻率,這種技術(shù) 已應(yīng)用于模擬信號(hào)的數(shù)字通信之中。 pADPCM p綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng) 的差分特性,是一種性能比較好的波形編 碼。使用過去的樣本值估算下一個(gè)輸入樣 本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間 的差值總是最小。 p優(yōu)點(diǎn):算法復(fù)雜度低,壓縮比大、編解碼 延時(shí)最短 p缺點(diǎn):還原質(zhì)量一般 p圖像壓縮的基本方法圖像壓縮的基本方法 p變換編碼變換編碼 p變換編碼不是直接對(duì)原圖像信號(hào)壓縮編碼,而變換編碼不是直接對(duì)原圖像信號(hào)壓縮編碼,而 是首先將圖像信號(hào)進(jìn)行某種函數(shù)變換,從一種是首先將圖像信號(hào)進(jìn)行

21、某種函數(shù)變換,從一種 信號(hào)映射到另一個(gè)域中,產(chǎn)生一組變換系數(shù),信號(hào)映射到另一個(gè)域中,產(chǎn)生一組變換系數(shù), 然后對(duì)這些系數(shù)量化、編碼、傳輸。在空間上然后對(duì)這些系數(shù)量化、編碼、傳輸。在空間上 具有強(qiáng)相關(guān)性的信號(hào),反映在頻域上是某些特具有強(qiáng)相關(guān)性的信號(hào),反映在頻域上是某些特 定的區(qū)域內(nèi)能量常常被集中在一起,或是變換定的區(qū)域內(nèi)能量常常被集中在一起,或是變換 系數(shù)矩陣的分布具有規(guī)律性??衫眠@些規(guī)律,系數(shù)矩陣的分布具有規(guī)律性。可利用這些規(guī)律, 在不同的頻域上分配不同的量化比特?cái)?shù),從而在不同的頻域上分配不同的量化比特?cái)?shù),從而 達(dá)到壓縮數(shù)據(jù)的目的。達(dá)到壓縮數(shù)據(jù)的目的。 p離散余弦變化壓縮離散余弦變化壓縮 離散

22、傅里葉變換需要進(jìn)行復(fù)數(shù)運(yùn)算,盡管有FFT可以提高運(yùn)算 速度,但在圖像編碼、特別是在實(shí)時(shí)處理中非常不便。離散傅 里葉變換在實(shí)際的圖像通信系統(tǒng)中很少使用,但它具有理論的 指導(dǎo)意義。根據(jù)離散傅里葉變換的性質(zhì),使偶函數(shù)的傅里葉變 換只含實(shí)的余弦項(xiàng),因此構(gòu)造了一種實(shí)數(shù)域的變換離散余 弦變換(DCT)。通過研究發(fā)現(xiàn),DCT除了具有一般的正交變換 性質(zhì)外,其變換陣的基向量很近似于Toeplitz矩陣的特征向量, 后者體現(xiàn)了人類的語言、圖像信號(hào)的相關(guān)特性。因此,在對(duì)語 音、圖像信號(hào)變換的確定的變換矩陣正交變換中,DCT變換被 認(rèn)為是一種準(zhǔn)最佳變換。在近年頒布的一系列視頻壓縮編碼的 國(guó)際標(biāo)準(zhǔn)建議中,都把 DCT

23、 作為其中的一個(gè)基本處理模塊。 pK-L變換變換 以矢量信號(hào)X的協(xié)方差矩陣的歸一化正交特 征矢量q所構(gòu)成的正交矩陣Q,來對(duì)該矢量信 號(hào)X做正交變換Y=QX,則稱此變換為K-L變 換(K-LT或KLT),K-LT是Karhunen-Love Transform的簡(jiǎn)稱, p在模式識(shí)別和圖像處理中一個(gè)主要的問題就是 降維,在實(shí)際模式識(shí)別問題中,我們選擇的特 征經(jīng)常彼此相關(guān),在識(shí)別這些特征時(shí),數(shù)量很 多,大部分都是無用的。如果我們能減少特征 的數(shù)量,即減少特征空間的維數(shù),那么我們將 以更少的存儲(chǔ)和計(jì)算復(fù)雜度獲得更高的準(zhǔn)確性 。 KL變換是一種常用的特征提取方法,在消除 模式特征之間的相關(guān)性、突出差異性

24、方面有最 優(yōu)的效果。 p小波變換小波變換 小波變換是一種新的變換分析方法,它繼承和發(fā)展 了短時(shí)傅立葉變換局部化的思想,同時(shí)又克服了窗 口大小不隨頻率變化等缺點(diǎn),能夠提供一個(gè)隨頻率 改變的“時(shí)間-頻率”窗口,是進(jìn)行信號(hào)時(shí)頻分析和 處理的理想工具。它的主要特點(diǎn)是通過變換能夠充 分突出問題某些方面的特征,能對(duì)時(shí)間(空間)頻 率的局部化分析,通過伸縮平移運(yùn)算對(duì)信號(hào)(函數(shù)) 逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時(shí)間細(xì)分, 低頻處頻率細(xì)分,能自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求 ,從而可聚焦到信號(hào)的任意細(xì)節(jié), p圖像壓縮的基本方法圖像壓縮的基本方法 p分形編碼分形編碼 p分形圖像編碼是目前較有發(fā)展前途的圖像 編碼方法

25、之一, 也是目前研究較為廣泛的 編碼方法之一。對(duì)其研究已有近十年的歷 史,其間,人們發(fā)現(xiàn)了它所具有的許多優(yōu) 點(diǎn):比如,它突破以往熵壓縮編碼的界限, 在編碼過程中,采用了類似描述的方法, 而解碼是通過迭代完成的,且具有分辨率 無關(guān)的解碼特性等。 p分形圖像編碼的思想最早由Barnsley和 Sloan引入,將原始圖像表示為圖像空間 中一系列壓縮映射的吸引子。在此基礎(chǔ)上 ,Jacquin設(shè)計(jì)了第一個(gè)實(shí)用的基于方塊分 割的分形圖像編碼器,他首先將原始圖像 分割為值域子塊和定義域子塊,對(duì)于每一 個(gè)值域子塊,尋找一個(gè)定義域子塊和仿射 變換(包括幾何變換、對(duì)比度放縮和亮度 平移), p使變換后的定義域子塊

26、最佳逼近值域子塊 。隨后Fisher等提出了四象限樹編碼方案 ,采用有效的分類技術(shù),極大的提高了編 碼性能。隨著幾十種新算法和改進(jìn)方案的 問世,分形圖像編碼目前已形成了三個(gè)主 要發(fā)展方向:加快分形的編解碼速度、提 高分形編碼質(zhì)量、分形序列圖像編碼。 p圖像壓縮標(biāo)準(zhǔn)圖像壓縮標(biāo)準(zhǔn)JPEG pJPEG算法被確定為算法被確定為JPEG國(guó)際標(biāo)準(zhǔn),它是國(guó)際標(biāo)準(zhǔn),它是 國(guó)際上彩色、灰度、靜止圖像的第一個(gè)國(guó)國(guó)際上彩色、灰度、靜止圖像的第一個(gè)國(guó) 際標(biāo)準(zhǔn)。際標(biāo)準(zhǔn)。 pJPEG標(biāo)準(zhǔn)是一個(gè)適合范圍廣泛的通用標(biāo)準(zhǔn)。標(biāo)準(zhǔn)是一個(gè)適合范圍廣泛的通用標(biāo)準(zhǔn)。 它不僅適于靜圖像的壓縮,電視圖像序列它不僅適于靜圖像的壓縮,電視圖像序

27、列 的幀內(nèi)圖像的壓縮編碼也常采用的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮壓縮 標(biāo)準(zhǔn)。標(biāo)準(zhǔn)。 量化的基本原理量化的基本原理 量化的作用是在圖像質(zhì)量或聲音質(zhì)量達(dá)量化的作用是在圖像質(zhì)量或聲音質(zhì)量達(dá) 到一定保真度的前提下,舍棄那些對(duì)視覺到一定保真度的前提下,舍棄那些對(duì)視覺 或聽覺影響不大的信息。量化的過程是?;蚵犛X影響不大的信息。量化的過程是模 擬信號(hào)到數(shù)字信號(hào)的映射。模擬量是連續(xù)擬信號(hào)到數(shù)字信號(hào)的映射。模擬量是連續(xù) 量,而數(shù)字量是離散量,因此量化操作實(shí)量,而數(shù)字量是離散量,因此量化操作實(shí) 質(zhì)上是用有限的離散量代替無限的連續(xù)模質(zhì)上是用有限的離散量代替無限的連續(xù)模 擬量的多對(duì)一的映射操作。擬量的多對(duì)一的

28、映射操作。 量化的基本原理量化的基本原理 p 量化概念主要來自于從模擬量到數(shù)字量的轉(zhuǎn)換,量化概念主要來自于從模擬量到數(shù)字量的轉(zhuǎn)換, 即即A/D轉(zhuǎn)換,也就是通過采樣把連續(xù)的模擬量轉(zhuǎn)換,也就是通過采樣把連續(xù)的模擬量 離散化。量化過程預(yù)先設(shè)置一組判決電平和一離散化。量化過程預(yù)先設(shè)置一組判決電平和一 組重建電平,各個(gè)判決電平覆蓋一定的區(qū)間,組重建電平,各個(gè)判決電平覆蓋一定的區(qū)間, 所有判決電平將覆蓋整個(gè)有效取值區(qū)間。量化所有判決電平將覆蓋整個(gè)有效取值區(qū)間。量化 時(shí)將模擬量的取樣值同這些電平比較,若采樣時(shí)將模擬量的取樣值同這些電平比較,若采樣 值幅度落在覆蓋區(qū)間之上,則取這個(gè)量化級(jí)的值幅度落在覆蓋區(qū)間之

29、上,則取這個(gè)量化級(jí)的 代表值,稱為碼字。一個(gè)量化器只能取有限多代表值,稱為碼字。一個(gè)量化器只能取有限多 個(gè)量化級(jí),因此量化過程不可避免地存在量化個(gè)量化級(jí),因此量化過程不可避免地存在量化 誤差。誤差。 量化器的設(shè)計(jì)要求量化器的設(shè)計(jì)要求 通常設(shè)計(jì)量化器有下述兩種情況:通常設(shè)計(jì)量化器有下述兩種情況: p(1)給定量化分層級(jí)數(shù),滿足量化誤差)給定量化分層級(jí)數(shù),滿足量化誤差 最小。最小。 p(2)限定量化誤差,確定分層級(jí)數(shù),滿)限定量化誤差,確定分層級(jí)數(shù),滿 足以盡量小的平均比特?cái)?shù),表示量化輸出。足以盡量小的平均比特?cái)?shù),表示量化輸出。 幀間預(yù)測(cè)編碼幀間預(yù)測(cè)編碼(P119) p幀間預(yù)測(cè)編碼技術(shù)的對(duì)象是序列

30、圖象。隨幀間預(yù)測(cè)編碼技術(shù)的對(duì)象是序列圖象。隨 著大規(guī)模集成電路技術(shù)的發(fā)展,已有可能著大規(guī)模集成電路技術(shù)的發(fā)展,已有可能 把幾幀的圖象存起來作實(shí)時(shí)處理,利用幀把幾幀的圖象存起來作實(shí)時(shí)處理,利用幀 間的時(shí)間相關(guān)性進(jìn)一步消除圖象信號(hào)的冗間的時(shí)間相關(guān)性進(jìn)一步消除圖象信號(hào)的冗 余度,提高壓縮比。幀間編碼的技術(shù)基礎(chǔ)余度,提高壓縮比。幀間編碼的技術(shù)基礎(chǔ) 是預(yù)測(cè)技術(shù)。是預(yù)測(cè)技術(shù)。 pJPEG2000標(biāo)準(zhǔn) p特色特色: p(1)高壓縮比(低比特率)。)高壓縮比(低比特率)。 p(2)無損壓縮。)無損壓縮。 p(3)漸進(jìn)傳輸。)漸進(jìn)傳輸。 p(4)感興趣區(qū)域壓縮。)感興趣區(qū)域壓縮。 p(5)其他優(yōu)點(diǎn)。)其他優(yōu)點(diǎn)。

31、 pJPEG 2000是基于小波變換的圖像壓縮標(biāo) 準(zhǔn),由Joint Photographic Experts Group組 織創(chuàng)建和維護(hù)。JPEG 2000通常被認(rèn)為是 未來取代JPEG(基于離散余弦變換)的 下一代圖像壓縮標(biāo)準(zhǔn)。 pJPEG2000的壓縮比更高,而且不會(huì)產(chǎn)生 原先的基于離散馀弦變換的JPEG標(biāo)準(zhǔn)產(chǎn) 生的塊狀模糊瑕疵。JPEG2000同時(shí)支持 有損壓縮和無損壓縮。另外,JPEG2000 也支持更復(fù)雜的漸進(jìn)式顯示和下載。 p在有損壓縮下,JPEG2000一個(gè)比較明顯 的優(yōu)點(diǎn)就是沒有JPEG壓縮中的馬賽克失 真效果。JPEG2000的失真主要是模糊失 真。模糊失真產(chǎn)生的主要原因是在

32、編碼過 程中高頻量一定程度的衰減。傳統(tǒng)的 JPEG壓縮也存在模糊失真的問題。 p就圖像整體壓縮性能來說,目前有一些文章可 能夸大JPEG2000的性能。事實(shí)上,在低壓縮比 情形下(比如壓縮比小于10:1),傳統(tǒng)的JPEG 圖像質(zhì)量有可能要比JPEG2000要好。JPEG2000 在壓縮比比較高的情形下,優(yōu)勢(shì)才開始明顯。 整體來說,和傳統(tǒng)的JPEG相比,JPEG2000仍然 有很大的技術(shù)優(yōu)勢(shì),通常壓縮性能大概可以提 高20%以上。一般在壓縮比達(dá)到100:1的情形 下,采用JPEG壓縮的圖像已經(jīng)嚴(yán)重失真并開始 難以識(shí)別了,但JPEG2000的圖像仍可識(shí)別。 對(duì)于不同類型的音頻信號(hào)而言,其信號(hào)帶寬是

33、對(duì)于不同類型的音頻信號(hào)而言,其信號(hào)帶寬是 不同的,如電話音頻信號(hào)不同的,如電話音頻信號(hào)(200Hz-3.4kHz)(200Hz-3.4kHz),調(diào),調(diào) 幅廣播音頻信號(hào)幅廣播音頻信號(hào)(50Hz- 7kHz)(50Hz- 7kHz),調(diào)頻廣播音頻,調(diào)頻廣播音頻 信號(hào)信號(hào)(20Hz- 15kHz)(20Hz- 15kHz),激光唱盤音頻信號(hào),激光唱盤音頻信號(hào)(10Hz- (10Hz- 20kHz)20kHz)。針對(duì)不同的音頻信號(hào),制定了相應(yīng)的。針對(duì)不同的音頻信號(hào),制定了相應(yīng)的 壓縮標(biāo)準(zhǔn)。壓縮標(biāo)準(zhǔn)。 音頻壓縮編碼的基本方法音頻壓縮編碼的基本方法 1 1統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼 2 2波形編碼波形編碼 3. 3

34、. 參數(shù)編碼參數(shù)編碼 4 4混合編碼混合編碼 5 5感知編碼感知編碼 視頻壓縮技術(shù)標(biāo)準(zhǔn)主要有:視頻壓縮技術(shù)標(biāo)準(zhǔn)主要有: ITU H.261ITU H.261建議建議,用于,用于ISDNISDN信道的信道的PCPC電視電話、桌面視電視電話、桌面視 頻會(huì)議和音像郵件等通信終端。頻會(huì)議和音像郵件等通信終端。 MPEGMPEG1 1視頻壓縮標(biāo)準(zhǔn),用于視頻壓縮標(biāo)準(zhǔn),用于 VCDVCD、MPCMPC、PCPCTVTV一體機(jī)、一體機(jī)、 交互電視交互電視ITVITV和電視點(diǎn)播和電視點(diǎn)播VODVOD。 MPEGMPEG2 2ITU H.262ITU H.262視頻視頻標(biāo)準(zhǔn),主要用于數(shù)字存儲(chǔ)。視標(biāo)準(zhǔn),主要用于數(shù)字

35、存儲(chǔ)。視 頻廣播和通信,如頻廣播和通信,如HDTVHDTV、CATVCATV、DVDDVD、VODVOD和電影點(diǎn)播和電影點(diǎn)播MODMOD 等。等。 ITU H.263ITU H.263建議,用于網(wǎng)上的可視電話、移動(dòng)多媒體終建議,用于網(wǎng)上的可視電話、移動(dòng)多媒體終 端、多媒體可視圖文、遙感、電子郵件、電子報(bào)紙和交互端、多媒體可視圖文、遙感、電子郵件、電子報(bào)紙和交互 式計(jì)算機(jī)成像等。式計(jì)算機(jī)成像等。 MPEGMPEG4 4和和 ITU H.VLCITU H.VLCL L低碼率多媒體通信標(biāo)準(zhǔn)仍在發(fā)低碼率多媒體通信標(biāo)準(zhǔn)仍在發(fā) 展之中展之中. . MPEGMPEG標(biāo)準(zhǔn)概述標(biāo)準(zhǔn)概述 MPEGMPEG的全稱是

36、運(yùn)動(dòng)圖像專家組(的全稱是運(yùn)動(dòng)圖像專家組(Moving Picture Experts Moving Picture Experts GroupGroup) MPEGMPEG標(biāo)準(zhǔn)由標(biāo)準(zhǔn)由MPEGMPEG視頻、視頻、MPEGMPEG音頻和視頻與音頻同步三個(gè)部音頻和視頻與音頻同步三個(gè)部 分組成。分組成。 MPEGMPEG壓縮標(biāo)準(zhǔn)是針對(duì)運(yùn)動(dòng)圖像而設(shè)計(jì)的。基本方法是壓縮標(biāo)準(zhǔn)是針對(duì)運(yùn)動(dòng)圖像而設(shè)計(jì)的?;痉椒ㄊ?在單位時(shí)間內(nèi)采集并保存第一幀信息,然后就只存儲(chǔ)其余在單位時(shí)間內(nèi)采集并保存第一幀信息,然后就只存儲(chǔ)其余 幀相對(duì)第一幀發(fā)生變化的部分,以達(dá)到壓縮的目的。幀相對(duì)第一幀發(fā)生變化的部分,以達(dá)到壓縮的目的。 M

37、PEGMPEG 壓縮標(biāo)準(zhǔn)可實(shí)現(xiàn)幀之間的壓縮,其平均壓縮比可達(dá)壓縮標(biāo)準(zhǔn)可實(shí)現(xiàn)幀之間的壓縮,其平均壓縮比可達(dá)5050:1 1, 壓縮率比較高,且又有統(tǒng)一的格式,兼容性好。壓縮率比較高,且又有統(tǒng)一的格式,兼容性好。 MPEG視頻壓縮技術(shù) pMPEG視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖象的數(shù)視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖象的數(shù) 據(jù)壓縮技術(shù)。為了提高壓縮比,據(jù)壓縮技術(shù)。為了提高壓縮比,幀內(nèi)圖象幀內(nèi)圖象 數(shù)據(jù)壓縮數(shù)據(jù)壓縮和和幀間圖象數(shù)據(jù)壓縮技術(shù)幀間圖象數(shù)據(jù)壓縮技術(shù)必須同必須同 時(shí)使用。時(shí)使用。 MPEG將圖像分成三種類型 pI圖像(圖像(Intra Picture 幀內(nèi)圖)幀內(nèi)圖) pP圖像(圖像(Predicted Picture預(yù)測(cè)圖)預(yù)測(cè)圖) pB圖像(圖像(Bidirectional Picture雙向預(yù)雙向預(yù) 測(cè)圖)。測(cè)圖)。 MPEG1:MPEG1: 基于數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像和聲音的壓縮標(biāo)準(zhǔn)基于數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像和聲音的壓縮標(biāo)準(zhǔn)” 著眼于解決多媒體的存儲(chǔ)問題。著眼于解決多媒體的存儲(chǔ)問題。 由于由于MPEG-1MPEG-1的成功制定,以的成功制定,以VCDVCD和和MP3MP3為代表的為代表的MPEG-1MPEG-1產(chǎn)品產(chǎn)品 在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論