《光電圖像處理》06-圖像編碼_第1頁
《光電圖像處理》06-圖像編碼_第2頁
《光電圖像處理》06-圖像編碼_第3頁
《光電圖像處理》06-圖像編碼_第4頁
《光電圖像處理》06-圖像編碼_第5頁
已閱讀5頁,還剩114頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、光電圖像處理 (六)圖像編碼電子工程學(xué)院光電子技術(shù)系16.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的國際標(biāo)準(zhǔn)主 要 內(nèi) 容26.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的國際標(biāo)準(zhǔn)主 要 內(nèi) 容36.1 圖像編碼概述 6.1.1 圖像編碼技術(shù)的研究背景 6.1.2 圖像編碼基本原理 6.1.3 圖像編碼的方法 6.1.4 圖像編碼新技術(shù) 6.1.5 圖像編碼評價4 6.1.1 圖像編碼技術(shù)的研究

2、背景通信方式的改變文字+語音圖像+文字+語音通信對象的改變?nèi)伺c人人與機器,機器與機器1. 信息傳輸方式發(fā)生了很大的改變5 (a)彩色視頻信息 對于電視畫面的分辨率640 480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為: 640 480 24 30 = 221.12Mbit 所以播放時,需要221Mbps的通信回路。 參考數(shù)據(jù):寬帶網(wǎng)為512K,電話線為56K。 存儲時,1張CD可存640M,則僅可以存放2.89秒的數(shù)據(jù)。2. 圖像傳輸與存儲需要的信息量空間6 (b)傳真數(shù)據(jù) 如果只傳送2值圖像,以200dpi的分辨率傳輸,一張A4稿紙的內(nèi)容的數(shù)據(jù)量為:3888768bit 按目前14.4K的

3、電話線傳輸速率,需要傳送的時間是:270秒(4.5分) 按每分鐘4元計算:18元 由于通信方式和通信對象的改變帶來的最大問題是: 傳輸帶寬、速度、存儲器容量的限制。 給我們帶來的一個難題,也給了我們一個機會: 如何用軟件的手段來解決硬件上的物理極限。7圖像信息源圖像預(yù)處理圖像信源編碼信道編碼調(diào)制信道傳輸解調(diào)信道解碼圖像信源解碼顯示圖像圖像通信系統(tǒng)模型81. 數(shù)字圖像的冗余的概念6.1.2 圖像編碼基本原理 你的妻子,Helen,將于明天晚上6點零5分在上海的虹橋機場接你。 (232+10=56個半角字符) 你的妻子將于明天晚上6點零5分在虹橋機場接你。 (202+3=43個半角字符) Hele

4、n將于明晚6點在虹橋接你。 (102+7=27個半角字符)結(jié)論:只要接收端不會產(chǎn)生誤解,就可以減少承載信息的數(shù)據(jù)量。9描述語言(1) “這是一幅 22的圖像,圖像的第一個像素是紅的,第二個像素是紅的,第三個像素是紅的,第四個像素是紅的”。 (2) “這是一幅22的圖像,整幅圖都是紅色”。 由此我們知道,整理圖 像的描述方法可以達(dá)到 壓縮的目的。10圖像冗余無損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來的1638=384bits 壓縮為:(1+3)8=32bits11圖像冗余有損壓縮的原理36353434343434

5、32343433373034343434343434343534343134343434343434343434343434343434343434343434343434253412 空間冗余:圖像內(nèi)部相鄰像素之間存在較強的相關(guān)性 所造成的冗余。 時間冗余: 視頻圖像序列中的不同幀之間的相關(guān)性 所造成的冗余。 視覺冗余: 是指人眼不能感知或不敏感的那部分圖 像信息。2. 數(shù)字圖像冗余的分類13信息熵冗余: 也稱編碼冗余,如果圖像中平均每個像素使用 的比特數(shù)大于該圖像的信息熵,則圖像中存在冗余,這種冗余稱為信息熵冗余。結(jié)構(gòu)冗余: 是指圖像中存在很強的紋理結(jié)構(gòu)或自相似性。知識冗余: 是指在有些圖

6、像中還包含與某些先驗知識有關(guān)的信 息。圖像編碼的目的:充分利用圖像中存在的各種冗余信息,特別是空間冗余、時間冗余以及視覺冗余,以盡量少的比特數(shù)來表示圖像。14有損壓縮:存在信息損耗,不能精確重建原始圖像,存在一定程度的失真。包括哈夫曼編碼、行程編碼和算術(shù)編碼無損壓縮:不存在信息損失,解壓縮時能夠從壓縮數(shù)據(jù)精確地恢復(fù)原始圖像。包括預(yù)測編碼、變換編碼等等。6.1.3 圖像編碼的方法1. 根據(jù)編碼過程是否存在信息損耗15熵編碼:基于信號統(tǒng)計特性的編碼技術(shù),無損編碼?;驹硎墙o出現(xiàn)概率較大的符號賦予一個短碼字,而給出現(xiàn)概率較小的符號賦予一個長碼字,從而使得最終的平均碼長很小。包括行程編碼(Run L

7、ength Encoding)、哈夫曼編碼和算術(shù)編碼等。預(yù)測編碼:基于圖像數(shù)據(jù)的空間或時間冗余特性,用相鄰的已知像素(或像素塊)來預(yù)測當(dāng)前像素(或像素塊)的取值,然后再對預(yù)測誤差進(jìn)行量化和編碼??煞譃閹瑑?nèi)預(yù)測和幀間預(yù)測,常用的預(yù)測編碼有差分脈碼調(diào)制(Differential Pulse Code Modulation, DPCM)和運動補償法。2. 根據(jù)編碼原理16變換編碼:是將空間域上的圖像經(jīng)過正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個變換系數(shù)上,采用適當(dāng)?shù)牧炕挽鼐幋a就可以有效地壓縮圖像?;旌暇幋a:混合編

8、碼是指綜合了熵編碼、變換編碼或預(yù)測編碼的編碼方法,如JPEG標(biāo)準(zhǔn)和MPEG標(biāo)準(zhǔn)。17信息保持編碼: 也稱無失真編碼, 它要求在編解碼過程中保證圖像信息不丟失,從而可以完整地重建圖像。保真度編碼:利用人眼的視覺特性,在允許的失真(Lossy)條件下或一定的保真度準(zhǔn)則下,最大限度地壓縮圖像。特征提取: 在圖像識別、分析和分類等技術(shù)中,往往并不需要全部圖像信息,而只要對感興趣的部分特征信息進(jìn)行編碼即可壓縮數(shù)據(jù)。3. 根據(jù)對壓縮編碼后的圖像進(jìn)行重建的準(zhǔn)確程度186.1.4 圖像編碼新技術(shù)分形編碼(Fractal Coding):最大限度地利用了圖像在空間域上的自相似性(即局部與整體之間存在某種相似性)

9、,通過消除圖像的幾何冗余來壓縮數(shù)據(jù)。小波編碼(Wavelet Coding):經(jīng)過小波變換后的圖像,具有良好的空間方向選擇性,而且是多分辨率的,能夠保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu),與人的視覺特性十分吻合。模型編碼(Model Based Coding ):在編、解碼兩端分別建立起相同的模型,編碼時利用先驗?zāi)P统槿D像中的主要信息并用模型參數(shù)的形式表示,解碼時則利用所接收的模型參數(shù)重建圖像。 196.1.5 圖像編碼評價1. 算法的編碼效率2. 編碼圖像的質(zhì)量3. 算法的適用范圍4. 算法的復(fù)雜程度 一般來說,評價圖像壓縮算法的優(yōu)劣主要有以下4個參數(shù):20R平均碼字長度r圖像的壓縮比(rat

10、e)bps每秒鐘所需的傳輸比特數(shù)(bits per second)圖像熵與平均碼長之比1. 算法的編碼效率21 設(shè)一幅灰度級為N的圖像,圖像中第k級灰度出現(xiàn)的概率為Pk, 圖像大小為NxNy,每個像素用d比特表示,每兩幀圖像間隔t。 對于一種圖像編碼方法,設(shè)第k級灰度的碼字長度為Bk,則該圖像的平均碼字長度R為: 則按信息論中信息熵的定義,則數(shù)字圖像的熵H為:由此可見,圖像熵H表示各灰度級比特數(shù)的統(tǒng)計平均值。22編碼效率為: 每秒鐘所需的傳輸比特數(shù)bps為 :壓縮比r為: 由于同一壓縮算法對不同圖像的編碼效率會有所不同,因此常需定義一些“標(biāo)準(zhǔn)圖像”,一般通過測量不同壓縮算法對同一組“標(biāo)準(zhǔn)圖像”

11、的編碼性能來評價各圖像壓縮算法的編碼效率。 232. 編碼圖像的質(zhì)量圖像質(zhì)量評價可分為:客觀質(zhì)量評價和主觀質(zhì)量評價。最常用的客觀質(zhì)量評價指標(biāo)是:均方誤差(MSE)和峰值信噪比(PSNR)。24 主觀質(zhì)量評價是指:由一批觀察者對編碼圖像進(jìn)行觀察并打分,然后綜合所有人的評判結(jié)果,給出圖像的質(zhì)量評價??陀^質(zhì)量評價能夠快速有效地評價編碼圖像的質(zhì)量,但符合客觀質(zhì)量評價指標(biāo)的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評價能夠與人的視覺效果相匹配,但其評判過程緩慢費時。 25 特定的圖像編碼算法具有其相應(yīng)的適用范圍, 并不對所有圖像都有效。一般說來, 大多數(shù)基于圖像信息統(tǒng)計特性的壓縮算法具有較廣的適用范圍, 而

12、一些特定的編碼算法的適用范圍較窄, 如分形編碼主要用于自相似性高的圖像。 3. 算法的適用范圍26 算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運算量和硬件實現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時一定要考慮圖像信源本身的統(tǒng)計特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、 應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。 4. 算法的復(fù)雜程度276.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的國際標(biāo)準(zhǔn)主 要 內(nèi) 容286.2

13、哈夫曼編碼 1. 哈夫曼編碼的理論基礎(chǔ) RH總可設(shè)計出一種無失真編碼。RH時,表明該編碼方法效率很低; R等于或很接近于H時最佳編碼,無失真R 0)時,采用香農(nóng)-范諾編碼同樣能夠達(dá)到100%的編碼效率。香農(nóng)-范諾編碼的理論基礎(chǔ)是符號的碼字長度Ni完全由該符號出現(xiàn)的概率來決定,即 式中,D為編碼所用的數(shù)制。 44香農(nóng)-范諾編碼的步驟如下: (1) 將信源符號按其出現(xiàn)概率從大到小排序; (2) 計算出各概率對應(yīng)的碼字長度Ni; (3) 計算累加概率Ai,即Ai=Ai-1+Pi-1 i=1, 2, , N-1; A0=0 (4)把各個累加概率Ai由十進(jìn)制轉(zhuǎn)化為二進(jìn)制,取該二進(jìn)制數(shù)的前Ni位作為對應(yīng)信

14、源符號的碼字。 45香農(nóng)-范諾編碼 46二分法香農(nóng)-范諾編碼方法: (1) 首先統(tǒng)計出每個符號出現(xiàn)的概率; (2) 對上述概率從大到小排序; (3)從這個概率集合中的某個位置將其分為兩個子集合,并盡量使兩個子集合的概率和近似相等,給前面一個子集合賦值為0, 后面一個子集合賦值為1; (4) 重復(fù)步驟3,直到各個子集合中只有一個元素為止; (5) 將每個元素所屬的子集合的值依次串起來,即可得到各個元素的香農(nóng)-范諾編碼。 47二分法香農(nóng)-范諾編碼 486.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的

15、國際標(biāo)準(zhǔn)主 要 內(nèi) 容496.4 行 程 編 碼 將具有相同值的連續(xù)串用其串長和一個代表值來代替, 該連續(xù)串就稱為行程,串長稱為行程長度。 例如 aaaa bbb cc d eeeee fffffff (共228=176 bits) 4a3b2c1d5e7f (共128=96 bits) 1. 行程編碼基本原理和方法行程編碼行程長度編碼(Run Length Encoding, RLE)50 定長編碼:編碼的行程長度所用的二進(jìn)制位數(shù)固定。 變長行程編碼:對不同范圍的行程長度使用不同位數(shù)的二進(jìn)制位進(jìn)行編碼。使用變長行程編碼需要增加標(biāo)志位來表明所使用的二進(jìn)制位數(shù)。 2. 行程編碼的分類3. 行程編

16、碼的應(yīng)用 1) 行程編碼比較適合于二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場合,用行程來表示連零碼。 2) 如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的,那么采用行程編碼可以達(dá)到很高的壓縮比。 3) 如果圖像中的數(shù)據(jù)非常分散,則行程編碼不但不能壓縮數(shù)據(jù),反而會增加圖像文件的大小。這時一般和其他編碼結(jié)合使用。51傳真件中一般都是白色比較多,而黑色相對比較少。所以可能常常會出現(xiàn)如下的情況: 600w 3b 100w 12b 4w 3b 200w 上面的行程編碼所需用的字節(jié)數(shù)為:7 因為:5126001024 所以:計數(shù)值必須用10bit來表示 107=70bit在傳真中的應(yīng)用52

17、現(xiàn)在我們就希望對其有一個改善。 白色:10bit,黑色:4bit 600W 3b 100w 12b 4w 3b 200w 所需字節(jié)數(shù)為: 410+34=52bit 比原來的方式107=70bit減少了18bit53 PCX文件:文件頭圖像壓縮數(shù)據(jù)256色調(diào)色板。 文件頭全長128字節(jié),包含了圖像的大小和顏色以及PCX文件的版本標(biāo)識等信息 圖像壓縮數(shù)據(jù)緊跟在文件頭之后。按顏色平面和掃描行存儲。 如果沒有使用調(diào)色板, 那么圖像壓縮數(shù)據(jù)存儲的是實際像素值;否則,存儲的是調(diào)色板的索引值。4. PCX文件中的行程編碼PCX格式是ZSOFT公司在開發(fā)圖像處理軟件Paintbrush時開發(fā)的一種格式,基于P

18、C的繪圖程序的專用格式,一般的桌面排版、圖形藝術(shù)和視頻捕獲軟件都支持這種格式。PCX支持256色調(diào)色板或全24位的RGB,圖像大小最多達(dá)64K64K像素。不支持CMYK或HSI顏色模式,photoshop等多種圖像處理軟件均支持PCX格式。 PCX壓縮屬于無損壓縮。 54 1) 圖像數(shù)據(jù)以字節(jié)為單位進(jìn)行編碼的,每行填充到偶數(shù)字節(jié). 2) Pcx文件規(guī)定編碼時的最大行程長度為63,如果行程長度大于63,則必須分多次存儲。對于長度大于1的行程,編碼時先存入其行程長度(長度L加上192即0 xC0),再存入該行程的代表值,行程長度和行程的代表值分別占一字節(jié)。 3) 如果遇到不重復(fù)的像素值,如果該像素

19、值小于等于0 xC0,則直接存入該像素值。否則首先存入一個0 xC1,然后再存入該像素值。這樣做是為了避免該像素值被誤認(rèn)為是數(shù)據(jù)長度。 4) 對于連續(xù)重復(fù)的像素值,統(tǒng)計其連續(xù)出現(xiàn)的次數(shù)iCount(最大取值為63),先存入長度信息(iCount | 0 xC0),然后再存入像素值。如果連續(xù)次數(shù)超過63次,則必須分多次處理。例如,連續(xù)132個0 x98,編碼時必須分三次處理,編碼結(jié)果為:0 xFF 0 x98 0 xFF 0 x98 0 xC6 0 x98。編碼原則:55從壓縮數(shù)據(jù)部分讀取一個字節(jié),判斷該值是否大于0 xC0如果大于0 xC0 ,則表明該字節(jié)是行程長度信息, 取其低六位(相當(dāng)于減

20、去0 xC0)作為行程長度L,讀取下一個字節(jié)作為像素值并重復(fù)L次存入圖像數(shù)據(jù)緩沖區(qū)如果小于等于0 xC0,直接將該字節(jié)存入圖像數(shù)據(jù)緩沖區(qū)。256色PCX文件解碼:雖然幾乎所有的圖像應(yīng)用軟件都支持PCX文件格式,但由于它的壓縮比不高, 因而現(xiàn)在用得不是很多。566.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的國際標(biāo)準(zhǔn)主 要 內(nèi) 容576.5 LZW編碼 LZW(Lempel-Ziv & Welch)又稱字串表編碼, 無損編碼。 LZW編碼與行程編碼類似,也是對字符串進(jìn)行編碼從而實現(xiàn)壓縮,但它在編碼

21、的同時還生成了特定字符串以及與之對應(yīng)的索引字符串表。 58對文件進(jìn)行編碼的同時,生成了特定字符序列的表以及它們對應(yīng)的代碼。比如8位圖像編成12位碼,除了256代表原來8位字符,其他代碼分配給在壓縮過程中出現(xiàn)的字符串。(如字符對)當(dāng)表中沒有的字符串第一次出現(xiàn)的時候,原樣保存,同時將分配它的代碼也一起保存。只有如果這個字符串再次出現(xiàn),只存儲代碼。字符串表在壓縮中動態(tài)生成,而且也不用存儲,解壓時可以由壓縮文件中信息重構(gòu)它。LZW編碼原則:59 GIF(Graphics Interchange Format)是由CompuServe公司開發(fā)的一種壓縮位圖格式。它可支持多達(dá) 256 種的顏色,具有極佳的

22、壓縮效率,已成為Internet 上一種流行的文件格式。GIF圖像文件采用的是一種改良的LZW壓縮算法, 通常稱為GIF-LZW壓縮算法。GIF-LZW壓縮編碼60S1、S2兩個存放字符串的臨時變量LZW_CLEAR字符表初始化標(biāo)志LZW_EOI編碼結(jié)束標(biāo)志設(shè):(1) 根據(jù)圖像中使用的顏色數(shù)初始化一個字串表,字串表中的每個顏色對應(yīng)一個索引。在初始字串表的末尾再添加兩個符號(LZW_CLEAR和LZW_EOI)的索引。設(shè)置字符串變量S1、 S2并初始化為空。(2) 接著輸出LZW_CLEAR在字串表中的索引。編碼步驟:61(3)從圖像數(shù)據(jù)流中第一個字符(假設(shè)數(shù)據(jù)以字符串表示)開始, 每次讀取一個

23、字符,將其賦給字符串變量S2。(4)判斷“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,則S1=S1+S2;否則,輸出S1在字串表中的索引, 并在字串表末尾為“S1+S2”添加索引,同時,S1=S2。 (5)重復(fù)第3和第4步, 直到所有字符讀完為止。(6)輸出S1中的字符串在字串表中的索引, 然后輸出結(jié)束標(biāo)志LZW_EOI的索引,編碼完畢。62GIF-LZW解碼流程 63 設(shè)有一來源于4色(以a、b、c、d表示)圖像的數(shù)據(jù)流aabcabbbbd,現(xiàn)對其進(jìn)行LZW編碼。編碼過程如下: 編碼前,首先需要初始化一個字符串表。 LZW編碼實例字符串 索引 a 0 H b1 H c2

24、 H d3 H LZW_CLEAR 4 H LZW_EOI 5 H 64GIF-LZW編碼過程 b編碼結(jié)果:4001271B35(十六進(jìn)制表示)65GIF-LZW解碼過程 666.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的國際標(biāo)準(zhǔn)主 要 內(nèi) 容676.6 算 術(shù) 編 碼 基于信源概率統(tǒng)計特性的固定編碼模式 針對未知信源概率模型的自適應(yīng)模式基本原理:將被編碼的數(shù)據(jù)序列表示成0和1之間的一個間隔(即一個小數(shù)范圍),該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。 算術(shù)編碼有兩種模式:68例:設(shè)一待編碼的數(shù)據(jù)

25、序列(即信源)為“dacab”, 信源中各符號出現(xiàn)的概率依次為P(a)=0.4,P(b)=0.2,P(c)=0.2, P(d)=0.2。 首先,數(shù)據(jù)序列中的各數(shù)據(jù)符號在區(qū)間0, 1內(nèi)的間隔(賦值范圍)設(shè)定為a=0, 0.4), b=0.4, 0.6), c=0.6, 0.8), d=0.8, 1.0)StartN=StartB+LeftCL EndN=StartB+RightCL 69 第一個被壓縮的符號為“d”,其初始間隔為0.8, 1.0); 第二個被壓縮的符號為“a”,由于前面的符號“d”的取值區(qū)間被限制在0.8, 1.0)范圍內(nèi),所以“a”的取值范圍應(yīng)在前一符號間隔0.8, 1.0)的

26、0, 0.4)子區(qū)間內(nèi), 根據(jù)上式可知 :StartN=0.8+0(1.0-0.8)=0.8EndN=0.8+0.4(1.0-0.8)=0.88 即“a”的實際編碼區(qū)間在0.8, 0.88)之間。 70 第三個被壓縮的符號為“c”, 其編碼取值范圍應(yīng)在0.8, 0.88)區(qū)間的0.6, 0.8)的子區(qū)間內(nèi),據(jù)上式可知 第四個被壓縮的符號為“a”,其編碼取值范圍應(yīng)在0.848, 0.864)區(qū)間的0, 0.4)的子區(qū)間內(nèi)StartN=0.848+0(0.864-0.848)=0.848EndN=0.848+0.4(0.864-0.848)=0.8544 71 第五個被壓縮的符號為“b”,其編碼取

27、值范圍應(yīng)在 0.848 , 0.8544 )區(qū)間的0.4, 0.6)的子區(qū)間內(nèi)StartN=0.848+0.4(0.8544-0.848)=0.85056EndN=0.848+0.6(0.8544-0.848)=0.85184 至此,數(shù)據(jù)序列“dacab”已被描述為一個實數(shù)區(qū)間0.85056, 0.85184,或者說在此區(qū)間內(nèi)的任一實數(shù)值都惟一對應(yīng)該數(shù)據(jù)序列。這樣,就可以用一個實數(shù)表示這一數(shù)據(jù)序列。我們把區(qū)間0.85056, 0.85184用二進(jìn)制形式表示為0.110110011011, 0.110110100001。 72 在這個區(qū)間中,0.1101101位于這個區(qū)間內(nèi)并且其編碼最短, 故把

28、其作為數(shù)據(jù)序列“dacab”的編碼輸出。考慮到算術(shù)編碼中任一數(shù)據(jù)序列的編碼都含有“0.”,所以在編碼時,可以不考慮“0.”,于是把1101101作為本例中的數(shù)據(jù)序列的算術(shù)編碼。由此可見,數(shù)據(jù)序列“dacab”用7比特的二進(jìn)制代碼就可以表示,平均碼長為1.4比特字符。 736.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的國際標(biāo)準(zhǔn)主 要 內(nèi) 容746.7 預(yù)測編碼預(yù)測:根據(jù)過去時刻的樣本序列,采用一種模型預(yù)測當(dāng)前的樣本值;預(yù)測編碼的基本思想:通過僅提取每個象素中的新信息并對它們編碼來消除象素間的相關(guān)

29、性和冗余性。1個象素的新信息該象素的當(dāng)前或現(xiàn)實值與預(yù)測值的差。前提:象素間具有相關(guān)性。1. 無損預(yù)測編碼2. 有損預(yù)測編碼75輸入圖像預(yù)測器整數(shù)舍入符號編碼器fn+-en壓縮圖像1. 無損預(yù)測編碼預(yù)測器符號解碼器fn+en壓縮圖像+解壓圖像762. 有損預(yù)測編碼輸入圖像預(yù)測器符號編碼器fn+-en壓縮圖像量化器+預(yù)測器符號編碼器+壓縮圖像+解壓圖像776.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測編碼6.8 圖像編碼的國際標(biāo)準(zhǔn)主 要 內(nèi) 容786.8 圖像編碼的國際標(biāo)準(zhǔn)1. 靜止圖像壓縮標(biāo)準(zhǔn)JPEG2. 運動圖像壓

30、縮標(biāo)準(zhǔn) MPEG 近十年來,圖像編碼技術(shù)得到了迅速發(fā)展和廣泛應(yīng)用,并且日臻成熟,其標(biāo)志就是幾個圖像壓縮國際標(biāo)準(zhǔn)的制定。即關(guān)于靜止圖像的編碼標(biāo)準(zhǔn)JPEG和JPEG2000、關(guān)于電話/會議電視的視頻編碼標(biāo)準(zhǔn)H.261,H.263和關(guān)于活動圖像的編碼標(biāo)準(zhǔn)MPEG-1,MPEG-2, MPEG-4 和 H.264等。 JPEG (Joint Photographic Expert Group); MPEG (Motion Picture Experts Group)79圖像壓縮國際標(biāo)準(zhǔn)標(biāo)準(zhǔn) 標(biāo)題 起止日期 目標(biāo)比特率應(yīng)用場合 主要編碼技術(shù) JPEG 連續(xù)色調(diào)靜態(tài)圖像1986.31992.10 壓縮比為

31、230因特網(wǎng)數(shù)字照相圖像/視頻 編輯 DCT知覺量化霍夫曼編碼算術(shù)編碼 JPEG2000新一代靜態(tài)圖像編碼標(biāo)準(zhǔn) 1996.22000.12 壓縮比為250因特網(wǎng)移動通信數(shù)字照相遙感傳真數(shù)字圖書館JPEG所有技術(shù)小波變換EBCOTROI編碼可擴展編碼80標(biāo)準(zhǔn) 標(biāo)題 目標(biāo)比特率應(yīng)用場合 主要編碼技術(shù) MPEG-1 運動圖像及其伴音不超過1.5Mb/s 光盤存儲VCD 視頻監(jiān)控 JPEG所有技術(shù)自適應(yīng)量化運動補償預(yù)測MPEG-2 運動圖像及其伴音1.535Mb/s 數(shù)字高清 晰度電視高品質(zhì)視頻衛(wèi)星/有線電視地面廣播MPEG-1所有技術(shù)基于幀/場的 運動補償擴展編碼容錯編碼 81標(biāo)準(zhǔn) 標(biāo)題 目標(biāo)比特率

32、應(yīng)用場合 主要編碼技術(shù) MPEG-4音視頻對象的通用編碼 8kb/s35Mb/s 因特網(wǎng)交互式視頻2D/3D計算機圖形移動通信 MPEG-2所有技術(shù)小波變換運動估計/補償可擴展編碼位圖形狀編碼對象編碼動態(tài)網(wǎng)絡(luò)編碼 MPEG-7多媒體描述接口多媒體數(shù)據(jù)庫等 MPEG-21多媒體框架 82標(biāo)準(zhǔn) 標(biāo)題 目標(biāo)比特率應(yīng)用場合 主要編碼技術(shù) H.261 P64kb/s的音視頻服務(wù)P64kb/s(P取值:130) ISDN視頻會議 DCT自適應(yīng)量化運動補償預(yù)測運動估計霍夫曼編碼H.263低比特率通信的視頻編碼 8kb/s1.5Mb/s POTS視頻電話桌面視頻電話移動視頻電話 H.261所有技術(shù)雙向運動補償

33、半像素運動估計高級運動估計重疊運動補償算術(shù)編碼 83JPEG(joint picture expert group)面向靜態(tài)圖像編碼的標(biāo)準(zhǔn)。在相同圖像質(zhì)量條件下,JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中,是現(xiàn)今萬維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮, 即在壓縮過程中會丟失數(shù)據(jù),每次編輯JPEG圖像后,圖像就會被重復(fù)壓縮一次,損失就會有所增加。 1. 靜止圖像壓縮標(biāo)準(zhǔn)JPEG84 1)順序式(Sequential)DCT方式 2)漸進(jìn)式(Progressive)DCT方式 JPEG允許的四種編碼模式: 頻譜選擇法 逐次逼

34、近法 3)無失真(Lossless)方式 4)分層(Hierarchical)方式851) 順序式(Sequential)DCT方式:從左到右、從上到下對圖像順序進(jìn)行基于離散余弦變換(DCT)的編碼。DCT理論上是可逆的,但在計算時存在誤差,因而基于DCT的編碼模式是一種有損編碼。2) 漸進(jìn)式(Progressive)DCT方式:基于DCT,對圖像分層次進(jìn)行處理,從模糊到清晰地傳輸圖像(與GIF文件的交錯方式類似)。有兩種實現(xiàn)方法,一種是頻譜選擇法,即按Z形掃描的序號將DCT量化序數(shù)分成幾個頻段,每個頻段對應(yīng)一次掃描, 每塊均先傳送低頻掃描數(shù)據(jù),得到原圖概貌,再依次傳送高頻掃描數(shù)據(jù),使圖像逐漸

35、清晰;另一種是逐次逼近法,即每次掃描全部DCT量化序數(shù),但每次的表示精度逐漸提高。863) 無失真(Lossless)方式: 使用線性預(yù)測器,如DPCM, 而不是基于DCT。 4) 分層(Hierarchical)方式:在空間域?qū)⒃磮D像以不同的分辨率表示,每個分辨率對應(yīng)一次掃描, 處理時可以基于DCT或預(yù)測編碼,可以是漸進(jìn)式,也可以是順序式。87 1)基本系統(tǒng)(Baseline System) 2)擴展系統(tǒng)(Extended System) 3)無失真壓縮系統(tǒng)(Lossless System) 一個符合JPEG標(biāo)準(zhǔn)的編解碼器至少要滿足基本系統(tǒng)的技術(shù)指標(biāo)。 基本的JPEG算法屬于變換類編碼,下面

36、針對基于DCT的順序式基本系統(tǒng)編碼來說明JPEG的編碼方法。 JPEG定義了三種系統(tǒng):88JPEG 編碼/解碼的流程圖 89 1) 數(shù)據(jù)分塊 將圖像從RGB空間轉(zhuǎn)換到Y(jié)CbCr空間。 將每個分量圖像分割成不重疊的88像素塊DU(Data Unit)。 在YCbCr空間中壓縮圖像的每個彩色分量。 二次采樣采用不同的采樣頻率對圖像采樣。由于亮度比色彩更重要,因而對Y分量的采樣頻率可高于對Cb、Cr的采樣頻率,這樣有利于節(jié)省存儲空間。90把采樣頻率最低的分量圖像中一個DU所對應(yīng)的像區(qū)上覆蓋的所有各分量上的DU按順序編組為一個最小編碼單元(MCU)。 對灰度圖像而言,只有一個Y分量,MCU就是一個數(shù)據(jù)

37、單元。 對彩色圖像而言,以4:1:1的采樣方案為例,則一個MCU由4個Y分量的DU、1個Cb分量的DU和1個Cr分量的DU組成。91 以MCU為單位順序?qū)U進(jìn)行二維離散余弦變換。 對以無符號數(shù)表示的具有P位精度的輸入數(shù)據(jù), 在DCT前要減去2P-1,轉(zhuǎn)換成有符號數(shù),而在IDCT后,應(yīng)加上2P-1,轉(zhuǎn)換成無符號數(shù)。 對每個88的數(shù)據(jù)塊DU進(jìn)行DCT后, 得到的64個系數(shù)代表了該圖像塊的頻率成分,其中低頻分量集中在左上角, 高頻分量分布在右下角。系數(shù)矩陣左上角的叫做直流(DC)系數(shù),它代表了該數(shù)據(jù)塊的平均值,其余63個叫交流(AC)系數(shù)。 2) DCT處理92 在DCT處理中得到的64個系數(shù)中,

38、低頻分量包含了圖像亮度等主要信息。在從空間域到頻域的變換中,圖像中的緩慢變化比快速變化更易引起人眼的注意,所以在重建圖像時,低頻分量的重要性高于高頻分量。因而在編碼時可以忽略高頻分量,從而達(dá)到壓縮的目的,這也是量化的根據(jù)和目的。 3) 系數(shù)量化93亮度量化表 色度量化表94 DCT系數(shù)量化后,構(gòu)成一個稀疏矩陣,用Z(Zigzag)形掃描將其變成一維數(shù)列,將有利于熵編碼。Z形掃描的順序如圖所示。 DCT系數(shù)的Z形掃描順序 4) Z形掃描95 DC系數(shù)反映了一個88數(shù)據(jù)塊的平均亮度,一般與相鄰塊有較大的相關(guān)性。 JPEG對DC系數(shù)作差分編碼,即用前一數(shù)據(jù)塊的同一分量的DC系數(shù)作為當(dāng)前塊的預(yù)測值,再

39、對當(dāng)前塊的實際值與預(yù)測值的差值作哈夫曼編碼。 5) DC系數(shù)編碼96 若DC系數(shù)的動態(tài)范圍為-1024+1024,則差值的動態(tài)范圍為-2047+2047。如果為每個差值賦予一個碼字, 則碼表過于龐大。 采用“前綴碼(SSSS)+尾碼”來表示。 前綴碼指明了尾碼的有效位數(shù)B, 可以根據(jù)DIFF(DC系數(shù)的差值)從對應(yīng)表中查出前綴碼對應(yīng)的哈夫曼編碼。 尾碼的取值取決于DC系數(shù)的差值和前綴碼。如果DC系數(shù)的差值DIFF大于等于0,則尾碼的碼字為DIFF的B位原碼;否則,取DIFF的B位反碼。 97 經(jīng)Z形排列后的AC系數(shù),更有可能出現(xiàn)連續(xù)0組成的字符串, 行程編碼將有利于壓縮數(shù)據(jù)。 JPEG將一個非

40、零DC系數(shù)及其前面的0行程長度(連續(xù)0的個數(shù))的組合稱為一個事件。將每個事件編碼表示為“NNNN/SSSS+尾碼”, NNNN0行程的長度 SSSS尾碼的有效位數(shù)B(即當(dāng)前非0系數(shù)所占的比特數(shù)),如果非零AC系數(shù)大于等于0, 則尾碼的碼字為該系數(shù)的B位原碼, 否則, 取該系數(shù)的B位反碼。 6) AC系數(shù)編碼98 2. 運動圖像壓縮標(biāo)準(zhǔn) H.261:主要為電視會議等應(yīng)用制訂。也稱P64標(biāo)準(zhǔn)??稍试S通過T1線路(帶寬為1.544Mbit/s)以小于150ms的延遲傳輸運動視頻。 MPEG-1:娛樂質(zhì)量的視頻壓縮標(biāo)準(zhǔn),主要用于數(shù)字媒體上壓縮圖像數(shù)據(jù)的儲存和提取。 MPEG-2:用于視頻傳輸?shù)膲嚎s標(biāo)準(zhǔn)

41、,適用于從普通電視直到高清晰度電視的帶寬范圍。 MPEG-4:適應(yīng)在窄帶寬上對動態(tài)圖像進(jìn)行傳輸?shù)囊蟆?蓪Ω鞣N音頻視頻AV進(jìn)行有效的編碼,同時支持固定碼流和變碼流。99一、MPEG-1視頻壓縮標(biāo)準(zhǔn) MPEG-1是由ISO/IEC 于1991 年提出的,正式名稱為“用于數(shù)字存儲媒體的1.5 Mbit/s 以下的活動圖像及相關(guān)音頻編碼”(ISO/IEC 11172)。其中的數(shù)字存儲媒體包括光盤(CD),視頻光盤(VCD),其中分配比特的方案是在1.5Mbps 的數(shù)據(jù)傳輸中1.2Mbps用于編碼視頻,256Kbps 用于立體聲。MPEG-1包括五個部分:系統(tǒng)、視頻、音頻、一致性、及軟件。 在MPEG

42、-1只采用逐行掃描方式,采用4 :2 :0的亞采樣格式,其源輸入格式是SIF,有 352 288 25 和 352 288 30 兩種格式。100MPEG-1采用兩種壓縮方法:幀內(nèi)壓縮算法: 采用與JPEG壓縮算法大致相同的方法,即基于DCT的變換編碼技術(shù),用以減少空間冗余信息。幀間壓縮算法: 采用運動補償算法、預(yù)測編碼方法、以及差補法等編碼方法。幀間編碼技術(shù)可以減少時間冗余信息。101MPEG1視頻壓縮編碼算法 在MPEG-1 編碼中,為了支持隨機訪問與高效壓縮的要求,定義了四種編碼類型: I幀圖像編碼(幀內(nèi)圖像)、 P幀圖像編碼(預(yù)測圖像)、 B幀圖像編碼(差補圖或雙向預(yù)測圖像)。 D幀圖

43、像編碼(直流分量圖像) 這四種類型的幀按某種方式組織在一起就構(gòu)成了GOP。102I 幀圖像的編碼 I幀圖像是利用圖像的空間相關(guān)性進(jìn)行壓縮,其壓縮編碼采用類似JPEG壓縮算法,同時I幀圖像又是P幀圖像和B幀圖像的參考圖像,所以I幀圖像壓縮率不高,壓縮倍數(shù)在8倍左右。 幀內(nèi)圖像I不參照任何過去的或者將來的其它圖像幀,壓縮編碼采用類似JPEG壓縮算法:如果電視圖像是用RGB空間表示的,則首先把它轉(zhuǎn)換成YCrCb空間表示的圖像。每個圖像平面分成88的圖塊,對每個圖塊進(jìn)行離散余弦變換DCT。DCT變換后經(jīng)過量化的交流分量系數(shù)后進(jìn)行Z掃描,然后再使用無損壓縮技術(shù)進(jìn)行編碼。103 DCT變換后經(jīng)過量化的直流

44、分量系數(shù)采用差分脈沖編碼DPCM,交流分量系數(shù)采用游程編碼RLE,然后再采用霍夫曼(Huffman)編碼或者用算術(shù)編碼。104P 幀圖像的編碼 P幀圖像是參考過去的I幀圖像(幀內(nèi)圖像)或者過去的預(yù)測得到P幀圖像用運動補償預(yù)測技術(shù)進(jìn)行編碼,這些預(yù)測圖像通常作為進(jìn)一步預(yù)測的參考幀,預(yù)測圖像的編碼效率較高。 P幀圖像的編碼也是以圖像宏塊為基本編碼單元。預(yù)測編碼的基礎(chǔ)是運動估值,它將直接影響到整個系統(tǒng)的編碼效率和壓縮性能,因此希望找到一種預(yù)測精度高同時計算量又小的運動估值算法。105 P幀編碼時,編碼器需要對每一個宏塊作以下選擇:(1)決定是否作運動補償(MC/No-MC),即是將運動矢量發(fā)送出去,還

45、是設(shè)其為0。在許多 情況下,使用非零的運動矢量并不比使用零值的運動矢量所形成的誤差少多少。而非零運動矢量需要額外的編碼比特,因此這 時可設(shè)運動矢量為0,這樣可以提高編碼效率。(2)決定采用幀內(nèi)編碼還是幀間編碼,即是采用幀內(nèi)宏塊編碼還是利用運動矢量預(yù)測編碼。在許多情況下,某些宏塊采用幀內(nèi)編碼方式也許會用更少的比特。這通常發(fā)生在由于運動十分劇烈而導(dǎo)致運動估計失敗的情況。106(3)決定宏塊要不要編碼。有時在量化后,宏塊中所有的DCT系數(shù)都是0,這種宏塊就不需要被編碼。在對這種宏塊解碼時,只需要從過去的幀中把對應(yīng)的宏塊復(fù)制到這個宏塊就行了。(4)決定量化等級是否符合要求,是否需要改變。107 B 幀

46、圖像的編碼 B幀圖像(或稱雙向圖)在預(yù)測時,既可使用前向預(yù)測方式,也可使用后向預(yù)測方式,或同時使用雙向預(yù)測后取平均方式(雙向幀間預(yù)測),取決于哪一種方式下表示該宏塊所需的信息量為最少。使用雙向預(yù)測后,可以使那些在前一幀中預(yù)測不到的內(nèi)容很好地在后一幀中預(yù)測到,而且通過預(yù)測后取平均,非常有效地減少了預(yù)測噪聲的影響。它的壓縮效率最高,但雙向預(yù)測圖像不作為預(yù)測的參考圖像。108類似于P幀,B幀在編碼前同樣要作一系列的決定,其流程如下:(1)決定運動補償模式,即前向,后向及插值 運動補償中哪個能達(dá)到最佳。 宏塊運動補償模式的選擇是基于代價函數(shù)的最小值。代價函數(shù)是運動補償宏塊和當(dāng)前宏塊的亮度差的均方誤差。

47、解碼器通過一種簡單的方法為前向運動補償計算最佳運動補償宏塊。然后再為后向運動補償計算最佳運動補償宏塊。最后再求兩種運動補償宏塊的均值,從而產(chǎn)生宏塊的插值。然后再選擇它與當(dāng)前宏塊均方誤差最小的方式。如果找不出最小值,就選取宏塊插值方式。109(2)決定采用幀內(nèi)/幀間編碼。 即宏塊類型是幀內(nèi)編碼還是使用運動矢量作運動補償編碼。計算方法和P幀的類似,解碼器計算差分宏塊和當(dāng)前宏塊的變化。如果兩者的變化相同則選擇非幀內(nèi)編碼(參考該節(jié)的流程序圖分析)。(3)如果宏塊類型是非幀內(nèi)宏塊,則要決定這個宏塊是否編碼,即殘差是否大得足以采用DCT變換。解碼器根據(jù)量化的結(jié)果選擇編碼與否,當(dāng)所有量化系數(shù)都為零時,則這個塊不用編碼.如果宏塊中沒有編碼的塊,則這個宏塊不需編碼 ,否則該宏塊需要編碼。(4)決定量化尺寸是否滿足要求,是否需要改變尺寸。11

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論