圖像的編碼與壓縮課件_第1頁(yè)
圖像的編碼與壓縮課件_第2頁(yè)
圖像的編碼與壓縮課件_第3頁(yè)
圖像的編碼與壓縮課件_第4頁(yè)
圖像的編碼與壓縮課件_第5頁(yè)
已閱讀5頁(yè),還剩58頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七講

圖像的編碼與壓縮

第七講

圖像的編碼與壓縮

數(shù)據(jù)壓縮最初是信息論研究中的一個(gè)重要課題,在信息論中數(shù)據(jù)壓縮被稱為信源編碼。但近年來(lái),數(shù)據(jù)壓縮不僅限于編碼方法的研究與探討,己逐步形成較為獨(dú)立的體系。它主要研究數(shù)據(jù)的表示、傳輸、變換和編碼方法,目的是減少存儲(chǔ)數(shù)據(jù)所需的空間和傳輸所用的時(shí)間。一、引言數(shù)據(jù)壓縮最初是信息論研究中的一個(gè)重要課題,在信息論中為什么要壓縮?

圖像作為信息的重要表現(xiàn)形式,其具有數(shù)據(jù)量大、帶寬寬等特點(diǎn)。

需要增加信道,但這很有限,因?yàn)樾诺赖脑黾佑肋h(yuǎn)趕不上信息的爆炸式增長(zhǎng),況且還要受到環(huán)境的限制。

必須減少表示圖像的數(shù)據(jù)量,以達(dá)到壓縮圖像數(shù)據(jù)的目的。為什么要壓縮?

圖像數(shù)據(jù)的特點(diǎn)之一是信息量大。以像幅為23cm×23cm的航攝影像為例,若按采樣間隔25um、每象素8bit掃描,其數(shù)據(jù)量為84.5MB;一顆衛(wèi)星每半小時(shí)發(fā)回—次全波段(五個(gè)波段)數(shù)據(jù),每個(gè)波段圖像大小為2292×2190字節(jié)約4.90MB,每天的數(shù)據(jù)量高達(dá)1.2GB。如此海量數(shù)據(jù)需要巨大的存儲(chǔ)空間。在多媒體中,海量圖像數(shù)據(jù)的存儲(chǔ)和處理是難點(diǎn)之一。根據(jù)計(jì)算,一張600M字節(jié)的光盤,能存放20秒左右的640×480像素的圖像畫面信息,如不進(jìn)行編碼壓縮處理,多媒體信息保存有多么困難是可想而知的。

在現(xiàn)代通信中,圖像傳輸已成為重要內(nèi)容。除要求設(shè)備可靠、圖像保真度高以外,實(shí)時(shí)性將是重要技術(shù)指標(biāo)之一。很顯然,在信道帶寬、通信鏈路容量一定的前提下,采用編碼壓縮技術(shù),減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。

沒有圖像編碼壓縮技術(shù)的發(fā)展,大容量圖像信息的存儲(chǔ)與傳輸是難以實(shí)現(xiàn)的,多媒體、高速信息公路等新技術(shù)在實(shí)際中的應(yīng)用會(huì)碰到很大困難。圖像數(shù)據(jù)的特點(diǎn)之一是信息量大。在現(xiàn)代通信中,2.為什么能壓縮?

一般圖像中,存在很大的冗余度。到底能壓縮多少,除了和圖像本身存在的冗余度多少有關(guān)外,很大程度取決于對(duì)圖像質(zhì)量的要求。

例如:廣播電視要考慮藝術(shù)欣賞,對(duì)圖像質(zhì)量要求就很高,用目前的編碼技術(shù),即使壓縮比達(dá)到3∶1都是很困難的。而對(duì)可視電話,因畫面活動(dòng)部分少,對(duì)圖像質(zhì)量要求也低,可采用高效編碼技術(shù),使壓縮比高達(dá)1500∶1以上。

目前高效圖像壓縮編碼技術(shù)已能用硬件實(shí)現(xiàn)實(shí)時(shí)處理,在廣播電視、工業(yè)電視、電視會(huì)議、可視電話、傳真和互連網(wǎng)、遙感等多方面得到應(yīng)用。

2.為什么能壓縮?

空間冗余:圖像內(nèi)部相鄰像素之間存在較強(qiáng)的相關(guān)性所造成的冗余。時(shí)間冗余:視頻圖像序列中的不同幀之間的相關(guān)性所造成的冗余。視覺冗余:是指人眼不能感知或不敏感的那部分圖像信息。數(shù)字圖像的冗余主要表現(xiàn)為以下幾種形式:空間冗余、時(shí)間冗余、視覺冗余、信息熵冗余、結(jié)構(gòu)冗余。數(shù)字圖像的冗余主要表現(xiàn)為以下幾種形式:信息熵冗余:也稱編碼冗余,如果圖像中平均每個(gè)像素使用的比特?cái)?shù)大于該圖像的信息熵,則圖像中存在冗余,這種冗余稱為信息熵冗余。結(jié)構(gòu)冗余:是指圖像中存在很強(qiáng)的紋理結(jié)構(gòu)或自相似性。信息熵冗余:也稱編碼冗余,如果圖像中平均每個(gè)像素使用的比特?cái)?shù)圖像數(shù)據(jù)的這些冗余信息為圖像壓縮編碼提供了依據(jù)。

例如,利用人眼對(duì)藍(lán)光不敏感的視覺特性,在對(duì)彩色圖像編碼時(shí),就可以用較低的精度對(duì)藍(lán)色分量進(jìn)行編碼。圖像編碼的目的就是充分利用圖像中存在的各種冗余信息,特別是空間冗余、時(shí)間冗余以及視覺冗余,以盡量少的比特?cái)?shù)來(lái)表示圖像。

利用各種冗余信息,壓縮編碼技術(shù)能夠很好地解決在將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)后所產(chǎn)生的帶寬需求增加的問題,它是使數(shù)字信號(hào)走上實(shí)用化的關(guān)鍵技術(shù)之一,下表中列出了幾種常見應(yīng)用的碼率。

圖像數(shù)據(jù)的這些冗余信息為圖像壓縮編碼提供了依據(jù)。圖像的編碼與壓縮課件圖像壓縮編碼的概念圖像數(shù)據(jù)的壓縮和編碼表示。圖像壓縮編碼系統(tǒng):圖像編碼:對(duì)圖像信息進(jìn)行壓縮和編碼,在存儲(chǔ)、處理和傳輸前進(jìn)行,也稱圖像壓縮;圖像解碼:對(duì)壓縮圖像進(jìn)行解壓以重建原圖像或其近似圖像。圖像壓縮編碼的概念圖像數(shù)據(jù)的壓縮和編碼表示。二、

圖像編碼評(píng)價(jià)

隨著眾多圖像壓縮算法的出現(xiàn),如何評(píng)價(jià)圖像壓縮算法就成為重要的課題。一般說(shuō)來(lái),評(píng)價(jià)圖像壓縮算法的優(yōu)劣主要有以下4個(gè)參數(shù)。

1)算法的編碼效率算法的編碼效率通常有幾種表現(xiàn)形式:平均碼字長(zhǎng)度(R),圖像的壓縮比(rate,r),每秒鐘所需的傳輸比特?cái)?shù)(bitspersecond,bps),圖像熵與平均碼長(zhǎng)之比(η)。二、圖像編碼評(píng)價(jià)

設(shè)一幅灰度級(jí)為N的圖像,圖像中第k級(jí)灰度出現(xiàn)的概率為Pk,圖像大小為Nx×Ny,每個(gè)像素用d比特表示,每?jī)蓭瑘D像間隔Δt,則按信息論中信息熵的定義,數(shù)字圖像的熵H由下式定義:

由此可見,圖像熵H表示各灰度級(jí)比特?cái)?shù)的統(tǒng)計(jì)平均值。對(duì)于一種圖像編碼方法,設(shè)第k級(jí)灰度的碼字長(zhǎng)度為Bk,則該圖像的平均碼字長(zhǎng)度R為設(shè)一幅灰度級(jí)為N的圖像,圖像中第k級(jí)灰度出現(xiàn)于是,可定義編碼效率η為

每秒鐘所需的傳輸比特?cái)?shù)bps為壓縮比r為

由于同一壓縮算法對(duì)不同圖像的編碼效率會(huì)有所不同,因此常需定義一些“標(biāo)準(zhǔn)圖像”,一般通過測(cè)量不同壓縮算法對(duì)同一組“標(biāo)準(zhǔn)圖像”的編碼性能來(lái)評(píng)價(jià)各圖像壓縮算法的編碼效率。于是,可定義編碼效率η為每秒鐘所需的傳輸比特?cái)?shù)bps為

2)編碼圖像的質(zhì)量圖像質(zhì)量評(píng)價(jià)可分為客觀質(zhì)量評(píng)價(jià)和主觀質(zhì)量評(píng)價(jià)。最常用的客觀質(zhì)量評(píng)價(jià)指標(biāo)是均方誤差(MSE)和峰值信噪比(PSNR),其定義如下:

2)編碼圖像的質(zhì)量

主觀質(zhì)量評(píng)價(jià)是指由一批觀察者對(duì)編碼圖像進(jìn)行觀察并打分,然后綜合所有人的評(píng)判結(jié)果,給出圖像的質(zhì)量評(píng)價(jià)。

客觀質(zhì)量評(píng)價(jià)能夠快速有效地評(píng)價(jià)編碼圖像的質(zhì)量,但符合客觀質(zhì)量評(píng)價(jià)指標(biāo)的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評(píng)價(jià)能夠與人的視覺效果相匹配,但其評(píng)判過程緩慢費(fèi)時(shí)。主觀質(zhì)量評(píng)價(jià)是指由一批觀察者對(duì)編碼圖像進(jìn)行觀察

3)算法的適用范圍

特定的圖像編碼算法具有其相應(yīng)的適用范圍,并不對(duì)所有圖像都有效。

一般說(shuō)來(lái),大多數(shù)基于圖像信息統(tǒng)計(jì)特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像。

3)算法的適用范圍

4)算法的復(fù)雜度

算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運(yùn)算量和硬件實(shí)現(xiàn)該算法的難易程度。

優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡(jiǎn)單,易于硬件實(shí)現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。

選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。4)算法的復(fù)雜度三圖像壓縮方法分類

按壓縮前及解壓后的信息保持程度和方法的原理來(lái)分類

按照壓縮前及解壓后的信息保持程度分成三類:信息保持(存)型

壓縮、解壓中無(wú)信息損失,主要用于圖像存檔,其特點(diǎn)是信息無(wú)失真,但壓縮比有限,也稱無(wú)失真無(wú)損可逆型編碼。信息損失型

犧牲部分信息,來(lái)獲取高壓縮比,數(shù)字電視、圖像傳輸和多媒體等應(yīng)用場(chǎng)合常用這類壓縮,其特點(diǎn)是通過忽略人的視覺不敏感的次要信息來(lái)提高壓縮比,也稱有損壓縮。特征抽取型

僅對(duì)于實(shí)際需要的(提?。┨卣餍畔⑦M(jìn)行編碼,而丟掉其它非特征信息,屬于信息損失型。這里的第三類是針對(duì)特殊的應(yīng)用場(chǎng)合,因此,一般就將圖像壓縮編碼分成無(wú)損和有損兩大類。圖像的編碼與壓縮課件按照?qǐng)D像壓縮的方法原理可分成四類像素編碼:編碼時(shí)只對(duì)每個(gè)像素單獨(dú)處理。如脈沖編碼調(diào)制、熵編碼、行程編碼等。預(yù)測(cè)編碼:通過去除相鄰像素之間的相關(guān)性和冗余性,只對(duì)新的信息進(jìn)行編碼。常用的有差分脈沖編碼調(diào)制。變換編碼:對(duì)給定圖像采用某種變換,使得大量的信息能用較少的數(shù)據(jù)來(lái)表示。通常采用的變換包括:離散傅立葉變換(DFT(DFT),離散余弦變換),(DCT)(DCT)和離散小波變換(DWT)(DWT)。其它方法:早期的編碼,如混合編碼、矢量量化、LZWLZW算法。

近些年來(lái)也出現(xiàn)了很多新的壓縮編碼方法,如使用人工神經(jīng)元網(wǎng)絡(luò)的壓縮編碼算法、分形、小波、基于對(duì)象的壓縮編碼算法、基于模型的壓縮編碼算法等。按照?qǐng)D像壓縮的方法原理可分成四類行程編碼(RLE)

在一個(gè)逐行存儲(chǔ)的圖像中,具有相同灰度值的一些象素組成的序列稱為一個(gè)行程。在編碼時(shí),對(duì)于每個(gè)行程只存儲(chǔ)一個(gè)灰度值的碼,再緊跟著存儲(chǔ)這個(gè)行程的長(zhǎng)度。這種按照行程進(jìn)行的編碼被稱為行程編碼(RunLengthEncoding)。

行程編碼對(duì)于僅包含很少幾個(gè)灰度級(jí)的圖像,特別是二值圖像,比較有效。3.1無(wú)損編碼行程編碼(RLE)3.1無(wú)損編碼1、行程編碼基本方法行程編碼又稱行程長(zhǎng)度編碼,是一種熵編碼,其編碼原理相當(dāng)簡(jiǎn)單,即將具有相同值的連續(xù)串用其串長(zhǎng)和一個(gè)代表值來(lái)代替,該連續(xù)串就稱為行程,串長(zhǎng)稱為行程長(zhǎng)度。例如,有一字符串“aabbbcddddd”,則經(jīng)行程長(zhǎng)度編碼后,該字符串可以只用“2a3b1c5d”來(lái)表示。行程編碼分為定長(zhǎng)和不定長(zhǎng)編碼兩種。定長(zhǎng)編碼是指編碼的行程長(zhǎng)度所用的二進(jìn)制位數(shù)固定,而變長(zhǎng)行程編碼是指對(duì)不同范圍的行程長(zhǎng)度使用不同位數(shù)的二進(jìn)制位數(shù)進(jìn)行編碼。使用變長(zhǎng)行程編碼需要增加標(biāo)志位來(lái)表明所使用的二進(jìn)制位數(shù)。

1、行程編碼基本方法

行程編碼比較適合于二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場(chǎng)合,用行程來(lái)表示連零碼。如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的,那么采用行程編碼可以達(dá)到很高的壓縮比。如果圖像中的數(shù)據(jù)非常分散,則行程編碼不但不能壓縮數(shù)據(jù),反而會(huì)增加圖像文件的大小。

為了達(dá)到較好的壓縮效果,一般不單獨(dú)采用行程編碼,而是和其他編碼方法結(jié)合使用。例如,在JPEG中,就綜合使用了行程編碼、DCT、量化編碼以及哈夫曼編碼,先對(duì)圖像作分塊處理,再對(duì)這些分塊圖像進(jìn)行離散余弦變換(DCT),對(duì)變換后的頻域數(shù)據(jù)進(jìn)行量化并作Z字形掃描,接著對(duì)掃描結(jié)果作行程編碼,對(duì)行程編碼后的結(jié)果再作哈夫曼編碼。行程編碼比較適合于二值圖像的編碼,一般用于量2、PCX文件中的行程編碼

PCX文件分為文件頭和圖像壓縮數(shù)據(jù)兩個(gè)部分。如果是256色圖像,則還有一個(gè)256色調(diào)色板存于文件尾部。文件頭全長(zhǎng)128字節(jié),包含了圖像的大小和顏色以及PCX文件的版本標(biāo)識(shí)等信息,圖像壓縮數(shù)據(jù)緊跟在文件頭之后。如果沒有使用調(diào)色板,那么圖像壓縮數(shù)據(jù)存儲(chǔ)的是實(shí)際像素值;否則,存儲(chǔ)的是調(diào)色板的索引值。2、PCX文件中的行程編碼

在256色PCX文件中,每個(gè)像素占一字節(jié),壓縮數(shù)據(jù)以字節(jié)為單位逐行進(jìn)行編碼,每行填充到偶數(shù)字節(jié)。PCX文件規(guī)定編碼時(shí)的最大行程長(zhǎng)度為63,如果行程長(zhǎng)度大于63,則必須分多次存儲(chǔ)。

對(duì)于長(zhǎng)度大于1的行程,編碼時(shí)先存入其行程長(zhǎng)度(長(zhǎng)度L加上192即0xC0),再存入該行程的代表值,行程長(zhǎng)度和行程的代表值分別占一字節(jié)。

對(duì)于長(zhǎng)度為1的行程,即單個(gè)像素,如果該像素的值小于或等于0xC0,則編碼時(shí)直接存入該像素值,而不存儲(chǔ)長(zhǎng)度信息;否則,先存入0xC1,再存入該像素值,這樣做的目的是為了避免該像素值被誤認(rèn)為長(zhǎng)度信息。

在256色PCX文件中,每個(gè)像素占一字節(jié),例如,連續(xù)100個(gè)灰度值為0x80的像素,其編碼(以十六進(jìn)制表示)應(yīng)為FF802580。上面的編碼中出現(xiàn)FF的長(zhǎng)度信息是由63與0xC0相加所得。對(duì)256色PCX文件解碼時(shí),首先從壓縮數(shù)據(jù)部分讀取一個(gè)字節(jié),判斷該值是否大于0xC0,如果是,則表明該字節(jié)是行程長(zhǎng)度信息,取其低六位(相當(dāng)于減去0xC0)作為行程長(zhǎng)度L,讀取下一個(gè)字節(jié)作為像素值并重復(fù)L次存入圖像數(shù)據(jù)緩沖區(qū);否則,直接將該字節(jié)存入圖像數(shù)據(jù)緩沖區(qū)。幾乎所有的圖像應(yīng)用軟件都支持PCX文件格式,但由于它的壓縮比不高,因而現(xiàn)在用得不是很多。

例如,連續(xù)100個(gè)灰度值為0x80的像素,其編碼(以十六進(jìn)制LZW編碼

LZW(Lempel-Ziv&Welch)編碼又稱字串表編碼,屬于一種無(wú)損編碼,是Welch將Lempel和Ziv所提出的無(wú)損壓縮技術(shù)改進(jìn)后的壓縮方法。LZW編碼與行程編碼類似,也是對(duì)字符串進(jìn)行編碼從而實(shí)現(xiàn)壓縮,但它在編碼的同時(shí)還生成了特定字符串以及與之對(duì)應(yīng)的索引字符串表。

LZW編碼

LZW編碼的基本思想是:在編碼過程中,將所遇到的字符串建立一個(gè)字符串表,表中的每個(gè)字符串都對(duì)應(yīng)一個(gè)索引,編碼時(shí)用該字符串在字串表中的索引來(lái)代替原始的數(shù)據(jù)串。

例如,一幅8位的灰度圖像,我們可以采用12位來(lái)表示每個(gè)字符串的索引,前256個(gè)索引用于對(duì)應(yīng)可能出現(xiàn)的256種灰度,由此可建立一個(gè)初始的字符串表,而剩余的3840個(gè)索引就可分配給在壓縮過程中出現(xiàn)的新字符串,這樣就生成了一個(gè)完整的字符串表,壓縮數(shù)據(jù)就可以只保存它在字符串表中的索引,從而達(dá)到壓縮數(shù)據(jù)的目的。

字符串表是在壓縮過程中動(dòng)態(tài)生成的,不必將它保存在壓縮文件里,因?yàn)榻鈮嚎s時(shí)字符串表可以由壓縮文件中的信息重新生成。LZW編碼的基本思想是:在編碼過程中,將所遇

GIF(GraphicsInterchangeFormat)最初于1987年開發(fā)的一種壓縮位圖格式。它可支持多達(dá)256種的顏色,具有極佳的壓縮效率,已成為Internet上一種流行的文件格式。GIF圖像文件采用的是一種改良的LZW壓縮算法,通常稱為GIF-LZW壓縮算法。GIF圖像文件以塊(又稱為區(qū)域結(jié)構(gòu))的方式來(lái)存儲(chǔ)圖像相關(guān)的信息。設(shè)S1、S2為兩個(gè)存放字符串的臨時(shí)變量,LZW_CLEAR和LZW_EOI分別為字符表初始化標(biāo)志和編碼結(jié)束標(biāo)志,GIF-LZW的編碼步驟如下:

GIF(GraphicsIntercha

(1)根據(jù)圖像中使用的顏色數(shù)初始化一個(gè)字串表,字串表中的每個(gè)顏色對(duì)應(yīng)一個(gè)索引。在初始字串表的末尾再添加兩個(gè)符號(hào)(LZW_CLEAR和LZW_EOI)的索引。設(shè)置字符串變量S1、S2并初始化為空。(2)接著輸出LZW_CLEAR在字串表中的索引。(3)從圖像數(shù)據(jù)流中第一個(gè)字符(假設(shè)數(shù)據(jù)以字符串表示)開始,每次讀取一個(gè)字符,將其賦給字符串變量S2。(4)判斷“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,則S1=S1+S2;否則,輸出S1在字串表中的索引,并在字串表末尾為“S1+S2”添加索引,同時(shí),S1=S2。

(1)根據(jù)圖像中使用的顏色數(shù)初始化一個(gè)字串表,字串

(5)重復(fù)第3和第4步,直到所有字符讀完為止。(6)輸出S1中的字符串在字串表中的索引,然后輸出結(jié)束標(biāo)志LZW_EOI的索引,編碼完畢。

GIF-LZW的解碼過程比較復(fù)雜,它和編碼過程正好相反,即將編碼后的碼字轉(zhuǎn)換成對(duì)應(yīng)的字符串,重新生成字串表,然后依次輸出對(duì)應(yīng)的字符串即可。(5)重復(fù)第3和第4步,直到所有字符讀完為止。LZW編碼實(shí)例設(shè)有一來(lái)源于4色(以a、b、c、d表示)圖像的數(shù)據(jù)流aabcabbbbd,現(xiàn)對(duì)其進(jìn)行LZW編碼。編碼過程如下:編碼前,首先需要初始化一個(gè)字符串表。由于圖像中只有四種顏色,因而我們可以只用4比特表示字符串表中每個(gè)字符串的索引,表中的前4項(xiàng)代表4種顏色,后兩項(xiàng)分別表示初始化和圖像結(jié)束標(biāo)志,建立的初始化字符串表如表所示。接著把S1和S2初始化為空(即NULL),輸出LZW_CLEAR的在字符串表中的索引值4H,接下來(lái)是對(duì)圖像數(shù)據(jù)的編碼。

LZW編碼實(shí)例初始化字符串表字符串索引a0Hb1Hc2Hd3HLZW_CLEAR4HLZW_EOI5H初始化字符串表字符串索引a0Hb1Hc2H

讀取圖像數(shù)據(jù)流的第一個(gè)字符“a”,賦給S2,因S1+S2=“a”已存在字串表中,所以S1=S1+S2=“a”。接著讀入下一個(gè)字符“a”賦給S2,因S1+S2=“aa”不存在于字串表中,所以輸出S1=“a”的索引0H,同時(shí)在字符串表末尾添加新字符串“aa”的索引6H,并使S1=S2=“a”。依次讀取數(shù)據(jù)流中的每個(gè)字符,如果S1+S2沒有出現(xiàn)在字符串表中,則輸出S1中的字符串的索引,并在字符串表末尾為新字符串S1+S2添加索引,并使S1=S2;否則,不輸出任何結(jié)果,只是使S1=S1+S2。所有字符處理完畢后,輸出S1中的字符串的索引,最后輸出結(jié)束標(biāo)志LZW_EOI的索引。至此,編碼完畢,完整的編碼過程如下表所示,最后的編碼結(jié)果為“4001271B35”(以十六進(jìn)制表示)。

讀取圖像數(shù)據(jù)流的第一個(gè)字符“a”,賦給S2,GIF-LZW編碼過程GIF-LZW編碼過程Huffman編碼Huffman編碼是50年代提出的一種基于統(tǒng)計(jì)的無(wú)損編碼方法,它利用變長(zhǎng)的碼來(lái)使冗余量達(dá)到最小。

Huffman編碼原理:常出現(xiàn)的字符用較短的碼代表,不常出現(xiàn)的字符用較長(zhǎng)的碼代表。靜態(tài)Huffman編碼使用一棵依據(jù)字符出現(xiàn)的概率事先生成好的編碼樹進(jìn)行編碼。而動(dòng)態(tài)Huffman編碼需要在編碼的過程中建立編碼樹。由于Huffman編碼所得到的平均碼字長(zhǎng)度可以接近信源的熵,因此在變長(zhǎng)編碼中是最佳的編碼方法,故也稱為熵編碼。Huffman編碼

1、哈夫曼編碼的理論基礎(chǔ)

根據(jù)信息論中信源編碼理論,當(dāng)平均碼長(zhǎng)R大于等于圖像熵H時(shí),總可設(shè)計(jì)出一種無(wú)失真編碼。當(dāng)平均碼長(zhǎng)等于或很接近于(但不大于)圖像熵時(shí),稱此編碼方法為最佳編碼,此時(shí)不會(huì)引起圖像失真;當(dāng)平均碼長(zhǎng)大于圖像熵時(shí),壓縮比較高,但會(huì)引起圖像失真。

在變長(zhǎng)編碼中,如果碼字長(zhǎng)度嚴(yán)格按照對(duì)應(yīng)符號(hào)出現(xiàn)的概率大小逆序排列,則其平均碼字長(zhǎng)度為最小,這就是變長(zhǎng)最佳編碼定理。變長(zhǎng)最佳編碼定理是哈夫曼編碼的理論基礎(chǔ)。設(shè)D為編碼所使用的數(shù)制,則變長(zhǎng)最佳編碼的平均碼字長(zhǎng)度R的范圍為

1、哈夫曼編碼的理論基礎(chǔ)

2、哈夫曼編碼算法(1)首先統(tǒng)計(jì)信源中各符號(hào)出現(xiàn)的概率,按符號(hào)出現(xiàn)的概率從大到小排序。(2)把最小的兩個(gè)概率相加合并成新的概率,與剩余的概率組成新的概率集合。(3)對(duì)新的概率集合重新排序,再次把其中最小的兩個(gè)概率相加,組成新的概率集合。如此重復(fù)進(jìn)行,直到最后兩個(gè)概率的和為1。2、哈夫曼編碼算法

(4)分配碼字。碼字分配從最后一步開始反向進(jìn)行,對(duì)于每次相加的兩個(gè)概率,給大的賦“0”,小的賦“1”(也可以全部相反,如果兩個(gè)概率相等,則從中任選一個(gè)賦“0”,另一個(gè)賦“1”即可),讀出時(shí)由該符號(hào)開始一直走到最后的概率和“1”,將路線上所遇到的“0”和“1”按最低位到最高位的順序排好,就是該符號(hào)的哈夫曼編碼。

(4)分配碼字。碼字分配從最后一步開始反向進(jìn)行

設(shè)一幅灰度級(jí)為8(分別用S0、S1、S2、S3、S4、S5、S6、S7表示)的圖像中,各灰度所對(duì)應(yīng)的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04?,F(xiàn)對(duì)其進(jìn)行哈夫曼編碼編碼過程如圖所示,具體步驟如下:

(1)首先對(duì)信源概率從大到小排序,選出最小的兩個(gè)概率(0.04和0.05),相加得0.09,與其他概率組成新的概率集合{0.40,0.18,0.10,0.10,0.07,0.06,0.09}。例設(shè)一幅灰度級(jí)為8(分別用S0、S1、S(2)對(duì)新的概率集合重新排序,選出最小的兩個(gè)概率(0.06和0.07),相加得0.13,組成新的概率集合{0.40,0.18,0.10,0.10,0.09,0.13}。

(3)對(duì)新的概率集合重新排序,選出最小的兩個(gè)概率(0.10和0.09),相加得0.19,組成新的概率集合{0.40,0.18,0.13,0.10,0.19}。

(4)對(duì)新的概率集合重新排序,選出最小的兩個(gè)概率(0.13和0.10),相加得0.23,組成新的概率集合{0.40,0.19,0.18,0.23}。(2)對(duì)新的概率集合重新排序,選出最小的兩(5)對(duì)新的概率集合重新排序,選出最小的兩個(gè)概率(0.19和0.18),相加得0.37,組成新的概率集合{0.40,0.23,0.37}。

(6)對(duì)新的概率集合重新排序,選出最小的兩個(gè)概率(0.23和0.37),相加得0.60,組成新的概率集合{0.40,0.60}。

(7)直到最后兩個(gè)概率(0.60和0.40)相加和為1。(5)對(duì)新的概率集合重新排序,選出最小(8)分配碼字。從最后一步反向進(jìn)行,首先給最后相加的兩個(gè)概率(0.60和0.40)分配碼字,由于0.60大于0.40,于是給0.60賦“0”,給0.40賦“1”。如此依次給每次相加的兩個(gè)概率分配碼字。

(9)最后寫出每個(gè)符號(hào)的哈夫曼編碼。以符號(hào)S1(對(duì)應(yīng)的概率為0.18)為例,在從0.18到1.0的路徑上,它所遇到的賦值(“0”或“1”)依次為1、0、0,將其反向排列成“001”,于是就形成了符號(hào)S1的哈夫曼碼字“001”。(8)分配碼字。從最后一步反向進(jìn)行,首先哈夫曼編碼過程哈夫曼編碼過程

上述哈夫曼編碼方法形成的碼字是可識(shí)別的,即能夠保證一個(gè)符號(hào)的碼字不會(huì)與另一個(gè)符號(hào)的碼字的前幾位相同。比如說(shuō),如果S0的碼字為1,S1的碼字為001,而S2的碼字為011,則當(dāng)編碼序列中出現(xiàn)0011時(shí),就不能判別它是S2的碼字還是S1的碼字后面跟了一個(gè)S0的碼字1。下面來(lái)看一下哈夫曼編碼的編碼效率。平均碼長(zhǎng)R為上述哈夫曼編碼方法形成的碼字是可識(shí)別的,即能夠數(shù)字圖像的熵H為則哈夫曼編碼的編碼效率η為數(shù)字圖像的熵H為則哈夫曼編碼的編碼效率η為

由此可見,哈夫曼編碼的編碼效率是相當(dāng)高的,其冗余度只有2.2%。如果采用等長(zhǎng)編碼,由于有8種灰度級(jí),則每種灰度級(jí)別至少需要3比特來(lái)表示,對(duì)于例中的圖像而言,其編碼的平均碼長(zhǎng)為3,編碼效率為85%。

對(duì)不同概率分布的信源,哈夫曼編碼的編碼效率有所差別。根據(jù)信息論中信源編碼理論,對(duì)于二進(jìn)制編碼,當(dāng)信源概率為2的負(fù)冪次方時(shí),哈夫曼編碼的編碼效率可達(dá)100%,其平均碼字長(zhǎng)度也很短,而當(dāng)信源概率為均勻分布時(shí),其編碼效果明顯降低。在下表中,顯然,第二種情況的概率分布也服從2的負(fù)冪次方,故其編碼效率η也可以達(dá)到100%,但由于它服從均勻分布,其熵最大,平均編碼長(zhǎng)度很大,因此從其他指標(biāo)看(如,壓縮比r),其編碼效率最低。也就是說(shuō),在信源概率接近于均勻分布時(shí),一般不使用哈夫曼編碼。

由此可見,哈夫曼編碼的編碼效率是相當(dāng)高的,其啥夫曼編碼在不同概率分布下的編碼效果對(duì)比啥夫曼編碼在不同概率分布下的編碼效果對(duì)比3.2有損編碼

量化將圖像用較少的灰度級(jí)別來(lái)表示是最簡(jiǎn)單的減小數(shù)據(jù)量的方法,這種方法就是標(biāo)量量化方法。更一般的情況是,針對(duì)連續(xù)量的采樣過程,量化是用有限個(gè)狀態(tài)來(lái)表示連續(xù)值。3.2有損編碼量化預(yù)測(cè)編碼

預(yù)測(cè)編碼根據(jù)數(shù)據(jù)在時(shí)間和空間上的相關(guān)性,根據(jù)統(tǒng)計(jì)模型利用已有樣本對(duì)新樣本進(jìn)行預(yù)測(cè),將樣本的實(shí)際值與其預(yù)測(cè)值相減得到誤差值,再對(duì)誤差值進(jìn)行編碼。由于通常誤差值比樣本值小得多,因而可以達(dá)到數(shù)據(jù)壓縮的效果。模擬量到數(shù)字量的轉(zhuǎn)換過程是脈沖編碼調(diào)制過程PCM,也稱PCM編碼。對(duì)于圖像而言,直接以PCM編碼,存儲(chǔ)量很大。預(yù)測(cè)編碼可以利用相鄰象素之間的相關(guān)性,用前面已出現(xiàn)的象素值估計(jì)當(dāng)前象素值,對(duì)實(shí)際值與估計(jì)值的差值進(jìn)行編碼。常用的一種線性預(yù)測(cè)編碼方法是差分脈沖編碼調(diào)制DPCM。預(yù)測(cè)編碼預(yù)測(cè)就是根據(jù)過去時(shí)刻的樣本序列,運(yùn)用一種模型,預(yù)測(cè)當(dāng)前的樣本值。預(yù)測(cè)就是根據(jù)過去時(shí)刻的樣本序列,運(yùn)用一種模型,預(yù)測(cè)當(dāng)前的樣本預(yù)測(cè)編碼通常不直接對(duì)信號(hào)編碼,而是對(duì)預(yù)測(cè)誤差編碼。當(dāng)預(yù)測(cè)比較準(zhǔn)確,誤差較小時(shí),即可達(dá)到編碼壓縮的目的。這種編碼稱之為差分脈沖編碼調(diào)制(DPCM),上圖是原理框圖。在該系統(tǒng)中,xN為tN時(shí)刻的亮度取樣值。預(yù)測(cè)器根據(jù)tN時(shí)刻之前的樣本x1,x2,…,xN-1對(duì)xN作預(yù)測(cè),得到預(yù)測(cè)值x'N。xN與x'N之間的誤差為預(yù)測(cè)編碼通常不直接對(duì)信號(hào)編碼,而是對(duì)預(yù)測(cè)誤差編碼。當(dāng)預(yù)測(cè)比較量化器對(duì)eN進(jìn)行量化得到e‘N。編碼器對(duì)e’N

進(jìn)行編碼發(fā)送。接收端解碼時(shí)的預(yù)測(cè)過程與發(fā)送端相同,所用預(yù)測(cè)器亦相同。接收端恢復(fù)的輸出信號(hào)是xN的近似值,兩者的誤差是當(dāng)ΔxN足夠小時(shí),輸入信號(hào)xN

和DPCM系統(tǒng)的輸出信號(hào)幾乎一致。量化器對(duì)eN進(jìn)行量化得到e‘N。編碼器對(duì)e’N進(jìn)行編碼發(fā)送DCT編碼

DCT變換是圖像壓縮標(biāo)準(zhǔn)中常用的變換方法,如JPEG標(biāo)準(zhǔn)中將圖像按照8x8分塊利用DCT變換編碼實(shí)現(xiàn)壓縮。DCT編碼

DCT變換是圖像壓縮標(biāo)準(zhǔn)中常用的變換方法Lena.bmp(原圖)Lena.bmp(原圖)Lenna.jpg(壓縮率9.2)Lenna.jpg(壓縮率9.2)Lenna.jpg(壓縮率18.4)Lenna.jpg(壓縮率18.4)Lenna.jpg(壓縮率51.6)Lenna.jpg(壓縮率51.6)其它變換編碼

變換方法是實(shí)現(xiàn)圖像數(shù)據(jù)壓縮的主要手段。其基本原理是:1、通過變換將圖像數(shù)據(jù)投影到另一特征空間,降低數(shù)據(jù)的相關(guān)性,使有效數(shù)據(jù)集中分布;2、采用量化方法離散化,最后通過Huffman等無(wú)損壓縮編碼進(jìn)一步壓縮數(shù)據(jù)的存儲(chǔ)量。DCT是一種常用的變換域壓縮方法,是JPEG,MPEGI-II等圖像及視頻信號(hào)壓縮標(biāo)準(zhǔn)的算法基礎(chǔ)。在實(shí)際采用DCT編碼時(shí),需要分塊處理,各塊單獨(dú)變換編碼,整體圖像編碼后再解壓會(huì)出現(xiàn)塊狀人工效應(yīng),特別是當(dāng)壓縮比較大時(shí)非常明顯,使圖像失真。因此,為了獲得更高的圖像壓縮比,人們提出了一些其它方法,如基于小波變換的圖像壓縮算法和基于分形的圖像壓縮算法等。其它變換編碼

基于小波變換的圖像壓縮算法首先使用某種小波基函數(shù)將圖像做小波變換,再根據(jù)四個(gè)通道的不同情況,分別量化編碼。

比如對(duì)低頻頻段(LL)采用較多的量化級(jí)別,而對(duì)中間頻段(LH,RH)采用較少量化級(jí)別,對(duì)高頻頻段(HH)采用很少幾個(gè)量化級(jí)別,這樣根據(jù)重構(gòu)時(shí)對(duì)復(fù)原信號(hào)的重要程度分別對(duì)待的方式可以有效地提高壓縮比而又不產(chǎn)生明顯的失真。

由于小波變換不使用DCT變換方法中的固定大小的塊分別編碼的處理方法,而是通過整體的多級(jí)(通常用3-5個(gè)級(jí)別)變換方法實(shí)現(xiàn),沒有塊狀效應(yīng)。小波變換可以獲得10-50倍的壓縮比而沒有明顯的失真。小波變換在靜態(tài)圖像

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論