壓縮編碼在圖像處理中的應(yīng)用(畢業(yè)論文)_第1頁(yè)
壓縮編碼在圖像處理中的應(yīng)用(畢業(yè)論文)_第2頁(yè)
壓縮編碼在圖像處理中的應(yīng)用(畢業(yè)論文)_第3頁(yè)
壓縮編碼在圖像處理中的應(yīng)用(畢業(yè)論文)_第4頁(yè)
壓縮編碼在圖像處理中的應(yīng)用(畢業(yè)論文)_第5頁(yè)
已閱讀5頁(yè),還剩136頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、摘要數(shù)字圖像的表示需要大量的數(shù)據(jù),必須進(jìn)行數(shù)據(jù)的壓縮。即使采用多種方法對(duì)數(shù)據(jù)進(jìn)行了壓縮,其數(shù)據(jù)量仍然巨大,對(duì)傳輸介質(zhì)、傳輸方法和存儲(chǔ)介質(zhì)的要求較高。因此圖象壓縮編碼技術(shù)的研究顯得特別有意義。目前圖像數(shù)據(jù)壓縮的方法主要有哈夫曼編碼、行程編碼、算術(shù)編碼、離散余弦變換編碼以及混合編碼等。本文描述了圖像編碼壓縮方法的主要分類(lèi),介紹了每個(gè)分類(lèi)里面的典型算法的原理、特點(diǎn),列舉了近些年出現(xiàn)的新的壓縮編碼算法,然后在Matlab環(huán)境下運(yùn)用DCT變換對(duì)JPEG圖像壓縮編碼進(jìn)行仿真,并給出了仿真圖片的對(duì)比和分析。關(guān)鍵詞:圖像壓縮編碼;DCT變換;哈弗曼編碼AbstractThe digital images re

2、quire large amounts of data, so the data must be compressed. Even with the variety of methods of data compression, the data are still huge, and transmission methods and storage media require a higher on the transmission media. Therefore, image compression coding technology research is particularly m

3、eaningful. Current image data compression methods are Huffman coding, length encoding, arithmetic coding, discrete cosine transform coding and hybrid coding, etc.This article describes the image encoding method of the main categories, introduces inside the typical algorithms for each classification

4、of the principles and characteristics, cites the recent emergence of a new coding algorithm, then in the Matlab environment using DCT transform coding of the JPEG image compression simulation, and simulation and analysis of image contrast.Keywords:Image compression;DCT transform;Huffman coding目錄 TOC

5、 o 1-3 h z u HYPERLINK l _Toc264455937 第1章 緒論 PAGEREF _Toc264455937 h 1 HYPERLINK l _Toc264455938 1.1 數(shù)字圖像處理 PAGEREF _Toc264455938 h 1 HYPERLINK l _Toc264455939 1.1.1 圖像處理的概念 PAGEREF _Toc264455939 h 1 HYPERLINK l _Toc264455940 1.1.2 數(shù)字圖像處理的應(yīng)用 PAGEREF _Toc264455940 h 2 HYPERLINK l _Toc264455941 1.2 圖

6、像數(shù)據(jù)壓縮的研究 PAGEREF _Toc264455941 h 3 HYPERLINK l _Toc264455942 1.2.1 研究背景及意義 PAGEREF _Toc264455942 h 3 HYPERLINK l _Toc264455943 1.2.2 圖像數(shù)據(jù)壓縮的必要性 PAGEREF _Toc264455943 h 4 HYPERLINK l _Toc264455944 1.2.3 圖像數(shù)據(jù)壓縮的可行性 PAGEREF _Toc264455944 h 5 HYPERLINK l _Toc264455945 第2章 圖像壓縮編碼理論 PAGEREF _Toc264455945

7、h 6 HYPERLINK l _Toc264455946 2.1 模擬圖像信號(hào)數(shù)字傳輸與存儲(chǔ)的一般過(guò)程 PAGEREF _Toc264455946 h 6 HYPERLINK l _Toc264455947 2.2 圖像數(shù)據(jù)壓縮原理和圖像壓縮系統(tǒng)構(gòu)成 PAGEREF _Toc264455947 h 7 HYPERLINK l _Toc264455948 2.2.1 圖像數(shù)據(jù)壓縮的基本原理 PAGEREF _Toc264455948 h 7 HYPERLINK l _Toc264455949 2.2.2 圖像壓縮系統(tǒng)的一般構(gòu)成 PAGEREF _Toc264455949 h 8 HYPERLI

8、NK l _Toc264455950 2.3 圖象壓縮的幾種方法 PAGEREF _Toc264455950 h 8 HYPERLINK l _Toc264455951 2.4 圖像壓縮編碼的分類(lèi) PAGEREF _Toc264455951 h 10 HYPERLINK l _Toc264455952 2.5 傳統(tǒng)圖像壓縮編碼方法 PAGEREF _Toc264455952 h 11 HYPERLINK l _Toc264455953 2.5.1 熵編碼 PAGEREF _Toc264455953 h 11 HYPERLINK l _Toc264455954 2.5.2 線性預(yù)測(cè)編碼 PAGE

9、REF _Toc264455954 h 15 HYPERLINK l _Toc264455955 2.5.3 變換編碼 PAGEREF _Toc264455955 h 16 HYPERLINK l _Toc264455956 2.5.4 矢量量化編碼 PAGEREF _Toc264455956 h 16 HYPERLINK l _Toc264455957 2.6 現(xiàn)代圖像編碼方法 PAGEREF _Toc264455957 h 16 HYPERLINK l _Toc264455958 2.6.1 子帶編碼(SBC) PAGEREF _Toc264455958 h 16 HYPERLINK l

10、_Toc264455959 2.6.2 模型基圖像編碼 PAGEREF _Toc264455959 h 17 HYPERLINK l _Toc264455960 2.6.3 分形編碼 PAGEREF _Toc264455960 h 17 HYPERLINK l _Toc264455961 2.6.4 小波變換編碼 PAGEREF _Toc264455961 h 17 HYPERLINK l _Toc264455962 2.7 圖像壓縮編碼的國(guó)際化標(biāo)準(zhǔn) PAGEREF _Toc264455962 h 17 HYPERLINK l _Toc264455963 2.7.1 圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn)化背

11、景 PAGEREF _Toc264455963 h 17 HYPERLINK l _Toc264455964 2.7.2 圖像編碼國(guó)際標(biāo)準(zhǔn)化建議的特點(diǎn)及適用方向 PAGEREF _Toc264455964 h 18 HYPERLINK l _Toc264455965 第3章 壓縮編碼在圖像壓縮中的應(yīng)用研究 PAGEREF _Toc264455965 h 22 HYPERLINK l _Toc264455966 3.1 幾種圖像壓縮編碼的MATLAB實(shí)現(xiàn)示例 PAGEREF _Toc264455966 h 22 HYPERLINK l _Toc264455967 3.1.1 像素編碼 PAGER

12、EF _Toc264455967 h 22 HYPERLINK l _Toc264455968 3.1.2 預(yù)測(cè)編碼 PAGEREF _Toc264455968 h 23 HYPERLINK l _Toc264455969 3.1.3 變換編碼 PAGEREF _Toc264455969 h 23 HYPERLINK l _Toc264455970 3.1.4 其它編碼 PAGEREF _Toc264455970 h 24 HYPERLINK l _Toc264455971 3.2 JPEG壓縮標(biāo)準(zhǔn) PAGEREF _Toc264455971 h 25 HYPERLINK l _Toc2644

13、55972 3.3 基于DCT的JPEG圖像壓縮編碼理論算法 PAGEREF _Toc264455972 h 26 HYPERLINK l _Toc264455973 3.3.1 基于離散余弦變換(DCT變換)的JPEG編碼方法 PAGEREF _Toc264455973 h 26 HYPERLINK l _Toc264455974 3.3.2 基于DCT的JPEG圖像壓縮編碼算法的過(guò)程表述 PAGEREF _Toc264455974 h 26 HYPERLINK l _Toc264455975 3.3.3 基于DCT的JPEG圖像壓縮編碼步驟 PAGEREF _Toc264455975 h

14、27 HYPERLINK l _Toc264455976 3.3.4 DCT變換與小波變換的壓縮性能比較 PAGEREF _Toc264455976 h 32 HYPERLINK l _Toc264455977 第4章 基于DCT變換的JPEG壓縮過(guò)程MATLAB實(shí)現(xiàn) PAGEREF _Toc264455977 h 33 HYPERLINK l _Toc264455978 4.1 MATLAB簡(jiǎn)介 PAGEREF _Toc264455978 h 33 HYPERLINK l _Toc264455979 4.1.1 MATLAB軟件 PAGEREF _Toc264455979 h 33 HYPE

15、RLINK l _Toc264455980 4.1.2 MATLAB中數(shù)字圖像文件的讀寫(xiě) PAGEREF _Toc264455980 h 33 HYPERLINK l _Toc264455981 4.2 MATLAB仿真實(shí)現(xiàn)流程 PAGEREF _Toc264455981 h 35 HYPERLINK l _Toc264455982 4.3 MATLAB仿真結(jié)果分析 PAGEREF _Toc264455982 h 38 HYPERLINK l _Toc264455983 結(jié)論 PAGEREF _Toc264455983 h 39 HYPERLINK l _Toc264455984 參考文獻(xiàn) P

16、AGEREF _Toc264455984 h 40 HYPERLINK l _Toc264455985 附錄 外文文獻(xiàn)原文 PAGEREF _Toc264455985 h 41 HYPERLINK l _Toc264455986 附錄 外文文獻(xiàn)譯文 PAGEREF _Toc264455986 h 55 HYPERLINK l _Toc264455987 附錄 程序清單 PAGEREF _Toc264455987 h 66 HYPERLINK l _Toc264455988 致謝 PAGEREF _Toc264455988 h 94第1章 緒論1.1 數(shù)字圖像處理1.1.1 圖像處理的概念1什么

17、是圖像?“圖”物體透射或反射光的分布(圖像場(chǎng)),是客觀存在;“像”人的視覺(jué)系統(tǒng)對(duì)接收在大腦中形成的圖的印象或認(rèn)識(shí),是人的感覺(jué);圖像圖和像的有機(jī)結(jié)合,既反映物體的客觀存在,又體現(xiàn)人的心理因素;對(duì)客觀存在物體的一種相似性的生動(dòng)模仿或描述。2圖像的表示一幅圖像定義為一個(gè)二維函數(shù)f(x,y),這里x和y是空間坐標(biāo),在任何一對(duì)空間坐標(biāo)(x,y)上的幅值f稱(chēng)為該點(diǎn)圖像的強(qiáng)度或灰度。當(dāng)幅值f為有限的、離散的數(shù)值時(shí),稱(chēng)該圖像為數(shù)字圖像。數(shù)字圖像由有限的元素組成,每個(gè)元素都有一個(gè)特定的位置和幅值,這些元素稱(chēng)為像素(圖像元素或畫(huà)面元素)。空間有界:L-xxL+x (1-1)L-yyL+y (1-2)亮度(點(diǎn)亮度)

18、有限:0f(x,y)Bmax (1-3)圖像的數(shù)學(xué)表示:一幅圖像所包含的信息首先表現(xiàn)為光的強(qiáng)度,即一幅圖像可看成是空間各個(gè)坐標(biāo)點(diǎn)上的光強(qiáng)度I的集合,其普遍數(shù)學(xué)表達(dá)式為:I=f(x,y,z,t) (1-4)式中(x,y,z)是空間坐標(biāo),是波長(zhǎng),t是時(shí)間,I是光點(diǎn)(x,y,z)的強(qiáng)度(幅度)。式(1-4)表示一幅運(yùn)動(dòng)的(t)、彩色/多光譜的()、立體的(x,y,z)圖像。靜止圖像,與時(shí)間t無(wú)關(guān);單色圖像(也稱(chēng)灰度圖像),波長(zhǎng)為一常數(shù);平面圖像,則與坐標(biāo)z無(wú)關(guān)。在每一種情況下,圖像的表示可省略掉一維,即:靜止圖像:I=f(x,y,z,) (1-5)灰度圖像:I=f(x,y,z,t) (1-6)平面圖

19、像:I=f(x,y,t) (1-7)而對(duì)于平面上的靜止灰度圖像,其數(shù)學(xué)表達(dá)式可簡(jiǎn)化為:I=f(x,y) (1-8)運(yùn)動(dòng)圖像可用靜止圖像序列表示,彩色圖像可分解成三基色圖像,三維圖像可由二維重建。因此本文主要針對(duì)平面上的靜止灰度圖像進(jìn)行論述。3數(shù)字圖像處理的定義1:利用數(shù)字計(jì)算機(jī)或其它高速、大規(guī)模集成數(shù)字硬件,對(duì)從圖像信息轉(zhuǎn)換來(lái)的數(shù)字電信號(hào)進(jìn)行某些運(yùn)算或處理,以期提高圖像質(zhì)量或達(dá)到人們所要求的某些預(yù)期效果。對(duì)被噪聲污染的圖像去除噪聲;對(duì)信息微弱的圖像進(jìn)行增強(qiáng);失真圖像的幾何校正;從遙感圖片中辨別農(nóng)作物、森林、湖泊和軍事設(shè)施等。4數(shù)字圖像處理的目的對(duì)圖像信息進(jìn)行加工處理和分析,以滿足人的視覺(jué)、心理

20、需要和實(shí)際應(yīng)用或某種目的(如機(jī)器識(shí)別)的要求。著重強(qiáng)調(diào)在圖像之間進(jìn)行的變換,廣義上泛指各種圖像技術(shù);狹義上指對(duì)圖像進(jìn)行各種加工處理,達(dá)到:改善人的視覺(jué)效果;為自動(dòng)識(shí)別打基礎(chǔ);壓縮編碼等目標(biāo)。5數(shù)字圖像處理的內(nèi)容和方法圖像數(shù)字化:將非數(shù)字形式的圖像信號(hào)通過(guò)數(shù)字化設(shè)備轉(zhuǎn)換成數(shù)字圖像,包括采樣和量化。圖像變換:對(duì)圖像信息進(jìn)行變換以便于在頻域?qū)D像進(jìn)行更有效的處理。圖像增強(qiáng):增強(qiáng)圖像中的有用信息,削弱干擾和噪聲,提高圖像的清晰度,突出圖像中所感興趣的部分。圖像恢復(fù)(復(fù)原):對(duì)退化的圖像進(jìn)行處理,使處理后的圖像盡可能地接近原始(清晰)圖像。圖像壓縮編碼:對(duì)待處理圖像進(jìn)行壓縮編碼以減少描述圖像的數(shù)據(jù)量。圖

21、像分割:根據(jù)選定的特征將圖像劃分成若干個(gè)有意義的部分,這些選定的特征包括圖像的邊緣、區(qū)域等。圖像分析與描述:主要是對(duì)已經(jīng)分割的或正在分割的圖像各部分的屬性及各部分之間的關(guān)系進(jìn)行分析表述。圖像識(shí)別分類(lèi):根據(jù)從圖像中提取的各目標(biāo)物的特征與目標(biāo)物固有的特征進(jìn)行匹配、識(shí)別,以作出對(duì)各目標(biāo)物類(lèi)屬的判別。1.1.2 數(shù)字圖像處理的應(yīng)用闡述數(shù)字圖像處理應(yīng)用范圍最簡(jiǎn)單的一種方法是根據(jù)信息源來(lái)分類(lèi)。各類(lèi)信息源及不同的應(yīng)用領(lǐng)域產(chǎn)生各種不同的圖像。宇宙探測(cè)中的應(yīng)用:主要是星體圖片的獲取、傳送和處理。通信方面的應(yīng)用:圖像信息傳輸、電視電話、衛(wèi)星通信、數(shù)字電話等。主要是壓縮圖像數(shù)據(jù)和動(dòng)態(tài)圖像(序列)傳送。遙感方面的應(yīng)用

22、:航空遙感和衛(wèi)星遙感,地形、地質(zhì)、資源的勘測(cè),自然災(zāi)害監(jiān)測(cè)、預(yù)報(bào)和調(diào)查,環(huán)境監(jiān)測(cè)、調(diào)查等。生物醫(yī)學(xué)方面的應(yīng)用:細(xì)胞分析、染色體分類(lèi)、放射圖像處理、血球分類(lèi)、各種CT、核磁共振圖像分析、DNA顯示分析、顯微圖像處理、癌細(xì)胞識(shí)別、心臟活動(dòng)的動(dòng)態(tài)分析、超聲圖像成像、生物進(jìn)化的圖像分析等等。軍事公安方面的應(yīng)用:軍事:軍事目標(biāo)的偵察和探測(cè)、導(dǎo)彈制導(dǎo)、各種偵察圖像的判讀和識(shí)別,雷達(dá)、聲納圖像處理、指揮自動(dòng)化系統(tǒng)等。公安:現(xiàn)場(chǎng)實(shí)景照片、指紋、足跡的分析與鑒別,人像、印章、手跡的識(shí)別與分析,集裝箱內(nèi)物品的核輻射成像檢測(cè),人隨身攜帶物品的X射線檢查等。工業(yè)生產(chǎn)的應(yīng)用:將CAD和CAM技術(shù)應(yīng)用于磨具和零件優(yōu)化設(shè)計(jì)

23、和制造、印制板質(zhì)量和缺陷的檢測(cè)、無(wú)損探傷、石油氣勘測(cè)、交通管制和機(jī)場(chǎng)監(jiān)控、紡織物的圖案設(shè)計(jì)、光的彈性場(chǎng)分析、運(yùn)動(dòng)工具的視覺(jué)反饋控制、流水線零件的自動(dòng)監(jiān)測(cè)識(shí)別、郵件自動(dòng)分揀和包裹的自動(dòng)分揀識(shí)別等。天氣預(yù)報(bào):天氣云圖測(cè)繪、傳輸,氣象衛(wèi)星云圖的處理和識(shí)別等??脊牛赫滟F文物圖片、名畫(huà)、壁畫(huà)的輔助恢復(fù)。新領(lǐng)域:信息安全:信息隱藏與數(shù)字水印,指紋識(shí)別、虹膜識(shí)別和面部識(shí)別等;圖像檢索:基于內(nèi)容的圖像檢測(cè)、識(shí)別與檢索;體育運(yùn)動(dòng):運(yùn)動(dòng)員動(dòng)作的分析、評(píng)測(cè)及優(yōu)化設(shè)計(jì)。1.2 圖像數(shù)據(jù)壓縮的研究1.2.1 研究背景及意義近年來(lái),隨著計(jì)算機(jī)技術(shù)、現(xiàn)代通信技術(shù)、網(wǎng)絡(luò)技術(shù)和信息處理技術(shù)的迅速發(fā)展,人們對(duì)各種信息的需求不斷增

24、長(zhǎng),尤其是圖像和多媒體信息。未經(jīng)處理的圖像信號(hào)的數(shù)據(jù)量是巨大的,使得圖像信息的傳輸,處理和存儲(chǔ)都受到限制。因此,研究高效的圖像數(shù)據(jù)壓縮編碼方法,即怎樣處理、組織圖像數(shù)據(jù),在應(yīng)用領(lǐng)域中的作用將是至關(guān)重要的,圖像壓縮編碼技術(shù)已經(jīng)成為多媒體及通訊領(lǐng)域中的關(guān)鍵技術(shù)之一。多媒體數(shù)據(jù)的數(shù)據(jù)量非常巨大,如果不進(jìn)行壓縮,就無(wú)法在計(jì)算機(jī)中存儲(chǔ)和傳輸,也無(wú)法在多媒體信息系統(tǒng)中處理。對(duì)數(shù)據(jù)進(jìn)行壓縮的目的是減小存儲(chǔ)容量和降低數(shù)據(jù)傳輸率,使得現(xiàn)有的PC機(jī)的指標(biāo)與性能方面達(dá)到能夠處理聲音和圖像信息的要求,從而實(shí)現(xiàn)實(shí)時(shí)、快速、有效地處理、傳輸和存儲(chǔ)數(shù)據(jù)。壓縮的出發(fā)點(diǎn)是利用各種編碼方法將數(shù)據(jù)冗余壓縮到最小,并盡可能地減少失真

25、,提高數(shù)據(jù)使用效率。在掌握數(shù)據(jù)壓縮技術(shù)的基本原理與方法的基礎(chǔ)上,研究數(shù)據(jù)壓縮技術(shù)來(lái)實(shí)現(xiàn)更高的壓縮比和壓縮質(zhì)量。圖像數(shù)據(jù)壓縮編碼近年來(lái)在技術(shù)及應(yīng)用方面都取得了很大進(jìn)展,它的進(jìn)步和完善深刻影響著現(xiàn)代社會(huì)的方方面面。在眾多編碼標(biāo)準(zhǔn)中,JPEG壓縮算法實(shí)現(xiàn)簡(jiǎn)單,在很大的壓縮范圍內(nèi),都能得到很好的重建圖像質(zhì)量。用MATLAB做仿真實(shí)驗(yàn),方法簡(jiǎn)單且誤差小,很達(dá)程度的提高了圖像壓縮的效率和壓縮精度。DCT變換是最小均方誤差準(zhǔn)則下得出的次最佳正交變換。 DCT具有算法簡(jiǎn)單,易于硬件實(shí)現(xiàn)等優(yōu)點(diǎn),從而廣泛應(yīng)用于圖像壓縮領(lǐng)域。正是由于具有這些優(yōu)點(diǎn),JPEG壓縮編碼算法在圖像壓縮領(lǐng)域得到了越來(lái)越廣泛的應(yīng)用,尤其在較高

26、比特率的傳輸條件下能取得令人滿意的壓縮效果。1.2.2 圖像數(shù)據(jù)壓縮的必要性進(jìn)入21世紀(jì),人類(lèi)已步入信息社會(huì),新信息技術(shù)革命使人類(lèi)被日益增多的多媒體信息所包圍,這也正好迎合了人類(lèi)對(duì)要示提高視覺(jué)信息的需求。多媒體信息主要有三種形式:文本、聲音和圖像。從信息傳輸?shù)陌l(fā)展史(電報(bào)、電話、傳真、收音機(jī)、電視機(jī)直至現(xiàn)在的網(wǎng)絡(luò))可以看出,人們逐漸將信息傳輸?shù)闹攸c(diǎn)從聲音轉(zhuǎn)向圖像,然而圖像是三種信息形式中數(shù)據(jù)量最大的,這給圖像的傳輸和存儲(chǔ)帶來(lái)了極大的困難。例如,一幅640480分辨率的24位真彩色圖像的數(shù)據(jù)量約為900kb;一個(gè)100Mb的硬盤(pán)只能存儲(chǔ)約l00幅靜止圖像畫(huà)面。對(duì)于如此巨大的數(shù)字圖像數(shù)據(jù)量,如果不

27、經(jīng)過(guò)壓縮,不僅超出了計(jì)算機(jī)的存儲(chǔ)和處理能力,而且在現(xiàn)有的通信信道的傳輸速率下,是無(wú)法完成大量多媒體信息實(shí)時(shí)傳輸?shù)模瑪?shù)字圖像高速傳輸和存貯所需要的巨大容量已成為推廣數(shù)字圖像通信和最大障礙。因此,為了存儲(chǔ)、處理和傳輸這些數(shù)據(jù),必須進(jìn)行壓縮。圖像壓縮之所以能夠進(jìn)行壓縮是因?yàn)樵紙D像數(shù)據(jù)是高度相關(guān)的,存在很大的數(shù)據(jù)冗余。數(shù)字圖像包含的冗余信息一般有以下幾種:空間冗余、時(shí)間冗余、信息熵冗余、統(tǒng)計(jì)冗余、結(jié)構(gòu)冗余、視覺(jué)冗余以及知識(shí)冗余等。圖像壓縮算法就是要在保證圖像一定的重建質(zhì)量的同時(shí),盡可能多的去除這些冗余信息,以達(dá)到對(duì)圖像壓縮的目的。圖象采樣后,如果對(duì)之進(jìn)行簡(jiǎn)單的8bit量化和PCM編碼,其數(shù)據(jù)量是巨大

28、的。以CIF(Common Intermediate Format)格式的彩色視頻信號(hào)為例,若采樣速率為25幀/秒,采樣樣點(diǎn)的Y、U、V分量均為8bit量化,則一秒鐘的數(shù)據(jù)量為:(1-9)352288382560.83Mbit 要傳輸或存儲(chǔ)這樣大的數(shù)據(jù)量是非常困難的,必需對(duì)其進(jìn)行壓縮編碼,在滿足實(shí)際需要的前提下,盡量減少要傳輸或存儲(chǔ)的數(shù)據(jù)量。雖然數(shù)字圖象的數(shù)據(jù)量巨大,但圖象數(shù)據(jù)是高度相關(guān)的。一幅圖象的內(nèi)部相鄰象素之間,相鄰行之間的視頻序列中相鄰圖象之間有大量冗余信息空間相關(guān)性和時(shí)間相關(guān)性,可以使用各種方法盡量去除這些冗余信息,減少圖象的數(shù)據(jù)量。除了時(shí)間冗余和空間冗余外,在一般的圖象數(shù)據(jù)中還存在

29、信息熵冗余、結(jié)構(gòu)冗余、知識(shí)冗余和視覺(jué)冗余。各種冗余就是壓縮圖象數(shù)據(jù)的出發(fā)點(diǎn)。圖象編碼的目的就在于采用各種方法去除冗余,以盡量少的數(shù)據(jù)量來(lái)表示個(gè)重建圖象。1.2.3 圖像數(shù)據(jù)壓縮的可行性經(jīng)研究發(fā)現(xiàn),與音頻數(shù)據(jù)一樣,圖像數(shù)據(jù)中存在著大量的冗余,原因在于原始圖像數(shù)據(jù)是高度相關(guān)的。通過(guò)去除那些冗余數(shù)據(jù)可以節(jié)約文件所占的碼字從而極大地降低原始圖像數(shù)據(jù)量,解決圖像數(shù)據(jù)量巨大的問(wèn)題,達(dá)到數(shù)據(jù)壓縮的目的。圖像數(shù)據(jù)壓縮技術(shù)就是研究如何利用圖像數(shù)據(jù)的冗余性來(lái)減少圖像數(shù)據(jù)量的方法。因此,進(jìn)行圖像壓縮研究的起點(diǎn)是研究圖像數(shù)據(jù)的冗余性。空間冗余。在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在這個(gè)區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及色

30、飽和度都相同,具有很大的空間冗余。這是由于基于離散像素采樣的方法不能表示物體顏色之間的空間連貫性導(dǎo)致的。時(shí)間冗余。電視圖像、動(dòng)畫(huà)等序列圖片,當(dāng)其中物體有位移時(shí),后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,如背景等位置不變,只有部分相鄰幀改變的畫(huà)面,顯然是一種冗余,這種冗余稱(chēng)為時(shí)間冗余。結(jié)構(gòu)冗余。在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。例如,方格狀的地板圖案等,稱(chēng)此為結(jié)構(gòu)冗余。如果已知分布模式,就可以通過(guò)某一過(guò)程生成圖像。知識(shí)冗余。對(duì)于圖像中重復(fù)出現(xiàn)的部分,我們可以構(gòu)造出基本模型,并創(chuàng)建對(duì)應(yīng)各種特征的圖像庫(kù),進(jìn)而使圖像的存儲(chǔ)只需要保存一些特征參數(shù),從而可以大大減少數(shù)據(jù)量。知識(shí)冗余是

31、模型編碼主要利用的特性。視覺(jué)冗余。事實(shí)表明,人的視覺(jué)系統(tǒng)對(duì)圖像的敏感性是非均勻性和非線性的。在記錄原始的圖像數(shù)據(jù)時(shí),對(duì)人眼看不見(jiàn)或不能分辨的部分進(jìn)行記錄顯然是不必要的。因此,大可利用人的視覺(jué)的非均勻性和非線性,降低視覺(jué)冗余。圖像區(qū)域的相同性冗余。它是指在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有像素值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲(chǔ),這就是圖像區(qū)域的相似性冗余。在以上的情況下,當(dāng)記錄了一個(gè)區(qū)域中各像素的顏色值,則與其相同或相近的其他區(qū)域就不需要記錄其中各像素的值。采用向量量化(Vector quantization)方法就是針對(duì)這種冗余性的圖像壓縮編碼方法。隨著對(duì)人的視覺(jué)系統(tǒng)和圖像模型的進(jìn)一步研究

32、,人們可能會(huì)發(fā)現(xiàn)圖像中存在著更多的冗余性,使圖像數(shù)據(jù)壓縮編碼的可能性越來(lái)越大,從而推動(dòng)圖像壓縮技術(shù)的進(jìn)一步發(fā)展。允許圖像有一定的失真也是圖像可以壓縮的一個(gè)重要原因,在許多應(yīng)用場(chǎng)合,并不要求經(jīng)過(guò)壓縮后復(fù)原的圖像和原始圖像完全相同,而允許有少量的失真。只要這些失真并不被人眼所察覺(jué),在許多情況下是完全可以接受的。這就個(gè)圖像壓縮提供了十分有利的條件。圖像質(zhì)量允許的失真越多,可以實(shí)現(xiàn)的壓縮比就越大。這種有失真的壓縮編碼稱(chēng)為限失真編碼。第2章 圖像壓縮編碼理論圖象的數(shù)字化表示使得圖象信號(hào)可以高質(zhì)量地傳輸,并便于圖像的檢索、分析、處理和存儲(chǔ)。但是數(shù)字圖像的表示需要大量的數(shù)據(jù),必須進(jìn)行數(shù)據(jù)的壓縮。即使采用多種

33、方法對(duì)數(shù)據(jù)進(jìn)行了壓縮,其數(shù)據(jù)量仍然巨大,對(duì)傳輸介質(zhì)、傳輸方法和存儲(chǔ)介質(zhì)的要求較高。因此圖象壓縮編碼技術(shù)的研究顯得特別有意義,也正是由于圖象壓縮編碼技術(shù)及傳輸技術(shù)的不斷發(fā)展、更新,推動(dòng)了現(xiàn)代多媒體技術(shù)應(yīng)用的迅速發(fā)展。2.1 模擬圖像信號(hào)數(shù)字傳輸與存儲(chǔ)的一般過(guò)程目前,模擬圖像信號(hào)的數(shù)字傳輸與存儲(chǔ)的一般原理如圖2-1所示:圖2-1 圖像傳輸與存儲(chǔ)原理其中圖像壓縮編碼一般大致分為三個(gè)過(guò)程:采樣、量化和編碼過(guò)程。采樣圖像在空間上的離散化稱(chēng)為采樣。也就是用空間上部分點(diǎn)的灰度值代表圖像,這些點(diǎn)稱(chēng)為采樣點(diǎn)。采樣需符合采樣定理,才能使圖像不失真,即:Fs=2Fmax。量化模擬圖像經(jīng)過(guò)采樣后,在時(shí)間和空間上離散化

34、為像素。但采樣所得的像素值(即灰度值)仍是連續(xù)量。把采樣后所得的各像素的灰度值從模擬量到離散量的轉(zhuǎn)換稱(chēng)為圖像灰度的量化。量化等級(jí)越多,所得圖像層次越豐富,灰度分辨率高,圖像質(zhì)量好,但數(shù)據(jù)量大;量化等級(jí)越少,圖像層次欠豐富,灰度分辨率低,會(huì)出現(xiàn)假輪廓現(xiàn)象,圖像質(zhì)量變差,但數(shù)據(jù)量小。量化可分為均勻量化和非均勻量化。均勻量化是簡(jiǎn)單地在灰度范圍內(nèi)等間隔量化。非均勻量化是對(duì)像素出現(xiàn)頻度少的部分量化間隔取大,而對(duì)頻度大的量化間隔取小。一般情況下,對(duì)灰度變化比較平緩的部分用比較多的量化級(jí),在灰度變化比較劇烈的地方用比較高的分辨率。一般,當(dāng)限定數(shù)字圖像的大小時(shí),為了得到質(zhì)量較好的圖像可采用如下原則:(1)對(duì)緩

35、變的圖像,應(yīng)該細(xì)量化,粗采樣,以避免假輪廓。(2)對(duì)細(xì)節(jié)豐富的圖像,應(yīng)細(xì)采樣,粗量化,以避免模糊(混疊)。編碼圖像編碼是將模擬圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的一種技術(shù)。圖像編碼方法很多,圖2-2就是其中的一種。圖2-2 圖像編碼的一種方法圖2-2中的圖像編碼包含:(1).PCM編碼;(2).壓縮編碼。2.2 圖像數(shù)據(jù)壓縮原理和圖像壓縮系統(tǒng)構(gòu)成2.2.1 圖像數(shù)據(jù)壓縮的基本原理由于圖像數(shù)據(jù)之間存在著一定的冗余,所以使得數(shù)據(jù)的壓縮成為可能。信息論的創(chuàng)始人Shannon提出把數(shù)據(jù)看作是信息和冗余度的組合。所謂冗余度,是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而達(dá)到減少冗余

36、壓縮數(shù)據(jù)的目的。為了去掉數(shù)據(jù)中的冗余,常常要考慮信號(hào)源的統(tǒng)計(jì)特性,或建立信號(hào)源的統(tǒng)計(jì)模型。對(duì)數(shù)字圖像進(jìn)行壓縮通常利用兩個(gè)基本原理2:(1)數(shù)字圖像的相關(guān)性。在圖像的同一行相鄰像素之間、活動(dòng)圖像的相鄰幀的對(duì)應(yīng)像素之間往往存在很強(qiáng)的相關(guān)性,去除或減少這些相關(guān)性,也就去除或減少圖像信息中的冗余度,即實(shí)現(xiàn)了對(duì)數(shù)字圖像的壓縮。(2)人的視覺(jué)心理特征。人的視覺(jué)對(duì)于邊緣急劇變化不敏感(視覺(jué)掩蓋效應(yīng)),對(duì)顏色分辨力弱,利用這些特征可以在相應(yīng)部分適當(dāng)降低編碼精度,而使人從視覺(jué)上并不感覺(jué)到圖像質(zhì)量的下降,從而達(dá)到對(duì)數(shù)字圖像壓縮的目的。2.2.2 圖像壓縮系統(tǒng)的一般構(gòu)成圖2-3 圖像壓縮系統(tǒng)的一般構(gòu)成信源編碼:完成

37、原始數(shù)據(jù)的壓縮與編碼。信道編碼:為了抗干擾,增加一些容錯(cuò)、校驗(yàn)位,實(shí)際上是有規(guī)律地增加傳輸數(shù)據(jù)的冗余,以便于消除傳輸過(guò)程中增加的隨機(jī)信號(hào)。信道:傳輸數(shù)據(jù)(信息)的手段。如Internet、廣播、通訊、可移動(dòng)介質(zhì)等。信源數(shù)據(jù)編碼與解碼的模型如圖2-4和圖2-5所示:圖2-4 信源編碼模型映射器:減少像素冗余,如使用RLE編碼?;蜻M(jìn)行圖像變換。量化器:減少視覺(jué)心理冗余,僅用于有損壓縮。符號(hào)編碼器:減少編碼冗余,如使用哈夫曼編碼。圖2-5 信源解碼模型2.3 圖象壓縮的幾種方法統(tǒng)計(jì)和字典的壓縮方法常規(guī)程序和計(jì)算機(jī)熵的數(shù)據(jù)對(duì)于那些基于利用統(tǒng)計(jì)變種的壓縮,效果很好,這些統(tǒng)計(jì)變種表現(xiàn)在單個(gè)符號(hào)的頻率以及符

38、號(hào)或短語(yǔ)字符串的頻率等方面,而基于字典的系統(tǒng)實(shí)際上就是假扮統(tǒng)計(jì)程序。可是遺憾的是,這類(lèi)壓縮對(duì)于連續(xù)色調(diào)圖象的作用并不是很好。這些程序的主要問(wèn)題產(chǎn)生于這樣的一個(gè)事實(shí):照片圖象的象素廣泛地分布在整個(gè)范圍。如果將圖象中的彩色用頻率分布畫(huà)出,那么頻率分布圖中,沒(méi)有我們?cè)诮y(tǒng)計(jì)壓縮的成功的情況下所看到的“尖峰”狀,實(shí)際上,如果延長(zhǎng)這個(gè)分布圖,那么從類(lèi)似于電視那樣的生活圖象源中得出的分布圖會(huì)趨于平展。這意味著,每個(gè)象素代碼彼此是大約相同的出現(xiàn)機(jī)會(huì),決對(duì)不存在挖掘熵差的任何機(jī)會(huì)?;谧值涞膲嚎s程序的運(yùn)行也有類(lèi)似的問(wèn)題,基于掃描照片的圖象決定沒(méi)有任何類(lèi)型的數(shù)據(jù)特征以產(chǎn)生相同的短語(yǔ)的多次出現(xiàn)。例如,一個(gè)柵格化的圖

39、象,類(lèi)似房子墻邊的垂直部分,在圖片的許多連續(xù)的行中可能可以給出相似的字符串。但不幸的是,由于真實(shí)世界是變化多端的,每行中的相同的性能將彼此地略有不同,對(duì)于20個(gè)象素的一個(gè)字符串,其中的一兩個(gè)象素會(huì)因掃描而彼此出現(xiàn)一步長(zhǎng)的變化,雖然這些不同點(diǎn)小到人眼不能探測(cè)或?qū)θ搜鄄黄鹱饔茫麄儺吘狗恋K了基于字典壓縮的工作,對(duì)于這類(lèi)壓縮方法來(lái)說(shuō),字符串必須嚴(yán)格匹配,由于小的變化,而使匹配的字符串長(zhǎng)度趨于很小,這就限制了壓縮的效率。有損壓縮類(lèi)似于音頻數(shù)據(jù),圖形圖象也同樣有一個(gè)比常規(guī)計(jì)算機(jī)數(shù)據(jù)文件優(yōu)越的地方:在壓縮/擴(kuò)展的循環(huán)中,他們可以被略微改動(dòng),而不會(huì)影響用戶(hù)的立即質(zhì)量。如果仔細(xì)修改,那么各處象素的精確灰度可

40、以完全不被注意地進(jìn)行小的改變。由于計(jì)算機(jī)柵的圖形圖象通常來(lái)自對(duì)真實(shí)世界源的掃描,所有他們通常表達(dá)一個(gè)已經(jīng)不完美的照片的表達(dá)或是不完美的其他打印接著的表達(dá)。沒(méi)有改變圖象基本性能的有損壓縮程序應(yīng)該是可行的。假設(shè)圖形圖象的有損壓縮是可能的,那么它是如何實(shí)現(xiàn)的呢?研究人員最初試驗(yàn)了用于語(yǔ)音信號(hào)的同樣的技術(shù),如差分編碼和自適應(yīng)編碼,雖然這些技術(shù)對(duì)圖象有幫助,但并沒(méi)有達(dá)到所希望的那么好,原因之一是音頻數(shù)據(jù)和視頻數(shù)據(jù)根本不同。用常規(guī)格式采樣的音頻數(shù)據(jù)是趨于反復(fù)的,聲音,包括講話,是由每次幾秒的重復(fù)的正弦波組成的。雖然計(jì)算機(jī)上DAC的輸入流可能由許多不同的頻率疊加在一起而成,但是正弦波通常產(chǎn)生反復(fù)的波形。音頻

41、反復(fù)的本性自然使他利于壓縮,線性預(yù)言編碼和自適應(yīng)差分脈沖編碼調(diào)制等技術(shù)就利于了這一點(diǎn),因此將音頻數(shù)據(jù)流壓縮了50到95。但開(kāi)始研究圖形壓縮時(shí),人們也試圖用相似的技術(shù)壓縮數(shù)字化的圖象,取得了一些成功。最初,研究人員進(jìn)行柵格化數(shù)據(jù)流的壓縮,如顯示在電視機(jī)柵的數(shù)據(jù)。圖形數(shù)據(jù)柵格化時(shí),圖形顯示成一個(gè)象素流,每次一行地顯示在屏幕上,從左到右,從上到下。這樣,當(dāng)完成一行時(shí),圖片的一個(gè)細(xì)片就畫(huà)出了,直到整個(gè)屏幕填滿。數(shù)字化時(shí),象素可以使用從1位到24位,如今的圖形常常使用8位來(lái)定義一個(gè)象素。差分調(diào)制差分調(diào)制依賴(lài)于模擬數(shù)據(jù)趨于“平緩”的變化,信號(hào)幅度上那個(gè)的大的跳變是例外,而不是常規(guī)。在音頻數(shù)據(jù)中,只要信號(hào)的

42、采樣率一定程度地高于信息本身的最大的頻率分量,那么大的跳變就不會(huì)產(chǎn)生。音頻信號(hào)的差分調(diào)制通過(guò)編碼一個(gè)樣點(diǎn)與前一個(gè)樣點(diǎn)的不同來(lái)利用這一個(gè)特點(diǎn)。例如,如果單頻樣點(diǎn)位8位,差分編碼系統(tǒng)可能用4位來(lái)編碼樣點(diǎn)之差,這就將輸入數(shù)據(jù)壓縮了50。這種壓縮方法中所產(chǎn)生的損失是來(lái)自于:使用標(biāo)準(zhǔn)的差分方法不可能總是精確地編碼。信號(hào)的增長(zhǎng)可能快于比編碼的允許,或者,編碼可能太粗而不能容納下的差別,差分編碼的有損性可以很好的處理,以產(chǎn)生出好的信號(hào)。當(dāng)壓縮圖形數(shù)據(jù)時(shí),差分調(diào)制有很多問(wèn)題。首先,圖形中的象素依賴(lài)于平緩的增加或減少是不可靠的,一幅圖中不同的分量間的明顯界限是常有的事情。這意味著,使用差分編碼的系統(tǒng)需要接受樣點(diǎn)

43、間的大的不同和小的不同。這就限制了壓縮的效率。帶有數(shù)據(jù)長(zhǎng)結(jié)構(gòu)的許多圖象可以壓縮的很好。長(zhǎng)結(jié)構(gòu)中的象素,彼此之間沒(méi)有什么差別或差別很少;但時(shí),帶有突變部分的那些圖象不可能壓縮的很好。通常,圖形圖象的差分的編碼似乎不產(chǎn)生非常強(qiáng)于最好的無(wú)損算法的壓縮結(jié)果,他當(dāng)然也不會(huì)產(chǎn)生所需要的、對(duì)壓縮的數(shù)量級(jí)上的改進(jìn)。自適應(yīng)編碼自適應(yīng)編碼(常常于差分編碼一同使用)根據(jù)前面看到的一些象素而對(duì)將要到來(lái)的一些象素的信息做預(yù)言。例如,如果一幅灰度級(jí)照片中的最新的十個(gè)象素的值都在45到50之間,那么自適應(yīng)壓縮系統(tǒng)可能預(yù)言,下一個(gè)象素很大可能也在這個(gè)范圍中,之后,類(lèi)似于霍夫曼或算術(shù)編碼那樣的基于熵的編碼方案可能給將來(lái)到來(lái)的各

44、種代碼賦以概率值,可以代替地使用壓縮擴(kuò)展方法,將最細(xì)的粒度賦給最接近預(yù)言猜測(cè)的范圍。2.4 圖像壓縮編碼的分類(lèi)圖像壓縮編碼的方法目前有很多,其分類(lèi)方法根據(jù)出發(fā)點(diǎn)不同而有差異。根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差,圖像編碼壓縮分為無(wú)損(亦稱(chēng)無(wú)失真、無(wú)誤差、信息保持型)編碼和有損(有失真、有誤差、信息非保持型)編碼兩大類(lèi)。無(wú)損壓縮:這類(lèi)壓縮算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息,因此在解壓縮時(shí)能精確恢復(fù)原圖像。無(wú)損壓縮用于要求重建后圖像嚴(yán)格地和原始圖像保持相同的場(chǎng)合,例如復(fù)制、保存十分珍貴的歷史、文物圖像等。一些常用的無(wú)損壓縮編碼有哈夫曼編碼、行程編碼、算術(shù)編碼等。有損壓縮:這類(lèi)算法把不

45、相干的信息也刪除了,因此在解壓縮時(shí)只能對(duì)原始圖像進(jìn)行近似的重建,而不能精確的復(fù)原,有損壓縮適合大多數(shù)用于存儲(chǔ)數(shù)字化了的模擬數(shù)據(jù)。有損編碼包括預(yù)測(cè)編碼、變換編碼和其他編碼等。根據(jù)編碼原理圖像編碼分為熵編碼、預(yù)測(cè)編碼、變換編碼和混合編碼等。熵編碼:這是純粹基于信號(hào)統(tǒng)計(jì)特性的編碼技術(shù),是一種無(wú)損編碼。熵編碼的基本原理是給出現(xiàn)概率較大的符號(hào)賦予一個(gè)短碼字,而給出現(xiàn)概率較小的符號(hào)賦予一個(gè)長(zhǎng)碼字,從而使最終的平均碼長(zhǎng)很小。常見(jiàn)的熵編碼方法有哈夫曼編碼、算術(shù)編碼和行程編碼。預(yù)測(cè)編碼:它是基于圖像數(shù)據(jù)的空間或時(shí)間冗余特性,用相鄰的已知像素(或像素塊)來(lái)預(yù)測(cè)當(dāng)前像素(或像素塊)的取值,然后再對(duì)預(yù)測(cè)誤差進(jìn)行量化和

46、編碼。預(yù)測(cè)編碼可分為幀內(nèi)預(yù)測(cè)和幀間預(yù)測(cè),常用的預(yù)測(cè)編碼有差分脈碼調(diào)制(Differential Pulse Code Modulation,DPCM)和運(yùn)動(dòng)補(bǔ)償法。變換編碼:通常是將空間域上的圖像經(jīng)過(guò)正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個(gè)變換系數(shù)上,再采用適當(dāng)?shù)牧炕挽鼐幋a就可以有效地壓縮圖像。混合編碼:是指綜合了熵編碼、變換編碼或預(yù)測(cè)編碼的編碼方法,如JPEG和MPEG標(biāo)準(zhǔn)。從圖像的光譜特征出發(fā),將壓縮編碼分為單色圖像編碼、彩色圖像編碼和多光譜圖像編碼。從圖像的灰度層次上,壓縮編碼可分為多灰度編碼和二值

47、圖像編碼。根據(jù)編碼作用域劃分,圖像編碼為空間域編碼和變換域編碼兩大類(lèi)。2.5 傳統(tǒng)圖像壓縮編碼方法2.5.1 熵編碼根據(jù)信息論中信源碼理論,可以證明在平均碼長(zhǎng)R大于等于圖像熵H的條件下,總可以設(shè)計(jì)出某種無(wú)失真編碼方法,當(dāng)然如果編碼結(jié)果使R遠(yuǎn)大于H,表明這種編碼方法效率很低,占用比特?cái)?shù)太多;最好的編碼結(jié)果是使R等于或接近于H,這種狀態(tài)的編碼方法稱(chēng)為最佳編碼,它既不丟失信息而引起圖像失真,又占用最少的比特?cái)?shù)。熵編碼的目的就是要使編碼后的圖像平均碼長(zhǎng)R盡可能接近圖像熵H,一般是根據(jù)圖像灰度級(jí)數(shù)出現(xiàn)的概率大小賦予不同長(zhǎng)度碼字,出現(xiàn)概率大的灰度級(jí)用短碼字,出現(xiàn)概率小的灰度級(jí)用長(zhǎng)碼字??梢宰C明,這樣的編碼

48、結(jié)果所獲得的平均碼字長(zhǎng)度最短,這就是下面要介紹的變長(zhǎng)最佳編碼定理。變長(zhǎng)最佳編碼定理3:在變長(zhǎng)編碼中,對(duì)出現(xiàn)概率大的信息符號(hào)賦給短碼字,而對(duì)于出現(xiàn)概率小的信息符號(hào)賦給長(zhǎng)碼字,如果碼字長(zhǎng)度嚴(yán)格按照所對(duì)應(yīng)符號(hào)出現(xiàn)概率大小逆序排列,則編碼結(jié)果平均碼字長(zhǎng)度一定小于任何其它排列方式。哈夫曼編碼4大多數(shù)存儲(chǔ)數(shù)字的信息編碼系統(tǒng)都采用位數(shù)固定的定長(zhǎng)碼,即使用相同位數(shù)對(duì)數(shù)據(jù)進(jìn)行編碼。如常用的ASCII碼,用8位二進(jìn)制數(shù)表示一個(gè)英文字符。正像一篇文章中,每個(gè)字符出現(xiàn)的頻度是不同的。有些字符出現(xiàn)的頻率高,有些字符出現(xiàn)的頻率低。同樣,在一幅圖像中,有些圖像數(shù)據(jù)出現(xiàn)的頻率高,有些圖像數(shù)據(jù)出現(xiàn)的頻率低。如果對(duì)出現(xiàn)頻率高的數(shù)

49、據(jù)用較少的比特?cái)?shù)來(lái)表示,出現(xiàn)頻率低的數(shù)據(jù)用較多的比特?cái)?shù)來(lái)表示,這樣從總的效果看還是節(jié)省了存儲(chǔ)空間。采用這種辦法對(duì)數(shù)據(jù)進(jìn)行編碼時(shí),代碼的位數(shù)不固定,這種碼稱(chēng)為變長(zhǎng)碼。這種編碼思想首先由香農(nóng)提出,哈夫曼對(duì)它提出了改進(jìn),用這種方法得到的編碼稱(chēng)為哈夫曼碼。哈夫曼編碼(Huffman)是運(yùn)用信息熵原理的一種無(wú)損編碼方法。哈夫曼編碼于1952年問(wèn)世,迄今為止仍經(jīng)久不衰,廣泛應(yīng)用于各種數(shù)據(jù)壓縮技術(shù)中。壓縮編碼思想是利用變長(zhǎng)編碼將圖像中出現(xiàn)概率大的灰度值賦予短碼字,而對(duì)出現(xiàn)概率小的灰度值賦予長(zhǎng)字碼,從而達(dá)到壓縮圖像數(shù)據(jù)的目的。哈夫曼編碼的理論依據(jù)是變字長(zhǎng)編碼理論。在變字長(zhǎng)編碼中,編碼器的編碼輸出碼字是字長(zhǎng)不等

50、的碼字,按編碼輸入信息符號(hào)出現(xiàn)的統(tǒng)計(jì)概率,給輸出碼字分配以不同的字長(zhǎng)。對(duì)于編碼輸入中,出現(xiàn)大概率息符號(hào),賦以短字長(zhǎng)的輸出碼字;對(duì)于編碼輸入中,出現(xiàn)小概率的信息符號(hào),賦以長(zhǎng)字長(zhǎng)的輸出碼字。可以證明,按照概率出現(xiàn)大小的順序,對(duì)輸出碼字分配不同碼字長(zhǎng)度的變字長(zhǎng)編碼方法,其輸出碼字的平均碼長(zhǎng)最短,與信源熵值最接近。哈夫曼碼字長(zhǎng)度和信息符號(hào)出現(xiàn)概率大小次序正好相反,即大概信息符號(hào)分配碼字長(zhǎng)度短,小概率信息符號(hào)分配碼字長(zhǎng)度長(zhǎng),編碼方法最佳。哈夫曼編碼具有以下特點(diǎn):哈夫曼編碼構(gòu)造出來(lái)的編碼值不是唯一的。原因是在給兩個(gè)最小概率的圖像的灰度值進(jìn)行編碼時(shí),可以是大概率為“0”,小概率為“1”,但也可相反;而當(dāng)兩個(gè)

51、灰度值的概率相等時(shí),“0”、“1”的分配也是隨機(jī)的,這就造成了編碼的不唯一性,可是其平均碼長(zhǎng)卻是相同的,所以不影響編碼效率和數(shù)據(jù)壓縮性能。哈夫曼編碼對(duì)不同的信源其編碼效率是不同的,當(dāng)信源概率為2的負(fù)冪次方時(shí),哈夫曼編碼的編碼效率達(dá)到100。因此只有當(dāng)信源概率分布很不均勻時(shí),哈夫曼編碼才會(huì)收到顯著的效果。換句話說(shuō),在信源概率比較接近的情況下,一般不使用哈夫曼編碼方法。哈夫曼編碼結(jié)果碼字不等長(zhǎng),雖說(shuō)平均碼字最短,效率最高,但是碼字長(zhǎng)短不一,實(shí)時(shí)硬件實(shí)現(xiàn)很復(fù)雜(特別是譯碼),而且在抗誤碼能力方面也比較差,為此,研究人員提出了一些修正方法,如雙字長(zhǎng)哈夫曼編碼(也稱(chēng)亞最佳編碼方法),希望通過(guò)降低一些效率

52、來(lái)?yè)Q取硬件實(shí)現(xiàn)簡(jiǎn)單的實(shí)惠。雙字長(zhǎng)編碼只采用兩種字長(zhǎng)的碼字,對(duì)出現(xiàn)概率高的符號(hào)用短碼字,對(duì)出現(xiàn)概率低的符號(hào)用長(zhǎng)碼字。短碼字中留下一個(gè)碼字不用,作為長(zhǎng)碼字前綴,這種方法編碼壓縮效果不如哈夫曼碼,但其硬件實(shí)現(xiàn)相對(duì)簡(jiǎn)單,抗干擾能力也比哈夫曼方法強(qiáng)得多。哈夫曼編碼應(yīng)用時(shí),均需要與其他編碼結(jié)合起來(lái)使用,才能進(jìn)一步提高數(shù)據(jù)壓縮比。例如,在靜態(tài)圖像國(guó)際壓縮標(biāo)準(zhǔn)JPEG中,先對(duì)圖像進(jìn)行分塊,然后進(jìn)行DCT變換、量化、Z形掃描、行程編碼后,再進(jìn)行哈夫曼編碼。哈夫曼編碼的一般算法如下:首先統(tǒng)計(jì)圖像灰度值出現(xiàn)的概率,按灰度值出現(xiàn)概率從大到小排序。把最小的兩個(gè)概率相加合并成新的概率,與剩余的概率組成新的概率集合。對(duì)新的

53、概率集合重新排序,再次把其中最小的兩個(gè)概率相加,組成新的概率集合。如此重復(fù)進(jìn)行,直到最后兩個(gè)概率的和為1。分配碼字。圖像灰度值的概率分布不同,哈夫曼的編碼效率有所差別。圖像灰度值分布很不均勻時(shí),哈夫曼編碼的編碼效率就高。而圖像灰度值分布比較均勻時(shí),哈夫曼編碼的編碼效率就很低。哈夫曼編碼的性質(zhì):哈夫曼編碼構(gòu)造出來(lái)的碼不是惟一的,主要有兩個(gè)原因:一是在兩個(gè)符號(hào)概率相加給兩條支路分配“0”和“1”時(shí),這一選擇是任意的;二是當(dāng)兩個(gè)消息的概率相等時(shí),0,1分配也是隨意的。哈夫曼編碼對(duì)不同的信源,其編碼效率是不同的。哈夫曼編碼中,沒(méi)有一個(gè)碼字是另一個(gè)碼字的前綴,因此,每個(gè)碼字惟一可譯。香農(nóng)范諾(Shann

54、on-Fannon)編碼香農(nóng)范諾編碼也是一種常見(jiàn)的可變字長(zhǎng)編碼,與哈夫曼編碼相似,當(dāng)信源符號(hào)出現(xiàn)的概率正好為2的負(fù)冪次方時(shí),采用香農(nóng)范諾編碼同樣能夠達(dá)到100%的編碼效率。香農(nóng)范諾編碼的理論基礎(chǔ)是符號(hào)的碼字長(zhǎng)度Ni完全由該符號(hào)出現(xiàn)的概率來(lái)決定。香農(nóng)一范諾編碼的步驟如下:將輸入灰度值xi按其出現(xiàn)概率Pi從大到小排序計(jì)算出各概率對(duì)應(yīng)的碼字長(zhǎng)度bi計(jì)算累加概率Ai把各個(gè)累加概率Ai由十進(jìn)制轉(zhuǎn)化為二進(jìn)制取小數(shù)點(diǎn)后的該二進(jìn)制數(shù)的前bi位作為對(duì)應(yīng)輸入灰度值xi的碼字。香農(nóng)一范諾的編碼程序可由下述幾個(gè)步驟來(lái)完成:首先統(tǒng)計(jì)出每個(gè)灰度值出現(xiàn)的概率;對(duì)上述概率從大到小排序;從這個(gè)概率集合中的某個(gè)位置將其分為兩個(gè)子

55、集合,并盡量使兩個(gè)子集合的概率附近似相等,給前面一個(gè)子集合賦值為0,后面一個(gè)子集合賦值為1;重復(fù)步驟(3),直到各個(gè)子集合中只有一個(gè)元素為止;將每個(gè)元素所屬的子集合的值依次串起來(lái)。算術(shù)編碼算術(shù)編碼是80年代發(fā)展起來(lái)的一種熵編碼方法,這種方法不是將單個(gè)信源符號(hào)映射成一個(gè)碼字,而是把整個(gè)信源表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間,其長(zhǎng)度等于該序列的概率,再在該區(qū)間內(nèi)選擇一個(gè)代表性的小數(shù),轉(zhuǎn)化為二進(jìn)制作為實(shí)際的編碼輸出,消息序列中的每個(gè)元素都要縮短為一個(gè)區(qū)間,消息序列中元素越多,所得到的區(qū)間就越小,當(dāng)區(qū)間變小時(shí),就需要更多的數(shù)位來(lái)表示這個(gè)區(qū)間,采用算術(shù)編碼,每個(gè)符號(hào)的平均編碼長(zhǎng)度可以為小數(shù)。算術(shù)編碼基

56、本原理是將被編碼的數(shù)據(jù)序列表示成01之間的一個(gè)間隔(也就是一個(gè)小數(shù)范圍),該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。信息越長(zhǎng),編碼表示它的間隔就越小,因而表示這一間隔所需的二進(jìn)制位數(shù)就越多(由于間隔是用小數(shù)表示的)。算術(shù)編碼有兩種模式:一種是基于信源概率統(tǒng)計(jì)特性的固定編碼模式,另一種是針對(duì)未知信源概率模型的自適應(yīng)模式。自適應(yīng)模式中各個(gè)符號(hào)的概率初始值都相同,它們依據(jù)出現(xiàn)的符號(hào)而相應(yīng)地改變。只要編碼器和解碼器都使用相同的初始值和相同的改變值的方法,那么它們的概率模型將保持一致。解碼是編碼的逆過(guò)程,根據(jù)編碼時(shí)的概率分配表和壓縮后數(shù)據(jù)代碼所在的范圍,確定代碼所對(duì)應(yīng)的每一個(gè)數(shù)據(jù)符號(hào)。上述兩種形式的算術(shù)編碼

57、均可用硬件實(shí)現(xiàn),其中自適應(yīng)模式適用于不進(jìn)行概率統(tǒng)計(jì)的場(chǎng)合。有關(guān)實(shí)驗(yàn)數(shù)據(jù)表明,在未知信源概率分布的情況下,算術(shù)編碼的實(shí)現(xiàn)方法要比哈夫曼編碼復(fù)雜一些,一般要優(yōu)于Huffman編碼。在JPEG擴(kuò)展系統(tǒng)中,就用算術(shù)編碼取代了哈夫曼編碼。行程編碼行程編碼基本方法行程編碼又稱(chēng)行程長(zhǎng)度編碼(Run Length Encoding,RLE),是一種熵編碼,也是最簡(jiǎn)單的壓縮圖像的方法之一。行程編碼原理是在給定的圖像數(shù)據(jù)中尋找連續(xù)重復(fù)的數(shù)值,然后用兩個(gè)字符值取代這些連續(xù)值。即將具有相同值的連續(xù)串用其串長(zhǎng)和一個(gè)代表值來(lái)代替,該連續(xù)串就稱(chēng)為行程,串長(zhǎng)稱(chēng)為行程長(zhǎng)度。其主要思路是將一個(gè)相同值的連續(xù)串用一個(gè)代表值和串長(zhǎng)來(lái)代

58、替。例如有一個(gè)字符串“aaabccddddd”,經(jīng)過(guò)行程編碼后可以用“3a1b2c5d”來(lái)表示。對(duì)圖像編碼來(lái)說(shuō),可以定義沿特定方向上具有相同灰度值的相鄰像素為一輪,其延續(xù)長(zhǎng)度稱(chēng)之為延續(xù)的行程,簡(jiǎn)稱(chēng)為行程或游程。例如,若沿水平方向有一串M個(gè)像素具有相同的灰度N,則行程編碼后,只傳遞兩個(gè)值(N,M)就可以代替M個(gè)像素的M個(gè)灰度值N。行程編碼分為定長(zhǎng)行程編碼和變長(zhǎng)行程編碼兩種。定長(zhǎng)行程編碼是指編碼的行程所使用的二進(jìn)制位數(shù)固定,如果灰度連續(xù)相等的個(gè)數(shù)超過(guò)了固定二進(jìn)制位數(shù)所能表示的最大值,則進(jìn)行下一輪行程編碼。變長(zhǎng)行程編碼是指對(duì)不同范圍的行程使用不同位數(shù)的二進(jìn)制位數(shù)進(jìn)行編碼,需要增加標(biāo)志位來(lái)表明所使用的

59、二進(jìn)制位數(shù)。行程編碼一般不直接應(yīng)用于多灰度圖像,但比較適合于二值圖像的編碼。為了達(dá)到較好的壓縮效果,有時(shí)行程編碼和其他一些編碼方法混合使用。例如,在JPEG中,行程編碼和DCT及哈夫曼方法一起使用,先對(duì)圖像分塊處理,然后對(duì)分塊進(jìn)行DCT,量化后的頻域圖像數(shù)據(jù)作Z形掃描,然后作行程編碼,對(duì)行程編碼的結(jié)果再進(jìn)行哈夫曼編碼。行程編碼對(duì)傳輸差錯(cuò)很敏感,一位符號(hào)出錯(cuò)就會(huì)改變行程編碼的長(zhǎng)度,從而使整個(gè)圖像出現(xiàn)偏移,因此一般要用行同步、列同步的方法把差錯(cuò)控制在一行一列之內(nèi)。PCX的RLE壓縮算法PCX格式的圖像文件是采用行程壓縮方法處理數(shù)據(jù)的。壓縮原理如下:只要在圖像數(shù)據(jù)中發(fā)現(xiàn)一串連續(xù)相同的值,就用兩個(gè)字節(jié)

60、代替這串連續(xù)相同的值,存入圖像文件中。這兩個(gè)字節(jié)中的第一個(gè)字節(jié)代表這串相同數(shù)據(jù)的個(gè)數(shù),第二字節(jié)代表這串?dāng)?shù)據(jù)的值。對(duì)于不重復(fù)的數(shù)據(jù)則單獨(dú)處理。BMP的RLE4壓縮算法利用RLE4壓縮算法處理16色位圖數(shù)據(jù)時(shí),與一般的行程編碼算法基本相同。不同點(diǎn)是RLE4壓縮算法在第1字節(jié)中所表示的連續(xù)重復(fù)數(shù)據(jù)的個(gè)數(shù)是像素個(gè)數(shù)而不是一般RLE中所定義的字節(jié)個(gè)數(shù),在RLE4壓縮算法中,每個(gè)字節(jié)包含兩個(gè)像素的顏色值。RLE4壓縮算法與一般RLE壓縮算法不同點(diǎn)還表現(xiàn)在:它是針對(duì)16色圖像數(shù)據(jù)的處理,引進(jìn)了4組特殊的識(shí)別碼:0X000X00:表示該行圖像數(shù)據(jù)己經(jīng)結(jié)束0X000X01:表示整個(gè)圖像數(shù)據(jù)結(jié)束。0X000X02

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論