圖像壓縮綜述

上傳人：鍵*** IP屬地：上海上傳時間：2022-03-04 格式：DOCX 頁數(shù)：11 大?。?05.56KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩6頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、圖像壓縮綜述摘要：隨著信息時代的不斷發(fā)展，數(shù)字圖像處理技術(shù)得到了廣泛的應用，而作為數(shù)字圖像處理技術(shù)的重要組成部分數(shù)字圖像壓縮，也得到了迅猛的發(fā)展。本文從數(shù)字圖像壓縮的概念、發(fā)展歷史、圖像壓縮的必要性和可能性、圖像壓縮標準、圖像壓縮基本方法和圖像壓縮效果評價等方面進行了綜述。引言在當前這個信息化社會中，新信息技術(shù)革命使人類被日益增多的多媒體信息所包圍。多媒體信息主要是由圖像、文本和聲音三大元素組成。圖像作為其主要元素之一，發(fā)揮著越來越重要的作用。而傳輸和存儲圖像需要占用大量的數(shù)據(jù)空間，這嚴重影響了傳輸速率和實時處理量,極大地制約了圖像通信的發(fā)展。其中，數(shù)據(jù)量最大的是數(shù)字視頻數(shù)據(jù)。未經(jīng)處理的數(shù)字視

2、頻信息需要消耗巨大的存儲資源，以主流高清視頻為例，在分辨率為1280×720，幀率為30幀每秒的視頻應用中，存儲一分鐘的視頻信息，需要約18.5G(以常4:2:0視頻，每像素12比特)比特存儲空間，一部120分鐘高清電影約需要2225G比特的存儲空間?？梢娢唇?jīng)處理的視頻信息量非常大，為了滿足存儲和傳輸需求，視頻信息的壓縮是十分必要的。在同等的通信容量下，如果圖像數(shù)據(jù)可以壓縮之后再傳輸，就可以使傳輸?shù)臄?shù)據(jù)量變得很小，也就能夠增加通信能力。因此圖像壓縮編碼技術(shù)受到了越來越多的關(guān)注及廣泛的應用。如數(shù)碼相機、USB攝像頭、可視電話、視頻點播、視頻會議系統(tǒng)、數(shù)字監(jiān)控系統(tǒng)等等，都使用到了圖像或視

3、頻的壓縮技術(shù)。數(shù)字圖像壓縮是以盡可能少的比特數(shù)代表圖像或圖像中所包含的信息量的技術(shù)，圖像通過壓縮處理去掉其中的數(shù)據(jù)冗余、符號冗余、視覺冗余等各種冗余信息，提高傳輸速率，節(jié)省存儲空間。1圖像壓縮的發(fā)展歷史自1948年提出的電視信號數(shù)字化設想后, 即開始了圖像壓縮的研究，到現(xiàn)在已有60多年的歷史。20世紀五六十年代的圖像壓縮編碼主要集中在預測編碼、哈夫曼編碼等技術(shù)的研究,還不成熟。1969年在美國召開的第一屆“圖像編碼會議”，標志著圖像編碼作為一門獨立學科的誕生。到了七八十年代,圖像壓縮技術(shù)的主要成果體現(xiàn)在變換編碼技術(shù)上, 矢量量化編碼技術(shù)也有較大的發(fā)展。80年代末,小波變換理論、分形理論、人工神

4、經(jīng)網(wǎng)絡理論、視覺仿真理論建立,人們開始突破傳統(tǒng)的信源編碼理論, 圖像壓縮編碼向著更高的壓縮率和更好的壓縮質(zhì)量的方向發(fā)展,進入了一個嶄新的發(fā)展時期。2圖像壓縮的可能性圖像之所以能夠進行壓縮有以下幾個方面的原因:一是原始圖像數(shù)據(jù)是高度相關(guān)的,存在很大的數(shù)據(jù)冗余。如圖像內(nèi)相鄰像素之間的空間冗余度、系列圖像前后幀之間的時間冗余度、多光譜遙感圖像各頻譜間的頻率域冗余度等,它們造成了大量的比特數(shù)浪費,消除這些冗余就可以節(jié)約碼字,大大減少數(shù)據(jù)量,達到數(shù)據(jù)壓縮的目的。二是信源符號出現(xiàn)的概率不同,若用相同碼長表示不同出現(xiàn)概率的符號,就會造成符號冗余度。如果采用可變長編碼技術(shù),對出現(xiàn)概率高的符號用短碼字,對出現(xiàn)概

5、率低的符號用長碼字表示,就可以消除符號冗余度,從而節(jié)約碼字。三是人眼具有視覺冗余,允許圖像編碼有一定的失真。人類視覺系統(tǒng)(HVS)是有缺陷的,人眼對于某些失真不敏感難以察覺。在許多場合中,并不要求經(jīng)壓縮及復原以后的圖像和原始圖像完全相同,可以允許有少量的失真,只要這些失真并不被人眼所察覺即可。這就為壓縮比的提高提供了十分有利的條件,這種有失真的編碼稱為限失真編碼。在多數(shù)應用中,人眼往往是圖像信息的最終接受者,圖像編碼方法如果能充分利用人眼的視覺特性,就可以在保證復原圖像主觀質(zhì)量較好的前提下取得較高的壓縮比。四是還可以利用先驗知識來實現(xiàn)圖像編碼,降低知識冗余度。例如,在可視電話中,編碼對象可為人

6、的頭和肩等,這時可利用對編碼對象的先驗知識為編碼對象建立模型,通過提取模型參數(shù),對參數(shù)進行編碼而不對圖像直接進行編碼,可以達到非常高的壓縮比。3圖像壓縮編碼標準國際標準化協(xié)會(ISO)、國際電子學委員會(IEC)、國際電信協(xié)會(ITU)等國際組織，于90年代領(lǐng)導制定了許多重要的多媒體數(shù)據(jù)壓縮標準如JPEG、H261、H263、H.264、HEVC、MPEG一1、MPEG一2、MPEG一4等等。這些標準已在數(shù)字電視、多媒體領(lǐng)域得到廣泛應用。1目前國際主流的視頻編碼國際標準主要有兩大系列，分別為H.26X系列和MPEG系列。H.26X系列包括H.2612、H.2623、H.2634、H.263+

7、5、H.263+6和H.2647、 H.265。其制定者為國際電信聯(lián)盟電信標準化部門(ITU-T: International Telecommunication Union-Telecommunication Standardization Sector)。MPEG系列包括MPEG-18、MPEG-29、MPEG-410以及正在制定中的MPEG-H11。其制定者為國際標準化組織(ISO: International Organization forStandardization)和國際電工委(IEC：International Electronics Committee)下屬的運動圖像專家組

8、(MPEG: Moving Picture Experts Group)。為了推動視頻編碼技術(shù)的發(fā)展，兩大標準組織共同制定了H.262和H.264/AVC標準。目前，為適應視頻技術(shù)發(fā)展的趨勢，兩大組織再一次合作，共同開發(fā)新一代高性能視頻編碼標準HEVC(High Efficiency Video Coding)。下圖為兩大系列標準的發(fā)展歷史圖。圖3-1 H.26X系列發(fā)展圖圖3-2 MPEG系列發(fā)展圖不同的視頻標準有不同的社會需求背景，同時所面向的應用也有所不同。下表所示為各編碼標準面向應用情況12。表3-3編碼標準面向應用除了兩大國際標準以外，還有我國自主知識產(chǎn)權(quán)的AVS編碼標準。AVS標準

9、的制定是為了適應我國信息產(chǎn)業(yè)快速崛起崛起而提出的，隨著我國在視頻編碼技術(shù)研發(fā)方面的不斷積累，相信其影響力將會不斷的增強。4圖像壓縮方法如下圖為圖像壓縮系統(tǒng)的一般模型圖4-1 圖像壓縮系統(tǒng)的一般模型4.1壓縮方法的分類研究圖像壓縮方法實際是研究圖像壓縮的算法(或者稱為“編碼)，隨著研究的不斷深入，出現(xiàn)了多種壓縮(“編碼)方法。顯然，各種編碼方法的并存是十分必要的。圖像壓縮編碼可以有多種分類方法：以恢復的圖像與原圖像關(guān)系分：無失真編碼和限失真編碼。以使用方法的原理分：基于圖像統(tǒng)計特性、基于人眼視覺特性和基于圖像特性提取編碼。以圖像的光學特性分：靜止圖像、慢速圖像和實時圖像編碼。以采用的基本理論

10、不同分：變換法和分形法編碼。4.2壓縮方法算法4.2.1 空間法空間域圖像壓縮可以有六種形式，其中包括脈沖編碼調(diào)制、預測編碼、差分脈沖碼調(diào)制、Delta 調(diào)制、內(nèi)插編碼及比特平面編碼這六種方法?？臻g域圖像壓縮的主要特點有：（1）脈沖編碼調(diào)制這種壓縮方法可接受的圖片質(zhì)量是由每像3比特量化值，壓縮比C=2.6至C=1.0，顫動法可以用來改進圖像的質(zhì)量，全然沒有利用人的視覺特性。（2）預測編碼預測編碼的理論基礎(chǔ)是現(xiàn)代統(tǒng)計學和控制論。預測編碼是根據(jù)某一模型利用以往的樣本值，對于新樣本值進行預測，然后將樣本的實際值與其預測值相減得到一個誤差值，對這一誤差值進行編碼，如果模型足夠好且樣本序列在時間上的相關(guān)

11、性較強，那么誤差信號的幅度將遠小于原始信號，從而可以用較少的數(shù)據(jù)類對其差值量化得到較大的數(shù)據(jù)壓縮結(jié)果。利用預測編碼的方法壓縮圖像數(shù)據(jù)的空間和時間冗余性，這種方法直觀、簡捷、易于實現(xiàn)，它的不足在于壓縮能力有限?，F(xiàn)在常用的一種線性預測編碼方法是差分脈沖編碼調(diào)制DPCM (differential pulse codemodulation)13線性預測形式如下：S(n1，n2)=c1s(n11,n21)+ c2s(n11，n2)+c3s(n1一1，n2+ 1)+c4s(n1，n21)。最佳線性預測選擇系數(shù)使均方誤差最小：min E(s一s)T（s一S) 預測法通常不利用人的視覺系統(tǒng)的特性，對于8比特

12、的規(guī)范形式運用兩維預測所獲得的壓縮比約為4:1。若預測參量以適當方式與數(shù)據(jù)自適應，則預測法便為自適應的。例如，一局部性測量可以定義，則預測參量在每一顯著的變化時可以被修正。用自適應修正，壓縮比可以增加百分之一到二十左右。預測的特例是差分脈沖編碼調(diào)制。（3）差分脈沖編碼調(diào)制脈沖編碼調(diào)制可獲得壓縮比為2.5:1，自主適應脈沖編碼調(diào)制可使壓縮比達3.5:1。（4）Delta調(diào)制用這種方法所獲得的壓縮比雖然不高，但方法相當簡單。（5）內(nèi)插編碼最通用的內(nèi)插方法是零階和一階內(nèi)插器，它能獲得大約4:1的壓縮比。高階多項式或樣條函數(shù)也能使用，但是其計算復雜性不能證明其結(jié)果的有效性，再則是未利用人的視覺系

13、統(tǒng)的性質(zhì)。（6）比特平面編碼用比特平面編碼法在未涉及人的視覺系統(tǒng)特性時可以獲得平均壓縮比約為4:1。4.2.2變換編碼變換編碼先對圖像進行某種函數(shù)變換，從一種表示空間變換到另一種表示空間，然后在變換后的域上，對變換后信號進行編碼。目前在圖像壓縮中經(jīng)常使用的變換有:（1）Karhunen-Loeve變換（KLT）。它是一種最優(yōu)變換。KLT可以有效地去除原始數(shù)據(jù)的相關(guān)性，從而實現(xiàn)高效壓縮。但是由于KLT變換的核不是固定的，是隨原始數(shù)據(jù)而變的，并且不存在快速算法，限制了它在實際上的應用，一般常作為其他方法的參照。（2）離散余弦變換（DCT）。對于像素間呈現(xiàn)高度相關(guān)的典型圖像，DCT的性能與KLT的

14、性能沒有實質(zhì)的區(qū)別。DCT的快速實現(xiàn)算法也已經(jīng)實現(xiàn)。與Walsh-Hadamard變換相比，DCT具有更強的信息集中能力，并且易于軟硬件的實現(xiàn)，正是由于這些優(yōu)點，DCT已經(jīng)成為當前圖像壓縮中應用最廣泛的技術(shù)。（3）Walsh-Hadamard變換（WHT）。與DCT相比，WHT的壓縮方面的性能要遜色許多，但由于實現(xiàn)起來算法簡單，且具有簡潔的去相關(guān)能力，以及特別有利于硬件實現(xiàn)，使得WHT也成為一種比較流行的算法。（4）小波變換。小波變換把圖像分解成逼近圖像和細節(jié)圖像之和，它們分別代表圖像的不同結(jié)構(gòu)，然后采用快速算法(Mallat) 進行壓縮，可以獲得很高的壓縮比?；谛〔ㄗ儞Q的圖像壓縮算法首先使

15、用某種小波基函數(shù)將圖像作小波變換，再根據(jù)4個通道的不同情況，分別量化編碼，比如對低頻頻段(LL)采用較多的量化級別，而對中間頻段(LH，RH)采用較少量化級別，對高頻頻段(HH)采用很少幾個量化級別，這樣根據(jù)重構(gòu)時對復原信號的重要程度分別對待的方式可以有效地提高壓縮比而又不產(chǎn)生明顯的失真。小波變換在靜態(tài)圖像壓縮中的作用已經(jīng)得到公認，為JPEG2000標準所采納。小波變換應用于圖像壓縮時，本質(zhì)上是對原始圖像的小波系數(shù)進行重組處理，然后用處理后的小波系數(shù)恢復圖像，在實際的信號壓縮標準中(如JPEG2000)，一般采用支集長度為9和7的雙正交小波，該方法容錯性比較好，因此更適合實際的應用。目前3個最

16、高等級的小波圖像編碼分別是嵌入式小波零樹圖像編碼(EZW),分層樹中分配樣本圖像編碼(SPIHT)和可擴展圖像壓縮編碼(EBCOT)。1.EZW算法EZW算法中采用的零樹結(jié)構(gòu)充分利用了不同尺度間小波系數(shù)的相似特性，有效地剔除了對高頻小波系數(shù)的編碼，極大的提高了小波系數(shù)的編碼效率。EZW算法以極低的復雜度獲得了高效的壓縮性能，產(chǎn)生的碼流還具有嵌入的特性，支持漸進傳輸，因此EZW算法在小波圖像編碼史上就有里程碑式的意義。零樹小波編碼基于三個關(guān)鍵的思想：（1）用小波變換去相關(guān)；（2）利用小波變換的內(nèi)在自相似性在各級之間預測重要信息的位置；（3）用自適應算法編碼進行無損壓縮。一個零樹的數(shù)據(jù)結(jié)構(gòu)可以定

17、義如下：一個小波系數(shù)x，對于一個給定的閾值T，如果|x|<T,則稱小波系數(shù)x是不重要的。如果一個小波系數(shù)在一個粗的尺度上對于給定的閾值T是不重要的，而且在較細的尺度上在同樣空間位置處的所有小波系數(shù)對于閾值T 也是不重要的，則稱這些小波系數(shù)形成了一個零樹。這時，粗尺度上的小波系數(shù)稱為父節(jié)點，它是樹根，在較細尺度上相應位置上的小波系數(shù)稱為子節(jié)點。采用這種零樹結(jié)構(gòu)可以使得用于描述重要系數(shù)位置的信息大為減少。EZW算法使用了四個符號進行編碼：零樹根、孤立零點、正重要值、負重要值。孤立零點表示當前系數(shù)值是不重要的，但它的子孫中至少有一個是重要的。正/負重要值表示當前系數(shù)是一個正/負的重要值。通過這

18、四個符號，各子帶按一定順序?qū)π〔ㄏ禂?shù)進行掃描，對小波系數(shù)進行判斷，并將相應的符號放入一個表中，從而形成了一個符號表。在EZW編/解碼過程中，始終保持著兩個列表：主表和副表。主表包括編碼中的不重要的集合或系數(shù)，其輸出信息起到了恢復各重要值的空間位置的作用；而副表包括編碼中的有效信息，輸出為各重要系數(shù)的二進制值。編碼分為主通、副通兩個過程。在主通過程中，在給定閾值下，主表進行掃描編碼，若為重要系數(shù)，則將其幅值加入副表，然后將該系數(shù)在數(shù)組中置為零，這樣當閾值減小時，該系數(shù)不會影響新零樹的出現(xiàn)；在副通過程中，對副表中的重要系數(shù)進行細化，細化過程相當于比特平面的編碼過程。零樹結(jié)構(gòu)和SAQ相結(jié)合構(gòu)成的編碼

19、器的工作過程可以概括如下：首先給出初始化閾值，進行第一次主掃描，若是重要系數(shù)，則將其幅值加入副表，然后將該系數(shù)在數(shù)組中置為零；接下來進行第一次副掃描，細化重要值的表示。更新閾值,進行新一輪主掃描，對已經(jīng)發(fā)現(xiàn)的重要小波系數(shù)的位置不再掃描；主掃描結(jié)束，進入副掃描，對原已發(fā)現(xiàn)的重要值和新發(fā)現(xiàn)的重要值進行細化處理。重復上述過程，直到滿足要求為止。EZW的編碼思想是不斷掃描變換后的圖像，生成多棵零樹來對圖像進行編碼。由于編碼時它形成多棵零樹，因而需要多次掃描圖像，造成效率很低。而在一顆零樹中包含的元素越多，則越有利于數(shù)據(jù)壓縮，在EZW算法中存在這樣的樹間冗余。人們通過對小波系數(shù)的分析發(fā)現(xiàn)，在同一子帶中相

20、鄰元素間有一定的相關(guān)性，尤其在高頻子帶中存在大量的幅值很低的系數(shù)，所以可以通過子帶的集合把這種大量的系數(shù)組織到一起，達到數(shù)據(jù)壓縮的目的，而EZW 算法并沒有充分利用這種相關(guān)性。在EZW算法的基礎(chǔ)上，許多學者又進行了深入的研究，并提出了一些更為高效的小波圖像編碼方法，這類編碼器被統(tǒng)稱為“零樹編碼器”。2.EBCOT算法EBCOT算法包括嵌入式塊編碼和分層裝配兩個結(jié)構(gòu)。嵌入式塊編碼是EBCOT的基礎(chǔ),其輸出的碼流不僅包含塊信息,而且也包含附加信息。EBCOT將待編碼的小波圖像分成尺寸相對較小的獨立編碼子塊，對每個子塊進行獨立編碼得到嵌入式碼流，進而對塊間的碼流進行組織以進一步提高壓縮性能，它的編碼

21、過程如下：將原始圖像進行小波變換，得到小波圖像以降低圖像數(shù)據(jù)的相關(guān)性；把小波圖像分成許多較小的編碼子塊Bj，Bj是獨立壓縮編碼的主體，通過對Bj的獨立優(yōu)化編碼，可充分利用塊內(nèi)數(shù)據(jù)冗余，獲取較高的壓縮性能；將位平面進一步細分為“分數(shù)位平面”以獲取更多的可截取點，并對這些截取點進行優(yōu)化，達到更好的可嵌入性；設置專門的“第二層編碼”，組織相互獨立的塊碼流，從而提供功能上的豐富性。在EBCOT算法中，最小編碼單位是編碼子塊，簡稱“碼塊”，用字母Bj表示，碼塊的分割是在圖像經(jīng)小波變換后得到的子帶圖像中進行。編碼前需把小波圖像中各個子帶圖像tbj分割成碼快Bj(j=1,2,q)，分割完成的編碼子塊應互不交

22、叉，同時編碼子塊不跨越子帶邊界，而且除邊緣碼塊外其余的碼塊形狀與大小均需相同。一般，編碼子塊的形狀取正方形，大小為2n×2n像素。量化是有損壓縮的基礎(chǔ)，通過量化處理可以進一步提高圖像壓縮倍數(shù)，這種壓縮倍數(shù)的提高是以犧牲重構(gòu)圖像質(zhì)量為代價。EBCOT算法中量化產(chǎn)生的編碼是嵌入式的，它包含兩重含義：分辨層漸進編碼，即優(yōu)先保留低分辨率系數(shù)，然后逐步加入高分辨率細節(jié)系數(shù)；質(zhì)量層漸進編碼，即在同一碼塊內(nèi)先保留系數(shù)的高位比特。對于每個子帶圖像，用戶根據(jù)視覺特性或者編碼比特率控制的要求選擇合適的量化步長，將子帶中的小波系數(shù)進行量化，量化過程會產(chǎn)生量化誤差。最終的壓縮數(shù)據(jù)由各個編碼塊的碼流組成。每一

23、個編碼塊都在一個固定的分辨率上，所以這種簡單的封包形式具有“分辨率可伸縮性”。同時，因為每一個編碼塊只影響圖像的一個區(qū)域，所以此封包形式還具有一定的“空間可伸縮性”, 這樣，如果對一個空間域上的圖像感興趣,就可以把感興趣圖像所在的編碼塊識別出來，然后進行相應的處理。盡管有些封包格式中每一個編碼塊都是嵌入式表示的，但是它并不具有“失真率可伸縮性”。為了解決這一問題，EBCOT算法中引入了“質(zhì)量層”的概念，每一個質(zhì)量層Qi由不同編碼塊的一部分碼流組成。需要強調(diào)的是，一些編碼塊在某一層中可以為空。這樣，由“質(zhì)量層結(jié)構(gòu)”構(gòu)成的碼流形式具有失真率可伸縮性,編碼后的壓縮數(shù)據(jù)就具有漸進傳輸?shù)男再|(zhì)了。3.SP

24、IHT算法SPIHT算法繼承了EZW算法的三個主要思想: 把小波系數(shù)按照幅值排序編碼傳輸，同時解碼器也按同樣的算法,以實現(xiàn)從執(zhí)行中復制編碼的排序信息；細化重要系數(shù)的位平面?zhèn)鬏?；利用小波系?shù)不同尺度同一方向的系數(shù)間的自相似性。SPIHT 算法同樣利用了樹的結(jié)構(gòu),并且對重要的樹集合進行進一步的分割,目的是使更多不重要系數(shù)包含在同一個集合里,從而提高壓縮效率。在SPIHT 算法中,使用了如下的集合定義：其中Z(i，j)為系數(shù)x(i，j)及其所有后代節(jié)點的集合，D（i，j）是系數(shù)x（i，j)的所有后代節(jié)點集合，O（i，j）是系數(shù)x（i，j)的直接后代節(jié)點的集合,L(i，j)是系數(shù)x（i，j）除去直接后

25、代的其它所有后代節(jié)點的集合，集合分割策略為： Z(i，j)=x(i，j)+D（i，j） D（i，j）=O（i，j）+L(i，j) L(i，j)=D（i，j），（k，j） SPIHT 算法通過初始化、分類掃描、細化掃描和閾值更新四個子過程來完成圖像的編碼,過程中使用了三個鏈表來記錄相關(guān)信息：不重要系數(shù)鏈表、不重要集合鏈表以及重要系數(shù)鏈表。初始化就是把整個系數(shù)矩陣分成了樹頭節(jié)點x（i，j)（放入不重要系數(shù)鏈表）和剩余集合D（i，j）（放入不重要集合鏈表）。分類掃描就是從以上的所有x（i，j)和D（i，j）中找出重要系數(shù)并放入重要系數(shù)鏈表中,以供細化處理,在這個過程中就用到了集合分割策略,不斷地對重

26、要集合進行分割,直到找出所有的重要系數(shù),并放入重要系數(shù)鏈表中。細化掃描,就是對重要系數(shù)鏈表中的每一項(除了在當前閾值進入重要系數(shù)鏈表的系數(shù))。在閾值為2n時,輸出它的第n個位平面的值。閾值更新，就是將n減1，即閾值減半，然后又重復進行分類掃描和細化掃描，直到編碼結(jié)束，或達到目標碼率，停止編碼。(5)子帶編碼子帶編碼屬于分析綜合類的編碼技術(shù)。子帶編碼的基本思想是，在編碼端，將圖像信號在頻率域分裂成若干子帶（subband），而后對各個子帶用與其統(tǒng)計特性相適合的編碼器及比特分配方案進行數(shù)據(jù)壓縮；在解碼端，將分別解碼后的各子帶信號再綜合成重建圖像。子帶編碼有三方面的優(yōu)點。一個子帶內(nèi)的編碼噪聲（失真）

27、不會擴散到其他子帶，所以，圖像經(jīng)過子帶編碼后，其能量較弱的高頻細節(jié)仍能較好地保持?？梢愿鶕?jù)視覺特性控制編碼噪聲的頻譜，使之適應人眼對不同頻帶噪聲的敏感程度，將編碼比特數(shù)在各個子帶之間合理分配，有利于提高圖像的主觀質(zhì)量。子帶編碼由于其本身具備的頻率分裂特性，非常適合于分辨率可分級、質(zhì)量可分級的圖像編碼，也非常適合嵌入式的碼流結(jié)構(gòu)。除了通過專門設計的正交鏡像濾波器實現(xiàn)的經(jīng)典子帶編碼方法之外，小波變換是目前使用最多的子帶編碼方法。早期的綜合高頻編碼、塔型編碼也屬于子帶編碼的范疇。4.2.3 統(tǒng)計編碼統(tǒng)計編碼又稱熵編碼，它是對于有不同概率的事件分配以不同長度的碼字，對概率大的事件分配以短的碼字，從而使

28、平均碼字最短。統(tǒng)計編碼實現(xiàn)事件出現(xiàn)的概率與碼字長度的最佳匹配。典型的統(tǒng)計編碼法有哈夫曼編碼（huffman）、算術(shù)編碼和行程編碼等。(1) Hufman編碼無失真編碼方法中，Hufman編碼是一種較有效的編碼方法。Huffman編碼是一種長度不均勻的，平均碼率可以接近信息熵值的一種編碼。它的編碼思想是：對于出現(xiàn)概率大的信息，采用字短的碼，對于出現(xiàn)概率低的信息采用字長的碼，以達到縮短平均碼長，從而實現(xiàn)數(shù)據(jù)的壓縮。Huffman編碼小變字長編碼方法是最佳的，其碼字平均長度很接近信息符號的熵值。Huffman編碼的最高壓縮效率可達到8：1。(2)算術(shù)編碼算術(shù)編碼完全拋棄了用特殊字符代替輸入字符的思想

29、。在算術(shù)編碼中，輸入的字符信息用0 到1 之間的是數(shù)進行編碼，它用到兩個基本的參數(shù)：符號的頻率及其編碼間隔。對于輸入的字符信息，算術(shù)編碼后形成一個唯一的浮點數(shù)。算術(shù)編碼的特點是算術(shù)編碼在自適應模式下，不必預先統(tǒng)計符號概率當信源個符號的概率比較接近時，算術(shù)編碼的效率優(yōu)于哈夫曼編碼算術(shù)編碼的實現(xiàn)比哈夫曼編碼復雜一些。（3）行程(RunLength)編碼在一個逐行存儲的圖像中，具有相同灰度值的一些像素組成的序列稱為一個行程。在編碼時，對于每個行程只存儲一個灰度值的碼，再緊跟著存儲這個行程的長度。這種按照行程進行的編碼被稱為行程編碼(Run Length Encoding)。行程編碼是相對簡單的一種編

30、碼，是指一行掃描的像素中，比較相鄰像素的幅度(如：亮度)，當幅度有顯著變化時，就說有一個行程存在。隨終點位置標記方法不同，行程編碼可分為“行程終點編碼”和“行程長度編碼”。行程編碼對于僅包含很少幾個灰度級的圖像，特別是二值圖像，比較有效。4.2.4合成高系統(tǒng)合成高系統(tǒng)的產(chǎn)生和發(fā)展經(jīng)過了近三十年的歷史，這一方法的重要性是它導致了第二代數(shù)據(jù)壓縮技術(shù)的進展。在過去沒有很好發(fā)展的直接原因是由于其計算量大而又使電腦存儲量大，而在上世紀八十年代以來由于電腦速度猛增，使得這一方法的實現(xiàn)和普及得到令人滿意的程度。它同現(xiàn)代一些方法相比，它能獲得很高的壓縮比。同時它為發(fā)展第二代圖像編碼壓縮技術(shù)提供一條有益，而且十

31、分有效的新途徑。國際上許多研究都是基于把一幅圖片分解成低頻成份和高頻成份兩部份，它是直接或間接地利用合成高系統(tǒng)分別進行編碼壓縮，然后進行綜合，獲得原始圖像的很高系統(tǒng)的壓縮性能。合成高系統(tǒng)用的信息序列以下述方式來選擇。原始圖片分成兩部份：低通圖片沒有很銳的圍線而給出一般的面積亮度，高通圖片含有很銳的邊緣信息，根據(jù)兩維抽樣定理，低通圖片可由很少的樣本表示。這些樣本是說明規(guī)范形式的低通信息的樣本。邊緣檢測可用梯度算子或拉普拉斯算子來實現(xiàn)。非線性運算取門限是對高通圖片執(zhí)行的，以確定是否邊緣點是重要的。于是，這一方法是成為無損信息的。最后，每一個選擇的邊緣點的位置和幅值被編碼。這些變量是說明高通圖片的

32、迅息。兩維重建濾波，其特性唯一地用于低通圖片的低能濾波來確定，同時用于綜合從邊緣信息來的高頻分量。合成高系統(tǒng)精巧地利用了視覺系統(tǒng)的特性。利用橫向禁止現(xiàn)象在早期處理級考慮視覺系統(tǒng)的性能。因而，它允許降低較大的剩余度。在合成高系統(tǒng)中，門限的正確利用是十分重要的。這樣可以獲得很高的壓縮比及良好的圖像質(zhì)量。若門限選得太低，雖然圖像質(zhì)量很好，但壓縮比很小。反之，若門限選擇得太高，圖像質(zhì)量差，但壓縮比很大。在壓縮比和圖像質(zhì)量之間的折衷方法目前還沒有，可以運用經(jīng)驗方法來獲得很好的結(jié)果。指向性分解法是合成高系統(tǒng)的細化，在那里提取邊緣和對邊緣編碼可以運用指向性濾波器。4.2.5 分形編碼法分形法是基于物質(zhì)的自相

33、似性，在編碼時將信號分解為若干分形子圖，然后每一個子圖像對應一個迭代函數(shù),子圖像以迭代函數(shù)存儲,迭代函數(shù)越簡單,壓縮比也就越大。同樣解碼時只要調(diào)出每一個子圖像對應的迭代函數(shù)反復迭代,就可以恢復出原來的子圖像,從而得到原始圖像?；贗FS的分形法編碼壓縮過程應包括以下步驟：將原圖預分割成若干分形子圖，使每一子圖具有一定的分形結(jié)構(gòu)。目前這一步需要采用圖像處理、計算機視覺和模式識別的技術(shù)，經(jīng)過反復試湊才能完成。對每一子圖提取IFS 代碼。即將子圖置于計算機屏幕上，采用伸縮、平移、旋轉(zhuǎn)或仿射手段，對子圖進行壓縮，獲得一組仿射變換參量，便可得到該子圖的IFS 代碼。對IFS 代碼采用經(jīng)典的編碼方法進行編

34、碼。譯碼形成IFS 代碼。由IFS 代碼，利用隨機迭代法獲取相應的重構(gòu)子圖。把各重構(gòu)子圖拼成恢復圖像。對于一定的整體與局部存在明顯相似性或仿射性的分形圖像類，這種方法可以取得很高的壓縮比。隨著分形圖像壓縮技術(shù)的發(fā)展,越來越多的算法被提出,基于分形的不同特征,可以分成以下幾種主要的分形圖像編碼方法。1.尺碼編碼方法尺碼編碼方法是基于分形幾何中利用小尺度度量不規(guī)則曲線長度的方法,類似于傳統(tǒng)的亞取樣和內(nèi)插方法,其主要不同之處在于尺度編碼方法中引入了分形的思想,尺度隨著圖像各個組成部分復雜性的不同而改變。2.迭代函數(shù)系統(tǒng)方法迭代函數(shù)系統(tǒng)方法是目前研究最多、應用最廣泛的一種分形壓縮技術(shù),它是一種人機交

35、互的拼貼技術(shù),它基于自然界圖像中普遍存在的整體和局部自相關(guān)的特點,尋找這種自相關(guān)映射關(guān)系的表達式,即仿射變換,并通過存儲比原圖像數(shù)據(jù)量小的仿射系數(shù),來達到壓縮的目的。如果尋得的仿射變換簡單而有效,那么迭代函數(shù)系統(tǒng)就可以達到極高的壓縮比。3.A-E-Jacquin的分形方案A-E-Jacquin的分形方案是一種全自動的基于塊的分形圖像壓縮方案,它也是一個尋找映射關(guān)系的過程,但尋找的對象域是將圖像分割成塊之后的局部與局部的關(guān)系。在此方案中還有一部分冗余度可以去除,而且其解碼圖像中存在著明顯的方塊效應。4.2.5神經(jīng)網(wǎng)絡人工神經(jīng)網(wǎng)絡在圖像壓縮中的應用越來越引起人們的注意，和一些傳統(tǒng)的壓縮方法相比，人

36、工神經(jīng)網(wǎng)絡技術(shù)具有良好的容錯性、自組織性和自適應性，因此在圖像壓縮過程中，不必借助于某種預先確定的數(shù)據(jù)編碼算法，神經(jīng)網(wǎng)絡能根據(jù)圖像本身的信息特點，自主地完成圖像編碼和壓縮。目前,在圖像壓縮中,使用較多的是三層BP(Back2Propagation) 網(wǎng)絡,如圖所示。將圖像先分成n個小塊,對應于輸入的n個神經(jīng)元,壓縮后的數(shù)據(jù)對應于隱含層m個神經(jīng)元,mn。通過BP 訓練算法,調(diào)整網(wǎng)絡權(quán)重,使重建圖像盡可能地相似于原始圖像,經(jīng)過訓練后BP 神經(jīng)網(wǎng)絡便可直接用來進行數(shù)據(jù)壓縮。BP 網(wǎng)絡用于數(shù)據(jù)壓縮類似于圖像的KL變換。但是,目前人工神經(jīng)網(wǎng)絡的工作原理還不清楚,神經(jīng)網(wǎng)絡的圖像編碼方法的研究目前僅處于一個

37、初級階段,需要解決的問題還很多,如完善人工神經(jīng)網(wǎng)絡的理論體系,弄清楚神經(jīng)網(wǎng)絡的工作原理,找到適合圖像數(shù)據(jù)高效壓縮,充分利用視覺信息處理機制的神經(jīng)網(wǎng)絡模型和學習算法。圖4-2 三層BP網(wǎng)絡5復原圖像質(zhì)量的性能評價復原圖像質(zhì)量是評價圖像壓縮編碼方法的最為重要的標準之一,它包括兩方面的含義:一方面是圖像的逼真度,即復原圖像與原始圖像的偏離程度;另一方面是圖像的可懂度,即圖像能向人或機器提供特征信息的能力。對于限失真編碼,原圖像與復原圖像之間存在著差異,差異的大小意味著恢復圖像的質(zhì)量不相同。但是,由于人的視覺冗余度的原因,則對有些差異的靈敏度較低,這就產(chǎn)生了兩種判別標準:一種是客觀判別標準,它建立在原

38、始圖像與復原圖像之間的誤差上;另一種是主觀評價標準,通過用人的肉眼對圖像打分而得到。5.1 主觀評價主觀評價采用平均判分MOS(Mean Option Score)或多維計分等方法進行測試,所評價出的圖像質(zhì)量不僅與圖像本身特征有關(guān),也與觀察者特性以及觀察者的環(huán)境條件有關(guān)。組織一群足夠多(至少應有20名)的觀察者(包括一般觀眾及專業(yè)人員),通過觀察來評定圖像的質(zhì)量。觀察者將復原圖像與原圖像相對比,比較損傷程度,可參照表1.1,給評定的圖像打上一定的質(zhì)量等級,最后用平均的方法得到圖像的分數(shù)。這樣的評分雖然很花時間,但比較符合實際。表5.15.2 客觀評價對圖像質(zhì)量進行定量描述是一個比較復雜的問題,

39、進展比較緩慢,一方面是因為人們還沒有充分了解視覺感知的過程和方法;另一方面是由于圖像是多維信號,很難用確定的幾個統(tǒng)計參數(shù)來表示其特征。彩色圖像由于量綱數(shù)增多,而且必須滿足人眼對彩色的視覺感知,因此對彩色圖像逼真度進行定量表示是一個更加復雜的問題。目前應用得較多的是對灰度級圖像逼真度的定量表示。一個合理的尺度應該與圖像的主觀測試結(jié)果相吻合或密切相關(guān),要求便于計算分析而且簡單易行。設原始的二維灰度圖像為A=f(i,j)。i=1,2,N;j=1,2,M,經(jīng)壓縮復原后的圖像為A=f(i,j)。可以用以下幾種指標來評價圖像的質(zhì)量?？梢钥闯?以上的評價完全取決于原始圖像與重建圖像每個像素上灰度值的誤差,這

40、種評價在主觀感覺上也有一定的參考意義。常用的客觀評價指標為PSNR,一般,當PSNR超過30dB時,人的主觀感覺很難找出其差異。主觀評價與客觀評價之間有一定的聯(lián)系,但不能完全等同?？陀^評價比較方便,很具有說服力。由于主觀評價很直觀,比較符合人的視覺效果及實際,故在制定國際標準時常被采用。總結(jié)圖像壓縮技術(shù)研究了幾十年,取得了很大的成績,但還有許多不足,值得我們進一步研究。小波圖像壓縮和分形圖像壓縮是當前研究的熱點,但二者也有各自的缺點,在今后工作中,應與人眼視覺特性相結(jié)合。總之, 圖像壓縮是一個非常有發(fā)展前途的研究領(lǐng)域, 這一領(lǐng)域的突破對于我們的信息生活和通信事業(yè)的發(fā)展具有深遠的影響。參考文獻：1 D Henriksson，A Cervin，KE Arz6nTruetime：Simulation of control loops under sharedcomputerresourcesIn Proceedings of the 1 5th IFACW orld Congress on Auto

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

圖像壓縮綜述

文檔簡介

溫馨提示

最新文檔

評論

圖像壓縮綜述

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔