圖像壓縮綜述_第1頁
圖像壓縮綜述_第2頁
圖像壓縮綜述_第3頁
圖像壓縮綜述_第4頁
圖像壓縮綜述_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、圖像壓縮綜述摘要:隨著信息時(shí)代的不斷發(fā)展,數(shù)字圖像處理技術(shù)得到了廣泛的應(yīng)用,而作為數(shù)字圖像處理技術(shù)的重要組成部分?jǐn)?shù)字圖像壓縮,也得到了迅猛的發(fā)展。本文從數(shù)字圖像壓縮的概念、發(fā)展歷史、圖像壓縮的必要性和可能性、圖像壓縮標(biāo)準(zhǔn)、圖像壓縮基本方法和圖像壓縮效果評(píng)價(jià)等方面進(jìn)行了綜述。引言在當(dāng)前這個(gè)信息化社會(huì)中,新信息技術(shù)革命使人類被日益增多的多媒體信息所包圍。多媒體信息主要是由圖像、文本和聲音三大元素組成。圖像作為其主要元素之一,發(fā)揮著越來越重要的作用。而傳輸和存儲(chǔ)圖像需要占用大量的數(shù)據(jù)空間,這嚴(yán)重影響了傳輸速率和實(shí)時(shí)處理量,極大地制約了圖像通信的發(fā)展。其中,數(shù)據(jù)量最大的是數(shù)字視頻數(shù)據(jù)。未經(jīng)處理的數(shù)字視

2、頻信息需要消耗巨大的存儲(chǔ)資源,以主流高清視頻為例,在分辨率為1280×720,幀率為30幀每秒的視頻應(yīng)用中,存儲(chǔ)一分鐘的視頻信息,需要約18.5G(以常4:2:0視頻,每像素12比特)比特存儲(chǔ)空間,一部120分鐘高清電影約需要2225G比特的存儲(chǔ)空間??梢娢唇?jīng)處理的視頻信息量非常大,為了滿足存儲(chǔ)和傳輸需求,視頻信息的壓縮是十分必要的。在同等的通信容量下,如果圖像數(shù)據(jù)可以壓縮之后再傳輸,就可以使傳輸?shù)臄?shù)據(jù)量變得很小,也就能夠增加通信能力。因此圖像壓縮編碼技術(shù)受到了越來越多的關(guān)注及廣泛的應(yīng)用。如數(shù)碼相機(jī)、USB攝像頭、可視電話、視頻點(diǎn)播、視頻會(huì)議系統(tǒng)、數(shù)字監(jiān)控系統(tǒng)等等,都使用到了圖像或視

3、頻的壓縮技術(shù)。數(shù)字圖像壓縮是以盡可能少的比特?cái)?shù)代表圖像或圖像中所包含的信息量的技術(shù),圖像通過壓縮處理去掉其中的數(shù)據(jù)冗余、符號(hào)冗余、視覺冗余等各種冗余信息,提高傳輸速率,節(jié)省存儲(chǔ)空間。1圖像壓縮的發(fā)展歷史自1948年提出的電視信號(hào)數(shù)字化設(shè)想后, 即開始了圖像壓縮的研究,到現(xiàn)在已有60多年的歷史。20世紀(jì)五六十年代的圖像壓縮編碼主要集中在預(yù)測(cè)編碼、哈夫曼編碼等技術(shù)的研究,還不成熟。1969年在美國召開的第一屆“圖像編碼會(huì)議”,標(biāo)志著圖像編碼作為一門獨(dú)立學(xué)科的誕生。到了七八十年代,圖像壓縮技術(shù)的主要成果體現(xiàn)在變換編碼技術(shù)上, 矢量量化編碼技術(shù)也有較大的發(fā)展。80年代末,小波變換理論、分形理論、人工神

4、經(jīng)網(wǎng)絡(luò)理論、視覺仿真理論建立,人們開始突破傳統(tǒng)的信源編碼理論, 圖像壓縮編碼向著更高的壓縮率和更好的壓縮質(zhì)量的方向發(fā)展,進(jìn)入了一個(gè)嶄新的發(fā)展時(shí)期。2圖像壓縮的可能性圖像之所以能夠進(jìn)行壓縮有以下幾個(gè)方面的原因:一是原始圖像數(shù)據(jù)是高度相關(guān)的,存在很大的數(shù)據(jù)冗余。如圖像內(nèi)相鄰像素之間的空間冗余度、系列圖像前后幀之間的時(shí)間冗余度、多光譜遙感圖像各頻譜間的頻率域冗余度等,它們?cè)斐闪舜罅康谋忍財(cái)?shù)浪費(fèi),消除這些冗余就可以節(jié)約碼字,大大減少數(shù)據(jù)量,達(dá)到數(shù)據(jù)壓縮的目的。二是信源符號(hào)出現(xiàn)的概率不同,若用相同碼長(zhǎng)表示不同出現(xiàn)概率的符號(hào),就會(huì)造成符號(hào)冗余度。如果采用可變長(zhǎng)編碼技術(shù),對(duì)出現(xiàn)概率高的符號(hào)用短碼字,對(duì)出現(xiàn)概

5、率低的符號(hào)用長(zhǎng)碼字表示,就可以消除符號(hào)冗余度,從而節(jié)約碼字。三是人眼具有視覺冗余,允許圖像編碼有一定的失真。人類視覺系統(tǒng)(HVS)是有缺陷的,人眼對(duì)于某些失真不敏感難以察覺。在許多場(chǎng)合中,并不要求經(jīng)壓縮及復(fù)原以后的圖像和原始圖像完全相同,可以允許有少量的失真,只要這些失真并不被人眼所察覺即可。這就為壓縮比的提高提供了十分有利的條件,這種有失真的編碼稱為限失真編碼。在多數(shù)應(yīng)用中,人眼往往是圖像信息的最終接受者,圖像編碼方法如果能充分利用人眼的視覺特性,就可以在保證復(fù)原圖像主觀質(zhì)量較好的前提下取得較高的壓縮比。四是還可以利用先驗(yàn)知識(shí)來實(shí)現(xiàn)圖像編碼,降低知識(shí)冗余度。例如,在可視電話中,編碼對(duì)象可為人

6、的頭和肩等,這時(shí)可利用對(duì)編碼對(duì)象的先驗(yàn)知識(shí)為編碼對(duì)象建立模型,通過提取模型參數(shù),對(duì)參數(shù)進(jìn)行編碼而不對(duì)圖像直接進(jìn)行編碼,可以達(dá)到非常高的壓縮比。3圖像壓縮編碼標(biāo)準(zhǔn)國際標(biāo)準(zhǔn)化協(xié)會(huì)(ISO)、國際電子學(xué)委員會(huì)(IEC)、國際電信協(xié)會(huì)(ITU)等國際組織,于90年代領(lǐng)導(dǎo)制定了許多重要的多媒體數(shù)據(jù)壓縮標(biāo)準(zhǔn) 如JPEG、H261、H263、H.264、HEVC、MPEG一1、MPEG一2、MPEG一4等等。這些標(biāo)準(zhǔn)已在數(shù)字電視、多媒體領(lǐng)域得到廣泛應(yīng)用。1目前國際主流的視頻編碼國際標(biāo)準(zhǔn)主要有兩大系列,分別為H.26X系列和MPEG系列。H.26X系列包括H.2612、H.2623、H.2634、H.263+

7、5、H.263+6和H.2647、 H.265。其制定者為國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(ITU-T: International Telecommunication Union-Telecommunication Standardization Sector)。MPEG系列包括MPEG-18、MPEG-29、MPEG-410以及正在制定中的MPEG-H11。其制定者為國際標(biāo)準(zhǔn)化組織(ISO: International Organization forStandardization)和國際電工委(IEC:International Electronics Committee)下屬的運(yùn)動(dòng)圖像專家組

8、(MPEG: Moving Picture Experts Group)。為了推動(dòng)視頻編碼技術(shù)的發(fā)展,兩大標(biāo)準(zhǔn)組織共同制定了H.262和H.264/AVC標(biāo)準(zhǔn)。目前,為適應(yīng)視頻技術(shù)發(fā)展的趨勢(shì),兩大組織再一次合作,共同開發(fā)新一代高性能視頻編碼標(biāo)準(zhǔn)HEVC(High Efficiency Video Coding)。下圖為兩大系列標(biāo)準(zhǔn)的發(fā)展歷史圖。圖3-1 H.26X系列發(fā)展圖圖3-2 MPEG系列發(fā)展圖不同的視頻標(biāo)準(zhǔn)有不同的社會(huì)需求背景,同時(shí)所面向的應(yīng)用也有所不同。下表所示為各編碼標(biāo)準(zhǔn)面向應(yīng)用情況12。表3-3編碼標(biāo)準(zhǔn)面向應(yīng)用除了兩大國際標(biāo)準(zhǔn)以外,還有我國自主知識(shí)產(chǎn)權(quán)的AVS編碼標(biāo)準(zhǔn)。AVS標(biāo)準(zhǔn)

9、的制定是為了適應(yīng)我國信息產(chǎn)業(yè)快速崛起崛起而提出的,隨著我國在視頻編碼技術(shù)研發(fā)方面的不斷積累,相信其影響力將會(huì)不斷的增強(qiáng)。4圖像壓縮方法如下圖為圖像壓縮系統(tǒng)的一般模型圖4-1 圖像壓縮系統(tǒng)的一般模型4.1壓縮方法的分類研究圖像壓縮方法實(shí)際是研究圖像壓縮的算法(或者稱為“編碼),隨著研究的不斷深入,出現(xiàn)了多種壓縮(“編碼)方法。顯然,各種編碼方法的并存是十分必要的。圖像壓縮編碼可以有多種分類方法: 以恢復(fù)的圖像與原圖像關(guān)系分:無失真編碼和限失真編碼。以使用方法的原理分:基于圖像統(tǒng)計(jì)特性、基于人眼視覺特性和基于圖像特性提取編碼。以圖像的光學(xué)特性分:靜止圖像、慢速圖像和實(shí)時(shí)圖像編碼。 以采用的基本理論

10、不同分:變換法和分形法編碼。4.2壓縮方法算法4.2.1 空間法空間域圖像壓縮可以有六種形式,其中包括脈沖編碼調(diào)制、預(yù)測(cè)編碼、差分脈沖碼調(diào)制、Delta 調(diào)制、內(nèi)插編碼及比特平面編碼這六種方法。空間域圖像壓縮的主要特點(diǎn)有:(1)脈沖編碼調(diào)制這種壓縮方法可接受的圖片質(zhì)量是由每像3比特量化值,壓縮比C=2.6至C=1.0,顫動(dòng)法可以用來改進(jìn)圖像的質(zhì)量,全然沒有利用人的視覺特性。(2)預(yù)測(cè)編碼預(yù)測(cè)編碼的理論基礎(chǔ)是現(xiàn)代統(tǒng)計(jì)學(xué)和控制論。預(yù)測(cè)編碼是根據(jù)某一模型利用以往的樣本值,對(duì)于新樣本值進(jìn)行預(yù)測(cè),然后將樣本的實(shí)際值與其預(yù)測(cè)值相減得到一個(gè)誤差值,對(duì)這一誤差值進(jìn)行編碼,如果模型足夠好且樣本序列在時(shí)間上的相關(guān)

11、性較強(qiáng),那么誤差信號(hào)的幅度將遠(yuǎn)小于原始信號(hào),從而可以用較少的數(shù)據(jù)類對(duì)其差值量化得到較大的數(shù)據(jù)壓縮結(jié)果。利用預(yù)測(cè)編碼的方法壓縮圖像數(shù)據(jù)的空間和時(shí)間冗余性,這種方法直觀、簡(jiǎn)捷、易于實(shí)現(xiàn),它的不足在于壓縮能力有限?,F(xiàn)在常用的一種線性預(yù)測(cè)編碼方法是差分脈沖編碼調(diào)制DPCM (differential pulse codemodulation)13線性預(yù)測(cè)形式如下:S(n1,n2)=c1s(n11,n21)+ c2s(n11,n2)+c3s(n1一1,n2+ 1)+c4s(n1,n21)。最佳線性預(yù)測(cè)選擇系數(shù)使均方誤差最小:min E(s一s)T(s一S) 預(yù)測(cè)法通常不利用人的視覺系統(tǒng)的特性,對(duì)于8比特

12、的規(guī)范形式運(yùn)用兩維預(yù)測(cè)所獲得的壓縮比約為4:1。若預(yù)測(cè)參量以適當(dāng)方式與數(shù)據(jù)自適應(yīng),則預(yù)測(cè)法便為自適應(yīng)的。例如,一局部性測(cè)量可以定義,則預(yù)測(cè)參量在每一顯著的變化時(shí)可以被修正。用自適應(yīng)修正,壓縮比可以增加百分之一到二十左右。預(yù)測(cè)的特例是差分脈沖編碼調(diào)制。(3)差分脈沖編碼調(diào)制 脈沖編碼調(diào)制可獲得壓縮比為2.5:1,自主適應(yīng)脈沖編碼調(diào)制可使壓縮比達(dá)3.5:1。(4)Delta調(diào)制 用這種方法所獲得的壓縮比雖然不高,但方法相當(dāng)簡(jiǎn)單。(5)內(nèi)插編碼 最通用的內(nèi)插方法是零階和一階內(nèi)插器,它能獲得大約4:1的壓縮比。高階多項(xiàng)式或樣條函數(shù)也能使用,但是其計(jì)算復(fù)雜性不能證明其結(jié)果的有效性,再則是未利用人的視覺系

13、統(tǒng)的性質(zhì)。(6)比特平面編碼 用比特平面編碼法在未涉及人的視覺系統(tǒng)特性時(shí)可以獲得平均壓縮比約為4:1。4.2.2變換編碼變換編碼先對(duì)圖像進(jìn)行某種函數(shù)變換,從一種表示空間變換到另一種表示空間,然后在變換后的域上,對(duì)變換后信號(hào)進(jìn)行編碼。目前在圖像壓縮中經(jīng)常使用的變換有:(1)Karhunen-Loeve變換(KLT)。它是一種最優(yōu)變換。KLT可以有效地去除原始數(shù)據(jù)的相關(guān)性,從而實(shí)現(xiàn)高效壓縮。但是由于KLT變換的核不是固定的,是隨原始數(shù)據(jù)而變的,并且不存在快速算法,限制了它在實(shí)際上的應(yīng)用,一般常作為其他方法的參照。(2)離散余弦變換(DCT)。對(duì)于像素間呈現(xiàn)高度相關(guān)的典型圖像,DCT的性能與KLT的

14、性能沒有實(shí)質(zhì)的區(qū)別。DCT的快速實(shí)現(xiàn)算法也已經(jīng)實(shí)現(xiàn)。與Walsh-Hadamard變換相比,DCT具有更強(qiáng)的信息集中能力,并且易于軟硬件的實(shí)現(xiàn),正是由于這些優(yōu)點(diǎn),DCT已經(jīng)成為當(dāng)前圖像壓縮中應(yīng)用最廣泛的技術(shù)。(3)Walsh-Hadamard變換(WHT)。與DCT相比,WHT的壓縮方面的性能要遜色許多,但由于實(shí)現(xiàn)起來算法簡(jiǎn)單,且具有簡(jiǎn)潔的去相關(guān)能力,以及特別有利于硬件實(shí)現(xiàn),使得WHT也成為一種比較流行的算法。(4)小波變換。小波變換把圖像分解成逼近圖像和細(xì)節(jié)圖像之和,它們分別代表圖像的不同結(jié)構(gòu),然后采用快速算法(Mallat) 進(jìn)行壓縮,可以獲得很高的壓縮比?;谛〔ㄗ儞Q的圖像壓縮算法首先使

15、用某種小波基函數(shù)將圖像作小波變換,再根據(jù)4個(gè)通道的不同情況,分別量化編碼,比如對(duì)低頻頻段(LL)采用較多的量化級(jí)別,而對(duì)中間頻段(LH,RH)采用較少量化級(jí)別,對(duì)高頻頻段(HH)采用很少幾個(gè)量化級(jí)別,這樣根據(jù)重構(gòu)時(shí)對(duì)復(fù)原信號(hào)的重要程度分別對(duì)待的方式可以有效地提高壓縮比而又不產(chǎn)生明顯的失真。小波變換在靜態(tài)圖像壓縮中的作用已經(jīng)得到公認(rèn),為JPEG2000標(biāo)準(zhǔn)所采納。小波變換應(yīng)用于圖像壓縮時(shí),本質(zhì)上是對(duì)原始圖像的小波系數(shù)進(jìn)行重組處理,然后用處理后的小波系數(shù)恢復(fù)圖像,在實(shí)際的信號(hào)壓縮標(biāo)準(zhǔn)中(如JPEG2000),一般采用支集長(zhǎng)度為9和7的雙正交小波,該方法容錯(cuò)性比較好,因此更適合實(shí)際的應(yīng)用。目前3個(gè)最

16、高等級(jí)的小波圖像編碼分別是嵌入式小波零樹圖像編碼(EZW),分層樹中分配樣本圖像編碼(SPIHT)和可擴(kuò)展圖像壓縮編碼(EBCOT)。1.EZW算法EZW算法中采用的零樹結(jié)構(gòu)充分利用了不同尺度間小波系數(shù)的相似特性,有效地剔除了對(duì)高頻小波系數(shù)的編碼,極大的提高了小波系數(shù)的編碼效率。EZW算法以極低的復(fù)雜度獲得了高效的壓縮性能,產(chǎn)生的碼流還具有嵌入的特性,支持漸進(jìn)傳輸,因此EZW算法在小波圖像編碼史上就有里程碑式的意義。零樹小波編碼基于三個(gè)關(guān)鍵的思想:(1)用小波變換去相關(guān);(2)利用小波變換的內(nèi)在自相似性在各級(jí)之間預(yù)測(cè)重要信息的位置;(3)用自適應(yīng)算法編碼進(jìn)行無損壓縮。 一個(gè)零樹的數(shù)據(jù)結(jié)構(gòu)可以定

17、義如下:一個(gè)小波系數(shù)x,對(duì)于一個(gè)給定的閾值T,如果|x|<T,則稱小波系數(shù)x是不重要的。如果一個(gè)小波系數(shù)在一個(gè)粗的尺度上對(duì)于給定的閾值T是不重要的,而且在較細(xì)的尺度上在同樣空間位置處的所有小波系數(shù)對(duì)于閾值T 也是不重要的,則稱這些小波系數(shù)形成了一個(gè)零樹。這時(shí),粗尺度上的小波系數(shù)稱為父節(jié)點(diǎn),它是樹根,在較細(xì)尺度上相應(yīng)位置上的小波系數(shù)稱為子節(jié)點(diǎn)。采用這種零樹結(jié)構(gòu)可以使得用于描述重要系數(shù)位置的信息大為減少。EZW算法使用了四個(gè)符號(hào)進(jìn)行編碼:零樹根、孤立零點(diǎn)、正重要值、負(fù)重要值。孤立零點(diǎn)表示當(dāng)前系數(shù)值是不重要的,但它的子孫中至少有一個(gè)是重要的。正/負(fù)重要值表示當(dāng)前系數(shù)是一個(gè)正/負(fù)的重要值。通過這

18、四個(gè)符號(hào),各子帶按一定順序?qū)π〔ㄏ禂?shù)進(jìn)行掃描,對(duì)小波系數(shù)進(jìn)行判斷,并將相應(yīng)的符號(hào)放入一個(gè)表中,從而形成了一個(gè)符號(hào)表。在EZW編/解碼過程中,始終保持著兩個(gè)列表:主表和副表。主表包括編碼中的不重要的集合或系數(shù),其輸出信息起到了恢復(fù)各重要值的空間位置的作用;而副表包括編碼中的有效信息,輸出為各重要系數(shù)的二進(jìn)制值。編碼分為主通、副通兩個(gè)過程。在主通過程中,在給定閾值下,主表進(jìn)行掃描編碼,若為重要系數(shù),則將其幅值加入副表,然后將該系數(shù)在數(shù)組中置為零,這樣當(dāng)閾值減小時(shí),該系數(shù)不會(huì)影響新零樹的出現(xiàn);在副通過程中,對(duì)副表中的重要系數(shù)進(jìn)行細(xì)化,細(xì)化過程相當(dāng)于比特平面的編碼過程。零樹結(jié)構(gòu)和SAQ相結(jié)合構(gòu)成的編碼

19、器的工作過程可以概括如下:首先給出初始化閾值,進(jìn)行第一次主掃描,若是重要系數(shù),則將其幅值加入副表,然后將該系數(shù)在數(shù)組中置為零;接下來進(jìn)行第一次副掃描,細(xì)化重要值的表示。更新閾值,進(jìn)行新一輪主掃描,對(duì)已經(jīng)發(fā)現(xiàn)的重要小波系數(shù)的位置不再掃描;主掃描結(jié)束,進(jìn)入副掃描,對(duì)原已發(fā)現(xiàn)的重要值和新發(fā)現(xiàn)的重要值進(jìn)行細(xì)化處理。重復(fù)上述過程,直到滿足要求為止。EZW的編碼思想是不斷掃描變換后的圖像,生成多棵零樹來對(duì)圖像進(jìn)行編碼。由于編碼時(shí)它形成多棵零樹,因而需要多次掃描圖像,造成效率很低。而在一顆零樹中包含的元素越多,則越有利于數(shù)據(jù)壓縮,在EZW算法中存在這樣的樹間冗余。人們通過對(duì)小波系數(shù)的分析發(fā)現(xiàn),在同一子帶中相

20、鄰元素間有一定的相關(guān)性,尤其在高頻子帶中存在大量的幅值很低的系數(shù),所以可以通過子帶的集合把這種大量的系數(shù)組織到一起,達(dá)到數(shù)據(jù)壓縮的目的,而EZW 算法并沒有充分利用這種相關(guān)性。在EZW算法的基礎(chǔ)上,許多學(xué)者又進(jìn)行了深入的研究,并提出了一些更為高效的小波圖像編碼方法,這類編碼器被統(tǒng)稱為“零樹編碼器”。2.EBCOT算法EBCOT算法包括嵌入式塊編碼和分層裝配兩個(gè)結(jié)構(gòu)。嵌入式塊編碼是EBCOT的基礎(chǔ),其輸出的碼流不僅包含塊信息,而且也包含附加信息。EBCOT將待編碼的小波圖像分成尺寸相對(duì)較小的獨(dú)立編碼子塊,對(duì)每個(gè)子塊進(jìn)行獨(dú)立編碼得到嵌入式碼流,進(jìn)而對(duì)塊間的碼流進(jìn)行組織以進(jìn)一步提高壓縮性能,它的編碼

21、過程如下:將原始圖像進(jìn)行小波變換,得到小波圖像以降低圖像數(shù)據(jù)的相關(guān)性;把小波圖像分成許多較小的編碼子塊Bj,Bj是獨(dú)立壓縮編碼的主體,通過對(duì)Bj的獨(dú)立優(yōu)化編碼,可充分利用塊內(nèi)數(shù)據(jù)冗余,獲取較高的壓縮性能;將位平面進(jìn)一步細(xì)分為“分?jǐn)?shù)位平面”以獲取更多的可截取點(diǎn),并對(duì)這些截取點(diǎn)進(jìn)行優(yōu)化,達(dá)到更好的可嵌入性;設(shè)置專門的“第二層編碼”,組織相互獨(dú)立的塊碼流,從而提供功能上的豐富性。在EBCOT算法中,最小編碼單位是編碼子塊,簡(jiǎn)稱“碼塊”,用字母Bj表示,碼塊的分割是在圖像經(jīng)小波變換后得到的子帶圖像中進(jìn)行。編碼前需把小波圖像中各個(gè)子帶圖像tbj分割成碼快Bj(j=1,2,q),分割完成的編碼子塊應(yīng)互不交

22、叉,同時(shí)編碼子塊不跨越子帶邊界,而且除邊緣碼塊外其余的碼塊形狀與大小均需相同。一般,編碼子塊的形狀取正方形,大小為2n×2n像素。量化是有損壓縮的基礎(chǔ),通過量化處理可以進(jìn)一步提高圖像壓縮倍數(shù),這種壓縮倍數(shù)的提高是以犧牲重構(gòu)圖像質(zhì)量為代價(jià)。EBCOT算法中量化產(chǎn)生的編碼是嵌入式的,它包含兩重含義:分辨層漸進(jìn)編碼,即優(yōu)先保留低分辨率系數(shù),然后逐步加入高分辨率細(xì)節(jié)系數(shù);質(zhì)量層漸進(jìn)編碼,即在同一碼塊內(nèi)先保留系數(shù)的高位比特。對(duì)于每個(gè)子帶圖像,用戶根據(jù)視覺特性或者編碼比特率控制的要求選擇合適的量化步長(zhǎng),將子帶中的小波系數(shù)進(jìn)行量化,量化過程會(huì)產(chǎn)生量化誤差。最終的壓縮數(shù)據(jù)由各個(gè)編碼塊的碼流組成。每一

23、個(gè)編碼塊都在一個(gè)固定的分辨率上,所以這種簡(jiǎn)單的封包形式具有“分辨率可伸縮性”。同時(shí),因?yàn)槊恳粋€(gè)編碼塊只影響圖像的一個(gè)區(qū)域,所以此封包形式還具有一定的“空間可伸縮性”, 這樣,如果對(duì)一個(gè)空間域上的圖像感興趣,就可以把感興趣圖像所在的編碼塊識(shí)別出來,然后進(jìn)行相應(yīng)的處理。盡管有些封包格式中每一個(gè)編碼塊都是嵌入式表示的,但是它并不具有“失真率可伸縮性”。為了解決這一問題,EBCOT算法中引入了“質(zhì)量層”的概念,每一個(gè)質(zhì)量層Qi由不同編碼塊的一部分碼流組成。需要強(qiáng)調(diào)的是,一些編碼塊在某一層中可以為空。這樣,由“質(zhì)量層結(jié)構(gòu)”構(gòu)成的碼流形式具有失真率可伸縮性,編碼后的壓縮數(shù)據(jù)就具有漸進(jìn)傳輸?shù)男再|(zhì)了。3.SP

24、IHT算法SPIHT算法繼承了EZW算法的三個(gè)主要思想: 把小波系數(shù)按照幅值排序編碼傳輸,同時(shí)解碼器也按同樣的算法,以實(shí)現(xiàn)從執(zhí)行中復(fù)制編碼的排序信息;細(xì)化重要系數(shù)的位平面?zhèn)鬏敚焕眯〔ㄏ禂?shù)不同尺度同一方向的系數(shù)間的自相似性。SPIHT 算法同樣利用了樹的結(jié)構(gòu),并且對(duì)重要的樹集合進(jìn)行進(jìn)一步的分割,目的是使更多不重要系數(shù)包含在同一個(gè)集合里,從而提高壓縮效率。在SPIHT 算法中,使用了如下的集合定義:其中Z(i,j)為系數(shù)x(i,j)及其所有后代節(jié)點(diǎn)的集合,D(i,j)是系數(shù)x(i,j)的所有后代節(jié)點(diǎn)集合,O(i,j)是系數(shù)x(i,j)的直接后代節(jié)點(diǎn)的集合,L(i,j)是系數(shù)x(i,j)除去直接后

25、代的其它所有后代節(jié)點(diǎn)的集合,集合分割策略為: Z(i,j)=x(i,j)+D(i,j) D(i,j)=O(i,j)+L(i,j) L(i,j)=D(i,j),(k,j) SPIHT 算法通過初始化、分類掃描、細(xì)化掃描和閾值更新四個(gè)子過程來完成圖像的編碼,過程中使用了三個(gè)鏈表來記錄相關(guān)信息:不重要系數(shù)鏈表、不重要集合鏈表以及重要系數(shù)鏈表。初始化就是把整個(gè)系數(shù)矩陣分成了樹頭節(jié)點(diǎn)x(i,j)(放入不重要系數(shù)鏈表)和剩余集合D(i,j)(放入不重要集合鏈表)。分類掃描就是從以上的所有x(i,j)和D(i,j)中找出重要系數(shù)并放入重要系數(shù)鏈表中,以供細(xì)化處理,在這個(gè)過程中就用到了集合分割策略,不斷地對(duì)重

26、要集合進(jìn)行分割,直到找出所有的重要系數(shù),并放入重要系數(shù)鏈表中。細(xì)化掃描,就是對(duì)重要系數(shù)鏈表中的每一項(xiàng)(除了在當(dāng)前閾值進(jìn)入重要系數(shù)鏈表的系數(shù))。在閾值為2n時(shí),輸出它的第n個(gè)位平面的值。閾值更新,就是將n減1,即閾值減半,然后又重復(fù)進(jìn)行分類掃描和細(xì)化掃描,直到編碼結(jié)束,或達(dá)到目標(biāo)碼率,停止編碼。(5)子帶編碼子帶編碼屬于分析綜合類的編碼技術(shù)。子帶編碼的基本思想是,在編碼端,將圖像信號(hào)在頻率域分裂成若干子帶(subband),而后對(duì)各個(gè)子帶用與其統(tǒng)計(jì)特性相適合的編碼器及比特分配方案進(jìn)行數(shù)據(jù)壓縮;在解碼端,將分別解碼后的各子帶信號(hào)再綜合成重建圖像。子帶編碼有三方面的優(yōu)點(diǎn)。一個(gè)子帶內(nèi)的編碼噪聲(失真)

27、不會(huì)擴(kuò)散到其他子帶,所以,圖像經(jīng)過子帶編碼后,其能量較弱的高頻細(xì)節(jié)仍能較好地保持??梢愿鶕?jù)視覺特性控制編碼噪聲的頻譜,使之適應(yīng)人眼對(duì)不同頻帶噪聲的敏感程度,將編碼比特?cái)?shù)在各個(gè)子帶之間合理分配,有利于提高圖像的主觀質(zhì)量。子帶編碼由于其本身具備的頻率分裂特性,非常適合于分辨率可分級(jí)、質(zhì)量可分級(jí)的圖像編碼,也非常適合嵌入式的碼流結(jié)構(gòu)。除了通過專門設(shè)計(jì)的正交鏡像濾波器實(shí)現(xiàn)的經(jīng)典子帶編碼方法之外,小波變換是目前使用最多的子帶編碼方法。早期的綜合高頻編碼、塔型編碼也屬于子帶編碼的范疇。4.2.3 統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼又稱熵編碼,它是對(duì)于有不同概率的事件分配以不同長(zhǎng)度的碼字,對(duì)概率大的事件分配以短的碼字,從而使

28、平均碼字最短。統(tǒng)計(jì)編碼實(shí)現(xiàn)事件出現(xiàn)的概率與碼字長(zhǎng)度的最佳匹配。典型的統(tǒng)計(jì)編碼法有哈夫曼編碼(huffman)、算術(shù)編碼和行程編碼等。(1) Hufman編碼無失真編碼方法中,Hufman編碼是一種較有效的編碼方法。Huffman編碼是一種長(zhǎng)度不均勻的,平均碼率可以接近信息熵值的一種編碼。它的編碼思想是:對(duì)于出現(xiàn)概率大的信息,采用字短的碼,對(duì)于出現(xiàn)概率低的信息采用字長(zhǎng)的碼,以達(dá)到縮短平均碼長(zhǎng),從而實(shí)現(xiàn)數(shù)據(jù)的壓縮。Huffman編碼小變字長(zhǎng)編碼方法是最佳的,其碼字平均長(zhǎng)度很接近信息符號(hào)的熵值。Huffman編碼的最高壓縮效率可達(dá)到8:1。(2)算術(shù)編碼算術(shù)編碼完全拋棄了用特殊字符代替輸入字符的思想

29、。在算術(shù)編碼中,輸入的字符信息用0 到1 之間的是數(shù)進(jìn)行編碼,它用到兩個(gè)基本的參數(shù):符號(hào)的頻率及其編碼間隔。對(duì)于輸入的字符信息,算術(shù)編碼后形成一個(gè)唯一的浮點(diǎn)數(shù)。算術(shù)編碼的特點(diǎn)是算術(shù)編碼在自適應(yīng)模式下,不必預(yù)先統(tǒng)計(jì)符號(hào)概率當(dāng)信源個(gè)符號(hào)的概率比較接近時(shí),算術(shù)編碼的效率優(yōu)于哈夫曼編碼算術(shù)編碼的實(shí)現(xiàn)比哈夫曼編碼復(fù)雜一些。(3)行程(RunLength)編碼在一個(gè)逐行存儲(chǔ)的圖像中,具有相同灰度值的一些像素組成的序列稱為一個(gè)行程。在編碼時(shí),對(duì)于每個(gè)行程只存儲(chǔ)一個(gè)灰度值的碼,再緊跟著存儲(chǔ)這個(gè)行程的長(zhǎng)度。這種按照行程進(jìn)行的編碼被稱為行程編碼(Run Length Encoding)。行程編碼是相對(duì)簡(jiǎn)單的一種編

30、碼,是指一行掃描的像素中,比較相鄰像素的幅度(如:亮度),當(dāng)幅度有顯著變化時(shí),就說有一個(gè)行程存在。隨終點(diǎn)位置標(biāo)記方法不同,行程編碼可分為“行程終點(diǎn)編碼”和“行程長(zhǎng)度編碼”。行程編碼對(duì)于僅包含很少幾個(gè)灰度級(jí)的圖像,特別是二值圖像,比較有效。4.2.4合成高系統(tǒng)合成高系統(tǒng)的產(chǎn)生和發(fā)展經(jīng)過了近三十年的歷史,這一方法的重要性是它導(dǎo)致了第二代數(shù)據(jù)壓縮技術(shù)的進(jìn)展。在過去沒有很好發(fā)展的直接原因是由于其計(jì)算量大而又使電腦存儲(chǔ)量大,而在上世紀(jì)八十年代以來由于電腦速度猛增,使得這一方法的實(shí)現(xiàn)和普及得到令人滿意的程度。它同現(xiàn)代一些方法相比,它能獲得很高的壓縮比。同時(shí)它為發(fā)展第二代圖像編碼壓縮技術(shù)提供一條有益,而且十

31、分有效的新途徑。國際上許多研究都是基于把一幅圖片分解成低頻成份和高頻成份兩部份,它是直接或間接地利用合成高系統(tǒng)分別進(jìn)行編碼壓縮,然后進(jìn)行綜合,獲得原始圖像的很高系統(tǒng)的壓縮性能。合成高系統(tǒng)用的信息序列以下述方式來選擇。原始圖片分成兩部份: 低通圖片沒有很銳的圍線而給出一般的面積亮度,高通圖片含有很銳的邊緣信息,根據(jù)兩維抽樣定理,低通圖片可由很少的樣本表示。這些樣本是說明規(guī)范形式的低通信息的樣本。邊緣檢測(cè)可用梯度算子或拉普拉斯算子來實(shí)現(xiàn)。非線性運(yùn)算取門限是對(duì)高通圖片執(zhí)行的,以確定是否邊緣點(diǎn)是重要的。于是,這一方法是成為無損信息的。最后,每一個(gè)選擇的邊緣點(diǎn)的位置和幅值被編碼。這些變量是說明高通圖片的

32、迅息。兩維重建濾波,其特性唯一地用于低通圖片的低能濾波來確定,同時(shí)用于綜合從邊緣信息來的高頻分量。合成高系統(tǒng)精巧地利用了視覺系統(tǒng)的特性。利用橫向禁止現(xiàn)象在早期處理級(jí)考慮視覺系統(tǒng)的性能。因而,它允許降低較大的剩余度。在合成高系統(tǒng)中,門限的正確利用是十分重要的。這樣可以獲得很高的壓縮比及良好的圖像質(zhì)量。若門限選得太低,雖然圖像質(zhì)量很好,但壓縮比很小。反之,若門限選擇得太高,圖像質(zhì)量差,但壓縮比很大。在壓縮比和圖像質(zhì)量之間的折衷方法目前還沒有,可以運(yùn)用經(jīng)驗(yàn)方法來獲得很好的結(jié)果。指向性分解法是合成高系統(tǒng)的細(xì)化,在那里提取邊緣和對(duì)邊緣編碼可以運(yùn)用指向性濾波器。4.2.5 分形編碼法分形法是基于物質(zhì)的自相

33、似性,在編碼時(shí)將信號(hào)分解為若干分形子圖,然后每一個(gè)子圖像對(duì)應(yīng)一個(gè)迭代函數(shù),子圖像以迭代函數(shù)存儲(chǔ),迭代函數(shù)越簡(jiǎn)單,壓縮比也就越大。同樣解碼時(shí)只要調(diào)出每一個(gè)子圖像對(duì)應(yīng)的迭代函數(shù)反復(fù)迭代,就可以恢復(fù)出原來的子圖像,從而得到原始圖像?;贗FS的分形法編碼壓縮過程應(yīng)包括以下步驟:將原圖預(yù)分割成若干分形子圖,使每一子圖具有一定的分形結(jié)構(gòu)。目前這一步需要采用圖像處理、計(jì)算機(jī)視覺和模式識(shí)別的技術(shù),經(jīng)過反復(fù)試湊才能完成。對(duì)每一子圖提取IFS 代碼。即將子圖置于計(jì)算機(jī)屏幕上,采用伸縮、平移、旋轉(zhuǎn)或仿射手段,對(duì)子圖進(jìn)行壓縮,獲得一組仿射變換參量,便可得到該子圖的IFS 代碼。對(duì)IFS 代碼采用經(jīng)典的編碼方法進(jìn)行編

34、碼。譯碼形成IFS 代碼。由IFS 代碼,利用隨機(jī)迭代法獲取相應(yīng)的重構(gòu)子圖。把各重構(gòu)子圖拼成恢復(fù)圖像。對(duì)于一定的整體與局部存在明顯相似性或仿射性的分形圖像類,這種方法可以取得很高的壓縮比。隨著分形圖像壓縮技術(shù)的發(fā)展,越來越多的算法被提出,基于分形的不同特征,可以分成以下幾種主要的分形圖像編碼方法。1.尺碼編碼方法尺碼編碼方法是基于分形幾何中利用小尺度度量不規(guī)則曲線長(zhǎng)度的方法,類似于傳統(tǒng)的亞取樣和內(nèi)插方法,其主要不同之處在于尺度編碼方法中引入了分形的思想,尺度 隨著圖像各個(gè)組成部分復(fù)雜性的不同而改變。2.迭代函數(shù)系統(tǒng)方法迭代函數(shù)系統(tǒng)方法是目前研究最多、應(yīng)用最廣泛的一種分形壓縮技術(shù),它是一種人機(jī)交

35、互的拼貼技術(shù),它基于自然界圖像中普遍存在的整體和局部自相關(guān)的特點(diǎn),尋找這種自相關(guān)映射關(guān)系的表達(dá)式,即仿射變換,并通過存儲(chǔ)比原圖像數(shù)據(jù)量小的仿射系數(shù),來達(dá)到壓縮的目的。如果尋得的仿射變換簡(jiǎn)單而有效,那么迭代函數(shù)系統(tǒng)就可以達(dá)到極高的壓縮比。3.A-E-Jacquin的分形方案A-E-Jacquin的分形方案是一種全自動(dòng)的基于塊的分形圖像壓縮方案,它也是一個(gè)尋找映射關(guān)系的過程,但尋找的對(duì)象域是將圖像分割成塊之后的局部與局部的關(guān)系。在此方案中還有一部分冗余度可以去除,而且其解碼圖像中存在著明顯的方塊效應(yīng)。4.2.5神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)在圖像壓縮中的應(yīng)用越來越引起人們的注意,和一些傳統(tǒng)的壓縮方法相比,人

36、工神經(jīng)網(wǎng)絡(luò)技術(shù)具有良好的容錯(cuò)性、自組織性和自適應(yīng)性,因此在圖像壓縮過程中,不必借助于某種預(yù)先確定的數(shù)據(jù)編碼算法,神經(jīng)網(wǎng)絡(luò)能根據(jù)圖像本身的信息特點(diǎn),自主地完成圖像編碼和壓縮。目前,在圖像壓縮中,使用較多的是三層BP(Back2Propagation) 網(wǎng)絡(luò),如圖所示。將圖像先分成n個(gè)小塊,對(duì)應(yīng)于輸入的n個(gè)神經(jīng)元,壓縮后的數(shù)據(jù)對(duì)應(yīng)于隱含層m個(gè)神經(jīng)元,mn。通過BP 訓(xùn)練算法,調(diào)整網(wǎng)絡(luò)權(quán)重,使重建圖像盡可能地相似于原始圖像,經(jīng)過訓(xùn)練后BP 神經(jīng)網(wǎng)絡(luò)便可直接用來進(jìn)行數(shù)據(jù)壓縮。BP 網(wǎng)絡(luò)用于數(shù)據(jù)壓縮類似于圖像的KL變換。但是,目前人工神經(jīng)網(wǎng)絡(luò)的工作原理還不清楚,神經(jīng)網(wǎng)絡(luò)的圖像編碼方法的研究目前僅處于一個(gè)

37、初級(jí)階段,需要解決的問題還很多,如完善人工神經(jīng)網(wǎng)絡(luò)的理論體系,弄清楚神經(jīng)網(wǎng)絡(luò)的工作原理,找到適合圖像數(shù)據(jù)高效壓縮,充分利用視覺信息處理機(jī)制的神經(jīng)網(wǎng)絡(luò)模型和學(xué)習(xí)算法。圖4-2 三層BP網(wǎng)絡(luò)5復(fù)原圖像質(zhì)量的性能評(píng)價(jià)復(fù)原圖像質(zhì)量是評(píng)價(jià)圖像壓縮編碼方法的最為重要的標(biāo)準(zhǔn)之一,它包括兩方面的含義:一方面是圖像的逼真度,即復(fù)原圖像與原始圖像的偏離程度;另一方面是圖像的可懂度,即圖像能向人或機(jī)器提供特征信息的能力。對(duì)于限失真編碼,原圖像與復(fù)原圖像之間存在著差異,差異的大小意味著恢復(fù)圖像的質(zhì)量不相同。但是,由于人的視覺冗余度的原因,則對(duì)有些差異的靈敏度較低,這就產(chǎn)生了兩種判別標(biāo)準(zhǔn):一種是客觀判別標(biāo)準(zhǔn),它建立在原

38、始圖像與復(fù)原圖像之間的誤差上;另一種是主觀評(píng)價(jià)標(biāo)準(zhǔn),通過用人的肉眼對(duì)圖像打分而得到。5.1 主觀評(píng)價(jià)主觀評(píng)價(jià)采用平均判分MOS(Mean Option Score)或多維計(jì)分等方法進(jìn)行測(cè)試,所評(píng)價(jià)出的圖像質(zhì)量不僅與圖像本身特征有關(guān),也與觀察者特性以及觀察者的環(huán)境條件有關(guān)。組織一群足夠多(至少應(yīng)有20名)的觀察者(包括一般觀眾及專業(yè)人員),通過觀察來評(píng)定圖像的質(zhì)量。觀察者將復(fù)原圖像與原圖像相對(duì)比,比較損傷程度,可參照表1.1,給評(píng)定的圖像打上一定的質(zhì)量等級(jí),最后用平均的方法得到圖像的分?jǐn)?shù)。這樣的評(píng)分雖然很花時(shí)間,但比較符合實(shí)際。表5.15.2 客觀評(píng)價(jià)對(duì)圖像質(zhì)量進(jìn)行定量描述是一個(gè)比較復(fù)雜的問題,

39、進(jìn)展比較緩慢,一方面是因?yàn)槿藗冞€沒有充分了解視覺感知的過程和方法;另一方面是由于圖像是多維信號(hào),很難用確定的幾個(gè)統(tǒng)計(jì)參數(shù)來表示其特征。彩色圖像由于量綱數(shù)增多,而且必須滿足人眼對(duì)彩色的視覺感知,因此對(duì)彩色圖像逼真度進(jìn)行定量表示是一個(gè)更加復(fù)雜的問題。目前應(yīng)用得較多的是對(duì)灰度級(jí)圖像逼真度的定量表示。一個(gè)合理的尺度應(yīng)該與圖像的主觀測(cè)試結(jié)果相吻合或密切相關(guān),要求便于計(jì)算分析而且簡(jiǎn)單易行。設(shè)原始的二維灰度圖像為A=f(i,j)。i=1,2,N;j=1,2,M,經(jīng)壓縮復(fù)原后的圖像為A=f(i,j)??梢杂靡韵聨追N指標(biāo)來評(píng)價(jià)圖像的質(zhì)量。可以看出,以上的評(píng)價(jià)完全取決于原始圖像與重建圖像每個(gè)像素上灰度值的誤差,這

40、種評(píng)價(jià)在主觀感覺上也有一定的參考意義。常用的客觀評(píng)價(jià)指標(biāo)為PSNR,一般,當(dāng)PSNR超過30dB時(shí),人的主觀感覺很難找出其差異。主觀評(píng)價(jià)與客觀評(píng)價(jià)之間有一定的聯(lián)系,但不能完全等同??陀^評(píng)價(jià)比較方便,很具有說服力。由于主觀評(píng)價(jià)很直觀,比較符合人的視覺效果及實(shí)際,故在制定國際標(biāo)準(zhǔn)時(shí)常被采用。總結(jié)圖像壓縮技術(shù)研究了幾十年,取得了很大的成績(jī),但還有許多不足,值得我們進(jìn)一步研究。小波圖像壓縮和分形圖像壓縮是當(dāng)前研究的熱點(diǎn),但二者也有各自的缺點(diǎn),在今后工作中,應(yīng)與人眼視覺特性相結(jié)合??傊? 圖像壓縮是一個(gè)非常有發(fā)展 前途的研究領(lǐng)域, 這一領(lǐng)域的突破對(duì)于我們的信息生活和通信事業(yè)的發(fā)展具有深遠(yuǎn)的影響。參考文獻(xiàn):1 D Henriksson,A Cervin,KE Arz6nTruetime:Simulation of control loops under sharedcomputerresourcesIn Proceedings of the 1 5th IFACW orld Congress on Auto

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論