圖像編碼技術(shù)比較_第1頁
圖像編碼技術(shù)比較_第2頁
圖像編碼技術(shù)比較_第3頁
圖像編碼技術(shù)比較_第4頁
圖像編碼技術(shù)比較_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

圖像編碼技術(shù)比較圖像編碼技術(shù)比較圖像編碼技術(shù)比較xxx公司圖像編碼技術(shù)比較文件編號(hào):文件日期:修訂次數(shù):第1.0次更改批準(zhǔn)審核制定方案設(shè)計(jì),管理制度目錄TOC\o"1-4"\u摘要: 10前言 11圖像編碼綜述 2圖像編碼起源與發(fā)展 2圖像編碼的基本原理 2圖像編碼的目的 32經(jīng)典編碼技術(shù) 4熵編碼 4行程編碼 4霍夫曼編碼 5算術(shù)編碼 5預(yù)測編碼 6差分脈沖編碼調(diào)制 6自適應(yīng)差分脈沖編碼調(diào)制 7變換編碼 7K-L變換 8離散余弦變換 8混合編碼 83第二代編碼技術(shù) 9分型編碼 9模型編碼 9小波變換編碼 104圖像編碼技術(shù)發(fā)展前景 115結(jié)論 12參考文獻(xiàn) 13圖像編碼技術(shù)比較劉炎基(河南大學(xué)物理與電子學(xué)院,河南開封,475004)摘要:本文簡要回顧了圖像編碼技術(shù)起源及其發(fā)展。介紹了經(jīng)典圖像編碼技術(shù)和“第二代”圖像編碼技術(shù)的理論思想與實(shí)現(xiàn)方法,比較分析了各種編碼技術(shù)之間的區(qū)別與優(yōu)缺點(diǎn),并討論了圖像編碼技術(shù)的發(fā)展前景。關(guān)鍵詞:數(shù)字圖像處理;圖像編碼技術(shù);比較;分析CompareofImageCodingTechnologyLiuYan-ji(SchoolofPhysicsandElectronics,HenanUniversity,HenanKaifeng475004,China)Abstract:Inthispaper,abriefreviewoftheoriginoftheimagecodingtechnologyanditsdevelopment.Introducedtheclassicimagecodingtechniquesand"secondgeneration"imagecodingtechnologytoachievethetheoreticalideasandmethods,comparativeanalysisofavarietyofcodingtechniquesandtheadvantagesanddisadvantagesofthedistinctionbetweenandtheimagecodingtechniquesdiscussedprospectsfordevelopment.Keywords:digitalpictureprocessing;imagecodingtechnology;compare;analyse0前言圖像編碼技術(shù)是20世紀(jì)60年代發(fā)展起來的一門新興學(xué)科。近40年來,由于大規(guī)模集成電路技術(shù)和計(jì)算機(jī)技術(shù)的迅猛發(fā)展,離散數(shù)學(xué)理論的創(chuàng)立和完善以及社會(huì)各方面應(yīng)用需要的不斷增長,圖像編碼技術(shù)的理論和方法得到進(jìn)一步完善,取得了很多成果,使得數(shù)字圖像得到了近似完美的應(yīng)用,顯示出其廣闊的前景!1圖像編碼綜述圖像編碼起源與發(fā)展圖像編碼壓縮是指在滿足一定圖像質(zhì)量的條件下,用盡可能少的數(shù)據(jù)量來表示圖像。編碼技術(shù)比較系統(tǒng)的研究始于Shannon信息論,從此理論出發(fā)可以得到數(shù)據(jù)壓縮的兩種基本途徑。一種是設(shè)法改變信源的概率分布,使其盡可能地非均勻,再用最佳編碼方法使平均碼長逼近信源熵。使用此途徑的壓縮方法其效率一般以其熵為上界,壓縮比飽和于10:1,如Huffman編碼、算術(shù)編碼、行程編碼等。另一種是聯(lián)合信源的冗余度也寓于信源間的相關(guān)性之中,去除它們之間的相關(guān)性,使之成為或基本成為不相關(guān)信源,如預(yù)測編碼、變換域編碼、混合編碼等,但也大都受信息熵的約束??傮w上可以概括為熵編碼,預(yù)測編碼,變換編碼。也稱為三大經(jīng)典編碼方法。隨著人們對(duì)傳統(tǒng)壓縮編碼方法的深入研究和應(yīng)用,逐漸發(fā)現(xiàn)了這些傳統(tǒng)方法的許多缺點(diǎn)。如高壓縮比時(shí)恢復(fù)圖像會(huì)出現(xiàn)方塊效應(yīng),人眼視覺系統(tǒng)(HVS)的特性不易被引入到算法中等。為了克服這些缺點(diǎn),1985年M.Kunl等人提出了第2代圖像壓縮編碼的概念。經(jīng)過近20年的發(fā)展,在這一框架下,人們提出了幾種新的編碼方法:分形編碼、小波變換編碼和基于模型的編碼方法等。于是,對(duì)數(shù)據(jù)壓縮技術(shù)的研究就突破了傳統(tǒng)Shannon理論的框架,使得壓縮效率得以極大提高。圖像編碼的基本原理雖然表示圖像需要大量的數(shù)據(jù),但是圖像數(shù)據(jù)是高度相關(guān)的,或者說存在冗余信息,去掉這些信息后可以有效壓縮圖像,同時(shí)不會(huì)損害圖像的有效信息。數(shù)字圖像的冗余主要表現(xiàn)為一下幾種形式:空間冗余,時(shí)間冗余,視覺冗余,信息熵冗余,結(jié)構(gòu)冗余和知識(shí)冗余。圖像數(shù)據(jù)的這些冗余信息為圖像壓縮編碼提供了依據(jù)。圖像編碼的目的就是充分利用圖像中存在的各種冗余信息,特別時(shí)空間冗余,時(shí)間冗余以及視覺冗余,以盡量少的比特?cái)?shù)來表示圖像。利用各種冗余信息,壓縮編碼技術(shù)能夠很好地解決在將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)后所產(chǎn)生的帶寬需求增加的問題,它是使數(shù)字信號(hào)走上實(shí)用化的關(guān)鍵技術(shù)之一。圖像編碼的目的圖像編碼主要使利用圖像信號(hào)的統(tǒng)計(jì)特性以及人類視覺的生理學(xué)及心理學(xué)特性,對(duì)圖像信號(hào)進(jìn)行高效編碼,即研究數(shù)據(jù)壓縮技術(shù),目的是在保證圖像質(zhì)量的前提下壓縮數(shù)據(jù),便于存儲(chǔ)和傳輸,以解決數(shù)據(jù)量大的矛盾。一般來說,圖像編碼的目的有三個(gè):1.減少數(shù)據(jù)存儲(chǔ)量;2.降低數(shù)據(jù)率以減少傳輸帶寬;3.壓縮信息量,便于特征提取,為后續(xù)識(shí)別做準(zhǔn)備。圖像編碼的評(píng)價(jià)隨著眾多圖像壓縮算法的出現(xiàn),如何評(píng)價(jià)圖像壓縮算法就成為重要的課題。一般來說,評(píng)價(jià)圖像壓縮算法的優(yōu)劣有以下4個(gè)參數(shù):算法的編碼效率算法的編碼效率通常有幾種表現(xiàn)形式:平均碼字長度(R),圖像的壓縮比(rate,r),每秒鐘所需的傳輸比特?cái)?shù)(bps),圖像熵與平均碼長之比(η)。編碼圖像的質(zhì)量圖像質(zhì)量評(píng)價(jià)可分為客觀質(zhì)量評(píng)價(jià)和主觀質(zhì)量評(píng)價(jià)。最常用的客觀質(zhì)量評(píng)價(jià)指標(biāo)使均方誤差(MSE)和峰值信噪比(PSNR)。主觀質(zhì)量評(píng)價(jià)是指由一批觀察者對(duì)編碼圖像進(jìn)行觀察并打分,然后綜合所有人的批評(píng)結(jié)果,給出圖像的質(zhì)量評(píng)價(jià)??陀^質(zhì)量評(píng)價(jià)能夠快速有效地評(píng)價(jià)編碼圖像的質(zhì)量,但符合客觀質(zhì)量評(píng)價(jià)指標(biāo)的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量能夠與人的視覺效果相匹配,但其評(píng)判過程緩慢費(fèi)時(shí)。算法的適用范圍特定的圖像編碼算法具有其相應(yīng)的適用范圍,并不是對(duì)所有圖像都有效。一般來說,大多數(shù)基于圖像信息統(tǒng)計(jì)特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像。算法的復(fù)雜度算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運(yùn)算量和硬件實(shí)現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實(shí)現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特性,多媒體系統(tǒng)的適應(yīng)能力,應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。2經(jīng)典編碼技術(shù)經(jīng)典圖像編碼技術(shù)根據(jù)編碼原理可分為:熵編碼、預(yù)測編碼、變換編碼和混合編碼等。熵編碼熵編碼是純粹基于信號(hào)統(tǒng)計(jì)特性的編碼技術(shù),是一種無損編碼。熵編碼的基本原理是給出現(xiàn)概率較大的符號(hào)賦予一個(gè)短碼子,而給出現(xiàn)概率較小的符號(hào)賦予一個(gè)長碼字,從而使得最終的平均碼長很小。常見的熵編碼方法有行程編碼、霍夫曼編碼和算術(shù)編碼等。行程編碼行程編碼又稱行程長度編碼,是一種熵編碼,該編碼屬于無損壓縮編碼。對(duì)于二值圖有效。其基本原理是:將具有相同值的連續(xù)串用其串長和一個(gè)代表值來代替,使符號(hào)長度少于原始數(shù)據(jù)的長度。改連續(xù)串就稱為行程,串長稱為行程長度。例如:1行程編碼為:(5,6)(7,5)(3,3)(2,4)(l,7)??梢?,行程編碼的位數(shù)遠(yuǎn)遠(yuǎn)少于原始字符串的位數(shù)。行程編碼分為定長和不定長編碼兩種。定長編碼是指編碼的行程長度所用的二進(jìn)制位數(shù)固定,而變長行程編碼是指對(duì)不同范圍的行程長度使用不同位數(shù)的二進(jìn)制位數(shù)進(jìn)行編碼。使用變長行程編碼需要增加標(biāo)志位來表明所使用的二進(jìn)制位數(shù)。行程編碼比較適合與二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場合,用行程來表示連零碼。行程編碼對(duì)傳輸差錯(cuò)很敏感,一位符號(hào)出錯(cuò)就會(huì)改變行程編碼的長度,使整個(gè)圖像出現(xiàn)偏移,因此,一般要用行同步、列同步的方法,把差錯(cuò)控制在一行一列之內(nèi)。它適用于那些包含很少灰度級(jí)的圖像,對(duì)單一顏色背景下物體的圖形圖像可以達(dá)到很高的壓縮比,但對(duì)其他類型的圖像壓縮比就很低。在最壞的情況下,RLC甚至可將文件的大小加倍。霍夫曼編碼霍夫曼(Huffman)編碼是1952年為文本文件而建立,是一種熵編碼,屬于無損壓縮編碼。該方法完全依據(jù)字符出現(xiàn)的概率來構(gòu)造碼字,對(duì)頻繁出現(xiàn)的字符使用較短的碼字,而對(duì)出現(xiàn)次數(shù)較少的字符使用較長的碼字。在具有相同信源概率分布的前提下,它的平均碼字長度是最短的。變長最佳編碼定理是霍夫曼編碼的理論基礎(chǔ)。靜態(tài)霍夫曼編碼使用一棵在壓縮之前就建好的編碼樹,它是根據(jù)可能的字符出現(xiàn)的概率來生成的。相反,動(dòng)態(tài)霍夫曼編碼是在編碼過程中建立它的編碼樹。具體的方法是,在分配碼字長度時(shí),首先將其中概率最小的兩個(gè)符號(hào)的概率求和,并把它看作是一個(gè)新組合符號(hào)的概率,再與其它符號(hào)按概率遞降順序排列,重復(fù)上述做法,直到最后只剩下兩個(gè)符號(hào)的概率為止。然后開始以相反順序逐步進(jìn)行編碼,每一步有兩個(gè)概率分支,各賦予一個(gè)二進(jìn)制的碼。可以對(duì)概率小的賦編碼為0,則概率大的就賦l,也可以反過來賦編碼。這種統(tǒng)計(jì)方法能夠達(dá)到更高的壓縮比,而且此方法有效簡單,編碼效率高。但是,這是以增大編碼和解碼的時(shí)間為代價(jià)的。霍夫曼編碼具有一些明顯的特點(diǎn):1)編出來的碼都是異字頭碼,保證了碼的唯一可譯性。2)由于編碼長度可變。因此譯碼時(shí)間較長,使得霍夫曼編碼的壓縮與還原相當(dāng)費(fèi)時(shí)。3)編碼長度不統(tǒng)一,硬件實(shí)現(xiàn)有難度。4)對(duì)不同信號(hào)源的編碼效率不同,當(dāng)信號(hào)源的符號(hào)概率為2的負(fù)冪次方時(shí),達(dá)到100%的編碼效率;若信號(hào)源符號(hào)的概率相等,則編碼效率最低。5)由于"0"與"1"的指定是任意的,故由上述過程編出的最佳碼不是唯一的,但其平均碼長是一樣的,故不影響編碼效率與數(shù)據(jù)壓縮性能。算術(shù)編碼算術(shù)編碼是80年代發(fā)展起來的一種熵編碼方法,其基本原理是將被編碼的數(shù)據(jù)序列表示成0和1之間的一個(gè)間隔(也就是一個(gè)小數(shù)范圍),該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。信息越長,表示間隔就越小。因而表示這一間隔所需的二進(jìn)制位數(shù)就越多。算數(shù)編碼有兩種模式:一種是基于信源概率統(tǒng)計(jì)特性的固定編碼模式,另一種是針對(duì)未知信源概率模型的自適應(yīng)模式。算術(shù)編碼適合于由相同的重復(fù)序列組成的文件,算術(shù)編碼接近壓縮的理論極限。這種方法,是將不同的序列映像到0到1之間的區(qū)域內(nèi),該區(qū)域表示成可變精度(位數(shù))的二進(jìn)制小數(shù),越不常見的數(shù)據(jù)要的精度越高(更多的位數(shù)),這種方法比較復(fù)雜,因而不太常用。預(yù)測編碼預(yù)測編碼是基于圖像數(shù)據(jù)的空間或時(shí)間冗余特性,用已傳輸?shù)南袼貙?duì)當(dāng)前的像素進(jìn)行預(yù)測,然后對(duì)預(yù)測誤差進(jìn)行量化和編碼。如果預(yù)測比較準(zhǔn)確,誤差就會(huì)很小。在同等精度要求的條件下,就可以用比較少的比特進(jìn)行編碼,達(dá)到壓縮數(shù)據(jù)的目的。預(yù)測編碼可以分為一維預(yù)測(行內(nèi)預(yù)測)、二位預(yù)測(幀內(nèi)預(yù)測)和三維預(yù)測(幀間預(yù)測)。常用的預(yù)測編碼有差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)等。差分脈沖編碼調(diào)制在PCM系統(tǒng)中,原始的模擬信號(hào)經(jīng)過采樣后得到的每一個(gè)樣值都被量化成為數(shù)字信號(hào)。為了壓縮數(shù)據(jù),可以不對(duì)每一樣值都進(jìn)行量化,而是預(yù)測下一樣值,并量化實(shí)際值與預(yù)測值之間的差值,這就是DPCM(差分脈沖編碼調(diào)制)。1952年貝爾(Bell)實(shí)驗(yàn)室的取得了差分脈沖編碼調(diào)制系統(tǒng)的專利,奠定了真正實(shí)用的預(yù)測編碼系統(tǒng)的基礎(chǔ)。在圖像信號(hào)中應(yīng)用DPCM時(shí),用作預(yù)測的像素和被預(yù)測的像素可以在同一行,也可以在不同行(同一幀),甚至在不同幀,分別稱為一維預(yù)測、二維預(yù)測和三維預(yù)測。DPCM的優(yōu)點(diǎn)是算法簡單,容易硬件實(shí)現(xiàn),缺點(diǎn)是對(duì)信道噪聲很敏感,會(huì)產(chǎn)生誤差擴(kuò)散。即某一位碼出錯(cuò),對(duì)圖像一維預(yù)測來說,將使該像素以后的同一行各個(gè)像素都產(chǎn)生誤差;而對(duì)二維預(yù)測,該碼引起的誤差還將擴(kuò)散到以下的各行。這樣,將使圖像質(zhì)量大大下降。同時(shí),DPCM的壓縮率也比較低。隨著變換編碼的廣泛應(yīng)用,DPCM的作用已很有限。自適應(yīng)差分脈沖編碼調(diào)制進(jìn)一步改善量化性能或壓縮數(shù)據(jù)率的方法是采用自適應(yīng)量化或自適應(yīng)預(yù)測,即自適應(yīng)脈沖編碼調(diào)制(ADPCM)。它的核心想法是:①利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階去編碼小的差值,使用大的量化階去編碼大的差值,②使用過去的樣本值估算下一個(gè)輸入樣本的預(yù)測值,使實(shí)際樣本值和預(yù)測值之間的差值總是最小。1)自適應(yīng)量化在一定量化級(jí)數(shù)下減少量化誤差或在同樣的誤差條件下壓縮數(shù)據(jù),根據(jù)信號(hào)分布不均勻的特點(diǎn),希望系統(tǒng)具有隨輸入信號(hào)的變化區(qū)間足以保持輸入量化器的信號(hào)基本均勻的能力,這種能力叫自適應(yīng)量化。自適應(yīng)量化必須有對(duì)輸入信號(hào)的幅值進(jìn)行估值的能力,有了估值才能確定相應(yīng)的改變量。若估值在信號(hào)的輸入端進(jìn)行,稱前饋?zhàn)赃m應(yīng);若在量化輸出端進(jìn)行,稱反饋?zhàn)赃m應(yīng)。信號(hào)的估值必須簡單,占用時(shí)間短,才能達(dá)到實(shí)時(shí)處理的目的。2)自適應(yīng)預(yù)測預(yù)測參數(shù)的最佳化依賴信源的特征,要得到最佳預(yù)測參數(shù)顯然是一件繁瑣的工作。而采用固定的預(yù)測參數(shù)往往又得不到較好的性能。為了能使性能較佳,又不致于有太大的工作量,可以采用自適應(yīng)預(yù)測。為了減少計(jì)算工作量,預(yù)測參數(shù)仍采用固定的,但此時(shí)有多組預(yù)測參數(shù)可供選擇,這些預(yù)測參數(shù)根據(jù)常見的信源特征求得。編碼時(shí)具體采用哪組預(yù)測參數(shù)需根據(jù)特征來自適應(yīng)地確定。為了自適應(yīng)地選擇最佳參數(shù),通常將信源數(shù)據(jù)分區(qū)間編碼,編碼時(shí)自動(dòng)地選擇一組預(yù)測參數(shù),使該實(shí)際值與預(yù)測值的均方誤差最小。隨著編碼區(qū)間的不同,預(yù)測參數(shù)自適應(yīng)地變化,以達(dá)到準(zhǔn)最佳預(yù)測。變換編碼變換編碼是將空間域里描述的圖像,通過某種變換(常用的是二位正交變換,如離散余弦變換、K—L變換等),映射到另一變換域中,是變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個(gè)變換系數(shù)上,采用適當(dāng)?shù)牧炕挽鼐幋a才可以有效的壓縮圖像。K-L變換K-L變換是一種最佳正交變換。它是用數(shù)據(jù)本身的相關(guān)矩陣對(duì)角化后完成的,這種變換將產(chǎn)生完全不相關(guān)的變換系數(shù)。如果圖像數(shù)據(jù)之間是高度相關(guān)的,經(jīng)過K-L變換后的系數(shù)將出現(xiàn)多個(gè)零值,同時(shí)某些系數(shù)的值會(huì)很小。K-L變換的變換矩陣是由圖像數(shù)據(jù)本身求得的,不同的圖像數(shù)據(jù)有不同的變換矩陣,由此造成反變換矩陣的不惟一性;另外K-L變換矩陣的構(gòu)造計(jì)算量很大,因而它不是一種實(shí)用的變換方法,通常作為評(píng)價(jià)其他線性變換的比較基準(zhǔn)。離散余弦變換K-L變換算法復(fù)雜度較高,所以在實(shí)際編碼工作中,人們常用離散余弦變換。對(duì)大多數(shù)圖像信源來說,DCT變換是現(xiàn)行編碼方法中最接近K-L變換的方法。DCT先根據(jù)變換系數(shù)的能量分布,將整個(gè)圖像分成N*N像素塊,然后對(duì)這N*N像素塊逐一進(jìn)行DCT變換。其中變換后幅值較大的圖像系數(shù)大多集中在圖像塊的左上角。與其它系數(shù)相比,這些低頻系數(shù)包括了圖像的大部分內(nèi)容,具有的能量最大,在變換圖像中的地位最重要,應(yīng)使它們的量化誤差最小。另一方面,大多數(shù)圖像的高頻分量較小,對(duì)圖像質(zhì)量影響甚微,加上人眼對(duì)高頻成分的失真不太敏感,可以使用更粗的量化,一般采用設(shè)定閑值的方法,置小于閩值的變換系數(shù)為零,由此傳送變換系數(shù)所用的碼率要大大小于傳送圖像像素所用的碼率,從而大大提高了編碼效率。經(jīng)區(qū)域編碼和闡值編碼后,變換圖像的系數(shù)大部分為零,必須采用有效的方法將非零系數(shù)和零系數(shù)組織起來,在帶有最少冗余的同時(shí)保證最大的連零系數(shù)出現(xiàn)概率,在DCT圖像編碼中,可以對(duì)變換系數(shù)采用Z字形掃描。混合編碼混合編碼是指綜合了熵編碼、變換編碼或預(yù)測編碼的編碼方法,如JPEG標(biāo)準(zhǔn)和MPEG標(biāo)準(zhǔn)等。3第二代編碼技術(shù)分型編碼分形編碼是在數(shù)學(xué)家Manddbmt建立的分型幾何理論的基礎(chǔ)上發(fā)展起來的一種編碼方法。分型編碼最大限度的利用了圖像在空間域上的自相似性,通過消除圖像的幾何冗余來壓縮數(shù)據(jù)。將迭代函數(shù)系統(tǒng)(IFS)用于描述圖像的自相似性,并將其用于圖像編碼。對(duì)分形定義的一般描述:1)分形應(yīng)有精細(xì)的結(jié)構(gòu),有任意小比例的細(xì)節(jié)。2)它是如此的不規(guī)則,以至其局部和整體都不能用傳統(tǒng)的幾何語言來描述。3)分形通常有某種自相似的形式,可能是近似的或是統(tǒng)計(jì)的。4)其“分形維數(shù)”一般大于其拓?fù)渚S數(shù),并且通常能以非常簡單的方法定義,由迭代方法產(chǎn)生。分形編碼的方法是利用圖形處理技術(shù),如顏色分割、邊緣檢測、頻譜分析等將原始圖像分割成若干子圖像,然后為每個(gè)子圖像尋找迭代函數(shù),子圖像以迭代函數(shù)的形式存儲(chǔ)。由于這樣的迭代函數(shù)一般只需要幾個(gè)數(shù)據(jù)表示即可,所以分形壓縮可以達(dá)到較高的壓縮比。分形編碼是一種新穎、獨(dú)特的壓縮方法。它充分考慮自然景物的特點(diǎn)。其優(yōu)點(diǎn)是:壓縮比取決于圖像分割后所產(chǎn)生的子塊的大小,子塊取得越大,壓縮比越高;由于分形變換可把圖像劃分成大得多、形狀復(fù)雜得多的分區(qū),故壓縮比不受分辨率的影響。缺點(diǎn)有:分形編碼是非對(duì)稱的,壓縮時(shí)計(jì)算量較大,所需時(shí)間較長,但解壓縮速度很快;隨被壓縮圖像增大,運(yùn)算量增長過快。模型編碼基于模型的圖像編碼技術(shù)是近幾年發(fā)展起來的一種很有前途的低比特率編碼方法。它利用了計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)中的方法和理論,其基本出發(fā)點(diǎn)是在編、解碼兩端分別建立起相同的模型,針對(duì)輸入的圖像提取模型參數(shù),或根據(jù)模型參數(shù)重建圖像。模型編碼方法的核心是建模和提取模型參數(shù),其中模型的選取、描述和建立是決定模型編碼質(zhì)量的關(guān)鍵因素。為了對(duì)圖像數(shù)據(jù)建模,一般要求對(duì)輸入圖像要有某些先驗(yàn)知識(shí)。根據(jù)使用的模型的不同,模型編碼可以分為語義基編碼和物體基編碼?;谀P偷膱D像編碼方法是利用先驗(yàn)?zāi)P蛠沓槿D像中的主要信息,并以模型參數(shù)的形式表示它們,因此可以獲得很高的壓縮比。然而在模型編碼方法的研究中還存在很多問題,例如:①模型法需要先驗(yàn)知識(shí),不適合一般的應(yīng)用;②對(duì)不同的應(yīng)用所建模型是不一樣的;③在線框模型中控制點(diǎn)的個(gè)數(shù)不易確定,還未找到有效的方法能根據(jù)圖像內(nèi)容來選取;④由于利用模型法壓縮后復(fù)原圖像的大部分是用圖形學(xué)的方法產(chǎn)生的,因此看起來不夠自然;⑤傳統(tǒng)的誤差評(píng)估準(zhǔn)則不適合用于對(duì)模型編碼的評(píng)價(jià)。小波變換編碼小波變換編碼是隨著小波變換理論的研究而提出的一種編碼方式。小波變換的本質(zhì)是多分辨率或多尺度地分析信號(hào),非常適合視覺系統(tǒng)對(duì)頻率感知的對(duì)數(shù)特性,因此,它很適合與圖像信號(hào)的處理。小波變換編碼一方面具有傳統(tǒng)編碼方法的一些優(yōu)點(diǎn),能夠很好的消除統(tǒng)計(jì)冗余,另一方面它的多分辨率特性提供了利用人眼視覺特性的很好機(jī)制,而且變換后的圖像數(shù)據(jù)能夠保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu),為進(jìn)一步去除其他形式的冗余提供了便利。小波變換編碼的核心問題是要對(duì)子帶圖像進(jìn)行小波分解系數(shù)的量化和編碼。低頻子帶圖像包含原圖像的大部分能量,即包含圖像的基本特性。它在圖像重構(gòu)算法中起主導(dǎo)作用,對(duì)重建圖像的質(zhì)量有很大影響,因此這部分信號(hào)應(yīng)精確保留。高頻子圖像的系數(shù)分布符合廣義高斯分布,對(duì)其系數(shù)進(jìn)行粗量化編碼較為有效。這也完全符合人的視覺特性,根據(jù)對(duì)人眼視覺系統(tǒng)的研究可知,人眼視覺靈敏度具有明顯的低通特性,而且對(duì)不同方向上的敏感度也不一樣,尤其是對(duì)傾斜方向的刺激不太敏感,如人眼對(duì)對(duì)角線方向子圖像系數(shù)誤差敏感度較低,因此可對(duì)對(duì)角線方向子圖像進(jìn)行粗量化高壓縮。小波變換后的能量主要集中在低頻系數(shù)分量,而其他高頻系數(shù)分量大多為零值,這為高倍率壓縮提供了可能。通過選擇合適的具有平滑特性小波基,就可消除重建圖像中出現(xiàn)的方塊效應(yīng),減小量化噪聲,獲得較好的重建圖像質(zhì)量。用小波分析方法對(duì)圖像進(jìn)行編碼時(shí),主要涉及三個(gè)方面的問題:圖像邊界的擴(kuò)展、小波基的選取和小波系數(shù)的組織。小波變換編碼壓縮方法可分為如下兩大類:基于傳統(tǒng)的圖像編碼方法和基于分形理論的小波變換圖像編碼方法?;趥鹘y(tǒng)的圖像編碼方法包括:零樹小波編碼、基于塔式網(wǎng)絡(luò)矢量量化的小波變換編碼、基于LBG算法的小波變換編碼、基于標(biāo)量量化的小波變換編碼等。由于不同分辨率級(jí)子圖像之間存在著相似性,因此,利用此相似性,可提高壓縮比。采用零樹自嵌套編碼方法,對(duì)小波分解系數(shù)進(jìn)行壓縮,在PSNR=的情況下,獲得壓縮比為128∶1。這是最著名的一種小波變換圖像編碼壓縮方法。該方法的優(yōu)點(diǎn)是:與傳統(tǒng)的DCT編碼相比,它既可以克服方塊效應(yīng),又可以在低比特率下獲得較好的圖像主觀質(zhì)量。缺點(diǎn)是:由于它對(duì)各子帶采用相同的門限量化,因此不能充分利用人眼的視覺特性,限制了圖像壓縮比的進(jìn)一步提高。對(duì)此,等人提出了改進(jìn)算法。針對(duì)分形圖像編碼尚存在的缺點(diǎn),如編碼算法的耗時(shí)、自然圖像不一定具有嚴(yán)格的分形結(jié)構(gòu)而無法達(dá)到預(yù)期的高壓縮比、高壓縮倍率時(shí)的方塊效應(yīng)等,有人提出了基于小波變換的分形編碼。它具有以下特點(diǎn):①采用平滑小波可去除傳統(tǒng)分形變換中存在的方塊效應(yīng);②小波表示使圖像的四叉樹分割十分自然;③可將零樹算法看成是該算法的一個(gè)特例。圖像經(jīng)過金字塔形離散小波變換后的系數(shù)在小波域內(nèi)可組成分層樹狀數(shù)據(jù)結(jié)構(gòu)小波樹。這些跨越不同分辨率的小波樹之間存在一定的相似性,可通過分形變換來描述?;谛〔ㄗ儞Q的分形壓縮過程就是一個(gè)由分層樹狀結(jié)構(gòu)的頂部開始一層層地向下預(yù)測其余系統(tǒng)的過程,而這個(gè)由上至下、由粗至細(xì)的預(yù)測過程是通過分形編碼來實(shí)現(xiàn)的。從現(xiàn)在的研究結(jié)果可看到,小波變換編碼已獲得了較好的編碼效果,是現(xiàn)代圖像壓縮技術(shù)研究的熱點(diǎn)之一,也是十分有前途的一種方法。4圖像編碼技術(shù)發(fā)展前景自20世紀(jì)80年代以來,圖像編碼技術(shù)已經(jīng)逐步進(jìn)入了較大范圍的應(yīng)用階段。但由于沒有統(tǒng)一的壓縮算法和碼流格式,在圖像信息交流中遇到了很多困難,鑒于這一狀況,國際電信聯(lián)盟ITU和國際標(biāo)準(zhǔn)化組織ISO近年來已經(jīng)制定并在繼續(xù)制定一系列靜止和活動(dòng)圖像編碼的國際標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)和建議是在相應(yīng)領(lǐng)域工作的各國專家合作研究的成果和經(jīng)驗(yàn)的總結(jié)。由于這些國際標(biāo)準(zhǔn)的出現(xiàn),圖像編碼尤其是視頻圖像編碼壓縮技術(shù)得到了飛速發(fā)展。目前,按照這些標(biāo)準(zhǔn)做的硬件、軟件產(chǎn)品和專用集成電路已經(jīng)在市場上大量涌現(xiàn),對(duì)現(xiàn)代圖像通信的迅速發(fā)展及開拓圖像編碼新的應(yīng)用領(lǐng)域(如多媒體通信、數(shù)字高清晰度電視傳輸?shù)?發(fā)揮了重要作用。目前已批準(zhǔn)了JPEG、和MPEG等標(biāo)準(zhǔn)。對(duì)于圖像編碼技術(shù)未來的發(fā)展,應(yīng)注意經(jīng)典和新技術(shù)、新方法的結(jié)合。1)目前應(yīng)立足于經(jīng)典的編碼技術(shù)的研究我們認(rèn)為圖像壓縮技術(shù)的近期研究工作似乎應(yīng)該放在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論