淺談數(shù)字圖像編碼技術(shù)_第1頁
淺談數(shù)字圖像編碼技術(shù)_第2頁
淺談數(shù)字圖像編碼技術(shù)_第3頁
淺談數(shù)字圖像編碼技術(shù)_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、淺談數(shù)字圖像編碼技術(shù)    【關(guān)鍵詞】 淺談 1 引言 數(shù)字圖像處理又稱為計(jì)算機(jī)圖像處理,它是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過程。早期圖像處理的目的是改善圖像的質(zhì)量,它以人為對(duì)象,以改善人的視覺效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像。常見的圖像處理有圖像數(shù)字化、圖像編碼、圖像增強(qiáng)、圖像復(fù)原、圖像分割與圖像分析等。圖像編碼是對(duì)圖像信息進(jìn)行編碼,可以壓縮圖像的信息量,以便滿足傳輸與存儲(chǔ)的要求。本研究主要介紹了圖像編碼的基本原理和技術(shù)方法。 一幅二維數(shù)字圖像可以由一個(gè)二維亮度函數(shù)通過采樣和量化后而得到的一個(gè)

2、二維數(shù)組表示。這樣一個(gè)二維數(shù)組的數(shù)據(jù)量通常很大,從而對(duì)存儲(chǔ)、處理和傳輸都帶來了許多問題,提出了許多新的要求。為此人們?cè)噲D采用對(duì)圖像新的表達(dá)方法以減少表示一幅圖像需要的數(shù)據(jù)量,這就是圖像編碼所要解決的主要問題。壓縮數(shù)據(jù)量的主要方法是消除冗余數(shù)據(jù),從數(shù)學(xué)角度來講是要將原始圖像轉(zhuǎn)化為從統(tǒng)計(jì)角度看盡可能不相關(guān)的數(shù)據(jù)集。這個(gè)轉(zhuǎn)換要在圖像進(jìn)行存儲(chǔ)、處理和傳輸之前進(jìn)行,然后將壓縮了的圖像解壓縮以重建原始圖像,即通常所稱的圖像編碼和圖像解碼。    圖1給出了一個(gè)通用的圖像編碼系統(tǒng)模型,這個(gè)模型主要包括2個(gè)通過信道級(jí)連接的結(jié)構(gòu)模塊:編碼器和解碼器。當(dāng)一幅輸入圖像送入編碼

3、器后,編碼器根據(jù)輸入數(shù)據(jù)進(jìn)行信源編碼產(chǎn)生一組信號(hào),這組信號(hào)在進(jìn)一步被信道編碼器編碼后進(jìn)入信道。通過信道傳輸后的碼被送入信道解碼器和信源解碼器,解碼器重建輸入的圖像。一般來說,輸出圖是輸入圖的精確復(fù)制,那么系統(tǒng)是無失真的或者信息保持型的;否則,稱系統(tǒng)是信息損失的。 信源編碼器的作用是減少或消除輸入圖像中的編碼冗余、像素間冗余及心理視覺冗余。盡管信源編碼器的結(jié)構(gòu)與具體應(yīng)用和對(duì)保真度的要求有關(guān),但一般情況下信源編碼器包括順序的3個(gè)獨(dú)立操作,而對(duì)應(yīng)的信源解碼器包含反序的2個(gè)獨(dú)立操作(圖2)。在信源編碼器中,映射器將輸入數(shù)據(jù)變換以減少表達(dá)圖像的數(shù)據(jù),這與具體編碼技術(shù)有關(guān)。量化器根據(jù)給定的保真度準(zhǔn)則減少映

4、射器輸出的精確度。這個(gè)操作可以減少心理冗余,但不可翻轉(zhuǎn)。符號(hào)編碼器產(chǎn)生表達(dá)量化器輸出的碼本,并根據(jù)碼本輸出。符號(hào)編碼器編碼為了減少冗余,這個(gè)操作是可以反轉(zhuǎn)的。 當(dāng)信道是有噪聲的或者容易產(chǎn)生誤差時(shí),信道編碼器和信道解碼器對(duì)這個(gè)編解碼過程是非常重要的。由于信源編碼器的輸出數(shù)據(jù)一般只有很少的冗余,所以他們對(duì)傳輸噪聲很敏感。信道編碼器通過把可控制的冗余加入信源編碼器后的碼字以減少信道噪聲的影響。 2 傳統(tǒng)編碼方法 傳統(tǒng)的編碼方法可以分成兩大類,預(yù)測(cè)編碼方法(對(duì)應(yīng)空域方法)和變換編碼方法(對(duì)應(yīng)頻域編碼方法)。預(yù)測(cè)編碼方法的優(yōu)點(diǎn)是:算法一般較簡(jiǎn)單,易于用硬件實(shí)現(xiàn);缺點(diǎn)是:壓縮比不夠大,承受誤碼的能力較差。

5、由于它采用的最小均方誤差準(zhǔn)則不能反映人眼的視覺心理特性,近年來已較少單獨(dú)采用,而是與其他方法混合使用。另外,由于DPCM編碼系統(tǒng)會(huì)引起斜率過載、界線繁忙、顆粒噪聲和輪廓噪聲,在使用中應(yīng)加以考慮。變換編碼方法的優(yōu)點(diǎn)是:壓縮比高、承受誤碼能力強(qiáng);缺點(diǎn)是:算法較復(fù)雜。 3 現(xiàn)代編碼方法 31 第二代圖像編碼方法 第二代圖像編碼方法2是針對(duì)傳統(tǒng)編碼方法中沒有考慮人眼對(duì)輪廓、邊緣的特殊敏感性和方向感知特性而提出的。它認(rèn)為傳統(tǒng)的第一代編碼技術(shù)以信息論和數(shù)字信號(hào)處理技術(shù)為理論基礎(chǔ),出發(fā)點(diǎn)是消除圖像數(shù)據(jù)的統(tǒng)計(jì)冗余信息,包括信息熵冗余、空間冗余和時(shí)間冗余。其編碼壓縮圖像數(shù)據(jù)的能力已接近極限,壓縮比難以提高。第二

6、代圖像編碼方法充分利用人眼視覺系統(tǒng)的生理和心理視覺冗余特性以及信源的各種性質(zhì)以期獲得高壓縮比,這類方法一般要對(duì)圖像進(jìn)行預(yù)處理,將圖像數(shù)據(jù)根據(jù)視覺敏感性進(jìn)行分割。 按處理方法的不同,第二代圖像編碼方法可分為兩種典型的編碼技術(shù)3:一種是基于分裂合并的方法,先將圖像分為紋理和邊緣輪廓,然后各自采用不同的方法編碼;另一種是基于各向異性濾波器的方法,先對(duì)圖像進(jìn)行方向性濾波,得到不同方向的圖像信息,再根據(jù)人眼的方向敏感性對(duì)各個(gè)通道采用特定的方法單獨(dú)編碼。 32 分形圖像編碼 分形圖像編碼是在分形幾何理論的基礎(chǔ)上發(fā)展起來的一種編碼方法。分形理論是歐氏幾何相關(guān)理論的擴(kuò)展,是研究不規(guī)則圖形和混沌運(yùn)動(dòng)的一門新科學(xué)

7、。它描述了自然界物體的自相似性,這種自相似性可以是確定的,也可以是統(tǒng)計(jì)意義上的。這一理論基礎(chǔ)決定了它只有對(duì)具備明顯自相似性或統(tǒng)計(jì)自相似性的圖像,例如海岸線、云彩、大樹等才有較高的編碼效率。而一般圖像不具有這一特性,因此編碼效率與圖像性質(zhì)學(xué)特性有關(guān),而且分形圖像編碼方法實(shí)質(zhì)上是通過消除圖像的幾何冗余來壓縮數(shù)據(jù)的,根本沒有考慮人眼視覺特性的作用。 33 基于模型的圖像編碼 基于模型的圖像編碼技術(shù)4是近幾年發(fā)展起來的一種很有前途的編碼方法。它利用了計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)中的方法和理論,其基本出發(fā)點(diǎn)是在編、解碼兩端分別建立起相同的模型,針對(duì)輸入的圖像提取模型參數(shù),或根據(jù)模型參數(shù)重建圖像。模型編碼方法

8、的核心是建模和提取模型參數(shù),其中模型的選取、描述和建立是決定模型編碼質(zhì)量的關(guān)鍵因素。為了對(duì)圖像數(shù)據(jù)建模,一般要求對(duì)輸入圖像要有某些先驗(yàn)知識(shí)。 基于模型的圖像編碼方法是利用先驗(yàn)?zāi)P蛠沓槿D像中的主要信息,并以模型參數(shù)的形式表示它們,因此可以獲得很高的壓縮比。然而在模型編碼方法的研究中還存在很多問題,例如:模型法需要先驗(yàn)知識(shí),不適合一般的應(yīng)用;對(duì)不同的應(yīng)用所建模型是不一樣的;在線框模型中控制點(diǎn)的個(gè)數(shù)不易確定,還未找到有效的方法能根據(jù)圖像內(nèi)容來選??;由于利用模型法壓縮后復(fù)原圖像的大部分是用圖形學(xué)的方法產(chǎn)生的,因此看起來不夠自然;傳統(tǒng)的誤差評(píng)估準(zhǔn)則不適合用于對(duì)模型編碼的評(píng)價(jià)。 34 神經(jīng)網(wǎng)絡(luò)圖像編碼

9、在圖像編碼的各種方法中,除信息保持型編碼方法外,其余所有方法始終沒有解決好如何充分利用人的視覺特性這個(gè)問題,神經(jīng)網(wǎng)絡(luò)圖像編碼5試圖在此有所突破,現(xiàn)在直接用于圖像壓縮的神經(jīng)網(wǎng)絡(luò)主要有BP網(wǎng)絡(luò)和自組織映射神經(jīng)網(wǎng)絡(luò)。采用BP網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)壓縮好比是強(qiáng)迫數(shù)據(jù)通過細(xì)腰型網(wǎng)絡(luò)的瓶頸,并期望在網(wǎng)絡(luò)的瓶頸處能獲得較緊湊的數(shù)據(jù)表示。    圖3給出了BP網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)壓縮的原理,這是一nmn型三層BP神經(jīng)網(wǎng)絡(luò)。輸入層有n個(gè)神經(jīng)元,通過BP訓(xùn)練算法,在網(wǎng)絡(luò)的學(xué)習(xí)過程中調(diào)整網(wǎng)絡(luò)的權(quán)重,使訓(xùn)練集圖像的重建誤差E=X-Z2均值達(dá)到最小(X為輸入層樣本集,Z為輸出層樣本集),或者說,使

10、重建圖像在均方誤差意義上盡可能地相似于原始圖像。訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)便可用來進(jìn)行圖像壓縮,隱層神經(jīng)元矢量Y為壓縮結(jié)果。    自組織映射神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元可以自動(dòng)地根據(jù)外部刺激的興奮點(diǎn)來調(diào)整自己在由外界信號(hào)決定的參數(shù)空間中的位置。以一種雙層神經(jīng)網(wǎng)絡(luò)為例:其中輸入層神經(jīng)元(x1,x2,x3,xn)簡(jiǎn)單地反映著外部刺激,在輸出層中,M個(gè)神經(jīng)元排布成二維網(wǎng)絡(luò),其中每個(gè)神經(jīng)元j接收兩類輸入:來自輸入層神經(jīng)元i的輸入xi(權(quán)重為Wij)和來自輸出層神經(jīng)元的固定權(quán)重。對(duì)每一個(gè)外界輸入矢量X=(x1,x2,x3,xn),只有一個(gè)同該輸入的距離d1=f(X,Wj),Wj=(

11、W1j,W2j,W3j,Wnj)為最小的神經(jīng)元j才被激發(fā)。其中,距離函數(shù)f(X,Wj)反映了在某一準(zhǔn)則(一般為平方誤差準(zhǔn)則)下,矢量X與Wj之間的距離。在網(wǎng)絡(luò)的訓(xùn)練中我們只需要提供輸入矢量X,通過調(diào)整從公共的外部輸入到每個(gè)神經(jīng)元j的連接權(quán)重Wj,權(quán)重矢量將逐漸指向輸入矢量空間的聚類。從而實(shí)現(xiàn)了輸入空間的維數(shù)壓縮,完成了類似于矢量量化的功能。 35小波圖像編碼 一維連續(xù)小波變換可看成原始信號(hào)和一組不同尺度的小波帶通濾波器的濾波運(yùn)算,從而可把信號(hào)分解到一系列頻帶上進(jìn)行分析處理。將其離散化后即為離散小波變換。小波變換圖像編碼壓縮6的核心問題是要對(duì)子帶圖像進(jìn)行小波分解系數(shù)的量化和編碼。低頻子帶圖像包含

12、原圖像的大部分能量,即包含圖像的基本特性。它在圖像重構(gòu)算法中起主導(dǎo)作用,對(duì)重建圖像的質(zhì)量有很大影響,因此這部分信號(hào)應(yīng)精確保留。 高頻子圖像的系數(shù)分布符合廣義高斯分布,對(duì)其系數(shù)進(jìn)行粗量化編碼較為有效。這也完全符合人的視覺特性,根據(jù)對(duì)人眼視覺系統(tǒng)的研究可知,人眼視覺靈敏度具有明顯的低通特性,而且對(duì)不同方向上的敏感度也不一樣,尤其是對(duì)傾斜方向的刺激不太敏感,如人眼對(duì)對(duì)角線方向子圖像系數(shù)誤差敏感度較低,因此可對(duì)對(duì)角線方向子圖像進(jìn)行粗量化高壓縮。 小波變換后的能量主要集中在低頻系數(shù)分量,而其他高頻系數(shù)分量大多為零值,這為高倍率壓縮提供了可能。通過選擇合適的具有平滑特性小波基,就可消除重建圖像中出現(xiàn)的方塊

13、效應(yīng),減小量化噪聲,獲得較好的重建圖像質(zhì)量。 小波變換圖像編碼壓縮方法可分為如下兩大類:基于傳統(tǒng)的圖像編碼方法和基于分形理論的小波變換圖像編碼方法。 基于傳統(tǒng)的圖像編碼方法7包括:零樹小波編碼、基于塔式網(wǎng)絡(luò)矢量量化的小波變換編碼、基于LBG算法的小波變換編碼、基于標(biāo)量量化的小波變換編碼等。 由于不同分辨率級(jí)子圖像之間存在著相似性,因此,利用此相似性,可提高壓縮比8。J.M.Shapiro采用零樹自嵌套編碼方法,對(duì)小波分解系數(shù)進(jìn)行壓縮,在PSNR=27.54dB的情況下,獲得壓縮比為1281。這是最著名的一種小波變換圖像編碼壓縮方法。該方法的優(yōu)點(diǎn)是:與傳統(tǒng)的DCT編碼相比,它既可以克服方塊效應(yīng),

14、又可以在低比特率下獲得較好的圖像主觀質(zhì)量。缺點(diǎn)是:由于它對(duì)各子帶采用相同的門限量化,因此不能充分利用人眼的視覺特性,限制了圖像壓縮比的進(jìn)一步提高。對(duì)此,A.Said等人提出了改進(jìn)算法。 針對(duì)分形圖像編碼尚存在的缺點(diǎn),如編碼算法的耗時(shí)、自然圖像不一定具有嚴(yán)格的分形結(jié)構(gòu)而無法達(dá)到預(yù)期的高壓縮比、高壓縮倍率時(shí)的方塊效應(yīng)等,有人提出了基于小波變換的分形編碼9。它具有以下特點(diǎn):采用平滑小波可去除傳統(tǒng)分形變換中存在的方塊效應(yīng);小波表示使圖像的四叉樹分割十分自然;可將零樹算法看成是該算法的一個(gè)特例。圖像經(jīng)過金字塔形離散小波變換后的系數(shù)在小波域內(nèi)可組成分層樹狀數(shù)據(jù)結(jié)構(gòu)小波樹。這些跨越不同分辨率的小波樹之間存在

15、一定的相似性,可通過分形變換來描述。基于小波變換的分形壓縮過程就是一個(gè)由分層樹狀結(jié)構(gòu)的頂部開始一層層地向下預(yù)測(cè)其余系統(tǒng)的過程,而這個(gè)由上至下、由粗至細(xì)的預(yù)測(cè)過程是通過分形編碼來實(shí)現(xiàn)的?;谛〔ㄗ儞Q的圖像編碼壓縮的特點(diǎn)是10:壓縮比高、壓縮速度快,壓縮后能保持信號(hào)與圖像的特征不變,且在傳遞過程中就可以抗干擾。從現(xiàn)在的研究結(jié)果可看到,該方法已獲得了較好的編碼效果,是現(xiàn)代圖像壓縮技術(shù)研究的熱點(diǎn)之一,也是十分有前途的一種方法。 4結(jié)束語 本研究介紹了圖像編碼的基本原理,傳統(tǒng)的圖像編碼方法和幾種比較新的編碼方法。第二代圖像編碼將視覺特性引入到圖像編碼技術(shù),分形圖像編碼是以分形幾何理論為基礎(chǔ),基于模型的圖

16、像編碼是利用了計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)中的理論,而小波變換圖像編碼則引入了小波分析理論。盡管它們理論基礎(chǔ)不同,但它們均在不同情況下不同程度地提高了編碼質(zhì)量。相比之下,小波變換圖像編碼是一種性能更佳的圖像編碼方法,僅從去除冗余信息的角度而言,它的性能就遠(yuǎn)遠(yuǎn)優(yōu)于其他幾種編碼方法。另外,將小波變換與其他的新型編碼方法結(jié)合,也是小波圖像編碼方法的重要研究方向。 參考文獻(xiàn) 1 萬建偉,黃埔堪,周良柱,梁甸農(nóng)圖像編碼技術(shù)的發(fā)展系統(tǒng)工程與電子技術(shù),1996,5:3138 2 張雪松,倪國(guó)強(qiáng),周立偉,金偉其圖像編碼技術(shù)發(fā)展綜述光學(xué)技術(shù),1997,3:3741 3 曹寧,吳琰,馮曄模型基方法在圖像編碼中的應(yīng)用與改進(jìn)河海大學(xué)學(xué)報(bào),1997,25(6):97102 4 陳紅麗幾種新型的圖像編碼技術(shù)淮北煤師院學(xué)報(bào),2001,22(2):2830 5 吳謹(jǐn)圖像編碼與小波變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論