圖像處理第8章 圖像編碼基礎(chǔ)_第1頁
圖像處理第8章 圖像編碼基礎(chǔ)_第2頁
圖像處理第8章 圖像編碼基礎(chǔ)_第3頁
圖像處理第8章 圖像編碼基礎(chǔ)_第4頁
圖像處理第8章 圖像編碼基礎(chǔ)_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三單元圖像編碼本單元包括3章,分別為:

●第8章圖像編碼基礎(chǔ)

●第9章圖像變換編碼

●第10章其他圖像編碼方法

圖象編碼的目的是在保證一定視覺質(zhì)量的前提下減少數(shù)據(jù)量(從而也減少圖象傳輸所需的時(shí)間),這也可看作使用較少的數(shù)據(jù)量來獲得較好的視覺質(zhì)量。圖象編碼以信息論為基礎(chǔ),以壓縮數(shù)據(jù)量為主要目的,所以圖象編碼也常被稱為圖象壓縮。本章主要內(nèi)容圖像壓縮原理編碼定理變長編碼位平面編碼第8章圖像編碼基礎(chǔ)8.1圖像壓縮原理{在保持圖象中的原有信息或讓信息損失滿足應(yīng)用要求的基礎(chǔ)上盡可能地減少數(shù)據(jù)量}8.1.1數(shù)據(jù)冗余數(shù)據(jù)冗余:表達(dá)了無用的信息;表達(dá)了已表達(dá)的信息;表達(dá)沒有最優(yōu)而多使用的信息。數(shù)據(jù)冗余的定量描述。設(shè)n1、n2分別代表表達(dá)相同信息的兩個(gè)數(shù)據(jù)集合中的信息載體單位的個(gè)數(shù),那么第1個(gè)數(shù)據(jù)集合相對于第2個(gè)數(shù)據(jù)集合的相對數(shù)據(jù)冗余:RD=1-1/CR其中CR稱為壓縮率:CR=n1/n2CR和RD分別在開區(qū)間(0,∞)和(-∞,1)之間取值。圖像中的數(shù)據(jù)冗余主要有三種:①心理視覺冗余(與主觀感覺有關(guān));②像素間冗余(空間冗余,幾何冗余);③編碼冗余(與灰度分布的概率特性有關(guān))。1、心理視覺冗余眼睛并不是對所有信息有相同的敏感度。對于那些視覺過程中不重要的信息可認(rèn)為是心理視覺上的冗余,去掉這些信息不會(huì)明顯降低所感受到的圖像質(zhì)量。心理視覺冗余與人觀察圖像的方式有關(guān),這個(gè)因人而異,因應(yīng)用要求而異。1、心理視覺冗余心理視覺冗余與實(shí)際的視覺信息相聯(lián)系,只有對正常視感覺過程不必要的信息才可能被去除掉,該過程能導(dǎo)致定量信息的損失,因此也稱為量化,屬不可逆操作,用于數(shù)據(jù)壓縮導(dǎo)致有損壓縮。心理視覺冗余的存在與人觀察圖像的方式有關(guān),人在觀察圖像時(shí)會(huì)尋找某些比較明顯的目標(biāo),而不是定量的考慮圖像中每一個(gè)像素的亮度,通過在大腦中分析這些特征并與先驗(yàn)知識結(jié)合以完成對圖像的認(rèn)知和解釋過程,因?yàn)槊總€(gè)人所具有的先驗(yàn)知識不同,對同一幅圖的心理視覺冗余也就因人而異。2、像素間冗余圖8.1.1兩幅圖像和他們沿同一行的自相關(guān)系數(shù)曲線像素間冗余:一種與圖像像素間相關(guān)性直接聯(lián)系著的數(shù)據(jù)冗余。像素間冗余常稱為空間冗余或集合冗余。圖像(a)中各像素的值可以比較方便地由其鄰近像素的值預(yù)測出來,每個(gè)像素所攜帶的獨(dú)立信息相對較少。換句話說,單個(gè)像素對圖像的視覺貢獻(xiàn)有很多冗余,因?yàn)槠浠叶瘸D芙柚溧徑袼氐闹祦硗茢?。連續(xù)序列圖像或視頻中,考慮時(shí)間因素,像素間冗余也稱為時(shí)間冗余或幀間冗余。abcd規(guī)則

冗余大不規(guī)則冗余小3、編碼冗余編碼:建立碼本來表達(dá)數(shù)據(jù);碼本:用來表達(dá)一定量的信息或一組事件所需的一系列符號(如字母、數(shù)字等);碼字:對每個(gè)信息或事件所賦的碼符號序列;碼字的長度(碼長,字長):每個(gè)碼字里的符號個(gè)數(shù)。圖象中每個(gè)灰度值sk(對灰度編碼)出現(xiàn)的概率:

式中,L為灰度級數(shù),nk是第k個(gè)灰度級出現(xiàn)的次數(shù),N是圖像中的像素總個(gè)數(shù)。不同灰度出現(xiàn)的概率不同。每個(gè)像素所需的平均比特?cái)?shù):

l(sk)表示sk的每個(gè)數(shù)值的比特?cái)?shù),由上式可知,每個(gè)像素所需比特?cái)?shù)是每個(gè)灰度的像素?cái)?shù)與用來表示這些灰度值所需比特?cái)?shù)的乘積的總和。所以,如能用較少的比特?cái)?shù)來表示出現(xiàn)概率較大的灰度級,而用較多的比特?cái)?shù)來表示出現(xiàn)概率較小的灰度級就能達(dá)到減少平均比特的效果。如果編碼所用碼本不能使上式達(dá)到最小,就說明存在編碼冗余,一般,如果編碼時(shí)沒有充分利用編碼對象的概率特性就會(huì)產(chǎn)生編碼冗余。8.1.2圖像編解碼圖8.1.2圖像編解碼過程圖像編解碼過程:圖像編解碼系統(tǒng):圖8.1.4編碼器和解碼器及其模塊8.1.3圖像保真度和質(zhì)量圖象保真度描述解碼圖象相對于原始圖象的偏離程度,是對信息損失的一種測度。主要分為兩大類:①客觀保真度(用編碼輸入圖與解碼輸出圖的某個(gè)確定函數(shù)表示損失的信息量,便于計(jì)算或測量)②主觀保真度(主觀測量圖象的質(zhì)量,因人而異,應(yīng)用不方便)1、客觀保真度(用編碼輸入圖與解碼輸出圖的某個(gè)確定函數(shù)表示損失的信息量,便于計(jì)算或測量)點(diǎn)誤差:圖誤差:均方根誤差:均方信噪比:兩幅圖尺寸均為M×N歸一化信噪比,令:可得到峰值信噪比:用分貝(dB)表示歸一化,則有:2、主觀保真度(主觀測量圖象的質(zhì)量,因人而異,應(yīng)用不方便)很多解壓圖象最終是供人看的,在這種情況下,用主觀的檢測常更合適。主觀保真度可分為3種:①損傷檢驗(yàn)(觀察者對圖象根據(jù)其損傷程度打分)②質(zhì)量檢驗(yàn)(觀察者對圖象根據(jù)其質(zhì)量排序)③對比測試(觀察者對圖象進(jìn)行兩兩比較)8.2編碼定理{信息論是圖像編碼的基礎(chǔ)}8.2.1信息單位和信源描述信息量:概率為P(E)的隨機(jī)事件E的信息量:I(E)稱為E的自信息(隨概率增加而減少),特例:P(E)=1(即事件總發(fā)生),那么I(E)

=0。信息的單位:比特(log以2為底)1個(gè)比特:即2個(gè)相等可能性的事件之一發(fā)生信源:一幅圖各像素的灰度值可看作一個(gè)具有隨機(jī)輸出的信源。信源符號集:S={s1,s2,…,sj},sj稱為信源符號信源產(chǎn)生符號sj這個(gè)事件的概率是P(sj)概率矢量:u=[P(s1)P(s2)…P(sj

)]T,用(S,u)可以完全描述信源。信源平均信息H(u):H(u)稱為信源的熵,它定義了觀察到單個(gè)信源符號輸出時(shí)所獲得的平均信息量,若信源各符號概率相等則熵達(dá)到最大值,此時(shí)信源提供最大可能的每信源符號平均信息量編碼輸出:因?yàn)樾旁吹妮敵鰰r(shí)一個(gè)離散隨機(jī)變量,所以編碼后的輸出也是一個(gè)離散隨機(jī)變量,它也是一個(gè)有限或無窮可數(shù)的符號集合中得到的。編碼輸出符號集:T={t1,t2,…,tK}概率矢量:v=[P(t1)P(t2)…P(tK

)]T,用(T,v)可以完全描述編碼輸出。編碼輸出的概率P(tk

)和信源u的概率分布:

式中,P(tksj

)是在信源符號sj產(chǎn)生條件下得到編碼輸出符號tk的概率。將條件概率放入一個(gè)K×

J的傳遞矩陣Q:編碼輸出符號集的概率分布:v=Qu互信息:對應(yīng)每個(gè)tk有一個(gè)條件熵函數(shù):

H(u|tk)對所有tk的期望值:編碼輸出符號tk的條件下信源符號sj產(chǎn)生的概率

H(u)和H(u|tk)的差是獲得單個(gè)輸出符號而接收到的平均信息,也稱u,v的互信息:表明互信息是U和Q的函數(shù),當(dāng)輸入和輸出符號統(tǒng)計(jì)獨(dú)立時(shí),I(u,v)取得最小值0.8.2.2無失真編碼定理無失真編碼定理給出在沒有失真的條件下(無損壓縮),編碼表達(dá)每個(gè)信源符號時(shí)可達(dá)到的最小平均碼字長度。信源輸出一個(gè)塊(組)隨機(jī)變量,信源產(chǎn)生的概率,它與單符號概率P(sj)的關(guān)系為:信源的熵:由此可見,產(chǎn)生塊隨機(jī)變量的信源的熵是對應(yīng)單符號信源的n倍。它也可看作是單符號信源的n階擴(kuò)展。P(σi)=P(σj1)P(σj2)…P(σjn)概率矢量:u'

=[P(σ1)P(σ2)…P(σJn)]T用長度為的整數(shù)碼字來對編碼,滿足:取極限:各式乘以p(σi)并對所有i求和H(u)是L'avg/n的下限,所以效率可定義為:效率總是小于等于1的,所以也可以說無損信源編碼的平均碼字長度可接近信源的熵,但不能小于信源的熵。這是無損信源壓縮的極限。8.2.3率失真編碼定理

率失真編碼定理簡稱率失真定理,也稱信源編碼定理。該定理將對固定字長編碼方案的失真(重建誤差)D與編碼所用的數(shù)據(jù)率(如每象素比特?cái)?shù))R聯(lián)系在一起。它給出由于壓縮而產(chǎn)生的平均誤差被限制在某個(gè)最大允許水平D時(shí)的最小的R。用重建的均方誤差作為失真度:重建誤差的熵有如下的上限:率失真函數(shù):因?yàn)樾旁词请S機(jī)的,所以失真也是一個(gè)隨機(jī)變量。失真的平均值d(Q)可表示為:當(dāng)且僅當(dāng)Q對應(yīng)的平均失真小于或等于D時(shí),可以說編碼解碼過程的允許失真是D。所有允許失真為D的編碼解碼過程的集合是:因而可進(jìn)一步定義率失真函數(shù):上式給出了在平均失真小于或等于D時(shí),信源可以傳送給編碼輸出的最小平均信息量為計(jì)算R(D),可通過合理選擇Q以求取I(u,v)的最小值,此過程要滿足3個(gè)約束條件:(1)Q的元素必須是正的(2)Q的任一列之和為1(3)允許最大可能的失真,就可獲得最小的數(shù)據(jù)率例8.2.3擴(kuò)展編碼的率失真函數(shù)特點(diǎn):R(D)總是正的,單減的在[0,Dmax]區(qū)間下凸R(D)在D<0時(shí)不存在D≥Dmax時(shí)有R(D)=08.3變長編碼

變長編碼是一種統(tǒng)計(jì)編碼壓縮方式,可減少編碼冗余。變長編碼通過非配給出現(xiàn)頻率較高的符號以較短的碼字而出現(xiàn)頻率較低的符號以較長的碼字來降低平均比特率。變長編碼是一種信息保存型編碼方式。8.3.1哥倫布編碼哥倫布編碼是一種比較簡單的變長編碼方法??紤]像素間的相關(guān)性,相鄰像素灰度值的差將會(huì)呈現(xiàn)小值出現(xiàn)多、大直出現(xiàn)少的特點(diǎn),這種情況比較適合哥倫布編碼方法。給定一個(gè)非負(fù)整數(shù)n和一個(gè)正整數(shù)除數(shù)m,n相對于m的哥倫布碼記為Gm(n),它是對商

的一元碼和對余數(shù)nmodm的二值表達(dá)的組合。Gm(n)可根據(jù)以下3個(gè)步驟計(jì)算{對照例8.3.1}(1)構(gòu)建商的一元碼(整數(shù)I一元碼定義為I個(gè)1后面跟個(gè)0)(2)令c=2k

–m,r=nmodm,計(jì)算截?cái)嗟膔':(3)將上兩步驟的結(jié)果拼接起來得到Gm(n)。階為k的指數(shù)哥倫布碼Gk

exp(n)采用以下3個(gè)步驟{對照例8.3.2}:(1)確定滿足下式的整數(shù)i≥0:并構(gòu)建i的一元碼。(2)計(jì)算下式的二值表達(dá):并將其截?cái)嗟阶畹偷膋+i比特。(3)將上兩個(gè)步驟的結(jié)果拼接起來得到8.3.2哈夫曼編碼

哈夫曼編碼是消除編碼冗余最常用的技術(shù)。當(dāng)對信源符號逐個(gè)編碼時(shí),哈夫曼編碼能給出最短的碼字。根據(jù)無失真編碼定理,哈夫曼編碼方式對固定階數(shù)的信源是最優(yōu)的。哈夫曼編碼過程主要分為兩個(gè)步驟:縮減信源符號數(shù)量:

將信源符號按出現(xiàn)概率從大到小排列,為消減信源,先將概率最小的兩個(gè)符號結(jié)合得到一個(gè)組合符號。如果剩下的符號多余兩個(gè),則繼續(xù)以上過程直到信源中只有兩個(gè)符號為止。(2)

對每個(gè)信源符號賦值從(消減到)最小的信源開始,逐步回到初始信源(參照圖8.3.2)圖8.3.2哈夫曼賦值過程圖解最終得到的碼字見圖中“碼字”一列所示。對一個(gè)只有兩個(gè)符號的信源,最短長度的二元碼由符號0和1組成,將他們賦予對應(yīng)最右列兩個(gè)概率的符號,這里賦予0或1完全是隨機(jī)的,不影響結(jié)果,由于對應(yīng)概率為0.6的符號是由左邊兩個(gè)符號結(jié)合而成,所以先將0賦給這兩個(gè)符號,然后再隨機(jī)地將0和1接在后面以區(qū)分這兩個(gè)符號。8.3.3香農(nóng)-法諾編碼

香農(nóng)-法諾編碼碼字中的0和1是獨(dú)立的,并且基本上等概率出現(xiàn)。它與哈夫曼編碼一樣都是所謂塊(組)碼,將每個(gè)信源符號映射成一組固定次序的碼符號,這樣在編碼時(shí)可以一次一個(gè)符號,也都需要知道各個(gè)信源號產(chǎn)生的概率。其主要步驟為:(1)源號依從到小列;(2)將信源符號分成概率之和相接近的兩部分;(3)分別給兩部分的信源符號組合進(jìn)行賦值(分別賦予0和1,也可1和0);(4)如果兩部分均只有一個(gè)信源符號,編碼結(jié)束,否則返回(2)繼續(xù)進(jìn)行。8.3.4算術(shù)編碼算術(shù)編碼是一種從整個(gè)符號序列出發(fā),采用遞推形式連續(xù)編碼的方法。將需編碼的所有符號統(tǒng)一考慮,建立整個(gè)符號序列與一個(gè)實(shí)數(shù)區(qū)間的映射關(guān)系,算術(shù)編碼的特點(diǎn):1、只需用到加法和移位運(yùn)算(算術(shù));2、從整個(gè)符號序列出發(fā)采用遞推形式連續(xù)編碼;3、一個(gè)算術(shù)碼字要賦給整個(gè)信源符號序列;4、碼字本身確定0和1之間的一個(gè)實(shí)數(shù)區(qū)間;5、源符號和碼字間的一一對應(yīng)關(guān)系并不存在,算術(shù)碼不是塊碼編碼來自1個(gè)4-符號信源{s1,s2,s3,s4}組成的符號序列:s1s2s3s3s4(參見下圖)編碼開始時(shí)符號占據(jù)整個(gè)區(qū)間[0,1],根據(jù)各個(gè)信源符號概率分成四段,第一個(gè)符號s1對應(yīng)[0,0.2],編碼時(shí)將這個(gè)區(qū)間擴(kuò)展成整個(gè)高度,再將此區(qū)間根據(jù)各信源符號概率擴(kuò)展成四段,然后對序列中第二個(gè)符號s2編碼,同理依次到最后一個(gè)符號編碼結(jié)束,最終得到一個(gè)區(qū)間[0.06752,0.0688],任何一個(gè)該區(qū)間的實(shí)數(shù)都可代表這個(gè)區(qū)間,從而代表對應(yīng)的符號序列。圖8.3.5算術(shù)編碼過程圖解8.4位平面編碼

位平面編碼先將許多灰度值圖像分解成一系列二值圖,然后對二值圖再用二元壓縮方法進(jìn)行壓縮。它不僅能消除或減少編碼冗余也能消除或減少圖象中的象素間冗余。8.4.1位平面的分解基本的位平面分解方法主要有:二值分解和灰度分解。1、二值分解對一幅用多個(gè)比特表示其灰度值的圖像來說,其中的每個(gè)比特可看作表示了一個(gè)二值的平面,也稱位平面(簡稱位面)圖8.4.1圖像的位面表示來表示具有m比特灰度級的圖像中像素的灰度值。把一幅灰度圖分解成一系列二值圖集合的一種簡單方法就是把上述多項(xiàng)式的m個(gè)系數(shù)分別分到m個(gè)1比特的位面中,稱為二值分解。這個(gè)分解方法的一個(gè)固有缺點(diǎn)是像素點(diǎn)灰度值的微小變化有可能對平面的復(fù)雜度產(chǎn)生明顯影響??捎萌缦露囗?xiàng)式:對一幅8比特灰度級圖像,當(dāng)代表一個(gè)像素灰度值字節(jié)的最高比特為1時(shí),該像素的灰度值必定大于或等于128,而當(dāng)這個(gè)像素的最高比特為0時(shí),該像素的灰度值必定小于或等于127.2、灰度碼分解

減少小灰度值變化影響的位面分解法,先用一個(gè)m比特的灰度碼表示圖像。m比特的灰度碼可由下式計(jì)算:

其中⊕代表異或操作。按上述方式分解為灰度碼分解,其結(jié)果仍是二值的位面。這樣得到的碼的獨(dú)特性質(zhì)是相連的碼字只有一個(gè)比特的區(qū)別,像素點(diǎn)灰度值的小變化就不易影響所有位面。8.4.2位平面的編碼位平面分解后得到的是二值圖,即像素值只有0或1兩種。另外,像素值為0或1的兩種像素在平面上是互補(bǔ)的。這些特性都可用來幫助編碼。1、常數(shù)塊編碼(CAC)

用專門的碼字表達(dá)全是0或1的連通區(qū)域,將圖象分成全黑,全白或混合的m×n尺寸塊出現(xiàn)頻率最高的類賦予1bit碼字0,其它兩類分別賦予2bit碼字10和11。壓縮:原需用mn比特表示的常數(shù)塊現(xiàn)在只用1bit或2bit碼字表示當(dāng)需壓縮的圖像主要由白色部分組成時(shí),更簡單的方法是將白色區(qū)塊編為0,而將其他塊區(qū)域都用1街上該塊的位模式編碼。這種方法為跳躍白色塊(WBS).2、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論