版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
圖像壓縮編碼第四講圖像壓縮編碼4.1概述4.2熵編碼原理4.3預(yù)測編碼原理4.4變換編碼原理4.5二值編碼4.6國際編碼標準圖像壓縮編碼4.1
概述4.1.1圖像壓縮的必要性
計算機圖像處理中的數(shù)字圖像其灰度多數(shù)用8bit來度量,一幅最簡單的黑白照片,若按512×512點陣取樣,表示這幅圖像的二進制數(shù)據(jù)量512×512×8=2048Kbit=2Mbit=256KB
而醫(yī)學圖像處理和其他科研應(yīng)用的圖像的灰度量化可用到12bit以上,因而所需數(shù)據(jù)量太大。1024×1024×12=12Mbit圖像壓縮編碼圖像數(shù)據(jù)在傳輸和存儲的過程中占用的信號空間包括:
物理空間:存儲器、磁盤等數(shù)據(jù)存儲介質(zhì);
時間空間:傳輸信息所需要的時間;
電磁頻譜空間:傳輸信息所需要的帶寬。為了減少信號占用的各種信號空間,必須壓縮圖像數(shù)據(jù)。圖像壓縮編碼4.1.2圖像壓縮的可能性一、圖像信號中存在大量的冗余可供壓縮1、結(jié)構(gòu)上存在大量的冗余圖像信號的相鄰像素間、相鄰行間、相鄰幀間存在很強的相關(guān)性,可以信息壓縮。相鄰像素間、相鄰行間的冗余稱為空間冗余;相鄰幀間的冗余稱為時間冗余。圖像壓縮編碼
2、統(tǒng)計上存在大量冗余被編碼信號的概率分布不均勻,對出現(xiàn)概率高的信號采用短碼編碼,對出現(xiàn)概率低的信號采用長碼編碼,從而節(jié)省碼字。統(tǒng)計上的這種特性稱為統(tǒng)計冗余。二、利用人眼的視覺特性通過視覺的生理學、心理學特性分析可知,允許經(jīng)過壓縮編碼的復(fù)原圖像在客觀上有一定的失真,只要失真在主觀上是難以察覺的。圖像壓縮編碼4.1.3圖像壓縮的分類圖像編碼的方法有很多,但從技術(shù)的角度來看,可以分為三大類:一、無失真編碼(無損編碼、可逆編碼)該方法是一種經(jīng)編、解碼后圖像不會產(chǎn)生失真的編碼方法,可重建圖像,但壓縮比不大。主要應(yīng)用于圖像的數(shù)字存儲方面。
圖像壓縮編碼二、有失真編碼(有損編碼、不可逆編碼)解碼時無法完全恢復(fù)原始圖像,解碼圖像與編碼時的圖像有一定的失真,但是該失真人眼是感覺不出來的,該方法壓縮比大。主要應(yīng)用于數(shù)字電視技術(shù)和多媒體圖像通信中。三、特征抽取編碼在圖像識別和分析、理解等技術(shù)中,往往并不需要全部的圖像信息,只對需要的特征信息編碼。圖像壓縮編碼傳統(tǒng)的壓縮編碼方法有脈碼調(diào)制、量化算法、空間和時間亞取樣編碼、熵編碼、預(yù)測編碼、變換編碼、矢量量化和子帶編碼等;新型編碼技術(shù)包括第二代圖像編碼方法、分形編碼、基于模型編碼和小波編碼等。本章重點介紹傳統(tǒng)編碼中的熵編碼、預(yù)測編碼和變換編碼。圖像壓縮編碼4.2
熵編碼4.2.1基本概念一、圖像熵
設(shè)數(shù)字圖像像素灰度級集合為(W1,W2,…,WM),其對應(yīng)的概率分別(P1,P2,…,PM),按信息論中信源信息熵定義,數(shù)字圖像的熵H為:圖像壓縮編碼二、平均碼字長度
給(W1,W2,…,WM)每個灰度級賦予一個編碼Ck,其中k=1,2,…,M(二進制),稱為碼字。
設(shè)Nk為數(shù)字圖像第k個碼字Ck的長度(二進制代碼的位數(shù)),其相應(yīng)出現(xiàn)的概率為Pk,則數(shù)字圖像所賦予的碼字平均長度R為:圖像壓縮編碼三、編碼效率式中H為信源熵,R為平均碼字長度根據(jù)信息論信源編碼理論,可以證明:圖像壓縮編碼
在變長編碼中,對出現(xiàn)概率大的信息符號賦予短碼字,而對于出現(xiàn)概率小的信息符號賦予長碼字,如果碼字長度嚴格按照所對應(yīng)符號出現(xiàn)概率大小逆序排列,則編碼結(jié)果平均碼字長度一定小于任何其他排列方式。四、變長最佳編碼定理定理證明如下:圖像壓縮編碼設(shè):圖像灰度級為各灰度級出現(xiàn)概率分別為編碼所賦予的碼字長度分別為則編碼后圖像平均碼字長度R應(yīng)為令第m和n個灰度級出現(xiàn)的概率分別為且。圖像壓縮編碼與這兩個灰度級對應(yīng)的碼字長度分別為。如果不按定理規(guī)則賦予這兩個碼字長度,即令證明了該定理圖像壓縮編碼4.2.2霍夫曼(huffman)編碼
霍夫曼編碼是根據(jù)可變長最佳編碼定理應(yīng)用霍夫曼算法而產(chǎn)生的一種編碼方法。其具有最優(yōu)變長編碼性質(zhì),平均碼長最短,接近熵值,是一種無失真編碼。圖像壓縮編碼霍夫曼編碼的步驟為:1、將信源X中的符號(消息)按照概率從大到小順序排列(對應(yīng)概率相同的可任意顛倒排列位置);排序2、把最后兩個出現(xiàn)概率最小的消息合并為一個消息,從而使信源的消息數(shù)減少;合并3、重復(fù)以上兩個步驟,直到信源最后只有兩個符號為止;圖像壓縮編碼4、將被合并的消息分別賦予1和0,并對最后的兩個消息也相應(yīng)的賦予1和0。賦值
5、從根部開始讀取編碼結(jié)果。讀取結(jié)果例1:求下列信源的霍夫曼編碼圖像壓縮編碼解:碼樹及編碼結(jié)果如圖4-1所示:圖4-1碼樹及編碼結(jié)果圖像壓縮編碼計算信源的熵,平均碼長,效率分別為:圖像壓縮編碼例2:求下列信源的霍夫曼編碼學生自己算圖像壓縮編碼編碼效率計算:圖像壓縮編碼4.2.3仙農(nóng)(Shannon)仙農(nóng)編碼也是一種常見的變長編碼,利用該編碼有時效率可達到100%。仙農(nóng)編碼的步驟如下:
1、統(tǒng)計出各個灰度出現(xiàn)的概率;2、從上到下把上述概率按從大到小的順序排列;3、從序列中的某個位置將序列分成兩個子序列圖像壓縮編碼并盡量使兩個子序列概率和近似相等。給前面的一個子序列賦值為0,后面的一個子序列賦值為1;4、重復(fù)步驟3直到各個子序列不能再分;5、分配碼字,將每個元素所屬子序列的值串起來,就可以得到各個元素的仙農(nóng)編碼。
例3:一幅圖像的灰度級別及概率如下圖4-2所示,求其仙農(nóng)編碼結(jié)果及編碼效率。圖像壓縮編碼圖4-2仙農(nóng)編碼過程圖像壓縮編碼編碼效率計算:如果各級灰度出現(xiàn)的概率正好為1/2n(n=1,2,…),n為編碼長度,則采用仙農(nóng)編碼時效率可達到100%。圖像壓縮編碼4.3
預(yù)測編碼原理4.3.1DPCM原理
預(yù)測編碼亦稱為差分脈沖編碼調(diào)制(DPCM:DifferentialPulseCodeModulation)
,方法簡單,硬件容易實現(xiàn)。
DPCM的基本原理是基于圖像中相鄰像素、相鄰行之間具有較強的相關(guān)性。
DPCM系統(tǒng)基本原理框圖如圖4-3所示:圖像壓縮編碼
DPCM系統(tǒng)基本原理框圖如圖4-3所示:圖像壓縮編碼圖像壓縮編碼原理:在發(fā)送端需傳送的數(shù)據(jù)是XN,但實際傳送的是預(yù)測差值eN(去除了像素間的相關(guān)性),在接收端將此誤差和預(yù)測值相加,重建原始圖像像素信號。
例如電視圖像的壓縮編碼用到DPCM,對于隔行掃描通常有:圖像壓縮編碼
DPCM編碼中量化和傳送的是誤差信號,可用較少的單位像素比特率進行編碼,從而使圖像數(shù)據(jù)得以壓縮。圖像壓縮編碼1、qN=0時可以完全不失真地恢復(fù)輸入信號,實現(xiàn)信息保持編碼。2、qN不等于0時輸入信號和復(fù)原信號輸出之間就一定存在誤差,從而產(chǎn)生圖像質(zhì)量的某種降質(zhì),系統(tǒng)實現(xiàn)的是保真度編碼。DPCM系統(tǒng)需要設(shè)計的組成部分主要有兩個:一個量化器;一個預(yù)測器。圖像壓縮編碼4.4
變換編碼原理4.4.1概述
變換編碼是實現(xiàn)圖像數(shù)據(jù)壓縮的另一主要手段。變換編碼的基本思想:將空間域描寫的圖像信號變換到變換域進行描寫。空間域的8×8個像素組成的像塊進行正交變換,得到變換域的8×8個系數(shù)組成的系數(shù)塊。圖像壓縮編碼
1、正交變換:空間域像塊中像素間存在很強的相關(guān)性,能量分布比較均勻;正交變換后變換域系數(shù)間近似是統(tǒng)計獨立的,相關(guān)性基本解除,并且能量主要分布在直流和少數(shù)低頻系數(shù)上。變換編碼是冗余壓縮的過程,主要通過三個步驟來實現(xiàn):
2、非均勻量化:編碼的時候,對高低頻成分分別用不同的粗細量化等級,甚至于對很高的頻率成分舍去不傳,從而使碼率明顯減少。
3、Z形掃描和游程編碼:減少碼字長度圖像壓縮編碼影響變換編碼誤差和計算復(fù)雜性的因素為:1、圖像的尺寸一般采用8×8和6×6的像塊。2、正交變換的選擇常用的有二維離散余弦變換DCT,沃爾什-哈達瑪變換,小波變換等。3、比特分配對不同的頻率分量采用不同的量化比特數(shù)。圖像壓縮編碼4.4.2基于DCT的變換編碼
變換編碼的基本結(jié)構(gòu)如圖4-4所示:
圖4-4變換編碼基本結(jié)構(gòu)圖圖像壓縮編碼1、方塊化和DCTMPEG-2標準中通常采用二維離散余弦變換DCT,圖像尺寸為8×8。設(shè)由8×8像素組成的像塊用矩陣X表示,其DCT變換后的8×8系數(shù)塊用矩陣Y表示,則DCT和IDCT的公式如下:圖像壓縮編碼8×8的DCT變換矩陣C的第i行,第j列元素按下式定義:
變換后的系數(shù)矩陣Y中,y00對應(yīng)空間的直流分量,稱為DC系數(shù),其余63個為交流分量,稱為AC系數(shù)。Y的左上角變換系數(shù)對應(yīng)空間低頻分量,右下角對應(yīng)高頻分量。圖像壓縮編碼3、游程編碼
游程編碼的思想:用適當?shù)膾呙璺绞?,將已量化的DCT系數(shù)矩陣變?yōu)橐痪S序列,使序列中連零的數(shù)目盡量多,對游程的長度進行編碼以代替逐個傳送這些零值,從而實現(xiàn)數(shù)據(jù)壓縮。2、非均勻量化:對低頻成分采用小的量化層次,對高頻成分采用大的量化層次,在量化后DCT系數(shù)矩陣變得稀疏,大部分位于右下角的高頻分量系數(shù)被量化為0。
圖像的主體成分是低頻,高頻只占小部分圖像壓縮編碼在MPEG-2中最為常用的是Z形掃描方式。
編碼方法:將一維序列轉(zhuǎn)化為一個由二元數(shù)組(run,level)組成的數(shù)組序列。Run表示連零的長度,level表示這串連零之后出現(xiàn)的一個非零值。當剩下的所有系數(shù)都是零時,用一個符號EOB(EndofBlock)來表示。
例:DCT變換后的系數(shù)矩陣如下表,求Z形掃描游程編碼,設(shè)量化因子為16。圖像壓縮編碼1125-32-8863010-18-203551100-155401713000180000000000000000000000000000000000000070-2-500000-1-1200000-921000000000000000000000000000000000000000000000DCT后的系數(shù)矩陣
均勻量化的結(jié)果圖像壓縮編碼游程編碼結(jié)果為:0,70,0,-2,0,-1,0,-9,0,-1,0,-5,1,2,0,2,3,1,EOB碼字變短了很多Z形掃描的結(jié)果為:70,-2,-1,-9,-1,-5,0,2,2,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0。圖像壓縮編碼4.5
二值圖像編碼二值圖像:只有兩個灰度級0和1的圖像,即圖像內(nèi)容“非白即黑”。
二值圖像的典型應(yīng)用有:文字檔案、氣象趨勢圖、工程藍圖、邏輯線路圖、指紋圖等。
圖像壓縮編碼4.5.1直接編碼
直接編碼:每一個像素只用一位二進制碼0或1來表示。一幅二值圖像的像素數(shù)也是比特數(shù)。
分辨率:圖像單位長度的像素數(shù)。CCITT(國際電話電報咨詢委員會)建議在傳真中采用兩種分辨率:
1728像素/行,8像素/mm,3.85行/mm;
l728像素/行,8像素/mm,7.7行/mm。圖像壓縮編碼
壓縮倍數(shù):壓縮是和直接編碼相比較而言的。定義式為:C取決于圖像內(nèi)容、分辨率、編碼方法,C越大越好。二值圖像編碼壓縮一般采用熵編碼。圖像壓縮編碼4.5.2跳過白色塊編碼
(WhiteBlockSkipping,WBS)WBS編碼:
跳過白色區(qū)域,對黑色像素編碼。這樣表示這些圖像的比特數(shù)將減少,每個像素平均比特數(shù)也就可以減少。圖像壓縮編碼
將圖像的每條掃描線分成若干等長的段,每段有N個像素。這些掃描線段有三種形式:全是0像素;全是1像素;由0和1像素混合組成。對全部是0像素的空白段用1bit“0”表示;對于其他像素段采用N十1個比特編碼,即第一個比特人為地規(guī)定為1,其余N比特采用直接編碼。一、一維WBS編碼圖像壓縮編碼例:假定掃描線由160個像素組成,令N=10,則有:線段號線段組成編碼#100000000000#2011101001110111010011#3111111111111111111111
………#16100000000011000000000在WBS中,空白塊總是占有一定的比例,所以盡管對非空白塊編碼時比直接編碼多了一個1,但總的編碼效果還是優(yōu)于直接編碼的。圖像壓縮編碼空白塊編碼的平均碼字長度為:壓縮比為:PN為空白塊出現(xiàn)的概率,N的取值一般為8~12。圖像壓縮編碼二、二維WBS編碼
一維WBS編碼可以方便地推廣到二維。一維的像素段——二維中像素塊假設(shè)像素塊尺寸為M×N,全部為白色的像素塊用“0”表示,非全白像素塊用(M×N+1)個比特碼表示。其中第一個比特為“1”。其余M×N個比特采用直接編碼。圖像壓縮編碼0000000010000101000000000100100010101000WBS圖像壓縮編碼三、自適應(yīng)WBS編碼二值圖像的自適應(yīng)WBS編碼:
根據(jù)圖像的局部結(jié)構(gòu)或統(tǒng)計特性,改變其像素塊尺寸大小、則WBS編碼所用的比特數(shù)一定會更少。自適應(yīng)增加了設(shè)備的復(fù)雜性。實際選用時要根據(jù)應(yīng)用要求和具體圖像內(nèi)容綜合考慮其經(jīng)濟性和有效性。圖像壓縮編碼4.6
圖像編碼的國際標準
國際標準化組織
(ISO)
(InternationalStandardizationOrganization)國際電信聯(lián)盟(ITU)
(InternationalTelecommUnication)
國際電信聯(lián)盟前身是國際電話電報咨詢委員會(CCITT)
(ConsultativeCommitteeoftheInternationalTelephoneandTelegraph)圖像壓縮編碼根據(jù)各標準所處理圖象的類型不同,可將它們分成兩大系列:1、用于壓縮靜止圖像的標準JPEG;2、用于壓縮運動圖像的標準MPEG和H.26X。
圖像壓縮編碼4.6.1JPEG標準(JointPhoto-GraphicExpertGroup)靜止圖像數(shù)據(jù)壓縮標準,也可直譯為聯(lián)合圖像專家組,1986年開始制定。用于連續(xù)變換的靜止圖像,所謂連續(xù)變換是指灰度等級和顏色兩方面的連續(xù)變換。圖像壓縮編碼定義了三種編碼系統(tǒng):1、基于DCT的有損編碼基本系統(tǒng),可用于絕大多數(shù)壓縮應(yīng)用場合;2、用于高壓縮比、高精確度或漸進模式應(yīng)用的擴展
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版購銷簡單的合同范本
- 2025年度建筑照明材料采購合同范本3篇
- 杭州公司合作合同范本
- 2024酒店勞動合同模板
- 2025年度GRC構(gòu)件生產(chǎn)與裝配安全責任合同3篇
- 影視作品海外發(fā)行與推廣2025年度合同2篇
- 二零二五年度跨區(qū)域LNG管道運輸及倉儲服務(wù)合同3篇
- 2025年度電機維修智能化改造升級合同3篇
- 2025年度電子元器件專用紙箱采購與倉儲管理合同3篇
- 2024珠寶首飾租賃與購買合同
- TD/T 1060-2021 自然資源分等定級通則(正式版)
- 人教版二年級下冊口算題大全1000道可打印帶答案
- 《創(chuàng)傷失血性休克中國急診專家共識(2023)》解讀
- 倉庫智能化建設(shè)方案
- 海外市場開拓計劃
- 2024年度國家社會科學基金項目課題指南
- 供應(yīng)鏈組織架構(gòu)與職能設(shè)置
- 幼兒數(shù)學益智圖形連線題100題(含完整答案)
- 七上-動點、動角問題12道好題-解析
- 2024年九省聯(lián)考新高考 數(shù)學試卷(含答案解析)
- 紅色歷史研學旅行課程設(shè)計
評論
0/150
提交評論