版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第六章變換編碼變換編碼變換編碼(TransformCoding):將信源輸出分解/變換為其組成部分,然后根據(jù)每個(gè)成分的特性分別進(jìn)行編碼主要內(nèi)容Karhunen-Loéve變換(KLT)離散余弦變換(discretecosinetransform,DCT)變換系數(shù)的量化編碼JPEG例:動機(jī)y=2.5x例:動機(jī)
——旋轉(zhuǎn)考慮(可逆)變換例:動機(jī)
——變換后的序列例:動機(jī)
——壓縮拋棄坐標(biāo)第二維…用定長碼編碼,可降低50%!例:動機(jī)
——重構(gòu)序列原始值重構(gòu)值例:動機(jī)
——誤差分析誤差取決于被置為0的那些n的幅值如果幅值很小,則誤差也很小即大多數(shù)信息在每個(gè)數(shù)據(jù)對的第一個(gè)元素中例:動機(jī)
——從統(tǒng)計(jì)分析的角度上面我們從幾何的角度分析了變換我們也可以從統(tǒng)計(jì)分析角度來審視變換:當(dāng)變換對序列去相關(guān)時(shí),能得到最大壓縮主成分方法(PrincipleComponentMethod)即樣本—樣本之間的相關(guān)性為0變換編碼變換將原始序列{xn}分成大小為N的塊將每個(gè)塊映射成變換序列
{n}
可逆映射每塊的不同元素的通常有不同的統(tǒng)計(jì)特性量化,根據(jù)目標(biāo)平均碼率統(tǒng)計(jì)序列的統(tǒng)計(jì)特性可能對不同的子序列采取不同的技術(shù)失真熵編碼定長碼、Huffman編碼、算術(shù)編碼、RLE+算術(shù)編碼…變換我們主要考慮線性變換:{n}每個(gè)元素的特性與其位置有關(guān)如:在上述例子中元素的位置是奇數(shù)還是偶數(shù)設(shè)計(jì)變換序列的方差決定編碼策略N
與特定領(lǐng)域有關(guān),基于實(shí)踐考慮計(jì)算代價(jià)、延遲、信源統(tǒng)計(jì)特性的穩(wěn)定性重構(gòu):變換(2)寫成矩陣形式(1-D):2-D變換:可分解的2-D變換:變換(3)矩陣形式的可分解2-D變換:我們要討論的變換都是正交變換(Orthonormaltransforms)正交變換正交矩陣:如果一個(gè)矩陣滿足其中I為單位陣,則稱A為正交矩陣。每行/列點(diǎn)積為1,不同行/列的點(diǎn)積為0正交矩陣的逆矩陣等于其轉(zhuǎn)置:正交反變換:正交變換(2)能量守恒性質(zhì):總能量守恒,但通常能量在各系數(shù)上分布并不均勻變換編碼增益為增益與系數(shù)方差的集中程度有關(guān)若每個(gè)系數(shù)的方差相等,則沒有增益幾何均值算術(shù)均值從信號分解的角度考慮變換:反變換為變換行=基向量表示x與ai之間的相似性相似性越高,變換系數(shù)越大例:第一行:低通信號,x0和x1的均值第二行:高通信號,x0和x1的差值A(chǔ)為正交矩陣從信號分解的角度(2)例(續(xù)):考慮兩個(gè)序列:低通:(3,1)高通:(3,-1)矩陣的角度1-D變換:變換矩陣的行展開類似的,2-D變換可視為變換矩陣行向量外積構(gòu)成的矩陣的展開外積:矩陣的角度(2)例:外積為:矩陣的角度(3)例(續(xù)):逆變換為:DC系數(shù)AC系數(shù)基矩陣Karhunen-LoéveTransform(KLT)亦稱為HotellingTransformHotelling于1933年用于離散數(shù)據(jù)去相關(guān)Karhunen、Loéve分別于1947年和1948用于連續(xù)函數(shù)分析Kramer和Mathews、Huang和Schultheiss分別于1956年、1963年用于數(shù)據(jù)壓縮(變換編碼)在統(tǒng)計(jì)分析中被稱為主成份分析
(Principal
ComponentsAnalysis,PCA)KLT(2)目標(biāo):用一個(gè)正交變換,去除輸入之間的相關(guān)性自相關(guān)矩陣:
{n}不相關(guān)為對角陣A為正交矩陣基函數(shù)(A的行向量)為矩陣的特征向量
{n}的方差為的特征值是對稱的可正交對角化KLT的性質(zhì)從N維中任取
系數(shù),令其他系數(shù)為0,得到的重構(gòu)誤差(均方誤差)為其中為的特征值,也是k
的方差所以KLT最小均方誤差意義下的最佳變換KLT達(dá)到最佳的能量集中KLT的性質(zhì)(2)任何正交變換的行列式的值:任何正交變換的協(xié)方差的行列式的值:KLT變換后(對角)協(xié)方差矩陣的行列式Hadamardin不等式:任何對稱、半正定矩陣的行列式小于等于其對角線元素的乘積變換系數(shù)方差的幾何均值最小編碼增益GTC最大例:KLT對塊大小為2的平穩(wěn)過程,自相關(guān)矩陣為特征值:特征向量:須滿足正交約束,歸一化:所以,KLT的變換矩陣為:KLT(3)既然KLT是最佳的,為什么還會有其他的變換呢?沒有快速計(jì)算方法KLT取決于信號的統(tǒng)計(jì)性質(zhì)對平穩(wěn)過程,KLT比較合適但對大多數(shù)輸入,需重復(fù)計(jì)算/傳輸變換矩陣尋找結(jié)構(gòu)化的變換,使得其性能接近KLTDCT離散余弦變換
(DiscreteCosineTransform,DCT)變換矩陣為cosine的函數(shù)源自DFT但更適合壓縮DCT基向量變化隨行號增大而增大(頻率越來越高)DCT基矩陣DFTvs.DCTDFT:DCT:函數(shù)的不連續(xù)影響Fourier級數(shù)的收斂,從而需要更多基函數(shù),影響壓縮DCT更連續(xù)DFT在邊界不連續(xù)DFTvs.DCT(2)DCT變換后的能量更集中更適合壓縮DCT的性質(zhì)對Markov過程:當(dāng)很大時(shí),DCT的性能接近KLT的性能
實(shí)際上,很多信源都是很大的Markov過程DCT是一個(gè)最流行的變換JPEGMPEGH.261…離散正弦變換
(DiscreteSineTransform,DST)變換矩陣為sine的函數(shù):類似DCT,有很好的性質(zhì)當(dāng)很小時(shí),DST的性能接近KLT的性能在圖像/語音編碼應(yīng)用中,與DCT變換互補(bǔ)離散DiscreteWalsh-Hadamard變換N階Hadamard矩陣HHT=NIN=2k的構(gòu)造規(guī)則:…DWH變換從Hadamard矩陣HN推導(dǎo)得到變換矩陣H歸一:乘以將每行以Wash序(sequencyorder)排列如:性能:計(jì)算簡單:+/-,在有限硬件上容易實(shí)現(xiàn)但壓縮性能比采用DCT稍差各種變換的比較(1)各種變換的比較(2)對塊大小為1×32的典型自然圖像,各種變換的能量集中比較:i主要內(nèi)容Karhunen-Loéve變換(KLT)離散余弦變換(discretecosinetransform,DCT)變換系數(shù)的量化編碼JPEG例1:空域量化vs.變換域量化x=[100110120130140150160170]T8點(diǎn)DCT變換:y=[381.84-64.420-6.730-2.010-0.5070]
能量主要集中在前兩個(gè)系數(shù)7水平的中平量化器例1:空域量化vs.變換域量化(2)方案1:直接對原始數(shù)據(jù)進(jìn)行量化方案2:對DCT系數(shù)進(jìn)行量化△=6,量化后的DCT系數(shù):[64-110-10000]3個(gè)非0DCT系數(shù)MSE:w/oDCT:3.0w/DCT:1.5例1:空域量化vs.變換域量化(3)△=20,2個(gè)非0DCT系數(shù):[19-3000000]DCT系數(shù)重構(gòu)效果仍然很平滑直接方法開始產(chǎn)生塊/mosaic效應(yīng)MSE:w/oDCT:50.0w/DCT:9.07例1:空域量化vs.變換域量化(4)△=100,2個(gè)非0DCT系數(shù):[4-1000000]DCT系數(shù)重構(gòu)效果仍然平滑直接方法產(chǎn)生的塊/mosaic效應(yīng)更多MSE:w/oDCT:1000w/DCT:205例2:空域量化vs.變換域量化輸入數(shù)據(jù): 8978767570828182 12295868080767481 18415312610685767175 22120518014697716867 225222217194144957882 228225227220193146110108 223224225224220197156120 2172192192242302201971512-DDCT變換系數(shù)(取整):1155259-23611730 -377-5085-101047-3 -4-158-2442-15101 -23-34-199-54-1 196-15-106-5-1 31336-920-3 8-24-13-10-2 20-32-200-1大多數(shù)能量集中在左上角例2:空域量化vs.變換域量化(2)
在變換域量化通常能得到更好的結(jié)果我們還可以做得更好對不同的子帶采取不同的量化步長
DCT系數(shù)的分布變換系數(shù)的比特分配我們討論的變換為正交變換變換過程為能量守恒,所以總的誤差=量化誤差每個(gè)子帶的能量:每個(gè)子帶的量化誤差:總的量化誤差:變換系數(shù)的比特分配(2)比特分配問題:計(jì)算,使得最小并滿足比特率:子帶能量:
為對角線上第k個(gè)元素變換系數(shù)的比特分配(3)用Lagrangian乘子法得到最佳的比特分配對所有的k,每個(gè)子帶的量化誤差的方差盡可能相等變換系數(shù)的比特分配(4)
方差越大,比特?cái)?shù)越多代入比特率約束最佳失真和每個(gè)系數(shù)的碼率分別為變換系數(shù)的比特分配(5)變換編碼的最佳失真為假設(shè)對原始信號的碼率失真函數(shù)為則變換編碼增益為變換系數(shù)的比特分配(6)變換編碼增益為
為Rxx對角線的元素,對平穩(wěn)過程,Rxx每個(gè)(i,i)相等增益與系數(shù)方差的集中程度有關(guān)若每個(gè)系數(shù)的方差相等,則沒有增益幾何均值算術(shù)均值變換系數(shù)的比特分配(7)上述最佳不一定為整數(shù),甚至不能保證為正數(shù)
但增大了平均碼率,還需均勻減小非0遞歸比特分配滿足約束:且為整數(shù)所以碼率分配算法為:1、計(jì)算每個(gè)成分的方差2、雖所以的3、對所有的方差排序,對最大的方差的成分分配1比特
若比特?cái)?shù)用盡,停止;否則轉(zhuǎn)第3步上述算法稱為zonalsampling遞歸比特分配(2)8*8變換的比特分配閾值編碼zonalsampling基于平均值進(jìn)行比特分配局部變化可能不能很好重構(gòu)如邊緣像素閾值編碼:對所有大于閾值的系數(shù)進(jìn)行編碼,而丟棄其他較小的系數(shù)閾值編碼(2)對2-D圖像編碼可采用Zigzag方式編碼可得到很多高頻系數(shù)為0,發(fā)送EOB(EndofBlock)即可總結(jié)正交變換:對信號空間的坐標(biāo)進(jìn)行旋轉(zhuǎn)變換的目的:去相關(guān):使得在量化時(shí),對各系數(shù)單獨(dú)量化(標(biāo)量量化),而不會損傷過多效率(與矢量量化相比)變換本身并不會產(chǎn)生壓縮,但變換會使得量化更容易實(shí)現(xiàn),真正實(shí)現(xiàn)壓縮的是變換后的量化能量集中:稀疏,將原始信號的能量壓縮到盡可能少的系數(shù)對原始信號只用少數(shù)幅值較大的系數(shù)表示比特分配與方差的log成正比KLT是最佳的,但其是信號相關(guān)的,沒有快速算法
DCT性能接近KLT,有快速計(jì)算算法通常采用DCT:對圖像采用8x8的塊大小、均勻量化
、Z字掃描(JPEG,MPEG,ITU-TH.261,H.263…)下節(jié)課內(nèi)容下節(jié)課內(nèi)容:JPEG作業(yè):Sayood3rd,pp.421-4222,4變換編碼JPEGJPEG標(biāo)準(zhǔn)JPEG:JointPhotographicExpertsGroup正式名稱:ISO/IECJTC1/SC29/WG10與CCITT(現(xiàn)為ITU)學(xué)習(xí)組VIII聯(lián)合工作開始于1986年于1992年形成國際標(biāo)準(zhǔn)ISO/IEC10918-1和CCITT建議T.81
廣泛用于圖像交換、WWW、數(shù)字圖像Motion-JPEG為數(shù)字視頻編緝的事實(shí)標(biāo)準(zhǔn)InternationalOrganizationforStandardizationInternationalElectrotechnicalCommissionJointISO/IECTechnicalCommittee(InformationTechnology)Subcommittee29
(CodingofAudio,Picture,MultimediaandHypermediaInformation)WorkingGroup10(JBIG,JPEG)JPEG:8×8的塊編碼JPEG標(biāo)準(zhǔn)JPEG規(guī)定了4種運(yùn)行模式,以滿足不同需要:基于DPCM的無損編碼模式:壓縮比可達(dá)2:1基于DCT的有損順序編碼模式:壓縮比可達(dá)10:1以上基于DCT的遞增編碼模式基于DCT的分層編碼模式基本(baseline)JPEG編碼器Huffman編碼:通過簡單的查表就可以實(shí)現(xiàn)Huffman編碼可以用自適應(yīng)二進(jìn)制算術(shù)編碼代替(由于專利問題,很少產(chǎn)品支持)
編碼效率提高10%,但算法更復(fù)雜顏色空間JPEG標(biāo)準(zhǔn)本身并沒有規(guī)定具體的顏色空間,只是對各分量分別進(jìn)行編碼實(shí)現(xiàn)中通常將高度相關(guān)RGB顏色空間轉(zhuǎn)換到相關(guān)性較小的YCbCr顏色空間RGBYCbCr(8bit/pixel)YCbCrRGB顏色空間圖像的主要信息包括在Y通道Cb、Cr更平滑容易壓縮人眼對色度分量不敏感對色度分量可以進(jìn)行下采樣:如4:2:2,4:2:0CbCr零偏置(LevelOffset)對于灰度級是2n的像素,通過減去2n-1,將無符號的整數(shù)值變成有符號數(shù)對于n=8,即將0~255的值域,通過減去128,轉(zhuǎn)換為值域在128~127]內(nèi)目的:使像素的絕對值出現(xiàn)3位10進(jìn)制的概率大大減少DCT變換對每個(gè)單獨(dú)的彩色圖像分量,把整個(gè)分量圖像分成8×8的圖像塊,如圖所示,并作為兩維離散余弦變換DCT的輸入DCT變換:其中逆變換:量化中平型均勻量化器:量化步長是按照系數(shù)所在的位置顏色分量來確定因?yàn)槿搜蹖α炼刃盘柋葘ι钚盘柛舾?,因此使用了兩種量化表:亮度量化值和色差量化值根據(jù)人眼的視覺特性(對低頻敏感,對高頻不太敏感)對低頻分量采取較細(xì)的量化,對高頻分量采取較粗的量化如果原始圖象中細(xì)節(jié)豐富,則去掉的數(shù)據(jù)較多,量化后的系數(shù)與量化前差別反之,細(xì)節(jié)少的原始圖象在壓縮時(shí)去掉的數(shù)據(jù)少些DCT系數(shù)量化步長人眼的對亮度敏感性DCLowHighLowHighSensitiveforhumaneyesLesssensitiveforhumaneyes建議基本量化表基于人的生理感知閾值實(shí)驗(yàn)量化表縮放真正的量化表=縮放因子×基本量化表質(zhì)量因子≤50:縮放因子=50/質(zhì)量;質(zhì)量因子>50:縮放因子=2–質(zhì)量/50縮放因子70586不同質(zhì)量因子的圖像示例GIF:258898bytes100:326321bytes75:70586bytes
50:46295bytes
25:29360bytes10:15325byteshttp://www.cs.sfu.ca/CC/365/mark/material/cgi-bin/whichjpeg.cgi9438bytes例: 用8x8的JEPG基線標(biāo)準(zhǔn),壓縮并重構(gòu)下列子圖52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68 65 76 78 940偏置轉(zhuǎn)換后-76 -73 -67 -62 -58 -67 -64 -55-65 -69 -62 -38 -19 -43 -59 -56-66 -69 -60 -15 16 -24 -62 -55-65 -70 -57 -6 26 -22 -58 -59-61 -67 -60 -24 -2 -40 -60 -58-49 -63 -68 -58 -51 -65 -70 -53-43 -57 -64 -69 -73 -67 -63 -45-41 -49 -59 -60 -63 -52 -50 -34正向DCT變換(n=8)后變成-415 -29 -62 25 55 -20 -1 37 -21 -62 9 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 311 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1 -1 0 -1量化變換后的數(shù)組-26 -3 -6 2 2 -1 0 01 -2 -4 1 1 0 0 0-3 1 5 -1 -1 0 0 00-4 1 2 -1 0 0 0 001 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0DC系數(shù)的差分編碼8×8圖像塊經(jīng)過DCT變換之后得到的DC直流系數(shù)有兩個(gè)特點(diǎn)系數(shù)的數(shù)值比較大相鄰8×8圖像塊的DC系數(shù)值變化不大:冗余根據(jù)這個(gè)特點(diǎn),JPEG算法使用了差分脈沖調(diào)制編碼(DPCM)技術(shù),對相鄰圖像塊之間量化DC系數(shù)的差值DIFF進(jìn)行編碼:DC系數(shù)的差分編碼對DIFF用Huffman編碼:分成類別,類似指數(shù)Golomb編碼類別ID:一元碼編碼類內(nèi)索引:采用定長碼DC類別范圍范圍大小0011-1,122-3,-2,2,343-7,
-6,
-5,
-4,4,5,6,784-15,…,-8,8,…,15165-31,…,-16,16,…,3132………15[-32767,-16384],[16384,32767]32768DC系數(shù)的差分編碼
例:DC=8,上一DC=5,則DIFF=8-5=3
類別ID=2,類內(nèi)索引=3,則碼流=10011AC系數(shù)的Z字掃描由于經(jīng)DCT變換后,系數(shù)大多數(shù)集中在左上角,即低頻分量區(qū),因此采用Z字形按頻率的高低順序讀出,可以出現(xiàn)很多連零的機(jī)會??梢允褂糜纬叹幋a。尤其在最后,如果都是零,給出EOB(EndofBlock)即可。Zig-zag掃描26?30?3?2?62?41?411512?11?1200000?1?1EOBAC系數(shù)的游程編碼在JPEG和MPEG編碼中規(guī)定為:(run,level)表示連續(xù)run個(gè)0,后面跟值為level的系數(shù)如:?30?3?2?62?41?411512?11?1200000?1?1EOB表示為(0,-3);(1,-3);(0,-2);(0,-6);(0,2);(0,-4);(0,1);(0,-4);(0,1)(0,1);(0,5);(0,1);
(0,2);(0,-1);(0,1);(0,-1);(0,2);(5,-1);(0,-1);EOB編碼:Run:最多15個(gè),用4位表示ZLevel:類似DC分成16個(gè)類別,用4位表示表示類別號C類內(nèi)索引對(Z,C)聯(lián)合用Huffman編碼對類內(nèi)索引用定長碼編碼AC系數(shù)的Huffman編碼Z:0的游程;C:類別ZRL:表示16個(gè)0;當(dāng)0的個(gè)數(shù)大于15時(shí),分成多次如20個(gè)0,緊跟-1:ZRL;(4,-1)(run,level)序列:(0,-3);(1,-3);...Z/C序列:0/2,1/2,…-3是第2類的第1個(gè)值,(0,-3):0100-3是第2類的第1個(gè)值,(1,-3):1101100重構(gòu)與編碼相反解碼Huffman數(shù)據(jù)解碼DC差值重構(gòu)量化后的系數(shù)DCT你變換丟棄填充的行/列反0偏置對丟失的CbCr分量差值(下采樣的逆過程)YCbCrRGB重構(gòu)量化后的系數(shù)(已通過DC差重構(gòu)DC系數(shù))乘以量化表,得到IDCT:+128:重構(gòu)誤差:每個(gè)像素大約為5的平均絕對誤差誤差在左下角比較明顯原圖重構(gòu)圖示例圖像示例圖像基于DPCM的無損編碼模式采用三鄰域二維預(yù)測編碼和熵編碼無失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預(yù)測器熵編碼器表說明DPCM預(yù)測編碼框圖基于DCT的遞增編碼模式此模式與順序模式編碼步驟基本一致不同之處在于:遞增模式每個(gè)圖像分量的編碼要經(jīng)過多次掃描才完成第一次掃描只進(jìn)行一次粗糙的壓縮,然后根據(jù)此數(shù)據(jù)先重建一幅質(zhì)量低的圖像以后的掃描再作較細(xì)的掃描,使重建圖像質(zhì)量不斷提高,直到滿意為止遞增模式分為兩種:按頻段累進(jìn)按位累進(jìn)基于DCT的分層編碼模式1、降低原始圖像的空間分辨率2、對已經(jīng)降低分辨率的圖像按照順序編碼模式進(jìn)行壓縮并存儲或傳輸3、對低分辨率圖像進(jìn)行解碼,然后用插值法提高圖像的分辨率4、將分辨率已經(jīng)升高的圖像作為原圖像的預(yù)測值,并把它與原圖像的差值進(jìn)行基于DCT的編碼5、重復(fù)步驟3、4直到圖像達(dá)到完整的分辨率總結(jié)JPEG:各種基本算法的精妙組合:DCT+DPCM+Huffman其他標(biāo)準(zhǔn)也類似ReferencesG.K.Wallace,“TheJPEGstillpicturecompressionstandard,”IEEETrans.ConsumerElectronics,vol.38,no.1,pp.xviii-xxxiv,Feb.1992.TU-TRec.T.81
/ITU-T/studygroups/com16/jpeg1x/index.html
Wiki:/wiki/JpegJPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOTJPEG2000概述靜止圖像壓縮標(biāo)準(zhǔn):連續(xù)色調(diào)和二值1997年開始,2000年定案主要特性:低碼率下性能更好(與JPEG相比)分辨率和質(zhì)量可伸縮隨機(jī)訪問ROI
(RegionOfInterest)容錯(cuò):在位流中可加入同步碼支持大圖像應(yīng)用更廣:復(fù)合文檔壓縮在單一數(shù)據(jù)流中統(tǒng)一有失真編碼和無失真編碼代價(jià)(與JPEG相比):更多存儲更復(fù)雜JPEGat0.125bpp(放大后)192:1JPEG2000at0.125bpp(放大后)192:1JPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOT編碼器結(jié)構(gòu)DiscreteWaveletTransformQuantizationEBCOTEntropycodingTier1:BlockCodingImagedataPre-processingTier2:LayerCodingBitstreamRateControlJPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOT預(yù)處理貼片劃分(ImageTiling)顏色變換貼片劃分(1)圖像可能太大,編碼器一次不能處理圖像被分割成不重疊的貼片(tile),所有的操作都是以貼片為處理單元顏色變換、小波變換、量化和熵編碼貼片的一個(gè)主要目的是可以對圖像中感興趣的部分進(jìn)行解碼解碼器識別位流中的每個(gè)貼片,并且只對包含在貼片中的像素進(jìn)行解碼貼片劃分(2)參考網(wǎng)格:(referencegrid):Xsiz,Ysiz圖像區(qū)域偏移量:XOsiz,YOsiz圖像與參考網(wǎng)格底端對齊
每個(gè)成分的水平/豎直方向采樣周期:XRsiz,YRSiz如XRsiz=2,YRsiz=1XRsiz=2,YRsiz=2.貼片劃分(3)所有貼片大小相等,邊界處除外貼片劃分(4)貼片的大小會影響圖像的主觀質(zhì)量和客觀質(zhì)量太小的貼片會帶來更多的“貼片效應(yīng)”顏色變換支持兩種顏色變換不可逆變換(Irreversiblecolortransform,ICT):YCbCr空間同JPEG中的顏色變換用于浮點(diǎn)小波變換/有失真編碼可逆變換(Reversiblecolortransform,RCT):YUV空間用于整數(shù)小波變換,可用于有失真編碼或無失真編碼可選:對色度分量進(jìn)行下采樣同JPEG一樣,顏色分量也進(jìn)行0偏置處理:-2n-1可逆顏色變換顏色變換:逆變換:JPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOT核心處理小波變換量化離散小波變換(DWT)DWT(2)雙正交DWTh0與g0正交h1與g1正交DWT(3)不可逆:Daubechies(9,7)在低碼率下性能最好,但計(jì)算復(fù)雜度高可逆:LeGall(5,3):整數(shù)實(shí)現(xiàn)無失真編碼,計(jì)算復(fù)雜度低nh0(n)nh1(n)0+6/8-1+1±1+2/8-2,0-1/2±2-1/8nh0(n)nh1(n)0+0.602949018236-1+1.115087052456±1+0.266864118442-2,0-0.591271763114±2-0.078223266528-3,1-0.057543526228±3-0.016864118442-4,2+0.091271763114±4+0.026748757410DWT(4)支持卷積方式和提升方式實(shí)現(xiàn)離散小波變換卷積:濾波器與信號卷積提升格式:預(yù)測和更新DWTCohen-Daubechies-Feauveau(CDF)(9,7)的提升格式:其中P表示像素值,C表示小波系數(shù)
LeGall(5,3)用整數(shù)小波變換實(shí)現(xiàn)=1.586,=0.052,=0.882,=0.443,K=1.230量化JPEG2000支持兩種量化帶死區(qū)的標(biāo)量量化網(wǎng)格量化(TrellisCodedQuantization)帶死區(qū)的均勻量化死區(qū):0附近區(qū)域的大小為其他區(qū)域的2倍量化規(guī)則:對每個(gè)子帶b,用戶選擇基本量化步長△b,并用該步長對該子帶中的所有系數(shù)量化可根據(jù)視覺模型(如對比敏感函數(shù),contrastsensitivityfunction)選擇每個(gè)子帶的步長
相同視覺質(zhì)量下能得到更高的壓縮比JPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOTEBCOTEBCOT:EmbeddedBlockCodingwithOptimizedTruncationTier1:分塊編碼(BlockCoding)將每個(gè)子帶分成獨(dú)立編碼的碼塊(32x32or64x64)Tier2:最佳截?cái)?OptimalTruncation)在所有塊被壓縮后,一個(gè)后處理過程決定每塊的截?cái)帱c(diǎn)壓縮后的率—失真(Post-compressionrate-distortion,PCRD)優(yōu)化上下文建模算術(shù)編碼碼率—失真控制cxD(Tier1)(Tier2)量化后的系數(shù)位流EmbeddedBlockCodingOptimizedTruncationTier-1第一輪(Tier-1)編碼:編碼塊的小波系數(shù)按位面算術(shù)編碼位面編碼(Bit-PlaneCoding)分?jǐn)?shù)位面(FractionalBit-Plane)掃描MQ編碼器上下文建模算術(shù)編碼碼率—失真控制cxD(Tier1)(Tier2)量化后的系數(shù)位流EmbeddedBlockCodingOptimizedTruncation分塊編碼與EZW和SPIHT的哲學(xué)思想不同由于沒有利用帶內(nèi)冗余,會輕微犧牲效率,但這會帶來其他好處分塊編碼的優(yōu)點(diǎn)提供SNR(或質(zhì)量)和分辨率可伸縮分辨率可伸縮:可解碼小圖像通過發(fā)送逐個(gè)子帶的塊碼流實(shí)現(xiàn)EZW和SPIHT只有SNR可伸縮:不同子帶的數(shù)據(jù)混合在一起可以利用局部統(tǒng)計(jì)性:對算術(shù)編碼有用提供隨機(jī)訪問特征減少存儲要求允許并行實(shí)現(xiàn)編碼塊的位平面分解1SignbitMSBLSBMagnitudebitsinsignificantsignificantPixelBit-plane10011000動態(tài)掃描和分?jǐn)?shù)位平面每塊用位平面編碼編碼動態(tài)掃描:先編碼更可能是重要系數(shù)的系數(shù)EZW和SPIHT采用確定的掃描順序每個(gè)位平面進(jìn)一步被細(xì)分為3個(gè)步驟編碼(分?jǐn)?shù)位平面):1.重要性傳播過程(significancepass):對可能是重要的系數(shù)2.幅值細(xì)化過程(refinementpass):對已是重要的系數(shù)3.清除過程(cleanuppass):對不太可能是重要的系數(shù)每個(gè)系數(shù)值在上述3個(gè)步驟中的之一出現(xiàn)在每一個(gè)步驟中,系數(shù)以確定的順序訪問面向條帶(Stripe)的掃描每條4行按列掃描位平面編碼原語4種“原語”編碼操作零編碼(ZeroCoding,ZC):在significanceandcleanuppasses對系數(shù)的第p個(gè)位平面,如果系數(shù)仍不是重要系數(shù)符號編碼(Sign
Coding,SC):在significancepass當(dāng)系數(shù)從不重要變成重要時(shí)幅值細(xì)化(MagnitudeRefinement,MR):在refinementpass對重要系數(shù),細(xì)化1比特游程編碼(RLC):只在cleanuppass用游程符號編碼多個(gè)連續(xù)系數(shù)的重要性EBCOT中的上下文共18種上下文10種:重要性編碼5種:符號編碼3種:細(xì)化編碼而JBIG和JBIG-2有上千種上下文對每塊,重新初始化上下文模型提高容錯(cuò)性允許并行實(shí)現(xiàn)三個(gè)編碼步驟重要性傳播步驟(對第一個(gè)位平面省略):
系數(shù)不重要,但8鄰居中至少有一個(gè)重要的系數(shù),根據(jù)當(dāng)前位平面檢查其是否變成重要的這些系數(shù)更可能是重要的系數(shù),因?yàn)槠溆兄匾泥従尤绻麡颖救允遣恢匾?,用ZC原語編碼如果樣本變成重要的(該位為1時(shí)),將其重要性標(biāo)志置為1,并用SC原語編碼其符號位幅值細(xì)化步驟(對第一個(gè)位平面省略):在前一個(gè)位平面已經(jīng)是重要的系數(shù),用MR原語編碼清除步驟:對其他剩下的系數(shù),用ZC和RLC原語編碼該過程中的系數(shù)極有可能仍是不重要的ZeroCoding亦稱為重要性編碼(Significancecoding)的正常模式若不重要系數(shù)在當(dāng)前位平面仍是不重要的,發(fā)送0否則發(fā)送1,然后發(fā)送系數(shù)的符號位系數(shù)的重要性與其鄰居有關(guān)上下文模型:如果系數(shù)仍是不重要的,用9個(gè)上下文(索引0-8)編碼系數(shù)的第p個(gè)位平面根據(jù)8鄰居的狀態(tài)決定ZC上下文Sh:水平方向重要鄰居的數(shù)目(0-2)Sv:豎直方向重要鄰居的數(shù)目(0-2)Sd:對角線向重要鄰居的數(shù)目(0-4)利用前一個(gè)位平面的信息如果鄰居不在同一塊內(nèi),則認(rèn)為該鄰居是不重要的鄰居系數(shù)之間的相關(guān)性鄰居系數(shù)的重要性可用來預(yù)測當(dāng)前系數(shù)的重要性HL子帶捕獲豎直方向的邊緣LH子帶捕獲水平方向的邊緣不同的邊緣需要不同方向的鄰居ZeroCoding上下文Sh:水平方向重要鄰居的數(shù)目(0-2)Sv:豎直方向重要鄰居的數(shù)目(0-2)Sd:對角線向重要鄰居的數(shù)目(0-4)LL,LH,HL子帶ZC上下文
舉例水平方向鄰居的重要性預(yù)測性最好豎直方向鄰居的重要性預(yù)測性最好對角線方向鄰居的重要性預(yù)測性最好ZeroCoding上下文游程編碼
—重要性編碼的游程模式應(yīng)用于不重要概率高的區(qū)域當(dāng)滿足下列條件時(shí),進(jìn)入游程模式:1.在前一個(gè)位平面,列中的所有4個(gè)系數(shù)都是不重要的2.其中任何一個(gè)都沒有重要的鄰居解碼器采用相同的決策如果進(jìn)入游程模式,發(fā)送一個(gè)二進(jìn)制的RunInterruption符號,采用索為9的上下文,用于標(biāo)識該4個(gè)系數(shù)中是否有系數(shù)在當(dāng)前位平面是重要的如果所有的都是不重要的(很有可能)發(fā)送0否則(不太可能):發(fā)送1,然后發(fā)送列中前面不重要系數(shù)的數(shù)目,緊跟第一個(gè)重要系數(shù)的符號。其余用正常模式編碼。不重要系數(shù)的數(shù)目在[0,3]區(qū)間內(nèi)近似均勻分布用2比特表示,用均勻分布編碼符號編碼當(dāng)系數(shù)從不重要變成重要時(shí)采用相鄰系數(shù)的符號位表現(xiàn)出強(qiáng)相關(guān)性例:LH子帶中的水平方向系數(shù)趨向于有相同的符號HL子帶中的豎直方向系數(shù)趨向于有相反的符號符號編碼的上下文呢:利用直接4鄰居的符號(2個(gè)水平、2個(gè)豎直)每個(gè)鄰居可能是:不重要、正、負(fù)3^4=81種可能的配置JPEG2000中簡化為5種上下文:索引:10-14幅值細(xì)化編碼對重要系數(shù)的第p個(gè)比特編碼:上下文模型:選用3個(gè)上下文(索引15-17)上下文選擇,基于:該比特是否為該系數(shù)的第一個(gè)細(xì)化比特該系數(shù)是否有重要的鄰居(水平、豎直或?qū)蔷€)編碼舉例位平面2:重要性過程:忽略,開始時(shí)所有都是不重要的細(xì)化過程:忽略,開始時(shí)沒有重要的系數(shù)清除過程:0,0:前2列用RLC:都是不重要的1,
1,0,0,1,0:第3列用RLC:不是所有都是不重要的,前面有2個(gè)不重要,且下一個(gè)系數(shù)為正的重要系數(shù),最后一個(gè)系數(shù)為正的重要系數(shù)
0,0,0,0:最后1列,不能用RLC,對每個(gè)系數(shù)用ZC:所有都是不重要的編碼舉例(2)位平面1:重要性過程:逐列掃描所有有至少一個(gè)重要鄰居的不重要的系數(shù)1,0,1,1,1,1,0,0,0,1,1(這輪中有4個(gè)新的重要系數(shù))細(xì)化過程:1,1清除過程:0,1,1,0,1,0,0,1,0,0(這輪中3個(gè)新的重要系數(shù))編碼舉例(3)位平面0:重要性過程:逐列掃描所有有至少一個(gè)重要鄰居的不重要的系數(shù)1,1,1,0,1,0,1,0,0,1,0,1,1(這輪中有6個(gè)新的重要系數(shù))細(xì)化過程:1,0,0,0,1,1,0,1,0清除過程:該例中無EBCOTEBCOT:EmbeddedBlockCodingwithOptimizedTruncationTier-1:分塊編碼(BlockCoding)將每個(gè)子帶分成獨(dú)立編碼的碼塊(32x32or64x64)Tier-2:最佳截?cái)?OptimalTruncation)在所有塊被壓縮后,一個(gè)后處理過程決定每塊的截?cái)帱c(diǎn)壓縮后的率—失真(Post-compressionrate-distortion,PCRD)優(yōu)化上下文建模算術(shù)編碼碼率—失真控制cxD(Tier1)(Tier2)量化后的系數(shù)位流EmbeddedBlockCodingOptimizedTruncationTier-2:最佳截?cái)鄩K截?cái)啵好總€(gè)編碼塊產(chǎn)生的位流有不同的小塊組成每個(gè)位平面3小塊,對應(yīng)3個(gè)分?jǐn)?shù)位平面編碼過程最后的位流由不同的質(zhì)量層組成每層由不同塊的合適
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 交通事故賠償金協(xié)議書七篇
- 鮑恩病病因介紹
- 勞務(wù)派遣書面協(xié)議書七篇
- 《數(shù)據(jù)資產(chǎn)入表合規(guī)規(guī)范指南》(征求意見稿)
- (參考)雕刻工藝品投資項(xiàng)目可行性研究報(bào)告
- 2023年天津市南開區(qū)高考語文二模試卷
- 《廉政公署專題》課件
- 電工培訓(xùn)課件之跌落熔絲的操作
- 《廣告創(chuàng)意文案設(shè)計(jì)》課件
- 內(nèi)蒙古呼倫貝爾市阿榮旗2023-2024學(xué)年七年級上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 2024秋期國家開放大學(xué)《公共政策概論》一平臺在線形考(形考任務(wù)1至4)試題及答案
- 《2024版 CSCO非小細(xì)胞肺癌診療指南》解讀
- GB 44497-2024智能網(wǎng)聯(lián)汽車自動駕駛數(shù)據(jù)記錄系統(tǒng)
- 家具售后合同協(xié)議書
- 空氣動力學(xué)數(shù)值方法:有限體積法(FVM):離散化技術(shù)與數(shù)值通量
- 下肢靜脈曲張的靜脈內(nèi)射頻消融術(shù)
- 北師大版七上冊數(shù)學(xué)期末沖刺復(fù)習(xí)
- 物流管理專業(yè)培養(yǎng)專題方案調(diào)研綜合報(bào)告樣本
- 小學(xué)語文整本書閱讀《夏洛的網(wǎng)》導(dǎo)讀課公開課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 建筑鋼結(jié)構(gòu)質(zhì)量通病及防治措施
- 骨科中醫(yī)護(hù)理方案總結(jié)與優(yōu)化(2篇)
評論
0/150
提交評論