一種反映人眼視覺特性的JPEG壓縮編碼_第1頁
一種反映人眼視覺特性的JPEG壓縮編碼_第2頁
一種反映人眼視覺特性的JPEG壓縮編碼_第3頁
一種反映人眼視覺特性的JPEG壓縮編碼_第4頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、    一種反映人眼視覺特性的JPEG壓縮編碼        唐躍林 肖沙里 姚富光 丘 時間:2009年08月31日     字 體: 大 中 小        關(guān)鍵詞:        ? 摘? 要: 在分析標準JPEG編碼與解碼過程的基礎(chǔ)上,利用人眼的視覺特性調(diào)整量化矩陣,提

2、高了編碼器的壓縮性能。? 關(guān)鍵詞: JPEG? 圖像壓縮? 人眼視覺特性? 量化?1?JPEG編碼與解碼分析JPEG標準有4種編碼方式,其中基于DCT的編碼與解碼過程分別如圖1和圖2所示。?在JPEG編碼過程中,正向離散余弦變換(FDCT)、DC差分脈沖編碼、AC系數(shù)排序及熵編碼均可認為對圖像質(zhì)量沒有影響。而對圖像質(zhì)量和壓縮率起關(guān)鍵作用的是量化過程。對DCT系數(shù)進行量化的目的是:在滿足圖像質(zhì)量的要求下進一步提高壓縮率。量化的出發(fā)點是對于人眼敏感的低頻系數(shù)及亮度信息進行細量化,以提高圖像的質(zhì)量。而對于人眼不敏感的高頻系數(shù)及色度信息采用較大的量化間隔,以取得更大的壓縮比。量化的方法是對每一個DCT

3、系數(shù)F(u,v)除以相應的量化間隔Q(u,v)并取整,即:FQ(u,v)=Integer Round(F(u,v)/Q(u,v)。?2?基于人眼視覺特性的量化表的產(chǎn)生JPEG標準推薦了亮度和色度二個基本量化表(默認量化表),其中考慮了人眼對空間頻率的敏感性,即對人眼敏感的低頻系數(shù)采用較小的量化步長,對人眼不敏感的高頻系數(shù)采用較大的量化步長。然而,這并未充分考慮人眼的視覺特性。人眼不僅對宏塊的空間頻率敏感性不同,而且,還依賴于其周圍的環(huán)境。人眼視覺系統(tǒng)對于邊緣區(qū)或均勻圖案區(qū)比復雜圖案區(qū)更敏感。而標準的JPEG使用的是線性均勻量化器,不能反映圖像的局部變化特征,從而增加了重建圖像的主觀失真,影響圖

4、像的質(zhì)量。因此,針對不同區(qū)域的宏塊,相應地調(diào)整量化步長,以減少圖像壓縮的主觀失真及提高壓縮率,是本文要解決的問題。2.1 宏塊類別的界定由上面的論述可知,不同圖案區(qū)的宏塊相對于人眼具有不同的視覺敏感性。因此可利用宏塊的象素梯度(Pixel Gradients)信息及亮度信息來界定宏塊類別,同時,也相應地反映出圖像的主觀復雜度。宏塊的象素梯度信息計算:式中,sp(i,j)為原始宏塊的相應象素值;det_H、det_V分別為宏塊的水平和垂直象素梯度信息;f_det用來度量宏塊的復雜性;TH1為人眼視覺系統(tǒng)所能感覺到的圖像變化的門限值,它隨宏塊的平均亮度而改變,即:根據(jù)上述公式,對宏塊可作如下分類及

5、其相應的量化調(diào)整因子為:式中,M是量化調(diào)整因子,NO1、NO2、NO3為宏塊的象素梯度閾值。2.2 宏塊活動性的計算宏塊的活動性反映了宏塊的復雜程度。活動性越高,人眼視覺感知能力越小,可以采用相對較大的量化步長。在MPEG-2 TM5中,宏塊的活動性是以4個亮度子塊的象素方差最小值作為度量標準的。本文為減少計算量,采用直接計算4個亮度子塊DCT中AC系數(shù)的絕對值之和的最小值作為該宏塊活動性水平的統(tǒng)計標準。即:宏塊的平均活動性則以所有8×8亮度子塊的AC系數(shù)的絕對值之和的平均值來表示。即:avg_act=mean(abs_sum)2.3 量化表的產(chǎn)生根據(jù)上面所計算的宏塊的活動性,參考M

6、PEG-2 TM5中計算宏塊復雜性的方法,可得歸一化活動性函數(shù)為:宏塊的活動性函數(shù)反映了人眼的視覺特性。當塊的內(nèi)容復雜、包含高頻成分較多、宏塊活動性較高時,人眼對此不敏感,可以采用較大的量化步長。相反,對于平坦區(qū)等活動性較低,人眼視覺相對敏感的宏塊則進行細量化。同時,考慮到不同的宏塊類別,則最后的量化矩陣為:式中,Qj為第j個宏塊的量化矩陣;Qdef為JPEG推薦的量化表;Qsub為根據(jù)不同類型的宏塊而產(chǎn)生的量化調(diào)整矩陣。3?實驗結(jié)果實驗中,針對二幅圖像(Lenna、Clumbia),利用本文的方法和使用默認量化矩陣的標準JPEG壓縮方法進行了模擬對比實驗,采用峰值信噪比PSNR(Peak S

7、ignal-to-Noise Ratio)和壓縮比CR(Compression Ratio)二項指標作為實驗結(jié)果的評價。實驗結(jié)果如表1所示。?從表1可以看出,本文的方法優(yōu)于采用默認量化矩陣的標準JPEG壓縮編碼,提高了圖像的壓縮比和重構(gòu)圖像的質(zhì)量。4? 結(jié)束語本文在分析標準JPEG編碼與解碼過程的基礎(chǔ)上,著重討論了與圖像質(zhì)量和壓縮率密切相關(guān)的量化過程。在此基礎(chǔ)之上,利用人眼的視覺特性,通過確定宏塊的類別和分析宏塊的活動特性,相應地調(diào)整量化矩陣,以達到提高圖像的壓縮比和重構(gòu)圖像質(zhì)量的目的。實驗結(jié)果表明,該方法的壓縮性能優(yōu)于采用默認量化表的標準JPEG的壓縮性能。?參考文獻1? 張益貞,劉滔.Visual C+實現(xiàn)MPEG/JPEG編解碼技術(shù).北京:人民郵電出版社,20022? 林福宗,陸達.多媒體與CD-ROM.北京:清華大學出版社,19943? Chung T Y,Jung K H,Young N O et al.Quantization Control for Improvem

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論