數(shù)據(jù)壓縮預測編碼_第1頁
數(shù)據(jù)壓縮預測編碼_第2頁
數(shù)據(jù)壓縮預測編碼_第3頁
數(shù)據(jù)壓縮預測編碼_第4頁
數(shù)據(jù)壓縮預測編碼_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第5章預測編碼

具有M種取值的符號序列,第L符號的熵滿足:預測

1第5章預測編碼

5.1DPCM基本原理工作過程:1)先發(fā)送

2)在基礎上進行預測,得到預測值;3)差分,量化和編碼4)重復一樣的過程,預測器必須相同

25.2最佳線性預測非時變線性預測:預測誤差:一、MMSE線性預測預測誤差的均方值MSE最小的必要條件35.2最佳線性預測定義自相關函數(shù)得到由于自相關函數(shù)滿足當廣義平穩(wěn)時有45.2最佳線性預測得到實對稱的Toeplitz矩陣,正定,可逆。如果各態(tài)歷經(jīng)的且N足夠大由上述方法求出的最佳預測系數(shù)得到的最小均方誤差55.2最佳線性預測二、預測階數(shù)的選擇當N

足夠大使預測誤差不相關再增大N不會使均方誤差在減小。若為N

階馬爾克夫過程,則用N階預測。例5-2設為一階馬爾克夫序列,其相關系數(shù)求解的公式若N=1,則65.2最佳線性預測誤差:有若加大N=2,與N=1時的預測表達式完全相等。75.3音頻信號與聽覺感知人耳可聽到的聲音頻率范圍:20Hz~20KHz一、語音信號的時域冗余度1、幅度非均勻分布2、樣本間的相關性3、基音之間的相關性語音濁音(嗓音)清音(非嗓音)4、話音間隔5、長時自相關函數(shù)85.3音頻信號與聽覺感知二、語音信號的頻域冗余度1、非均勻的長時功率譜密度2、語音特有的短時功率譜密度95.3音頻信號與聽覺感知三、單音的聽覺感知人類聽覺系統(tǒng)(HAS,HumanAuditorySystem)帶通濾波器組,一系列帶寬遞增的帶通濾波器組成

可聞閾(聽覺閾):人耳剛能聽見的聲壓級疼痛閾:使人耳有痛感的聲壓級聽覺范圍:疼痛閾和可聞閾之差HAS表現(xiàn)特性(純音)1)響度:與頻率有關1kHz/10dB200Hz/30dB

2)頻率:可聞閾與頻率有關2~4kHZ低<40Hz或>16kHz高

3)相位:對相位感知不敏感105.3音頻信號與聽覺感知三、多音的掩蔽效應

掩蔽效應:一個聲音的存在會影響人耳對另一個聲音的聽覺能力。掩蔽閾:單音都有一個掩蔽閾其聲壓級越高,對其周圍頻率聲音的掩蔽效應越強。

115.4語音信號的預測編碼一、基于預測的語音壓縮技術

波形編碼:被編碼的語音信號與重建信號波形基本相同。

語聲編碼:重建信號聽起來與原始聲音基本一樣

混合編碼:綜合兩種方法。幾個階段:1)增量調(diào)制DM,Deltamodulation

125.4語音信號的預測編碼2)DPCM3)ADPCM預測器或量化器中引入自適應調(diào)節(jié)1986-1990ITU-T制定的語音編碼標準技術基礎4)LPC聲碼器:不傳送預測誤差,傳送參數(shù)波形編碼參數(shù)編碼135.4語音信號的預測編碼5)混合編碼RELP:殘差激勵線性預測CELP:碼激勵線性預測(1984提出)LD-CELP:低時延的碼激勵線性預測(G.728建議,1992)ACELP:代數(shù)碼激勵線性預測(G.723.1建議,1996)CS-ACELP:共軛結(jié)構(gòu)代數(shù)碼激勵線性預測(G.729建議,1996)145.5靜止圖像的預測編碼一、預測器設計

1、預測器一維預測:二維預測:三維預測:2、相關性的強弱3、階數(shù)選擇4、預測器實現(xiàn)5、系數(shù)確定155.5靜止圖像的預測編碼二、JPEG無損壓縮模式空間域無量化DPCM,Huffman或算術編碼165.5靜止圖像的預測編碼三、JPEG-LS壓縮標準近無損、無損壓縮標準,1998正式公布JPEG-LS編碼系統(tǒng)1)基于上下文的建模計算其鄰域點變化量判斷進入預測還是游程175.5靜止圖像的預測編碼2)預測自適應非線性預測

=3)常規(guī)模式的誤差編碼4)游程模式185.6視頻信號與視覺感知一、電視信號概述PAL25幀/s625行視頻帶寬6M

195.6視頻信號與視覺感知二、數(shù)字化格式CCIT601:對彩色電視信號的亮度和色差采樣編碼采樣頻率:13.5MHz(亮度)205.6視頻信號與視覺感知采樣頻率:13.5MHz(亮度)采樣定理行頻的整數(shù)倍兼容三種國際標準制式取樣結(jié)構(gòu):4:4:44:2:24:1:1數(shù)碼率:r=(13.5+6.75+6.75)*8=216Mb/sr=3*13.5*8=324Mb/s215.6視頻信號與視覺感知三、電視信號的冗余度空間冗余:時間冗余(幀間冗余):

幀間差值對相鄰兩幀圖像進行測試黑白圖像:幀間差值超過3的像素不到4%變化劇烈的彩色序列:亮度>6只有7.5%色度只有千分之7.5可視電話,電視會議225.6視頻信號與視覺感知四、人的視覺感知特性彩色電視信號的數(shù)碼率人類視覺系統(tǒng)(HVS,humanvisualsystem)1)亮度掩蔽特性:背景較明或較暗時,人眼對亮度分辨能力下降。2)空間掩蔽特性:隨著空間變化頻率的提高,人眼對亮度(灰度)分辨能力下降3)時間掩蔽特性:隨著時間變化頻率的提高,人眼對細節(jié)和亮度分辨能力下降235.7活動圖像的預測編碼一、幀間預測編碼1、發(fā)展2、編碼方法1)條件幀修補法2)運動補償預測電視圖像特點(可視電話、電視會議和電視等)背景區(qū):運動物體區(qū):暴露區(qū):245.7活動圖像的預測編碼3、運動補償預測組成1)圖像分割:把圖像分為靜止和運動兩部分.2)運動估值:估計物體的位移量,得到運動矢量.3)運動補償:用運動矢量補償物體的運動效果,再預測.4)編碼:幀間運動誤差和運動矢量.255.7活動圖像的預測編碼二、快匹配運動估值對當前幀的每一個子塊,在上一幀某一搜索范圍內(nèi)尋找最優(yōu)匹配,該子塊和最優(yōu)匹配塊之間的位移就是運動矢量。265.7活動圖像的預測編碼1)判斷準則歸一化互相關函數(shù)(NCCF)均方誤差(MSE)最小絕對差(MAD)275.7活動圖像的預測編碼2)搜索策略全局搜索法(FullSearchMethod,F(xiàn)S)二維對數(shù)搜索法(Two-DimensionalLogarithmic,TDL基本思想:從原點開始,以“十”字形分布的五個點構(gòu)成每次搜索的點群,通過快速搜索跟蹤最小塊誤差MAD點。Step1:從原點開始,選取一定的步長,以十字形分布的五個點處進行MAD值的計算并比較。Step2:若MBD點在邊緣四個點處,則以該點為中心點,保持步長不變,重新搜索十字形分布的五個點;若MBD點位于中心點,則保持中心點位置不變,將十字點群的步長減半,并在五個點處計算。Step3:若步長為1,在中心及周圍8個點處找出MBD點,該點所在位置即對應最佳匹配點,算法結(jié)束;否則重復Step2。285.7活動圖像的預測編碼[0,-4]、[+4,-4]、[+6,-4]是每個搜索階段的最小塊誤差點若[+5,-4]是8個點中的最小MBD,則運動矢量為[+5,-4],295.7活動圖像的預測編碼2)搜索策略三步搜索法(ThreeStepSearch,TSS)四步搜索法(FourStepSearch,F(xiàn)SS)基于塊的梯度下降搜索法(Block-BasedGradientDescentSearch,BBGDS)菱形搜索法(DiamondSearch)基本思想:兩種搜索模板,5個檢測點的小模板SDSM和9個檢測點的大模板LDSM。搜索時先用大模板計算,當最小塊誤差MAD點出現(xiàn)在中心點處時,將大模板LDSM換為SDSM,再進行匹配計算,這時5個點中的MAD即為最優(yōu)匹配點。305.7活動圖像的預測編碼菱形搜索法SDSMLDSM315.7活動圖像的預測編碼3)塊的劃分H261,MPEG1,216*16H26316*16高級預測模式4個8*8H2647種模式325.8高光譜遙感圖像的預測編碼對同一對象(區(qū)域或目標)在多個窄光譜波段范圍上獲得的圖像。一、特點1)三維空間冗余譜間冗余2)豐富紋理信息,空間相關性較弱各波段的成像對象是同一地物,在結(jié)構(gòu)上具有相似性3)預測、變換和矢量量化等方法去除兩種冗余4)無損壓縮、近無損壓縮。二、DPCM預測335.8高光譜遙感圖像的預測編碼三、最小絕對權(quán)值(MAW)預測樹方法1、原理把一幅圖像看作一個加權(quán)圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論