第5章限失真信源編碼

上傳人：7*** IP屬地：湖北上傳時間：2022-07-07 格式：PPT 頁數(shù)：43 大小：319.50KB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩38頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第5章限失真信源編碼1.信息率失真函數(shù)2.限失真信源編碼定理3.常用信源編碼方法第三章我們討論了無失真信源編碼。但是，在很多場合，特別是對于連續(xù)信源，因?yàn)槠浣^對熵為無限大，若要求無失真地對其進(jìn)行傳輸，則要求信道的信息傳輸率也為無限大，這是不現(xiàn)實(shí)的。因此也就不可能實(shí)現(xiàn)完全無失真?zhèn)鬏敗Ａ硪环矫?，從無失真信源編碼定理來考慮，由于要求碼字包含的信息量大于等于信源的熵，所以對于連續(xù)信源，要用無限多個比特才能完全無失真地來描述。即使對于離散信源，由于處理的信息量越來越大，使得信息的存儲和傳輸成本很高，而且在很多場合，過高的信息率也沒有必要，例如：由于人耳能夠接收的帶寬和分辨率是有限的，因此對數(shù)字音頻傳輸

2、的時候，就允許有一定的失真，并且對欣賞沒有影響。又如對于數(shù)字電視，由于人的視覺系統(tǒng)的分辨率有限，并且對低頻比較敏感，對高頻不太敏感，因此也可以損失部分高頻分量，當(dāng)然要在一定的限度內(nèi)。等等，這些，都決定了限失真信源編碼的重要性。在限失真信源編碼里，一個重要的問題就是在一定程度的允許失真限度內(nèi)，能把信源信息壓縮到什么程度，即最少用多少比特數(shù)才能描述信源。這個問題已經(jīng)被香農(nóng)解決。香農(nóng)在1948年的經(jīng)典論文中已經(jīng)提到了這個問題，在1959年，香農(nóng)又在他的一篇論文“保真度準(zhǔn)則下的離散信源編碼定理”里討論了這個問題。研究這個問題并做出較大貢獻(xiàn)的還有前蘇聯(lián)的柯爾莫郭洛夫（Kolmogorov）以及伯格（T.

3、 Berger）等。信息率失真理論矢量化、數(shù)摸轉(zhuǎn)換、頻帶壓縮和數(shù)據(jù)壓縮的理論基礎(chǔ)。本章主要介紹信息率失真理論的基本內(nèi)容，包括信源的失真度和信息率失真函數(shù)的定義與性質(zhì)，離散信源和連續(xù)信源的信息率失真函數(shù)計(jì)算，介紹一些常用的限失真編碼方法等。5.1 平均失真和信息率失真函數(shù)平均失真和信息率失真函數(shù)一、失真函數(shù)設(shè)某信源輸出的隨機(jī)變量為X，其值集合為，經(jīng)過編碼后輸出為，設(shè) 對應(yīng) ，如果則認(rèn)為沒有失真。當(dāng) 時，就產(chǎn)生了失真，失真的大小，用失真函數(shù)來衡量。失真函數(shù)的定義為,21nxxxX,21myyyYixjyjiyx mjni, 2 , 1;, 2 , 1jiyx 由于輸入符號有n個，輸出符號有m

4、個,所以共有個，寫成矩陣形式，就是d被稱為失真矩陣。jijijiyxyxaayxd00),(),(jiyxdmn),(),(),(),(1111mnnmyxdyxdyxdyxdd失真函數(shù) 的函數(shù)形式可以根據(jù)需要適當(dāng)選取，如平方代價函數(shù)、絕對代價函數(shù)、均勻代價函數(shù)等：平方失真：絕對失真：相對失真：誤碼失真：),(jiyxd2)(),(jijiyxyxdjijiyxyxd),(ijijixyxyxd/),(其它, 1, 0),(),(jijijiyxyxyxd 也可以按其它的標(biāo)準(zhǔn)，如引起的損失、風(fēng)險、主觀感覺上的差別等來定義失真函數(shù)。二、平均失真由于信源X和信宿Y都是隨機(jī)變量，所以符號失真度函

5、數(shù)也是一個隨機(jī)變量，傳輸時引起的平均失真應(yīng)該是符號失真度函數(shù) 在信源概率空間和信宿概率空間求平均，即),(jiyxdnimjjiijiYXnimjjijiyxdxypxpyxdyxpyxdyxpD11,11),()/()(,(),(),(),(）平均失真是符號失真函數(shù)在信源空間和信宿空間平均的結(jié)果，是描述某一信源在某一信道傳輸時失真的大小，是從整體上描述系統(tǒng)的失真情況。三、信源符號序列的失真從上面的單符號失真函數(shù)，可以得到信源符號序列的失真函數(shù)和平均失真度。由于序列時相當(dāng)于是一個由單符號隨機(jī)變量組成的隨機(jī)矢量，仿照單符號時的情況，可得：設(shè)信源輸出的符號序列為，其中的每一個隨機(jī)變量取自同一符

6、號集，所以X共有種不同的符號序列，記為，接收到的符號為式中每一個符號取自符號集，所以Y共有種不同的符號序列，記為，則 LkjkikjiLyxdd1),(),(,21rxxxix,L21xxxxixLrL21Y,Y,YY,21syyyiYLsij 失真函數(shù)矩陣應(yīng)該是一個的矩陣。故對L長的信源序列，其平均失真度為平均每個符號的平均失真度為當(dāng)信源無記憶時，，而LLsr LLrisjjijiYXdpyxdyxpLD11,),(),(),(),()()(1LDLD LkkDLD1)(LkkDLD11 若平均失真度不大于我們所允許的失真D，即我們稱此為保真度準(zhǔn)則。四、信息率失真函數(shù)

7、在信源給定，并且也定義了具體的失真函數(shù)之后，我們總是希望在滿足一定的失真限度要求的情況下，使信源最后輸出的信息率R盡可能地小。也就是說，要在滿足保真度準(zhǔn)則下( )，尋找信源輸出信息率R的下限值。如果將信源編碼也看成是一個信道，構(gòu)成了一類假想信道，DD DD 稱為D允許信道（或D失真許可的試驗(yàn)信道），記為對于離散無記憶信道，有我們的目的，就是要在上述允許信道中，尋找到一個信道P(Y/X)，使得從輸入端傳送過來的信息量最少，即I(X;Y)最小。這個最小的互信息就稱為信息率失真函數(shù)R(D)，簡稱為率失真函數(shù)，即: )/(DDxypPD, 2 , 1;, 2 , 1;: )/(mjniDDxyp

8、PijDDP 其單位是比特/信源符號。應(yīng)當(dāng)注意，在研究R(D)時，我們引用的條件概率并沒有實(shí)際信道的含義，只是為了求平均互信息的最小值而引用的、假想的可變試驗(yàn)信道。實(shí)際上這些信道反應(yīng)的僅是不同的有失真信源編碼，或稱信源壓縮。所以改變試驗(yàn)信道求最小值，實(shí)質(zhì)上是選擇一種編碼方式式信息傳輸率為最小，也就是在保真度準(zhǔn)則下，使信源的壓縮率最高。nimjjijijiPPPPypxypxypxpYXIDRDijDij11)(/(log)/()(min);(min)(）)/(xyp五、信息率失真函數(shù)的性質(zhì) 1. R(D)的定義域 R(D)的定義域，即D的取值范圍。（1）因?yàn)镈是非負(fù)函數(shù)d(x,y)的數(shù)學(xué)期望

9、，因此D也是非負(fù)函數(shù)，其下界為0。此時，意味著不允許失真，所以信道的信息率等于信源的熵，即)()0()(XHRDR（2）平均失真D也有一上界值。根據(jù)R(D)的定義，R(D)是在一定的約束條件下，平均互信息量I(X;Y)的最小值，其下界為0。R(D)和D的關(guān)系曲線一般如下圖所示。當(dāng)D大到一定程度，R(D)就達(dá)到其下界0，我們定義這時的D為。maxDmaxD 的計(jì)算：設(shè)當(dāng)平均失真時，R(D)以達(dá)到其下界0。當(dāng)允許更大失真時，即時，R(D)仍只能繼續(xù)是0。因?yàn)楫?dāng)X和Y統(tǒng)計(jì)獨(dú)立時，平均互信息I(X;Y)=0，可見當(dāng) 時，信源X和接收符號Y已經(jīng)統(tǒng)計(jì)獨(dú)立了，因此，與x無關(guān)。 maxDR(D)DR

10、(D)0R(D)=0maxDmaxDD maxDD maxDD )()/(ypxyp因此，就是在R(D)=0的條件下，看在什么樣的分布下，能夠得到的平均失真D的最小值，即也可以改寫成maxD)(ypYXypyxdypxpD,)(max),()()(minYypYXypydypyxdxpypD)()(min),()()(min)()(max也就是說，要求的數(shù)學(xué)期望的最小值。這個最小值是一定存在的。比如這樣分布：當(dāng)某一個使得為最小時，就取，而其余的，此時求得的的數(shù)學(xué)期望一定是最小的。此時，有)(yd)(yp)(jydjy1)(jypjiypi , 0)()(ydXYYyxdxpyd

11、D),()(min)(minmax求解：0110),(),(),(),(22122111yxdyxdyxdyxddmaxD3132,31min032131, 132031min),()(min),()(min)(min2, 12, 1212, 1maxjjijiijXYYyxdxpyxdxpydD例題1：設(shè)輸入輸出符號表為X=Y=0,1，輸入概率分布為，失真矩陣為3/2 , 3/1)(xp而輸出符號概率為. 1)(, 0)(21ypyp例題2：輸入輸出符號表同上題，失真矩陣為求解：12121),(),(),(),(22122111yxdyxdyxdyxddmaxD11 ,23min13213

12、1,2322131min),()(min2, 12, 1212, 1maxjjijiijyxdxpD. 1)(, 0)(21ypyp此時，（2）R(D)函數(shù)的單調(diào)遞減性和連續(xù)性R(D)的單調(diào)遞減性是很容易理解的。因?yàn)樵试S的失真越大，所要求的信息率就可以越小。根據(jù)R(D)的定義，他是在平均失真度小于或等于允許失真度D的所有試驗(yàn)信道集合中，取I(X;Y)的最小值。當(dāng)允許失真D擴(kuò)大，則的集合也擴(kuò)大，當(dāng)然仍然包含原來滿足條件的所有信道。這是在擴(kuò)大了的集合中找I(X;Y)的最小值，DPDPDP顯然或者是最小值不變，或者是變小了，所以R(D)是非增的。關(guān)于R(D)的連續(xù)性，這里我們就不再證明了。所以

13、，R(D)有如下基本性質(zhì)：，定義域?yàn)?，當(dāng) 時，R(D)=0。R(D)是關(guān)于D的連續(xù)函數(shù)。R(D)是關(guān)于D的嚴(yán)格遞減函數(shù)。0)(DRmax0DmaxDD 因此，當(dāng)規(guī)定了允許失真，又找到了適當(dāng)?shù)氖д婧瘮?shù) ，就可以找到該失真條件下的最小信息率R(D)，用不同的方法進(jìn)行數(shù)據(jù)壓縮時（在允許的失真限度D內(nèi)），其壓縮的程度如何，可以用R(D)來衡量。由它可知是否還有壓縮潛力，有多大的壓縮潛力。因此，有關(guān)R(D)的研究也是信息論領(lǐng)域的一個研究熱點(diǎn)。ijd5.2 R(D)的計(jì)算的計(jì)算已知信源的概率分布和失真函數(shù) ，就可以求得信源的R(D)函數(shù)。求R(D)函數(shù)，實(shí)際上是一個求有約束問題的最小值問題。即適當(dāng)選取

14、試驗(yàn)信道的使平均互信息最小化，并使滿足以下約束條件)/(xypmimjjijijiypxypxypxpYXI11)()/(log)/()();()/(xypijd 應(yīng)用拉格朗日乘子法，原則上總是可以求出上述問題的界。但一般來說，求解會是非常復(fù)雜的。這里不準(zhǔn)備做復(fù)雜的推導(dǎo)過程，只給出幾個結(jié)果。Dyxdxypxpnimjjiiji11),()/()(), 2 , 1;, 2 , 1( , 0)/(mjnixypij1)/(1mjijxyp ，（2）當(dāng) ，時，，（3）當(dāng) ，時，，DDRlog)(yxyxd),(xexp2)(DDR1log)(),(),(yxyxdpxppxp1) 1(,

15、) 0()()()(DHpHDR2maxD/1maxD2/112/1maxppppD（1）當(dāng) ，時，2)(),(yxyxd)2exp(21)(22xxp5.3 限失真信源編碼定理（香農(nóng)第三定理）限失真信源編碼定理（香農(nóng)第三定理）設(shè)R(D)為一離散無記憶平穩(wěn)信源的信息率失真函數(shù)，并且有有限的失真測度。則對于任意的和，當(dāng)信息率RR(D)時，一定存在一種編碼方法，其譯碼失真小于或等于，條件是編碼的信源序列長度L足夠長。反之，如果RR(D)，則無論采用什么編碼方法，其譯碼失真必大于D。定理說明，在允許失真為D的條件下，信源最小可達(dá)的信息傳輸率是信源的R(D)。0D0D保真度準(zhǔn)則下的信源編碼定

16、理（限失真信源編碼定理）是有失真信源壓縮的理論基礎(chǔ)。定理說明了在允許失真 D 確定后，總存在一種編碼方法，使編碼的信息傳輸率大于 R(D) 且可以任意接近R(D)，而平均失真度小于允許失真D。而當(dāng)信息傳輸率小于 R(D) 時，編碼的平均失真將大于 D?？梢姡琑(D) 是允許失真度為 D 的情況下信源信息壓縮的下限值。比較香農(nóng)第一定理和香農(nóng)第三定理可知，當(dāng)信源給定后，無失真信源壓縮的極限值是信源熵 H(X) ，而有失真信源壓縮的極限值是信息率失真函數(shù)R(D)。在給定D后，一般R(D)H(X)。R(D)可以作為衡量各種壓縮編碼方法性能優(yōu)劣的一種尺度。但香農(nóng)第三定理同樣是一個指出存在性的定理，至于如

17、何尋找這種最佳壓縮編碼方法，定理中沒有給出。在實(shí)際應(yīng)用中，該理論主要存在以下兩類問題：（1）符合實(shí)際信源的R(D)函數(shù)的計(jì)算相當(dāng)困難。首先，對需要對實(shí)際信源的統(tǒng)計(jì)特性有確切的數(shù)學(xué)描述，其次，需要符合主客觀實(shí)際的失真度量。這些都不是很容易的事情。即使有了這些，信息率失真函數(shù)的計(jì)算也是相當(dāng)困難的。（2）即使求得了符合實(shí)際的信息率失真函數(shù)，還需要研究采用何種編碼方法，才能達(dá)到或接近極限值R(D)。5.6常用信源編碼方法簡介常用信源編碼方法簡介 1. 游程編碼在二元序列中，只有“0”和“1”兩個碼元，我們把連續(xù)出現(xiàn)的“0”叫做“0”游程，連續(xù)出現(xiàn)的“1”叫做“1”游程。連續(xù)出現(xiàn)“0”或者“1”碼元

18、的個數(shù)叫做游程長度。這樣，一個二元序列可以轉(zhuǎn)換成游程序列，例如：二元序列0001100111100010可以變換成3224311，若規(guī)定游程必須從“0”游程開始，則上述變換是可逆的。如果連“0”或連“1”非常多，則可以達(dá)到信源壓縮的目的。游程編碼是無失真信源編碼。2. 矢量量化連續(xù)信源進(jìn)行編碼的主要方法是量化，即將連續(xù)的樣值離散化成為。n是量化級數(shù)，這樣就把連續(xù)值轉(zhuǎn)化為n個實(shí)數(shù)中的一個，可以用0，1，2，n等n個數(shù)字來表示。由于是一個標(biāo)量，因此稱為標(biāo)量量化標(biāo)量量化。在量化的過程中，將會引入失真，量化是必須使這些失真最小。要想得到更好的性能，僅采用標(biāo)量量化是不可xniyi, 2 , 1

19、，x 能的。從前面的討論我們已經(jīng)知道，把多個信源符號組成一個符號序列進(jìn)行聯(lián)合編碼可以提高編碼效率。連續(xù)信源也是如此，當(dāng)把多個信源符號聯(lián)合起來形成多維矢量，然后進(jìn)行量化，可以進(jìn)一步壓縮碼率，這種量化方法叫做矢量矢量量化量化。實(shí)驗(yàn)證明，即使各信源符號相互獨(dú)立，矢量量化也可以壓縮信息率，因此，人們對矢量量化非常感興趣，是當(dāng)前信源編碼的一個熱點(diǎn)，而且不僅限于連續(xù)信源，對離散信源也可以如此。如圖像編碼時采用矢量量化，但由于聯(lián)合概率密度不易測定，目前常用的是訓(xùn)練序列的方法，如圖像編碼時就要采用訓(xùn)練序列的方法，找到其碼書，進(jìn)行量化。還可以與神經(jīng)網(wǎng)絡(luò)方法結(jié)合，利用神經(jīng)網(wǎng)絡(luò)的自組織來得到訓(xùn)練集。 3. 預(yù)測

20、編碼預(yù)測就是從已收到的符號來提取關(guān)于末收到的符號的信息，從而預(yù)測其最可能的制作為預(yù)測值。并把它與實(shí)際值之差進(jìn)行編碼，由于這個差值一般都比較小，所以在編碼時會出現(xiàn)很多連“0”值，再采用游程編碼，就可以大大地壓縮碼率。由此可見，預(yù)測編碼是利用信源符號之間的相關(guān)性來壓縮碼率的，對于獨(dú)立信源，預(yù)測就沒有可能。 4. 變換編碼變換是一個廣泛的概念。變換編碼就是經(jīng)變換后的信號能更有效地編碼，也就是通過變換來解除或減弱信源符號間的相關(guān)性，以達(dá)到壓縮碼率的效果（如單頻率正弦波信號，變換到頻域）。一般地，對一個函數(shù) ，變換式為：而反變換為：)(tf0),()(iitiatfTidttitfa0),()

21、( 要使上式成立，要求必須是正交完備的（相當(dāng)于歐氏空間的坐標(biāo)投影），求的公式，實(shí)際上就是內(nèi)積運(yùn)算，把函數(shù) 投影到上去。信源編碼常用的變換有：DCT（discrete Cosine Transform）變換：如JPEG、MPEG等圖像壓縮標(biāo)準(zhǔn)中，就是主要采用的這種變換壓縮方法。K-L變換：K-L變換是均方誤差準(zhǔn)則下的最佳變換。),( tiia)(tf),( ti 它是一種正交變換，變幻后的隨機(jī)變量之間互不相關(guān)，一般認(rèn)為，K-L變換是最佳變換，其最大缺點(diǎn)是計(jì)算復(fù)雜，除了需要測定相關(guān)函數(shù)和解積分方程外，變換時的運(yùn)算也十分復(fù)雜，也沒有快速算法，因此，K-L變換不是一種實(shí)用的變換編碼方法，但經(jīng)常用來作為標(biāo)準(zhǔn)，評估其他方法的優(yōu)劣。小波（Wavelet Transform）

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第5章限失真信源編碼

文檔簡介

溫馨提示

最新文檔

評論

第5章 限失真信源編碼

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第5章限失真信源編碼