第5章 限失真信源編碼_第1頁
第5章 限失真信源編碼_第2頁
第5章 限失真信源編碼_第3頁
第5章 限失真信源編碼_第4頁
第5章 限失真信源編碼_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第5章 限失真信源編碼1.信息率失真函數(shù)2.限失真信源編碼定理3.常用信源編碼方法第三章我們討論了無失真信源編碼。但是,在很多場合,特別是對于連續(xù)信源,因為其絕對熵為無限大,若要求無失真地對其進(jìn)行傳輸,則要求信道的信息傳輸率也為無限大,這是不現(xiàn)實的。因此也就不可能實現(xiàn)完全無失真?zhèn)鬏敗A硪环矫?,從無失真信源編碼定理來考慮,由于要求碼字包含的信息量大于等于信源的熵,所以對于連續(xù)信源,要用無限多個比特才能完全無失真地來描述。即使對于離散信源,由于處理的信息量越來越大,使得信息的存儲和傳輸成本很高,而且在很多場合,過高的信息率也沒有必要,例如:由于人耳能夠接收的帶寬和分辨率是有限的,因此對數(shù)字音頻傳輸

2、的時候,就允許有一定的失真,并且對欣賞沒有影響。又如對于數(shù)字電視,由于人的視覺系統(tǒng)的分辨率有限,并且對低頻比較敏感,對高頻不太敏感,因此也可以損失部分高頻分量,當(dāng)然要在一定的限度內(nèi)。等等,這些,都決定了限失真信源編碼的重要性。在限失真信源編碼里,一個重要的問題就是在一定程度的允許失真限度內(nèi),能把信源信息壓縮到什么程度,即最少用多少比特數(shù)才能描述信源。這個問題已經(jīng)被香農(nóng)解決。香農(nóng)在1948年的經(jīng)典論文中已經(jīng)提到了這個問題,在1959年,香農(nóng)又在他的一篇論文“保真度準(zhǔn)則下的離散信源編碼定理”里討論了這個問題。研究這個問題并做出較大貢獻(xiàn)的還有前蘇聯(lián)的柯爾莫郭洛夫(Kolmogorov)以及伯格(T.

3、 Berger)等。信息率失真理論矢量化、數(shù)摸轉(zhuǎn)換、頻帶壓縮和數(shù)據(jù)壓縮的理論基礎(chǔ)。本章主要介紹信息率失真理論的基本內(nèi)容,包括信源的失真度和信息率失真函數(shù)的定義與性質(zhì),離散信源和連續(xù)信源的信息率失真函數(shù)計算,介紹一些常用的限失真編碼方法等。5.1 平均失真和信息率失真函數(shù)平均失真和信息率失真函數(shù)一、失真函數(shù)設(shè)某信源輸出的隨機(jī)變量為X,其值集合為 ,經(jīng)過編碼后輸出為 ,設(shè) 對應(yīng) ,如果 則認(rèn)為沒有失真。當(dāng) 時,就產(chǎn)生了失真,失真的大小,用失真函數(shù)來衡量。失真函數(shù)的定義為,21nxxxX,21myyyYixjyjiyx mjni, 2 , 1;, 2 , 1jiyx 由于輸入符號有n個,輸出符號有m

4、個,所以共有 個,寫成矩陣形式,就是d被稱為失真矩陣。jijijiyxyxaayxd00),(),(jiyxdmn),(),(),(),(1111mnnmyxdyxdyxdyxdd失真函數(shù) 的函數(shù)形式可以根據(jù)需要適當(dāng)選取,如平方代價函數(shù)、絕對代價函數(shù)、均勻代價函數(shù)等:平方失真:絕對失真:相對失真:誤碼失真:),(jiyxd2)(),(jijiyxyxdjijiyxyxd),(ijijixyxyxd/),(其它, 1, 0),(),(jijijiyxyxyxd 也可以按其它的標(biāo)準(zhǔn),如引起的損失、風(fēng)險、主觀感覺上的差別等來定義失真函數(shù)。二、平均失真 由于信源X和信宿Y都是隨機(jī)變量,所以符號失真度函

5、數(shù)也是一個隨機(jī)變量,傳輸時引起的平均失真應(yīng)該是符號失真度函數(shù) 在信源概率空間和信宿概率空間求平均,即),(jiyxdnimjjiijiYXnimjjijiyxdxypxpyxdyxpyxdyxpD11,11),()/()(,(),(),(),()平均失真是符號失真函數(shù)在信源空間和信宿空間平均的結(jié)果,是描述某一信源在某一信道傳輸時失真的大小,是從整體上描述系統(tǒng)的失真情況。三、信源符號序列的失真從上面的單符號失真函數(shù),可以得到信源符號序列的失真函數(shù)和平均失真度。由于序列時相當(dāng)于是一個由單符號隨機(jī)變量組成的隨機(jī)矢量,仿照單符號時的情況,可得:設(shè)信源輸出的符號序列為 ,其中的每一個隨機(jī)變量 取自同一符

6、號集 ,所以X共有 種不同的符號序列,記為 ,接收到的符號為 式中每一個符號取自符號集 ,所以Y共有 種不同的符號序列,記為 ,則 LkjkikjiLyxdd1),(),(,21rxxxix,L21xxxxixLrL21Y,Y,YY,21syyyiYLsij 失真函數(shù)矩陣應(yīng)該是一個 的矩陣。故對L長的信源序列,其平均失真度為 平均每個符號的平均失真度為當(dāng)信源無記憶時, ,而LLsr LLrisjjijiYXdpyxdyxpLD11,),(),(),(),()()(1LDLD LkkDLD1)(LkkDLD11 若平均失真度不大于我們所允許的失真D,即 我們稱此為保真度準(zhǔn)則。四、信息率失真函數(shù)

7、在信源給定,并且也定義了具體的失真函數(shù)之后,我們總是希望在滿足一定的失真限度要求的情況下,使信源最后輸出的信息率R盡可能地小。也就是說,要在滿足保真度準(zhǔn)則下( ),尋找信源輸出信息率R的下限值。如果將信源編碼也看成是一個信道,構(gòu)成了一類假想信道,DD DD 稱為D允許信道(或D失真許可的試驗信道),記為 對于離散無記憶信道,有 我們的目的,就是要在上述允許信道 中,尋找到一個信道P(Y/X),使得從輸入端傳送過來的信息量最少,即I(X;Y)最小。這個最小的互信息就稱為信息率失真函數(shù)R(D),簡稱為率失真函數(shù),即: )/(DDxypPD, 2 , 1;, 2 , 1;: )/(mjniDDxyp

8、PijDDP 其單位是比特/信源符號。應(yīng)當(dāng)注意,在研究R(D)時,我們引用的條件概率 并沒有實際信道的含義,只是為了求平均互信息的最小值而引用的、假想的可變試驗信道。實際上這些信道反應(yīng)的僅是不同的有失真信源編碼,或稱信源壓縮。所以改變試驗信道求最小值,實質(zhì)上是選擇一種編碼方式式信息傳輸率為最小,也就是在保真度準(zhǔn)則下,使信源的壓縮率最高。nimjjijijiPPPPypxypxypxpYXIDRDijDij11)(/(log)/()(min);(min)())/(xyp五、信息率失真函數(shù)的性質(zhì) 1. R(D)的定義域 R(D)的定義域,即D的取值范圍。(1)因為D是非負(fù)函數(shù)d(x,y)的數(shù)學(xué)期望

9、,因此D也是非負(fù)函數(shù),其下界為0。此時,意味著不允許失真,所以信道的信息率等于信源的熵,即)()0()(XHRDR(2)平均失真D也有一上界值 。根據(jù)R(D)的定義,R(D)是在一定的約束條件下,平均互信息量I(X;Y)的最小值,其下界為0。R(D)和D的關(guān)系曲線一般如下圖所示。當(dāng)D大到一定程度,R(D)就達(dá)到其下界0,我們定義這時的D為 。maxDmaxD 的計算:設(shè)當(dāng)平均失真 時,R(D)以達(dá)到其下界0。當(dāng)允許更大失真時,即 時,R(D)仍只能繼續(xù)是0。因為當(dāng)X和Y統(tǒng)計獨(dú)立時,平均互信息I(X;Y)=0,可見當(dāng) 時,信源X和接收符號Y已經(jīng)統(tǒng)計獨(dú)立了,因此 ,與x無關(guān)。 maxDR(D)DR

10、(D)0R(D)=0maxDmaxDD maxDD maxDD )()/(ypxyp因此, 就是在R(D)=0的條件下,看在什么樣的分布下,能夠得到的平均失真D的最小值,即也可以改寫成maxD)(ypYXypyxdypxpD,)(max),()()(minYypYXypydypyxdxpypD)()(min),()()(min)()(max也就是說,要求 的數(shù)學(xué)期望的最小值。這個最小值是一定存在的。比如 這樣分布:當(dāng)某一個 使得 為最小時,就取 ,而其余的 ,此時求得的 的數(shù)學(xué)期望一定是最小的。此時,有)(yd)(yp)(jydjy1)(jypjiypi , 0)()(ydXYYyxdxpyd

11、D),()(min)(minmax求解:0110),(),(),(),(22122111yxdyxdyxdyxddmaxD3132,31min032131, 132031min),()(min),()(min)(min2, 12, 1212, 1maxjjijiijXYYyxdxpyxdxpydD例題1:設(shè)輸入輸出符號表為X=Y=0,1,輸入概率分布為 ,失真矩陣為3/2 , 3/1)(xp而輸出符號概率為. 1)(, 0)(21ypyp例題2:輸入輸出符號表同上題,失真矩陣為求解:12121),(),(),(),(22122111yxdyxdyxdyxddmaxD11 ,23min13213

12、1,2322131min),()(min2, 12, 1212, 1maxjjijiijyxdxpD. 1)(, 0)(21ypyp此時,(2)R(D)函數(shù)的單調(diào)遞減性和連續(xù)性R(D)的單調(diào)遞減性是很容易理解的。因為允許的失真越大,所要求的信息率就可以越小。根據(jù)R(D)的定義,他是在平均失真度小于或等于允許失真度D的所有試驗信道集合 中,取I(X;Y)的最小值。當(dāng)允許失真D擴(kuò)大,則 的集合也擴(kuò)大,當(dāng)然仍然包含原來滿足條件的所有信道。這是在擴(kuò)大了的 集合中找I(X;Y)的最小值,DPDPDP顯然或者是最小值不變,或者是變小了,所以R(D)是非增的。關(guān)于R(D)的連續(xù)性,這里我們就不再證明了。所以

13、,R(D)有如下基本性質(zhì): ,定義域為 ,當(dāng) 時,R(D)=0。R(D)是關(guān)于D的連續(xù)函數(shù)。R(D)是關(guān)于D的嚴(yán)格遞減函數(shù)。0)(DRmax0DmaxDD 因此,當(dāng)規(guī)定了允許失真,又找到了適當(dāng)?shù)氖д婧瘮?shù) ,就可以找到該失真條件下的最小信息率R(D),用不同的方法進(jìn)行數(shù)據(jù)壓縮時(在允許的失真限度D內(nèi)),其壓縮的程度如何,可以用R(D)來衡量。由它可知是否還有壓縮潛力,有多大的壓縮潛力。因此,有關(guān)R(D)的研究也是信息論領(lǐng)域的一個研究熱點。ijd5.2 R(D)的計算的計算已知信源的概率分布和失真函數(shù) ,就可以求得信源的R(D)函數(shù)。求R(D)函數(shù),實際上是一個求有約束問題的最小值問題。即適當(dāng)選取

14、試驗信道的 使平均互信息最小化,并使 滿足以下約束條件)/(xypmimjjijijiypxypxypxpYXI11)()/(log)/()();()/(xypijd 應(yīng)用拉格朗日乘子法,原則上總是可以求出上述問題的界。但一般來說,求解會是非常復(fù)雜的。這里不準(zhǔn)備做復(fù)雜的推導(dǎo)過程,只給出幾個結(jié)果。Dyxdxypxpnimjjiiji11),()/()(), 2 , 1;, 2 , 1( , 0)/(mjnixypij1)/(1mjijxyp ,(2)當(dāng) , 時, ,(3)當(dāng) , 時, ,DDRlog)(yxyxd),(xexp2)(DDR1log)(),(),(yxyxdpxppxp1) 1(,

15、) 0()()()(DHpHDR2maxD/1maxD2/112/1maxppppD(1)當(dāng) , 時,2)(),(yxyxd)2exp(21)(22xxp5.3 限失真信源編碼定理(香農(nóng)第三定理)限失真信源編碼定理(香農(nóng)第三定理)設(shè)R(D)為一離散無記憶平穩(wěn)信源的信息率失真函數(shù),并且有有限的失真測度。則對于任意的 和 ,當(dāng)信息率RR(D)時,一定存在一種編碼方法,其譯碼失真小于或等于 ,條件是編碼的信源序列長度L足夠長。反之,如果RR(D),則無論采用什么編碼方法,其譯碼失真必大于D。 定理說明,在允許失真為D的條件下,信源最小可達(dá)的信息傳輸率是信源的R(D)。0D0D保真度準(zhǔn)則下的信源編碼定

16、理(限失真信源編碼定理)是有失真信源壓縮的理論基礎(chǔ)。定理說明了在允許失真 D 確定后,總存在一種編碼方法,使編碼的信息傳輸率大于 R(D) 且可以任意接近R(D),而平均失真度小于允許失真D。而當(dāng)信息傳輸率小于 R(D) 時,編碼的平均失真將大于 D??梢?,R(D) 是允許失真度為 D 的情況下信源信息壓縮的下限值。比較香農(nóng)第一定理和香農(nóng)第三定理可知,當(dāng)信源給定后,無失真信源壓縮的極限值是信源熵 H(X) ,而有失真信源壓縮的極限值是信息率失真函數(shù)R(D)。在給定D后,一般R(D)H(X)。R(D)可以作為衡量各種壓縮編碼方法性能優(yōu)劣的一種尺度。但香農(nóng)第三定理同樣是一個指出存在性的定理,至于如

17、何尋找這種最佳壓縮編碼方法,定理中沒有給出。在實際應(yīng)用中,該理論主要存在以下兩類問題: (1)符合實際信源的R(D)函數(shù)的計算相當(dāng)困難。首先,對需要對實際信源的統(tǒng)計特性有確切的數(shù)學(xué)描述,其次,需要符合主客觀實際的失真度量。這些都不是很容易的事情。即使有了這些,信息率失真函數(shù)的計算也是相當(dāng)困難的。(2)即使求得了符合實際的信息率失真函數(shù),還需要研究采用何種編碼方法,才能達(dá)到或接近極限值R(D)。5.6常用信源編碼方法簡介常用信源編碼方法簡介 1. 游程編碼 在二元序列中,只有“0”和“1”兩個碼元,我們把連續(xù)出現(xiàn)的“0”叫做“0”游程,連續(xù)出現(xiàn)的“1”叫做“1”游程。連續(xù)出現(xiàn)“0”或者“1”碼元

18、的個數(shù)叫做游程長度。這樣,一個二元序列可以轉(zhuǎn)換成游程序列,例如:二元序列0001100111100010可以變換成3224311,若規(guī)定游程必須從“0”游程開始,則上述變換是可逆的。如果連“0”或連“1”非常多,則可以達(dá)到信源壓縮的目的。游程編碼是無失真信源編碼。2. 矢量量化 連續(xù)信源進(jìn)行編碼的主要方法是量化,即將連續(xù)的樣值 離散化成為 。n是量化級數(shù),這樣就把連續(xù)值轉(zhuǎn)化為n個實數(shù)中的一個,可以用0,1,2,n等n個數(shù)字來表示。由于 是一個標(biāo)量,因此稱為標(biāo)量量化標(biāo)量量化。在量化的過程中,將會引入失真,量化是必須使這些失真最小。 要想得到更好的性能,僅采用標(biāo)量量化是不可xniyi, 2 , 1

19、,x 能的。從前面的討論我們已經(jīng)知道,把多個信源符號組成一個符號序列進(jìn)行聯(lián)合編碼可以提高編碼效率。連續(xù)信源也是如此,當(dāng)把多個信源符號聯(lián)合起來形成多維矢量,然后進(jìn)行量化,可以進(jìn)一步壓縮碼率,這種量化方法叫做矢量矢量量化量化。 實驗證明,即使各信源符號相互獨(dú)立,矢量量化也可以壓縮信息率,因此,人們對矢量量化非常感興趣,是當(dāng)前信源編碼的一個熱點,而 且不僅限于連續(xù)信源,對離散信源也可以如此。如圖像編碼時采用矢量量化,但由于聯(lián)合概率密度不易測定,目前常用的是訓(xùn)練序列的方法,如圖像編碼時就要采用訓(xùn)練序列的方法,找到其碼書,進(jìn)行量化。還可以與神經(jīng)網(wǎng)絡(luò)方法結(jié)合,利用神經(jīng)網(wǎng)絡(luò)的自組織來得到訓(xùn)練集。 3. 預(yù)測

20、編碼 預(yù)測就是從已收到的符號來提取關(guān)于末收到的符號的信息,從而預(yù)測其最可能的制作為預(yù)測值。并把它與實際值之差進(jìn)行編碼,由于這個 差值一般都比較小,所以在編碼時會出現(xiàn)很多連“0”值,再采用游程編碼,就可以大大地壓縮碼率。由此可見,預(yù)測編碼是利用信源符號之間的相關(guān)性來壓縮碼率的,對于獨(dú)立信源,預(yù)測就沒有可能。 4. 變換編碼 變換是一個廣泛的概念。變換編碼就是經(jīng)變換后的信號能更有效地編碼,也就是通過變換來 解除或減弱信源符號間的相關(guān)性,以達(dá)到壓縮碼率的效果(如單頻率正弦波信號,變換到頻域)。一般地,對一個函數(shù) ,變換式為: 而反變換為:)(tf0),()(iitiatfTidttitfa0),()

21、( 要使上式成立,要求 必須是正交完備的(相當(dāng)于歐氏空間的坐標(biāo)投影),求 的公式,實際上就是內(nèi)積運(yùn)算,把函數(shù) 投影到 上去。 信源編碼常用的變換有:DCT(discrete Cosine Transform)變換:如JPEG、MPEG等圖像壓縮標(biāo)準(zhǔn)中,就是主要采用的這種變換壓縮方法。K-L變換:K-L變換是均方誤差準(zhǔn)則下的最佳變換。),( tiia)(tf),( ti 它是一種正交變換,變幻后的隨機(jī)變量之間互不相關(guān),一般認(rèn)為,K-L變換是最佳變換,其最大缺點是計算復(fù)雜,除了需要測定相關(guān)函數(shù)和解積分方程外,變換時的運(yùn)算也十分復(fù)雜,也沒有快速算法,因此,K-L變換不是一種實用的變換編碼方法,但經(jīng)常用來作為標(biāo)準(zhǔn),評估其他方法的優(yōu)劣。小波(Wavelet Transform)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論