




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
信息論與編碼李軒、李玉峰編著第2章單符號離散信源第2章單符號離散信源最簡通信系統(tǒng)由信源、信道和信宿三部分構成。離散信源可用離散隨機矢量來描述,其中每個隨機變量都是取值離散的。當隨機矢量只含一個離散隨機變量時,這種信源就稱為單符號離散信源。2.1單符號離散信源的數學模型信源的信息熵2.3信源符號的自信息量2.22.4信息熵的性質第2章單符號離散信源2.1單符號離散信源的數學模型如果信源X符號集為,r為符號集大小,信源符號對應某一概率分布,,稱此信源為單符號離散信源,信源空間數學模型可由下式描述其中,,【例2.1】一個三元無記憶信源X,符號集A={0,1,2},概率分布為:p(0)=1/2,p(1)=1/3,p(2)=1/6,寫出信源空間模型。解:信源空間模型如下式所示:【例2.2】某箱子中共有32個質地均勻的球,其中,紅球16個,黃球8個,藍球和白球各4個。每次拿出一個球,拿出后又放回,各種彩球出現(xiàn)的先驗概率分別為:2.1單符號離散信源的數學模型P(紅)=16/32=1/2P(黃)=8/32=1/4P(藍)=4/32=1/8P(白)=4/32=1/8
用隨機變量X表示這個信源,其信源空間為:由上述兩個例子看出:信源空間包含兩個基本要素:隨機變量X的狀態(tài)空間和概率空間,而概率空間又是決定性要素。概率可測是香農信息論的基本前提。2.2信源符號的自信息量設信源發(fā)出某符號,由于信道中存在噪聲或其它干擾,收端收到的是的某種變型,收信者收到后,從中獲取關于的信息量,用表示,則若信道是無噪無損信道,即一一對應信道,收信者收到就是本身,那么就完全消除了對信源符號的不確定性,即把定義為信源符號的自信息量,并用表示,即信源符號的自信息量度量問題,相當于信源發(fā)符號的不確定性度量問題,是先驗概率的函數:根據自信息量定義所需的4個公理性條件,自信息量函數定義如下:自信息量隨變化的曲線自信息量的單位與對數的底有關若以“2”為底,自信息量單位為“比特”(bit-binaryunit),即若以“e”為底,自信息量單位為“奈特”(nat-natureunit),即若以“10”為底,自信息量單位為“哈特”(Hart-Hartley),即2.2信源符號的自信息量
2.2信源符號的自信息量若以正整數“r”為底,自信息量單位為“r進制信息單位”,即不同信息單位之間可以進行換算。本書如不加說明,信息度量默認為以“2”為底,且略去底數“2”不寫。香農信息量的度量,是信息論發(fā)展史上的里程碑,奠定了信息論發(fā)展成為一門學科的基礎?!纠?.3】箱中80個紅球,20個白球,現(xiàn)從箱中隨機取出兩個球。求:(1)求解“兩個球中紅、白各一個”的不確定性(2)求解“兩個球都是白球”所提供的信息量(3)求解“兩個球都是白球”和“兩個球都是紅球”相比較,哪個事件發(fā)生的更難測?2.2信源符號的自信息量
解:設x為紅球數,y為白球數,則:
從上述計算結果來看,1.416bit大于0.195bit,顯然,事件“兩個球都是白球”要比事件“兩個球都是紅球”更難測?!纠?.4】設二元隨機矢量,矢量中每個變量(i=1,2,...,N)為獨立同分布隨機變量,且0符號的概率。求序列x=101100100的自信息量。解:2.3信源的信息熵自信息量是針對具體的特定事件在發(fā)生前存在的不確定度的度量,或發(fā)生后,提供給接收者的信息量。自信量的度量具有個體差異性,不具備對信源總體不確定度的度量能力。對信源X總體進行信息度量,即信源熵,它表征信源平均每個符號所含有的不確定性或平均輸出一個符號提供給觀測者的信息量,是自信息量的統(tǒng)計均值,即有熵的單位即自信息量的單位,取決于對數的底?!纠?.5】(a)設有一信源X由兩個事件,組成,其概率空間如下則其信源熵為(b)設有另一信源Y如下則2.3信源的信息熵可見有,即信源Y的平均不確定性要大于信源X的平均不確定性。直觀地分析也易得出這樣一個結論:信源中各事件的出現(xiàn)概率越接近,則事先猜測某一事件發(fā)生的把握性越小,即不確定性越大。從后述信息熵的極值性質,我們可知:當信源各事件等概率出現(xiàn)時具有最大的信源熵,也即信源的平均不確定性最大?!纠?.6】設二元信源X的信源空間為其中,(1)試計算當p=1/2;p=0(或p=1)時信息熵的值;(2)信息熵是概率分量p的函數。畫出的函數曲線,并指明函數的特性。解:信源X的信息熵這表明,二元信源X的信息熵H(X)是概率分量p的函數。(1)當p=(1-p)=1/2時,二元信源X稱為二維等概信源,其信息熵2.3信源的信息熵這表明,二元等概信源X,每一個符號(不論是“0”還是“1”)含有的平均信息量是1比特,每發(fā)一個符號(不論是“0”還是“1”)提供的平均信息量是1比特;每一個符號(不論是“0”還是“1”)存在的平均不確定性是1比特;收信者能確切無誤的收到信源X的“0”或“1”時,收信者每收到信源X的一個符號,獲取的平均信息量是1比特。(2)當p=0(p=1)時,二元信源X是一個確知信源,其信息熵因為,對任意小的正數,以“e”為底的對數可展開成級數當時,的極限值等于零,即有所以2.3信源的信息熵這樣,可合理的約定0log0=0則當p=0(p=1)時,信源X的信息熵這表明,以概率1發(fā)符號“0”或“1”的二元確知信源,不存在任何不確定性,不含有任何信息量。(3)當0<p<1時,取不同的p值,可計算出二元信源X的信息熵相應地,得到H(p)函數曲線2.3信源的信息熵從圖中可見,若二元信源X發(fā)符號“0”(或“1”)是確定事件,即p=1(p=0)時,則H(p)=H(1)(或H(0))=0。這意味著確知信源X不提供任何信息量;若二元信源X以相同概率0.5發(fā)符號“0”或“1”,即p=1/2時,H(p)=1比特/信源符號。這意味著等概信源X每發(fā)一個符號提供的平均信息量達到最大值1比特/信源符號。若二元信源X發(fā)“0”(或“1”)的概率p(0<p<1)越接近1/2,則發(fā)“1”(或“0”)的概率(1-p)亦越接近1/2.若“0”和“1”的概率越接近則H(p)的值越大。這意味著二元信源X的平均不確定性越大,每符號(不論是“0”還是“1”)含有的平均信息量越大;相反,二元信源X發(fā)“0”(或“1”)的概率p(0<p<1)越遠離1/2,則發(fā)“1”(或“0”)的概率(1-p)亦越遠離1/2.若發(fā)“0”和“1”的概率相差越大,則H(p)的值就越小。這意味著二元信源X的平均不確定性越小,每符號(不論是“0”還是“1”)含有的平均信息量就越小。這體現(xiàn)出H(p)是概率分量p的上凸形函數的基本特性。2.3信源的信息熵【例2.7】在一個箱子中裝有m個黑球和(n-m)個白球。設實驗X:隨機的從箱子中取出一個球而不再放回箱子;實驗Y:從箱子中取出第二個球。(1)計算實驗X所獲取的平均信息量(2)若實驗X摸取的第一個球的顏色不知道,計算實驗Y所獲取的平均信息量。解:令W代表白球;B代表黑球。(1)設實驗X中取出的球是黑球的概率為PX(B);實驗X中取出的球是白球的概率為PX(W),則有信源X的信源空間可表示為
實驗X所獲取的平均信息量,就是信源X的信息熵(2)若實驗X中取出的第一個球是白球,令實驗Y中取出的白球的概率為PY(W/W);取出黑球的概率為PY(B/W),則有若實驗X中取出的第一個球是黑球,令實驗Y中取出白球的概率為PY(W/B);取出黑球的概率為PY(B/B),則有設實驗Y中出現(xiàn)白球的概率為PY(W);出現(xiàn)黑球的概率為PY(B),則有2.3信源的信息熵信源Y的信源空間可表示為實驗Y所獲取的平均信息量,就是信源Y的信息熵這說明,實驗X和實驗Y的平均不確定性或獲取的平均信息量是相等的。2.3信源的信息熵定義2.4.1
對于服從聯(lián)合分布為p(x,y)的一對離散隨機變量(X,Y),其聯(lián)合熵H(X,Y)(jointentropy)定義為
上式亦可表示為也可以定義一個隨機變量在給定另一隨機變量下的條件熵,先求條件分布熵H(Y|X=x);然后對條件分布熵再求統(tǒng)計均值既得條件熵。2.4.1聯(lián)合熵與條件熵2.4信息熵的性質定義2.4.2若,條件熵(conditionalentropy)定義為:
聯(lián)合熵和條件熵定義的這種自然性可由一個事實得到體現(xiàn),它就是一對隨機變量的熵等于其中一個隨機變量的熵加上另一個隨機變量的條件熵。其證明見如下定理。2.4信息熵的性質定理2.1(鏈式法則)【證明】
等價地記為:等式的兩邊同時取對數期望,即得本定理。
推論2.4信息熵的性質2.4.2相對熵若P和Q為定義在同一概率空間的兩個概率測度,定義P相對于Q的相對熵為相對熵又稱散度、鑒別信息、方向散度、交叉熵、Kullback_leibler距離等。注意,在上式中,概率分布的維數不限,可以是一維,也可以是多維,也可以是條件概率。
對于任意正實數x,下面不等式成立:(2.16)實際上,設,可求得函數的穩(wěn)定點為x=1,并可求得在該點的二階導數小于0,從而可得x=1為f(x)取極大值的點,即,僅當x=1時,上式(2.16)右邊等號成立。令y=1/x,可得,再將y換成x,就得到左邊的不等式。定理2.2如果在一個共同有限字母表概率空間上給定兩個概率測度P(x)和Q(x),那么(2.17)僅當對所有x,P(x)=Q(x)時,等式成立?!咀C明】因,,所以根據式(2.16),有
僅當對所有x,P(x)=Q(x)時,等式成立。式(2.17)稱為散度不等(divergenceinequality),該式說明,一個概率測度相對于另一個概率測度的散度是非負的,僅當兩測度相同時,散度為零。散度可以解釋為兩個概率測度之間的“距離”,即兩概率測度不同程度的度量。不過,散度并不是通常意義下的距離,因為它不滿足對稱性,也不滿足三角不等式?!纠?.8】設一個二元信源的符號集為{0,1},有兩個概率分布p和q,并且p(0)=1-r,p(1)=r,q(0)=1-s,q(1)=s,求散度D(p||q)和D(q||p),并分別求當r=s和r=2s=1/2時散度的值。解:當r=s時,有D(p||q)=D(q||p)=0當r=2s=1/2時,有2.4信息熵的性質2.4信息熵的性質定理2.3(熵的不增原理)
(2.19)【證明】設,那么
上面利用了散度不等式,僅當X,Y相互獨立時,等式成立。式(2.19)表明,條件熵總是不大于無條件熵,這就是熵的不增原理:在信息處理過程中,已知條件越多,結果的不確定性越小,也就是熵越小。
定義2.4.3若對于任意的及,滿足
則稱函數f(x)在區(qū)間上是凸的(convex)。如果僅當或,上式成立,則稱函數f是嚴格凸的(strictlyconvex)。定義2.4.4如果為凸函數,則稱函數是凹的。如果函數總是位于任何一條弦的下面,則該函數是凸的;如果函數總是位于任何一條弦的上面,則該函數是凹的。定理2.4(Jensen不等式)若給定凸函數和一個隨機變量X,則(2.21)進一步,若是嚴格凸的,那么式(2.21)中的等式蘊含X=EX的概率為1(即X是個常量)。2.4信息熵的性質
2.4.3Jensen不等式及其結果
【證明】我們只證明離散分布情形,且對分布點的個數進行歸納證明。當為嚴格凸函數時,等號成立條件的證明留給讀者。對于兩點分布,不等式變?yōu)?.4信息熵的性質
這由凸函數的定義可直接得到。假定當分布點的個數為k-1時,定理成立,此時記則有2.4.4信息熵的基本性質對稱性
概率矢量中,各分量的次序任意改變,熵不變,即
(2.24)其中,是1,2,,n的任何一種n級排列。該性質說明熵僅與隨機變量總體概率特性(即概率分布)有關,而與隨機變量的取值及符號排列順序無關。非負性
(2.25)
僅當對某個時,等式成立。
因為自信息量是非負的,熵為自信息的平均,所以也是非負的。不過,非負性僅對離散熵有效,而對連續(xù)熵來說這一性質并不成立。2.4信息熵的性質確定性這就是說,當隨機變量集合中任一事件概率為1時,熵就為0。這個性質意味著,從總體來看,事件集合中雖含有許多事件,但是如果只有一個事件幾乎必然出現(xiàn),而其他事件幾乎都不出現(xiàn),那么,這就是一個確知的變量,其不確定性為0.擴展性利用可得到上面的結果,其含義是,雖然小概率事件自信息大,但在計算熵時所占比重很小,可以忽略。極值性定理2.5(離散最大熵定理)對于有限離散隨機變量,當符號集中的符號等概率發(fā)生時,熵達到最大值。注意:離散最大熵定理僅適用于有限離散隨機變量,對于無限可數符號集,只有附加其他約束求最大熵才有意義。2.4信息熵的性質【證明】設隨機變量有n個符號,概率分布為P(x);Q(x)為等概率分布,即Q(x)=1/n。根據散度不等式有即 僅當P(x)等概布時等號成立。上凸性是概率矢量p的嚴格的上凸函數。這就是說,若,那么,其中均為n維概率矢量,。該性質可用凸函數性質(1)來證明(提示:先證明是嚴格上凸的)。2.4信息熵的性質一一對應變換下的不變性離散隨機變量的變換包含兩種含義,一是符號集中符號到符號的映射,二是符號序列到序列的變換。首先研究第一種情況。設兩隨機變量X、Y,符號集分別為A、B,其中Y是X的映射,可以表示為,。因此有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- BIM基礎知識培訓課件
- AED急救知識培訓課件
- 西游記知識競賽100題
- 企業(yè)并購股權轉讓合同模板
- 甘肅省張掖市甘州區(qū)張掖市甘州區(qū)南關校2024-2025學年初三4月適應性測試一?;瘜W試題含解析
- 北京交通職業(yè)技術學院《土木工程CAD與BM》2023-2024學年第一學期期末試卷
- 湖北經濟學院《西牙語Ⅲ》2023-2024學年第二學期期末試卷
- 湖南中醫(yī)藥大學《民用建筑施工概論》2023-2024學年第二學期期末試卷
- 青海省2025屆初三9月月考試題含答案
- 株洲師范高等??茖W?!豆こ痰刭|B》2023-2024學年第二學期期末試卷
- 2025年倉儲物流改進與合作伙伴協(xié)議
- 人教版《美術》二年級上冊第17課《會轉的玩具》課件
- 小學生數據分析課件
- 術后鎮(zhèn)痛規(guī)范與流程
- 《瓣膜性心臟病》課件
- 植入式靜脈給藥裝置護理技術課件
- 2025年甘肅農墾集團招聘筆試參考題庫含答案解析
- 2024年01月湖南2024岳陽市農商銀行系統(tǒng)招考員工筆試歷年參考題庫附帶答案詳解
- 2025年泰隆銀行招聘筆試參考題庫含答案解析
- 5.1導數的概念及其意義(同步練習)(含解析)-【一堂好課】2022-2023學年高二數學同步名師重點課堂(人教A版2019選擇性必修第二冊)
- 09《戰(zhàn)國策》第八-整本書閱讀系列《經典常談》名著閱讀與練習(解析版)
評論
0/150
提交評論