現(xiàn)代通信理論第二章_第1頁
現(xiàn)代通信理論第二章_第2頁
現(xiàn)代通信理論第二章_第3頁
現(xiàn)代通信理論第二章_第4頁
現(xiàn)代通信理論第二章_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

現(xiàn)代通信理論第二章第一頁,共一百零三頁,2022年,8月28日

§2.1引言-關(guān)于信源編碼數(shù)字通信系統(tǒng)因具有許多優(yōu)點(diǎn)而成為當(dāng)今通信的發(fā)展方向。在數(shù)字通信系統(tǒng)中,信道傳輸?shù)氖菙?shù)字信號(hào)。但是在自然界中,很多信源輸出的是模擬量,如話音、圖像等。因此在利用數(shù)字通信系統(tǒng)進(jìn)行信息傳輸時(shí),首先需先對(duì)信號(hào)(模擬的)數(shù)字化,即A/D。模擬信號(hào)的數(shù)字化屬于信源編碼的范疇。第二頁,共一百零三頁,2022年,8月28日數(shù)字通信中的編碼概念編碼和譯碼是數(shù)字通信發(fā)送與接收設(shè)備的重要組成部分。第三頁,共一百零三頁,2022年,8月28日數(shù)字通信中的編碼概念(續(xù))數(shù)字通信系統(tǒng)中包含編碼和譯碼,編碼的逆過程是譯碼。數(shù)字通信中的編碼涉及兩部分,含義完全不同:信源編碼信道編碼第四頁,共一百零三頁,2022年,8月28日信源編碼的作用作用之一是設(shè)法減少碼元數(shù)目和降低碼元速率,即通常所說的數(shù)據(jù)壓縮。碼元速率將直接影響傳輸所占的帶寬,而傳輸帶寬又直接反映了通信的有效性。我們所熟悉的典型的壓縮:音頻壓縮MP3

圖像壓縮JPEG、MPEG等

作用之二是當(dāng)信息源給出的是模擬信號(hào)時(shí),信源編碼器將其轉(zhuǎn)換成數(shù)字信號(hào),以實(shí)現(xiàn)模擬信號(hào)的數(shù)字化傳輸。模擬信號(hào)數(shù)字化傳輸?shù)姆绞接忻}沖編碼調(diào)制(PCM)和增量調(diào)制(ΔM)、ADPCM等。作用之三是加密第五頁,共一百零三頁,2022年,8月28日信道編碼信道編碼是為了降低誤碼率,提高數(shù)字通信的可靠性而采取的編碼。信道編碼技術(shù)的基本思想是通過對(duì)信息序列作某種變換,使原來彼此獨(dú)立,相關(guān)性極小的信息碼元產(chǎn)生某種相關(guān)性,從而在接收端利用這種規(guī)律檢查或糾正信息碼元在信道傳輸中所造成的差錯(cuò)。具體做法是信道編碼器對(duì)傳輸?shù)男畔⒋a元按一定的規(guī)則加入保護(hù)成分(監(jiān)督元),組成所謂“抗干擾編碼”。接收端的信道譯碼器按一定規(guī)則進(jìn)行解碼,從解碼過程中發(fā)現(xiàn)錯(cuò)誤或糾正錯(cuò)誤,從而提高通信系統(tǒng)抗干擾能力,實(shí)現(xiàn)可靠通信。與信源編碼相反,信道編碼提高了可靠性。第六頁,共一百零三頁,2022年,8月28日本章涉及內(nèi)容語音信號(hào)的編碼問題-重點(diǎn)討論語音編碼的基本方法,包括波形編碼(脈沖編碼調(diào)制(PCM),對(duì)增量調(diào)制(ΔM)、自適應(yīng)差分脈碼調(diào)制(ADPCM)、參數(shù)編碼(線性預(yù)測(cè)LP)、混合編碼(碼激勵(lì)線性預(yù)測(cè)CELP等。圖像信號(hào)的編碼問題-壓縮編碼,如靜態(tài)圖像壓縮方法JPEG、動(dòng)態(tài)圖像壓縮方法MPEG等。第七頁,共一百零三頁,2022年,8月28日§2.2音頻信號(hào)編碼語音編碼概述時(shí)域波形編碼變換域編碼參數(shù)編碼混合編碼各種音頻信號(hào)編碼方法的比較現(xiàn)代語音處理技術(shù)及應(yīng)用第八頁,共一百零三頁,2022年,8月28日語音編碼概述

語音是人類進(jìn)行交流的重要手段,通信系統(tǒng)中最常見的數(shù)據(jù)形式就是語音。語音通信是人類通信最基本、最重要的方式之一。隨著移動(dòng)通信與互聯(lián)網(wǎng)的飛速發(fā)展,語音通信技術(shù)也在不斷地進(jìn)行更新并與之相融合。語音信號(hào)的數(shù)字化傳輸和存儲(chǔ),在可靠性、抗干擾語音信號(hào)的數(shù)字化傳輸和存儲(chǔ),在可靠性、抗干擾能力、快速交換等方面遠(yuǎn)勝于模擬化,且靈活方便,易于保密,價(jià)格低廉,所以從20世紀(jì)50年代以來,數(shù)字化語音在通信系統(tǒng)中所占的比重越來越大。語音編碼是數(shù)字語音通信中的一項(xiàng)重要技術(shù)。為了壓縮數(shù)字語音傳輸?shù)谋忍芈剩允雇瑯拥男诺廊萘磕軅鬏敻嗦返恼Z音信號(hào),節(jié)省存儲(chǔ)空間,語音壓縮編碼也有了很大的發(fā)展,并在有線/無線電話的話帶語音信號(hào)、會(huì)議電視的寬帶語音信號(hào)、HDTV和高保真音樂等的音頻信號(hào)等領(lǐng)域有廣泛的應(yīng)用。第九頁,共一百零三頁,2022年,8月28日語音編碼算法語音編碼大致分為四種方式:時(shí)域波形編碼-不基于聲學(xué)模型.只針對(duì)語音波形進(jìn)行編碼變換域編碼-不基于聲學(xué)模型的編碼方法參數(shù)編碼-參數(shù)編碼是基于聲學(xué)模型的編碼方法混合編碼-結(jié)合上述幾種編碼方式的優(yōu)點(diǎn)有時(shí)也將時(shí)域的波形編碼和變換域編碼統(tǒng)稱波形編碼,因此也可以稱語音編解碼算法分為波形編碼、參數(shù)編碼(聲碼器)和混合編碼三類。第十頁,共一百零三頁,2022年,8月28日§2.2.1時(shí)域波形編碼時(shí)域波形編碼不基于聲學(xué)模型.只針對(duì)語音波形進(jìn)行編碼。這種方法在降低量化每個(gè)語音樣本比特?cái)?shù)的同時(shí),又保持了相對(duì)良好的語音質(zhì)量。波形編碼主要有脈沖編碼調(diào)制(PCM)、增量調(diào)制(ΔM)、自適應(yīng)增量調(diào)制(ADM)、自適應(yīng)差分脈碼調(diào)制(ADPCM)等。第十一頁,共一百零三頁,2022年,8月28日一、采用PCM的模擬信號(hào)數(shù)字傳輸系統(tǒng)m(t)模擬隨機(jī)信號(hào)mo(t)模擬隨機(jī)信號(hào){ak}數(shù)字隨機(jī)序列{a’k}數(shù)字隨機(jī)序列模擬信息源受信者數(shù)字傳輸系統(tǒng)抽樣、量化和編碼譯碼和低通濾波第十二頁,共一百零三頁,2022年,8月28日PCM數(shù)字化的過程一般分三步:抽樣量化編碼m(t){ak}“抽樣”指抽取樣值,或抽取樣點(diǎn),抽樣的多少對(duì)通信的性能指標(biāo)有決定影響。抽樣的多少即快慢由抽樣定理規(guī)定。復(fù)習(xí)或回憶抽樣定理-低通抽樣定理頻率受限于(0,fH)的時(shí)間連續(xù)信號(hào)m(t),其抽樣頻率fs≥2fH、抽樣間隔Ts≤1/2fH第十三頁,共一百零三頁,2022年,8月28日抽樣應(yīng)用實(shí)例:1)對(duì)于電話質(zhì)量的語音信號(hào)2)聲卡8kHz為電話質(zhì)量11kHz為AM廣播質(zhì)量22kHz為FM廣播質(zhì)量44kHz為激光視盤(CD)質(zhì)量第十四頁,共一百零三頁,2022年,8月28日帶通抽樣定理頻率受限于(fL,fH)的時(shí)間連續(xù)信號(hào)m(t),其最小抽樣頻率滿足:第十五頁,共一百零三頁,2022年,8月28日抽樣小結(jié)抽樣以后連續(xù)時(shí)間信號(hào)m(t)變成了時(shí)間離散的脈沖,脈沖幅度隨m(t)連續(xù)變化,本質(zhì)上仍為模擬信號(hào)。要完成數(shù)字化,需要進(jìn)一步的處理。第十六頁,共一百零三頁,2022年,8月28日第二步:模擬信號(hào)的量化(一)、概念:

1.量化定義:用預(yù)先規(guī)定的有限個(gè)電平來表示模擬抽樣值的過程,如后圖。*注意這里的量化指標(biāo)量量化-數(shù)與后面要講的矢量量化不同。第十七頁,共一百零三頁,2022年,8月28日量化過程示意圖信號(hào)的實(shí)際值信號(hào)的量化值量化誤差q7m6q6m5q5m4q4m3q3m2q2m1q1Ts2Ts3Ts4Ts5Ts6Ts7Tsmq(t)m(t)mq(6Ts)m(6Ts)t量化器{m(kTs)}{mq(kTs)}第十八頁,共一百零三頁,2022年,8月28日3.量化電平

q1,q2………qM為量化電平指量化器可能的輸出電平,M為量化電平數(shù),4.量化間隔V=mi-mi-1m(kTs)——為抽樣值2.量化信號(hào)mq(t),為m

(t)的近似值第十九頁,共一百零三頁,2022年,8月28日5.量化誤差只能減?。炕娖絺€(gè)數(shù)多一點(diǎn)),無法消除,也稱量化噪聲,大小由量化電平個(gè)數(shù)及量化方法決定。6.量化信噪比量化信噪比是量化器的主要性能指標(biāo)之一。第二十頁,共一百零三頁,2022年,8月28日量化方法:均勻量化有不足之處A律13折線近似方法:先對(duì)x軸上的輸入信號(hào)歸一化取值范圍,按1/2遞減規(guī)律分為8段,分段點(diǎn)依次為1/2、1/4、1/8、1/16、1/32、1/64、1/128,再把y軸上輸出的歸一化取值范圍均勻地分成8段,即每段長(zhǎng)為1/8,然后把x軸和y軸的相應(yīng)分段線的交點(diǎn)連接起來,共得到8段斜線。負(fù)向8段斜線按同樣方法得到。每一段再均勻分為16個(gè)量化級(jí)采用非均勻量化-折線近似法第二十一頁,共一百零三頁,2022年,8月28日A律13折線

第二十二頁,共一百零三頁,2022年,8月28日第三步:編碼量化完成了幅度的離散,但直接傳輸時(shí),電平數(shù)多,判決困難,故需要將量化電平用代碼表示。(一)、概念:1.編碼:把量化后的信號(hào)變換成代碼的過程。2.譯碼:由代碼重建量化信號(hào)的過程。第二十三頁,共一百零三頁,2022年,8月28日(二)編碼實(shí)現(xiàn):

1、碼型選擇:自然二進(jìn)制碼折疊二進(jìn)制碼小信號(hào)時(shí)折疊二進(jìn)制碼誤差小自然碼誤差大大信號(hào)時(shí)自然碼誤差小折疊二進(jìn)制碼誤差大樣值脈沖極性格雷二進(jìn)制自然二進(jìn)碼折疊二進(jìn)碼量化級(jí)序號(hào)正極性部分10001001101110101110111111011100111111101101110010111010100110001111111011011100101110101001100015141312111098負(fù)極性部分01000101011101100010001100010000011101100101010000110010000100000000000100100011010001010110011176543210第二十四頁,共一百零三頁,2022年,8月28日2.碼位安排極性碼段落碼段內(nèi)碼C1C2C3C4C5C6C7C8>0,“1”<0,“0”段落序號(hào)段落碼C2c3c4876543211

11110101100011010001000電平序號(hào)段內(nèi)碼電平序號(hào)段內(nèi)碼c5c6c7c8c5c6c7c815141312111098111111101101110010111010100110007654321001110110011001010011001000010000第二十五頁,共一百零三頁,2022年,8月28日(三)編碼方法——逐次比較法原理圖:第二十六頁,共一百零三頁,2022年,8月28日PCM碼流速率計(jì)算:第二十七頁,共一百零三頁,2022年,8月28日PCM系統(tǒng)的抗噪性能第二十八頁,共一百零三頁,2022年,8月28日3)總信噪比:第二十九頁,共一百零三頁,2022年,8月28日二、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)64kb/s的A律或μ律的對(duì)數(shù)壓擴(kuò)PCM編碼已經(jīng)在大容量的光纖通信系統(tǒng)和數(shù)字微波系統(tǒng)中得到了廣泛的應(yīng)用。但PCM信號(hào)占用頻帶要比模擬通信系統(tǒng)中的一個(gè)標(biāo)準(zhǔn)話路帶寬(3.1kHz)寬很多倍,這樣,對(duì)于大容量的長(zhǎng)途傳輸系統(tǒng),采用PCM的經(jīng)濟(jì)性能很難與模擬通信相比。

以較低的速率獲得高質(zhì)量編碼,一直是語音編碼追求的目標(biāo)。通常,人們把話路速率低于64kb/s的語音編碼方法,稱為語音壓縮編碼技術(shù)。第三十頁,共一百零三頁,2022年,8月28日語音壓縮編碼方法很多,其中,自適應(yīng)差分脈沖編碼調(diào)制是語音壓縮中復(fù)雜度較低的一種編碼方法,它可在32kb/s的比特率上達(dá)到64kb/s的PCM數(shù)字電話質(zhì)量。近年來,ADPCM已成為長(zhǎng)途傳輸中一種新型的國(guó)際通用的語音編碼方法(G.721)。ADPCMADPCM是在差分脈沖編碼調(diào)制(DPCM)的基礎(chǔ)上發(fā)展起來的,為此,下面先介紹DPCM的編碼原理與系統(tǒng)框圖。第三十一頁,共一百零三頁,2022年,8月28日由于相鄰樣值的差值比樣值本身小,可以用較少的比特?cái)?shù)表示差值。這樣,用樣點(diǎn)之間差值的編碼來代替樣值本身的編碼,可以在量化臺(tái)階不變的情況下(即量化噪聲不變),編碼位數(shù)顯著減少,信號(hào)帶寬大大壓縮。這種利用差值的PCM編碼稱為差分PCM(DPCM)。在PCM中,每個(gè)波形樣值都獨(dú)立編碼,與其他樣值無關(guān),這樣,樣值的整個(gè)幅值編碼需要較多位數(shù),比特率較高,造成數(shù)字化的信號(hào)帶寬大大增加。然而,大多數(shù)以奈奎斯特或更高速率抽樣的信源信號(hào)在相鄰抽樣間表現(xiàn)出很強(qiáng)的相關(guān)性,有很大的冗余度。利用信源的這種相關(guān)性,一種比較簡(jiǎn)單的解決方法是對(duì)相鄰樣值的差值而不是樣值本身進(jìn)行編碼。1、DPCM如果將樣值之差仍用N位編碼傳送,則DPCM的量化信噪比顯然優(yōu)于PCM系統(tǒng)。實(shí)現(xiàn)差分編碼的一個(gè)好辦法是根據(jù)前面的k個(gè)樣值預(yù)測(cè)當(dāng)前時(shí)刻的樣值。編碼信號(hào)只是當(dāng)前樣值與預(yù)測(cè)值之間的差值的量化編碼。第三十二頁,共一百零三頁,2022年,8月28日DPCM系統(tǒng)原理框圖第三十三頁,共一百零三頁,2022年,8月28日式中,(S/N)q是把差值序列作為信號(hào)時(shí)量化器的量化信噪比,與PCM系統(tǒng)考慮量化誤差時(shí)所計(jì)算的信噪比相當(dāng)。Gp可理解為DPCM系統(tǒng)相對(duì)于PCM系統(tǒng)而言的信噪比增益,稱為預(yù)測(cè)增益。如果能夠選擇合理的預(yù)測(cè)規(guī)律,差值功率E[e2n]就能遠(yuǎn)小于信號(hào)功率E[x2n],Gp就會(huì)大于1,該系統(tǒng)就能獲得增益。對(duì)DPCM系統(tǒng)的研究就是圍繞著如何使Gp和(S/N)q這兩個(gè)參數(shù)取最大值而逐步完善起來的。通常Gp約為6~11dB。因此DPCM系統(tǒng)總的量化信噪比可表示為第三十四頁,共一百零三頁,2022年,8月28日可見,DPCM系統(tǒng)總的量化信噪比遠(yuǎn)大于量化器的信噪比。因此,要求DPCM系統(tǒng)達(dá)到與PCM系統(tǒng)相同的信噪比,則可降低對(duì)量化器信噪比的要求,即可減小量化級(jí)數(shù),從而減少碼位數(shù),降低比特率。第三十五頁,共一百零三頁,2022年,8月28日2、ADPCM值得注意的是,DPCM系統(tǒng)性能的改善是以最佳的預(yù)測(cè)和量化為前提的。但對(duì)語音信號(hào)進(jìn)行預(yù)測(cè)和量化是復(fù)雜的技術(shù)問題,這是因?yàn)檎Z音信號(hào)在較大的動(dòng)態(tài)范圍內(nèi)變化。為了能在相當(dāng)寬的變化范圍內(nèi)獲得最佳的性能,只有在DPCM基礎(chǔ)上引入自適應(yīng)系統(tǒng)。有自適應(yīng)系統(tǒng)的DPCM稱為自適應(yīng)差分脈沖編碼調(diào)制,簡(jiǎn)稱ADPCM。第三十六頁,共一百零三頁,2022年,8月28日

ADPCM的主要特點(diǎn)是用自適應(yīng)量化取代固定量化,用自適應(yīng)預(yù)測(cè)取代固定預(yù)測(cè)。自適應(yīng)量化指量化臺(tái)階隨信號(hào)的變化而變化,使量化誤差減?。蛔赃m應(yīng)預(yù)測(cè)指預(yù)測(cè)器系數(shù)可以隨信號(hào)的統(tǒng)計(jì)特性而自適應(yīng)調(diào)整,提高了預(yù)測(cè)信號(hào)的精度,從而得到高預(yù)測(cè)增益。通過這兩點(diǎn)改進(jìn),可大大提高輸出信噪比和編碼動(dòng)態(tài)范圍。如果DPCM的預(yù)測(cè)增益為6~11dB,自適應(yīng)預(yù)測(cè)可使信噪比改善4dB;自適應(yīng)量化可使信噪比改善4~7dB,則ADPCM比PCM可改善14~22dB,相當(dāng)于編碼位數(shù)可以減小3位到4位。因此,在維持相同的語音質(zhì)量下,ADPCM允許用32kb/s比特率編碼,這是標(biāo)準(zhǔn)64kb/sPCM的一半。因此,在長(zhǎng)途傳輸系統(tǒng)中,ADPCM有著遠(yuǎn)大的前景。相應(yīng)地,CCITT也形成了關(guān)于ADPCM系統(tǒng)的規(guī)范建議G.721、G.726等。ADPCM(續(xù))第三十七頁,共一百零三頁,2022年,8月28日三、增量調(diào)制(ΔM或DM)1、與PCM區(qū)別

PCM碼表示樣值大小,N位碼,ΔM代碼表示相鄰樣值的關(guān)系,一位碼,是DPCM的特例。2、ΔM基本原理(1).編碼第三十八頁,共一百零三頁,2022年,8月28日ΔM波形示意e(ti)=m(ti-)-m’(ti-)>0e(ti)=m(ti-)-m’(ti-)<0輸出1,上升一個(gè)臺(tái)階s輸出0,下降一個(gè)臺(tái)階s

第三十九頁,共一百零三頁,2022年,8月28日波形編碼小結(jié)PCM、ΔM、ADPCM是基于時(shí)域的波形編碼技術(shù),不基于聲學(xué)模型。波形編碼器作用于所有輸入信號(hào),因此會(huì)產(chǎn)生高質(zhì)量的樣值。然而,波形編碼器工作在高比特率。例如:ITU-G.711規(guī)范(PCM)用的比特率為64kbps。**引出其它編碼,目的是降低比特率,提高有效性。第四十頁,共一百零三頁,2022年,8月28日§

變換域編碼-頻域編碼變換域編碼方式也是不基于聲學(xué)模型的編碼方法,但對(duì)信號(hào)進(jìn)行頻域處理,再編碼。典型的變換域編碼有子帶編碼(SBC)第四十一頁,共一百零三頁,2022年,8月28日子帶編碼(sub—bandcoding,SBC)SBC利用帶通濾波器將語音頻帶分成若干子帶,并且分別進(jìn)行采樣、編碼,編碼方式可以用ADPCM或ADM,SBC速率可以達(dá)到9.6kb/s??勺僑BC可使子帶的設(shè)計(jì)不固定,而是隨共振峰變化,使編碼效率進(jìn)一步提高,這種方式在碼率為4.8kb/s時(shí)可具有相當(dāng)于7.2kb/s的固定SBC的語音質(zhì)量。第四十二頁,共一百零三頁,2022年,8月28日SBC原理框圖(a)編碼器

(b)解碼器

第四十三頁,共一百零三頁,2022年,8月28日子帶編碼應(yīng)用1976年子帶編碼技術(shù)首次被美國(guó)貝爾實(shí)驗(yàn)室的R.E.Crochiere等人應(yīng)用于語音編碼。子帶編碼器SBC愈來愈受到重視。在中等速率的編碼系統(tǒng)中,SBC的動(dòng)態(tài)范圍寬、音質(zhì)高、成本低。使用子帶編碼技術(shù)的編譯碼器已開始用于話音存儲(chǔ)轉(zhuǎn)發(fā)(voicestore-and-forward)和話音郵件,采用2個(gè)子帶和ADPCM的編碼系統(tǒng)也已由CCITT作為G.722標(biāo)準(zhǔn)向全世界推薦使用。1986年Woods等將子帶編碼又引入到圖像編碼,此后子帶編碼在視頻信號(hào)壓縮領(lǐng)域得到了很大發(fā)展。目前,已經(jīng)研制出采用子帶編碼技術(shù)的具有演播室質(zhì)量的140MbpsHDTV硬件編解碼系統(tǒng)。第四十四頁,共一百零三頁,2022年,8月28日§

參數(shù)編碼(參量編碼)

與波形編碼不同,參量編碼又稱為聲源編碼(聲碼器),是將信源信號(hào)提取特征參量,并將其變換成數(shù)字代碼進(jìn)行傳輸。解碼為其反過程,將收到的數(shù)字序列經(jīng)變換恢復(fù)特征參量,再根據(jù)特征參量重建語音信號(hào)。具體說,參量編碼是通過對(duì)語音信號(hào)特征參數(shù)的提取和編碼,力圖使重建語音信號(hào)具有盡可能高的可靠性,即保持原語音的語意,但重建信號(hào)的波形同原語音信號(hào)的波形可能會(huì)有相當(dāng)大的差別。這種編碼技術(shù)可實(shí)現(xiàn)低速率語音編碼,比特率可壓縮到2Kbit/s-4.8Kbit/s,甚至更低,但語音質(zhì)量只能達(dá)到中等,特別是自然度較低,連熟人都不一定能聽出講話人是誰。線性預(yù)測(cè)編碼(LPC)及其它各種改進(jìn)型都屬于參量編碼。

第四十五頁,共一百零三頁,2022年,8月28日聲碼器聲碼器(vocoder)不會(huì)再生原始波形。這組編碼器會(huì)提取一組參數(shù),這組參數(shù)被送到接收端,用來導(dǎo)出語音產(chǎn)生模形。第四十六頁,共一百零三頁,2022年,8月28日聲碼器質(zhì)量在電話系統(tǒng)中使用聲碼器,語音質(zhì)量不夠好。

第四十七頁,共一百零三頁,2022年,8月28日對(duì)于語音數(shù)據(jù),人們已經(jīng)找到了較合理的聲道模型,聲音數(shù)據(jù)的參數(shù)編碼方法就是基于聲音參數(shù)的分析與合成來實(shí)現(xiàn)的。聲道模型在聲音合成等領(lǐng)域也有成功應(yīng)用。統(tǒng)計(jì)表明,語音過程是一個(gè)近似的短時(shí)隨機(jī)過程。所謂短時(shí),是指在10-30ms的范圍。由于這一性質(zhì),使一幀一幀地處理語音信號(hào)成為可能,每一幀的信號(hào)近似滿足同一模型,提取模型參數(shù)即可再現(xiàn)信號(hào)。這是方法假設(shè)的基本前提。實(shí)際應(yīng)用中,每幀取20ms。語音參數(shù)編碼原理

第四十八頁,共一百零三頁,2022年,8月28日語音生成機(jī)構(gòu)模型:①聲源。聲源分三類:元音:由聲帶的自激振動(dòng)所產(chǎn)生;摩擦音:靠聲道變窄時(shí)氣流所產(chǎn)生的喘流噪聲產(chǎn)生;爆破音:由閉合的聲道急速打開時(shí)形成的脈沖波所產(chǎn)生的喘流噪聲所產(chǎn)生。模型中用基音周期參數(shù)描述聲源。②共鳴機(jī)構(gòu),也稱聲道。由鼻腔、口腔與舌頭組成。模型中用共振峰參數(shù)描述。③放射機(jī)構(gòu):由嘴唇和鼻孔組成,其功能是發(fā)出聲音并傳播出去。模型中用語音譜和聲強(qiáng)參數(shù)描述。常用語音參數(shù)

-基音周期、共振峰、語音譜、聲強(qiáng)等。第四十九頁,共一百零三頁,2022年,8月28日①分幀:聲音變?yōu)閹蛄衒1,f2,…。②計(jì)算每一幀fi的參數(shù)向量(基音周期,共振峰,語音譜,聲強(qiáng))i。

③直接傳送參數(shù)向量或?qū)?shù)向量進(jìn)行矢量量化。語音參數(shù)編碼過程:

第五十頁,共一百零三頁,2022年,8月28日LPC線性預(yù)測(cè)編碼(LPC)用來獲取一時(shí)變數(shù)字濾波器的參數(shù)。這個(gè)濾波器用來模擬說話人的聲道輸出。

由圖一中所示,聲音的產(chǎn)生被模擬成聲源和聲道兩個(gè)部分構(gòu)成。聲源為噪聲和脈沖兩種,聲道相當(dāng)于一個(gè)濾波器,氣管口腔形狀不同相當(dāng)于聲道濾波器的參數(shù)不同,最后就生成不同聲音。

第五十一頁,共一百零三頁,2022年,8月28日參數(shù)編碼小結(jié)參數(shù)編碼數(shù)據(jù)量小,但計(jì)算量很大。由于聲音從發(fā)聲模型出發(fā),不是從波形出發(fā)仿真,保真難度大,目前的保真度還很差。例如,某人說了一句話,分析出參數(shù)再由參數(shù)合成的聲音,能聽出這段話的字句就合格了,聽起來不是機(jī)器語言,即自然度好一些已相當(dāng)不錯(cuò)了,要能聽出誰在說話就不容易。由于壓縮比高,成本低,很多低檔的學(xué)習(xí)機(jī)就是采用了這種語音壓縮方式,出來的聲音生硬、含混不清、毫無語感,對(duì)英語的語音學(xué)習(xí)不但毫無幫助,而且會(huì)誤導(dǎo)正確的語音學(xué)習(xí)。第五十二頁,共一百零三頁,2022年,8月28日§2.2.4混合型編碼

混合編碼則是在波形編碼和參數(shù)編碼的基礎(chǔ)上,以相對(duì)較低的比特率上獲得較高的語音質(zhì)量,所以其數(shù)據(jù)率和音質(zhì)介于二者之間。

當(dāng)波形編碼的比特率每聲道低于16kbps后,音質(zhì)下降很快。而參數(shù)法由于機(jī)理本身就是一種模擬,比特率上升到10kbps以上后再上升音質(zhì)也沒有多少改善。所以,兩者結(jié)合的混合編碼法就被消費(fèi)類電子公司開發(fā)出來。

第五十三頁,共一百零三頁,2022年,8月28日發(fā)展與應(yīng)用計(jì)算機(jī)的發(fā)展為語音編碼技術(shù)的研究提供了強(qiáng)有力的工具,大規(guī)模、超大規(guī)模集成電路的出現(xiàn),則為語音編碼的實(shí)現(xiàn)提供了基礎(chǔ)。80年代以來,語音編碼技術(shù)有了實(shí)質(zhì)性的進(jìn)展,產(chǎn)生了新一代的編碼算法,這就是混合編碼。它將波形編碼的高質(zhì)量和參量編碼的低數(shù)據(jù)速率組合起來,克服了原有波形編碼和參量編碼的弱點(diǎn),結(jié)合各自的長(zhǎng)處,力圖保持波形編碼的高質(zhì)量和參量編碼的低速率,在4-16Kbit/s速率上能夠得到高質(zhì)量的合成語音。目前較為成功的混合型編碼方案有多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPLPC)和碼激勵(lì)線性預(yù)測(cè)編碼(CELP)。很顯然,混合編碼是適合于數(shù)字移動(dòng)通信的語音編碼技術(shù)。

第五十四頁,共一百零三頁,2022年,8月28日LDCELP低時(shí)延碼激勵(lì)線性預(yù)測(cè)編碼是LowDelay-CodeExcitedLinearPrediction的縮寫。16kbit/sLDCELP是CCITTG.728語音編碼標(biāo)準(zhǔn)算法,這種法在CELP算法的基礎(chǔ)上,采用后向自適應(yīng)線性預(yù)測(cè)、50階合成濾波、短激勵(lì)矢量(5個(gè)樣值)等改進(jìn)方法,從而達(dá)到高質(zhì)量和低時(shí)延的目的,總的編碼時(shí)延小于2ms。第五十五頁,共一百零三頁,2022年,8月28日RPE/LTP規(guī)則脈沖激勵(lì)—長(zhǎng)時(shí)預(yù)測(cè)—線性預(yù)測(cè)編碼是RegularPulseExcited-LongTermPredition-LinearPredictiveCoding的縮寫。這種算法是MPE-LPC的改進(jìn)算法,除了增加長(zhǎng)時(shí)預(yù)測(cè)功能外,激勵(lì)脈沖的位置具有一定的規(guī)律。這種算法是歐洲900MHz數(shù)字蜂窩移動(dòng)電話的語音編碼標(biāo)準(zhǔn)(GSM),也為數(shù)字蜂窩系統(tǒng)DCS1800所采用。

MPE-LPC(多脈沖線性預(yù)測(cè)編碼)

多脈沖線性預(yù)測(cè)編碼是Multi-PulseExcitedLPC的縮寫。這種算法在一幀語音中選擇幾十個(gè)典型脈沖作為激勵(lì)信號(hào)。INMARSAT的9.6kbit/s語音編碼航空標(biāo)準(zhǔn)采用這種算法。第五十六頁,共一百零三頁,2022年,8月28日VSELPVSELP(矢量和激勵(lì)線性預(yù)測(cè)編碼)

矢量和激勵(lì)線性預(yù)測(cè)編碼是VectorSumExcitedLinearPrediction的縮寫。這種算法采用三個(gè)碼本作為激勵(lì)信號(hào),其中兩個(gè)是隨機(jī)碼本,一個(gè)是自適應(yīng)碼本,最終的激勵(lì)信號(hào)是三個(gè)激勵(lì)矢量的和。美國(guó)電信工業(yè)協(xié)會(huì)(TIA)選擇8kbit/sVSELP算法作為北美第一代數(shù)字蜂窩移動(dòng)電話的編碼標(biāo)準(zhǔn)(IS54)。日本的全速率數(shù)字移動(dòng)電話也采用VSELP算法作為語音編碼標(biāo)準(zhǔn)(JDC),速率為6.7kbit/s。第五十七頁,共一百零三頁,2022年,8月28日§2.2.5各種音頻信號(hào)編碼方法的比較編碼方法傳輸速率(kb/s)最小基帶帶寬(kHz)質(zhì)量PCMADPCMSBC+ADPCM△MSBC(子帶)RPE/LTP(規(guī)則脈沖激勵(lì))LD-CELP(低延遲碼激勵(lì))MPE/LPC(多脈沖)CELP(碼本激勵(lì))LPC(線性預(yù)測(cè))LPC+VQ(矢量量化)6432643216161632163216888長(zhǎng)途電話質(zhì)量長(zhǎng)途電話質(zhì)量廣播質(zhì)量通信質(zhì)量通信質(zhì)量通信質(zhì)量接近長(zhǎng)途質(zhì)量通信質(zhì)量通信質(zhì)量合成質(zhì)量合成質(zhì)量第五十八頁,共一百零三頁,2022年,8月28日電話質(zhì)量的音頻(

kHz

)G728,LD-CELP16kb/s,GSM,RPE/LTP,13kb/s,(歐洲移動(dòng))GTIA,VSELP,8kb/s(美國(guó)移動(dòng))NSA,CELP,4.8kb/sNSA,LPC,2.4kb/s第五十九頁,共一百零三頁,2022年,8月28日調(diào)幅廣播質(zhì)量的音頻50Hz-7kHz

采樣率16KHz

,14bit量化,PCM碼率224Kb/s,采用G.722(子帶)標(biāo)準(zhǔn)可壓縮到64Kb/s,適于ISDN的B信道,傳輸高質(zhì)量語音。第六十頁,共一百零三頁,2022年,8月28日高保真立體聲音頻壓縮標(biāo)準(zhǔn)即CD音質(zhì)音頻20Hz--20KHz采樣率44.1kHz,,16位量化,立體聲數(shù)據(jù)量為

44.1*16b*2=1411.2kb/s=176.4KB/s1小時(shí)為

176.4KB/s*3600s=635MB

目前,采用MPEG音頻標(biāo)準(zhǔn),有三層(第三層MP3),采用子帶及熵編碼技術(shù),可壓縮到每聲道32kb/s-448kb/s第六十一頁,共一百零三頁,2022年,8月28日MP3及其基本原理

MP3就是采用國(guó)際標(biāo)準(zhǔn)MPEG中的第三層音頻壓縮模式,對(duì)聲音信號(hào)進(jìn)行壓縮的一種格式,中文也稱"電腦網(wǎng)絡(luò)音樂"。MPEG中的第三層音頻壓縮模式比第一層和第二層編碼要復(fù)雜得多,但音質(zhì)最高,可與CD音質(zhì)相比。第六十二頁,共一百零三頁,2022年,8月28日多媒體視聽業(yè)務(wù)音頻

ITU關(guān)于電視電話系統(tǒng)和終端設(shè)備的技術(shù)標(biāo)準(zhǔn)針H.320用于ISDN網(wǎng),不適合窄帶電話網(wǎng),而H.324既適合高速數(shù)字網(wǎng),也適合在普通電話之類的窄帶網(wǎng)上使用,H.323標(biāo)準(zhǔn)用于質(zhì)量不能保證的局域網(wǎng)LAN在H.320中,語音編碼標(biāo)準(zhǔn)為G.711(64kb/s

)、G.722(64kb/s

)、G.728(16kb/s

),H.324分配給語音帶寬6.5kb/s

(高——采用MP-MLQCELP)和5.3K(低——采用ACELP),采用的語音壓縮標(biāo)準(zhǔn)為G.723H.323系統(tǒng)語音壓縮方法有6種,即G.711(64kb/s

)、G.722(64kb/s

)、G.728(16kb/s

)、G.723、G.729、MPEGAUDIO

第六十三頁,共一百零三頁,2022年,8月28日§2.2.6現(xiàn)代語音處理技術(shù)及應(yīng)用第六十四頁,共一百零三頁,2022年,8月28日§2.3圖像信號(hào)的壓縮圖像信號(hào)壓縮的必要性圖像信號(hào)壓縮基礎(chǔ)圖像壓縮編碼方法圖像壓縮編碼標(biāo)準(zhǔn)第六十五頁,共一百零三頁,2022年,8月28日?qǐng)D像信號(hào)壓縮的必要性與文字信息不同,圖像信息占據(jù)大量的存儲(chǔ)容量,而且傳輸?shù)膸捰邢蘩?:一張A4(210mm×297mm)大小的照片,若用中等分辨率(300dpi)的掃描儀按真彩色掃描,其數(shù)據(jù)量為多少?(注:dpi表示每英寸像素,1英寸=25.4mm)若按每像素3個(gè)字節(jié)計(jì)算,上述結(jié)果為約26M例2:目前的WWW互聯(lián)網(wǎng)包含大量的圖像信息,如果圖像信息的數(shù)據(jù)量太大,會(huì)使本來就已經(jīng)非常緊張的網(wǎng)絡(luò)帶寬變得更加不堪重負(fù)(WorldWideWeb變成了WorldWideWait)第六十六頁,共一百零三頁,2022年,8月28日?qǐng)D像信號(hào)壓縮的必要性(續(xù))視頻數(shù)據(jù)量:對(duì)于電視畫面的分辨率640*480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為:640*480*24*30=221.12Mbit/s=28MB/s實(shí)時(shí)傳輸:在10M帶寬網(wǎng)上實(shí)時(shí)傳輸?shù)脑?,需要壓縮到原來數(shù)據(jù)量的0.045存儲(chǔ):1張CD可存640MB,如果不進(jìn)行壓縮,1張CD則僅可以存放20幾秒的數(shù)據(jù)可見,單純依靠增加存儲(chǔ)器容量和改善信道帶寬無法滿足需求,必須進(jìn)行壓縮第六十七頁,共一百零三頁,2022年,8月28日§2.3.2圖像壓縮編碼基礎(chǔ) 圖像數(shù)據(jù)的壓縮機(jī)理來自兩個(gè)方面:一是利用圖像中存在大量冗余度可供壓縮;二是利用人眼的視覺特性。第六十八頁,共一百零三頁,2022年,8月28日(1)空間冗余

在一幅圖像中規(guī)則的物體和規(guī)則的背景具有很強(qiáng)的相關(guān)性。

(2)時(shí)間冗余

電視圖像序列中相鄰兩幅圖像之間有較大的相關(guān)性。(3)結(jié)構(gòu)冗余和知識(shí)冗余

圖像從大面積上看常存在有紋理結(jié)構(gòu),稱之為結(jié)構(gòu)冗余。(4)視覺冗余

人眼的視覺系統(tǒng)對(duì)于圖像的感知是非均勻和非線性的,對(duì)圖像的變化并不都能察覺出來。1.圖像數(shù)據(jù)的冗余度第六十九頁,共一百零三頁,2022年,8月28日(1)亮度辨別閾值

當(dāng)景物的亮度在背景亮度基礎(chǔ)上增加很少時(shí),人眼是辨別不出的,只有當(dāng)亮度增加到某一數(shù)值時(shí),人眼才能感覺其亮度有變化。人眼剛剛能察覺的亮度變化值稱為亮度辨別閾值。2.人眼的視覺特性第七十頁,共一百零三頁,2022年,8月28日(2)視覺閾值 視覺閾值是指干擾或失真剛好可以被察覺的門限值,低于它就察覺不出來,高于它才看得出來,這是一個(gè)統(tǒng)計(jì)值。(3)空間分辨力 空間分辨力是指對(duì)一幅圖像相鄰像素的灰度和細(xì)節(jié)的分辨力,視覺對(duì)于不同圖像內(nèi)容的分辨力不同。(4)掩蓋效應(yīng)

“掩蓋效應(yīng)”是指人眼對(duì)圖像中量化誤差的敏感程度,與圖像信號(hào)變化的劇烈程度有關(guān)。第七十一頁,共一百零三頁,2022年,8月28日?qǐng)D像壓縮的可能性與基本思想各種冗余和視覺特性就是壓縮圖象數(shù)據(jù)的出發(fā)點(diǎn)和依據(jù)。圖象編碼的目的就在于采用各種方法去除冗余和不太重要的部分內(nèi)容,以盡量少的數(shù)據(jù)量來表示個(gè)重建圖象。壓縮編碼技術(shù)能夠很好地解決在將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)后所產(chǎn)生的帶寬需求增加的問題,

它是使數(shù)字信號(hào)走上實(shí)用化的關(guān)鍵技術(shù)之一。第七十二頁,共一百零三頁,2022年,8月28日§2.3.3圖像壓縮的方法圖像壓縮方法有很多種,而且很多方法還在不斷地發(fā)展和完善。從不同的角度出發(fā)有不同的分類方法。1.根據(jù)解壓重建后的圖像與原始圖像是否有誤差,可分為無損壓縮與有損壓縮兩大類;第七十三頁,共一百零三頁,2022年,8月28日?qǐng)D像壓縮的方法(續(xù))2.根據(jù)實(shí)施編碼所在的數(shù)據(jù)域可分為空間域和變換域編碼第七十四頁,共一百零三頁,2022年,8月28日(1)基于圖像信源統(tǒng)計(jì)特性的壓縮方法,有預(yù)測(cè)編碼、變換編碼、矢量量化編碼、子帶-小波編碼和神經(jīng)網(wǎng)絡(luò)編碼法等。(2)基于人眼視覺特性的壓縮方法,有基于方向?yàn)V波的圖像編碼法和基于圖像輪廓-紋理的編碼法等。(3)基于圖像景物特征的壓縮方法,有分形編碼法和基于模型的編碼方法等。3.根據(jù)壓縮機(jī)理的不同,數(shù)據(jù)壓縮編碼方法大致可以分成三類第七十五頁,共一百零三頁,2022年,8月28日?qǐng)D像壓縮的方法圖像壓縮有損壓縮無損壓縮行程編碼LZW編碼哈夫曼編碼算術(shù)編碼無損預(yù)測(cè)編碼位平面編碼有損預(yù)測(cè)編碼分形編碼模型編碼子帶編碼神經(jīng)網(wǎng)絡(luò)編碼變換編碼K-L變換Haar變換Walsh.Hadamard變換離散余弦變換離散傅立葉變換斜變換小波變換第七十六頁,共一百零三頁,2022年,8月28日衡量一個(gè)壓縮編碼方法優(yōu)劣的重要指標(biāo)

(1)壓縮比要高,有幾倍、幾十倍,也有幾百乃至幾千倍;

(2)壓縮與解壓縮要快,算法要簡(jiǎn)單,硬件實(shí)現(xiàn)容易;

(3)解壓縮的圖像質(zhì)量要好。

需要說明的是選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特征;多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力;應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。第七十七頁,共一百零三頁,2022年,8月28日幾種典型的圖像壓縮方法原理霍夫曼(Huffman)編碼游程編碼預(yù)測(cè)編碼變換編碼混合編碼第七十八頁,共一百零三頁,2022年,8月28日

1.霍夫曼(Huffman)編碼霍夫曼(Huffman)編碼是一種可變長(zhǎng)編碼,編碼方法如下圖所示。

(1)將輸入信號(hào)符號(hào)以出現(xiàn)概率由大至小為序排成一列。

(2)將兩處最小概率的符號(hào)相加合成為一個(gè)新概率,再按出現(xiàn)概率的大小排序。

(3)重復(fù)步驟(2),直至最終只剩兩個(gè)概率。

(4)編碼從最后一步出發(fā)逐步向前進(jìn)行,概率大的符號(hào)賦予“0”碼,另一個(gè)概率賦予“1”碼,直至到達(dá)最初的概率排列為止。第七十九頁,共一百零三頁,2022年,8月28日霍夫曼(Huffman)編碼將最常出現(xiàn)(概率大的)的符號(hào)用最短的編碼,最少出現(xiàn)的符號(hào)用最長(zhǎng)的編碼。第八十頁,共一百零三頁,2022年,8月28日游程編碼(RLC,RunLengthCoding)是一種十分簡(jiǎn)單的壓縮方法,它將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一的記號(hào)來表示。例如,字符串可以壓縮為5310-10110-08120-12,其中,“-”后面兩個(gè)數(shù)字是“-”前面數(shù)字的連續(xù)個(gè)數(shù)。游程編碼的壓縮率不高,但編碼、解碼的速度快,仍被得到廣泛的應(yīng)用,特別是在變換編碼后再進(jìn)行游程編碼,有很好的效果。

2.游程編碼第八十一頁,共一百零三頁,2022年,8月28日3.預(yù)測(cè)編碼(1)預(yù)測(cè)編碼基本原理 預(yù)測(cè)編碼是根據(jù)某一模型利用過去的樣值對(duì)當(dāng)前樣值進(jìn)行預(yù)測(cè),然后將當(dāng)前樣值的實(shí)際值與預(yù)測(cè)值相減得到一個(gè)誤差值,只對(duì)這一預(yù)測(cè)誤差值進(jìn)行編碼。

-DPCM第八十二頁,共一百零三頁,2022年,8月28日(2)預(yù)測(cè)方法1).幀內(nèi)預(yù)測(cè) 幀內(nèi)預(yù)測(cè)利用圖像信號(hào)的空間相關(guān)性來壓縮圖像的空間冗余,根據(jù)前面已經(jīng)傳送的同一幀內(nèi)的像素來預(yù)測(cè)當(dāng)前像素。2).幀間預(yù)測(cè) 電視圖像在相鄰幀之間存在很強(qiáng)的相關(guān)性。3.預(yù)測(cè)編碼(續(xù))第八十三頁,共一百零三頁,2022年,8月28日?qǐng)D像變換編碼是將空間域里描述的圖像,經(jīng)過某種變換(如傅立葉變換、離散余弦變換、沃爾什變換等)在變換域中進(jìn)行描述。這樣可以將圖像能量在空間域的分散分布變?yōu)樵谧儞Q域的相對(duì)集中分布,便于用“Z”(zig-zag)字形掃描、自適應(yīng)量化、變長(zhǎng)編碼等進(jìn)一步處理,完成對(duì)圖像信息的有效壓縮。4.變換編碼第八十四頁,共一百零三頁,2022年,8月28日變換編碼將被處理數(shù)據(jù)按照某種變換規(guī)則映射到另一個(gè)域中去處理,圖像編碼采用二維正交變換的方式,若將整個(gè)圖像作為一個(gè)二維矩陣,變換編碼的計(jì)算量太大。所以將一幅圖像分成一個(gè)個(gè)小圖像塊,通常是8×8或16×16小方塊,每個(gè)圖像塊可以看成為一個(gè)二維數(shù)據(jù)矩陣,變換編碼以這些小圖像塊為單位進(jìn)行,變換編碼把統(tǒng)計(jì)上密切相關(guān)的像素構(gòu)成的矩陣通過線性正交變換,變成統(tǒng)計(jì)上較為相互獨(dú)立,甚至完全獨(dú)立的變換系數(shù)所構(gòu)成的矩陣。第八十五頁,共一百零三頁,2022年,8月28日在常用的正交變換中,DCT(DiscreteCosineTransform)變換的性能接近最佳,是一種準(zhǔn)最佳變換。DCT變換矩陣與圖像內(nèi)容無關(guān),是因?yàn)樗鼧?gòu)造成對(duì)稱的數(shù)據(jù)序列,避免了子圖像輪廓處的跳躍和不連續(xù)現(xiàn)象。DCT變換也有快速算法(FDCT),在圖像編碼的應(yīng)用中,大都采用二維DCT變換。典型的變換編碼方法-離散余弦變換(DCT)

第八十六頁,共一百零三頁,2022年,8月28日?qǐng)D像塊的DCT變換(a)背景部分圖像塊的DCT;(b)細(xì)節(jié)部分圖像塊的DCT第八十七頁,共一百零三頁,2022年,8月28日Z字形掃描第八十八頁,共一百零三頁,2022年,8月28日混合編碼是近年來廣泛采用的方法,這種方法充分利用各種單一壓縮方法的長(zhǎng)處,以期在壓縮比和效率之間取得最佳的平衡。如廣泛流行的JPEG和MPEG壓縮方法都是典型的混合編碼方案。

5.混合編碼第八十九頁,共一百零三頁,2022年,8月28日§2.3.4圖像壓縮編碼標(biāo)準(zhǔn)制定圖像標(biāo)準(zhǔn)的國(guó)際組織是ISO(國(guó)際標(biāo)準(zhǔn)化組織)和CCITT(國(guó)際電報(bào)電話咨詢委員會(huì))靜止圖像:JPEG(JointPhotographicExpertGroup,聯(lián)合圖像專家組)通常為有損壓縮(采用DCT變換編碼),JPEG是目前靜態(tài)圖像壓縮比最高的,但失真的程度非常小也支持無損壓縮(采用預(yù)測(cè)編碼),但壓縮比降低(無損壓縮的壓縮比總有個(gè)極限)運(yùn)動(dòng)圖像:MPEG(MovingPictureExpertGroup,運(yùn)動(dòng)圖像專家組)第九十頁,共一百零三頁,2022年,8月28日1.JPEG壓縮流程編碼流程:解碼流程:量化器DCT變換構(gòu)造8x8的子圖輸入圖像符號(hào)編碼器壓縮數(shù)據(jù)量化表碼表壓縮數(shù)據(jù)符號(hào)解碼器DCT逆變換反量化器量化表輸出圖像碼表(從壓縮數(shù)據(jù)中得到)第九十一頁,共一百零三頁,2022年,8月28日顏色空間轉(zhuǎn)換JPEG使用的顏色空間不是RGB空間,而是YCbCr空間,在進(jìn)行DCT變換之前完成,這是因?yàn)槿搜蹖?duì)亮度信息更敏感,相互之間的轉(zhuǎn)換為:R=Y+1.40200(Cr–128)G=Y–0.34414(Cb–128)–0.71414(Cr–128)B=Y+1.77200(Cb–128)Y=0.299R+0.5870G+0.1140BCb=–0.1787R–0.3313G+0.5000B+128Cr=0.5000R–0.4187G–0.0813B+128第九十二頁,共一百零三頁,2022年,8月28日量化Y為亮度分量,需要細(xì)量化,C

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論