




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章 信源編碼理論n引言n音頻信號(hào)編碼n圖像信號(hào)編碼 2.1 引言-關(guān)于信源編碼 數(shù)字通信系統(tǒng)因具有許多優(yōu)點(diǎn)而成為當(dāng)今通信的發(fā)展方向。n在數(shù)字通信系統(tǒng)中,信道傳輸?shù)氖菙?shù)字信號(hào)。n但是在自然界中,很多信源輸出的是模擬量,如話音、圖像等。因此在利用數(shù)字通信系統(tǒng)進(jìn)行信息傳輸時(shí),首先需先對(duì)信號(hào)(模擬的)數(shù)字化,即A/D。n模擬信號(hào)的數(shù)字化屬于信源編碼的范疇。數(shù)字通信中的編碼概念n編碼和譯碼是數(shù)字通信發(fā)送與接收設(shè)備的重要組成部分。數(shù)字通信中的編碼概念(續(xù)) 數(shù)字通信系統(tǒng)中包含編碼和譯碼,編碼的逆過程是譯碼。數(shù)字通信中的編碼涉及兩部分,含義完全不同:n信源編碼n信道編碼信源編碼的作用 n作用之一是設(shè)法減
2、少碼元數(shù)目和降低碼元速率,即通常所說的數(shù)據(jù)壓縮。碼元速率將直接影響傳輸所占的帶寬,而傳輸帶寬又直接反映了通信的有效性。 我們所熟悉的典型的壓縮:音頻壓縮MP3 圖像壓縮JPEG、MPEG等n 作用之二是當(dāng)信息源給出的是模擬信號(hào)時(shí),信源編碼器將其轉(zhuǎn)換成數(shù)字信號(hào),以實(shí)現(xiàn)模擬信號(hào)的數(shù)字化傳輸。 模擬信號(hào)數(shù)字化傳輸?shù)姆绞接忻}沖編碼調(diào)制(PCM)和增量調(diào)制(M)、 ADPCM等。n作用之三是加密信道編碼n信道編碼是為了降低誤碼率,提高數(shù)字通信的可靠性而采取的編碼。n信道編碼技術(shù)的基本思想是通過對(duì)信息序列作某種變換,使原來彼此獨(dú)立,相關(guān)性極小的信息碼元產(chǎn)生某種相關(guān)性,從而在接收端利用這種規(guī)律檢查或糾正信息
3、碼元在信道傳輸中所造成的差錯(cuò)。n具體做法是信道編碼器對(duì)傳輸?shù)男畔⒋a元按一定的規(guī)則加入保護(hù)成分(監(jiān)督元),組成所謂“抗干擾編碼”。接收端的信道譯碼器按一定規(guī)則進(jìn)行解碼,從解碼過程中發(fā)現(xiàn)錯(cuò)誤或糾正錯(cuò)誤,從而提高通信系統(tǒng)抗干擾能力,實(shí)現(xiàn)可靠通信。n與信源編碼相反,信道編碼提高了可靠性。本章涉及內(nèi)容n語音信號(hào)的編碼問題-重點(diǎn)討論語音編碼的基本方法,包括波形編碼(脈沖編碼調(diào)制(PCM) ,對(duì)增量調(diào)制(M)、自適應(yīng)差分脈碼調(diào)制(ADPCM)、參數(shù)編碼(線性預(yù)測(cè)LP)、混合編碼(碼激勵(lì)線性預(yù)測(cè)CELP等。n圖像信號(hào)的編碼問題-壓縮編碼,如靜態(tài)圖像壓縮方法JPEG、動(dòng)態(tài)圖像壓縮方法MPEG等。 2.2 音頻信
4、號(hào)編碼n語音編碼概述n時(shí)域波形編碼n變換域編碼n參數(shù)編碼n混合編碼n各種音頻信號(hào)編碼方法的比較n現(xiàn)代語音處理技術(shù)及應(yīng)用語音編碼概述n 語音是人類進(jìn)行交流的重要手段,通信系統(tǒng)中最常見的數(shù)據(jù)形式就是語音。語音通信是人類通信最基本、最重要的方式之一。隨著移動(dòng)通信與互聯(lián)網(wǎng)的飛速發(fā)展,語音通信技術(shù)也在不斷地進(jìn)行更新并與之相融合。n語音信號(hào)的數(shù)字化傳輸和存儲(chǔ),在可靠性、抗干擾語音信號(hào)的數(shù)字化傳輸和存儲(chǔ),在可靠性、抗干擾能力、快速交換等方面遠(yuǎn)勝于模擬化,且靈活方便,易于保密,價(jià)格低廉,所以從20世紀(jì)50年代以來,數(shù)字化語音在通信系統(tǒng)中所占的比重越來越大。語音編碼是數(shù)字語音通信中的一項(xiàng)重要技術(shù)。n為了壓縮數(shù)字
5、語音傳輸?shù)谋忍芈?,以使同樣的信道容量能傳輸更多路的語音信號(hào),節(jié)省存儲(chǔ)空間,語音壓縮編碼也有了很大的發(fā)展,并在有線無線電話的話帶語音信號(hào)、會(huì)議電視的寬帶語音信號(hào)、HDTV和高保真音樂等的音頻信號(hào)等領(lǐng)域有廣泛的應(yīng)用。語音編碼算法語音編碼大致分為四種方式:n時(shí)域波形編碼-不基于聲學(xué)模型只針對(duì)語音波形進(jìn)行編碼n變換域編碼-不基于聲學(xué)模型的編碼方法n參數(shù)編碼-參數(shù)編碼是基于聲學(xué)模型的編碼方法n混合編碼-結(jié)合上述幾種編碼方式的優(yōu)點(diǎn) 有時(shí)也將時(shí)域的波形編碼和變換域編碼統(tǒng)稱波形編碼,因此也可以稱語音編解碼算法分為波形編碼、參數(shù)編碼(聲碼器)和混合編碼三類。 2.2.1 時(shí)域波形編碼n 時(shí)域波形編碼不基于聲學(xué)模
6、型只針對(duì)語音波形進(jìn)行編碼。這種方法在降低量化每個(gè)語音樣本比特?cái)?shù)的同時(shí),又保持了相對(duì)良好的語音質(zhì)量。n波形編碼主要有脈沖編碼調(diào)制(PCM)、增量調(diào)制(M)、自適應(yīng)增量調(diào)制(ADM)、自適應(yīng)差分脈碼調(diào)制(ADPCM) 等。一、 采用PCM的模擬信號(hào)數(shù)字傳輸系統(tǒng)m(t)模擬隨機(jī)信號(hào)mo(t)模擬隨機(jī)信號(hào)ak數(shù)字隨機(jī)序列ak數(shù)字隨機(jī)序列模擬信息源受信者數(shù)字傳輸系統(tǒng)抽樣、量化和編碼譯碼和低通濾波PCM數(shù)字化的過程一般分三步:抽樣量化編碼m(t)akn “抽樣”指抽取樣值,或抽取樣點(diǎn),抽樣的多少對(duì)通信的性能指標(biāo)有決定影響。0 ,“1” 0,“0”段落序號(hào)段落碼C2 c3 c4876543211 1 11
7、1 01 0 11 0 00 1 10 1 00 0 10 0 0電平序號(hào)段內(nèi)碼電平序號(hào)段內(nèi)碼c5c6c7c8c5c6c7c8151413121110981 1 1 11 1 1 01 1 0 11 1 0 01 0 1 11 0 1 01 0 0 11 0 0 0 765432100 1 1 10 1 1 00 1 1 00 1 0 10 0 1 10 0 1 00 0 0 10 0 0 0(三)(三)編碼方法逐次比較法原理圖:PCM碼流速率計(jì)算:PCM系統(tǒng)的抗噪性能 3)總信噪比:NeNOPNS2202412二、 自適應(yīng)差分脈沖編碼調(diào)制(ADPCM) 64kb/s的A律或律的對(duì)數(shù)壓擴(kuò)PCM
8、編碼已經(jīng)在大容量的光纖通信系統(tǒng)和數(shù)字微波系統(tǒng)中得到了廣泛的應(yīng)用。 但PCM信號(hào)占用頻帶要比模擬通信系統(tǒng)中的一個(gè)標(biāo)準(zhǔn)話路帶寬(3.1 kHz)寬很多倍,這樣,對(duì)于大容量的長(zhǎng)途傳輸系統(tǒng),采用PCM的經(jīng)濟(jì)性能很難與模擬通信相比。 以較低的速率獲得高質(zhì)量編碼,一直是語音編碼追求的目標(biāo)。通常,人們把話路速率低于64kb/s的語音編碼方法, 稱為語音壓縮編碼技術(shù)。 語音壓縮編碼方法很多,其中, 自適應(yīng)差分脈沖編碼調(diào)制是語音壓縮中復(fù)雜度較低的一種編碼方法,它可在32kb/s的比特率上達(dá)到64kb/s的PCM數(shù)字電話質(zhì)量。近年來,ADPCM已成為長(zhǎng)途傳輸中一種新型的國(guó)際通用的語音編碼方法(G.721)。 AD
9、PCM ADPCM是在差分脈沖編碼調(diào)制(DPCM)的基礎(chǔ)上發(fā)展起來的,為此,下面先介紹DPCM的編碼原理與系統(tǒng)框圖。 由于相鄰樣值的差值比樣值本身小,可以用較少的比特?cái)?shù)表示差值。這樣,用樣點(diǎn)之間差值的編碼來代替樣值本身的編碼, 可以在量化臺(tái)階不變的情況下(即量化噪聲不變),編碼位數(shù)顯著減少,信號(hào)帶寬大大壓縮。這種利用差值的PCM編碼稱為差分PCM(DPCM)。 在PCM中,每個(gè)波形樣值都獨(dú)立編碼,與其他樣值無關(guān), 這樣,樣值的整個(gè)幅值編碼需要較多位數(shù),比特率較高, 造成數(shù)字化的信號(hào)帶寬大大增加。然而,大多數(shù)以奈奎斯特或更高速率抽樣的信源信號(hào)在相鄰抽樣間表現(xiàn)出很強(qiáng)的相關(guān)性, 有很大的冗余度。利用
10、信源的這種相關(guān)性,一種比較簡(jiǎn)單的解決方法是對(duì)相鄰樣值的差值而不是樣值本身進(jìn)行編碼。1、DPCM如果將樣值之差仍用N位編碼傳送,則DPCM的量化信噪比顯然優(yōu)于PCM系統(tǒng)。 實(shí)現(xiàn)差分編碼的一個(gè)好辦法是根據(jù)前面的k個(gè)樣值預(yù)測(cè)當(dāng)前時(shí)刻的樣值。編碼信號(hào)只是當(dāng)前樣值與預(yù)測(cè)值之間的差值的量化編碼。DPCM系統(tǒng)原理框圖qPqnnnqnDPCMNSGnEeEeExEnExENs)()(222222 式中,(S/N)q是把差值序列作為信號(hào)時(shí)量化器的量化信噪比,與PCM系統(tǒng)考慮量化誤差時(shí)所計(jì)算的信噪比相當(dāng)。Gp可理解為DPCM系統(tǒng)相對(duì)于PCM系統(tǒng)而言的信噪比增益,稱為預(yù)測(cè)增益。如果能夠選擇合理的預(yù)測(cè)規(guī)律,差值功率E
11、e2n就能遠(yuǎn)小于信號(hào)功率Ex2n,Gp就會(huì)大于1,該系統(tǒng)就能獲得增益。對(duì)DPCM系統(tǒng)的研究就是圍繞著如何使Gp和(S/N)q 這兩個(gè)參數(shù)取最大值而逐步完善起來的。通常Gp約為611 dB。 因此DPCM系統(tǒng)總的量化信噪比可表示為 可見,DPCM系統(tǒng)總的量化信噪比遠(yuǎn)大于量化器的信噪比。因此, 要求DPCM系統(tǒng)達(dá)到與PCM系統(tǒng)相同的信噪比,則可降低對(duì)量化器信噪比的要求,即可減小量化級(jí)數(shù),從而減少碼位數(shù),降低比特率。2、ADPCM值得注意的是,DPCM系統(tǒng)性能的改善是以最佳的預(yù)測(cè)和量化為前提的。但對(duì)語音信號(hào)進(jìn)行預(yù)測(cè)和量化是復(fù)雜的技術(shù)問題,這是因?yàn)檎Z音信號(hào)在較大的動(dòng)態(tài)范圍內(nèi)變化。為了能在相當(dāng)寬的變化范
12、圍內(nèi)獲得最佳的性能,只有在DPCM基礎(chǔ)上引入自適應(yīng)系統(tǒng)。有自適應(yīng)系統(tǒng)的DPCM稱為自適應(yīng)差分脈沖編碼調(diào)制,簡(jiǎn)稱ADPCM。 ADPCM的主要特點(diǎn)是用自適應(yīng)量化取代固定量化,用自適應(yīng)預(yù)測(cè)取代固定預(yù)測(cè)。自適應(yīng)量化指量化臺(tái)階隨信號(hào)的變化而變化,使量化誤差減小;自適應(yīng)預(yù)測(cè)指預(yù)測(cè)器系數(shù)可以隨信號(hào)的統(tǒng)計(jì)特性而自適應(yīng)調(diào)整,提高了預(yù)測(cè)信號(hào)的精度, 從而得到高預(yù)測(cè)增益。 通過這兩點(diǎn)改進(jìn),可大大提高輸出信噪比和編碼動(dòng)態(tài)范圍。 如果DPCM的預(yù)測(cè)增益為611dB,自適應(yīng)預(yù)測(cè)可使信噪比改善4 dB;自適應(yīng)量化可使信噪比改善47dB,則ADPCM比PCM可改善1422dB,相當(dāng)于編碼位數(shù)可以減小 3 位到 4 位。 因
13、此,在維持相同的語音質(zhì)量下,ADPCM允許用32 kb/s比特率編碼,這是標(biāo)準(zhǔn)64kb/s PCM的一半。 因此,在長(zhǎng)途傳輸系統(tǒng)中 ,ADPCM有著遠(yuǎn)大的前景。相應(yīng)地,CCITT也形成了關(guān)于ADPCM系統(tǒng)的規(guī)范建議G.721 、 G.726等。 ADPCM(續(xù))(續(xù))三、 增量調(diào)制( M或DM)1、與PCM區(qū)別 PCM碼表示樣值大小,N位碼,M代碼表示相鄰樣值的關(guān)系,一位碼,是DPCM的特例。2 、M 基本原理 (1).編碼 M波形示意e(ti)=m(ti-)-m(ti-)0e(ti)=m(ti-)-m(ti-)0輸出1 ,上升一個(gè)臺(tái)階s輸出0,下降一個(gè)臺(tái)階s 波形編碼小結(jié) PCM、M、ADP
14、CM是基于時(shí)域的波形編碼技術(shù),不基于聲學(xué)模型。 波形編碼器作用于所有輸入信號(hào),因此會(huì)產(chǎn)生高質(zhì)量的樣值。然而,波形編碼器工作在高比特率。 例如:ITU-G.711規(guī)范(PCM)用的比特率為64kbps。 *引出其它編碼,目的是降低比特率,提高有效性。 2.2.2 變換域編碼-頻域編碼 變換域編碼方式也是不基于聲學(xué)模型的編碼方法,但對(duì)信號(hào)進(jìn)行頻域處理,再編碼。 典型的變換域編碼有子帶編碼(SBC)子帶編碼(subband coding,SBC) SBC利用帶通濾波器將語音頻帶分成若干子帶,并且分別進(jìn)行采樣、編碼,編碼方式可以用ADPCM或ADM,SBC速率可以達(dá)到96kbs。 可變SBC可使子帶的
15、設(shè)計(jì)不固定,而是隨共振峰變化,使編碼效率進(jìn)一步提高,這種方式在碼率為48kbs時(shí)可具有相當(dāng)于72kbs的固定SBC的語音質(zhì)量。SBC原理框圖(a) 編碼器 (b)解碼器 子帶編碼應(yīng)用n1976年子帶編碼技術(shù)首次被美國(guó)貝爾實(shí)驗(yàn)室的R. E. Crochiere等人應(yīng)用于語音編碼。n子帶編碼器SBC愈來愈受到重視。在中等速率的編碼系統(tǒng)中,SBC的動(dòng)態(tài)范圍寬、音質(zhì)高、成本低。使用子帶編碼技術(shù)的編譯碼器已開始用于話音存儲(chǔ)轉(zhuǎn)發(fā)(voice store-and-forward)和話音郵件,采用2個(gè)子帶和ADPCM的編碼系統(tǒng)也已由CCITT作為G.722標(biāo)準(zhǔn)向全世界推薦使用。 n1986年Woods等將子帶
16、編碼又引入到圖像編碼,此后子帶編碼在視頻信號(hào)壓縮領(lǐng)域得到了很大發(fā)展。目前,已經(jīng)研制出采用子帶編碼技術(shù)的具有演播室質(zhì)量的140Mbps HDTV硬件編解碼系統(tǒng)。 2.2.3 參數(shù)編碼(參量編碼)n與波形編碼不同,參量編碼又稱為聲源編碼(聲碼器),是將信源信號(hào)提取特征參量,并將其變換成數(shù)字代碼進(jìn)行傳輸。解碼為其反過程,將收到的數(shù)字序列經(jīng)變換恢復(fù)特征參量,再根據(jù)特征參量重建語音信號(hào)。n具體說,參量編碼是通過對(duì)語音信號(hào)特征參數(shù)的提取和編碼,力圖使重建語音信號(hào)具有盡可能高的可靠性,即保持原語音的語意,但重建信號(hào)的波形同原語音信號(hào)的波形可能會(huì)有相當(dāng)大的差別。n這種編碼技術(shù)可實(shí)現(xiàn)低速率語音編碼,比特率可壓縮
17、到2Kbit/s-4.8Kbit/s,甚至更低,但語音質(zhì)量只能達(dá)到中等,特別是自然度較低,連熟人都不一定能聽出講話人是誰。線性預(yù)測(cè)編碼(LPC)及其它各種改進(jìn)型都屬于參量編碼。聲碼器n聲碼器(vocoder)不會(huì)再生原始波形。這組編碼器會(huì)提取一組參數(shù),這組參數(shù)被送到接收端,用來導(dǎo)出語音產(chǎn)生模形。聲碼器質(zhì)量n在電話系統(tǒng)中使用聲碼器,語音質(zhì)量不夠好。 n對(duì)于語音數(shù)據(jù),人們已經(jīng)找到了較合理的聲道模型,聲音數(shù)據(jù)的參數(shù)編碼方法就是基于聲音參數(shù)的分析與合成來實(shí)現(xiàn)的。聲道模型在聲音合成等領(lǐng)域也有成功應(yīng)用。n統(tǒng)計(jì)表明,語音過程是一個(gè)近似的短時(shí)隨機(jī)過程。所謂短時(shí),是指在1030ms的范圍。由于這一性質(zhì),使一幀一
18、幀地處理語音信號(hào)成為可能,每一幀的信號(hào)近似滿足同一模型,提取模型參數(shù)即可再現(xiàn)信號(hào)。這是方法假設(shè)的基本前提。實(shí)際應(yīng)用中,每幀取20ms。語音參數(shù)編碼原理n語音生成機(jī)構(gòu)模型: 聲源。聲源分三類:元音:由聲帶的自激振動(dòng)所產(chǎn)生;摩擦音:靠聲道變窄時(shí)氣流所產(chǎn)生的喘流噪聲產(chǎn)生;爆破音:由閉合的聲道急速打開時(shí)形成的脈沖波所產(chǎn)生的喘流噪聲所產(chǎn)生。模型中用基音周期基音周期參數(shù)描述聲源。 共鳴機(jī)構(gòu),也稱聲道。由鼻腔、口腔與舌頭組成。模型中用共振峰共振峰參數(shù)描述。 放射機(jī)構(gòu):由嘴唇和鼻孔組成,其功能是發(fā)出聲音并傳播出去。模型中用語音譜和聲強(qiáng)語音譜和聲強(qiáng)參數(shù)描述。常用語音參數(shù)-基音周期、共振峰、語音譜、聲強(qiáng)等。 分幀
19、:聲音變?yōu)閹蛄衒1,f2,。 計(jì)算每一幀fi的參數(shù)向量(基音周期,共振峰,語音譜,聲強(qiáng))i。 直接傳送參數(shù)向量或?qū)?shù)向量進(jìn)行矢量量化。語音參數(shù)編碼過程:LPCn線性預(yù)測(cè)編碼(LPC)用來獲取一時(shí)變數(shù)字濾波器的參數(shù)。這個(gè)濾波器用來模擬說話人的聲道輸出。n 由圖一中所示,聲音的產(chǎn)生被模擬成聲源和聲道兩個(gè)部分構(gòu)成。聲源為噪聲和脈沖兩種,聲道相當(dāng)于一個(gè)濾波器,氣管口腔形狀不同相當(dāng)于聲道濾波器的參數(shù)不同,最后就生成不同聲音。 參數(shù)編碼小結(jié)n參數(shù)編碼數(shù)據(jù)量小,但計(jì)算量很大。n由于聲音從發(fā)聲模型出發(fā),不是從波形出發(fā)仿真,保真難度大,目前的保真度還很差。例如,某人說了一句話,分析出參數(shù)再由參數(shù)合成的聲音,
20、能聽出這段話的字句就合格了,聽起來不是機(jī)器語言,即自然度好一些已相當(dāng)不錯(cuò)了,要能聽出誰在說話就不容易。n由于壓縮比高,成本低,很多低檔的學(xué)習(xí)機(jī)就是采用了這種語音壓縮方式,出來的聲音生硬、含混不清、毫無語感,對(duì)英語的語音學(xué)習(xí)不但毫無幫助,而且會(huì)誤導(dǎo)正確的語音學(xué)習(xí)。 2.2.4 混合型編碼n 混合編碼則是在波形編碼和參數(shù)編碼的基礎(chǔ)上,以相對(duì)較低的比特率上獲得較高的語音質(zhì)量,所以其數(shù)據(jù)率和音質(zhì)介于二者之間。n 當(dāng)波形編碼的比特率每聲道低于16kbps后,音質(zhì)下降很快。而參數(shù)法由于機(jī)理本身就是一種模擬,比特率上升到10kbps以上后再上升音質(zhì)也沒有多少改善。n所以,兩者結(jié)合的混合編碼法就被消費(fèi)類電子公
21、司開發(fā)出來。 發(fā)展與應(yīng)用n計(jì)算機(jī)的發(fā)展為語音編碼技術(shù)的研究提供了強(qiáng)有力的工具,大規(guī)模、超大規(guī)模集成電路的出現(xiàn),則為語音編碼的實(shí)現(xiàn)提供了基礎(chǔ)。n80年代以來,語音編碼技術(shù)有了實(shí)質(zhì)性的進(jìn)展,產(chǎn)生了新一代的編碼算法,這就是混合編碼。它將波形編碼的高質(zhì)量和參量編碼的低數(shù)據(jù)速率組合起來,克服了原有波形編碼和參量編碼的弱點(diǎn),結(jié)合各自的長(zhǎng)處,力圖保持波形編碼的高質(zhì)量和參量編碼的低速率,在4-16Kbit/s速率上能夠得到高質(zhì)量的合成語音。n目前較為成功的混合型編碼方案有多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPLPC)和碼激勵(lì)線性預(yù)測(cè)編碼(CELP)。n很顯然,混合編碼是適合于數(shù)字移動(dòng)通信的語音編碼技術(shù)。 LDCELPn
22、低時(shí)延碼激勵(lì)線性預(yù)測(cè)編碼 是Low Delay-Code Excited Linear Prediction的縮寫。16kbits LDCELP是CCITT G.728語音編碼標(biāo)準(zhǔn)算法,這種法在CELP算法的基礎(chǔ)上,采用后向自適應(yīng)線性預(yù)測(cè)、50階合成濾波、短激勵(lì)矢量(5個(gè)樣值)等改進(jìn)方法,從而達(dá)到高質(zhì)量和低時(shí)延的目的,總的編碼時(shí)延小于2ms。 RPE/LTPn規(guī)則脈沖激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)線性預(yù)測(cè)編碼 是Regular Pulse Excited-Long Term Predition-Linear Predictive Coding的縮寫。這種算法是MPE-LPC的改進(jìn)算法,除了增加長(zhǎng)時(shí)預(yù)測(cè)功能外,激
23、勵(lì)脈沖的位置具有一定的規(guī)律。這種算法是歐洲900MHz數(shù)字蜂窩移動(dòng)電話的語音編碼標(biāo)準(zhǔn)(GSM),也為數(shù)字蜂窩系統(tǒng)DCS1800所采用。 MPE-LPC(多脈沖線性預(yù)測(cè)編碼) n多脈沖線性預(yù)測(cè)編碼 是Multi-Pulse Excited LPC的縮寫。這種算法在一幀語音中選擇幾十個(gè)典型脈沖作為激勵(lì)信號(hào)。INMARSAT的9.6kbits語音編碼航空標(biāo)準(zhǔn)采用這種算法。 VSELPVSELP(矢量和激勵(lì)線性預(yù)測(cè)編碼) n矢量和激勵(lì)線性預(yù)測(cè)編碼 是Vector Sum Excited Linear Prediction的縮寫。這種算法采用三個(gè)碼本作為激勵(lì)信號(hào),其中兩個(gè)是隨機(jī)碼本,一個(gè)是自適應(yīng)碼本,最
24、終的激勵(lì)信號(hào)是三個(gè)激勵(lì)矢量的和。美國(guó)電信工業(yè)協(xié)會(huì)(TIA)選擇8kbits VSELP算法作為北美第一代數(shù)字蜂窩移動(dòng)電話的編碼標(biāo)準(zhǔn)(IS54)。日本的全速率數(shù)字移動(dòng)電話也采用VSELP算法作為語音編碼標(biāo)準(zhǔn)(JDC),速率為6.7kbits。 2.2.5 各種音頻信號(hào)編碼方法的比較編碼方法傳輸速率(kb/s)最小基帶帶寬(kHz)質(zhì)量PCMADPCMSBC+ADPCMMSBC(子帶)RPE/LTP(規(guī)則脈沖激勵(lì))LD-CELP(低延遲碼激勵(lì))MPE/LPC(多脈沖)CELP(碼本激勵(lì))LPC(線性預(yù)測(cè))LPC+VQ(矢量量化)6432643216161632163216888
25、長(zhǎng)途電話質(zhì)量長(zhǎng)途電話質(zhì)量廣播質(zhì)量通信質(zhì)量通信質(zhì)量通信質(zhì)量接近長(zhǎng)途質(zhì)量通信質(zhì)量通信質(zhì)量合成質(zhì)量合成質(zhì)量電話質(zhì)量的音頻(0.3-3.4K kHz )G728, LD-CELP 16kb/s ,GSM ,RPE/LTP, 13kb/s ,(歐洲移動(dòng))GTIA ,VSELP, 8kb/s (美國(guó)移動(dòng))NSA ,CELP,4.8 kb/s NSA ,LPC,2.4kb/s 調(diào)幅廣播質(zhì)量的音頻n50Hz-7kHz n采樣率16KHz ,14bit 量化,PCM碼率224Kb/s, 采用G.722(子帶)標(biāo)準(zhǔn)可壓縮到64Kb/s,適于ISDN的B信道,傳輸高質(zhì)量語音。高保真立體聲音頻壓縮
26、標(biāo)準(zhǔn)n即CD音質(zhì)音頻20Hz-20KHzn采樣率44.1kHz,,16位量化,立體聲n數(shù)據(jù)量為 44.1*16b*2=1411.2kb/s=176.4KB/sn1小時(shí)為 176.4KB/s*3600s=635MB n目前,采用MPEG音頻標(biāo)準(zhǔn),有三層(第三層MP3),采用子帶及熵編碼技術(shù),可壓縮到每聲道32kb/s-448kb/sMP3及其基本原理nMP3就是采用國(guó)際標(biāo)準(zhǔn)MPEG中的第三層音頻壓縮模式,對(duì)聲音信號(hào)進(jìn)行壓縮的一種格式,中文也稱電腦網(wǎng)絡(luò)音樂。MPEG中的第三層音頻壓縮模式比第一層和第二層編碼要復(fù)雜得多,但音質(zhì)最高,可與CD音質(zhì)相比。多媒體視聽業(yè)務(wù)音頻 nITU關(guān)于電視電話系統(tǒng)和終端
27、設(shè)備的技術(shù)標(biāo)準(zhǔn)針H.320用于ISDN網(wǎng),不適合窄帶電話網(wǎng),而H.324既適合高速數(shù)字網(wǎng),也適合在普通電話之類的窄帶網(wǎng)上使用,H.323標(biāo)準(zhǔn)用于質(zhì)量不能保證的局域網(wǎng)LANn在H.320中,語音編碼標(biāo)準(zhǔn)為G.711(64 kb/s )、G.722(64 kb/s )、G.728(16 kb/s ),nH.324分配給語音帶寬6.5 kb/s (高采用MP-MLQCELP)和5.3K(低采用ACELP),采用的語音壓縮標(biāo)準(zhǔn)為G.723nH.323系統(tǒng)語音壓縮方法有6種,即G.711(64 kb/s )、G.722(64 kb/s )、G.728(16 kb/s )、G.723、G.729、MPEG
28、 AUDIO 2.2.6 現(xiàn)代語音處理技術(shù)及應(yīng)用 2.3 圖像信號(hào)的壓縮n圖像信號(hào)壓縮的必要性n圖像信號(hào)壓縮基礎(chǔ)n圖像壓縮編碼方法n圖像壓縮編碼標(biāo)準(zhǔn) 2.3.1圖像信號(hào)壓縮的必要性n與文字信息不同,圖像信息占據(jù)大量的存儲(chǔ)容量,而且傳輸?shù)膸捰邢辬例1:一張A4(210mm297mm) 大小的照片,若用中等分辨率(300dpi)的掃描儀按真彩色掃描,其數(shù)據(jù)量為多少?(注:dpi表示每英寸像素,1英寸25.4mm)n若按每像素3個(gè)字節(jié)計(jì)算,上述結(jié)果為約26Mn例2:目前的WWW互聯(lián)網(wǎng)包含大量的圖像信息,如果圖像信息的數(shù)據(jù)量太大,會(huì)使本來就已經(jīng)非常緊張的網(wǎng)絡(luò)帶寬變得更加不堪重負(fù)(World Wide
29、 Web變成了World Wide Wait)圖像信號(hào)壓縮的必要性(續(xù))n視頻數(shù)據(jù)量:n對(duì)于電視畫面的分辨率640*480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為:640*480*24*30=221.12Mbit/s=28MB/sn實(shí)時(shí)傳輸:在10M帶寬網(wǎng)上實(shí)時(shí)傳輸?shù)脑?,需要壓縮到原來數(shù)據(jù)量的0.045n存儲(chǔ): 1張CD可存640MB,如果不進(jìn)行壓縮,1張CD則僅可以存放20幾秒的數(shù)據(jù)n可見,單純依靠增加存儲(chǔ)器容量和改善信道帶寬無法滿足需求,必須進(jìn)行壓縮 2.3.2 圖像壓縮編碼基礎(chǔ)圖像數(shù)據(jù)的壓縮機(jī)理來自兩個(gè)方面:n一是利用圖像中存在大量冗余度可供壓縮;n二是利用人眼的視覺特性。(1)空間冗
30、余在一幅圖像中規(guī)則的物體和規(guī)則的背景具有很強(qiáng)的相關(guān)性。 (2)時(shí)間冗余電視圖像序列中相鄰兩幅圖像之間有較大的相關(guān)性。(3)結(jié)構(gòu)冗余和知識(shí)冗余圖像從大面積上看常存在有紋理結(jié)構(gòu),稱之為結(jié)構(gòu)冗余。(4)視覺冗余人眼的視覺系統(tǒng)對(duì)于圖像的感知是非均勻和非線性的,對(duì)圖像的變化并不都能察覺出來。1圖像數(shù)據(jù)的冗余度(1)亮度辨別閾值 當(dāng)景物的亮度在背景亮度基礎(chǔ)上增加很少時(shí),人眼是辨別不出的,只有當(dāng)亮度增加到某一數(shù)值時(shí),人眼才能感覺其亮度有變化。人眼剛剛能察覺的亮度變化值稱為亮度辨別閾值。2人眼的視覺特性n(2)視覺閾值視覺閾值是指干擾或失真剛好可以被察覺的門限值,低于它就察覺不出來,高于它才看得出來,這是一個(gè)
31、統(tǒng)計(jì)值。n(3)空間分辨力空間分辨力是指對(duì)一幅圖像相鄰像素的灰度和細(xì)節(jié)的分辨力,視覺對(duì)于不同圖像內(nèi)容的分辨力不同。n(4)掩蓋效應(yīng)“掩蓋效應(yīng)”是指人眼對(duì)圖像中量化誤差的敏感程度,與圖像信號(hào)變化的劇烈程度有關(guān)。圖像壓縮的可能性與基本思想n各種冗余和視覺特性就是壓縮圖象數(shù)據(jù)的出發(fā)點(diǎn)和依據(jù)。圖象編碼的目的就在于采用各種方法去除冗余和不太重要的部分內(nèi)容,以盡量少的數(shù)據(jù)量來表示個(gè)重建圖象。n壓縮編碼技術(shù)能夠很好地解決在將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)后所產(chǎn)生的帶寬需求增加的問題, 它是使數(shù)字信號(hào)走上實(shí)用化的關(guān)鍵技術(shù)之一。 2.3.3 圖像壓縮的方法n圖像壓縮方法有很多種,而且很多方法還在不斷地發(fā)展和完善。從不同
32、的角度出發(fā)有不同的分類方法。1.根據(jù)解壓重建后的圖像與原始圖像是否有誤差,可分為無損壓縮與有損壓縮兩大類;圖像壓縮的方法(續(xù))2. 根據(jù)實(shí)施編碼所在的數(shù)據(jù)域可分為空間域和變換域編碼(1)基于圖像信源統(tǒng)計(jì)特性的壓縮方法,有預(yù)測(cè)編碼、變換編碼、矢量量化編碼、子帶小波編碼和神經(jīng)網(wǎng)絡(luò)編碼法等。(2)基于人眼視覺特性的壓縮方法,有基于方向?yàn)V波的圖像編碼法和基于圖像輪廓紋理的編碼法等。(3)基于圖像景物特征的壓縮方法,有分形編碼法和基于模型的編碼方法等。3.根據(jù)壓縮機(jī)理的不同,數(shù)據(jù)壓縮編碼根據(jù)壓縮機(jī)理的不同,數(shù)據(jù)壓縮編碼方法大致可以分成三類方法大致可以分成三類圖像壓縮的方法圖像壓縮有損壓縮無損壓縮行程編碼
33、LZW編碼哈夫曼編碼算術(shù)編碼無損預(yù)測(cè)編碼位平面編碼有損預(yù)測(cè)編碼分形編碼模型編碼子帶編碼神經(jīng)網(wǎng)絡(luò)編碼變換編碼K-L變換Haar變換Walsh.Hadamard變換離散余弦變換離散傅立葉變換斜變換小波變換衡量一個(gè)壓縮編碼方法優(yōu)劣的重要指標(biāo)n(1)壓縮比要高,有幾倍、幾十倍,也有幾百乃至幾千倍;(2)壓縮與解壓縮要快,算法要簡(jiǎn)單,硬件實(shí)現(xiàn)容易;(3)解壓縮的圖像質(zhì)量要好。n需要說明的是選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特征;多媒體系統(tǒng)(硬件和 軟件產(chǎn)品)的適應(yīng)能力;應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。 幾種典型的圖像壓縮方法原理n霍夫曼(Huffman)編碼n游程編碼n預(yù) 測(cè) 編 碼n變換編碼n混合編碼
34、1. 霍夫曼(Huffman)編碼 霍夫曼(Huffman)編碼是一種可變長(zhǎng)編碼, 編碼方法如下圖所示。 (1) 將輸入信號(hào)符號(hào)以出現(xiàn)概率由大至小為序排成一列。 (2) 將兩處最小概率的符號(hào)相加合成為一個(gè)新概率, 再按出現(xiàn)概率的大小排序。 (3) 重復(fù)步驟(2), 直至最終只剩兩個(gè)概率。 (4) 編碼從最后一步出發(fā)逐步向前進(jìn)行, 概率大的符號(hào)賦予“0”碼, 另一個(gè)概率賦予“1”碼, 直至到達(dá)最初的概率排列為止。 霍夫曼(Huffman)編碼 將最常出現(xiàn)(概率大的)的符號(hào)用最短的編碼,最少出現(xiàn)的符號(hào)用最長(zhǎng)的編碼。n游程編碼(RLC, Run Length Coding)是一種十分簡(jiǎn)單的壓縮方法,
35、 它將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一的記號(hào)來表示。 例如, 字符串5310000000000110000000012000000000000可以壓縮為5310-10110-08120-12, 其中, “-”后面兩個(gè)數(shù)字是“-”前面數(shù)字的連續(xù)個(gè)數(shù)。 游程編碼的壓縮率不高, 但編碼、 解碼的速度快, 仍被得到廣泛的應(yīng)用, 特別是在變換編碼后再進(jìn)行游程編碼, 有很好的效果。 2. 游程編碼3.預(yù) 測(cè) 編 碼n(1) 預(yù)測(cè)編碼基本原理n預(yù)測(cè)編碼是根據(jù)某一模型利用過去的樣值對(duì)當(dāng)前樣值進(jìn)行預(yù)測(cè),然后將當(dāng)前樣值的實(shí)際值與預(yù)測(cè)值相減得到一個(gè)誤差值,只對(duì)這一預(yù)測(cè)誤差值進(jìn)行編碼。 -DPCMn(2) 預(yù)測(cè)方法n1)
36、幀內(nèi)預(yù)測(cè)n幀內(nèi)預(yù)測(cè)利用圖像信號(hào)的空間相關(guān)性來壓縮圖像的空間冗余,根據(jù)前面已經(jīng)傳送的同一幀內(nèi)的像素來預(yù)測(cè)當(dāng)前像素。n2)幀間預(yù)測(cè)n電視圖像在相鄰幀之間存在很強(qiáng)的相關(guān)性。3.預(yù) 測(cè) 編 碼(續(xù))n圖像變換編碼是將空間域里描述的圖像, 經(jīng)過某種變換(如傅立葉變換、 離散余弦變換、 沃爾什變換等)在變換域中進(jìn)行描述。 這樣可以將圖像能量在空間域的分散分布變?yōu)樵谧儞Q域的相對(duì)集中分布, 便于用“Z”(zig-zag)字形掃描、 自適應(yīng)量化、 變長(zhǎng)編碼等進(jìn)一步處理, 完成對(duì)圖像信息的有效壓縮。4. 變換編碼n 變換編碼將被處理數(shù)據(jù)按照某種變換規(guī)則映射到另一個(gè)域中去處理, 圖像編碼采用二維正交變換的方式, 若
37、將整個(gè)圖像作為一個(gè)二維矩陣, 變換編碼的計(jì)算量太大。 所以將一幅圖像分成一個(gè)個(gè)小圖像塊, 通常是88或1616小方塊, 每個(gè)圖像塊可以看成為一個(gè)二維數(shù)據(jù)矩陣, 變換編碼以這些小圖像塊為單位進(jìn)行, 變換編碼把統(tǒng)計(jì)上密切相關(guān)的像素構(gòu)成的矩陣通過線性正交變換, 變成統(tǒng)計(jì)上較為相互獨(dú)立, 甚至完全獨(dú)立的變換系數(shù)所構(gòu)成的矩陣。 n在常用的正交變換中, DCT(Discrete Cosine Transform)變換的性能接近最佳, 是一種準(zhǔn)最佳變換。 DCT變換矩陣與圖像內(nèi)容無關(guān), 是因?yàn)樗鼧?gòu)造成對(duì)稱的數(shù)據(jù)序列, 避免了子圖像輪廓處的跳躍和不連續(xù)現(xiàn)象。 DCT變換也有快速算法(FDCT), 在圖像編碼的
38、應(yīng)用中, 大都采用二維DCT變換。 典型的變換編碼方法-離散余弦變換(DCT) 圖像塊的DCT變換(a) 背景部分圖像塊的DCT; (b) 細(xì)節(jié)部分圖像塊的DCTZ字形掃描n混合編碼是近年來廣泛采用的方法, 這種方法充分利用各種單一壓縮方法的長(zhǎng)處, 以期在壓縮比和效率之間取得最佳的平衡。 如廣泛流行的JPEG和MPEG壓縮方法都是典型的混合編碼方案。 5. 混合編碼 2.3.4 圖像壓縮編碼標(biāo)準(zhǔn)n制定圖像標(biāo)準(zhǔn)的國(guó)際組織是ISO(國(guó)際標(biāo)準(zhǔn)化組織)和CCITT(國(guó)際電報(bào)電話咨詢委員會(huì))n靜止圖像:JPEG(Joint Photographic Expert Group,聯(lián)合圖像專家組)n通常為有損
39、壓縮(采用DCT變換編碼),JPEG是目前靜態(tài)圖像壓縮比最高的,但失真的程度非常小n也支持無損壓縮(采用預(yù)測(cè)編碼),但壓縮比降低(無損壓縮的壓縮比總有個(gè)極限)n運(yùn)動(dòng)圖像:MPEG(Moving Picture Expert Group,運(yùn)動(dòng)圖像專家組)1.JPEG壓縮流程n編碼流程:n解碼流程:量化器DCT變換構(gòu)造8x8的子圖輸入圖像符號(hào)編碼器壓縮數(shù)據(jù)量化表碼表壓縮數(shù)據(jù)符號(hào)解碼器DCT逆變換反量化器量化表輸出圖像碼表(從壓縮數(shù)據(jù)中得到)顏色空間轉(zhuǎn)換nJPEG使用的顏色空間不是RGB空間,而是YCbCr空間,在進(jìn)行DCT變換之前完成,這是因?yàn)槿搜蹖?duì)亮度信息更敏感,相互之間的轉(zhuǎn)換為:R = Y +
40、 1.40200(Cr 128)G = Y 0.34414(Cb 128) 0.71414(Cr 128)B = Y + 1.77200(Cb 128)Y = 0.299R + 0.5870G + 0.1140BCb = 0.1787R 0.3313G +0.5000B +128Cr = 0.5000R 0.4187G 0.0813B + 128量化nY為亮度分量,需要細(xì)量化,CbCr為色度分量,可以粗量化,因此量化表有2張),從而提高壓縮比nDCT變換之后n低頻分量集中在左上角,代表直流(DC)系數(shù),由于兩個(gè)相鄰的子塊DC系數(shù)相差很小,采用差分編碼(DPCM),可以提高壓縮比n后面的63個(gè)元素為高頻分量,代表交流(AC)系數(shù),采用行程編碼,通過“之”字型(Zigzag)排列方法來保證低頻分量先出現(xiàn),高頻分量后出現(xiàn)JPEG壓縮前后的比較nCompression Ratio 8.91
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《機(jī)械設(shè)計(jì)基礎(chǔ)》課件-第3章 平面連桿機(jī)構(gòu)
- 項(xiàng)鏈課件教學(xué)課件
- 農(nóng)村電商培訓(xùn):助力鄉(xiāng)村振興與農(nóng)業(yè)轉(zhuǎn)型
- 《旅行社經(jīng)營(yíng)管理》課件-第一章 概 述
- xx河流排水防澇設(shè)施建設(shè)項(xiàng)目風(fēng)險(xiǎn)管理方案(范文模板)
- 2025年新型全液壓鉆機(jī)項(xiàng)目合作計(jì)劃書
- 2025年自動(dòng)酸雨采樣器及測(cè)定儀項(xiàng)目發(fā)展計(jì)劃
- 健康飲食產(chǎn)業(yè)園項(xiàng)目資金申請(qǐng)報(bào)告(范文模板)
- xx河流排水防澇設(shè)施建設(shè)項(xiàng)目招商引資報(bào)告
- 2025年解熱鎮(zhèn)痛類藥物項(xiàng)目發(fā)展計(jì)劃
- 【艾瑞咨詢】2024年中國(guó)健康管理行業(yè)研究報(bào)告494mb
- 年產(chǎn)xxx千件自行車配件項(xiàng)目可行性研究報(bào)告
- DZ/T 0261-2014滑坡崩塌泥石流災(zāi)害調(diào)查規(guī)范(1∶50 000)
- T/CQAP 3014-2024研究者發(fā)起的抗腫瘤體細(xì)胞臨床研究細(xì)胞制劑制備和質(zhì)量控制規(guī)范
- 初中體育教學(xué)中德育教育的現(xiàn)狀、問題與突破路徑探究
- 基層供銷社管理制度
- 農(nóng)業(yè)供應(yīng)鏈管理考試試題及答案
- 人行雨棚施工方案
- 2025-2030中國(guó)晶圓鍵合系統(tǒng)行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析研究報(bào)告
- 從校園到職場(chǎng):新員工角色轉(zhuǎn)換與職業(yè)化塑造
- 奶茶服務(wù)協(xié)議合同
評(píng)論
0/150
提交評(píng)論