聲碼器和混合編碼_第1頁
聲碼器和混合編碼_第2頁
聲碼器和混合編碼_第3頁
聲碼器和混合編碼_第4頁
聲碼器和混合編碼_第5頁
已閱讀5頁,還剩78頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第10章語音編碼(1)—波形編碼概述及分類脈沖編碼調(diào)制PCM預(yù)測編碼及其自適應(yīng)APC自適應(yīng)差分脈沖編碼調(diào)制ADPCM及自適應(yīng)增量調(diào)制ADM子帶編碼SBC自適應(yīng)變換編碼ATC當(dāng)前第1頁\共有83頁\編于星期四\22點(diǎn)概述語音編碼:SpeechCoding,在語音通信及人類信息交流中占舉足輕重的地位。研究對(duì)語音信號(hào)進(jìn)行壓縮傳輸、存儲(chǔ)等內(nèi)容。目前數(shù)字通信得以廣泛應(yīng)用,語音編碼是將模擬語音數(shù)字化的手段。將語音信號(hào)編碼為二進(jìn)制數(shù)字序列,最簡單的方法是對(duì)其直接進(jìn)行模/數(shù)變換;只要取樣率足夠高,量化每個(gè)樣本的比特?cái)?shù)足夠多,則可以保證解碼恢復(fù)的語音信號(hào)有很好的音質(zhì),不會(huì)丟失有用信息。然而對(duì)語音信號(hào)直接數(shù)字化所需的數(shù)碼率太高,例如,普通的電話通信中采用8kHz取樣率,如用12bit進(jìn)行量化,則數(shù)碼率為96kbit/s。這樣大的數(shù)碼率即使對(duì)很大容量的傳輸信道也是難以承受的,因而必須對(duì)語音信號(hào)進(jìn)行壓縮編碼。

當(dāng)前第2頁\共有83頁\編于星期四\22點(diǎn)概述語音編碼目的:在保持可以接受的失真的情況下,采用盡可能少的比特?cái)?shù)表示語音,即減少傳輸碼率或存儲(chǔ)量。編碼后同樣的信道容量能傳輸更多路的信號(hào),因而這類編碼又稱為壓縮編碼,壓縮編碼需要在保持可懂度與音質(zhì)、降低數(shù)碼率和降低編碼過程的計(jì)算代價(jià)三方面折衷。傳輸碼率:也稱為數(shù)碼率,指傳輸每秒鐘語音信號(hào)所需要的比特?cái)?shù)。當(dāng)前第3頁\共有83頁\編于星期四\22點(diǎn)波形編碼語音編碼分類:波形編碼,WaveformCoder;

參數(shù)編碼,ParametricCoder;

混合編碼,HybridCoder特點(diǎn):針對(duì)語音波形進(jìn)行編碼,盡量保持輸入波形不變,即恢復(fù)的語音信號(hào)基本上與輸入的語音信號(hào)波形相同。優(yōu)缺點(diǎn):具有適應(yīng)能力強(qiáng)、語音質(zhì)量好等優(yōu)點(diǎn),缺點(diǎn)是需要的編碼速率高。典型的編碼方式:脈沖編碼調(diào)制PCM、自適應(yīng)差分脈沖編碼調(diào)制ADPCM、子帶編碼SBC等。在16-64kbit/s的數(shù)碼率上能給出高的編碼質(zhì)量,當(dāng)數(shù)碼率進(jìn)一步降低時(shí),其性能下降較快。當(dāng)前第4頁\共有83頁\編于星期四\22點(diǎn)聲碼器:即參數(shù)編碼特點(diǎn):先對(duì)語音信號(hào)進(jìn)行分析,提取出其參數(shù),對(duì)參數(shù)進(jìn)行編碼,解碼后這些參數(shù)重新合成出重構(gòu)的語音信號(hào)。力圖使重建的語音信號(hào)具有盡可能高的可懂度,而不必保持波形的一致。

優(yōu)缺點(diǎn):優(yōu)點(diǎn)是編碼速率低,可以低到2.4kbps甚至以下,缺點(diǎn)是合成語音質(zhì)量差,特別是自然度低,處理復(fù)雜。典型的編碼方式:如通道聲碼器、相位聲碼器、同態(tài)聲碼器、線性預(yù)測聲碼器等?;旌暇幋a特點(diǎn):上述兩類方法的有機(jī)結(jié)合,與參數(shù)編碼相同的是,它也是基于語音產(chǎn)生模型的假定并采用了分析合成技術(shù),但同時(shí)它又利用了語音的時(shí)間波形信息,增強(qiáng)了重建語音的自然度,使得語音質(zhì)量有明顯的提高,代價(jià)是編碼速率相應(yīng)上升,一般在16-2.4Kbps之間。典型的編碼方式:多脈沖激勵(lì)線性預(yù)測編碼MPLPC、規(guī)則脈沖激勵(lì)線性預(yù)測編碼RPE-LPC、碼本激勵(lì)線性預(yù)測編碼CELP等當(dāng)前第5頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第6頁\共有83頁\編于星期四\22點(diǎn)按傳輸碼率分類高速率語音編碼:速率32kbit/s以上,PCM,64kbit/s,主要用于公用電話網(wǎng);中高速率語音編碼:速率16-32kbit/s,ADPCM,32kbit/s,主要用于公用網(wǎng);中速率語音編碼:速率4.8-16kbit/s,GSM用的RPE/LTP13kbit/s、VSELP,8kbit/s主要用于數(shù)字移動(dòng)通信話音郵件;低速率語音編碼:速率1.2-4.8kbit/s,CELP,4.8kb/s、LPC,1.2kb/s,主要用于保密話音;極低速率語音編碼:速率1.2kbit/s以下當(dāng)前第7頁\共有83頁\編于星期四\22點(diǎn)脈沖編碼調(diào)制PCM波形編碼方式的最簡單形式是脈沖編碼調(diào)制(Pulsecodemodulation,簡稱PCM)。它直接把語音信號(hào)進(jìn)行采樣量化,表示成二進(jìn)制數(shù)字信號(hào),并通過并-串轉(zhuǎn)換過程轉(zhuǎn)換成串行的脈沖,并用脈沖對(duì)采樣幅度進(jìn)行編碼,以便于傳輸和存儲(chǔ)。

它沒有利用語音信號(hào)的冗余度,所以信號(hào)沒有得到壓縮,編碼效率很低。一般,PCM有均勻PCM、非均勻PCM和自適應(yīng)PCM幾種形式當(dāng)前第8頁\共有83頁\編于星期四\22點(diǎn)模擬語音信號(hào)數(shù)字語音編碼抗混疊濾波采樣量化編碼A/D轉(zhuǎn)換1.均勻PCM:不論信號(hào)幅度的大小,它都采用同等的量化階距進(jìn)行量化,即采用均勻量化。當(dāng)前第9頁\共有83頁\編于星期四\22點(diǎn)2.非均勻PCM:從觀測到的語音信號(hào)概率密度可知,語音信號(hào)大量集中在低幅度上。因而,可以利用非均勻量化來彌補(bǔ)均勻量化的缺點(diǎn)。非均勻量化的基本思想是對(duì)大幅度的樣本使用大的,對(duì)小幅度的樣本使用小的;在接收端按此還原。

當(dāng)前第10頁\共有83頁\編于星期四\22點(diǎn)PCM的量化方式均勻量化與非均勻量化當(dāng)前第11頁\共有83頁\編于星期四\22點(diǎn)

國際上采用兩種非均勻量化方法:A律和

律當(dāng)前第12頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第13頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第14頁\共有83頁\編于星期四\22點(diǎn)改變量化階大小的方法有兩種:一種稱為前向自適應(yīng)(forwardadaptation),另一種稱為后向自適應(yīng)(backwardadaptation)。3.自適應(yīng)PCM(APCM):

PCM在量化間隔上存在矛盾:為適應(yīng)大的幅值要用大的,但為了提高信噪比又希望用小的。除了前面介紹的非均勻量化外,還有一種是采用自適應(yīng)方法,稱為自適應(yīng)PCM

(adaptivePCM,簡稱APCM)。

自適應(yīng)脈沖編碼調(diào)制(APCM)是根據(jù)輸入信號(hào)幅度大小來改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時(shí)自適應(yīng),即量化階的大小每隔幾個(gè)樣本就改變,也可以是音節(jié)自適應(yīng),即量化階的大小在較長時(shí)間周期里發(fā)生變化。前向是指(n)是由估計(jì)輸入信號(hào)而得到的,而后向是指由估計(jì)量化器的輸出當(dāng)前第15頁\共有83頁\編于星期四\22點(diǎn)前向自適應(yīng)是根據(jù)未量化的樣本值的均方根值來估算輸入信號(hào)的電平,以此來確定量化階的大小,并對(duì)其電平進(jìn)行編碼作為邊信息(sideinformation)傳送到接收端。其特點(diǎn)是使用原始信號(hào)提取預(yù)測系數(shù),精度比較高,預(yù)測的效果好。但是需要將預(yù)測器系數(shù)用邊信息傳送到接收端的解碼器,從而減小了差值信號(hào)量化的有效比特?cái)?shù),處理的延時(shí)比較大。當(dāng)前第16頁\共有83頁\編于星期四\22點(diǎn)后向自適應(yīng)是從量化器剛輸出的過去樣本中來提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩端自動(dòng)生成量化階,所以它不需要傳送邊信息。后向自適應(yīng)預(yù)測利用量化后的信號(hào)提取預(yù)測信號(hào),避免了前向自適應(yīng)預(yù)測的缺點(diǎn),但是由于存在量化噪聲,使得預(yù)測系數(shù)的提取精度收到一定的影響。當(dāng)前第17頁\共有83頁\編于星期四\22點(diǎn)預(yù)測編碼及其自適應(yīng)APC在第六章中我們?cè)敿?xì)討論了線性預(yù)測分析原理,利用線性預(yù)測可以改進(jìn)編碼中的量化器性能,因?yàn)轭A(yù)測誤差e(n)的動(dòng)態(tài)范圍和平均能量均比信號(hào)x(n)小,如果對(duì)e(n)進(jìn)行量化和編碼,則量化bit數(shù)將減少。在接收端,只要使用與發(fā)送端相同的預(yù)測器,就可恢復(fù)原信號(hào)x(n)。

基于這種原理的編碼方式稱為預(yù)測編碼(predictivecoding,簡稱PC)

當(dāng)預(yù)測系數(shù)是自適應(yīng)隨語音信號(hào)變化時(shí),又稱為自適應(yīng)預(yù)測編碼(AdaptivePC,簡稱APC)。

當(dāng)前第18頁\共有83頁\編于星期四\22點(diǎn)語音數(shù)據(jù)流一般分為1020ms相繼的幀,而預(yù)測器系數(shù)(或其等效參數(shù))則與預(yù)測誤差一起傳輸。

在接收端,用由預(yù)測器系數(shù)控制的逆濾波器再現(xiàn)語音。采用自適應(yīng)技術(shù)后,預(yù)測器P(z)要自適應(yīng)變化,以便與信號(hào)匹配。

當(dāng)前第19頁\共有83頁\編于星期四\22點(diǎn)自適應(yīng)差分脈沖編碼調(diào)制ADPCM及自適應(yīng)增量調(diào)制ADM當(dāng)前第20頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第21頁\共有83頁\編于星期四\22點(diǎn)在DM中,與量化階梯相比,當(dāng)語音波形幅度發(fā)生急劇變化時(shí),譯碼波形不能充分跟蹤這種急劇的變化而必然產(chǎn)生失真,這稱為斜率過載。

相反地,在沒有輸入語音的無聲狀態(tài)時(shí),或者是信號(hào)幅度為固定值時(shí),量化輸出都將呈現(xiàn)0、1交替的序列,而譯碼后的波形只是的重復(fù)增減。這種噪聲稱為顆粒噪聲,它給人以粗糙的噪聲感覺。

當(dāng)前第22頁\共有83頁\編于星期四\22點(diǎn)

為了減少斜率過載失真,必須把設(shè)計(jì)得大一些;但是過大,又增加了顆粒噪聲。因此,兼顧兩方面要求,需按均方量化誤差為最?。词箖煞N失真均減至最小)來選擇。

即采用隨輸入波形自適應(yīng)地改變大小的自適應(yīng)編碼方式,使值隨信號(hào)平均斜率而變化;斜率大時(shí),自動(dòng)增大;反之則減小。這就是自適應(yīng)增量調(diào)制(Adaptive,DM,簡稱ADM)。

2.自適應(yīng)增量調(diào)制ADM引入自適應(yīng)技術(shù)后、ADM大約可增多10dB的增益。實(shí)驗(yàn)表明,取樣率為56kHz時(shí)ADM具有與取樣率為8kHz時(shí)的7bit對(duì)數(shù)PCM相同的語音質(zhì)量。

當(dāng)前第23頁\共有83頁\編于星期四\22點(diǎn)差分脈沖編碼調(diào)制DPCM

降低傳輸比特率的一種方法是減少必須編碼的信息量,這要利用語音信號(hào)中大量的冗余度。在相鄰的語音樣本之間存在著明顯的相關(guān)性,因此,對(duì)相鄰樣本間的差信號(hào)(差分)進(jìn)行編碼,便可謀求信息量的壓縮,因?yàn)椴罘中盘?hào)比原語音信號(hào)的動(dòng)態(tài)范圍和平均能量都小。這種編碼稱為差分脈沖編碼調(diào)制(DifferentialPCM,簡稱DPCM)。

DPCM實(shí)質(zhì)上是預(yù)測編碼APC的一種特殊情況,是最簡單的一階線性預(yù)測,即

A(z)=1–a1z-1

當(dāng)a1=1時(shí),被量化的編碼是e(n)=x(n)-x(n-1)

當(dāng)前第24頁\共有83頁\編于星期四\22點(diǎn)DPCM編碼的原理當(dāng)前第25頁\共有83頁\編于星期四\22點(diǎn)由于a1是固定的,顯然它不可能對(duì)所有講話者和所有語音內(nèi)容都是最佳的,如果采用高階(p>1)的固定頂測,改善效果并不明顯;比較好的方法是采用高階自適應(yīng)預(yù)測。采用自適應(yīng)量化及高階自適應(yīng)預(yù)測的DPCM稱為ADPCM,它本質(zhì)上也是一種APC。

CCITT(國際電報(bào)電話咨詢委員會(huì))在1984年提出的32kbit/s編碼器建議(G.721),就是采用ADPCM作為長途傳輸中一種新的國際通用語音編碼方案。這種ADPCM可達(dá)到標(biāo)準(zhǔn)kbit/sPCM的語音傳輸質(zhì)量,并具有很好的抗誤碼性能。

當(dāng)前第26頁\共有83頁\編于星期四\22點(diǎn)子帶編碼SBCs(n)發(fā)信碼子帶編碼(Sub-BandCoding,簡稱SBC)也稱為頻帶分割編碼

首先使用帶通濾波器組將語音信號(hào)分割成若干個(gè)頻段也稱為子帶,然后用調(diào)制的方法對(duì)濾波后的信號(hào)即子帶信號(hào)進(jìn)行頻譜平移變成低通信號(hào)(即基帶信號(hào)),以利于降低取樣率進(jìn)行抽取;再利用奈奎斯特速率對(duì)其進(jìn)行取樣,最后再進(jìn)行編碼處理。而信號(hào)的恢復(fù)按與上面完全相反的過程進(jìn)行。

當(dāng)前第27頁\共有83頁\編于星期四\22點(diǎn)收信碼sr(n)SBC解碼器當(dāng)前第28頁\共有83頁\編于星期四\22點(diǎn)SBC的優(yōu)點(diǎn)是對(duì)應(yīng)于人的聽覺特性,可以比較容易地考慮噪聲的抑制;即各子帶可以選用不同的量化參數(shù)以分別控制其信噪比,滿足主觀聽覺的要求。

例如,由于語音能量的不平衡,對(duì)于含有基音頻率和第一共振峰的低頻部分,對(duì)語音清晰度等主觀品質(zhì)影響較大,應(yīng)分配比較多的信息、量化細(xì)些;反之,高頻部分的量化就可粗些。

這樣,可以減少量化噪聲對(duì)聽覺的妨害程度,整體上也能降低比特?cái)?shù)。另外,量化噪聲只能出現(xiàn)在各被分割的頻帶內(nèi),對(duì)其他頻帶沒有任何影響,所以可以較容易地控制噪聲譜。

當(dāng)前第29頁\共有83頁\編于星期四\22點(diǎn)各子帶的帶寬可以是相同的也可以是不相同的,相同的稱為等帶寬子帶編碼,不同的稱為變帶寬子帶編碼。當(dāng)前第30頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第31頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第32頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第33頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第34頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第35頁\共有83頁\編于星期四\22點(diǎn)正交鏡像濾波器組當(dāng)前第36頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第37頁\共有83頁\編于星期四\22點(diǎn)自適應(yīng)變換編碼ATC當(dāng)前第38頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第39頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第40頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第41頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第42頁\共有83頁\編于星期四\22點(diǎn)第11章語音編碼(2)-聲碼器技術(shù)及混合編碼

參數(shù)編碼也稱為模型編碼。它是對(duì)語音信號(hào)建立模型,然后對(duì)模型參數(shù)或是語音的特征參數(shù)進(jìn)行編碼,力圖使重建語音信號(hào)在聽覺上具有盡可能高的清晰度和可懂度。當(dāng)前第43頁\共有83頁\編于星期四\22點(diǎn)線性預(yù)測聲碼器:應(yīng)用最成功的低速率參數(shù)語音編碼器。線性預(yù)測分析器編碼器音調(diào)檢測器線性預(yù)測合成器解碼器信道LPC聲碼器框圖§11.1線性預(yù)測聲碼器與利用線性預(yù)測的波形編碼不同的是它的接收端不再利用殘差,即不具體恢復(fù)輸入語音的波形,而是直接利用預(yù)測系數(shù)等參數(shù)合成傳輸語音。LPC有作為預(yù)測器和作為模型的雙重作用。當(dāng)前第44頁\共有83頁\編于星期四\22點(diǎn)LPC參數(shù)的變換和量化當(dāng)前第45頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第46頁\共有83頁\編于星期四\22點(diǎn)變幀率LPC聲碼器充分利用了語音信號(hào)在時(shí)域上的冗余度,尤其是元音和擦音在發(fā)音過程中都有緩變的區(qū)間,描述這部分區(qū)間的語音不必像一些快變語音那樣用很多比特的信息量。語音信號(hào)是非平穩(wěn)的時(shí)變信號(hào),波形變化隨時(shí)間而不同。(清音至濁音的過渡段,語音特性變化劇烈,理論上應(yīng)用較短的分析幀,要求LPC聲碼器至少每隔10ms就發(fā)送一幀新的LPC參數(shù);而對(duì)于濁音部分,在發(fā)音過程中有緩變的區(qū)間,語音信號(hào)的頻譜特性變化很小,分析幀就可以取長些;在語音活動(dòng)停頓情況下更是如此。)因而可以采用變幀速率的編碼技術(shù)來降低聲碼器的平均傳輸碼率。當(dāng)前第47頁\共有83頁\編于星期四\22點(diǎn)實(shí)現(xiàn)思路:幀長可保持恒定,不必將每幀LPC參數(shù)都去編碼和傳送,合成部分所需的參數(shù)可以通過重復(fù)使用其前幀參數(shù)或內(nèi)插的方法獲得,可降低平均傳碼率。關(guān)鍵問題:需要一種度量方法來確定當(dāng)前幀參數(shù)和上一幀參數(shù)之間的差異(距離)。當(dāng)前第48頁\共有83頁\編于星期四\22點(diǎn)§11.2LPC-10編碼器當(dāng)前第49頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第50頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第51頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第52頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第53頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第54頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第55頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第56頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第57頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第58頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第59頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第60頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第61頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第62頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第63頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第64頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第65頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第66頁\共有83頁\編于星期四\22點(diǎn)

§11.3語音信號(hào)的混合編碼20世紀(jì)80年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語音質(zhì)量優(yōu)點(diǎn)的混合編碼得到廣泛的使用。最為典型的就是CELP模型。它在比特率為4-16Kbps時(shí)已經(jīng)可以得到比其他算法更高的重建語音質(zhì)量。得到最廣泛應(yīng)用的是LPAS(基于線性預(yù)測技術(shù)的分析-合成編碼方法),通過線性預(yù)測確定系統(tǒng)參數(shù),并通過閉環(huán)或分析-合成方法來確定激勵(lì)序列。當(dāng)前第67頁\共有83頁\編于星期四\22點(diǎn)短時(shí)預(yù)測器:分析語音信號(hào)的共振峰結(jié)構(gòu)(譜包絡(luò))長時(shí)預(yù)測器:分析語音信號(hào)的基音結(jié)構(gòu)感知加權(quán)濾波器:使得量化誤差能被高能量的共振峰所掩蓋。激勵(lì)信號(hào)依據(jù)MSE選擇當(dāng)前第68頁\共有83頁\編于星期四\22點(diǎn)3種最常見的分析-合成線性預(yù)測編碼算法分別是:多脈沖線性預(yù)測算法(MP-LPC)規(guī)則脈沖激勵(lì)線性預(yù)測編碼(RPE-LPC)碼激勵(lì)線性預(yù)測編碼(CELP):具有較高質(zhì)量的合成語音和良好的抗噪性和多次復(fù)接能力,近年很多聲碼器基于該模型。傳統(tǒng)的LPC聲碼器采用的是二元激勵(lì),它將激勵(lì)源分為清音和濁音;CELP的主要改進(jìn)是采用矢量量化技術(shù)對(duì)激勵(lì)信號(hào)編碼,將事先經(jīng)過訓(xùn)練得到的一組碼矢量組成一個(gè)碼本,然后對(duì)每一幀語音信號(hào)從這組碼本中選出一個(gè)在感知加權(quán)誤差最小意義上的最佳碼矢作為激勵(lì)源。當(dāng)前第69頁\共有83頁\編于星期四\22點(diǎn)用一個(gè)固定的隨機(jī)碼本中的碼矢量來逼近語音經(jīng)過短時(shí)、長時(shí)預(yù)測后的余量信號(hào)。用一個(gè)自適應(yīng)碼本中的碼矢量來逼近語音的長時(shí)周期性(基音)結(jié)構(gòu);當(dāng)前第70頁\共有83頁\編于星期四\22點(diǎn)+碼本++誤差最小化VQ索引CELP編碼器示意圖CELP模型編碼仍基于語音的短時(shí)特性,采用LAPS與矢量量化。在編碼類型上,既采用了類似聲源模型的語音合成方法,又做了波形的最佳匹配,所以同時(shí)具有參數(shù)編碼與波形編碼的特征,故稱為混合編碼。當(dāng)前第71頁\共有83頁\編于星期四\22點(diǎn)

§11.4現(xiàn)代通信中的語音信號(hào)編碼方法當(dāng)前語音編碼的研究主要致力于如何在較低數(shù)據(jù)速率的條件下提高聲碼器的語音質(zhì)量使之盡量接近有線話音質(zhì)量。目前的CDMA系統(tǒng)中,基于RCELP算法的EVRC算法在語音質(zhì)量與比特速率間取得了很好的平衡,且適用于變速率編碼,抗干擾能力也令人滿意,從而得到了極為廣泛的應(yīng)用。當(dāng)前第72頁\共有83頁\編于星期四\22點(diǎn)§7.6.1EVRC算法基本原理EVRC采用8kHz采樣頻率的16bit線性PCM信號(hào)作為輸入信號(hào),以20ms(即160個(gè)采樣點(diǎn))為一幀進(jìn)行編解碼。根據(jù)輸入信號(hào)的特點(diǎn)來選擇編碼速率——變速率編碼——平均比特速率低于8kbps。最后編碼結(jié)果的比特速率為8.5kbps(全速率),4kbps(半速率)或0.8kbps(1/8速率)。EVRC使用了3種類型的參數(shù)來表征語音模型——線性預(yù)測系數(shù)、基音參數(shù)、激勵(lì)信號(hào)。當(dāng)前第73頁\共有83頁\編于星期四\22點(diǎn)每一個(gè)20ms幀中,它產(chǎn)生10個(gè)LP系數(shù),并根據(jù)編碼速率采用不同精度的矢量量化,并采用相應(yīng)的比特?cái)?shù)表達(dá)。基音周期估計(jì):采用兩步法,先在20ms內(nèi)開環(huán)搜索得到一個(gè)最佳基音周期,然后線性內(nèi)插得到基音曲線,最后用自適應(yīng)碼本來映射長時(shí)相關(guān)性。這樣可減小基音的比特速率。激勵(lì)信號(hào):EVRC采用代數(shù)碼本。當(dāng)前第74頁\共有83頁\編于星期四\22點(diǎn)+共振峰合成濾波器自適應(yīng)碼本固定碼本隨機(jī)碼矢量增益自適應(yīng)碼矢量增益基音周期固定碼本索引XXEVRC語音合成示意圖當(dāng)前第75頁\共有83頁\編于星期四\22點(diǎn)EVRC編碼器示意圖信號(hào)處理LPC參數(shù)短時(shí)殘差1&1/2速率編碼1/8速率編碼數(shù)碼率判別長時(shí)延遲估計(jì)&增益Rate采樣信號(hào)Rate濾波,降噪§7.6.2EVRC算法概述當(dāng)前第76頁\共有83頁\編于星期四\22點(diǎn)EVRC編碼器示意圖預(yù)處理LPC參數(shù)短時(shí)殘差1&1/2速率編碼1/8速率編碼數(shù)碼率判別長時(shí)延遲估計(jì)&增益Rate采樣信號(hào)Rate濾波,降噪經(jīng)8kHz采樣,16bit量化后得到的線性PCM信號(hào)s(n)首先被送到預(yù)處理模塊。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論