聲碼器和混合編碼

上傳人：基*** IP屬地：廣東上傳時(shí)間：2023-06-16 格式：PPT 頁數(shù)：83 大?。?7.23MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩78頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第10章語音編碼(1)—波形編碼概述及分類脈沖編碼調(diào)制PCM預(yù)測編碼及其自適應(yīng)APC自適應(yīng)差分脈沖編碼調(diào)制ADPCM及自適應(yīng)增量調(diào)制ADM子帶編碼SBC自適應(yīng)變換編碼ATC當(dāng)前第1頁\共有83頁\編于星期四\22點(diǎn)概述語音編碼：SpeechCoding,在語音通信及人類信息交流中占舉足輕重的地位。研究對(duì)語音信號(hào)進(jìn)行壓縮傳輸、存儲(chǔ)等內(nèi)容。目前數(shù)字通信得以廣泛應(yīng)用，語音編碼是將模擬語音數(shù)字化的手段。將語音信號(hào)編碼為二進(jìn)制數(shù)字序列，最簡單的方法是對(duì)其直接進(jìn)行模/數(shù)變換；只要取樣率足夠高，量化每個(gè)樣本的比特?cái)?shù)足夠多，則可以保證解碼恢復(fù)的語音信號(hào)有很好的音質(zhì)，不會(huì)丟失有用信息。然而對(duì)語音信號(hào)直接數(shù)字化所需的數(shù)碼率太高，例如，普通的電話通信中采用8kHz取樣率，如用12bit進(jìn)行量化，則數(shù)碼率為96kbit/s。這樣大的數(shù)碼率即使對(duì)很大容量的傳輸信道也是難以承受的，因而必須對(duì)語音信號(hào)進(jìn)行壓縮編碼。

當(dāng)前第2頁\共有83頁\編于星期四\22點(diǎn)概述語音編碼目的：在保持可以接受的失真的情況下，采用盡可能少的比特?cái)?shù)表示語音，即減少傳輸碼率或存儲(chǔ)量。編碼后同樣的信道容量能傳輸更多路的信號(hào)，因而這類編碼又稱為壓縮編碼，壓縮編碼需要在保持可懂度與音質(zhì)、降低數(shù)碼率和降低編碼過程的計(jì)算代價(jià)三方面折衷。傳輸碼率：也稱為數(shù)碼率，指傳輸每秒鐘語音信號(hào)所需要的比特?cái)?shù)。當(dāng)前第3頁\共有83頁\編于星期四\22點(diǎn)波形編碼語音編碼分類：波形編碼，WaveformCoder;

參數(shù)編碼，ParametricCoder;

混合編碼，HybridCoder特點(diǎn)：針對(duì)語音波形進(jìn)行編碼，盡量保持輸入波形不變，即恢復(fù)的語音信號(hào)基本上與輸入的語音信號(hào)波形相同。優(yōu)缺點(diǎn)：具有適應(yīng)能力強(qiáng)、語音質(zhì)量好等優(yōu)點(diǎn)，缺點(diǎn)是需要的編碼速率高。典型的編碼方式：脈沖編碼調(diào)制PCM、自適應(yīng)差分脈沖編碼調(diào)制ADPCM、子帶編碼SBC等。在16-64kbit/s的數(shù)碼率上能給出高的編碼質(zhì)量，當(dāng)數(shù)碼率進(jìn)一步降低時(shí)，其性能下降較快。當(dāng)前第4頁\共有83頁\編于星期四\22點(diǎn)聲碼器：即參數(shù)編碼特點(diǎn)：先對(duì)語音信號(hào)進(jìn)行分析，提取出其參數(shù)，對(duì)參數(shù)進(jìn)行編碼，解碼后這些參數(shù)重新合成出重構(gòu)的語音信號(hào)。力圖使重建的語音信號(hào)具有盡可能高的可懂度，而不必保持波形的一致。

優(yōu)缺點(diǎn)：優(yōu)點(diǎn)是編碼速率低，可以低到2.4kbps甚至以下，缺點(diǎn)是合成語音質(zhì)量差，特別是自然度低，處理復(fù)雜。典型的編碼方式：如通道聲碼器、相位聲碼器、同態(tài)聲碼器、線性預(yù)測聲碼器等?；旌暇幋a特點(diǎn)：上述兩類方法的有機(jī)結(jié)合，與參數(shù)編碼相同的是，它也是基于語音產(chǎn)生模型的假定并采用了分析合成技術(shù)，但同時(shí)它又利用了語音的時(shí)間波形信息，增強(qiáng)了重建語音的自然度，使得語音質(zhì)量有明顯的提高，代價(jià)是編碼速率相應(yīng)上升，一般在16-2.4Kbps之間。典型的編碼方式：多脈沖激勵(lì)線性預(yù)測編碼MPLPC、規(guī)則脈沖激勵(lì)線性預(yù)測編碼RPE-LPC、碼本激勵(lì)線性預(yù)測編碼CELP等當(dāng)前第5頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第6頁\共有83頁\編于星期四\22點(diǎn)按傳輸碼率分類高速率語音編碼：速率32kbit/s以上,PCM,64kbit/s,主要用于公用電話網(wǎng);中高速率語音編碼：速率16-32kbit/s,ADPCM,32kbit/s,主要用于公用網(wǎng);中速率語音編碼：速率4.8-16kbit/s,GSM用的RPE/LTP13kbit/s、VSELP,8kbit/s主要用于數(shù)字移動(dòng)通信話音郵件;低速率語音編碼：速率1.2-4.8kbit/s,CELP,4.8kb/s、LPC,1.2kb/s,主要用于保密話音;極低速率語音編碼：速率1.2kbit/s以下當(dāng)前第7頁\共有83頁\編于星期四\22點(diǎn)脈沖編碼調(diào)制PCM波形編碼方式的最簡單形式是脈沖編碼調(diào)制(Pulsecodemodulation,簡稱PCM)。它直接把語音信號(hào)進(jìn)行采樣量化，表示成二進(jìn)制數(shù)字信號(hào)，并通過并-串轉(zhuǎn)換過程轉(zhuǎn)換成串行的脈沖，并用脈沖對(duì)采樣幅度進(jìn)行編碼，以便于傳輸和存儲(chǔ)。

它沒有利用語音信號(hào)的冗余度，所以信號(hào)沒有得到壓縮，編碼效率很低。一般，PCM有均勻PCM、非均勻PCM和自適應(yīng)PCM幾種形式當(dāng)前第8頁\共有83頁\編于星期四\22點(diǎn)模擬語音信號(hào)數(shù)字語音編碼抗混疊濾波采樣量化編碼A/D轉(zhuǎn)換1.均勻PCM：不論信號(hào)幅度的大小，它都采用同等的量化階距進(jìn)行量化，即采用均勻量化。當(dāng)前第9頁\共有83頁\編于星期四\22點(diǎn)2.非均勻PCM：從觀測到的語音信號(hào)概率密度可知，語音信號(hào)大量集中在低幅度上。因而，可以利用非均勻量化來彌補(bǔ)均勻量化的缺點(diǎn)。非均勻量化的基本思想是對(duì)大幅度的樣本使用大的，對(duì)小幅度的樣本使用小的；在接收端按此還原。

當(dāng)前第10頁\共有83頁\編于星期四\22點(diǎn)PCM的量化方式均勻量化與非均勻量化當(dāng)前第11頁\共有83頁\編于星期四\22點(diǎn)

國際上采用兩種非均勻量化方法：A律和

律當(dāng)前第12頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第13頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第14頁\共有83頁\編于星期四\22點(diǎn)改變量化階大小的方法有兩種：一種稱為前向自適應(yīng)(forwardadaptation)，另一種稱為后向自適應(yīng)(backwardadaptation)。3.自適應(yīng)PCM(APCM)：

PCM在量化間隔上存在矛盾：為適應(yīng)大的幅值要用大的，但為了提高信噪比又希望用小的。除了前面介紹的非均勻量化外，還有一種是采用自適應(yīng)方法，稱為自適應(yīng)PCM

（adaptivePCM，簡稱APCM）。

自適應(yīng)脈沖編碼調(diào)制(APCM)是根據(jù)輸入信號(hào)幅度大小來改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時(shí)自適應(yīng)，即量化階的大小每隔幾個(gè)樣本就改變，也可以是音節(jié)自適應(yīng)，即量化階的大小在較長時(shí)間周期里發(fā)生變化。前向是指(n)是由估計(jì)輸入信號(hào)而得到的，而后向是指由估計(jì)量化器的輸出當(dāng)前第15頁\共有83頁\編于星期四\22點(diǎn)前向自適應(yīng)是根據(jù)未量化的樣本值的均方根值來估算輸入信號(hào)的電平，以此來確定量化階的大小，并對(duì)其電平進(jìn)行編碼作為邊信息(sideinformation)傳送到接收端。其特點(diǎn)是使用原始信號(hào)提取預(yù)測系數(shù)，精度比較高，預(yù)測的效果好。但是需要將預(yù)測器系數(shù)用邊信息傳送到接收端的解碼器，從而減小了差值信號(hào)量化的有效比特?cái)?shù)，處理的延時(shí)比較大。當(dāng)前第16頁\共有83頁\編于星期四\22點(diǎn)后向自適應(yīng)是從量化器剛輸出的過去樣本中來提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩端自動(dòng)生成量化階，所以它不需要傳送邊信息。后向自適應(yīng)預(yù)測利用量化后的信號(hào)提取預(yù)測信號(hào)，避免了前向自適應(yīng)預(yù)測的缺點(diǎn)，但是由于存在量化噪聲，使得預(yù)測系數(shù)的提取精度收到一定的影響。當(dāng)前第17頁\共有83頁\編于星期四\22點(diǎn)預(yù)測編碼及其自適應(yīng)APC在第六章中我們?cè)敿?xì)討論了線性預(yù)測分析原理，利用線性預(yù)測可以改進(jìn)編碼中的量化器性能，因?yàn)轭A(yù)測誤差e(n)的動(dòng)態(tài)范圍和平均能量均比信號(hào)x(n)小，如果對(duì)e(n)進(jìn)行量化和編碼，則量化bit數(shù)將減少。在接收端，只要使用與發(fā)送端相同的預(yù)測器，就可恢復(fù)原信號(hào)x(n)。

基于這種原理的編碼方式稱為預(yù)測編碼(predictivecoding，簡稱PC)

當(dāng)預(yù)測系數(shù)是自適應(yīng)隨語音信號(hào)變化時(shí)，又稱為自適應(yīng)預(yù)測編碼(AdaptivePC，簡稱APC)。

當(dāng)前第18頁\共有83頁\編于星期四\22點(diǎn)語音數(shù)據(jù)流一般分為1020ms相繼的幀，而預(yù)測器系數(shù)（或其等效參數(shù)）則與預(yù)測誤差一起傳輸。

在接收端，用由預(yù)測器系數(shù)控制的逆濾波器再現(xiàn)語音。采用自適應(yīng)技術(shù)后，預(yù)測器P(z)要自適應(yīng)變化，以便與信號(hào)匹配。

當(dāng)前第19頁\共有83頁\編于星期四\22點(diǎn)自適應(yīng)差分脈沖編碼調(diào)制ADPCM及自適應(yīng)增量調(diào)制ADM當(dāng)前第20頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第21頁\共有83頁\編于星期四\22點(diǎn)在DM中，與量化階梯相比，當(dāng)語音波形幅度發(fā)生急劇變化時(shí)，譯碼波形不能充分跟蹤這種急劇的變化而必然產(chǎn)生失真，這稱為斜率過載。

相反地，在沒有輸入語音的無聲狀態(tài)時(shí)，或者是信號(hào)幅度為固定值時(shí)，量化輸出都將呈現(xiàn)0、1交替的序列，而譯碼后的波形只是的重復(fù)增減。這種噪聲稱為顆粒噪聲，它給人以粗糙的噪聲感覺。

當(dāng)前第22頁\共有83頁\編于星期四\22點(diǎn)

為了減少斜率過載失真，必須把設(shè)計(jì)得大一些；但是過大，又增加了顆粒噪聲。因此，兼顧兩方面要求，需按均方量化誤差為最?。词箖煞N失真均減至最小）來選擇。

即采用隨輸入波形自適應(yīng)地改變大小的自適應(yīng)編碼方式，使值隨信號(hào)平均斜率而變化；斜率大時(shí)，自動(dòng)增大；反之則減小。這就是自適應(yīng)增量調(diào)制（Adaptive，DM，簡稱ADM）。

2.自適應(yīng)增量調(diào)制ADM引入自適應(yīng)技術(shù)后、ADM大約可增多10dB的增益。實(shí)驗(yàn)表明，取樣率為56kHz時(shí)ADM具有與取樣率為8kHz時(shí)的7bit對(duì)數(shù)PCM相同的語音質(zhì)量。

當(dāng)前第23頁\共有83頁\編于星期四\22點(diǎn)差分脈沖編碼調(diào)制DPCM

降低傳輸比特率的一種方法是減少必須編碼的信息量，這要利用語音信號(hào)中大量的冗余度。在相鄰的語音樣本之間存在著明顯的相關(guān)性，因此，對(duì)相鄰樣本間的差信號(hào)（差分）進(jìn)行編碼，便可謀求信息量的壓縮，因?yàn)椴罘中盘?hào)比原語音信號(hào)的動(dòng)態(tài)范圍和平均能量都小。這種編碼稱為差分脈沖編碼調(diào)制（DifferentialPCM，簡稱DPCM）。

DPCM實(shí)質(zhì)上是預(yù)測編碼APC的一種特殊情況，是最簡單的一階線性預(yù)測，即

A(z)=1–a1z-1

當(dāng)a1=1時(shí)，被量化的編碼是e(n)＝x(n)-x(n-1)

當(dāng)前第24頁\共有83頁\編于星期四\22點(diǎn)DPCM編碼的原理當(dāng)前第25頁\共有83頁\編于星期四\22點(diǎn)由于a1是固定的，顯然它不可能對(duì)所有講話者和所有語音內(nèi)容都是最佳的，如果采用高階（p>1）的固定頂測，改善效果并不明顯；比較好的方法是采用高階自適應(yīng)預(yù)測。采用自適應(yīng)量化及高階自適應(yīng)預(yù)測的DPCM稱為ADPCM，它本質(zhì)上也是一種APC。

CCITT（國際電報(bào)電話咨詢委員會(huì)）在1984年提出的32kbit/s編碼器建議（G．721），就是采用ADPCM作為長途傳輸中一種新的國際通用語音編碼方案。這種ADPCM可達(dá)到標(biāo)準(zhǔn)kbit/sPCM的語音傳輸質(zhì)量，并具有很好的抗誤碼性能。

當(dāng)前第26頁\共有83頁\編于星期四\22點(diǎn)子帶編碼SBCs(n)發(fā)信碼子帶編碼（Sub-BandCoding，簡稱SBC）也稱為頻帶分割編碼

首先使用帶通濾波器組將語音信號(hào)分割成若干個(gè)頻段也稱為子帶，然后用調(diào)制的方法對(duì)濾波后的信號(hào)即子帶信號(hào)進(jìn)行頻譜平移變成低通信號(hào)（即基帶信號(hào)），以利于降低取樣率進(jìn)行抽取；再利用奈奎斯特速率對(duì)其進(jìn)行取樣，最后再進(jìn)行編碼處理。而信號(hào)的恢復(fù)按與上面完全相反的過程進(jìn)行。

當(dāng)前第27頁\共有83頁\編于星期四\22點(diǎn)收信碼sr(n)SBC解碼器當(dāng)前第28頁\共有83頁\編于星期四\22點(diǎn)SBC的優(yōu)點(diǎn)是對(duì)應(yīng)于人的聽覺特性，可以比較容易地考慮噪聲的抑制；即各子帶可以選用不同的量化參數(shù)以分別控制其信噪比，滿足主觀聽覺的要求。

例如，由于語音能量的不平衡，對(duì)于含有基音頻率和第一共振峰的低頻部分，對(duì)語音清晰度等主觀品質(zhì)影響較大，應(yīng)分配比較多的信息、量化細(xì)些；反之，高頻部分的量化就可粗些。

這樣，可以減少量化噪聲對(duì)聽覺的妨害程度，整體上也能降低比特?cái)?shù)。另外，量化噪聲只能出現(xiàn)在各被分割的頻帶內(nèi)，對(duì)其他頻帶沒有任何影響，所以可以較容易地控制噪聲譜。

當(dāng)前第29頁\共有83頁\編于星期四\22點(diǎn)各子帶的帶寬可以是相同的也可以是不相同的，相同的稱為等帶寬子帶編碼，不同的稱為變帶寬子帶編碼。當(dāng)前第30頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第31頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第32頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第33頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第34頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第35頁\共有83頁\編于星期四\22點(diǎn)正交鏡像濾波器組當(dāng)前第36頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第37頁\共有83頁\編于星期四\22點(diǎn)自適應(yīng)變換編碼ATC當(dāng)前第38頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第39頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第40頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第41頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第42頁\共有83頁\編于星期四\22點(diǎn)第11章語音編碼（2）-聲碼器技術(shù)及混合編碼

參數(shù)編碼也稱為模型編碼。它是對(duì)語音信號(hào)建立模型，然后對(duì)模型參數(shù)或是語音的特征參數(shù)進(jìn)行編碼，力圖使重建語音信號(hào)在聽覺上具有盡可能高的清晰度和可懂度。當(dāng)前第43頁\共有83頁\編于星期四\22點(diǎn)線性預(yù)測聲碼器：應(yīng)用最成功的低速率參數(shù)語音編碼器。線性預(yù)測分析器編碼器音調(diào)檢測器線性預(yù)測合成器解碼器信道LPC聲碼器框圖§11.1線性預(yù)測聲碼器與利用線性預(yù)測的波形編碼不同的是它的接收端不再利用殘差，即不具體恢復(fù)輸入語音的波形，而是直接利用預(yù)測系數(shù)等參數(shù)合成傳輸語音。LPC有作為預(yù)測器和作為模型的雙重作用。當(dāng)前第44頁\共有83頁\編于星期四\22點(diǎn)LPC參數(shù)的變換和量化當(dāng)前第45頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第46頁\共有83頁\編于星期四\22點(diǎn)變幀率LPC聲碼器充分利用了語音信號(hào)在時(shí)域上的冗余度，尤其是元音和擦音在發(fā)音過程中都有緩變的區(qū)間，描述這部分區(qū)間的語音不必像一些快變語音那樣用很多比特的信息量。語音信號(hào)是非平穩(wěn)的時(shí)變信號(hào)，波形變化隨時(shí)間而不同。（清音至濁音的過渡段，語音特性變化劇烈，理論上應(yīng)用較短的分析幀，要求LPC聲碼器至少每隔10ms就發(fā)送一幀新的LPC參數(shù)；而對(duì)于濁音部分，在發(fā)音過程中有緩變的區(qū)間，語音信號(hào)的頻譜特性變化很小，分析幀就可以取長些；在語音活動(dòng)停頓情況下更是如此。）因而可以采用變幀速率的編碼技術(shù)來降低聲碼器的平均傳輸碼率。當(dāng)前第47頁\共有83頁\編于星期四\22點(diǎn)實(shí)現(xiàn)思路：幀長可保持恒定，不必將每幀LPC參數(shù)都去編碼和傳送，合成部分所需的參數(shù)可以通過重復(fù)使用其前幀參數(shù)或內(nèi)插的方法獲得，可降低平均傳碼率。關(guān)鍵問題：需要一種度量方法來確定當(dāng)前幀參數(shù)和上一幀參數(shù)之間的差異（距離）。當(dāng)前第48頁\共有83頁\編于星期四\22點(diǎn)§11.2LPC-10編碼器當(dāng)前第49頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第50頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第51頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第52頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第53頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第54頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第55頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第56頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第57頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第58頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第59頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第60頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第61頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第62頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第63頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第64頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第65頁\共有83頁\編于星期四\22點(diǎn)當(dāng)前第66頁\共有83頁\編于星期四\22點(diǎn)

§11.3語音信號(hào)的混合編碼20世紀(jì)80年代后期，綜合了參數(shù)編碼低比特率與波形編碼高語音質(zhì)量優(yōu)點(diǎn)的混合編碼得到廣泛的使用。最為典型的就是CELP模型。它在比特率為4-16Kbps時(shí)已經(jīng)可以得到比其他算法更高的重建語音質(zhì)量。得到最廣泛應(yīng)用的是LPAS（基于線性預(yù)測技術(shù)的分析-合成編碼方法），通過線性預(yù)測確定系統(tǒng)參數(shù)，并通過閉環(huán)或分析-合成方法來確定激勵(lì)序列。當(dāng)前第67頁\共有83頁\編于星期四\22點(diǎn)短時(shí)預(yù)測器：分析語音信號(hào)的共振峰結(jié)構(gòu)（譜包絡(luò)）長時(shí)預(yù)測器：分析語音信號(hào)的基音結(jié)構(gòu)感知加權(quán)濾波器：使得量化誤差能被高能量的共振峰所掩蓋。激勵(lì)信號(hào)依據(jù)MSE選擇當(dāng)前第68頁\共有83頁\編于星期四\22點(diǎn)3種最常見的分析-合成線性預(yù)測編碼算法分別是：多脈沖線性預(yù)測算法（MP-LPC）規(guī)則脈沖激勵(lì)線性預(yù)測編碼（RPE-LPC）碼激勵(lì)線性預(yù)測編碼（CELP）：具有較高質(zhì)量的合成語音和良好的抗噪性和多次復(fù)接能力，近年很多聲碼器基于該模型。傳統(tǒng)的LPC聲碼器采用的是二元激勵(lì)，它將激勵(lì)源分為清音和濁音；CELP的主要改進(jìn)是采用矢量量化技術(shù)對(duì)激勵(lì)信號(hào)編碼，將事先經(jīng)過訓(xùn)練得到的一組碼矢量組成一個(gè)碼本，然后對(duì)每一幀語音信號(hào)從這組碼本中選出一個(gè)在感知加權(quán)誤差最小意義上的最佳碼矢作為激勵(lì)源。當(dāng)前第69頁\共有83頁\編于星期四\22點(diǎn)用一個(gè)固定的隨機(jī)碼本中的碼矢量來逼近語音經(jīng)過短時(shí)、長時(shí)預(yù)測后的余量信號(hào)。用一個(gè)自適應(yīng)碼本中的碼矢量來逼近語音的長時(shí)周期性（基音）結(jié)構(gòu)；當(dāng)前第70頁\共有83頁\編于星期四\22點(diǎn)＋碼本＋＋誤差最小化ＶＱ索引CELP編碼器示意圖CELP模型編碼仍基于語音的短時(shí)特性，采用LAPS與矢量量化。在編碼類型上，既采用了類似聲源模型的語音合成方法，又做了波形的最佳匹配，所以同時(shí)具有參數(shù)編碼與波形編碼的特征，故稱為混合編碼。當(dāng)前第71頁\共有83頁\編于星期四\22點(diǎn)

§11.4現(xiàn)代通信中的語音信號(hào)編碼方法當(dāng)前語音編碼的研究主要致力于如何在較低數(shù)據(jù)速率的條件下提高聲碼器的語音質(zhì)量使之盡量接近有線話音質(zhì)量。目前的ＣＤＭＡ系統(tǒng)中，基于ＲＣＥＬＰ算法的ＥＶＲＣ算法在語音質(zhì)量與比特速率間取得了很好的平衡，且適用于變速率編碼，抗干擾能力也令人滿意，從而得到了極為廣泛的應(yīng)用。當(dāng)前第72頁\共有83頁\編于星期四\22點(diǎn)§7.6.1EVRC算法基本原理EVRC采用8kHz采樣頻率的16bit線性PCM信號(hào)作為輸入信號(hào)，以20ms(即160個(gè)采樣點(diǎn))為一幀進(jìn)行編解碼。根據(jù)輸入信號(hào)的特點(diǎn)來選擇編碼速率——變速率編碼——平均比特速率低于8kbps。最后編碼結(jié)果的比特速率為8.5kbps(全速率)，4kbps(半速率)或0.8kbps（1/8速率）。EVRC使用了3種類型的參數(shù)來表征語音模型——線性預(yù)測系數(shù)、基音參數(shù)、激勵(lì)信號(hào)。當(dāng)前第73頁\共有83頁\編于星期四\22點(diǎn)每一個(gè)20ms幀中，它產(chǎn)生10個(gè)LP系數(shù)，并根據(jù)編碼速率采用不同精度的矢量量化，并采用相應(yīng)的比特?cái)?shù)表達(dá)。基音周期估計(jì)：采用兩步法，先在20ms內(nèi)開環(huán)搜索得到一個(gè)最佳基音周期，然后線性內(nèi)插得到基音曲線，最后用自適應(yīng)碼本來映射長時(shí)相關(guān)性。這樣可減小基音的比特速率。激勵(lì)信號(hào)：EVRC采用代數(shù)碼本。當(dāng)前第74頁\共有83頁\編于星期四\22點(diǎn)＋共振峰合成濾波器自適應(yīng)碼本固定碼本隨機(jī)碼矢量增益自適應(yīng)碼矢量增益基音周期固定碼本索引ＸＸＥＶＲＣ語音合成示意圖當(dāng)前第75頁\共有83頁\編于星期四\22點(diǎn)ＥＶＲＣ編碼器示意圖信號(hào)處理ＬＰＣ參數(shù)短時(shí)殘差１＆１/２速率編碼１/８速率編碼數(shù)碼率判別長時(shí)延遲估計(jì)＆增益Ｒａｔｅ采樣信號(hào)Ｒａｔｅ濾波，降噪§7.6.2EVRC算法概述當(dāng)前第76頁\共有83頁\編于星期四\22點(diǎn)ＥＶＲＣ編碼器示意圖預(yù)處理ＬＰＣ參數(shù)短時(shí)殘差１＆１/２速率編碼１/８速率編碼數(shù)碼率判別長時(shí)延遲估計(jì)＆增益Ｒａｔｅ采樣信號(hào)Ｒａｔｅ濾波，降噪經(jīng)8kHz采樣，16bit量化后得到的線性PCM信號(hào)s(n)首先被送到預(yù)處理模塊。

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

聲碼器和混合編碼

文檔簡介

溫馨提示

最新文檔

評(píng)論

聲碼器和混合編碼

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔