第十一章聲碼器和混合編碼

上傳人：小*** IP屬地：臺(tái)灣上傳時(shí)間：2021-11-27 格式：DOC 頁(yè)數(shù)：100 大?。?.64MB 積分：35 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩95頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第10章語(yǔ)音編碼(1)波形編碼:概述及分類(lèi)脈沖編碼調(diào)制PCM:預(yù)測(cè)編碼及其自適應(yīng)APC：自適應(yīng)差分脈沖編碼調(diào)制ADPCM及自適應(yīng)增量調(diào) 制ADM：子帶編碼SBC自適應(yīng)變換編碼ATC語(yǔ)音編碼：Speech Coding,在語(yǔ)音通信及人類(lèi)信息交流中占舉足輕重的地位。研究對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮傳輸、存儲(chǔ)等內(nèi)容。目前數(shù) 字通信得以廣泛應(yīng)用，語(yǔ)音編碼是將模擬語(yǔ)音數(shù)字化的手段。將語(yǔ)音信號(hào)編碼為二進(jìn)制數(shù)字序列，最簡(jiǎn)單的方法是對(duì)其直接進(jìn)行模/數(shù)變換；只要取樣率足夠高，量化每個(gè)樣本的比特?cái)?shù)足夠多，則可以保證解碼恢復(fù)的語(yǔ)音信號(hào)有很好的音質(zhì)，不會(huì)丟失有用信息。然而對(duì)語(yǔ)音信號(hào)直接數(shù)字化所需的數(shù)碼率太高，例如，普通的

2、電話(huà)通信中采用8kHz取樣率，如用12bit進(jìn)行量化，則數(shù)碼率為 96kbit/so這樣大的數(shù)碼率即使對(duì)很大容量的傳輸信道也是難以承受的，因而必須對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮編碼。語(yǔ)音編碼目的：在保持可以接受的失真的情況下，采用盡可能少的比特?cái)?shù)表示語(yǔ)音，即減少傳輸碼率或存儲(chǔ)量。編碼后同樣的信道容量能傳輸更多路的信號(hào)，因而這類(lèi)編碼又稱(chēng) 為壓縮編碼，壓縮編碼需要在保持可懂度與音質(zhì)、降低數(shù)碼率和降低編碼過(guò)程的計(jì)算代價(jià)三方面折衷。傳輸碼率：也稱(chēng)為數(shù)碼率，指?jìng)鬏斆棵腌娬Z(yǔ)音信號(hào)所需要的比特?cái)?shù)。語(yǔ)音編碼分類(lèi)：波形編碼，Waveform Coder; 參數(shù)編碼，Parametric Coder; 混合編碼，Hy

3、brid Coder波形編碼特點(diǎn)：針對(duì)語(yǔ)音波形進(jìn)行編碼，盡量保持輸入波形不變，即恢復(fù) 的語(yǔ)音信號(hào)基本上與輸入的語(yǔ)音信號(hào)波形相同。優(yōu)缺點(diǎn)：具有適應(yīng)能力強(qiáng)、語(yǔ)音質(zhì)量好等優(yōu)點(diǎn)，缺點(diǎn)是需要的編碼速率高。在16-64kbit/s的數(shù)碼率上能給出高的編碼質(zhì)量，當(dāng)數(shù)碼率進(jìn)一步降低時(shí)，其性能下降較快。典型的編碼方式：脈沖編碼調(diào)制PCM、自適應(yīng)差分脈沖編碼調(diào)制 ADPCM、子帶編碼SBC等。聲碼器：即參數(shù)編碼特點(diǎn)：先對(duì)語(yǔ)音信號(hào)進(jìn)行分析，提取出其參數(shù)，對(duì)參數(shù)進(jìn)行編碼, 解碼后這些參數(shù)重新合成出重構(gòu)的語(yǔ)音信號(hào)。力圖使重建的語(yǔ)音信號(hào)具有盡可能高的可懂度，而不必保持波形的一致。優(yōu)缺點(diǎn)：優(yōu)點(diǎn)是編碼速率低，可以低到2

4、.4kbps甚至以下，缺點(diǎn)是合成語(yǔ)音質(zhì)量差，特別是自然度低，處理復(fù)雜。典型的編碼方式：如通道聲碼器、相位聲碼器、同態(tài)聲碼器、線(xiàn)性預(yù)測(cè)聲碼器等?；旌暇幋a特點(diǎn)：上述兩類(lèi)方法的有機(jī)結(jié)合，與參數(shù)編碼相同的是，它也是基于語(yǔ)音產(chǎn)生模型的假定并采用了分析合成技術(shù)，但同時(shí)它又利用了語(yǔ)音的時(shí)間波形信息，增強(qiáng)了重建語(yǔ)音的自然度，使得語(yǔ)音質(zhì)量有明顯的提高，代價(jià)是編碼速率相應(yīng)上升，一般在1624Kbps之間。典型的編碼方式：多脈沖激勵(lì)線(xiàn)性預(yù)測(cè)編碼MPLPC、規(guī)則脈沖激勵(lì) 線(xiàn)性預(yù)測(cè)編碼RPE-LPC、碼本激勵(lì)線(xiàn)性預(yù)測(cè)編碼CELP等波形編碼與參數(shù)編碼的比較波形編碼與參數(shù)編碼的比較波形編碼與參數(shù)編碼的比較參數(shù)編碼

5、波形編碼波形編碼與參數(shù)編碼的比較波形編碼與參數(shù)編碼的比較9 6-64KbpsSNR譜失真和主觀(guān)聽(tīng)音編碼信息比特率語(yǔ)音質(zhì)量評(píng)價(jià)方法樓型鑒數(shù)2,49.6Kbps波形編碼與參數(shù)編碼的比較波形編碼與參數(shù)編碼的比較缺慮=1隨著量化粗糙語(yǔ)音質(zhì)董下降合成涪音質(zhì)量較低魯處理復(fù)雜度高按傳輸碼率分類(lèi)高速率語(yǔ)音編碼：速率32kbit/s以上，PCM, 64kbit/s,主要用于公用電話(huà)網(wǎng)；1-1中高速率語(yǔ)音編碼：速率16-32kbit/s, ADPCM, 32kbit/s, 主要用于公用網(wǎng)；中速率語(yǔ)音編碼：速率4.8-16kbit/s, GSM用的RPE/LTP 13kbit/s> VSELP, 8kbit

6、/s主要用于數(shù)字移動(dòng)通信話(huà)音郵件；低速率語(yǔ)音編碼：速率 1.2-4.8kbit/s, CELP, 4.8kb/s、LPC, 1.2kb/s,主要用于保密話(huà)音；極低速率語(yǔ)音編碼：速率1.2kbit/s以下脈沖編碼調(diào)制PCM波形編碼方式的最簡(jiǎn)單形式是脈沖編碼調(diào)制(Pulse code modulation, 簡(jiǎn)稱(chēng)PCM)O它直接把語(yǔ)音信號(hào)進(jìn)行采樣量化，表示成二進(jìn)制數(shù) 字信號(hào)，并通過(guò)并串轉(zhuǎn)換過(guò)程轉(zhuǎn)換成串行的脈沖，并用脈沖對(duì)采樣幅度進(jìn)行編碼，以便于傳輸和存儲(chǔ)。編碼效它沒(méi)有利用語(yǔ)音信號(hào)的冗余度，所以信號(hào)沒(méi)有得到壓縮, 率很低。般，PCM有均勻PCM、非均勻PCM和自適應(yīng)PCM幾種形式1均勻PCM：

7、不論信號(hào)幅度的大小，它都采用同等的量化階距進(jìn)行量化，即采用均勻量化。A/D轉(zhuǎn)換數(shù)字語(yǔ)音編碼假設(shè)董化誤差藝仏）在各個(gè)量化間隔的區(qū)間里均勻分布, 則信號(hào)對(duì)址化噪聲的信噪比可近似寫(xiě)為：SN/?(dB)= 6.02B-7.2其中B為量化器宇長(zhǎng)。當(dāng)要求60dB的SNR時(shí)至少應(yīng)取llo 此時(shí)，對(duì)于帶寬為4kHz的電話(huà)語(yǔ)音信號(hào)，若采樣率為8kHz,則 PCM要求的速率為8KXH = 88 Kbp況2非均勻PCM：均勻量化的缺點(diǎn)就是不論語(yǔ)音信號(hào)的幅度大小而董化階距保持不變這樣在信號(hào)動(dòng)態(tài)范圍較大而方差較小時(shí)，其信噪比將下降。從觀(guān)測(cè)到的語(yǔ)音信號(hào)概率密度可知，語(yǔ)音信號(hào)大量集中在低幅度 ±o因而，可以利

8、用非均勻量化來(lái)彌補(bǔ)均勻量化的缺點(diǎn)。這種量化在輸入為低電平時(shí)量化階距小，而高電平時(shí)量化階距大口即信號(hào)概率密度大的區(qū)間，量化間隔應(yīng)該小些;反之信號(hào)概率密度小的區(qū)間，量化間隔應(yīng)該大些。非均勻量化的基本思想是對(duì)大幅度的樣本使用大的' 對(duì)小幅度的樣本使用小的4在接收端按此還原。PCM的量化方式均勻量化與非均勻量化非均勻量化也可看作是將佶號(hào)進(jìn)行非線(xiàn)性變換后再作均勻量化. 通當(dāng)被電話(huà)系統(tǒng)釆用的PCM,利用語(yǔ)音信號(hào)幅度的統(tǒng)計(jì)特性，對(duì) 幅度按對(duì)數(shù)變換壓縮,將壓縮后的信號(hào)作PCM,因此稱(chēng)為對(duì)數(shù)PCMo 在譯碼時(shí)需要按指數(shù)進(jìn)行擴(kuò)展。這種技術(shù)也稱(chēng)為壓縮擴(kuò)張技術(shù)。帚化輸人國(guó)際上釆用兩種非均勻量化方法：4

9、律和“律其中律PCM主要在北美和日本使用，A律PCM用于其他-1國(guó)家和地區(qū)。這兩種方式差別很小皿律壓縮是最常用的一種。在美國(guó)7位“律PCM-般已被接受為K途電話(huà)質(zhì)量的標(biāo)準(zhǔn)。設(shè)占（允為語(yǔ)音波形的取樣值，則聲律壓縮的定義為;匕5)杠5而y sgn(*j)jIn 1 +“ X八maxFTi式中用喚是工（小的最大幅度心是表示壓縮程.度的參量. p -0表示沒(méi)有壓縮，戸越大壓縮率越高，故稱(chēng)之為H律壓編心通常嚴(yán)在100-500之間取值。取尹= 255,可以對(duì)電話(huà)質(zhì)量語(yǔ) 音進(jìn)行編碼，其音質(zhì)與1?位均勻量化的音質(zhì)相當(dāng)乜我國(guó)則釆用A律壓縮，其壓縮公式為:FR&)二丙百?zèng)_工1 + nA jc( n )

10、/Xnwc ( . 11 + lnA丨R (兀)丨1% *“ /'tnax目前有標(biāo)椎的A律PCM編碼芯片（如2911） PWnnw-2553自適應(yīng) PCM(APCM)：PCM在量化間隔上存在矛盾：為適應(yīng)大的幅值要用大的,但為了提高信噪比又希望用小的亠除了前面介紹的非均勻量化外，還有一種是采用自適應(yīng)方法，稱(chēng)為自適應(yīng)PCM (adaptive PCM,簡(jiǎn) 稱(chēng) APCM) o自適應(yīng)脈沖編碼調(diào)制(APCM)是根據(jù)輸入信號(hào)幅度大小來(lái)改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時(shí)自適應(yīng), 即量化階的大小每隔幾個(gè)樣本就改變，也可以是音節(jié)自適應(yīng)，即量化階的大小在較長(zhǎng)時(shí)間周期里發(fā)生變化

11、。改變量化階大小的方法有兩種：一種稱(chēng)為前向自適應(yīng)(fonvardadaptation),另一種稱(chēng)為后向自適應(yīng)(backward adaptation)。前向是指()是由佔(zhàn)計(jì)輸入信號(hào)而得到的，而后向是指由彳占計(jì) 量化器的輸出S(k)信道緩伸器1一量化器1.11111>¥ D化器邊信道前向自適應(yīng)是根據(jù)未量化的樣本值的均方根值來(lái)估算輸入信號(hào)的電平，以此來(lái)確定量化階的大小，并對(duì)其電平進(jìn)行編碼作為邊信息(side information)傳送到接收端。其特點(diǎn)是使用原始信號(hào)提取預(yù)測(cè)系數(shù)，精度比較高，預(yù)測(cè)的效果好。但是需要將預(yù)測(cè)器系數(shù)用邊信息傳送到接收端的解碼器，從而減小了差值信號(hào)量化

12、的有效比特?cái)?shù)，處理的延時(shí)比較大。s(k)量器適配器信道Sr(k)量化階適配器后向自適應(yīng)是從量化器剛輸出的過(guò)去樣本中來(lái)提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩端自動(dòng)生成量化階，所以它不需要傳送邊信息。后向自適應(yīng)預(yù)測(cè)利用量化后的信號(hào)提取預(yù)測(cè)信號(hào)，避免了前向自適應(yīng)預(yù)測(cè)的缺點(diǎn)，但是由于存在量化噪聲，使得預(yù)測(cè)系數(shù)的提取精度收到一定的影響。預(yù)測(cè)編碼及其自適應(yīng)APC在第六章中我們?cè)敿?xì)討論了線(xiàn)性預(yù)測(cè)分析原理，利用線(xiàn)性預(yù)測(cè)可以改進(jìn)編碼中的量化器性能，因?yàn)轭A(yù)測(cè)誤差e（）的動(dòng)態(tài)范圍和平均能量均比信號(hào)兀小，如果對(duì)和）進(jìn)行量化和編碼，則量化bit數(shù)將減少。在接收端，只要使用與發(fā)送端相同的預(yù)測(cè)器，就可恢復(fù)原

13、彳言號(hào)x（n）o 基于這種原理的編碼方式稱(chēng)為預(yù)測(cè)編碼（predictive coding,簡(jiǎn)稱(chēng)PC）當(dāng)預(yù)測(cè)系數(shù)是自適應(yīng)隨語(yǔ)音信號(hào)變化時(shí)，又稱(chēng)為自適應(yīng)預(yù)測(cè)編碼（Adaptive PC,簡(jiǎn)稱(chēng)APC）。e(n) = x(n) 一 x(n)語(yǔ)音數(shù)據(jù)流一般分為10 20 ms相繼的幀，而預(yù)測(cè)器系數(shù)(或其等效參數(shù))則與預(yù)測(cè)誤差一起傳輸。在接收端，用由預(yù)測(cè)器系數(shù)控制的逆濾波器再現(xiàn)語(yǔ)音。釆用自適應(yīng)技術(shù)后，預(yù)測(cè)器Hz)要自適應(yīng)變化，以便與信號(hào)匹配。自適應(yīng)差分脈沖編碼調(diào)制ADPCM 及自適應(yīng)增量調(diào)制ADM一增調(diào)制(DIM!)及自適應(yīng)增調(diào)制(ADM)1 增調(diào)制增壘調(diào)制簡(jiǎn)稱(chēng)為DM或AM,是對(duì)一個(gè)語(yǔ)音信號(hào)的

14、信息用最低限度的一位來(lái)表示的方法。在這種調(diào)制方式中，首先判別下一個(gè)語(yǔ)音信號(hào)值比當(dāng)前的信號(hào)值是高還是低，如果髙則給定編碼“廣,如果低給定為這樣來(lái)進(jìn)行語(yǔ)音信號(hào)的編碼。X(z)如果差值為正，即下一個(gè)語(yǔ)音信號(hào)值比當(dāng)前的信號(hào)值高，則量化器輸岀為m如果差值為負(fù)，即下一個(gè)語(yǔ)音信號(hào)值比現(xiàn)在的信號(hào)值低，則量化器輸出為“0J在接收端,用接收的脈沖串控制，信號(hào)就可以用上升下降的階梯波形來(lái)逼近。在DM中，與量化階梯相比，當(dāng)語(yǔ)音波形幅度發(fā)生急劇變化時(shí)，譯碼波形不能充分跟蹤這種急劇的變化而必然產(chǎn)生失真，這稱(chēng)為斜率過(guò)載。相反地，在沒(méi)有輸入語(yǔ)音的無(wú)聲狀態(tài)時(shí)，或者是信號(hào)幅度為固定值時(shí)，量化輸出都將呈現(xiàn)0、1交替的

15、序列，而譯碼后的波形只是的重復(fù)增減。這種噪聲稱(chēng)為顆粒噪聲，它給人以粗糙的噪聲感覺(jué)。兩種噪聲的形式2.自適應(yīng)增量調(diào)制ADM為了減少斜率過(guò)載失真，必須把設(shè)計(jì)得大一些；但是過(guò)大，又增加了顆粒噪聲。因此，兼顧兩方面要求，需按均方量化誤差為最?。词箖煞N失真均減至最?。﹣?lái)選擇即采用隨輸入波形自適應(yīng)地改變大小的自適應(yīng)編碼方式，使厶值隨信號(hào)平均斜率而變化；斜率大時(shí)，自動(dòng)增大；反之則減小。這就是自適應(yīng)增量調(diào)制（Adaptive, DM,簡(jiǎn)稱(chēng)ADM）。引入自適應(yīng)技術(shù)后、ADM大約可增多10dB的增益。實(shí)驗(yàn)表明，取樣率為56kHz時(shí)ADM具有與取樣率為8kHz時(shí)的7bit對(duì)數(shù)PCM相同的語(yǔ)音質(zhì)量。

16、差分脈沖編碼調(diào)制DPCM降低傳輸比特率的一種方法是減少必須編碼的信息量，這要利用語(yǔ)音信號(hào)中大量的冗余度。在相鄰的語(yǔ)音樣本之間存在著明顯的相關(guān)性，因此，對(duì)相鄰樣本間的差信號(hào)(差分)進(jìn)行編碼，便可謀求信息量的壓縮，因?yàn)椴罘中盘?hào)比原語(yǔ)音信號(hào)的動(dòng)態(tài)范圍和平均能量都小。這種編碼稱(chēng)為差分脈沖編碼調(diào)制(Differential PCM,簡(jiǎn)稱(chēng)DPCM) oDPCM實(shí)質(zhì)上是預(yù)測(cè)編碼APC的一種特殊情況，是最簡(jiǎn)單的一階線(xiàn)性預(yù)測(cè)，即A二 1當(dāng)Q二1時(shí),被量化的編碼是e(n)=x(n) - x(n-l)sG）是輸入語(yǔ)音信號(hào)，SpG）是重建語(yǔ)音信號(hào)，作為預(yù)測(cè)器確定下一"信號(hào)估計(jì)值的輸入信號(hào)。Sp（

17、n）是預(yù)測(cè)語(yǔ)音信號(hào)，d（n）是預(yù)測(cè)誤差信號(hào)，也稱(chēng)為差值信號(hào)或余量信號(hào)。DPCM系統(tǒng) 實(shí)際上就是對(duì)這個(gè)差值信號(hào)進(jìn)行量化編碼，用來(lái)補(bǔ)償過(guò)去編碼中產(chǎn)生的量化誤差。DPCM系統(tǒng)是一個(gè)反饋系統(tǒng)，采用這種結(jié) 構(gòu)可以避免量化誤差的積累。切）是量化后的差值信號(hào), 心）是d$ （斤）的代碼o由于0是固定的，顯然它不可能對(duì)所有講話(huà)者和所有語(yǔ)音內(nèi)容都是最佳的，如果采用高階（1）的固定頂測(cè)，改善效果并不明顯；比較好的方法是采用高階自適應(yīng)預(yù)測(cè)。采用自適應(yīng)量化及高階自適應(yīng)預(yù)測(cè)的DPCM稱(chēng)為ADPCM,它本質(zhì)上也是一種 APCoCCITT （國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì)）在1984年提出的32kbit/s編碼器建議（

18、G. 721）,就是采用ADPCM作為長(zhǎng)途傳輸中一種新的國(guó)際通用語(yǔ)音編碼方案。這利1 ADPCM可達(dá)到標(biāo)準(zhǔn)kbit/sPCM的語(yǔ)音傳輸質(zhì)量，并具有很好的抗誤碼性能。子帶編碼SBC子帶編碼(Sub-Band Coding,簡(jiǎn)稱(chēng)SBC)也稱(chēng)為頻帶分割編碼1帶通濾波頻率搬移量化編碼Avv9f 9 Aw合帶通濾波頻率搬移J s2量化編碼路帶通濾波頻率搬移量化編碼發(fā)信碼首先使用帶通濾波器組將語(yǔ)音信號(hào)分割成若干個(gè)頻段也稱(chēng)為子帶，然后用調(diào)制的方法對(duì)濾波后的信號(hào)即子帶信號(hào)進(jìn)行頻譜平移變成低通信號(hào)(即基帶信號(hào))，以利于降低取樣率進(jìn)行抽?。辉倮媚慰?斯特速率對(duì)其進(jìn)行取樣，最后再進(jìn)行編碼處理。而信號(hào)的恢復(fù)

19、按與上面完全相反的過(guò)程進(jìn)行。SBC解碼器在接收端，把總的編碼分成各子帶的編碼值，分別解碼，再經(jīng)頻譜平移，帶通濾彼,最后相加得到重建信號(hào)。SBC的優(yōu)點(diǎn)是對(duì)應(yīng)于人的聽(tīng)覺(jué)特性，可以比較容易地考慮噪聲的抑制；即各子帶可以選用不同的量化參數(shù)以分別控制其信噪比，滿(mǎn)足主觀(guān)聽(tīng)覺(jué)的要求。例如，由于語(yǔ)音能量的不平衡，對(duì)于含有基音頻率和第一共振峰的低頻部分，對(duì)語(yǔ)音清晰度等主觀(guān)品質(zhì)影響較大，應(yīng)分配比較多的信息、量化細(xì)些；反之，高頻部分的量化就可粗些。這樣，可以減少量化噪聲對(duì)聽(tīng)覺(jué)的妨害程度，整體上也能降低比特?cái)?shù)。另外，量化噪聲只能出現(xiàn)在各被分割的頻帶內(nèi)，對(duì)其他頻帶沒(méi)有任何影響，所以可以較容易地控制噪聲譜

20、。各子帶的帶寬可以是相同的也可以是不相同的，相同的稱(chēng)為等帶寬子帶編碼，不同的稱(chēng)為變帶寬子帶編碼。等帶寬子帶編碼的優(yōu)點(diǎn)是易于用硬件實(shí)現(xiàn)也便于進(jìn)行理論分析。設(shè)有M個(gè)子帶，則對(duì)于等帶寬子帶編碼，艸二W/MM 二 1,2,，M直中附是編碼系統(tǒng)總的帶寬,M是子帶總數(shù)在變帶寬編碼中，常用的子帶劃分方法是令各子帶寬度隨由增加而增加,也就是低頻段的子帶寬度較窄，高頻段的較寬。這樣劃分環(huán)僅和語(yǔ)音信號(hào)的功率相匹配而且也和語(yǔ)音信號(hào)的可懂度:EO. tUL或清晰度隨頻率變化的關(guān)系相匹配。中具有相同帶寛的各子帶對(duì)語(yǔ)音可懂度研究表明,語(yǔ)音信號(hào)頻帶H影響是不同的。低頻段的彩響大，高頻段的影響小。因此，將低頻段的子帶分

21、得細(xì)一些,量化精度高一些,就可能使整個(gè)重建語(yǔ)音的質(zhì) 量高一些。但是在等帶寬分割時(shí)，肘不同子帶分配不同的比特?cái)?shù)，等帶寬子帶編碼也能獲得很好的質(zhì)量戔持別是當(dāng)M比較大時(shí)（例如M=16或32SBC中，相鄰子帶的交迭區(qū)或間隔應(yīng)盡量小。為了減小相鄰子帶的交迭區(qū)或間隔，濾波器的滾降特性應(yīng)該比較陡'代價(jià)是增加濾波器階數(shù)。川12i3412 .34l H W) Ia*(a)理想四了帯誕波曙組幅頻特性實(shí)際濾波器幅度響應(yīng)都有有限滾降持性，因此，在具體實(shí)現(xiàn)濾波組時(shí)有兩種情況。424(b)四f帶濾波器組幅頻特性一種是各子帶濾波器之間有交疊區(qū)域。若按理想帶通濾波器Nyquist 速率采樣，則會(huì)產(chǎn)生混疊若按實(shí)

22、際子帶寬度的Nvquist速率采樣，則會(huì)增加總的編碼速率。第二種情況各子帶之間有一定的間隙。實(shí)際語(yǔ)音帶寬小于原始語(yǔ)音帶寬，雖可以降低總的編碼邃率但重建語(yǔ)音會(huì)產(chǎn)生混響的主觀(guān)感覺(jué)。這兩種情況都要求濾波器組的滾降特性比較陡，盡最接近理想帶通特性，其代階是必須增加濾波器階數(shù)，從而使硬件復(fù)雜化。實(shí)際應(yīng)用中SBC往往采用“整數(shù)帶”取樣方法。因?yàn)樵摲椒?不需要調(diào)制器來(lái)平移各子帶的頻譜成分，所以有利于硬件實(shí)現(xiàn)。整數(shù)帶分割是措各子帶的下截止頻率幾恰好是該子帶寬度的整數(shù)倍，即:根據(jù)帶通信號(hào)的采樣定理，這時(shí)可以用f = 2SW,直接對(duì) 子帶信號(hào)采樣，而不發(fā)生混疊。圖給出了子吊信號(hào)的取樣、編碼和解碼過(guò)程:/.&

23、#39; ”1回壬巴-/ .f理*叫丿;-（ + ）/;打.-mJ 仆 /2匚 3Z 4/.J 丨 t t !5）幅度iffW=22/.（卜2 /. j,按厲贏(yíng)樣1 /-2/.02./.4/.'. 山心樣洽詁打譜 “2丿；”M誌L 顱構(gòu)常廿譜在發(fā)送端，各個(gè)濾波器的輸出按2£速率轉(zhuǎn)取樣（£是第i個(gè)子帶的帶寬）, 重新取樣后的子信號(hào)經(jīng)編碼和多路器后送入數(shù)字信道。：在接收端，分路器和解碼器恢復(fù)岀各子帶信號(hào)，它們經(jīng)過(guò)補(bǔ)零、再增加取樣, 和原始信號(hào)昭口）相同；再通過(guò)和發(fā)送端相同的一組帶通濾波掘”最后對(duì)各濾波器輸岀求和便產(chǎn)生出重構(gòu)的語(yǔ)音信號(hào)。正交鏡像濾波器組對(duì)于各子帶之間有疊

24、接的濾波器組，如果按理想帶通的Nyquist采樣定理對(duì)子帶信號(hào)采樣，則會(huì)產(chǎn)生混疊。為了減少混疊造成的失真，濾波；器的滾降特性必須陡lb肖，這就要求濾波器的階數(shù)較高。在數(shù)字濾波器實(shí)現(xiàn)中為了實(shí)現(xiàn)線(xiàn)性相位濾波，往往需要采用128256階甚至更高階的FIR濾波器才能使混疊效應(yīng)不至于對(duì)編碼質(zhì)量產(chǎn)生明顯的影響，這無(wú)疑會(huì)使實(shí)現(xiàn)濾波器的運(yùn)算負(fù)擔(dān)太重。止交鏡像濾波器組QMFB 不但能夠解決混疊問(wèn)題，面目對(duì)濾波器的滾降特性可以大大降低要求, 般只要16-32階就足夠。這種方法首先將整個(gè)語(yǔ)咅帶分成兩個(gè)相零部分Hi形成子帶，然后這些子帶被同樣分割以形成四個(gè)子帶。這個(gè)過(guò)程可按島藍(lán)重龕. 以產(chǎn)4；任何吵個(gè)了帑

25、窓采用這種方法的濾波器就稱(chēng)為正交鏡像濾波器°止交鏡像遞波器的原理如圖°圖儀是低通濾波器，其通帶為工5）的下半帶；浙仮繪上半帶，是相應(yīng)丁出的鏡像濾波器。這種濾波器所具有的性質(zhì)是：匕子帶濾波器的頻率響應(yīng)足卜嚴(yán)帶濾波器頻率響應(yīng)的鏡像，即I H（出曲）| = |武中、口二2處£ = 2tt/ T是卞（幾）的取樣角頻率（.這樣一對(duì)濾波器可用有限沖激響應(yīng)（FIR）數(shù)字濾波器實(shí)現(xiàn),U2是將乩沖激響應(yīng)每隔-個(gè)樣本的符號(hào)反號(hào)由H得到的。子帶每分隔一次+采樣率就隨著降低1倍。在接收器，輸人樣本通過(guò)內(nèi)插進(jìn)行過(guò)采樣，并采用與發(fā)送端濾波器相匹配的數(shù)字濾波器進(jìn)行帶逋濾波7自適應(yīng)

26、變換編碼ATC利用正交變換，把信號(hào)從時(shí)域變換到另一個(gè)域°正交變換可起相關(guān)的作用，使變換域系數(shù)集中在一個(gè)較小范圍內(nèi)把語(yǔ)音數(shù)據(jù)串分成相鄰的幀J每幀由運(yùn)算A進(jìn)行變換并對(duì)變換值進(jìn)行編碼和傳輸匕在接收端由反變換來(lái)恢復(fù)原來(lái)語(yǔ)音。設(shè)-幀涪昔信號(hào)訊九)w " W N -，町以形成個(gè)咲量 x = 15 (0), (I )H- j(yv - |) J1這里T表水轉(zhuǎn)置J該矢最通過(guò)一個(gè)正交變換矩陣A ,作一個(gè)線(xiàn)性變換式中M滿(mǎn)足4"y -肛A1,J中的兀素就是變換域系數(shù),它們被竝化后形成矢量" 在接收端通過(guò)逆變換重構(gòu)出倍號(hào)矢量ix = Ay = 4tj 這里，問(wèn)題是要提供一種合

27、適的正交變換“主要選擇對(duì)象有DFT、沃爾什-哈達(dá)馬變換、離散余弦變換DCT (Discrete Cosine Transform) KLT變換(Karhunen - Ueve Transform)。目前正交變換都采用DCT, 并往往將這種方式稱(chēng)為ATS其原因是DCT有以下特點(diǎn):(D DCrr與KLT相比，頻域變換明確且與人的聽(tīng)覺(jué)頻率分析機(jī)理相對(duì)應(yīng),因此容易控制量化噪聲的頻率范圍匚 DCT提供的性能一般在KLT的1 - 2 dB之內(nèi)其他變換則相當(dāng)差。而KLT的計(jì)算量太大。由于DCTH需在每幀采用FFT運(yùn)算即可，因此運(yùn)算董、數(shù)據(jù)量少他不需要傳輸特征矢量。由于DCT統(tǒng)計(jì)地近似丁氏時(shí)間最佳正交變

28、換和特征矢量，所以DCT與DFT相比，統(tǒng)汁地看DCT變換效率高° DC7與DFT相比號(hào)在端點(diǎn)取岀彼形的影響較小，在頻域區(qū)的畸變小。TV點(diǎn)DCT定義如下Y -X)血)二 x( rz) i)cos "2" g 甘"(0 蟲(chóng) & w 川一 1)n = Ui其反變換為*( n)=寺 £ Xf( c( fe)cos "" ； JT(0 w n W w - 1)式中I ( k = 0)U'2(1 w & w /v - i)ATC系統(tǒng)的原理框圖c上4離敝余輪變換一雖:化編叫=解礙一4余弦反變換計(jì)斤比特分配駅化何

29、隔佔(zhàn)計(jì)諸按每一幀作DCT變換，把DCT系數(shù)劃分為20個(gè)左右的頻帶，求各頻帶的平均功率，作為邊帶信息傳送口；這樣，編碼器輸出的信號(hào)為表示頻譜包絡(luò)的輔助信息以及被量化過(guò)的DCT系數(shù)舁專(zhuān)輸邊帶信息需要2 kbit/s的數(shù) 據(jù)量。第11章語(yǔ)音編碼（2）-聲碼器技術(shù)及混合編碼參數(shù)編碼也稱(chēng)為模型編碼。它是對(duì)語(yǔ)音信號(hào)建立模型，然后對(duì)模型參數(shù)或是語(yǔ)音的特征參數(shù)進(jìn)行編碼，力圖使重建語(yǔ)音信號(hào)在聽(tīng)覺(jué)上具有盡可能高的清晰度和可懂度。線(xiàn)性預(yù)測(cè)聲碼器是一種參數(shù)編碼方法。參數(shù)編碼利用生成模型，在幅度譜上逼近原誥音，但重建語(yǔ)音的波形與原語(yǔ)音信號(hào)的波形較大差別。參數(shù)編碼實(shí)現(xiàn)語(yǔ)音通信的設(shè)備通常稱(chēng)為聲碼器；例：通道聲碼

30、器、共振峰聲碼器、同態(tài)聲碼器、LPC聲碼器；§11.1線(xiàn)性預(yù)測(cè)聲碼器線(xiàn)性預(yù)測(cè)聲碼器：應(yīng)用最成功的低速率參數(shù)語(yǔ)音編碼器。與利用線(xiàn)性預(yù)測(cè)的波形編碼不同的是它的接收端不再利用殘差，即不具體恢復(fù) 輸入語(yǔ)音的波形，而是直接利用預(yù)測(cè)系數(shù)等參數(shù)合成傳輸語(yǔ)音。 LPC有作為預(yù)測(cè)器和作為模型的雙重作用。直接量化預(yù)測(cè)系數(shù)不介適，因合成誤差大，甚至系統(tǒng)不穩(wěn)定。解決辦法：或用較多的bit量化每個(gè)預(yù)測(cè)器系數(shù)。或?qū)㈩A(yù)測(cè)器系數(shù)變換成具它參數(shù)形式。歸納起來(lái)，有以下兒種(1) 反射系數(shù)仏,危,，冷。分析表明：在區(qū)間-11對(duì)反射系數(shù)作線(xiàn)性量化是低效的：比特?cái)?shù)應(yīng)非均分配，仏和他的比特?cái)?shù)多些(56 bit) o(2) 對(duì)

31、數(shù)面積比，師。g = lg 1 += lg4 ; / = 1,2,-! 1- 4式屮咼,&+ 聲管第？節(jié)和第汁1節(jié)的截fin積。上式映射，使g呈相當(dāng)均勻的幅度分布，可以采用均勻量化; 參數(shù)間相關(guān)性低，經(jīng)內(nèi)插產(chǎn)生的濾波器是穩(wěn)定的，需 56 bit 量化。'，. -(3) 預(yù)測(cè)多項(xiàng)式的根務(wù)嘰、kp o對(duì)預(yù)測(cè)多項(xiàng)式4分解因式，有*)=1-& 件，b)對(duì)預(yù)測(cè)多項(xiàng)式的根進(jìn)行量化，易保證合成濾波器的穩(wěn)定性。每個(gè)根平均用5 bit量化就能精確表示屮包含的頻譜信息。問(wèn)題：求根運(yùn)算量大，計(jì)算效率低，故該算法少用。> 一幀典型的LPC參數(shù)包括:1 bit清/濁音信息、大約5 bi

32、t增益常數(shù)、6 bit基音周期、反射系數(shù)或?qū)?shù)面積比平均56 bit量化(共有812個(gè)) 每幀共約60 bit。若25 ms幀，則編碼速率為2斗kbit/s左右。2.變幀率LPC聲碼器充分利用了語(yǔ)音信號(hào)在時(shí)域上的冗余度，尤其是元音和擦音在發(fā)音過(guò)程中都有緩變的區(qū)間，描述這部分區(qū)間的語(yǔ)音不必像一些快變語(yǔ)音那樣用很多比特的信語(yǔ)音信號(hào)是非平穩(wěn)的時(shí)變信號(hào)，波形變化隨時(shí)間而不同。（清音至濁音的過(guò)渡段，語(yǔ)音特性變化劇烈，理論上應(yīng)用較短的分析幀，要求LPC聲碼器至少每隔 10ms就發(fā)送一幀新的LPC參數(shù)；而對(duì)于濁音部分，在發(fā)音過(guò)程中有緩變的區(qū)間 ,語(yǔ)音信號(hào)的頻譜特性變化很小，分析幀就可以取長(zhǎng)些；在語(yǔ)音活動(dòng)

33、停頓情況下更是如此。）因而可以采用變幀速率的編碼技術(shù)來(lái)降低聲碼器的平均傳輸碼率。心辭數(shù)：Z鑑曲跡蠶瑟囁氐鑼碼率。謡問(wèn)題：需要一種度量方法來(lái)確定當(dāng)前幀參數(shù)和上-幀參數(shù)之間的差異（§11.2 LPC-10 編碼器LPC10盧碼器>LPC-l(h美國(guó)1976年確定的2.4kb.to語(yǔ)音通信的標(biāo)準(zhǔn)技術(shù)。1981年公布作為聯(lián)邦政府標(biāo)準(zhǔn)FED-STD-1015oA該算法可介成清晰、可懂的語(yǔ)音，但抗噪能力和自然度欠佳。>LPC-10e： 2.4kbJ必速率，LPC-1O 的增強(qiáng)型。> H JL986年以來(lái)，美國(guó)第二代保密電話(huà)裝宜采用LPC-lOeo »本節(jié)主要包括：

34、>.發(fā)端編碼器* > 收端解碼器% LPC-10聲碼器存在的問(wèn)題1.編碼器LPC-10編碼器框圖（幀180個(gè)樣，幀長(zhǎng)22.5 ms）預(yù)加重濾波器的傳輸函數(shù)：”嚴(yán)=1-0.9375L】聲道濾波器參數(shù)RC、增益卍席用準(zhǔn)基音同步相位法計(jì)算。2.計(jì)算聲道濾波器參數(shù)用7采用10階LPC分析濾波器，利用協(xié)方差法計(jì)算預(yù)測(cè)系數(shù)：ava2".a1Q,（用U卩分解法對(duì)系數(shù)矩陣求逆）轉(zhuǎn)換成反射系數(shù)或部分相關(guān)系數(shù)（PARCOR） o（理論上，RC和PARCOR互為相反數(shù)） LPC分析采用半基音同步算法，即濁音幀長(zhǎng)度取為130個(gè)樣本以?xún)?nèi)的基音周期整數(shù)倍值, 來(lái)計(jì)算和增益心於。每一個(gè)基音周期都可以

35、單獨(dú)用一組系數(shù)處理。清音幀長(zhǎng)度為22.5 ms的整幀屮點(diǎn)為屮心的130個(gè)樣本形成分析幀來(lái)計(jì)算R0和RA1SO3.計(jì)算増益RMS用如下公式計(jì)算増益RAIS:RMS =式屮 XU')經(jīng)過(guò)預(yù)加重的數(shù)字語(yǔ)音; 分析幀的長(zhǎng)度。4.提取基音周期和檢測(cè)清/濁音 x輸入語(yǔ)音經(jīng)3 dB截止頻率為80() Hz的4階Buttenvorth低通濾波，濾波后信號(hào)冉經(jīng)二階逆濾波。 (盪詭波器葩系敷茍喩而LPC今桁爾列屜親時(shí)需畚嶽丿取樣頻率降低至原來(lái)的1/4,再計(jì)算延遲時(shí)間為20- 156個(gè)樣點(diǎn)的AMDF, 基音周期：由AMDF的最小值確定。計(jì)算AMDF：公式為AMDF(r) = Y： x(m)- x(m

36、+ r)|式中，t = 20,21,22,.,40,42,44,.,80.8488,156；相當(dāng)丁在50400 Hz范圍內(nèi)計(jì)算60個(gè)AMDF值。清/濁音判決：利用模式匹配技術(shù)，基丁低帶能量、AMDF函數(shù)最大值與最小值Z比、過(guò)零率作出的。對(duì)基音值、清/濁音判決結(jié)果用動(dòng)態(tài)規(guī)劃算法：嗪裁1 在3幀范圍內(nèi)進(jìn)彳亍平滑和錯(cuò)誤校正，從而給出當(dāng)前幀的基音周期T、清/濁音判決參數(shù)U譏每幀清/濁音判決結(jié)果用兩位碼表示四種狀態(tài)：00:穩(wěn)定的清音；01：清音向濁音轉(zhuǎn)換；10：濁音向清音轉(zhuǎn)換；11：穩(wěn)定的濁音。LPCJLO 的 bit 分配濁音清音濁音清音ZVoiciiis774RMS冷 JJ.爲(wèi)4Sync11%45

37、%3爲(wèi)氣5102kp 5誤差校正0205總計(jì)545345 參數(shù)編碼與解碼 LPC-10的傳輸數(shù)據(jù)流含：10個(gè)反射系數(shù)：濟(jì)應(yīng)血0，增益RAIS.基音周期丁、清/濁音UA-同步信號(hào)Sync.同步信號(hào)采用相鄰幀1、0碼交替的模式。編碼成每幀54 bit。傳輸-44.4幀人，編碼速率為2 4 khit&o> :濁音幀和清音幀的比特分配。(1) 反射系數(shù)的編碼S解碼廠(chǎng)用對(duì)數(shù)而積比品表示反射系數(shù)&方法編碼，具關(guān)系為：+上呂二lg ；/ =J0xLPC-10,先將&變換成再查表量化。方法如下：符號(hào)轉(zhuǎn)換：對(duì)丁濁音，血被向+1偏負(fù)。儕和底作對(duì)數(shù)而積比后，確定仏和億的符號(hào)，負(fù)

38、T，正=0：對(duì)何和危的絕對(duì)值除以2X若±63,取為63，否則取原值。查表2得4 bit碼字再附上符號(hào)位,得5 bit碼為編碼輸出o表9.2對(duì)數(shù)面積比編碼對(duì)數(shù)面積比編碼對(duì)數(shù)面積比編碼對(duì)數(shù)面積比編碼對(duì)數(shù)面積比編碼05027-33449-5286012612134-38553-559611313-1923943656,5710621420-26344 “ 48758,59116315注：PARCOR參數(shù)上的絕對(duì)值作為序號(hào)于負(fù)的上參數(shù)用2進(jìn)制補(bǔ)碼運(yùn)算濁音幀：心心。取整后除以厶加上表93屮對(duì)應(yīng)的偏置數(shù),冉乘上表9；的比例因子后取整（具值在范-127-127 內(nèi)）,用8減左按表9-1分配的比

39、特?cái)?shù)的位數(shù)右移，剩下的比特?cái)?shù)即為編碼輸出，具屮含1位符號(hào)位。濁音幀：用表9.5 （見(jiàn)下頁(yè)丿對(duì)接收的處和他解碼，對(duì)T'io加一個(gè)量化偏置以補(bǔ)償量化的影響，然后以發(fā)送端相反的相應(yīng)操作去偏置和去比例因子，即乘以2打，取整。表9.3 FARCOR參數(shù)的偏置表參數(shù)k3趣k910偏置-1152+28164-1536+3584+ 1280+2432-768+1920>1：偏置加到參數(shù)帶特號(hào)移住Mbit的值上.偏置一1152 十 2816 十乃 36十 3%4十1280十 2432768 十 1920>i:偏蓋加到參數(shù)帶脊號(hào)移侵坯bit的值上表9.4 FARCOR參數(shù)的比例因子參數(shù)k

40、5k78比例因子0.00560.00630.00680.00720.00740.00730.00840.0102注：比參數(shù)放比例因子擴(kuò)展為6 bit分布.表9占對(duì)數(shù)面職比解碼表編碼對(duì)數(shù)面積比編碼對(duì)數(shù)面積比編碼對(duì)數(shù)面積比編碼對(duì)數(shù)面積比編碼對(duì)數(shù)面積比0262313431925501672714462057276129830154821582862313933165022 59306341610361752235931 63519113918542460注：接收上參數(shù)的絕對(duì)值尙左移一便作為解碼序號(hào).非濁音幀（清音或過(guò)渡音）：僅發(fā)送k嚴(yán)屮（& 4'） Hamming擴(kuò)展碼保護(hù)和RAIS

41、的4個(gè)高有效位;設(shè)4位信息碼為/71=777077?1叫皿3'發(fā)送碼字1円務(wù)叫吋爭(zhēng)屮譏尹"則編碼方程為：（最偸省軟洼叢僑碼丿v0 二 m0, v4 二叫刀2 W m2. v = /；71, v5 =叫 mx © 叫 r v2 = m2. v6 = /77O m2 m3 v3 m3, v7 - m ffl m2 叫(2) 恥卅參數(shù)的編碼、解碼KA/S參數(shù)用查表法進(jìn)行-編碼、解碼。表9.6:數(shù)值在2512 Z間的圧於值用步長(zhǎng)為0.773 dB的對(duì)數(shù)碼表進(jìn)行編碼和解碼。表96用跑編碼表序號(hào)丄換空值序號(hào)WE值序號(hào)WE值序號(hào)用府值序號(hào)用府值序號(hào)皿空值序號(hào)皿空值序號(hào)皿空值008

42、41682416323240664813556275109417825173335417249147573002110518926193439427950164583283.11151910272135424386511765935942126201128233646449452192603925213621122925375145：103532106142863 :14722133027385546113542306246873157231531303960471235525163512注：用對(duì)分法查表.在表內(nèi)我到序號(hào)后.序號(hào)廉以2即為發(fā)送比特. 計(jì)算公式為：序號(hào)=202)/0.773(3)

43、基音、清/濁音編碼、解碼 60個(gè)基音值和清/濁音編碼用7 bit編碼表不。清音/過(guò)渡幀；用矢量000C)0C)0/表示： 60個(gè)基音值用碼字重量3或4的7 bit Gray碼編碼;A表9.7：編碼方案。解碼時(shí),收到的7 bit矢量,若碼字重量為3或4時(shí)，按表97的基音周期編碼表解碼;若碼字重量為0或1時(shí)，則判定接收幀為清音幀；表9.7基音周期編碼表Gzy碼周期GiayS§周期Gmy碼周期Grny 碼周期Gray®周期Guy碼周期0010011200001111300110101401011010601001101801110001120000101121000011131

44、0110001421011000621001001841110000124001101122010011132011001144101110064 '10010118811100101280011001230100110330110010461010100661001010921100010132001110124010111034011011048101011068 .100111096110101013600 W1012501010103501 101005010100107010001101001101000140001011126010101136011110052101001

45110110014400101102701010013701110005410100017410000111081100100148001111028010110138oiii .010561010101761100011112110010115200011102901001013900110105810001017811000011161001100156若碼字重量為7或6時(shí)，則判定接收幀為過(guò)渡幀；若碼字重量為2或5時(shí)，則判定接收幀為無(wú)效幀。最后按表9.8的比特順序，組成發(fā)送比特流發(fā)往線(xiàn)路。表9.8發(fā)送比特流bit濁音清音bit濁音清音bit濁音清音Bit濁音清音1

46、妬,0同左15近2同左29go43耳22同左16同左3044褊23乓,0同左17務(wù)3同左31可4同左45D/c4Tfl同左18$2同左32虬4同左46心,25Rfi同左19每3同左3331.547同左6心,1同左20同左34艱048閔,17同左21尺3同左35爲(wèi),149匕38褊1同左22為,4同左364 550饑,3爲(wèi),89盜1同左23觴3同左3751為,3褊810同左24的4同左38去Lj652為2怠，811俎2同左25褊3同左3953心,312褊0同左26R4同左40盤(pán)? 2為；754sync同左13同左27石3同左41忌014氏2同左28饑4同左42同左注；1 發(fā)送順序是從bit 1到b

47、it 54；2. T是基音”氏是RM& k是反射系數(shù);3.參數(shù)丁后的數(shù)字爲(wèi)嚴(yán)表示的是第j位bit。圖9占：LPC-10收端解碼器框圖。接收信號(hào)經(jīng)串/并變換及同步后，用查表法進(jìn)行檢錯(cuò)、糾錯(cuò)。譯碼后的數(shù)據(jù)經(jīng)參數(shù)解碼得：解碼參數(shù)，結(jié)果延時(shí)一幀輸出。輸出數(shù)據(jù)在過(guò)去幀、當(dāng)前幀和將來(lái)幀，共3幀內(nèi)平滑。每幀只傳輸一組參數(shù)，但一幀內(nèi)可有不止一個(gè)基音周期，因此，要對(duì)接收數(shù)值進(jìn)行由幀塊到基音塊的轉(zhuǎn)換和插值。(1) 參數(shù)插值原則。對(duì)數(shù)面積比參數(shù)值毎幀插值兩次； RMS參數(shù)值在對(duì)數(shù)域進(jìn)行-基音同步插值；基音參數(shù)值用基音同步的線(xiàn)性插值；在濁音向清音過(guò)渡時(shí)對(duì)數(shù)面積比不插值。每個(gè)基音周期更新一次預(yù)測(cè)系數(shù)、增益、基

48、音周期、清/濁音等參數(shù)，這個(gè)過(guò)程在幀塊到基音塊的轉(zhuǎn)換和插值屮完成。(2) 激勵(lì)源。根據(jù)基音周期和清/濁音標(biāo)志決定耍采用的激勵(lì)信號(hào)源。清音幀用隨機(jī)數(shù)作為激勵(lì)源；濁音幀用周期性沖激序列通過(guò)一個(gè)全通濾波器來(lái)生成激勵(lì)源，語(yǔ)音合成濾波器輸入激勵(lì)的幅度保持恒定不變，輸出幅度受RMS參數(shù)加權(quán)。給岀一組有41個(gè)樣點(diǎn)的濁音激勵(lì)信號(hào)：麗二0、0, a Q 0,0,0, Q 5, & 13, 24 43,8U47, 252,359, 364,92,336 -306. -336 92.364.359,252.147 8143、24,13, & 5.0. Q 0, (X 0.0.0、0若當(dāng)前的基音周

49、期不等于41個(gè)樣點(diǎn)，則將此激勵(lì)源截短或者填零，使之與基音周期等長(zhǎng)。(3)語(yǔ)音合成。用Levinson遞推算法將反射參數(shù)變換成預(yù)測(cè)系數(shù)。收端合成器應(yīng)用直接型遞歸濾波器合成語(yǔ)音。對(duì)具輸出進(jìn)行幅度校正、去加重，并變換為模擬信號(hào), 最后經(jīng)3600 Hz的彳氐通濾波器后輸岀模擬涪音。LPC-10聲碼器存在的問(wèn)題(1) 損失了語(yǔ)音的Fl然度。實(shí)際語(yǔ)音的殘差信號(hào)屮，有部分既非周期脈沖乂非隨機(jī)噪聲；或者低頻段是周期脈沖，高頻段是隨機(jī)噪聲。采用二元激勵(lì)代替殘圣信號(hào)，使合成語(yǔ)音聽(tīng)起來(lái)不H然。(2) 穩(wěn)健性(Robustness)墾。噪聲環(huán)境下，基音周期和清/濁音判決不易準(zhǔn)確提取。噪聲較強(qiáng)時(shí)，系統(tǒng)性能顯著惡化。

50、(3) 共振峰位置及帶寬估值會(huì)有很大失真。失真的原因是濁語(yǔ)音段時(shí)域上的周期重復(fù)信號(hào)使得短時(shí)語(yǔ)音譜形接近于線(xiàn)狀分布譜?；l較大，且與譜包絡(luò)中共振峰久相接近，即方=1幾由丁 LPC譜估計(jì)力圖使模型譜逼近丁信號(hào)譜包絡(luò)，在估計(jì)岀的譜包絡(luò)屮會(huì)岀現(xiàn)極其尖銳的峰值O 在合成語(yǔ)音中會(huì)出現(xiàn)尖峰或較大毛刺，從而影響語(yǔ)音質(zhì)量。§ 11.3語(yǔ)音信號(hào)的混合編碼20世紀(jì)80年代后期，綜合了參數(shù)編碼低比特率與波形編碼高語(yǔ)音質(zhì)量?jī)?yōu)點(diǎn)的混合編碼得到廣泛的使用。最為典型的就是CELP模型。它在比特率為4-16Kbps時(shí)已經(jīng)可以得到比其他算法更高的重建語(yǔ)音質(zhì)量。：得到最廣泛應(yīng)用的是LPAS （基于線(xiàn)性預(yù)測(cè)技術(shù)的分

51、析合成編碼方法），通過(guò)線(xiàn)性預(yù)測(cè)確定系統(tǒng)參數(shù)，并通過(guò)閉環(huán)或分析-合成方法來(lái)確定激勵(lì)序列。0感知加權(quán)濾波器：使得量化誤差能被高能量的共振峰所掩蓋。« 3種最常見(jiàn)的分析-合成線(xiàn)性預(yù)測(cè)編碼算法分別是: 多脈沖線(xiàn)性預(yù)測(cè)算法（MPLPC）規(guī)則脈沖激勵(lì)線(xiàn)性預(yù)測(cè)編碼（RPE-LPC）：碼激勵(lì)線(xiàn)性預(yù)測(cè)編碼（CELP）:具有較高質(zhì)量的合成語(yǔ)音和良好的抗噪性和多次復(fù)接能力，近年很多聲碼器基于該模型。傳統(tǒng)的LPC聲碼器采用的是二元激勵(lì)，它將激勵(lì)源分為清音和濁音；CELP的主要改進(jìn)是采用矢量量化技術(shù)對(duì)激勵(lì)信號(hào) 編碼，將事先經(jīng)過(guò)訓(xùn)練得到的一組碼矢量組成一個(gè)碼本，然后對(duì)每一幀語(yǔ)音信號(hào)從這組碼本中選出一個(gè)在感知加權(quán)誤差最小意義上的最佳

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第十一章聲碼器和混合編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第十一章聲碼器和混合編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔