




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第第10章章 語音編碼語音編碼(1)波形編碼波形編碼v概述及分類概述及分類v脈沖編碼調(diào)制脈沖編碼調(diào)制PCMv預(yù)測編碼及其自適應(yīng)預(yù)測編碼及其自適應(yīng)APCv自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制ADPCM及自適應(yīng)增量調(diào)及自適應(yīng)增量調(diào)制制ADMv子帶編碼子帶編碼SBCv自適應(yīng)變換編碼自適應(yīng)變換編碼ATC概述概述語音編碼:語音編碼:Speech Coding, 在語音通信及人類信息交流中占舉足在語音通信及人類信息交流中占舉足輕重的地位。研究對語音信號進行壓縮傳輸、存儲等內(nèi)容。目前數(shù)輕重的地位。研究對語音信號進行壓縮傳輸、存儲等內(nèi)容。目前數(shù)字通信得以廣泛應(yīng)用,語音編碼是將模擬語音數(shù)字化的手段。字通
2、信得以廣泛應(yīng)用,語音編碼是將模擬語音數(shù)字化的手段。將語音信號編碼為二進制數(shù)字序列,最簡單的方法是對其直接進行將語音信號編碼為二進制數(shù)字序列,最簡單的方法是對其直接進行模模/數(shù)變換;只要取樣率足夠高,量化每個樣本的比特數(shù)足夠多,數(shù)變換;只要取樣率足夠高,量化每個樣本的比特數(shù)足夠多,則可以保證解碼恢復(fù)的語音信號有很好的音質(zhì),不會丟失有用信息。則可以保證解碼恢復(fù)的語音信號有很好的音質(zhì),不會丟失有用信息。 然而對語音信號直接數(shù)字化所需的數(shù)碼率太高,例如,普通的電話通信中采用8kHz取樣率,如用12bit進行量化,則數(shù)碼率為96kbit/s。這樣大的數(shù)碼率即使對很大容量的傳輸信道也是難以承受的,因而必須
3、對語音信號進行壓縮編碼。 概述概述語音編碼語音編碼目的目的:在保持可以接受的失真的情況下,采用盡可能少的:在保持可以接受的失真的情況下,采用盡可能少的比特數(shù)表示語音,即減少傳輸碼率或存儲量。比特數(shù)表示語音,即減少傳輸碼率或存儲量。編碼后同樣的信道容量能傳輸更多路的信號,因而這類編碼又稱編碼后同樣的信道容量能傳輸更多路的信號,因而這類編碼又稱為為壓縮編碼壓縮編碼,壓縮編碼需要在,壓縮編碼需要在保持可懂度與音質(zhì)保持可懂度與音質(zhì)、降低數(shù)碼率降低數(shù)碼率和和降低編碼過程的計算代價降低編碼過程的計算代價三方面折衷。三方面折衷。傳輸碼率傳輸碼率:也稱為也稱為數(shù)碼率數(shù)碼率,指傳輸每秒鐘語音信號所需要的比特,指
4、傳輸每秒鐘語音信號所需要的比特數(shù)。數(shù)。波形編碼波形編碼語音編碼分類語音編碼分類:波形編碼,:波形編碼,Waveform Coder; 參數(shù)編碼,參數(shù)編碼,Parametric Coder; 混合編碼,混合編碼,Hybrid Coder特點特點:針對語音波形進行編碼,盡量保持輸入波形不變,即恢復(fù):針對語音波形進行編碼,盡量保持輸入波形不變,即恢復(fù)的語音信號基本上與輸入的語音信號波形相同。的語音信號基本上與輸入的語音信號波形相同。 優(yōu)缺點優(yōu)缺點:具有適應(yīng)能力強、語音質(zhì)量好等優(yōu)點,缺點是需要的編:具有適應(yīng)能力強、語音質(zhì)量好等優(yōu)點,缺點是需要的編碼速率高。碼速率高。 典型的編碼方式典型的編碼方式:脈沖
5、編碼調(diào)制:脈沖編碼調(diào)制PCM、自適應(yīng)差分脈沖編碼調(diào)制、自適應(yīng)差分脈沖編碼調(diào)制ADPCM、子帶編碼、子帶編碼SBC等。等。 在在16-64kbit/s的數(shù)碼率上能給出高的編碼質(zhì)量,當(dāng)數(shù)碼率進一步的數(shù)碼率上能給出高的編碼質(zhì)量,當(dāng)數(shù)碼率進一步降低時,其性能下降較快。降低時,其性能下降較快。聲碼器聲碼器:即:即參數(shù)編碼參數(shù)編碼特點特點:先對語音信號進行分析,提取出其參數(shù),對參數(shù)進行編碼,先對語音信號進行分析,提取出其參數(shù),對參數(shù)進行編碼,解碼后這些參數(shù)重新合成出重構(gòu)的語音信號。力圖使重建的語音解碼后這些參數(shù)重新合成出重構(gòu)的語音信號。力圖使重建的語音信號具有盡可能高的可懂度,而不必保持波形的一致。信號具
6、有盡可能高的可懂度,而不必保持波形的一致。 優(yōu)缺點優(yōu)缺點:優(yōu)點是編碼速率低,可以低到優(yōu)點是編碼速率低,可以低到2.4kbps甚至以下,缺點是甚至以下,缺點是合成語音質(zhì)量差,特別是自然度低,處理復(fù)雜。合成語音質(zhì)量差,特別是自然度低,處理復(fù)雜。 典型的編碼方式典型的編碼方式:如通道聲碼器、相位聲碼器、同態(tài)聲碼器、線性如通道聲碼器、相位聲碼器、同態(tài)聲碼器、線性預(yù)測聲碼器等。預(yù)測聲碼器等。 混合編碼混合編碼特點特點:上述兩類方法的有機結(jié)合,與參數(shù)編碼相同的是,它也是基:上述兩類方法的有機結(jié)合,與參數(shù)編碼相同的是,它也是基于語音產(chǎn)生模型的假定并采用了分析合成技術(shù),但同時它又利用了于語音產(chǎn)生模型的假定并采
7、用了分析合成技術(shù),但同時它又利用了語音的時間波形信息,增強了重建語音的自然度,使得語音質(zhì)量有語音的時間波形信息,增強了重建語音的自然度,使得語音質(zhì)量有明顯的提高,代價是編碼速率相應(yīng)上升,一般在明顯的提高,代價是編碼速率相應(yīng)上升,一般在16-2.4Kbps之間。之間。典型的編碼方式典型的編碼方式:多脈沖激勵線性預(yù)測編碼:多脈沖激勵線性預(yù)測編碼MPLPC、規(guī)則脈沖激勵、規(guī)則脈沖激勵線性預(yù)測編碼線性預(yù)測編碼RPE-LPC、碼本激勵線性預(yù)測編碼、碼本激勵線性預(yù)測編碼CELP等等按傳輸碼率分類按傳輸碼率分類高速率語音編碼高速率語音編碼:速率:速率32kbit/s以上以上, PCM, 64kbit/s,
8、主主要用于公用電話網(wǎng)要用于公用電話網(wǎng);中高速率語音編碼中高速率語音編碼:速率:速率16-32kbit/s, ADPCM, 32kbit/s, 主要用于公用網(wǎng)主要用于公用網(wǎng);中速率語音編碼中速率語音編碼:速率:速率4.8-16kbit/s, GSM用的用的RPE/LTP 13kbit/s、VSELP, 8kbit/s主要用于數(shù)字移動通信話音郵主要用于數(shù)字移動通信話音郵件件; 低速率語音編碼低速率語音編碼:速率:速率1.2-4.8kbit/s, CELP, 4.8kb/s、 LPC, 1.2kb/s, 主要用于保密話音主要用于保密話音;極低速率語音編碼極低速率語音編碼:速率:速率1.2kbit/s
9、以下以下脈沖編碼調(diào)制脈沖編碼調(diào)制PCM波形編碼方式的最簡單形式是脈沖編碼調(diào)制脈沖編碼調(diào)制(Pulse code modulation,簡稱PCM)。它直接把語音信號進行采樣量化,表示成二進制數(shù)字信號,并通過并-串轉(zhuǎn)換過程轉(zhuǎn)換成串行的脈沖,并用脈沖對采樣幅度進行編碼,以便于傳輸和存儲。 它沒有利用語音信號的冗余度,所以信號沒有得到壓縮,編碼效它沒有利用語音信號的冗余度,所以信號沒有得到壓縮,編碼效率很低。率很低。一般,一般,PCM有均勻有均勻PCM、非均勻、非均勻PCM和自適應(yīng)和自適應(yīng)PCM幾種形式幾種形式模擬語音信號數(shù)字語音編碼抗混疊濾 波采樣量化編碼A/D轉(zhuǎn)換1.均勻均勻PCM:不論信號幅度
10、的大小,它都采用同等的量化階距不論信號幅度的大小,它都采用同等的量化階距進行量化,即采用均勻量化。進行量化,即采用均勻量化。2.非均勻非均勻PCM:從觀測到的語音信號概率密度可知,語音信號大量集中在低幅度上。因而,可以利用非均勻量化來彌補均勻量化的缺點。來彌補均勻量化的缺點。非均勻量化的基本思想是對大幅度的樣本使用大的,對小幅度的樣本使用小的;在接收端按此還原。 PCM的量化方式的量化方式均勻量化與非均勻量化 國際上采用兩種非均勻量化方法:A律和 律改變量化階大小的方法有兩種:一種稱為前向自適應(yīng)改變量化階大小的方法有兩種:一種稱為前向自適應(yīng)(forward adaptation),另一種稱為后
11、向自適應(yīng),另一種稱為后向自適應(yīng)(backward adaptation)。3.自適應(yīng)自適應(yīng)PCM(APCM): PCM在量化間隔上存在矛盾:為適應(yīng)大的幅值要用大的,但為了提高信噪比又希望用小的。除了前面介紹的非均勻量化外,還有一種是采用自適應(yīng)方法,稱為自適應(yīng)PCM (adaptive PCM,簡稱APCM)。 自適應(yīng)脈沖編碼調(diào)制自適應(yīng)脈沖編碼調(diào)制(APCM)是根據(jù)是根據(jù)輸入信號幅度大小來改變量輸入信號幅度大小來改變量化階大小化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時自適應(yīng),的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時自適應(yīng),即量化階的大小每隔幾個樣本就改變,也可以是音節(jié)自適應(yīng),即即量化階的大
12、小每隔幾個樣本就改變,也可以是音節(jié)自適應(yīng),即量化階的大小在較長時間周期里發(fā)生變化。量化階的大小在較長時間周期里發(fā)生變化。前向是指(n) 是由估計輸入信號而得到的,而后向是指由估計量化器的輸出前向自適應(yīng)是根據(jù)未量化的樣本值的均方根值來估算輸入信號的電平,以此來確定量化階的大小,并對其電平進行編碼作為邊信息(side information)傳送到接收端。其特點是使用原始信號提取預(yù)測系數(shù),精度比較高,預(yù)測的效果好。 但是需要將預(yù)測器系數(shù)用邊信息傳送到接收端的解碼器,從而減小了差值信號量化的有效比特數(shù),處理的延時比較大。后向自適應(yīng)是從量化器剛輸出的過去樣本中來提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩
13、端自動生成量化階,所以它不需要傳送邊信息。后向自適應(yīng)預(yù)測利用量化后的信號提取預(yù)測信號,避免了前向自適應(yīng)預(yù)測的缺點,但是由于存在量化噪聲,使得預(yù)測系數(shù)的提取精度收到一定的影響。預(yù)測編碼及其自適應(yīng)預(yù)測編碼及其自適應(yīng)APC在第六章中我們詳細討論了線性預(yù)測分析原理,利用線性預(yù)測可以改進編碼中的量化器性能,因為預(yù)測誤差e(n)的動態(tài)范圍和平均能量均比信號x(n)小,如果對e(n)進行量化和編碼,則量化bit數(shù)將減少。在接收端,只要使用與發(fā)送端相同的預(yù)測器,就可恢復(fù)原信號x(n)。 基于這種原理的編碼方式稱為預(yù)測編碼(predictive coding,簡稱PC) 當(dāng)預(yù)測系數(shù)是自適應(yīng)隨語音信號變化時,又稱
14、為自適應(yīng)預(yù)測編碼自適應(yīng)預(yù)測編碼(Adaptive PC,簡稱APC)。 )( )()(nxnxne語音數(shù)據(jù)流一般分為10 20 ms相繼的幀,而預(yù)測器系數(shù)(或其等效參數(shù))則與預(yù)測誤差一起傳輸。 在接收端,用由預(yù)測器系數(shù)控制的逆濾波器再現(xiàn)語音。采用自適應(yīng)技術(shù)后,預(yù)測器P(z)要自適應(yīng)變化,以便與信號匹配。 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制ADPCM及自適應(yīng)增及自適應(yīng)增量調(diào)制量調(diào)制ADM在DM中,與量化階梯相比,當(dāng)語音波形幅度發(fā)生急劇變化時,譯碼波形不能充分跟蹤這種急劇的變化而必然產(chǎn)生失真,這稱為斜率過載斜率過載。 相反地,在沒有輸入語音的無聲狀態(tài)時,或者是信號幅度為固定值時,量化輸出
15、都將呈現(xiàn)0、1交替的序列,而譯碼后的波形只是的重復(fù)增減。這種噪聲稱為顆粒噪聲顆粒噪聲,它給人以粗糙的噪聲感覺。 為了減少斜率過載失真,必須把設(shè)計得大一些;但是過大,又增加了顆粒噪聲。因此,兼顧兩方面要求,需按均方量化誤差為最小(即使兩種失真均減至最?。﹣磉x擇。 即采用隨輸入波形自適應(yīng)地改變大小的自適應(yīng)編碼方式,使值隨信號平均斜率而變化;斜率大時,自動增大;反之則減小。這就是自適應(yīng)增量調(diào)制(Adaptive,DM,簡稱ADM)。 2. 自適應(yīng)增量調(diào)制自適應(yīng)增量調(diào)制ADM引入自適應(yīng)技術(shù)后、ADM大約可增多10dB的增益。實驗表明,取樣率為56kHz時ADM具有與取樣率為8kHz時的7bit對數(shù)PC
16、M相同的語音質(zhì)量。 差分脈沖編碼調(diào)制DPCM 降低傳輸比特率的一種方法是減少必須編碼的信息量,這要利用語音信號中大量的冗余度。在相鄰的語音樣本之間存在著明顯的相關(guān)性,因此,對相鄰樣本間的差信號(差分)進行編碼,便可謀求信息量的壓縮,因為差分信號比原語音信號的動態(tài)范圍和平均能量都小。這種編碼稱為差分脈沖編碼調(diào)制差分脈沖編碼調(diào)制(Differential PCM,簡稱DPCM)。 DPCM實質(zhì)上是預(yù)測編碼APC的一種特殊情況,是最簡單的一階線性預(yù)測,即 A(z) = 1 a1z-1 當(dāng)a1= 1時,被量化的編碼是e(n)x(n) - x(n-1) DPCM編碼的原理編碼的原理量化器編碼器預(yù)測器+-
17、)(ndq)(nd)(ns)(nI)(nsp)(nsr的代碼。是是量化后的差值信號,積累。構(gòu)可以避免量化誤差的采用這種結(jié)系統(tǒng)是一個反饋系統(tǒng),中產(chǎn)生的量化誤差。來補償過去編碼信號進行量化編碼,用實際上就是對這個差值系統(tǒng)。為差值信號或余量信號是預(yù)測誤差信號,也稱是預(yù)測語音信號,入信號。下一個信號估計值的輸預(yù)測器確定是重建語音信號,作為是輸入語音信號,)()()()()()()(ndnIndDPCMDPCMndnsnsnsqqpr解碼器預(yù)測器+)( nI)(ndq)(nsp)(nsr由于a1是固定的,顯然它不可能對所有講話者和所有語音內(nèi)容都是最佳的,如果采用高階(p 1)的固定頂測,改善效果并不明顯
18、;比較好的方法是采用高階自適應(yīng)預(yù)測。采用自適應(yīng)量化及高階自適應(yīng)預(yù)測的DPCM稱為ADPCM,它本質(zhì)上也是一種APC。 CCITT(國際電報電話咨詢委員會)在1984年提出的32kbit/s編碼器建議(G721),就是采用ADPCM作為長途傳輸中一種新的國際通用語音編碼方案。這種ADPCM可達到標(biāo)準(zhǔn)kbit/sPCM的語音傳輸質(zhì)量,并具有很好的抗誤碼性能。 子帶編碼子帶編碼SBC帶通濾波頻率搬移量化編碼帶通濾波頻率搬移量化編碼量化編碼頻率搬移帶通濾波合路112 wfs222 wfsMw1w2ws(n)發(fā)信碼子帶編碼(Sub-Band Coding,簡稱SBC)也稱為頻帶分割編碼 首先使用帶通濾波
19、器組將語音信號分割成若干個頻段也稱為子帶,然后用調(diào)制的方法對濾波后的信號即子帶信號進行頻譜平移變成低通信號(即基帶信號),以利于降低取樣率進行抽?。辉倮媚慰固厮俾蕦ζ溥M行取樣,最后再進行編碼處理。而信號的恢復(fù)按與上面完全相反的過程進行。 帶通濾波頻率搬移譯碼帶通濾波頻率搬移譯碼譯碼頻率搬移帶通濾波分路112 wfs222 wfsMw1w2wMsMwf 2收信碼sr(n)SBC解碼器解碼器SBC的優(yōu)點是對應(yīng)于人的聽覺特性,可以比較容易地考慮噪聲的抑制;即各子帶可以選用不同的量化參數(shù)以分別控制其信噪比,滿足主觀聽覺的要求。 例如,由于語音能量的不平衡,對于含有基音頻率和第一共振峰的低頻部分,對
20、語音清晰度等主觀品質(zhì)影響較大,應(yīng)分配比較多的信息、量化細些;反之,高頻部分的量化就可粗些。 這樣,可以減少量化噪聲對聽覺的妨害程度,整體上也能降低比特數(shù)。另外,量化噪聲只能出現(xiàn)在各被分割的頻帶內(nèi),對其他頻帶沒有任何影響,所以可以較容易地控制噪聲譜。 各子帶的帶寬可以是相同的也可以是不相同的,相同的稱為等帶寬子帶編碼,不同的稱為變帶寬子帶編碼。正交鏡像濾波器組正交鏡像濾波器組自適應(yīng)變換編碼自適應(yīng)變換編碼ATC第11章 語音編碼(2)-聲碼器技術(shù)及混合編碼參數(shù)編碼也稱為模型編碼。它是對語音信號建立模型,然后對模型參數(shù)或是語音的特征參數(shù)進行編碼,力圖使重建語音信號在聽覺上具有盡可能高的清晰度和可懂度
21、。v線性預(yù)測聲碼器線性預(yù)測聲碼器:應(yīng)用最成功的低速率參數(shù)語音編碼器。:應(yīng)用最成功的低速率參數(shù)語音編碼器。線性預(yù)測線性預(yù)測分析器分析器編碼器編碼器音調(diào)音調(diào)檢測器檢測器線性預(yù)測線性預(yù)測合成器合成器解碼器解碼器)(ns)(ns信道LPC聲碼器框圖11.1 線性預(yù)測聲碼器線性預(yù)測聲碼器v與利用線性預(yù)測的波形編碼不同的是它的接收端不再利用殘差,即不具體恢復(fù)與利用線性預(yù)測的波形編碼不同的是它的接收端不再利用殘差,即不具體恢復(fù)輸入語音的波形,而是直接利用預(yù)測系數(shù)等參數(shù)合成傳輸語音。輸入語音的波形,而是直接利用預(yù)測系數(shù)等參數(shù)合成傳輸語音。vLPC有作為預(yù)測器和作為模型的雙重作用。有作為預(yù)測器和作為模型的雙重作
22、用。LPC參數(shù)的變換和量化變幀率LPC聲碼器v充分利用了語音信號在時域上的冗余度,尤其是元音和擦音在發(fā)音過程中都有充分利用了語音信號在時域上的冗余度,尤其是元音和擦音在發(fā)音過程中都有緩變的區(qū)間,描述這部分區(qū)間的語音不必像一些快變語音那樣用很多比特的信緩變的區(qū)間,描述這部分區(qū)間的語音不必像一些快變語音那樣用很多比特的信息量。息量。v語音信號是非平穩(wěn)的時變信號,波形變化隨時間而不同。(清音至濁音的過渡語音信號是非平穩(wěn)的時變信號,波形變化隨時間而不同。(清音至濁音的過渡段,語音特性變化劇烈,理論上應(yīng)用較短的分析幀,要求段,語音特性變化劇烈,理論上應(yīng)用較短的分析幀,要求LPC聲碼器至少每隔聲碼器至少每
23、隔10ms就發(fā)送一幀新的就發(fā)送一幀新的LPC參數(shù);而對于濁音部分,在發(fā)音過程中有緩變的區(qū)間參數(shù);而對于濁音部分,在發(fā)音過程中有緩變的區(qū)間,語音信號的頻譜特性變化很小,分析幀就可以取長些;在語音活動停頓情況,語音信號的頻譜特性變化很小,分析幀就可以取長些;在語音活動停頓情況下更是如此。)下更是如此。)v因而可以采用變幀速率的編碼技術(shù)來降低聲碼器的平均傳輸碼率。因而可以采用變幀速率的編碼技術(shù)來降低聲碼器的平均傳輸碼率。v實現(xiàn)思路實現(xiàn)思路:幀長可保持恒定,不必將每幀:幀長可保持恒定,不必將每幀LPC參數(shù)都去編碼和傳送,合成部參數(shù)都去編碼和傳送,合成部分所需的參數(shù)可以通過重復(fù)使用其前幀參數(shù)或內(nèi)插的方法
24、獲得,可降低平均傳分所需的參數(shù)可以通過重復(fù)使用其前幀參數(shù)或內(nèi)插的方法獲得,可降低平均傳碼率。碼率。v關(guān)鍵問題關(guān)鍵問題:需要一種度量方法來確定當(dāng)前幀參數(shù)和上一幀參數(shù)之間的差異(:需要一種度量方法來確定當(dāng)前幀參數(shù)和上一幀參數(shù)之間的差異(距離)。距離)。11.2 LPC-10編碼器編碼器 11.3 語音信號的混合編碼v 20世紀(jì)世紀(jì)80年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語音質(zhì)量優(yōu)點的混年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語音質(zhì)量優(yōu)點的混合編碼得到廣泛的使用。合編碼得到廣泛的使用。v最為典型的就是最為典型的就是CELP模型。它在比特率為模型。它在比特率為4-16Kbps時已經(jīng)可以得到
25、比其他算法時已經(jīng)可以得到比其他算法更高的重建語音質(zhì)量。更高的重建語音質(zhì)量。v得到最廣泛應(yīng)用的是得到最廣泛應(yīng)用的是LPAS(基于線性預(yù)測技術(shù)的分析(基于線性預(yù)測技術(shù)的分析-合成編碼方法),通過線合成編碼方法),通過線性預(yù)測確定系統(tǒng)參數(shù),并通過閉環(huán)或分析性預(yù)測確定系統(tǒng)參數(shù),并通過閉環(huán)或分析-合成方法來確定激勵序列。合成方法來確定激勵序列。短時預(yù)測器:分析語短時預(yù)測器:分析語音信號的共振峰結(jié)構(gòu)音信號的共振峰結(jié)構(gòu)(譜包絡(luò))(譜包絡(luò))長時預(yù)測器:分析語長時預(yù)測器:分析語音信號的基音結(jié)構(gòu)音信號的基音結(jié)構(gòu)感知加權(quán)濾波器:使得量化誤差能被高能量的共振峰所掩蓋。激勵信號依據(jù)MSE選擇v3種最常見的分析種最常見的
26、分析-合成線性預(yù)測編碼算法分別是:合成線性預(yù)測編碼算法分別是:v多脈沖線性預(yù)測算法(多脈沖線性預(yù)測算法(MP-LPC)v規(guī)則脈沖激勵線性預(yù)測編碼(規(guī)則脈沖激勵線性預(yù)測編碼(RPE-LPC)v碼激勵線性預(yù)測編碼(碼激勵線性預(yù)測編碼(CELP):具有較高質(zhì)量的合成語音和良好的抗噪性):具有較高質(zhì)量的合成語音和良好的抗噪性和多次復(fù)接能力,近年很多聲碼器基于該模型。和多次復(fù)接能力,近年很多聲碼器基于該模型。傳統(tǒng)的LPC聲碼器采用的是二元激勵,它將激勵源分為清音和濁音;CELP的主要改進是采用矢量量化技術(shù)對激勵信號編碼,將事先經(jīng)過訓(xùn)練得到的一組碼矢量組成一個碼本,然后對每一幀語音信號從這組碼本中選出一個
27、在感知加權(quán)誤差最小意義上的最佳碼矢作為激勵源。用一個固定的隨機碼本中的碼矢量來逼近語音經(jīng)過短時、用一個固定的隨機碼本中的碼矢量來逼近語音經(jīng)過短時、長時預(yù)測后的余量信號。長時預(yù)測后的余量信號。用一個自適應(yīng)碼本中的碼矢量來逼近語音的長時周期性(基音)結(jié)構(gòu);)( ns碼本誤差最小化索引)(ns)(nSw)(nv)(nx)(nc)(zp)(zA)(zW)(zW)(ne_CELP編碼器示意圖 CELP模型編碼仍基于語音的短時特性,采用模型編碼仍基于語音的短時特性,采用LAPS與矢量量化。在編碼類型上與矢量量化。在編碼類型上,既采用了類似聲源模型的語音合成方法,又做了波形的最佳匹配,所以同時,既采用了類似
28、聲源模型的語音合成方法,又做了波形的最佳匹配,所以同時具有參數(shù)編碼與波形編碼的特征,故稱為混合編碼。具有參數(shù)編碼與波形編碼的特征,故稱為混合編碼。 11.4 現(xiàn)代通信中的語音信號編碼方法v當(dāng)前語音編碼的研究主要致力于如何在較低數(shù)據(jù)速率的條件下提高聲碼器的語當(dāng)前語音編碼的研究主要致力于如何在較低數(shù)據(jù)速率的條件下提高聲碼器的語音質(zhì)量使之盡量接近有線話音質(zhì)量。音質(zhì)量使之盡量接近有線話音質(zhì)量。v目前的系統(tǒng)中,基于算法的算法在語音質(zhì)量與比目前的系統(tǒng)中,基于算法的算法在語音質(zhì)量與比特速率間取得了很好的平衡,且適用于變速率編碼,抗干擾能力也令人滿意,特速率間取得了很好的平衡,且適用于變速率編碼,抗干擾能力也
29、令人滿意,從而得到了極為廣泛的應(yīng)用。從而得到了極為廣泛的應(yīng)用。7.6.1 EVRC算法基本原理算法基本原理vEVRC采用采用8kHz采樣頻率的采樣頻率的16bit線性線性PCM信號作為輸入信號,以信號作為輸入信號,以20ms(即即160個個采樣點采樣點)為一幀進行編解碼。為一幀進行編解碼。v根據(jù)輸入信號的特點來選擇編碼速率根據(jù)輸入信號的特點來選擇編碼速率變速率編碼變速率編碼平均比特速率低于平均比特速率低于8kbps。v最后編碼結(jié)果的比特速率為最后編碼結(jié)果的比特速率為8.5kbps(全速率全速率),4kbps(半速率半速率)或或0.8kbps(1/8速率速率)。)。vEVRC使用了使用了3種類型
30、的參數(shù)來表征語音模型種類型的參數(shù)來表征語音模型線性預(yù)測系數(shù)、基音參數(shù)、激線性預(yù)測系數(shù)、基音參數(shù)、激勵信號。勵信號。v每一個每一個20ms幀中,它產(chǎn)生幀中,它產(chǎn)生10個個LP系數(shù),并根據(jù)編碼速率采用不同精度系數(shù),并根據(jù)編碼速率采用不同精度的矢量量化,并采用相應(yīng)的比特數(shù)表達。的矢量量化,并采用相應(yīng)的比特數(shù)表達。v基音周期估計:采用兩步法,先在基音周期估計:采用兩步法,先在20ms內(nèi)開環(huán)搜索得到一個最佳基音周內(nèi)開環(huán)搜索得到一個最佳基音周期,然后線性內(nèi)插得到基音曲線,最后用自適應(yīng)碼本來映射長時相關(guān)性期,然后線性內(nèi)插得到基音曲線,最后用自適應(yīng)碼本來映射長時相關(guān)性。這樣可減小基音的比特速率。這樣可減小基音
31、的比特速率。v激勵信號:激勵信號:EVRC采用代數(shù)碼本。采用代數(shù)碼本。共振峰合成濾波器自適應(yīng)碼本固定碼本隨機碼矢量增益自適應(yīng)碼矢量增益基音周期固定碼本索引)(nET)(nC)(nE) (nSpgcg語音合成示意圖編碼器示意圖信號處理信號處理參數(shù)參數(shù)短時殘差短時殘差/速率編碼速率編碼/速率編碼速率編碼數(shù)碼率判別數(shù)碼率判別長時延遲估計長時延遲估計增益增益) (nS)(nsp采樣信號采樣信號)(n,10.3 , 2 , 11 ,ia濾波,降噪濾波,降噪7.6.2 EVRC算法概述算法概述編碼器示意圖預(yù)處理預(yù)處理參數(shù)參數(shù)短時殘差短時殘差/速率編碼速率編碼/速率編碼速率編碼數(shù)碼率判別數(shù)碼率判別長時延遲估計長時延遲估計增益增益) (nS)(nsp采樣信號采樣信號)(n,10.3 , 2 , 11 ,ia濾波,降噪濾波,降噪經(jīng)經(jīng)8kHz采樣,采樣,16bit量化后得到的線性量化后得到的線性PCM信號信號s(n)首先被送到預(yù)處理模塊。在這里經(jīng)過三級二階首先被送到預(yù)處理模塊。在這里經(jīng)過三級二階Butterworth濾波器(截止頻率濾波器(截止頻率120Hz的高通,抑制非人聲的造音分量,包括的高通,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 纖維支氣管鏡肺泡灌洗治療小兒重癥肺炎的臨床效果觀察
- 駕校安全協(xié)議書(2篇)
- 寧波十校2025屆高三3月聯(lián)考地理試卷(含答案)
- 暑假去旅游創(chuàng)意畫
- 2025年熱敏型CTP版項目合作計劃書
- 2025年關(guān)于小馬過河標(biāo)準(zhǔn)教案
- 腰椎結(jié)核術(shù)中護理查房
- 2025年《機電工程管理與實務(wù)》考試備考寶典:基礎(chǔ)知識點庫與典型試題
- 2025年護士執(zhí)業(yè)資格考試題庫:護理教育與培訓(xùn)護理外科護理歷年真題及解析
- 2025年小學(xué)教師資格《綜合素質(zhì)》教育資源整合試卷含答案分析
- 陽光食品APP培訓(xùn)考核題庫(含答案)食品生產(chǎn)企業(yè)端
- 高考總復(fù)習(xí)優(yōu)化設(shè)計二輪用書英語(新高考)閱讀理解 文體分類練3 說明文之科普知識類
- 研究大腦可塑性與學(xué)習(xí)記憶機制
- 外研版英語四年級下冊閱讀理解練習(xí)(含答案)
- 秦川年產(chǎn)20萬噸有機肥項目可研報告
- 2024施工隊中途退場協(xié)議書
- 手術(shù)室標(biāo)本丟失應(yīng)急預(yù)案
- 基于PLC的飲料灌裝生產(chǎn)線的控制系統(tǒng)設(shè)計畢業(yè)論文
- 2024年中央電視臺臺屬企業(yè)中廣影視衛(wèi)星公司招聘筆試參考題庫含答案解析
- 兒童皮膚疾病護理培訓(xùn)
- T-CEPPC 13-2023 電網(wǎng)區(qū)域電碳因子和電力碳排放量核算規(guī)范
評論
0/150
提交評論