第十四講語音信號(hào)處理第7章_第1頁
第十四講語音信號(hào)處理第7章_第2頁
第十四講語音信號(hào)處理第7章_第3頁
第十四講語音信號(hào)處理第7章_第4頁
第十四講語音信號(hào)處理第7章_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

7.1概述7.2語音信號(hào)壓縮編碼原理和系統(tǒng)壓縮評(píng)價(jià)7.3語音信號(hào)的波形編碼7.4語音信號(hào)的參數(shù)編碼7.5語音信號(hào)的混合編碼第七章語音編碼7.1概述語音編碼(SpeechCoding)從信息論角度看,信源編碼是要以最少的數(shù)碼表示信源所發(fā)的信號(hào),語音編碼屬于信源編碼的范疇。語音編碼通過減少傳輸碼率(或存儲(chǔ)量),來達(dá)到提高傳輸(或存儲(chǔ))效率的目的。語音編碼分為三類:*波形編碼:重建后的語音時(shí)域信號(hào)的波形與原語音信號(hào)保持一致。*參數(shù)編碼:通過建立語音信號(hào)的產(chǎn)生模型,提取其特征參數(shù)來編碼,波形上不要求與原信號(hào)匹配,又稱聲碼器技術(shù)。*混合編碼:有機(jī)結(jié)合以上兩種編碼方式,基于語音產(chǎn)生模型的假定并采用分析合并技術(shù)。三種編碼方式的比較波形編碼參數(shù)編碼混合編碼編碼信息波形模型參數(shù)綜合比特率9.6~64Kbps2.4~9.6Kbps16~24Kbps優(yōu)點(diǎn)適應(yīng)能力強(qiáng),語音質(zhì)量好有效降低了編碼比特率語音質(zhì)量明顯提高缺點(diǎn)隨著量化粗糙語音質(zhì)量下降合成語音質(zhì)量低,處理復(fù)雜度高編碼速率明顯上升典型代表自適應(yīng)差分編碼調(diào)制(ADPCM)LPC-10、LPC-10E多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPLPC)規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼(RPE-LPC)7.2語音信號(hào)壓縮編碼原理和系統(tǒng)壓縮評(píng)價(jià)

語音信號(hào)中存在著冗余度(包括時(shí)域與頻域),人的聽覺感知機(jī)理也有很多可以利用的特點(diǎn)。語音信號(hào)壓縮編碼之所以可行,正是因?yàn)檫@兩種情況的存在。

語音編碼依據(jù)之一:語音信號(hào)冗余度基本時(shí)域冗余:語音信號(hào)幅度非均勻分布性語音信號(hào)樣本間的強(qiáng)相關(guān)性濁音語音段具有的準(zhǔn)周期性聲道形狀及其變化的緩慢性靜止系數(shù)(即語音間隙性)

基本頻域冗余:從長(zhǎng)時(shí)間的功率譜密度來看,語音信號(hào)具有強(qiáng)烈的非平坦性,存在著固定的冗余度。而且高頻能量通常較低,恰好對(duì)應(yīng)于時(shí)域上的相鄰樣本相關(guān)性。從短時(shí)功率譜密度來看,語音信號(hào)在不同頻率交替出現(xiàn)峰值(共振峰)與谷值。整個(gè)功率譜的細(xì)節(jié)基于基音頻率形成高次諧波結(jié)構(gòu)。

語音編碼依據(jù)之二:人的聽覺特點(diǎn)人類聽覺系統(tǒng)存在著掩蔽效應(yīng),即高聲級(jí)單音會(huì)明顯掩蔽臨近頻率聲音。對(duì)于不同頻段的聲音,人耳的敏感程度不盡相同。人類對(duì)于語音信號(hào)的周期性(即音調(diào))極為敏感,但對(duì)信號(hào)的相位卻充耳不聞。語音編碼中的幾項(xiàng)關(guān)鍵技術(shù)線性預(yù)測(cè)

線性預(yù)測(cè)傳送整個(gè)反應(yīng)過程變化的參數(shù),其出發(fā)點(diǎn)在于跟蹤波形的產(chǎn)生過程而非波形本身?;谌珮O點(diǎn)模型假設(shè),使得語音信號(hào)編碼的比特率得到有效的降低。語音信號(hào)中存在的兩點(diǎn)相關(guān)性樣點(diǎn)間的短時(shí)相關(guān)性相鄰基音周期之間的長(zhǎng)時(shí)相關(guān)性

激勵(lì)發(fā)生器1

————P(z)1

————A(z)合成語音語音信號(hào)合成模型圖示其中信號(hào)源為預(yù)測(cè)余量信號(hào),1/P(z)為長(zhǎng)時(shí)預(yù)測(cè)濾波器,1/A(z)為短時(shí)預(yù)測(cè)濾波器。語音信號(hào)的短時(shí)相關(guān)性可用一個(gè)全極點(diǎn)模型來描述,其傳輸函數(shù)H(z)為:短時(shí)預(yù)測(cè)系數(shù)濾波器階數(shù)而濾波器是語音信號(hào)長(zhǎng)時(shí)相關(guān)性的模型,其一般形式為:延時(shí)參數(shù)(基音周期)長(zhǎng)時(shí)預(yù)測(cè)系數(shù)合成分析合成分析原理

合成分析在編碼器中加入綜合器,并將其與分析器結(jié)合從而產(chǎn)生與譯碼器端相同的語音,而后根據(jù)誤差原理調(diào)整使得誤差最小化。合成分析背景

16Kbps以下的高質(zhì)量語音編碼在當(dāng)今得到極大關(guān)注,使得傳統(tǒng)的量化方法對(duì)誤差最小化已無能為力。因此,合成分析的方法被引入。感覺加權(quán)濾波器產(chǎn)生背景:理論與現(xiàn)實(shí)的出入

對(duì)于低碼率(4~16Kbps)的語音編碼,理論上的最小均方誤差(MMSE)在實(shí)際應(yīng)用時(shí)卻因?yàn)槿说穆犛X特點(diǎn)而障礙重重。在這種背景下,根據(jù)人耳的掩蔽效應(yīng)設(shè)計(jì)的感覺加權(quán)濾波器得到了廣泛的應(yīng)用。在實(shí)際應(yīng)用中,共振峰處的噪聲相對(duì)于能量較低處的頻段更加不易被察覺,故高能量段處的誤差要求不高。因此,感覺加權(quán)濾波器被提出,用以衡量語音間的誤差。

此時(shí),只需在高頻段處較大,低頻段處較小,就可以升高不敏感的高頻段的誤差,同時(shí)降低較敏感的低頻段的誤差,從而達(dá)到目的。抽樣頻率重建語音傅立葉變換原始語音傅立葉變換誤差表示其傳遞函數(shù)為:

的作用就是使實(shí)際信號(hào)誤差的譜呈現(xiàn)與語音信號(hào)類似的包絡(luò)形狀,從而在掩蔽效應(yīng)的作用下在主觀聽覺上產(chǎn)生較好的效果。加權(quán)因子預(yù)測(cè)系數(shù)語音壓縮系統(tǒng)的性能評(píng)判指標(biāo)較為重要的性能評(píng)價(jià)準(zhǔn)則編碼速率(比特率),決定了編碼器工作時(shí)占用的信道帶寬,要求盡可能降低。編碼器的頑健性,要求良好。編碼器的時(shí)延,要求最小化。誤碼容限,要求保持較高值。算法復(fù)雜度(包括運(yùn)算復(fù)雜度與內(nèi)存要求),影響硬件成本,盡可能降低。算法可擴(kuò)展性,越高越好。適用于低比特率語音編碼質(zhì)量的評(píng)價(jià)

計(jì)算較簡(jiǎn)單,但沒有考慮實(shí)際情況,故適用于高比特率語音編碼質(zhì)量的評(píng)價(jià)7.3語音信號(hào)的波形編碼波形編碼波形編碼是語音編碼系統(tǒng)在早期所廣泛采用的方法,它把語音信號(hào)當(dāng)成普通的波形信號(hào)來處理從而保持原波形形狀。波形編碼適應(yīng)能力強(qiáng),合成語音質(zhì)量好,但比特率過高,編碼的效率也不盡如人意。幾種典型的波形編碼:脈沖編碼調(diào)制(PCM)自適應(yīng)預(yù)測(cè)編碼自適應(yīng)增量調(diào)制(ADM)自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)子帶編碼(SBC)脈沖編碼調(diào)制形式一:均勻PCM

最簡(jiǎn)單最原始的波形編碼方式,沒有運(yùn)用壓縮技術(shù),產(chǎn)生的比特率也極高,故在當(dāng)今運(yùn)用極少。形式二:非均勻PCM將信號(hào)進(jìn)行非線性變換后再均勻量化,變換后信號(hào)具有均勻概率密度分布。編碼時(shí)常采用對(duì)數(shù)變換壓縮(譯碼時(shí)指數(shù)擴(kuò)展)。非線性壓縮均勻量化編碼解碼非線性擴(kuò)張非線性壓縮擴(kuò)張的非均勻量化器A律壓縮擴(kuò)張技術(shù)(中國(guó)標(biāo)準(zhǔn))

μ律壓縮擴(kuò)張技術(shù)(北美及日本標(biāo)準(zhǔn))

形式三:自適應(yīng)PCM

無論是均勻或是非均勻PCM,量化間隔總是隨著量化器的確定而固定。而自適應(yīng)PCM引入的自適應(yīng)幅值變化概念使得量化間隔Δ可以匹配于輸入信號(hào)方差,或是量化器增益G可以隨著幅值而變化,從而使信號(hào)能量在量化前恒定。Q【·】編碼器解碼器匹配自適應(yīng)編碼器Q【·】X解碼器+匹配自適應(yīng)兩種自適應(yīng)方法的原理

按照自適應(yīng)參數(shù)的來源劃分Q【·】編碼器解碼器自適應(yīng)系統(tǒng)Q【·】編碼器自適應(yīng)系統(tǒng)解碼器自適應(yīng)系統(tǒng)反饋?zhàn)赃m應(yīng)前饋?zhàn)赃m應(yīng)前饋?zhàn)赃m應(yīng)是計(jì)算信號(hào)有效值并決定最合適的量化間隔,用此間隔控制量化器,并將量化間隔信息發(fā)送給接收端。反饋?zhàn)赃m應(yīng)是由編碼器輸出來決定量化間隔,而在接收端由量化傳輸來的幅度信息自動(dòng)生成量化間隔。無須將量化間隔傳送到信道中去,但對(duì)誤差的靈敏度要求較高。自適應(yīng)預(yù)測(cè)編碼LPC計(jì)算-預(yù)測(cè)器系數(shù)發(fā)端收端自適應(yīng)預(yù)測(cè)編碼器(APC)利用線性預(yù)測(cè)來改進(jìn)編碼中的量化器性能根據(jù)信號(hào)量化噪聲比的定義:信號(hào)平均能量預(yù)測(cè)誤差平均能量量化噪聲平均能量

由此可知引入線性預(yù)測(cè)后,SNR可得到改善。預(yù)測(cè)增益自適應(yīng)增量調(diào)制(ADM)

增量調(diào)制的基本方案:

增量調(diào)制方式將下一個(gè)語音信號(hào)與當(dāng)前語音信號(hào)比較,如果高于當(dāng)前值則系統(tǒng)編碼1,否則系統(tǒng)編碼0.

自適應(yīng)增量調(diào)制的工作方式:自適應(yīng)增量調(diào)制隨輸入波形自適應(yīng)的改變量化階梯的大小,在信號(hào)平均斜率大時(shí)自動(dòng)增大量化階梯,反之減小。

自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)

差分脈沖編碼調(diào)制(DPCM):

不同于DM的一位編碼,DPCM多位量化對(duì)兩個(gè)采樣點(diǎn)之間的差分信號(hào)利用多位量化進(jìn)行編碼,使信息量得到壓縮的同時(shí)降低了信道負(fù)載。

+量化+預(yù)測(cè)發(fā)送端+預(yù)測(cè)接收端+

但采用固定的高階預(yù)測(cè),改善效果并不明顯,于是,高階自適應(yīng)預(yù)測(cè)作為相應(yīng)的解決方式被提出,自適應(yīng)預(yù)測(cè)器隨著語音特征變化不斷更新預(yù)測(cè)系數(shù),從而獲得更高的預(yù)測(cè)增益。-量化預(yù)測(cè)系數(shù)自適應(yīng)+預(yù)測(cè)后向自適應(yīng)預(yù)測(cè)編碼結(jié)構(gòu)框圖:子帶編碼(SBC)子帶編碼原理:

子帶編碼屬于頻域編碼,它首先將語音信號(hào)通過帶通濾波器分割為若干頻帶(子帶),而后對(duì)子帶信號(hào)進(jìn)行頻譜平移變?yōu)榛鶐盘?hào),再利用奈奎斯特速率抽樣,最后進(jìn)行編碼處理。

子帶編碼優(yōu)點(diǎn):分帶后可去除信號(hào)相關(guān)性,獲得與時(shí)域一樣的效果。不同子帶擁有不同比特?cái)?shù),可獲得更佳主觀聽音質(zhì)量。各子帶間量化噪音相互獨(dú)立互不干擾。

自適應(yīng)變換編碼(ATC)

編碼原理:

自適應(yīng)變換編碼利用正交變換將信號(hào)由時(shí)域變換到另外一個(gè)域,使變換域系數(shù)密集化,從而使信號(hào)相鄰樣本間冗余度得到降低。

正交變換DCT的優(yōu)點(diǎn):頻域變換明顯,較易控制量化噪聲頻率范圍。兼顧性能與計(jì)算量,不需要傳輸特征矢量。變換效率高于DFT,且在頻域區(qū)的畸變更小。

7.4語音信號(hào)的參數(shù)編碼參數(shù)編碼針對(duì)語音信號(hào)的特征參數(shù)來編碼,只適用于語音信號(hào)。實(shí)際應(yīng)用中一般采用的實(shí)現(xiàn)設(shè)備是線性預(yù)測(cè)聲碼器。線性預(yù)測(cè)分析器編碼器音調(diào)檢測(cè)器線性預(yù)測(cè)合成器解碼器信道LPC聲碼器框圖LPC參數(shù)的變換與量化①反射系數(shù):

對(duì)反射系數(shù)的值在【-1,1】區(qū)間一般進(jìn)行非線性量化,另外比特?cái)?shù)分配應(yīng)遞減。②對(duì)數(shù)面積比:針對(duì)對(duì)數(shù)面積比的方式是最為有效的編碼方式,很適合數(shù)字編碼與傳輸:其中Ai為面積函數(shù),通過上式可知幅度均勻分布,可以采用均勻量化。

變幀率LPC聲碼器

為降低LPC聲碼器的速率,應(yīng)用了變幀速率編碼(VFR)技術(shù)的變幀率LPC聲碼器應(yīng)運(yùn)產(chǎn)生。通過付出編解碼復(fù)雜化與時(shí)延的代價(jià),變幀率LPC聲碼器可明顯降低傳輸數(shù)碼率同時(shí)保持音質(zhì)。LPC-10編碼器

LPC-10利用簡(jiǎn)單的二元激勵(lì)取代余量信號(hào),在2.4kbps的速率上得到了清晰的合成語音,在當(dāng)代長(zhǎng)期被作為標(biāo)準(zhǔn)算法使用。但因?yàn)榧?lì)信號(hào)選取的影響,抗噪能力與自然度仍不盡如人意。7.5語音信號(hào)的混合編碼20世紀(jì)80年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語音質(zhì)量?jī)?yōu)點(diǎn)的混合編碼得到廣泛的使用。它在假定語音產(chǎn)生模型的同時(shí)將模型參數(shù)編碼,吸收了兩者的優(yōu)點(diǎn)。合成編碼方法(LPAS)是目前最廣泛研究的語音編碼算法,它通過線性預(yù)測(cè)確定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論