




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多帶激勵(lì)聲碼器第1頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型
11.1概述11.4多帶激勵(lì)語(yǔ)音合成11.3多帶激勵(lì)語(yǔ)音分析第2頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.1概述CELP、MPLPC等:全極點(diǎn)模型、LPC
分析,合成-分析法,
聽(tīng)覺(jué)加權(quán)方均誤差準(zhǔn)則,閉環(huán)確定激勵(lì)參數(shù)?!暨@類混合編碼,在4.8~16
kbit/s碼率內(nèi)獲得巨大成功?!絷P(guān)鍵技術(shù):是保持了合成語(yǔ)音與原始語(yǔ)音波形的相似性?!粼俳禂?shù)碼率時(shí),合成語(yǔ)音質(zhì)量迅速下降。LPC
聲碼器:(清/濁音)二元激勵(lì)模型,分析-合成法,
LPC
分析,清/濁音判別,估計(jì)基音周期?!鬝NR較高時(shí),2.4
kbit/s
及以下碼率,語(yǔ)音可懂度相當(dāng)高。以上編碼器,當(dāng)噪聲較大時(shí),因無(wú)法準(zhǔn)確提取參數(shù),性能嚴(yán)重惡化;其它聲碼器,如通道聲碼器、同態(tài)聲碼器等也有同樣弱點(diǎn)。第11章多帶激勵(lì)聲碼器11.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院-3-趙曉群
教授第3頁(yè),共51頁(yè),2023年,2月20日,星期四產(chǎn)生原因:二元激勵(lì)模型過(guò)于簡(jiǎn)化,不符合實(shí)際語(yǔ)音的特性?!粼S多語(yǔ)音段,同時(shí)含周期性、非周期性分量,
過(guò)渡音段、有噪濁音段更是如此?!舢?dāng)用二元譜來(lái)擬合時(shí),合成語(yǔ)音缺乏自然度。1988年MIT
林肯實(shí)驗(yàn)室提出多帶激勵(lì)(MBE)語(yǔ)音編碼,◆突破二元激勵(lì)的局限性,對(duì)多個(gè)頻帶逐個(gè)進(jìn)行V/U
判決,故稱為多帶激勵(lì)模型?!舨捎煤铣?分析法,在2.4
~4.8
kbit/s
碼率時(shí)性能優(yōu)良?!舾倪M(jìn)方案被國(guó)際海事衛(wèi)星組織采用(INMARSAT-M
Voice
Codec),碼率為6.4
kbit/s。本章主要內(nèi)容:MBE
原理,參數(shù)提取方法,合成語(yǔ)音的方法。重點(diǎn)介紹INMARSAT-M
Voice
Codec
標(biāo)準(zhǔn)的算法。
第11章多帶激勵(lì)聲碼器11.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院-4-趙曉群
教授第4頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型窗選語(yǔ)音信號(hào)為(窗長(zhǎng)20~40ms):◆源-系統(tǒng)語(yǔ)音模型理論,語(yǔ)音段是線性系統(tǒng)(聲道)對(duì)某種激勵(lì)信號(hào)的響應(yīng)。設(shè)系統(tǒng)的單位脈沖響應(yīng)為,則的Fourier
變換可表示為:式中Hw(ω),
Ew(ω)——hw(n),
ew(n)
的Fourier
變換?!糁亟ㄕZ(yǔ)音信號(hào)譜
Xwr(ω)
可表示為:式中Hwr(ω)——
合成濾波器的系統(tǒng)函數(shù);
Ewr(ω)——合成濾波器的激勵(lì)信號(hào)的Fourier
變換。兩者皆從原始語(yǔ)音信號(hào)中分析提取。第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型同濟(jì)大學(xué)電子與信息工程學(xué)院-5-趙曉群
教授清音波形第5頁(yè),共51頁(yè),2023年,2月20日,星期四Hwr(ω)
用全極點(diǎn)函數(shù)來(lái)逼近,相應(yīng)于Xwr(ω)
的譜包絡(luò)。MBE按基音各諧波,將語(yǔ)音分成若干個(gè)子頻帶(如以3個(gè)相鄰的諧波頻帶為一組進(jìn)行分帶),分別對(duì)各子帶進(jìn)行V/U
判決,激勵(lì)信號(hào)為各子帶的和?!羟逡魩В河冒自肼曌V作為激勵(lì)信號(hào)譜;◆濁音帶:用周期性的Pw(ω)
作為激勵(lì)信號(hào)譜。激勵(lì)信號(hào)是周期性信號(hào)與非周期性噪聲按不同頻帶混合而成。系統(tǒng)函數(shù)
Hwr(ω)
的作用是:調(diào)整各子帶分量的相對(duì)幅度和相位,并將Ew(ω)
映射成Xw(ω)。該模型較符合實(shí)際語(yǔ)音的特性,使合成語(yǔ)音譜同原語(yǔ)音譜在頻譜精細(xì)結(jié)構(gòu)上擬合得更好。若還利用譜的相位信息,則能夠合成出高質(zhì)量的語(yǔ)音。第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型同濟(jì)大學(xué)電子與信息工程學(xué)院-6-趙曉群
教授第6頁(yè),共51頁(yè),2023年,2月20日,星期四圖11.1:典型的濁音、清音和混合語(yǔ)音段的分析-合成情況?!鬗BE編碼過(guò)程涉及三種參數(shù)的提取,①
基音頻率;②每個(gè)子帶的譜包絡(luò)的幅度和相位參數(shù);③每個(gè)子帶的V/U
判決。圖11.2:MBE語(yǔ)音編/解碼器的簡(jiǎn)化原理圖。第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型同濟(jì)大學(xué)電子與信息工程學(xué)院-7-趙曉群
教授圖11.2MBE聲碼器語(yǔ)音編/解碼器原理圖清語(yǔ)音合成濁語(yǔ)音合成基音周期估計(jì)諧波產(chǎn)生頻帶劃分幅度估計(jì)清/濁判決相位計(jì)算FFT傳輸輸出Hamming窗第7頁(yè),共51頁(yè),2023年,2月20日,星期四同濟(jì)大學(xué)電子與信息工程學(xué)院-8-趙曉群
教授(a)濁語(yǔ)音段(b)清語(yǔ)音段(c)混合語(yǔ)音段圖11.1語(yǔ)音MBE的分析-合成波形(10kHz采樣,256點(diǎn)Hamming窗)
濁音波形清音波形混合音波形加窗語(yǔ)音譜加窗語(yǔ)音譜加窗語(yǔ)音譜譜包絡(luò)譜包絡(luò)譜包絡(luò)U/V判決結(jié)果U/V判決結(jié)果U/V判決結(jié)果周期譜P(ejω)周期譜P(ejω)周期譜P(ejω)白噪聲譜白噪聲譜白噪聲譜激勵(lì)信號(hào)譜激勵(lì)信號(hào)譜激勵(lì)信號(hào)譜合成語(yǔ)音譜合成語(yǔ)音譜合成語(yǔ)音譜第8頁(yè),共51頁(yè),2023年,2月20日,星期四同濟(jì)大學(xué)電子與信息工程學(xué)院-9-趙曉群
教授第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析MBE模型參數(shù)的最優(yōu)提取,計(jì)算量大,工程難以實(shí)時(shí)實(shí)現(xiàn)。常用次優(yōu)算法,分兩步完成參數(shù)的提?。孩俅_定基音頻率和每個(gè)分帶的譜包絡(luò)參數(shù),用AbS法提?。虎趯?duì)每個(gè)分帶進(jìn)行V/U判決。有兩種參數(shù)提取方案:
①使下列加權(quán)積分值(加權(quán)方均譜誤差)為最?。?/p>
②應(yīng)使下列加權(quán)積分值達(dá)到最小:
式中G(ω)
——頻率加權(quán)函數(shù);
Xw(ω),Xwr(ω)
——原始語(yǔ)音譜和合成語(yǔ)音譜。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析差別:方案①利用語(yǔ)音譜的模值;方案②利用模值和相位,性能優(yōu)于①,但計(jì)算復(fù)雜,碼率有所增加。
第9頁(yè),共51頁(yè),2023年,2月20日,星期四INMARSAT-M
Voice
Codec
采用方案①。本節(jié)主要內(nèi)容:
11.3.1頻域分析
11.3.2時(shí)域分析
11.3.3
INMARSAT-M改進(jìn)MBE模型分析算法第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-10-趙曉群
教授第10頁(yè),共51頁(yè),2023年,2月20日,星期四
11.3.1頻域分析
1.基音估計(jì)及各次諧波幅度的計(jì)算設(shè)基音周期為T0(基音角頻率
ω0=2π/T0
)。依次假設(shè)
ω0為各種可能出現(xiàn)的值?!魧?duì)于可能的基音角頻率值ω0,將ω=-π~π
分為若干頻帶,
分界點(diǎn)為:am=(m-0.5)ω0,bm=(m+0.5)ω0,m=0,±1,…,±(M+1)◆設(shè)每個(gè)分帶
[am,bm]中Hwr(ω)
保持不變,Hwr(ω)=
Am,
則有:式中ε——總的加權(quán)方均譜誤差;
εm——
第m子帶加權(quán)方均譜誤差,或第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-11-趙曉群
教授僅考慮幅度譜時(shí)考慮幅度、相位譜時(shí)第11頁(yè),共51頁(yè),2023年,2月20日,星期四令或,由上兩式可分別解得一組最佳和:或◆若第
m
次諧波的能量顯周期性,則其能量集中在該諧波附近;
選周期性
Pw(ω)的作為激勵(lì)信號(hào)
Ewr(ω),
則合成語(yǔ)音譜Xwr(ω)與窗選語(yǔ)音譜
Xw(ω)
在第
m次諧波帶內(nèi)將擬合得很好(εm最?。??!羧舻?/p>
m
次諧波的能量顯非周期性,
則
Xw(ω)在該頻帶內(nèi)沒(méi)有特征性的形狀。仍用Pw(ω)作為激勵(lì),εm值將較大。此時(shí),應(yīng)選噪聲為激勵(lì)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-12-趙曉群
教授僅考慮幅度譜時(shí)考慮幅度、相位譜時(shí)第12頁(yè),共51頁(yè),2023年,2月20日,星期四分析周期性與非周期性信號(hào)激勵(lì)時(shí)的最佳解?!魸嵋纛l帶時(shí),選Pw(ω)為激勵(lì)信號(hào),由上頁(yè)兩式得:◆清音頻帶時(shí),激勵(lì)采用理想白噪聲(幅度譜
=1),則有:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-13-趙曉群
教授僅考慮幅度譜時(shí),最佳譜幅度考慮幅度、相位譜時(shí),最佳譜包絡(luò)。相位信息無(wú)關(guān)緊要,在此無(wú)需計(jì)算
Am。第13頁(yè),共51頁(yè),2023年,2月20日,星期四對(duì)于假定基音頻率
ω0
的每一個(gè)諧波,計(jì)算
︱Am
︳或Am,
再求出各次諧波內(nèi)的最小誤差。則整個(gè)頻帶的總的最小誤差:◆每假設(shè)一個(gè)基音頻率
ω0,計(jì)算出對(duì)應(yīng)的ε0。顯然,正確的基音周期或其倍數(shù)上,ε0取極小值?!羲阉?/p>
ε0的全局最小值對(duì)應(yīng)的T0=2π/
ω0值可能是正確的基音周期的某個(gè)整數(shù)倍值?!粢蚨?,還需要對(duì)T0/2、T0/3、…處的ε0進(jìn)行校核,以判斷正確的基音周期,從而確定最佳基音周期?!糇詈蟠_定最佳基音周期時(shí),還需要考慮前后幀的情況。一般相鄰幀的T0值變化不會(huì)太大。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-14-趙曉群
教授第14頁(yè),共51頁(yè),2023年,2月20日,星期四2.諧波頻帶內(nèi)V/U
判決第m子帶的歸一化誤差能量為:◆采用激勵(lì)信號(hào)Pw(ω)(譜幅度︱Am
︳或譜包絡(luò)
Am、周期
T0
)是第m諧波子帶的譜擬合誤差。◆令頻率加權(quán)函數(shù)
G(ω)=1,上式化簡(jiǎn)為:◆子帶判決:
◆可以將相鄰的幾個(gè)諧波頻帶合并成一個(gè)子頻帶,用上述同樣的方法提取︱Am
︳或Am,并進(jìn)行
V/U
判決。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-15-趙曉群
教授第15頁(yè),共51頁(yè),2023年,2月20日,星期四
11.3.2時(shí)域分析W(ω):窗函數(shù)
w(n)的Fourier變換,
ω0:歸一化基音角頻率(基音周期
T0,ω0=2π/T0)◆假設(shè)在-π~π
頻率范圍內(nèi)共2M個(gè)諧波,
Pw(ω)為激勵(lì)時(shí),有:
式中,
第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-16-趙曉群
教授第16頁(yè),共51頁(yè),2023年,2月20日,星期四◆令頻率加權(quán)函數(shù)
G(ω)=1,由前面給出的式子得,全帶擬合誤差:
式中,◆由上式可求出使ε取極小值的矢量
a
為:再代入上式,結(jié)合上頁(yè)式,得:式中,◆因此,對(duì)于某個(gè)選定的T
值時(shí),計(jì)算min
ε
等價(jià)于
max
ψ。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-17-趙曉群
教授
注:上標(biāo)T為轉(zhuǎn)置
H為共軛轉(zhuǎn)置第17頁(yè),共51頁(yè),2023年,2月20日,星期四為了方便,選擇窗函數(shù)
w(n),使其滿足◆頻域內(nèi)正交條件:
,I
是單位矩陣;◆相當(dāng)于時(shí)域內(nèi)滿足條件:◆還要求其Fourier
變換的泄露足夠小,
主瓣寬度足夠窄(此寬度不應(yīng)大于基音頻率值)
。滿足上述條件且w(n)為偶函數(shù)時(shí),上頁(yè)計(jì)算ψ
式可改寫為:◆注意到ω0M=π
近似成立,且ω0T=2π,則上式可簡(jiǎn)化為:式中
T
——假定的基音周期;
——
w2(n)x(n)的自相關(guān)函數(shù),第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-18-趙曉群
教授第18頁(yè),共51頁(yè),2023年,2月20日,星期四由Parseval定理,總擬合誤差寫成:為了去除由于T
值增加造成的ε下降,需要對(duì)上式修正,
以保證真正的基音周期對(duì)應(yīng)的是全局最小值?!舨捎脽o(wú)偏擬合誤差公式如下:◆采用此修正后,歸一化總誤差能量應(yīng)寫成下列形式:
第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-19-趙曉群
教授第19頁(yè),共51頁(yè),2023年,2月20日,星期四設(shè)窗函數(shù)
w(n)長(zhǎng)為2N+1,以原點(diǎn)對(duì)稱。
同時(shí)假設(shè)在窗長(zhǎng)范圍內(nèi)有L
個(gè)假設(shè)基音周期,即:◆則上頁(yè)式中,ξuB的求和上下限應(yīng)作相應(yīng)的改動(dòng),即得到:
為粗搜索時(shí)確定初始基音周期
TI
所用的擬合誤差時(shí)域表達(dá)?!魹樘岣呔?,T
值也可取非整數(shù),如20.5,
21,
21.5…。
非整數(shù)點(diǎn)上的相關(guān)函數(shù)可插值計(jì)算:實(shí)驗(yàn)表明,10kHz
采樣,基音周期的精確可達(dá)0.04
樣點(diǎn)。數(shù)碼率較低時(shí)(4.8
kbit/s以下),精確到1/4
~
1/8
樣點(diǎn)也就滿足要求了,這樣運(yùn)算量可以減少很多。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-20-趙曉群
教授第20頁(yè),共51頁(yè),2023年,2月20日,星期四
11.3.3
INMARSAT-M改進(jìn)MBE模型分析算法
圖11.3:INMARSAT-M
改進(jìn)MBE
模型算法框圖?!粽Z(yǔ)音信號(hào):
8
kHz
采樣,線性
PCM
編碼,語(yǔ)音樣值的最大值定標(biāo)范圍:[214-1,215-1]
最小值定標(biāo)范圍:[-215,-214]◆需求出改進(jìn)MBE
模型參數(shù):基音角頻率、V/U判決,
子帶譜包絡(luò)參數(shù)(僅考慮幅度譜)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-21-趙曉群
教授圖11.3MBE語(yǔ)音分析算法方框圖高通濾波器低通濾波器基音周期初始估計(jì)清/濁判決基音周期精確估計(jì)頻譜估計(jì)語(yǔ)音信號(hào)第21頁(yè),共51頁(yè),2023年,2月20日,星期四1.高通濾波◆語(yǔ)音經(jīng)數(shù)字高通濾波器,濾除信號(hào)中的直流分量。
高通濾波器的截止頻率約10
Hz,傳遞函數(shù)為:2.低通濾波◆低通濾波器輸出的信號(hào)按下式計(jì)算:
低通濾波器是21
階FIR
數(shù)字濾波器,其系數(shù)值列于表11.1。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-22-趙曉群
教授表11.1
FIR
低通濾波器系數(shù)jhL(j)jhL(j)jhL(j)00.394201±4-0.063723±8-0.007430±10.297354±5-0.004565±9-0.013775±20.093671±60.030659±10-0.002174±3-0.051602±70.016900第22頁(yè),共51頁(yè),2023年,2月20日,星期四同濟(jì)大學(xué)電子與信息工程學(xué)院-23-趙曉群
教授圖11.4相鄰語(yǔ)音幀與幀之間的關(guān)系過(guò)去幀當(dāng)前幀將來(lái)幀3.
基音估計(jì)基音估計(jì)算法:應(yīng)保持相鄰語(yǔ)音幀基音周期的某種連續(xù)性?;舾櫵惴ǎ涸诖_定當(dāng)前幀的基音周期時(shí)要考慮相鄰的過(guò)去幀和將來(lái)幀的影響。圖11.4:當(dāng)前幀和前后幀之間的關(guān)系。
◆幀長(zhǎng)為
20
ms(160
個(gè)樣點(diǎn))?!艋艄烙?jì)算法分:初始估計(jì)、精細(xì)估計(jì)兩步進(jìn)行。初始估計(jì)得到初始基音周期:TI,TI∈D={21,21.5,…,114},
精度:
1/2
采樣周期;再由精細(xì)估計(jì)得出歸最終基音周期,精度:1/4
采樣周期。兩步法可降低計(jì)算復(fù)雜度和提高魯棒性。
第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析-40-200204060msT-2T-1
T0T1T2基音周期:誤差函數(shù):E-2(T)E-1(T)E0(T)E1(T)E2(T)第23頁(yè),共51頁(yè),2023年,2月20日,星期四算法的重要特點(diǎn):初始估計(jì)和精細(xì)估計(jì)使用不同長(zhǎng)度的窗函數(shù)?!舫跏脊烙?jì)窗
wI(n)
長(zhǎng)為281
個(gè)樣點(diǎn);◆精細(xì)估計(jì)窗wR(n)長(zhǎng)為221
個(gè)樣點(diǎn);◆皆是對(duì)稱三角形窗,兩窗中點(diǎn)對(duì)齊。相鄰語(yǔ)音幀之間的重疊量是窗長(zhǎng)的函數(shù),
重疊量
=窗長(zhǎng)
-幀移動(dòng)量(160
個(gè)樣點(diǎn))?!魒R(n)時(shí),重疊量
61
個(gè)樣點(diǎn);wR(n)時(shí),121個(gè)樣點(diǎn)。
(1)
基音的初始估計(jì)(步驟見(jiàn)圖11.5)◆對(duì)每一個(gè)可能的基音周期
T∈D,計(jì)算誤差函數(shù)值
E(T)。然后通過(guò)前向與后向基音
跟綜算法,比較求出的值,最終選擇最佳的候選者
作為TI。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-24-趙曉群
教授圖11.5初始基音周期估計(jì)后向基音跟蹤前向基音跟蹤比較基音估計(jì)值計(jì)算誤差函數(shù)第24頁(yè),共51頁(yè),2023年,2月20日,星期四
①
計(jì)算誤差函數(shù)◆根據(jù)歸一化總誤差能量定義,誤差函數(shù)
E(T)定義為:式中
wI(n)
——?dú)w一化三角形窗函數(shù),滿足
?!舢?dāng)t
為整數(shù)值時(shí),自相關(guān)函數(shù)
φ(t)定義為:當(dāng)t
為非整數(shù)值時(shí),用線性內(nèi)插公式計(jì)算
φ(t)?!艋糁芷诘某跏脊烙?jì)
TI為:◆采用基音跟蹤算法,保證基音周期
TI的連續(xù)性。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-25-趙曉群
教授第25頁(yè),共51頁(yè),2023年,2月20日,星期四
②
后向基音跟蹤◆E-1(T-1)、E-2(T-2)——過(guò)去兩幀對(duì)應(yīng)的誤差函數(shù)值;◆
因基音周期的連續(xù)性,當(dāng)前幀的基音周期
T
應(yīng)在T-1附近,應(yīng)滿足約束條件:◆在上式范圍內(nèi)逐個(gè)選取
T,并計(jì)算相應(yīng)的E(T)
,
使E(T)最小的T就是后向估計(jì)TB,計(jì)算后向累計(jì)誤差CE(TB):
CE(TB)是后向基音估計(jì)的置信度測(cè)度。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-26-趙曉群
教授第26頁(yè),共51頁(yè),2023年,2月20日,星期四
③前向基音跟蹤◆E1(T1)、E2(T2)——將來(lái)兩幀對(duì)應(yīng)的誤差函數(shù)值;◆將來(lái)兩幀的基音周期尚未確定,前向基音跟蹤算法必須首先設(shè)法確定這些基音周期值。◆在集合D內(nèi)選定一個(gè)T0,按下面的約束條件選取T1、T2:
使E1(T1)+E2(T2)最小的T1、T2表示為,并按下式計(jì)算前向累計(jì)誤差函數(shù)
CEF(T0)
為:◆重復(fù)上述過(guò)程,在規(guī)定的范圍內(nèi)逐個(gè)選定
T0,
計(jì)算相應(yīng)的CEF(T0)
,使其最小的T0定義為。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-27-趙曉群
教授第27頁(yè),共51頁(yè),2023年,2月20日,星期四為防止倍基音周期,考慮取的可能性?!粢?/p>
,選擇一個(gè)與其最接近的值代替。
再檢查是否滿足下列三個(gè)條件之一、且為最小值的,◆若有,則前向基音估計(jì);否則。完成前、后向基音跟蹤,并求得估計(jì)值后,
按下列判決規(guī)則確定初始基音估計(jì)
TI:
If
CEb(TB)<0.48
then
TI
=TB
else
if
CEb(TB)≤CEF(TF)
then
TI
=TB
else
TI
=TF
◆最終的基音估計(jì)的精度提高到
1/4
采樣周期。
第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-28-趙曉群
教授第28頁(yè),共51頁(yè),2023年,2月20日,星期四
(2)
基音的精細(xì)估計(jì)圖11.6:基音精細(xì)估計(jì)的方框圖?!艟?xì)估計(jì)窗
wR(n):長(zhǎng)
221
個(gè)樣點(diǎn),歸一化三角形窗?!粲苫舫跏脊烙?jì)
TI,產(chǎn)生10
個(gè)基音精細(xì)估計(jì)的候選值:◆將其轉(zhuǎn)換為相應(yīng)的基音頻率
ω0=2π/T0。然后在這10
個(gè)點(diǎn)上進(jìn)行細(xì)搜索,確定基音周期的精細(xì)估計(jì)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-29-趙曉群
教授圖11.6基音的精細(xì)估計(jì)計(jì)算Am(ω0)計(jì)算Xwr(l,ω0)⊕計(jì)算ε(ω0)256點(diǎn)DFT16384點(diǎn)DFT產(chǎn)生10個(gè)ω0候選值minε(ω0)第29頁(yè),共51頁(yè),2023年,2月20日,星期四①計(jì)算窗選語(yǔ)音和窗函數(shù)的離散Fourier
變換?!魧?duì)窗選語(yǔ)音信號(hào),計(jì)算
256
點(diǎn)DFT:對(duì)窗函數(shù),計(jì)算16384
點(diǎn)DFT:(擴(kuò)大點(diǎn)數(shù),可保證精度)②對(duì)每一個(gè)假設(shè)的
ω0,求各諧波的最佳譜包絡(luò)值
Am(ω0)。◆選定
ω0,則在-π~π
之間有個(gè)[2π/ω0]諧波分量,兩個(gè)相鄰諧波之間含有256ω0/2π
個(gè)語(yǔ)音信號(hào)的DFT
點(diǎn)?!魧?duì)于第
m
次諧波,它的頻帶下限、上限為:
其中,INTx表示取大于或等于
x
的最小整數(shù)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-30-趙曉群
教授第30頁(yè),共51頁(yè),2023年,2月20日,星期四◆根據(jù)式:因窗選激勵(lì)
Pw(ω)在頻帶內(nèi)與窗函數(shù)主瓣包絡(luò)形狀相同,
故用WR(ω)代替Pw(ω)。◆這意味著語(yǔ)音改變一個(gè)樣點(diǎn),窗改變
64
個(gè)樣點(diǎn)。
因此,最佳用下式計(jì)算:
③計(jì)算合成語(yǔ)音譜?!舭聪率接?jì)算:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-31-趙曉群
教授第31頁(yè),共51頁(yè),2023年,2月20日,星期四
④計(jì)算加權(quán)總擬合誤差,選擇最佳ω0
(或T0
)?!舨捎肈FT
的總擬合誤差為:◆在細(xì)搜索中,主要考慮高次諧波頻帶擬合的情況,因此,加權(quán)函數(shù)在低頻端可以取
0,求和下限不從1
開(kāi)始;
高頻端可以取1,求和上限也不必達(dá)到
127?!粽Z(yǔ)音頻譜一般限制在200~3600
Hz范圍內(nèi)。
故按下列公式確定求和上限
q:
總擬合誤差可以改寫成:◆對(duì)10
個(gè)候選基音頻率,逐個(gè)計(jì)算出總擬合誤差,
使其最小的ω0是當(dāng)前幀基音周期的精細(xì)估計(jì)值。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-32-趙曉群
教授利用偶對(duì)稱性,只計(jì)算了一半的值第32頁(yè),共51頁(yè),2023年,2月20日,星期四
4.
V/U
判決圖11.7:V/U
判決的方框圖。◆利用每個(gè)諧波處合成譜與窗選語(yǔ)音譜擬合的程度來(lái)確定。若歸一化擬合誤差
<閾值,判定該諧波頻帶為濁音帶;
反之為清音帶?!舨捎肈FT
時(shí),前面推導(dǎo)的歸一化誤差應(yīng)改寫成:◆也可將幾個(gè)相鄰諧波頻帶合并成一個(gè)頻帶,
根據(jù)該頻帶總擬合誤差作出該帶的V/U
判決。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-33-趙曉群
教授圖11.7清/濁判決方框圖計(jì)算擬合誤差計(jì)算E0更新Eavg,Emin,Emax計(jì)算閾值與閾值比較第33頁(yè),共51頁(yè),2023年,2月20日,星期四實(shí)用
V/U判決方案:最多分12個(gè)帶,判決方法如下:①
確定諧波的個(gè)數(shù)M。◆計(jì)算式:②
確定子帶的個(gè)數(shù)K。◆每個(gè)子帶包含3個(gè)諧波分量(見(jiàn)圖11.8)。子帶數(shù)的計(jì)算式:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-34-趙曉群
教授圖11.8改進(jìn)的MBE頻帶結(jié)構(gòu)子帶1子帶2子帶K-1子帶K第34頁(yè),共51頁(yè),2023年,2月20日,星期四
③
計(jì)算各帶的歸一化擬合誤差?!粲?jì)算式:
第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-35-趙曉群
教授第35頁(yè),共51頁(yè),2023年,2月20日,星期四④
計(jì)算
V/U
的判決閾值?!粲?jì)算式:◆第一項(xiàng):隨ω0增大而變大。
當(dāng)ω0增加時(shí)諧波個(gè)數(shù)將減少,擬合誤差會(huì)變大,此項(xiàng)起到去偏作用?!舻诙?xiàng):隨ω0升高而變小。
由于話音高頻端通常更具有隨機(jī)譜的特征,因此,較多地判為清音區(qū)會(huì)使合成語(yǔ)音聽(tīng)起來(lái)自然?!舻谌?xiàng):是同語(yǔ)音當(dāng)前幀能量
E0、平均能量
Eavg、
最小能量
Emin、最大能量
Emax
有關(guān)的參數(shù)。采用自適應(yīng)方法,逐幀更新這些參數(shù),以期獲得更好的效果。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-36-趙曉群
教授第36頁(yè),共51頁(yè),2023年,2月20日,星期四◆若用
E(0)
表示當(dāng)前幀的參數(shù),E(-1)表示前一幀的參數(shù),
相關(guān)量的定義為:且滿足的約束條件:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-37-趙曉群
教授第37頁(yè),共51頁(yè),2023年,2月20日,星期四◆求出上述幾個(gè)能量之后,再確定函數(shù):
⑤
V/U
判決?!襞袥Q規(guī)則為:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-38-趙曉群
教授第38頁(yè),共51頁(yè),2023年,2月20日,星期四
5.
求各諧波幅度或包絡(luò)圖11.9:頻譜幅度估計(jì)框圖?!舾倪M(jìn)MBE
語(yǔ)音編碼器,每個(gè)分頻帶包含
3
個(gè)諧波。諧波結(jié)構(gòu)見(jiàn)圖11.8。◆對(duì)于第k
個(gè)頻帶,其頻帶范圍為a3k-2≤ω
<b3k,需要確定
3
個(gè)頻譜幅度
A3k-2、A3k-1、A3k。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-39-趙曉群
教授圖11.9頻譜幅度估計(jì)計(jì)算清音幅度計(jì)算濁音幅度選擇清音/濁音譜幅度圖11.8改進(jìn)的MBE頻帶結(jié)構(gòu)子帶1子帶2子帶K-1子帶K第39頁(yè),共51頁(yè),2023年,2月20日,星期四◆濁音帶時(shí),按下式計(jì)算:如果數(shù)碼率足夠高,也可以直接傳送
Am(ω0)?!羟逡魩r(shí),Am按下式計(jì)算:◆對(duì)于最高分頻帶
K,其頻帶范圍是a3k-2≤ω<bM,
包含
M-3k+3個(gè)譜幅度。令直流分量
A0=0。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-40-趙曉群
教授第40頁(yè),共51頁(yè),2023年,2月20日,星期四改進(jìn)MBE
模型的全部參數(shù)為:
基音周期
T0,
各帶的
V/U
判決
Vk,(k=1,2,…,K),
各諧波處的最佳幅度
Am,(m=1,2,…,M)?!魠?shù)傳送給解碼器前,需量化、編碼?!?/p>
INMARSAT-M
語(yǔ)音編碼器的比特率為6.4
kbit/s,
幀長(zhǎng)
20
ms,每幀
128
bit,
其中45
bit
留給信道編碼用,余83
bit
供量化模型參數(shù)用?!舯?1.2:比特分配表。
(參數(shù)量化的方法從略)第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-41-趙曉群
教授表11.2模型參數(shù)比特分配參數(shù)基音周期V/U判決頻譜幅度每幀比特?cái)?shù)8K75-K第41頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成兩種合成方法:頻域合成法、時(shí)域合成法。◆頻域合成法:重建語(yǔ)音譜,求Fourier
反變換得時(shí)域序列。
相當(dāng)于分析過(guò)程的逆過(guò)程。
特點(diǎn):比較直接,但不能保證合成語(yǔ)音基音周期的平滑變化?!魰r(shí)域合成法:利用插值實(shí)現(xiàn)幀間基音周期的平滑過(guò)渡,
可使合成語(yǔ)音更自然。
因此,實(shí)際的MBE
算法都采用這種方法。◆下面介紹時(shí)域合成法。
圖11.10:改進(jìn)
MBE
語(yǔ)音合成框圖?!魸嵋舫煞峙c清音成分分開(kāi)合成,
再相加形成完整的合成語(yǔ)音。
第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成同濟(jì)大學(xué)電子與信息工程學(xué)院-42-趙曉群
教授圖11.10改進(jìn)MBE語(yǔ)音合成方框圖清音合成⊕濁音合成合成語(yǔ)音第42頁(yè),共51頁(yè),2023年,2月20日,星期四11.4.1清音成分的合成清音成分的合成用白噪聲激勵(lì)。◆初始值為u(-105)=3147。按下式產(chǎn)生一個(gè)白噪聲序列
u(n):◆對(duì)相繼的合成語(yǔ)音幀,u(n)
移動(dòng)20
ms(160
樣點(diǎn)),
對(duì)u(n)加窗,合成窗
wx(n)長(zhǎng):209
樣點(diǎn)。因此,在相繼合成語(yǔ)音幀之間,噪聲序列重疊49
樣點(diǎn)。對(duì)加窗后的u(n)進(jìn)行256
點(diǎn)的DFT,得:第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成同濟(jì)大學(xué)電子與信息工程學(xué)院-43-趙曉群
教授第43頁(yè),共51頁(yè),2023年,2月20日,星期四◆再根據(jù)諧波頻帶
m
是濁音區(qū)(Vk=1)或清音區(qū)(Vk=0),
再對(duì)
Uw(l)進(jìn)行修正得Uwc(l):
式中,am,bm——定義見(jiàn)前面;
Am(0)——當(dāng)前幀的Am值。
γm——伸縮系數(shù),是合成窗
wx(n)
與
基音精細(xì)估計(jì)窗
wR(n)的函數(shù),◆修正效果相當(dāng)于用一組帶通濾波器濾除濁音帶的信號(hào)。第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成同濟(jì)大學(xué)電子與信息工程學(xué)院-44-趙曉群
教授第44頁(yè),共51頁(yè),2023年,2月20日,星期四◆Uwc(l)中很低及很高的頻率成分都置0,即:◆對(duì)得到的頻域各點(diǎn)
Uwc(l
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025公司級(jí)員工安全培訓(xùn)考試試題帶答案(研優(yōu)卷)
- 2025年市政工程考試的疑難試題及答案
- 2025-2030年超聲波潔牙機(jī)行業(yè)市場(chǎng)深度調(diào)研及發(fā)展趨勢(shì)與投資研究報(bào)告
- 2025-2030年蓄冷空調(diào)行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030年數(shù)碼攝像機(jī)行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030年插座產(chǎn)業(yè)行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030年抗氧化劑行業(yè)市場(chǎng)深度調(diào)研及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 2025-2030年工藝陶瓷行業(yè)市場(chǎng)深度調(diào)研及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 工程項(xiàng)目資金運(yùn)作的分析技巧試題及答案
- 2025-2030年醫(yī)護(hù)輔助設(shè)備行業(yè)市場(chǎng)深度調(diào)研及發(fā)展趨勢(shì)與投資研究報(bào)告
- 測(cè)繪生產(chǎn)成本費(fèi)用細(xì)則定額
- 《公共政策學(xué)(第二版)》 課件第8章 政策創(chuàng)新與擴(kuò)散
- 課件6:環(huán)控電控柜主要部件-馬達(dá)保護(hù)器
- 小學(xué)生偏旁部首所表示的意義
- 七年級(jí)歷史上冊(cè) 第一單元 單元測(cè)試卷(人教版 2024年秋)
- 2024版電力服務(wù)咨詢服務(wù)合同范本
- 業(yè)務(wù)協(xié)作費(fèi)用協(xié)議書
- 國(guó)家職業(yè)資格目錄 2023
- 高處作業(yè)安全施工方案
- 燒結(jié)煤矸石實(shí)心磚和多孔磚塊用技術(shù)標(biāo)準(zhǔn)DBJ-T13-195-2022
- 食品安全知識(shí)競(jìng)賽考試資料
評(píng)論
0/150
提交評(píng)論