多帶激勵(lì)聲碼器_第1頁(yè)
多帶激勵(lì)聲碼器_第2頁(yè)
多帶激勵(lì)聲碼器_第3頁(yè)
多帶激勵(lì)聲碼器_第4頁(yè)
多帶激勵(lì)聲碼器_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多帶激勵(lì)聲碼器第1頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型

11.1概述11.4多帶激勵(lì)語(yǔ)音合成11.3多帶激勵(lì)語(yǔ)音分析第2頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.1概述CELP、MPLPC等:全極點(diǎn)模型、LPC

分析,合成-分析法,

聽(tīng)覺(jué)加權(quán)方均誤差準(zhǔn)則,閉環(huán)確定激勵(lì)參數(shù)?!暨@類混合編碼,在4.8~16

kbit/s碼率內(nèi)獲得巨大成功?!絷P(guān)鍵技術(shù):是保持了合成語(yǔ)音與原始語(yǔ)音波形的相似性?!粼俳禂?shù)碼率時(shí),合成語(yǔ)音質(zhì)量迅速下降。LPC

聲碼器:(清/濁音)二元激勵(lì)模型,分析-合成法,

LPC

分析,清/濁音判別,估計(jì)基音周期?!鬝NR較高時(shí),2.4

kbit/s

及以下碼率,語(yǔ)音可懂度相當(dāng)高。以上編碼器,當(dāng)噪聲較大時(shí),因無(wú)法準(zhǔn)確提取參數(shù),性能嚴(yán)重惡化;其它聲碼器,如通道聲碼器、同態(tài)聲碼器等也有同樣弱點(diǎn)。第11章多帶激勵(lì)聲碼器11.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院-3-趙曉群

教授第3頁(yè),共51頁(yè),2023年,2月20日,星期四產(chǎn)生原因:二元激勵(lì)模型過(guò)于簡(jiǎn)化,不符合實(shí)際語(yǔ)音的特性?!粼S多語(yǔ)音段,同時(shí)含周期性、非周期性分量,

過(guò)渡音段、有噪濁音段更是如此?!舢?dāng)用二元譜來(lái)擬合時(shí),合成語(yǔ)音缺乏自然度。1988年MIT

林肯實(shí)驗(yàn)室提出多帶激勵(lì)(MBE)語(yǔ)音編碼,◆突破二元激勵(lì)的局限性,對(duì)多個(gè)頻帶逐個(gè)進(jìn)行V/U

判決,故稱為多帶激勵(lì)模型?!舨捎煤铣?分析法,在2.4

~4.8

kbit/s

碼率時(shí)性能優(yōu)良?!舾倪M(jìn)方案被國(guó)際海事衛(wèi)星組織采用(INMARSAT-M

Voice

Codec),碼率為6.4

kbit/s。本章主要內(nèi)容:MBE

原理,參數(shù)提取方法,合成語(yǔ)音的方法。重點(diǎn)介紹INMARSAT-M

Voice

Codec

標(biāo)準(zhǔn)的算法。

第11章多帶激勵(lì)聲碼器11.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院-4-趙曉群

教授第4頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型窗選語(yǔ)音信號(hào)為(窗長(zhǎng)20~40ms):◆源-系統(tǒng)語(yǔ)音模型理論,語(yǔ)音段是線性系統(tǒng)(聲道)對(duì)某種激勵(lì)信號(hào)的響應(yīng)。設(shè)系統(tǒng)的單位脈沖響應(yīng)為,則的Fourier

變換可表示為:式中Hw(ω),

Ew(ω)——hw(n),

ew(n)

的Fourier

變換?!糁亟ㄕZ(yǔ)音信號(hào)譜

Xwr(ω)

可表示為:式中Hwr(ω)——

合成濾波器的系統(tǒng)函數(shù);

Ewr(ω)——合成濾波器的激勵(lì)信號(hào)的Fourier

變換。兩者皆從原始語(yǔ)音信號(hào)中分析提取。第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型同濟(jì)大學(xué)電子與信息工程學(xué)院-5-趙曉群

教授清音波形第5頁(yè),共51頁(yè),2023年,2月20日,星期四Hwr(ω)

用全極點(diǎn)函數(shù)來(lái)逼近,相應(yīng)于Xwr(ω)

的譜包絡(luò)。MBE按基音各諧波,將語(yǔ)音分成若干個(gè)子頻帶(如以3個(gè)相鄰的諧波頻帶為一組進(jìn)行分帶),分別對(duì)各子帶進(jìn)行V/U

判決,激勵(lì)信號(hào)為各子帶的和?!羟逡魩В河冒自肼曌V作為激勵(lì)信號(hào)譜;◆濁音帶:用周期性的Pw(ω)

作為激勵(lì)信號(hào)譜。激勵(lì)信號(hào)是周期性信號(hào)與非周期性噪聲按不同頻帶混合而成。系統(tǒng)函數(shù)

Hwr(ω)

的作用是:調(diào)整各子帶分量的相對(duì)幅度和相位,并將Ew(ω)

映射成Xw(ω)。該模型較符合實(shí)際語(yǔ)音的特性,使合成語(yǔ)音譜同原語(yǔ)音譜在頻譜精細(xì)結(jié)構(gòu)上擬合得更好。若還利用譜的相位信息,則能夠合成出高質(zhì)量的語(yǔ)音。第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型同濟(jì)大學(xué)電子與信息工程學(xué)院-6-趙曉群

教授第6頁(yè),共51頁(yè),2023年,2月20日,星期四圖11.1:典型的濁音、清音和混合語(yǔ)音段的分析-合成情況?!鬗BE編碼過(guò)程涉及三種參數(shù)的提取,①

基音頻率;②每個(gè)子帶的譜包絡(luò)的幅度和相位參數(shù);③每個(gè)子帶的V/U

判決。圖11.2:MBE語(yǔ)音編/解碼器的簡(jiǎn)化原理圖。第11章多帶激勵(lì)聲碼器11.2多帶激勵(lì)語(yǔ)音模型同濟(jì)大學(xué)電子與信息工程學(xué)院-7-趙曉群

教授圖11.2MBE聲碼器語(yǔ)音編/解碼器原理圖清語(yǔ)音合成濁語(yǔ)音合成基音周期估計(jì)諧波產(chǎn)生頻帶劃分幅度估計(jì)清/濁判決相位計(jì)算FFT傳輸輸出Hamming窗第7頁(yè),共51頁(yè),2023年,2月20日,星期四同濟(jì)大學(xué)電子與信息工程學(xué)院-8-趙曉群

教授(a)濁語(yǔ)音段(b)清語(yǔ)音段(c)混合語(yǔ)音段圖11.1語(yǔ)音MBE的分析-合成波形(10kHz采樣,256點(diǎn)Hamming窗)

濁音波形清音波形混合音波形加窗語(yǔ)音譜加窗語(yǔ)音譜加窗語(yǔ)音譜譜包絡(luò)譜包絡(luò)譜包絡(luò)U/V判決結(jié)果U/V判決結(jié)果U/V判決結(jié)果周期譜P(ejω)周期譜P(ejω)周期譜P(ejω)白噪聲譜白噪聲譜白噪聲譜激勵(lì)信號(hào)譜激勵(lì)信號(hào)譜激勵(lì)信號(hào)譜合成語(yǔ)音譜合成語(yǔ)音譜合成語(yǔ)音譜第8頁(yè),共51頁(yè),2023年,2月20日,星期四同濟(jì)大學(xué)電子與信息工程學(xué)院-9-趙曉群

教授第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析MBE模型參數(shù)的最優(yōu)提取,計(jì)算量大,工程難以實(shí)時(shí)實(shí)現(xiàn)。常用次優(yōu)算法,分兩步完成參數(shù)的提?。孩俅_定基音頻率和每個(gè)分帶的譜包絡(luò)參數(shù),用AbS法提?。虎趯?duì)每個(gè)分帶進(jìn)行V/U判決。有兩種參數(shù)提取方案:

①使下列加權(quán)積分值(加權(quán)方均譜誤差)為最?。?/p>

②應(yīng)使下列加權(quán)積分值達(dá)到最小:

式中G(ω)

——頻率加權(quán)函數(shù);

Xw(ω),Xwr(ω)

——原始語(yǔ)音譜和合成語(yǔ)音譜。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析差別:方案①利用語(yǔ)音譜的模值;方案②利用模值和相位,性能優(yōu)于①,但計(jì)算復(fù)雜,碼率有所增加。

第9頁(yè),共51頁(yè),2023年,2月20日,星期四INMARSAT-M

Voice

Codec

采用方案①。本節(jié)主要內(nèi)容:

11.3.1頻域分析

11.3.2時(shí)域分析

11.3.3

INMARSAT-M改進(jìn)MBE模型分析算法第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-10-趙曉群

教授第10頁(yè),共51頁(yè),2023年,2月20日,星期四

11.3.1頻域分析

1.基音估計(jì)及各次諧波幅度的計(jì)算設(shè)基音周期為T0(基音角頻率

ω0=2π/T0

)。依次假設(shè)

ω0為各種可能出現(xiàn)的值?!魧?duì)于可能的基音角頻率值ω0,將ω=-π~π

分為若干頻帶,

分界點(diǎn)為:am=(m-0.5)ω0,bm=(m+0.5)ω0,m=0,±1,…,±(M+1)◆設(shè)每個(gè)分帶

[am,bm]中Hwr(ω)

保持不變,Hwr(ω)=

Am,

則有:式中ε——總的加權(quán)方均譜誤差;

εm——

第m子帶加權(quán)方均譜誤差,或第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-11-趙曉群

教授僅考慮幅度譜時(shí)考慮幅度、相位譜時(shí)第11頁(yè),共51頁(yè),2023年,2月20日,星期四令或,由上兩式可分別解得一組最佳和:或◆若第

m

次諧波的能量顯周期性,則其能量集中在該諧波附近;

選周期性

Pw(ω)的作為激勵(lì)信號(hào)

Ewr(ω),

則合成語(yǔ)音譜Xwr(ω)與窗選語(yǔ)音譜

Xw(ω)

在第

m次諧波帶內(nèi)將擬合得很好(εm最?。??!羧舻?/p>

m

次諧波的能量顯非周期性,

Xw(ω)在該頻帶內(nèi)沒(méi)有特征性的形狀。仍用Pw(ω)作為激勵(lì),εm值將較大。此時(shí),應(yīng)選噪聲為激勵(lì)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-12-趙曉群

教授僅考慮幅度譜時(shí)考慮幅度、相位譜時(shí)第12頁(yè),共51頁(yè),2023年,2月20日,星期四分析周期性與非周期性信號(hào)激勵(lì)時(shí)的最佳解?!魸嵋纛l帶時(shí),選Pw(ω)為激勵(lì)信號(hào),由上頁(yè)兩式得:◆清音頻帶時(shí),激勵(lì)采用理想白噪聲(幅度譜

=1),則有:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-13-趙曉群

教授僅考慮幅度譜時(shí),最佳譜幅度考慮幅度、相位譜時(shí),最佳譜包絡(luò)。相位信息無(wú)關(guān)緊要,在此無(wú)需計(jì)算

Am。第13頁(yè),共51頁(yè),2023年,2月20日,星期四對(duì)于假定基音頻率

ω0

的每一個(gè)諧波,計(jì)算

︱Am

︳或Am,

再求出各次諧波內(nèi)的最小誤差。則整個(gè)頻帶的總的最小誤差:◆每假設(shè)一個(gè)基音頻率

ω0,計(jì)算出對(duì)應(yīng)的ε0。顯然,正確的基音周期或其倍數(shù)上,ε0取極小值?!羲阉?/p>

ε0的全局最小值對(duì)應(yīng)的T0=2π/

ω0值可能是正確的基音周期的某個(gè)整數(shù)倍值?!粢蚨?,還需要對(duì)T0/2、T0/3、…處的ε0進(jìn)行校核,以判斷正確的基音周期,從而確定最佳基音周期?!糇詈蟠_定最佳基音周期時(shí),還需要考慮前后幀的情況。一般相鄰幀的T0值變化不會(huì)太大。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-14-趙曉群

教授第14頁(yè),共51頁(yè),2023年,2月20日,星期四2.諧波頻帶內(nèi)V/U

判決第m子帶的歸一化誤差能量為:◆采用激勵(lì)信號(hào)Pw(ω)(譜幅度︱Am

︳或譜包絡(luò)

Am、周期

T0

)是第m諧波子帶的譜擬合誤差。◆令頻率加權(quán)函數(shù)

G(ω)=1,上式化簡(jiǎn)為:◆子帶判決:

◆可以將相鄰的幾個(gè)諧波頻帶合并成一個(gè)子頻帶,用上述同樣的方法提取︱Am

︳或Am,并進(jìn)行

V/U

判決。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-15-趙曉群

教授第15頁(yè),共51頁(yè),2023年,2月20日,星期四

11.3.2時(shí)域分析W(ω):窗函數(shù)

w(n)的Fourier變換,

ω0:歸一化基音角頻率(基音周期

T0,ω0=2π/T0)◆假設(shè)在-π~π

頻率范圍內(nèi)共2M個(gè)諧波,

Pw(ω)為激勵(lì)時(shí),有:

式中,

第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-16-趙曉群

教授第16頁(yè),共51頁(yè),2023年,2月20日,星期四◆令頻率加權(quán)函數(shù)

G(ω)=1,由前面給出的式子得,全帶擬合誤差:

式中,◆由上式可求出使ε取極小值的矢量

a

為:再代入上式,結(jié)合上頁(yè)式,得:式中,◆因此,對(duì)于某個(gè)選定的T

值時(shí),計(jì)算min

ε

等價(jià)于

max

ψ。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-17-趙曉群

教授

注:上標(biāo)T為轉(zhuǎn)置

H為共軛轉(zhuǎn)置第17頁(yè),共51頁(yè),2023年,2月20日,星期四為了方便,選擇窗函數(shù)

w(n),使其滿足◆頻域內(nèi)正交條件:

,I

是單位矩陣;◆相當(dāng)于時(shí)域內(nèi)滿足條件:◆還要求其Fourier

變換的泄露足夠小,

主瓣寬度足夠窄(此寬度不應(yīng)大于基音頻率值)

。滿足上述條件且w(n)為偶函數(shù)時(shí),上頁(yè)計(jì)算ψ

式可改寫為:◆注意到ω0M=π

近似成立,且ω0T=2π,則上式可簡(jiǎn)化為:式中

T

——假定的基音周期;

——

w2(n)x(n)的自相關(guān)函數(shù),第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-18-趙曉群

教授第18頁(yè),共51頁(yè),2023年,2月20日,星期四由Parseval定理,總擬合誤差寫成:為了去除由于T

值增加造成的ε下降,需要對(duì)上式修正,

以保證真正的基音周期對(duì)應(yīng)的是全局最小值?!舨捎脽o(wú)偏擬合誤差公式如下:◆采用此修正后,歸一化總誤差能量應(yīng)寫成下列形式:

第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-19-趙曉群

教授第19頁(yè),共51頁(yè),2023年,2月20日,星期四設(shè)窗函數(shù)

w(n)長(zhǎng)為2N+1,以原點(diǎn)對(duì)稱。

同時(shí)假設(shè)在窗長(zhǎng)范圍內(nèi)有L

個(gè)假設(shè)基音周期,即:◆則上頁(yè)式中,ξuB的求和上下限應(yīng)作相應(yīng)的改動(dòng),即得到:

為粗搜索時(shí)確定初始基音周期

TI

所用的擬合誤差時(shí)域表達(dá)?!魹樘岣呔?,T

值也可取非整數(shù),如20.5,

21,

21.5…。

非整數(shù)點(diǎn)上的相關(guān)函數(shù)可插值計(jì)算:實(shí)驗(yàn)表明,10kHz

采樣,基音周期的精確可達(dá)0.04

樣點(diǎn)。數(shù)碼率較低時(shí)(4.8

kbit/s以下),精確到1/4

~

1/8

樣點(diǎn)也就滿足要求了,這樣運(yùn)算量可以減少很多。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-20-趙曉群

教授第20頁(yè),共51頁(yè),2023年,2月20日,星期四

11.3.3

INMARSAT-M改進(jìn)MBE模型分析算法

圖11.3:INMARSAT-M

改進(jìn)MBE

模型算法框圖?!粽Z(yǔ)音信號(hào):

8

kHz

采樣,線性

PCM

編碼,語(yǔ)音樣值的最大值定標(biāo)范圍:[214-1,215-1]

最小值定標(biāo)范圍:[-215,-214]◆需求出改進(jìn)MBE

模型參數(shù):基音角頻率、V/U判決,

子帶譜包絡(luò)參數(shù)(僅考慮幅度譜)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-21-趙曉群

教授圖11.3MBE語(yǔ)音分析算法方框圖高通濾波器低通濾波器基音周期初始估計(jì)清/濁判決基音周期精確估計(jì)頻譜估計(jì)語(yǔ)音信號(hào)第21頁(yè),共51頁(yè),2023年,2月20日,星期四1.高通濾波◆語(yǔ)音經(jīng)數(shù)字高通濾波器,濾除信號(hào)中的直流分量。

高通濾波器的截止頻率約10

Hz,傳遞函數(shù)為:2.低通濾波◆低通濾波器輸出的信號(hào)按下式計(jì)算:

低通濾波器是21

階FIR

數(shù)字濾波器,其系數(shù)值列于表11.1。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-22-趙曉群

教授表11.1

FIR

低通濾波器系數(shù)jhL(j)jhL(j)jhL(j)00.394201±4-0.063723±8-0.007430±10.297354±5-0.004565±9-0.013775±20.093671±60.030659±10-0.002174±3-0.051602±70.016900第22頁(yè),共51頁(yè),2023年,2月20日,星期四同濟(jì)大學(xué)電子與信息工程學(xué)院-23-趙曉群

教授圖11.4相鄰語(yǔ)音幀與幀之間的關(guān)系過(guò)去幀當(dāng)前幀將來(lái)幀3.

基音估計(jì)基音估計(jì)算法:應(yīng)保持相鄰語(yǔ)音幀基音周期的某種連續(xù)性?;舾櫵惴ǎ涸诖_定當(dāng)前幀的基音周期時(shí)要考慮相鄰的過(guò)去幀和將來(lái)幀的影響。圖11.4:當(dāng)前幀和前后幀之間的關(guān)系。

◆幀長(zhǎng)為

20

ms(160

個(gè)樣點(diǎn))?!艋艄烙?jì)算法分:初始估計(jì)、精細(xì)估計(jì)兩步進(jìn)行。初始估計(jì)得到初始基音周期:TI,TI∈D={21,21.5,…,114},

精度:

1/2

采樣周期;再由精細(xì)估計(jì)得出歸最終基音周期,精度:1/4

采樣周期。兩步法可降低計(jì)算復(fù)雜度和提高魯棒性。

第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析-40-200204060msT-2T-1

T0T1T2基音周期:誤差函數(shù):E-2(T)E-1(T)E0(T)E1(T)E2(T)第23頁(yè),共51頁(yè),2023年,2月20日,星期四算法的重要特點(diǎn):初始估計(jì)和精細(xì)估計(jì)使用不同長(zhǎng)度的窗函數(shù)?!舫跏脊烙?jì)窗

wI(n)

長(zhǎng)為281

個(gè)樣點(diǎn);◆精細(xì)估計(jì)窗wR(n)長(zhǎng)為221

個(gè)樣點(diǎn);◆皆是對(duì)稱三角形窗,兩窗中點(diǎn)對(duì)齊。相鄰語(yǔ)音幀之間的重疊量是窗長(zhǎng)的函數(shù),

重疊量

=窗長(zhǎng)

-幀移動(dòng)量(160

個(gè)樣點(diǎn))?!魒R(n)時(shí),重疊量

61

個(gè)樣點(diǎn);wR(n)時(shí),121個(gè)樣點(diǎn)。

(1)

基音的初始估計(jì)(步驟見(jiàn)圖11.5)◆對(duì)每一個(gè)可能的基音周期

T∈D,計(jì)算誤差函數(shù)值

E(T)。然后通過(guò)前向與后向基音

跟綜算法,比較求出的值,最終選擇最佳的候選者

作為TI。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-24-趙曉群

教授圖11.5初始基音周期估計(jì)后向基音跟蹤前向基音跟蹤比較基音估計(jì)值計(jì)算誤差函數(shù)第24頁(yè),共51頁(yè),2023年,2月20日,星期四

計(jì)算誤差函數(shù)◆根據(jù)歸一化總誤差能量定義,誤差函數(shù)

E(T)定義為:式中

wI(n)

——?dú)w一化三角形窗函數(shù),滿足

?!舢?dāng)t

為整數(shù)值時(shí),自相關(guān)函數(shù)

φ(t)定義為:當(dāng)t

為非整數(shù)值時(shí),用線性內(nèi)插公式計(jì)算

φ(t)?!艋糁芷诘某跏脊烙?jì)

TI為:◆采用基音跟蹤算法,保證基音周期

TI的連續(xù)性。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-25-趙曉群

教授第25頁(yè),共51頁(yè),2023年,2月20日,星期四

后向基音跟蹤◆E-1(T-1)、E-2(T-2)——過(guò)去兩幀對(duì)應(yīng)的誤差函數(shù)值;◆

因基音周期的連續(xù)性,當(dāng)前幀的基音周期

T

應(yīng)在T-1附近,應(yīng)滿足約束條件:◆在上式范圍內(nèi)逐個(gè)選取

T,并計(jì)算相應(yīng)的E(T)

,

使E(T)最小的T就是后向估計(jì)TB,計(jì)算后向累計(jì)誤差CE(TB):

CE(TB)是后向基音估計(jì)的置信度測(cè)度。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-26-趙曉群

教授第26頁(yè),共51頁(yè),2023年,2月20日,星期四

③前向基音跟蹤◆E1(T1)、E2(T2)——將來(lái)兩幀對(duì)應(yīng)的誤差函數(shù)值;◆將來(lái)兩幀的基音周期尚未確定,前向基音跟蹤算法必須首先設(shè)法確定這些基音周期值。◆在集合D內(nèi)選定一個(gè)T0,按下面的約束條件選取T1、T2:

使E1(T1)+E2(T2)最小的T1、T2表示為,并按下式計(jì)算前向累計(jì)誤差函數(shù)

CEF(T0)

為:◆重復(fù)上述過(guò)程,在規(guī)定的范圍內(nèi)逐個(gè)選定

T0,

計(jì)算相應(yīng)的CEF(T0)

,使其最小的T0定義為。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-27-趙曉群

教授第27頁(yè),共51頁(yè),2023年,2月20日,星期四為防止倍基音周期,考慮取的可能性?!粢?/p>

,選擇一個(gè)與其最接近的值代替。

再檢查是否滿足下列三個(gè)條件之一、且為最小值的,◆若有,則前向基音估計(jì);否則。完成前、后向基音跟蹤,并求得估計(jì)值后,

按下列判決規(guī)則確定初始基音估計(jì)

TI:

If

CEb(TB)<0.48

then

TI

=TB

else

if

CEb(TB)≤CEF(TF)

then

TI

=TB

else

TI

=TF

◆最終的基音估計(jì)的精度提高到

1/4

采樣周期。

第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-28-趙曉群

教授第28頁(yè),共51頁(yè),2023年,2月20日,星期四

(2)

基音的精細(xì)估計(jì)圖11.6:基音精細(xì)估計(jì)的方框圖?!艟?xì)估計(jì)窗

wR(n):長(zhǎng)

221

個(gè)樣點(diǎn),歸一化三角形窗?!粲苫舫跏脊烙?jì)

TI,產(chǎn)生10

個(gè)基音精細(xì)估計(jì)的候選值:◆將其轉(zhuǎn)換為相應(yīng)的基音頻率

ω0=2π/T0。然后在這10

個(gè)點(diǎn)上進(jìn)行細(xì)搜索,確定基音周期的精細(xì)估計(jì)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-29-趙曉群

教授圖11.6基音的精細(xì)估計(jì)計(jì)算Am(ω0)計(jì)算Xwr(l,ω0)⊕計(jì)算ε(ω0)256點(diǎn)DFT16384點(diǎn)DFT產(chǎn)生10個(gè)ω0候選值minε(ω0)第29頁(yè),共51頁(yè),2023年,2月20日,星期四①計(jì)算窗選語(yǔ)音和窗函數(shù)的離散Fourier

變換?!魧?duì)窗選語(yǔ)音信號(hào),計(jì)算

256

點(diǎn)DFT:對(duì)窗函數(shù),計(jì)算16384

點(diǎn)DFT:(擴(kuò)大點(diǎn)數(shù),可保證精度)②對(duì)每一個(gè)假設(shè)的

ω0,求各諧波的最佳譜包絡(luò)值

Am(ω0)。◆選定

ω0,則在-π~π

之間有個(gè)[2π/ω0]諧波分量,兩個(gè)相鄰諧波之間含有256ω0/2π

個(gè)語(yǔ)音信號(hào)的DFT

點(diǎn)?!魧?duì)于第

m

次諧波,它的頻帶下限、上限為:

其中,INTx表示取大于或等于

x

的最小整數(shù)。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-30-趙曉群

教授第30頁(yè),共51頁(yè),2023年,2月20日,星期四◆根據(jù)式:因窗選激勵(lì)

Pw(ω)在頻帶內(nèi)與窗函數(shù)主瓣包絡(luò)形狀相同,

故用WR(ω)代替Pw(ω)。◆這意味著語(yǔ)音改變一個(gè)樣點(diǎn),窗改變

64

個(gè)樣點(diǎn)。

因此,最佳用下式計(jì)算:

③計(jì)算合成語(yǔ)音譜?!舭聪率接?jì)算:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-31-趙曉群

教授第31頁(yè),共51頁(yè),2023年,2月20日,星期四

④計(jì)算加權(quán)總擬合誤差,選擇最佳ω0

(或T0

)?!舨捎肈FT

的總擬合誤差為:◆在細(xì)搜索中,主要考慮高次諧波頻帶擬合的情況,因此,加權(quán)函數(shù)在低頻端可以取

0,求和下限不從1

開(kāi)始;

高頻端可以取1,求和上限也不必達(dá)到

127?!粽Z(yǔ)音頻譜一般限制在200~3600

Hz范圍內(nèi)。

故按下列公式確定求和上限

q:

總擬合誤差可以改寫成:◆對(duì)10

個(gè)候選基音頻率,逐個(gè)計(jì)算出總擬合誤差,

使其最小的ω0是當(dāng)前幀基音周期的精細(xì)估計(jì)值。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-32-趙曉群

教授利用偶對(duì)稱性,只計(jì)算了一半的值第32頁(yè),共51頁(yè),2023年,2月20日,星期四

4.

V/U

判決圖11.7:V/U

判決的方框圖。◆利用每個(gè)諧波處合成譜與窗選語(yǔ)音譜擬合的程度來(lái)確定。若歸一化擬合誤差

<閾值,判定該諧波頻帶為濁音帶;

反之為清音帶?!舨捎肈FT

時(shí),前面推導(dǎo)的歸一化誤差應(yīng)改寫成:◆也可將幾個(gè)相鄰諧波頻帶合并成一個(gè)頻帶,

根據(jù)該頻帶總擬合誤差作出該帶的V/U

判決。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-33-趙曉群

教授圖11.7清/濁判決方框圖計(jì)算擬合誤差計(jì)算E0更新Eavg,Emin,Emax計(jì)算閾值與閾值比較第33頁(yè),共51頁(yè),2023年,2月20日,星期四實(shí)用

V/U判決方案:最多分12個(gè)帶,判決方法如下:①

確定諧波的個(gè)數(shù)M。◆計(jì)算式:②

確定子帶的個(gè)數(shù)K。◆每個(gè)子帶包含3個(gè)諧波分量(見(jiàn)圖11.8)。子帶數(shù)的計(jì)算式:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-34-趙曉群

教授圖11.8改進(jìn)的MBE頻帶結(jié)構(gòu)子帶1子帶2子帶K-1子帶K第34頁(yè),共51頁(yè),2023年,2月20日,星期四

計(jì)算各帶的歸一化擬合誤差?!粲?jì)算式:

第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-35-趙曉群

教授第35頁(yè),共51頁(yè),2023年,2月20日,星期四④

計(jì)算

V/U

的判決閾值?!粲?jì)算式:◆第一項(xiàng):隨ω0增大而變大。

當(dāng)ω0增加時(shí)諧波個(gè)數(shù)將減少,擬合誤差會(huì)變大,此項(xiàng)起到去偏作用?!舻诙?xiàng):隨ω0升高而變小。

由于話音高頻端通常更具有隨機(jī)譜的特征,因此,較多地判為清音區(qū)會(huì)使合成語(yǔ)音聽(tīng)起來(lái)自然?!舻谌?xiàng):是同語(yǔ)音當(dāng)前幀能量

E0、平均能量

Eavg、

最小能量

Emin、最大能量

Emax

有關(guān)的參數(shù)。采用自適應(yīng)方法,逐幀更新這些參數(shù),以期獲得更好的效果。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-36-趙曉群

教授第36頁(yè),共51頁(yè),2023年,2月20日,星期四◆若用

E(0)

表示當(dāng)前幀的參數(shù),E(-1)表示前一幀的參數(shù),

相關(guān)量的定義為:且滿足的約束條件:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-37-趙曉群

教授第37頁(yè),共51頁(yè),2023年,2月20日,星期四◆求出上述幾個(gè)能量之后,再確定函數(shù):

V/U

判決?!襞袥Q規(guī)則為:第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-38-趙曉群

教授第38頁(yè),共51頁(yè),2023年,2月20日,星期四

5.

求各諧波幅度或包絡(luò)圖11.9:頻譜幅度估計(jì)框圖?!舾倪M(jìn)MBE

語(yǔ)音編碼器,每個(gè)分頻帶包含

3

個(gè)諧波。諧波結(jié)構(gòu)見(jiàn)圖11.8。◆對(duì)于第k

個(gè)頻帶,其頻帶范圍為a3k-2≤ω

<b3k,需要確定

3

個(gè)頻譜幅度

A3k-2、A3k-1、A3k。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-39-趙曉群

教授圖11.9頻譜幅度估計(jì)計(jì)算清音幅度計(jì)算濁音幅度選擇清音/濁音譜幅度圖11.8改進(jìn)的MBE頻帶結(jié)構(gòu)子帶1子帶2子帶K-1子帶K第39頁(yè),共51頁(yè),2023年,2月20日,星期四◆濁音帶時(shí),按下式計(jì)算:如果數(shù)碼率足夠高,也可以直接傳送

Am(ω0)?!羟逡魩r(shí),Am按下式計(jì)算:◆對(duì)于最高分頻帶

K,其頻帶范圍是a3k-2≤ω<bM,

包含

M-3k+3個(gè)譜幅度。令直流分量

A0=0。第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-40-趙曉群

教授第40頁(yè),共51頁(yè),2023年,2月20日,星期四改進(jìn)MBE

模型的全部參數(shù)為:

基音周期

T0,

各帶的

V/U

判決

Vk,(k=1,2,…,K),

各諧波處的最佳幅度

Am,(m=1,2,…,M)?!魠?shù)傳送給解碼器前,需量化、編碼?!?/p>

INMARSAT-M

語(yǔ)音編碼器的比特率為6.4

kbit/s,

幀長(zhǎng)

20

ms,每幀

128

bit,

其中45

bit

留給信道編碼用,余83

bit

供量化模型參數(shù)用?!舯?1.2:比特分配表。

(參數(shù)量化的方法從略)第11章多帶激勵(lì)聲碼器11.3多帶激勵(lì)語(yǔ)音分析同濟(jì)大學(xué)電子與信息工程學(xué)院-41-趙曉群

教授表11.2模型參數(shù)比特分配參數(shù)基音周期V/U判決頻譜幅度每幀比特?cái)?shù)8K75-K第41頁(yè),共51頁(yè),2023年,2月20日,星期四第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成兩種合成方法:頻域合成法、時(shí)域合成法。◆頻域合成法:重建語(yǔ)音譜,求Fourier

反變換得時(shí)域序列。

相當(dāng)于分析過(guò)程的逆過(guò)程。

特點(diǎn):比較直接,但不能保證合成語(yǔ)音基音周期的平滑變化?!魰r(shí)域合成法:利用插值實(shí)現(xiàn)幀間基音周期的平滑過(guò)渡,

可使合成語(yǔ)音更自然。

因此,實(shí)際的MBE

算法都采用這種方法。◆下面介紹時(shí)域合成法。

圖11.10:改進(jìn)

MBE

語(yǔ)音合成框圖?!魸嵋舫煞峙c清音成分分開(kāi)合成,

再相加形成完整的合成語(yǔ)音。

第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成同濟(jì)大學(xué)電子與信息工程學(xué)院-42-趙曉群

教授圖11.10改進(jìn)MBE語(yǔ)音合成方框圖清音合成⊕濁音合成合成語(yǔ)音第42頁(yè),共51頁(yè),2023年,2月20日,星期四11.4.1清音成分的合成清音成分的合成用白噪聲激勵(lì)。◆初始值為u(-105)=3147。按下式產(chǎn)生一個(gè)白噪聲序列

u(n):◆對(duì)相繼的合成語(yǔ)音幀,u(n)

移動(dòng)20

ms(160

樣點(diǎn)),

對(duì)u(n)加窗,合成窗

wx(n)長(zhǎng):209

樣點(diǎn)。因此,在相繼合成語(yǔ)音幀之間,噪聲序列重疊49

樣點(diǎn)。對(duì)加窗后的u(n)進(jìn)行256

點(diǎn)的DFT,得:第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成同濟(jì)大學(xué)電子與信息工程學(xué)院-43-趙曉群

教授第43頁(yè),共51頁(yè),2023年,2月20日,星期四◆再根據(jù)諧波頻帶

m

是濁音區(qū)(Vk=1)或清音區(qū)(Vk=0),

再對(duì)

Uw(l)進(jìn)行修正得Uwc(l):

式中,am,bm——定義見(jiàn)前面;

Am(0)——當(dāng)前幀的Am值。

γm——伸縮系數(shù),是合成窗

wx(n)

基音精細(xì)估計(jì)窗

wR(n)的函數(shù),◆修正效果相當(dāng)于用一組帶通濾波器濾除濁音帶的信號(hào)。第11章多帶激勵(lì)聲碼器11.4多帶激勵(lì)語(yǔ)音合成同濟(jì)大學(xué)電子與信息工程學(xué)院-44-趙曉群

教授第44頁(yè),共51頁(yè),2023年,2月20日,星期四◆Uwc(l)中很低及很高的頻率成分都置0,即:◆對(duì)得到的頻域各點(diǎn)

Uwc(l

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論