數(shù)字語音處理-第四章_第1頁
數(shù)字語音處理-第四章_第2頁
數(shù)字語音處理-第四章_第3頁
數(shù)字語音處理-第四章_第4頁
數(shù)字語音處理-第四章_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章語音信號的短時(shí)時(shí)域分析

4.1概述14.2傅里葉變換的解釋

4.3濾波器的解釋34.4短時(shí)譜的時(shí)域及頻域采樣率44.5短時(shí)綜合的濾波器組相加法524.1概述語音信號可被看作是短時(shí)平穩(wěn)信號,其某一幀的短時(shí)傅里葉變換定義式如下:(4.1)式中w(n-m)是窗函數(shù)。在式中,短時(shí)傅里葉變換有兩個(gè)變量,它們是離散時(shí)間n及連續(xù)頻率ω若令,則得離散的短時(shí)傅里葉變換如下:

(4.2)它實(shí)際上就是的頻率的取樣。4.1概述可以看出:(1)當(dāng)n固定時(shí),它們就是序列

(-∞≤m≤+∞)

的傅里葉變換或離散傅里葉變換。(2)

當(dāng)或k固定時(shí),它們是一個(gè)卷積,這相當(dāng)于濾波器的運(yùn)算。因此,語音信號的短時(shí)頻域分析可以解釋為傅里葉變換或?yàn)V波器。下面分別討論這兩種情況。4.1概述4.2

傅里葉變換的解釋

1.求x(n)將式(4.1)寫作(4.3)時(shí)變傅里葉變換是時(shí)間標(biāo)號n的函數(shù),當(dāng)n變化時(shí),窗w(n-m)沿著x(m)滑動。傅里葉逆變換公式為:

(4.4)令m=n,則

(4.5)可以看出,只有當(dāng)w(0)≠0時(shí),x(n)才能從求出。

此外,由功率譜定義,可以寫出短時(shí)功率譜與短時(shí)傅里葉變換的關(guān)系:

(4.6)功率譜是自相關(guān)函數(shù)

(4.7)的傅里葉變換。窗函數(shù)的作用

1.選出x(m)序列中被分析部分;

2.它的形狀對時(shí)變傅里葉變換特性也有重要作用。如果被看成是w(n-m)x(m)序列的標(biāo)準(zhǔn)傅里葉變換,同時(shí)假設(shè)x(m)及w(m)的標(biāo)準(zhǔn)傅里葉變換存在,為:(4.8)(4.9)當(dāng)n固定時(shí),序列w(n-m)的傅里葉變換為:

(4.10)根據(jù)卷積定理,有:

(4.11)寫成卷積積分形式:

(4.12)將θ改換為-θ后,可以寫成:

(4.13)可見,為了使能夠充分地表現(xiàn)的特性,要求對于來說,必須是一個(gè)沖激脈沖。

窗函數(shù)和窗寬對短時(shí)傅里葉譜的影響:由于矩形窗有較高的旁瓣,在語音頻譜分析中,很少采用。實(shí)驗(yàn)表明,窗的主瓣寬度與窗寬度N成反比,選擇窗寬時(shí)應(yīng)根據(jù)應(yīng)用需要,折衷考慮,要得到好的時(shí)間分辨率要求用窄窗,而要得到好的頻率分辨率要求用寬窗。

4.3

濾波器的解釋(ω給定)

1.短時(shí)傅里葉變換的濾波器實(shí)現(xiàn)形式一由式(4.1)可得

(4.14)如果把w(n)看作為一個(gè)濾波器的單位取樣響應(yīng),則短時(shí)傅里葉變換就是該濾波器的輸出,為濾波器的輸入。

用實(shí)數(shù)來運(yùn)算的方法:

(4.15)(4.16)

結(jié)論:經(jīng)調(diào)制后,其付里葉變換為,這說明調(diào)制使的頻譜在頻率軸上向左移動了,線性濾波器輸出端的頻譜等于乘積,故為了使輸出頻譜準(zhǔn)確等于,應(yīng)當(dāng)是一個(gè)沖激。即要求線性濾波器近似為一個(gè)窄帶低通濾波器。2.短時(shí)傅里葉變換的濾波器實(shí)現(xiàn)形式二令:

(4.16)令(4.17)則有

(4.18)可以畫出短時(shí)傅里葉變換的濾波器解釋的另一種形式如圖(4.3)所示,也分為復(fù)數(shù)運(yùn)算和實(shí)數(shù)運(yùn)算兩種。

同樣要求線性濾波器近似為一個(gè)中心頻率為ω的窄帶帶通濾波器。

4.4短時(shí)譜的時(shí)域及頻域取樣率

短時(shí)傅里葉變換同時(shí)是時(shí)間n以及角頻率ω的函數(shù)。由來恢復(fù)x(n),首先遇到的就是時(shí)域取樣率和頻域取樣率的問題。1.時(shí)域取樣率(ω為固定值)

若將w(n)的傅里葉變換記為,對于大多數(shù)窗函數(shù)來說,具有低通濾波器的特性,若它的帶寬為BHz,則具有與窗相同的帶寬。低通濾波器的帶寬是由第一個(gè)零點(diǎn)位置決定的。因?yàn)槭?1的傅里葉變換,因而B的取值決定于窗口序列的長度N和形狀。若使用哈明窗,的近似帶寬為

(4.20)

2、頻率取樣率(n為固定值)

此時(shí),是以2π為周期的ω的連續(xù)函數(shù),用下述一組頻率值來取樣:

(4.21)

設(shè)w(n)為有限時(shí)寬N,的短時(shí)付里葉反變換x(m)w(n-m)也應(yīng)當(dāng)是寬度為N有限時(shí)寬的?,F(xiàn)在在頻域內(nèi)L個(gè)角頻率上對進(jìn)行取樣,根據(jù)這些取樣所恢復(fù)出的時(shí)間信號應(yīng)該是x(m)w(n-m)進(jìn)行周期延拓的結(jié)果,延拓周期等于L。為使恢復(fù)的時(shí)域信號不產(chǎn)生混疊,要求,故頻域最小取樣數(shù)為窗寬SRf=N。

3、總?cè)勇实目偝闃勇剩⊿R)等于

(4.22)在大多數(shù)實(shí)際窗中,B可以表示為FS/N的倍數(shù)

(4.23)其中,C是比例常數(shù),

x(n)的抽樣頻率即為

(4.24)SR/FS即為與一般取樣頻率相比而得到的“過速率采樣比”。

欠速率采樣:

x(n)的短時(shí)譜所要求的取樣率比起一般波形表示來說,要增加到2~4倍。但有時(shí)在時(shí)域或頻域用低于理論上最小值的取樣率,而x(n)仍能從混疊的短時(shí)變換中準(zhǔn)確地恢復(fù)。欠速率采樣在短時(shí)譜估計(jì),基音及共振峰分析,數(shù)字語譜圖以及聲碼器中得到應(yīng)用。4.5短時(shí)綜合的濾波器組相加法

可表示為(4.25)(4.26)若定義則(4.27)(4.28)式(4.28)的圖形解釋

定義

(4.29)

可得

(4.30)

可見,是一個(gè)沖激響應(yīng)為的帶通濾波器的輸出。復(fù)數(shù)帶通濾波器的頻率響應(yīng)為

上式用圖4.7(b)表示,中心頻率為,帶寬為,假定所有通道都使用了相同的窗函數(shù),即

(4.31)(4.32)

考慮整個(gè)帶通濾波器組時(shí),其中每個(gè)帶通濾波器具有相同的輸入,其輸出相加在一起,如圖4.8所示,輸出為y(n),輸入為x(n),整個(gè)系統(tǒng)的復(fù)合頻率響應(yīng)為

(4.33)

如果在頻率域上正確抽樣(N≥L,L為窗寬),可以證明對于所有ω都滿足

(4.34)

上式證明如下:

的傅里葉反變換是窗函數(shù),如果在頻率上以N個(gè)均勻間隔抽樣,抽樣形式的離散傅里葉反變換為

(4.35)

如果w(n)的寬度等于L個(gè)抽樣,則

w(n)=0,n<0,n≥L(4.36)

在式(4.35)中取n=0,得到

(4.37)

從式(4.27)及式(4.34)可以推出復(fù)合系統(tǒng)的沖激響應(yīng)為:(4.38)

這時(shí)的復(fù)合輸出為

(4.39)

于是,用濾波器組相加法恢復(fù)的信號可以表示為:

(4.40)

上面已討論到,當(dāng)w(n)具有有限寬度L時(shí),x(n)完全能從時(shí)間及頻率域抽樣后的時(shí)變傅里葉變換準(zhǔn)確地恢復(fù)。下面還能證明,如果在頻域內(nèi)是頻帶受限的,則

x(n)也能準(zhǔn)確從中恢復(fù)。

前面已指出,在有限寬度窗的情況下,為避免時(shí)間混疊,必須至少在L個(gè)均勻分布的頻率上取值,其中L為窗的寬度。寬度為L的窗的帶寬一般在矩形窗)至哈明窗)之間,而分析頻率為,這時(shí)所得的帶通濾波器在頻率上疊接。4.5.2短時(shí)綜合的濾波器組相加法的MATLAB程序?qū)崿F(xiàn)

程序filterbank1.m對應(yīng)于圖4.6中的(b)圖,先調(diào)制后濾波,實(shí)現(xiàn)流程圖見圖4.10。圖4.6中的(b)圖圖4.10filterbank1的流程圖YN讀入語音數(shù)據(jù)分幀,不足補(bǔ)零,共N幀加哈寧窗濾波i=1~65取k=1幀數(shù)據(jù)用調(diào)制i=1~65用調(diào)制i=1~65k=k+1輸出

k≥N?

程序filterbank2.m對應(yīng)于圖4.6中的(a)圖,先濾波后調(diào)制,實(shí)現(xiàn)流程圖見圖4.12,程序運(yùn)行結(jié)果見圖4.13。圖4.6中的(a)圖圖4.12filterbank2的流程圖YN讀入語音數(shù)據(jù)分幀,不足補(bǔ)零,共N幀各通道濾波i=1~65取k=1幀數(shù)據(jù)并分別送入1~65通道的輸入端

各通道用調(diào)制i=1~65各通道用調(diào)制i=1~65k=k+1輸出

k≥N?

(4.41)式中r為一整數(shù),0≤i≤N-1,上式的反變換為

(4.42)又(4.43)因而

(4.44)假設(shè)在時(shí)域上利用周期為R的取樣對取樣得4.5.3短時(shí)綜合的疊接相加法原理及MATLAB程序?qū)崿F(xiàn)

將式(4.42)代入式(4.44)中,可得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論