




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、4.2語音信號(hào)的數(shù)字化與預(yù)處理 4.1概述 4.4短時(shí)平均過零率和上升過零間隔 4.3短時(shí)平均能量和短時(shí)平均幅度 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用 4.7中值濾波在語音短時(shí)時(shí)域處理中的應(yīng)用 第4章語音信號(hào)的時(shí)域分析4.1概述語音信號(hào)語音信號(hào)攜帶各種信息:攜帶各種信息:男聲男聲、女聲女聲,喜喜、怒怒,中中、英英等。等。不同場合感興趣的信息不同;不同場合感興趣的信息不同; 判斷信號(hào)是否為判斷信號(hào)是否為語音語音,只需人類語音信號(hào)的,只需人類語音信號(hào)的一般特征一般特征; 區(qū)分語音為區(qū)分語音為清、濁音清、濁音,需語音,需語音能量譜能量譜和和基頻基頻; 數(shù)字傳輸或數(shù)字存
2、儲(chǔ)時(shí),目的數(shù)字傳輸或數(shù)字存儲(chǔ)時(shí),目的不同不同,保留信息精度,保留信息精度不同不同;語音信號(hào)處理語音信號(hào)處理的的任務(wù)任務(wù): 去除去除與應(yīng)用目的不相干或影響不大的語音信息與應(yīng)用目的不相干或影響不大的語音信息 需要的信息不僅應(yīng)當(dāng)提取出來,有時(shí)還需要需要的信息不僅應(yīng)當(dāng)提取出來,有時(shí)還需要加強(qiáng)加強(qiáng)。以上涉及語音信號(hào)中,各種信息的以上涉及語音信號(hào)中,各種信息的表示問題表示問題。表示方法的原則:表示方法的原則:最方便最方便、最有效最有效。短時(shí)分析短時(shí)分析技術(shù)技術(shù)貫穿于貫穿于語音分析的全過程。語音分析的全過程。第4章語音信號(hào)的時(shí)域分析 4.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院 - 2 - 趙曉群 教授整體的語音信
3、號(hào)來講,分析出的是由每一幀特征參數(shù)組成的特整體的語音信號(hào)來講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時(shí)間序列。征參數(shù)時(shí)間序列。語音信號(hào)分析語音信號(hào)分析:時(shí)域分析時(shí)域分析、頻域分析頻域分析、倒頻域分析倒頻域分析等;等;語音信號(hào)分析語音信號(hào)分析:模型分析模型分析、非模型分析非模型分析;模型分析法是指依據(jù)語音信號(hào)產(chǎn)生的數(shù)學(xué)模型,來分析和提取模型分析法是指依據(jù)語音信號(hào)產(chǎn)生的數(shù)學(xué)模型,來分析和提取表征這些模型的表征這些模型的特征參數(shù)特征參數(shù),模型分析:模型分析:共振峰分析共振峰分析、無損級(jí)聯(lián)聲管分析法無損級(jí)聯(lián)聲管分析法非模型分析:非模型分析:不進(jìn)行模型化的分析不進(jìn)行模型化的分析語音的預(yù)處理語音的預(yù)處理
4、:語音信號(hào)的:語音信號(hào)的數(shù)字化數(shù)字化、語音信號(hào)的、語音信號(hào)的端點(diǎn)檢測端點(diǎn)檢測、 預(yù)加重預(yù)加重、加窗加窗、分幀分幀等,等,本章重點(diǎn):本章重點(diǎn):語音信號(hào)的各種時(shí)域分析技術(shù),是語音處理技術(shù)語音信號(hào)的各種時(shí)域分析技術(shù),是語音處理技術(shù) 的基礎(chǔ)知識(shí)。的基礎(chǔ)知識(shí)。第4章語音信號(hào)的時(shí)域分析 4.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院 - 3 - 趙曉群 教授第4章語音信號(hào)的時(shí)域分析4.2語音信號(hào)的數(shù)字化和預(yù)處理 信號(hào)數(shù)字化:信號(hào)數(shù)字化:放大放大、增益控制增益控制、反混疊濾波反混疊濾波、取樣取樣、 A/D變換變換及及編碼編碼(PCM編碼編碼););預(yù)處理:預(yù)處理:預(yù)加重預(yù)加重、加窗加窗、分幀分幀、端點(diǎn)檢測端點(diǎn)檢測等;
5、等;圖圖4.1:語音信號(hào)數(shù)字語音信號(hào)數(shù)字分析分析或或處理處理的的系統(tǒng)框圖系統(tǒng)框圖。第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 4 - 趙曉群 教授圖圖4.1語音信號(hào)數(shù)字處理系統(tǒng)框圖語音信號(hào)數(shù)字處理系統(tǒng)框圖反混疊濾波反混疊濾波語音輸入語音輸入語音輸出語音輸出A/D轉(zhuǎn)換轉(zhuǎn)換分析處理分析處理平滑濾波平滑濾波D/A轉(zhuǎn)換轉(zhuǎn)換合成處理合成處理傳輸或存儲(chǔ)傳輸或存儲(chǔ) 4.2.1預(yù)濾波、取樣、預(yù)濾波、取樣、A/D變換變換 預(yù)濾波:預(yù)濾波:帶通濾波器帶通濾波器(上、下(上、下截止頻率截止頻率為為fH、fL) 防混疊濾波防混疊濾波,抑制,抑制fs/2的輸入信號(hào)分量(的輸
6、入信號(hào)分量(fs為取樣頻率)為取樣頻率) 抑制工頻干擾抑制工頻干擾(50 Hz電源)。電源)。多數(shù)多數(shù)語音編語音編/ /譯碼器:譯碼器: fH = 3.4kHz, fL = 60100Hz,fs= 8kHz。語音識(shí)別:語音識(shí)別:對(duì)對(duì)電話用戶電話用戶指標(biāo)與語音編指標(biāo)與語音編/譯碼器時(shí)相同;譯碼器時(shí)相同; 要求較高或很高:要求較高或很高: fH=4.5 or 8kHz, fL=60Hz, fs = 10 or 20kHz。A/D變換需對(duì)信號(hào)變換需對(duì)信號(hào)量化量化,編碼為,編碼為二進(jìn)制二進(jìn)制,產(chǎn)生,產(chǎn)生量化誤差量化誤差。量化誤差量化誤差(量化噪聲量化噪聲):):量化信號(hào)值量化信號(hào)值與與原信號(hào)值原信號(hào)值
7、之差;之差;信號(hào)波形的變化信號(hào)波形的變化足夠大足夠大或量化或量化間隔足夠小間隔足夠小時(shí),時(shí), 量化噪聲符合具有下列特征的統(tǒng)計(jì)模型:量化噪聲符合具有下列特征的統(tǒng)計(jì)模型: 量化噪聲是量化噪聲是平穩(wěn)的白噪聲平穩(wěn)的白噪聲過程;過程; 量化噪聲與輸入信號(hào)量化噪聲與輸入信號(hào)不相關(guān)不相關(guān); 量化噪聲在量化間隔內(nèi)量化噪聲在量化間隔內(nèi)均勻分布均勻分布,即具有,即具有等概率密度分布等概率密度分布。同濟(jì)大學(xué)電子與信息工程學(xué)院 - 5 - 趙曉群 教授第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 量化信噪比量化信噪比SNR(信號(hào)與量化噪聲的功率比)為:(信號(hào)與量化噪聲的功率比)為: 式中,式中, 輸入輸入
8、語音信號(hào)序列語音信號(hào)序列的的方差方差, 噪聲序列噪聲序列的的方差方差, 信號(hào)的信號(hào)的峰峰- -峰值峰值, B量化字長量化字長,設(shè)語音信號(hào)的幅度服從設(shè)語音信號(hào)的幅度服從Laplace分布分布,則,則 取取 , 上式改寫為:上式改寫為:B=7 bit,SNR=35 dB,能,能滿足一般滿足一般通信系統(tǒng)的要求。通信系統(tǒng)的要求。語音波形的語音波形的動(dòng)態(tài)范圍動(dòng)態(tài)范圍達(dá)達(dá)55 dB,故,故B應(yīng)取應(yīng)取10 bit以上。以上。為保持為保持35 dB的的信噪比信噪比,常用,常用12 bit量化量化,附加的,附加的5 bit用于用于補(bǔ)償補(bǔ)償30 dB左右的輸入左右的輸入動(dòng)態(tài)動(dòng)態(tài)的變化。的變化。 同濟(jì)大學(xué)電子與信息
9、工程學(xué)院 - 6 - 趙曉群 教授2max10102(dB)10log6.024.7720logxexXSNRB2xmaxX2e(dB)6.027.2SNRB表明量化器中每表明量化器中每bit字長對(duì)字長對(duì)SNR的貢獻(xiàn)約為的貢獻(xiàn)約為6 dB 第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 max4xX(4)0.0035xp xA/D變換器:變換器:分為分為線性線性和和非線性非線性兩類。兩類。目前采用絕大部分的目前采用絕大部分的線性線性A/D變換器變換器是是12 bit。非線性非線性A/D變換器變換器一般是一般是8 bit,它與,它與12 bit線性變換器線性變換器等效等效。有時(shí)需要將非
10、線性的有時(shí)需要將非線性的8 bit碼轉(zhuǎn)換為線性的碼轉(zhuǎn)換為線性的12 bit碼。碼。數(shù)字化的數(shù)字化的反過程反過程是從數(shù)字化語音中是從數(shù)字化語音中重構(gòu)語音重構(gòu)語音波形。波形。必須在必須在D/A后加后加平滑濾波器平滑濾波器,對(duì)重構(gòu)的語音波形的高次諧波起,對(duì)重構(gòu)的語音波形的高次諧波起平滑作用,以平滑作用,以去除高次諧波去除高次諧波失真。失真。預(yù)濾波預(yù)濾波、取樣取樣、A/D和和D/A變換變換、平滑濾波平滑濾波等許多功能可以用等許多功能可以用一塊芯片一塊芯片完成,在市場上有多種這樣的完成,在市場上有多種這樣的集成芯片集成芯片供選用。供選用。同濟(jì)大學(xué)電子與信息工程學(xué)院 - 7 - 趙曉群 教授第4章語音信號(hào)
11、的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 4.2.2預(yù)處理預(yù)處理 預(yù)處理:預(yù)處理:預(yù)加重預(yù)加重、加窗加窗、分幀分幀、端點(diǎn)檢測端點(diǎn)檢測等;等;語音的一個(gè)特征:語音的一個(gè)特征:約約8 kHz高頻端按高頻端按-6 dB/倍頻程倍頻程跌落。跌落。預(yù)加重:預(yù)加重:提升提升語音的語音的高頻高頻部分,使信號(hào)的頻譜變得部分,使信號(hào)的頻譜變得平坦平坦, 可在可在反混疊濾波前反混疊濾波前,可,可壓縮動(dòng)態(tài)范圍壓縮動(dòng)態(tài)范圍,提高信噪比提高信噪比。 也可在也可在數(shù)字化后數(shù)字化后、參數(shù)分析之前參數(shù)分析之前。預(yù)加重預(yù)加重用用6 dB/倍頻程倍頻程的提升高頻特性的的提升高頻特性的預(yù)加重?cái)?shù)字濾波器預(yù)加重?cái)?shù)字濾波器: 式中,式
12、中,為為常系數(shù)常系數(shù),值接近于,值接近于1,通常取,通常取= 0.920.94?;謴?fù)恢復(fù)原信號(hào),對(duì)測量值進(jìn)行原信號(hào),對(duì)測量值進(jìn)行去加重去加重處理,處理, 即加上即加上-6 dB/倍頻程的下降的頻率特性來還原成原來的特性。倍頻程的下降的頻率特性來還原成原來的特性。 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 8 - 趙曉群 教授1( )1H zz 第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 4.2.3窗函數(shù)的作用窗函數(shù)的作用 采用采用連續(xù)分段連續(xù)分段或或交疊分段交疊分段的方法的方法分幀分幀,33 100幀幀/秒秒。圖圖4.2:幀移與幀長示例。幀移與幀長示例。幀與幀之間的信號(hào)平滑過渡,保持其連續(xù)
13、性。幀與幀之間的信號(hào)平滑過渡,保持其連續(xù)性。幀移:幀移:前后幀的前后幀的交疊部分交疊部分。幀移幀移與與幀長幀長的的比值比值一般為一般為01/2。移動(dòng)窗函數(shù)加權(quán)實(shí)現(xiàn):移動(dòng)窗函數(shù)加權(quán)實(shí)現(xiàn): x(n)為為語音信號(hào),語音信號(hào),w(n)為為窗函數(shù),窗函數(shù),sw(n)為為窗選語音信號(hào)窗選語音信號(hào)。 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 9 - 趙曉群 教授( )( ) ( )wxnx n w n圖圖4.2幀移與幀長的示例幀移與幀長的示例(N為幀長,為幀長,M為幀移為幀移)NNNMM 理想窗函數(shù)的頻率響應(yīng)有理想窗函數(shù)的頻率響應(yīng)有一個(gè)一個(gè)很窄的主瓣很窄的主瓣,它增加了頻,它增加了頻率的分辨度,而率的分辨度,而沒有旁
14、瓣沒有旁瓣。第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 討論討論窗函數(shù)窗函數(shù)的的形狀形狀和和長度長度的影響。的影響。 1. 窗函數(shù)的形狀窗函數(shù)的形狀好的窗函數(shù)的好的窗函數(shù)的標(biāo)準(zhǔn)標(biāo)準(zhǔn): 時(shí)域:減小時(shí)域:減小時(shí)間窗兩端的時(shí)間窗兩端的坡度坡度,使窗口兩端邊緣,使窗口兩端邊緣平滑過渡平滑過渡到到零到到零,減小減小語音幀的語音幀的截?cái)嘈?yīng)截?cái)嘈?yīng); 頻域:較寬頻域:較寬的的3 dB帶寬和帶寬和較小較小的邊帶最大值。的邊帶最大值。常用的常用的窗函數(shù)窗函數(shù)(窗長為(窗長為N):):(1) 矩形(矩形(rectangular)窗:)窗: (2) Hamming(漢明)窗:(漢明)窗:(3) Ha
15、nning(漢寧)窗:(漢寧)窗:同濟(jì)大學(xué)電子與信息工程學(xué)院 - 10 - 趙曉群 教授1;01( )0;nNw n其它20.540.46cos01( )10nnNw nN其他20.50.5cos01( )10nnNw nN其他第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 (4) Bartlett(巴特雷特)窗:(巴特雷特)窗: (5) Blackman(布累克曼)窗:(布累克曼)窗:(6) Kaiser(凱散)窗:(凱散)窗:式中,式中, 零階貝塞爾函數(shù)零階貝塞爾函數(shù), 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 11 - 趙曉群 教授20(1)/212( )2(1)/2110nnNNnw
16、nNnNN其他240.420.5cos0.08cos01( )110nnnNw nNN其他2002111( )01( )0nINw nnNI其他2020/2( )( !)kkxIxk第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 圖圖4.3、 4.4 :窗函數(shù)的波形窗函數(shù)的波形矩形窗矩形窗主瓣最窄主瓣最窄,頻率分辨度,頻率分辨度 最高最高,頻率,頻率泄漏最大泄漏最大; Blackman窗頻率分辨度窗頻率分辨度最低最低, 頻率頻率泄漏最小泄漏最小。常用常用矩形窗矩形窗、Hamming窗窗。同濟(jì)大學(xué)電子與信息工程學(xué)院 - 12 - 趙曉群 教授第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)
17、字化和預(yù)處理 圖圖4.3各種窗函數(shù)的時(shí)間波形各種窗函數(shù)的時(shí)間波形圖圖4.4各種窗的頻率響應(yīng)各種窗的頻率響應(yīng)Bartlett窗窗 矩形窗矩形窗Hamming窗窗 Blackman窗窗 Hanning窗窗 Kaiser窗窗 2. 窗口的長度窗口的長度 取樣周期取樣周期Ts = fs、窗口長度窗口長度N、頻率分辨率頻率分辨率f 的關(guān)系為:的關(guān)系為: Ts一定時(shí),一定時(shí), f 隨窗口隨窗口N增加增加而而減小減小, 即即f 提高提高,時(shí)間分辨率,時(shí)間分辨率降低降低。 如果窗口如果窗口取短取短,頻率分辨率,頻率分辨率下降下降,時(shí)間分辨率,時(shí)間分辨率提高提高。取樣周期和頻率分辨率取樣周期和頻率分辨率矛盾矛盾
18、,應(yīng)根據(jù)需要,應(yīng)根據(jù)需要選擇合適選擇合適的窗長。的窗長。時(shí)域分析:時(shí)域分析: N 很大,語音高頻受阻,短時(shí)能量變化很小,不能反映幅度變化;很大,語音高頻受阻,短時(shí)能量變化很小,不能反映幅度變化; N 太小,濾波器通帶寬,短時(shí)能量急劇變化,不能平滑能量函數(shù)。太小,濾波器通帶寬,短時(shí)能量急劇變化,不能平滑能量函數(shù)。通常一幀內(nèi)應(yīng)含有通常一幀內(nèi)應(yīng)含有1 7個(gè)基音周期。個(gè)基音周期?;糁芷谧兓?,從女性和兒童的基音周期變化大,從女性和兒童的2 ms到老年男子的到老年男子的14 ms10 kHz取樣時(shí),取樣時(shí),N 折衷選擇為折衷選擇為100 200點(diǎn)(點(diǎn)(10 20 ms)。)。分析條件:分析條件:(通常
19、需標(biāo)明,以提供性能評(píng)價(jià)參考依據(jù)) 取樣頻率、精度、預(yù)加重方式、窗函數(shù)、幀長、幀移取樣頻率、精度、預(yù)加重方式、窗函數(shù)、幀長、幀移等。等。 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 13 - 趙曉群 教授第4章語音信號(hào)的時(shí)域分析 4.2語音信號(hào)的數(shù)字化和預(yù)處理 1/sfNT 第4章語音信號(hào)的時(shí)域分析4.3短時(shí)能量和短時(shí)平均幅度 4.3.1短時(shí)能量短時(shí)能量語音的清音能量語音的清音能量較小較小,濁音能量,濁音能量較大較大。語音的能量分析主要語音的能量分析主要短時(shí)能量短時(shí)能量和和短時(shí)平均幅度短時(shí)平均幅度。n時(shí)刻時(shí)刻語音信號(hào)的語音信號(hào)的短時(shí)能量短時(shí)能量En為:為: 或或 式中,式中,h(n)=w2(n),可以看做濾
20、波器的,可以看做濾波器的沖激響應(yīng)函數(shù)沖激響應(yīng)函數(shù)。 En反映語音反映語音振幅振幅或或能量能量隨隨時(shí)間時(shí)間緩慢變化的緩慢變化的規(guī)律規(guī)律。窗函數(shù)窗函數(shù)或或?yàn)V波器濾波器的函數(shù)的函數(shù)形式形式和和寬度寬度對(duì)能量序列影響很大。對(duì)能量序列影響很大。選擇合適的選擇合適的窗函數(shù)窗函數(shù)或?yàn)V波器的或?yàn)V波器的沖激響應(yīng)函數(shù)沖激響應(yīng)函數(shù)和它們的和它們的寬度寬度。用得較多的是用得較多的是矩形窗矩形窗和和Hamming窗窗。第4章語音信號(hào)的時(shí)域分析 4.3短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院 - 14 - 趙曉群 教授122 ( ) () ( ) ()n Nnmm nEx m w nmx m w nm1222(
21、) ()( ) ()( )( )n Nnmm nExm h nmxm h nmxnh n 窗寬的影響:窗寬的影響:窗函數(shù)很寬窗函數(shù)很寬或或沖激響應(yīng)很長沖激響應(yīng)很長,平滑作用,平滑作用顯著顯著,使,使En變化不大,變化不大,反映不出語音能量的時(shí)變特性。反映不出語音能量的時(shí)變特性。窗函數(shù)過窄窗函數(shù)過窄,平滑作用,平滑作用有限有限,仍然保留,仍然保留瞬時(shí)瞬時(shí)快變化,使快變化,使En反映反映語音振幅細(xì)節(jié),表現(xiàn)不出振幅平方包絡(luò)的變化規(guī)律。語音振幅細(xì)節(jié),表現(xiàn)不出振幅平方包絡(luò)的變化規(guī)律。當(dāng)當(dāng)N小于語音基音周期時(shí),將按照基音周期內(nèi)語音振幅平方波小于語音基音周期時(shí),將按照基音周期內(nèi)語音振幅平方波形的形的細(xì)節(jié)細(xì)節(jié)
22、瞬時(shí)變化;瞬時(shí)變化;當(dāng)當(dāng)N比基音周期的若干倍還要大時(shí),各段語音的短時(shí)能量差別比基音周期的若干倍還要大時(shí),各段語音的短時(shí)能量差別不大,不能跟隨語音能量的時(shí)變特性。不大,不能跟隨語音能量的時(shí)變特性。這兩種情況都不能準(zhǔn)確描述語音能量自身的實(shí)際變化規(guī)律。這兩種情況都不能準(zhǔn)確描述語音能量自身的實(shí)際變化規(guī)律。必須選擇合適的窗寬,必須選擇合適的窗寬,兼顧男聲和女聲,兼顧男聲和女聲,10 kHz取樣時(shí),選取樣時(shí),選窗寬窗寬10 20 ms。第4章語音信號(hào)的時(shí)域分析 4.3短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院 - 15 - 趙曉群 教授 圖圖4.54.5:語音的語音的短時(shí)能量短時(shí)能量序列的序列的包絡(luò)
23、曲線包絡(luò)曲線。第4章語音信號(hào)的時(shí)域分析 4.3短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院 - 16 - 趙曉群 教授(a) 加矩形窗時(shí)加矩形窗時(shí) (b) 加加Hamming窗時(shí)窗時(shí)圖圖4.5語音語音“同舟共濟(jì)同舟共濟(jì)”的短時(shí)能量函數(shù)(的短時(shí)能量函數(shù)(10 kHz取樣)取樣)矩形窗比矩形窗比Hamming窗的平滑效果顯著窗的平滑效果顯著;隨著窗寬的增加,平滑效果越顯著;隨著窗寬的增加,平滑效果越顯著;從的包絡(luò)曲線可以清楚看出清音和濁音之間的從的包絡(luò)曲線可以清楚看出清音和濁音之間的區(qū)別區(qū)別和和分界點(diǎn)分界點(diǎn), 4.3.2短時(shí)平均幅度短時(shí)平均幅度En的計(jì)算是的計(jì)算是平方求和平方求和,計(jì)算量大;,
24、計(jì)算量大;平方運(yùn)算平方運(yùn)算擴(kuò)大擴(kuò)大了樣本間了樣本間差別差別,選窗寬擇帶來附加的困難。,選窗寬擇帶來附加的困難。須選擇較寬的窗,才能須選擇較寬的窗,才能較好地平滑較好地平滑平方幅度的起伏。平方幅度的起伏。為此,提出語音能量時(shí)變性質(zhì)的為此,提出語音能量時(shí)變性質(zhì)的另一個(gè)重要參數(shù)。另一個(gè)重要參數(shù)。n時(shí)刻時(shí)刻語音信號(hào)的語音信號(hào)的短時(shí)平均幅度短時(shí)平均幅度Mn為:為: 或或 式中,式中,h(n) = w(n)通常窗函數(shù)通常窗函數(shù)w(n)0 ,所以,所以h(n) = w(n)。 依據(jù)依據(jù)定義式定義式可導(dǎo)出多種的可導(dǎo)出多種的計(jì)算方法計(jì)算方法(略)(略)。共三種。共三種。第4章語音信號(hào)的時(shí)域分析 4.3短時(shí)能量和
25、短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院 - 17 - 趙曉群 教授1( ) ()( ) ()n Nnmm nMx m w nmx m w nm1( )()( )()( )( )n Nnmm nMx m h nmx m h nmx nh n 圖圖4.64.6:語音的語音的平均幅度平均幅度序列的序列的包絡(luò)曲線包絡(luò)曲線。第4章語音信號(hào)的時(shí)域分析 4.3短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院 - 18 - 趙曉群 教授(a) 加矩形窗時(shí)加矩形窗時(shí) (b) 加加Hamming窗時(shí)窗時(shí)圖圖4.6語音語音“同舟共濟(jì)同舟共濟(jì)”的短時(shí)平均幅度函數(shù)(的短時(shí)平均幅度函數(shù)(10 kHz取樣)取樣) 語音的語
26、音的平均幅度平均幅度與與短時(shí)能量短時(shí)能量具有相似的一些性質(zhì)具有相似的一些性質(zhì)矩形窗比矩形窗比Hamming窗的平滑效果顯著窗的平滑效果顯著;隨著窗寬的增加,平滑效果越顯著;隨著窗寬的增加,平滑效果越顯著;從的包絡(luò)曲線可以清楚看出清音和濁音之間的從的包絡(luò)曲線可以清楚看出清音和濁音之間的區(qū)別區(qū)別和和分界點(diǎn)分界點(diǎn),比較比較En和和Mn(比較比較圖圖4.6與與4.5 ):):短時(shí)平均幅度的差別沒有它們的短時(shí)能量的差別那么顯著;短時(shí)平均幅度的差別沒有它們的短時(shí)能量的差別那么顯著;清音的短時(shí)平均幅度比短時(shí)能量有所提高。清音的短時(shí)平均幅度比短時(shí)能量有所提高。En和和Mn的主要用途:的主要用途: 區(qū)分語音的區(qū)
27、分語音的清音段清音段與與濁音段濁音段; 區(qū)分區(qū)分聲母聲母與與韻母韻母; 無聲無聲與與有聲有聲的的分界分界; 作為一種作為一種超音段信息超音段信息用于語音識(shí)別。用于語音識(shí)別。 第4章語音信號(hào)的時(shí)域分析 4.3短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院 - 19 - 趙曉群 教授第4章語音信號(hào)的時(shí)域分析4.4短時(shí)平均過零率和上升過零間隔 4.4.1短時(shí)平均過零率短時(shí)平均過零率離散信號(hào)離散信號(hào)相鄰樣本相鄰樣本取取不同符號(hào)不同符號(hào)時(shí),稱為出現(xiàn)了時(shí),稱為出現(xiàn)了過零現(xiàn)象過零現(xiàn)象。過零率:過零率:單位時(shí)間過零的次數(shù)。單位時(shí)間過零的次數(shù)。窄帶離散信號(hào)窄帶離散信號(hào)的的過零率過零率較準(zhǔn)確地度量了信號(hào)的較準(zhǔn)確
28、地度量了信號(hào)的頻率特性頻率特性。寬帶離散信號(hào)寬帶離散信號(hào)的的過零率過零率只能粗略地反映信號(hào)的只能粗略地反映信號(hào)的頻譜特性頻譜特性。語音信號(hào)語音信號(hào)是是寬帶寬帶、緩時(shí)變信號(hào)緩時(shí)變信號(hào),其頻譜特性隨時(shí)間變化。,其頻譜特性隨時(shí)間變化。語音信號(hào)的語音信號(hào)的短時(shí)過零率短時(shí)過零率粗略地表征語音信號(hào)的粗略地表征語音信號(hào)的頻譜特性頻譜特性。語音信號(hào)的語音信號(hào)的過零率序列過零率序列能夠描述:能夠描述: 語音序列的語音序列的清音清音和和濁音濁音、無聲無聲與與有聲有聲等特征,等特征, 在語音分析中有在語音分析中有重要應(yīng)用重要應(yīng)用。第4章語音信號(hào)的時(shí)域分析 4.4短時(shí)平均過零率和上升過零間隔 同濟(jì)大學(xué)電子與信息工程學(xué)
29、院 - 20 - 趙曉群 教授n時(shí)刻時(shí)刻語音信號(hào)的語音信號(hào)的短時(shí)平均過零率短時(shí)平均過零率Zn為:為: 式中,式中,上式的上式的物理意義物理意義: 當(dāng)相鄰兩個(gè)樣本符號(hào)當(dāng)相鄰兩個(gè)樣本符號(hào)相同相同時(shí),時(shí),不產(chǎn)生不產(chǎn)生過零;過零; 當(dāng)相鄰兩個(gè)樣本符號(hào)當(dāng)相鄰兩個(gè)樣本符號(hào)相反相反時(shí),時(shí),產(chǎn)生產(chǎn)生一次過零。一次過零。第4章語音信號(hào)的時(shí)域分析 4.4短時(shí)平均過零率和上升過零間隔 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 21 - 趙曉群 教授2222221sgn ( ) ()sgn (1) (1)21sgn( )sgn(1)()21sgn( )sgn(1)( )2nmmZx m w nmx mw nmNx mx mw
30、nmNx nx nw nN21;011;0( ),sgn.0;1;0nNxw nxx其它圖圖4.7:語音的語音的短時(shí)平均過零率短時(shí)平均過零率的的包絡(luò)曲線包絡(luò)曲線。濁音頻譜主要集中在濁音頻譜主要集中在3 kHz以下低頻區(qū)域,超過以下低頻區(qū)域,超過4 kHz后頻譜幅后頻譜幅度迅速下降;而清音頻譜幅度在超過度迅速下降;而清音頻譜幅度在超過4 kHz后反而呈上升趨勢,后反而呈上升趨勢,甚至超過甚至超過8 kHz后頻譜幅度仍然很大。后頻譜幅度仍然很大。這表明清音頻譜主要集中在高頻區(qū)域。這表明清音頻譜主要集中在高頻區(qū)域。短時(shí)平均過零率粗略地描述了語音信短時(shí)平均過零率粗略地描述了語音信 號(hào)的頻譜特性,并可用
31、于區(qū)分濁音和號(hào)的頻譜特性,并可用于區(qū)分濁音和 清音。清音。例例: 圖圖4.7中短時(shí)平均過零率高的區(qū)段中短時(shí)平均過零率高的區(qū)段 對(duì)應(yīng)清音,過零率低的區(qū)段對(duì)應(yīng)濁音。對(duì)應(yīng)清音,過零率低的區(qū)段對(duì)應(yīng)濁音。但是,僅用過零率的高低區(qū)分清音和但是,僅用過零率的高低區(qū)分清音和 濁音并不很準(zhǔn)確,因?yàn)槟承┣逡艉蜐釢嵋舨⒉缓軠?zhǔn)確,因?yàn)槟承┣逡艉蜐?音的短時(shí)平均過零率的數(shù)值相差不多。音的短時(shí)平均過零率的數(shù)值相差不多。 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 22 - 趙曉群 教授第4章語音信號(hào)的時(shí)域分析 4.4短時(shí)平均過零率和上升過零間隔 圖圖4.7語音語音“同舟共濟(jì)同舟共濟(jì)”的短時(shí)的短時(shí)平平 均過零率曲線(均過零率曲線(10
32、 kHz取樣)取樣)(a) 原始語音波形原始語音波形(b) 平均過零率平均過零率圖圖4.8:清音清音和和濁音濁音每每10 ms內(nèi)內(nèi)過零數(shù)過零數(shù)的的概率分布曲線概率分布曲線。清音:清音:10 ms過零數(shù)為過零數(shù)為49的的概率最大概率最大,大體上顯,大體上顯正態(tài)分布正態(tài)分布。濁音:濁音:10 ms過零數(shù)為過零數(shù)為14的的概率最大概率最大,也大致呈,也大致呈正態(tài)分布正態(tài)分布。濁音濁音和和清音清音每每10 ms過零數(shù)為過零數(shù)為24左右的概率左右的概率幾乎是相等的幾乎是相等的,因,因而憑著這類數(shù)值就而憑著這類數(shù)值就很難區(qū)分很難區(qū)分濁音和清音。濁音和清音。規(guī)定一個(gè)規(guī)定一個(gè)噪聲門限噪聲門限:樣本樣本超過超過
33、門限門限正值正值,認(rèn)為是,認(rèn)為是正正并賦值,并賦值,樣本樣本低于低于門限門限負(fù)值負(fù)值,認(rèn)為是,認(rèn)為是負(fù)負(fù)并賦值,并賦值,界于界于門限門限正負(fù)值正負(fù)值間,認(rèn)為是間,認(rèn)為是零零并賦值。并賦值。為準(zhǔn)確判定樣本的符號(hào),為準(zhǔn)確判定樣本的符號(hào),應(yīng)要求應(yīng)要求: 信號(hào)中信號(hào)中不含直流偏移不含直流偏移; 噪聲噪聲和電源和電源干擾干擾盡可能盡可能小??; 選擇合適的選擇合適的正負(fù)門限值正負(fù)門限值。同濟(jì)大學(xué)電子與信息工程學(xué)院 - 23 - 趙曉群 教授第4章語音信號(hào)的時(shí)域分析 4.4短時(shí)平均過零率和上升過零間隔 圖圖4.8過零率概率分布圖過零率概率分布圖清音清音 47 濁音濁音 0 10 20 30 40 50 60
34、 70 80每每10 ms內(nèi)的過零分布內(nèi)的過零分布14 4.4.2短時(shí)上升過零間隔短時(shí)上升過零間隔 短時(shí)平均過零率:短時(shí)平均過零率:描述復(fù)雜波形描述復(fù)雜波形“頻率頻率”特征的一個(gè)參數(shù)。特征的一個(gè)參數(shù)。短時(shí)平均上升過零間隔:短時(shí)平均上升過零間隔:描述復(fù)雜波形描述復(fù)雜波形“周期周期”特性的參數(shù)。特性的參數(shù)。在一定的噪聲背景下,在一定的噪聲背景下,過零間隔過零間隔參數(shù)具有很好的頑健性,對(duì)不參數(shù)具有很好的頑健性,對(duì)不同的語音具有很好的差異性同的語音具有很好的差異性 上升過零點(diǎn)時(shí)間上升過零點(diǎn)時(shí)間RZCT:當(dāng)前信號(hào)波形樣本:當(dāng)前信號(hào)波形樣本大于大于或或等于零等于零,而,而其前一點(diǎn)樣本其前一點(diǎn)樣本小于零小于
35、零。上升過零間隔上升過零間隔RZCI:上升過零間隔次數(shù)序列上升過零間隔次數(shù)序列:將各種語音得到的統(tǒng)計(jì)出各種長度的:將各種語音得到的統(tǒng)計(jì)出各種長度的間隔出現(xiàn)的次數(shù),由此可以得到上升過零間隔次數(shù)序列。間隔出現(xiàn)的次數(shù),由此可以得到上升過零間隔次數(shù)序列。第4章語音信號(hào)的時(shí)域分析 4.4短時(shí)平均過零率和上升過零間隔 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 24 - 趙曉群 教授( )( )(1),1,2,RZCI iRZCT iRZCT iiN第4章語音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 4.5.1短時(shí)自相關(guān)函數(shù)短時(shí)自相關(guān)函數(shù)自相關(guān)函數(shù)自相關(guān)函數(shù)用于衡量信號(hào)自身用于衡量信號(hào)自身時(shí)間波形時(shí)間波
36、形的的相似性相似性。清音清音和和濁音濁音的的發(fā)聲機(jī)理發(fā)聲機(jī)理不同,不同,波形波形上存在較大的上存在較大的差異差異。 濁音濁音的時(shí)間波形呈現(xiàn)的時(shí)間波形呈現(xiàn)準(zhǔn)周期性準(zhǔn)周期性,波形之間,波形之間相似性較好相似性較好; 清音清音的時(shí)間波形呈現(xiàn)的時(shí)間波形呈現(xiàn)隨機(jī)噪聲隨機(jī)噪聲的特性,樣本間的特性,樣本間相似性較差相似性較差。可以用短時(shí)自相關(guān)函數(shù)來可以用短時(shí)自相關(guān)函數(shù)來測度語音測度語音的的相似特性相似特性。時(shí)間離散的時(shí)間離散的確定信號(hào)確定信號(hào),自相關(guān)函數(shù)自相關(guān)函數(shù)的定義為:的定義為:隨機(jī)信號(hào)隨機(jī)信號(hào)或者或者周期信號(hào)周期信號(hào),自相關(guān)函數(shù)自相關(guān)函數(shù)的定義為:的定義為:第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函
37、數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 25 - 趙曉群 教授( )( ) ()mR kx m x mk1( )lim( ) ()21NmNNR kx m x mkN自相關(guān)函數(shù)具有以下性質(zhì):自相關(guān)函數(shù)具有以下性質(zhì): (1) 周期性:周期性:周期信號(hào)的自相關(guān)函數(shù)是周期函數(shù);周期信號(hào)的自相關(guān)函數(shù)是周期函數(shù); (2) 對(duì)稱性:對(duì)稱性:R(k) = R(-k) ; (3) 存在最大值:存在最大值:對(duì)所有對(duì)所有k,有,有R(0) R(k); (4) 對(duì)對(duì)確定信號(hào)確定信號(hào), R(0) = 信號(hào)能量信號(hào)能量; 對(duì)對(duì)隨機(jī)信號(hào)隨機(jī)信號(hào)或或周期信號(hào)周期信號(hào), R(0) = 平均功率平均功率。短時(shí)自
38、相關(guān)函數(shù)短時(shí)自相關(guān)函數(shù)為:為: 根據(jù)自相關(guān)函數(shù)的根據(jù)自相關(guān)函數(shù)的性質(zhì)性質(zhì)(2),得:,得: 令令hk(n) = w(n)w(n+k) ,上式改寫為:,上式改寫為:上式表明,可用上式表明,可用數(shù)字濾波器數(shù)字濾波器實(shí)現(xiàn)實(shí)現(xiàn)Rn(k)的計(jì)算。的計(jì)算。第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 26 - 趙曉群 教授( )( ) () () ()nmR kx m w nm x mk w nmk( )()( ) () () ()nnmR kRkx m x mk w nm w nkm( )( ) ()() ( ) ()( )nkkmR kx m x
39、mk h nmx n x nkh n實(shí)際往往不采用數(shù)字濾波器來實(shí)現(xiàn),而采用直接計(jì)算的方法實(shí)際往往不采用數(shù)字濾波器來實(shí)現(xiàn),而采用直接計(jì)算的方法令令 ,并,并 m 用代替用代替 ,且,且 , 由上式得:由上式得:考慮到考慮到有限窗寬有限窗寬N,上式改寫為:,上式改寫為:考查考查Rn(k)計(jì)算量:計(jì)算量: 乘法:乘法: 加法:加法: 計(jì)算量過大,需計(jì)算量過大,需改進(jìn)。改進(jìn)。改進(jìn)方法:改進(jìn)方法:DFT技術(shù),細(xì)節(jié)略。技術(shù),細(xì)節(jié)略。第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 27 - 趙曉群 教授mnm( ) ()( ) ()()nmR kx nm
40、w mx nmk w mkm()( )wmw m10( ) ()( ) ()()NknmR kx nm w mx nmk w mk 0()1KkMNNkNk 4.5.2語音信號(hào)的短時(shí)自相關(guān)函數(shù)語音信號(hào)的短時(shí)自相關(guān)函數(shù) 圖圖4.9:語音語音的的短時(shí)自相關(guān)函數(shù)曲線短時(shí)自相關(guān)函數(shù)曲線,特點(diǎn):,特點(diǎn): 明顯反映明顯反映濁音濁音信號(hào)信號(hào)的的周期性周期性;例:例:周期周期72點(diǎn)點(diǎn),9 ms或或110 Hz 清音清音沒有沒有周期性周期性,其性質(zhì)其性質(zhì)類似于噪聲類似于噪聲; 窗函數(shù)窗函數(shù)有影響。有影響。矩形窗矩形窗時(shí),濁音的自相關(guān)函數(shù)周期性明顯;時(shí),濁音的自相關(guān)函數(shù)周期性明顯; 短時(shí)自相關(guān)函數(shù)的短時(shí)自相關(guān)函數(shù)
41、的幅度幅度是一個(gè)是一個(gè)逐漸衰減逐漸衰減的曲線。的曲線。第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 28 - 趙曉群 教授(a) 濁音濁音 (b) 清音清音圖圖4.9語音的短時(shí)自相關(guān)函數(shù)(語音的短時(shí)自相關(guān)函數(shù)(10 kHz取樣,窗長取樣,窗長320)語音波形語音波形窗函數(shù)窗函數(shù)長度長度對(duì)短時(shí)自相關(guān)函數(shù)有對(duì)短時(shí)自相關(guān)函數(shù)有重要影響重要影響;一般要求,窗長大于一般要求,窗長大于兩倍兩倍的基音周期為好。的基音周期為好。圖圖4.10:不同不同矩形窗長時(shí)的短時(shí)自相關(guān)函數(shù)矩形窗長時(shí)的短時(shí)自相關(guān)函數(shù) 為反映語音的為反映語音的周期性周期性,長窗長窗有利;有
42、利; 為反映語音的為反映語音的時(shí)變性時(shí)變性,短窗短窗有利;有利; 可采用可采用修正的修正的短時(shí)自相關(guān)函數(shù),折中處理。短時(shí)自相關(guān)函數(shù),折中處理。第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 29 - 趙曉群 教授圖圖4.10不同矩形窗長時(shí)的短時(shí)不同矩形窗長時(shí)的短時(shí)自相關(guān)函數(shù)(自相關(guān)函數(shù)(10 kHz取樣)取樣) 4.5.3修正的短時(shí)自相關(guān)函數(shù)修正的短時(shí)自相關(guān)函數(shù) 修正的短時(shí)自相關(guān)函數(shù)修正的短時(shí)自相關(guān)函數(shù)定義為:定義為: 或或 式中,式中, K最大的延遲最大的延遲,保證保證計(jì)算任何計(jì)算任何k時(shí),執(zhí)行時(shí),執(zhí)行N次乘累加運(yùn)算次乘累加運(yùn)算矩形窗時(shí)矩形
43、窗時(shí),計(jì)算式可,計(jì)算式可簡化簡化為:為: 是兩個(gè)不同有限長度語音段和的是兩個(gè)不同有限長度語音段和的互相關(guān)函數(shù)互相關(guān)函數(shù)。 不滿足不滿足對(duì)稱性;但對(duì)稱性;但有周期性,有周期性,幅度幅度不下降不下降。第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 30 - 趙曉群 教授12( )( )() ()()nmR kx m w nm x mk w nmk12( )()( ) ()()nmR kx nm w m x nmk w mk121,01,0( );( )0,0,mNmNKw mw m其它其它10( )() (),0NnmR kx nm x nmkk
44、K( )nR k( )nR k圖圖4.11:修正短時(shí)自相關(guān)函數(shù)的曲線修正短時(shí)自相關(guān)函數(shù)的曲線 基音周期基音周期最大值最大值為為Tmax,則,則 的兩段分別只需為的兩段分別只需為Tmax和和2Tmax ,可正確求取基音周期;,可正確求取基音周期; N 值較大時(shí),隨值較大時(shí),隨 k 增大,增大, 峰值峰值有所下降有所下降; 若信號(hào)為若信號(hào)為周期沖激串周期沖激串時(shí),則所有的峰值時(shí),則所有的峰值同幅度同幅度。第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 31 - 趙曉群 教授圖圖4.11不同矩形窗長時(shí)的修正短時(shí)不同矩形窗長時(shí)的修正短時(shí)自相關(guān)函數(shù)(自
45、相關(guān)函數(shù)(10 kHz取樣)取樣)( )nR k( )nR k 4.5.4短時(shí)平均幅度差函數(shù)短時(shí)平均幅度差函數(shù)短時(shí)自相關(guān)函數(shù)是語音信號(hào)時(shí)域分析的重要參量。短時(shí)自相關(guān)函數(shù)是語音信號(hào)時(shí)域分析的重要參量。自相關(guān)函數(shù)的運(yùn)算量大。原因:自相關(guān)函數(shù)的運(yùn)算量大。原因:乘法乘法運(yùn)算時(shí)間較長。運(yùn)算時(shí)間較長。避免乘法,引入避免乘法,引入短時(shí)平均幅度差短時(shí)平均幅度差函數(shù)函數(shù) 短時(shí)平均幅度差函數(shù)短時(shí)平均幅度差函數(shù)定義為:定義為:式中,式中,w1(m)和和w2(m)是窗函數(shù),是窗函數(shù), 當(dāng)窗的寬度選為當(dāng)窗的寬度選為 N 時(shí),上式為:時(shí),上式為: 若信號(hào)有若信號(hào)有周期性周期性,在,在 時(shí)將出現(xiàn)時(shí)將出現(xiàn)極小值極小值。 Np
46、是周期是周期 的性質(zhì)的性質(zhì)類似于類似于自相關(guān)函數(shù);自相關(guān)函數(shù);第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 32 - 趙曉群 教授12( )()( )()()nmF kx nm w mx nmk w mk10( )()()NknmF kx nmx nmk , 2,ppkNN ( )nF k圖圖4.12:周期性語音的周期性語音的Rn(k)和和Fn(k) 特點(diǎn):特點(diǎn):周期性信號(hào),周期性信號(hào),F(xiàn)n(k)是在周期是在周期 的的整數(shù)倍點(diǎn)整數(shù)倍點(diǎn)上有上有谷值谷值, 而而不是不是峰值。峰值。 可以證明可以證明Rn(k)和和Fn(k)有有密切關(guān)系密切關(guān)系,
47、 其關(guān)系為:其關(guān)系為: 式中,式中, 。計(jì)算計(jì)算Fn(k)只需只需加法加法、減法減法和和取絕對(duì)值取絕對(duì)值的運(yùn)算;的運(yùn)算;與與Rn(k)的的加法加法和和乘法乘法相比,其運(yùn)算量大大相比,其運(yùn)算量大大減少減少;用硬件實(shí)現(xiàn)語音信號(hào)分析時(shí)有很大好處。用硬件實(shí)現(xiàn)語音信號(hào)分析時(shí)有很大好處。 Fn(k)已用于已用于許多實(shí)時(shí)語音處理系統(tǒng)中。許多實(shí)時(shí)語音處理系統(tǒng)中。 第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 33 - 趙曉群 教授圖圖4.12周期性語音的周期性語音的Rn(k)和和Fn(k)的的示例(示例(10 kHz取樣,窗長取樣,窗長320)( )nRk
48、( )nFk( )( ) 2(0)( )nnnF kkRR k( )0.6 1.0k圖圖4.13:平均幅度差函數(shù)平均幅度差函數(shù) 平均幅度差函數(shù)在濁音的基音周期上出現(xiàn)極小值,平均幅度差函數(shù)在濁音的基音周期上出現(xiàn)極小值, 在清音時(shí)沒有明顯的極小值。在清音時(shí)沒有明顯的極小值。 第4章語音信號(hào)的時(shí)域分析 4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù) 同濟(jì)大學(xué)電子與信息工程學(xué)院 - 34 - 趙曉群 教授(a) 濁音濁音 (b) 清音清音圖圖4.13語音的平均幅度差函數(shù)(語音的平均幅度差函數(shù)(10 kHz取樣,窗長取樣,窗長320)第4章語音信號(hào)的時(shí)域分析4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用 4.6.1語音端點(diǎn)檢測
49、語音端點(diǎn)檢測某些應(yīng)用要求:某些應(yīng)用要求:找出找出語音端點(diǎn)語音端點(diǎn),采集,采集真正語音真正語音,以減少以減少數(shù)據(jù)量數(shù)據(jù)量、運(yùn)算量運(yùn)算量、處理時(shí)間處理時(shí)間。 語音端點(diǎn)檢測:語音端點(diǎn)檢測:歸結(jié)為區(qū)別歸結(jié)為區(qū)別語音語音和和噪聲噪聲。若若SNR很高,則計(jì)算信號(hào)的很高,則計(jì)算信號(hào)的短時(shí)能量短時(shí)能量可區(qū)分可區(qū)分語音端點(diǎn)語音端點(diǎn)。實(shí)際應(yīng)用中難保證高信噪比,不能僅依靠短時(shí)能量來判別;實(shí)際應(yīng)用中難保證高信噪比,不能僅依靠短時(shí)能量來判別;某些語音端點(diǎn)判別會(huì)遇到特殊的困難:某些語音端點(diǎn)判別會(huì)遇到特殊的困難: 弱摩擦音弱摩擦音、弱爆破音弱爆破音、鼻音鼻音時(shí),往往與時(shí),往往與背景噪聲電平背景噪聲電平相近。相近。 可補(bǔ)充利
50、用可補(bǔ)充利用短時(shí)平均過零率短時(shí)平均過零率Zn進(jìn)行判斷:因進(jìn)行判斷:因清音清音和以上所舉的和以上所舉的音素音素的的Zn比比背景噪聲背景噪聲的的Zn要要高數(shù)倍高數(shù)倍 。第4章語音信號(hào)的時(shí)域分析 4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用同濟(jì)大學(xué)電子與信息工程學(xué)院 - 35 - 趙曉群 教授兩級(jí)判決法:兩級(jí)判決法:用用En作作第一次第一次判別,再用判別,再用Zn作作第二次第二次判別。判別。第一級(jí)判別:第一級(jí)判別:采用采用雙門限比較雙門限比較的方法的方法(見圖(見圖4.14)。(1) 根據(jù)根據(jù)En取取較高門限較高門限M1 (En多在多在M1之上之上),進(jìn)行,進(jìn)行粗判粗判,語音,語音起止起止點(diǎn)點(diǎn)位于位于M1與與En包
51、絡(luò)交點(diǎn)對(duì)應(yīng)的包絡(luò)交點(diǎn)對(duì)應(yīng)的間隔之外間隔之外(即(即AB段之外)。段之外)。(2) 根據(jù)根據(jù)背景噪聲背景噪聲的的平均能量平均能量選取選取較低門限較低門限M2,從,從A點(diǎn)點(diǎn)往左往左、B點(diǎn)點(diǎn)往右往右搜索,分別找到搜索,分別找到En包絡(luò)包絡(luò)第一次與門限相交第一次與門限相交的的兩點(diǎn)兩點(diǎn)C和和D,于是于是CD段就是根據(jù)段就是根據(jù)En判定的判定的語音段語音段。第4章語音信號(hào)的時(shí)域分析 4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用同濟(jì)大學(xué)電子與信息工程學(xué)院 - 36 - 趙曉群 教授圖圖4.14語音端點(diǎn)的兩級(jí)判決法語音端點(diǎn)的兩級(jí)判決法EnM1M2 C A B D nZnM3 E F n第二級(jí)判決:第二級(jí)判決:從從C點(diǎn)點(diǎn)往左往
52、左、從、從D點(diǎn)點(diǎn)往右往右搜索,找到搜索,找到Zn第一次低于第一次低于某個(gè)門限某個(gè)門限M3的的兩點(diǎn)兩點(diǎn)E和和F,即為語音,即為語音起止點(diǎn)起止點(diǎn)。M3由由背景噪聲背景噪聲的平均的平均過零率過零率Zr確定,確定,一般取一般取M3 =(35)Zr 。M1 M2 M3需根據(jù)需根據(jù)實(shí)際語音實(shí)際語音數(shù)據(jù)選取;數(shù)據(jù)選?。豢捎枚虝r(shí)平均幅度可用短時(shí)平均幅度代替代替En。 4.6.2基音周期估計(jì)基音周期估計(jì)短時(shí)自相關(guān)函數(shù):短時(shí)自相關(guān)函數(shù):區(qū)分區(qū)分清音清音和和濁音濁音、估計(jì)、估計(jì)基音周期基音周期 特點(diǎn):特點(diǎn):用短時(shí)自相關(guān)函數(shù)估計(jì)基音周期時(shí),包含用短時(shí)自相關(guān)函數(shù)估計(jì)基音周期時(shí),包含多余信息多余信息。對(duì)策:對(duì)策:壓縮壓縮
53、與基頻無關(guān)的與基頻無關(guān)的信息信息,即進(jìn)行適當(dāng)處理,即進(jìn)行適當(dāng)處理 。方法:方法:低通濾波低通濾波、非線性濾波非線性濾波后,計(jì)算短時(shí)自相關(guān)函數(shù)。后,計(jì)算短時(shí)自相關(guān)函數(shù)。低通濾波:低通濾波:帶寬帶寬1 kHz。濾波后以。濾波后以2 kHz取樣頻率取樣,再以取樣頻率取樣,再以2 20 ms滯后逐幀計(jì)算短時(shí)自相關(guān)函數(shù),幀長滯后逐幀計(jì)算短時(shí)自相關(guān)函數(shù),幀長10 20 ms。理由:理由:一般一般基頻基頻500 Hz,女高音升,女高音升C調(diào)調(diào) 1 kHz。非線性濾波非線性濾波: :常采用常采用中心削波技術(shù)。中心削波技術(shù)。理由:理由:估計(jì)基頻僅用估計(jì)基頻僅用基頻處基頻處自相關(guān)峰,其余自相關(guān)峰,其余較低峰較低峰
54、是是多余多余的;的; 注:無關(guān)的峰是聲道對(duì)激勵(lì)脈沖產(chǎn)生的響應(yīng)?;糁芷诠烙?jì):可得到基頻基音周期估計(jì):可得到基頻隨時(shí)間變化隨時(shí)間變化的的軌跡軌跡 。第4章語音信號(hào)的時(shí)域分析 4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用同濟(jì)大學(xué)電子與信息工程學(xué)院 - 37 - 趙曉群 教授中心削波技術(shù):中心削波技術(shù):常用常用中心削波中心削波、三電平中心削波三電平中心削波兩種兩種。中心削波器特性中心削波器特性(見(見圖圖4.15 ) 削去削去聲道諧振聲道諧振產(chǎn)生的產(chǎn)生的阻尼振蕩阻尼振蕩,留下的序列包含,留下的序列包含基音基音信息信息; 削波電平削波電平的選取對(duì)于估計(jì)結(jié)果和計(jì)算復(fù)雜性有很大影響的選取對(duì)于估計(jì)結(jié)果和計(jì)算復(fù)雜性有很大影響; 有人提議
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 滌綸內(nèi)褲企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報(bào)告
- 二零二五年度企業(yè)內(nèi)部文員勞務(wù)服務(wù)協(xié)議范本
- 夜間燃脂膠囊行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 二零二五年度人工智能產(chǎn)業(yè)用工免責(zé)合同范本
- 二零二五年度新能源產(chǎn)業(yè)勞務(wù)輸出及技術(shù)研發(fā)合作協(xié)議
- 2025年度物業(yè)管理合同延期協(xié)議
- 2025年度環(huán)保工程融資合作協(xié)議
- 二零二五年度智能機(jī)器人研發(fā)中心員工勞動(dòng)服務(wù)協(xié)議
- 二零二五年度出租車公司運(yùn)營權(quán)及經(jīng)營權(quán)整體轉(zhuǎn)讓協(xié)議
- 離婚撫養(yǎng)權(quán)歸男方2025年度子女教育及生活費(fèi)用保障協(xié)議
- 流體輸送實(shí)訓(xùn)裝置操作規(guī)程
- 上市公司組織架構(gòu)策略
- extreme-sports 極限運(yùn)動(dòng) 英文 ppt
- 國際注冊建造師與項(xiàng)目管理師雙資格認(rèn)證
- 面癱護(hù)理查房
- 財(cái)政部金融企業(yè)不良資產(chǎn)批量轉(zhuǎn)讓管理辦法(財(cái)金[2012]6號(hào))
- 精品資料(2021-2022年收藏)建筑立面裝飾設(shè)計(jì)技術(shù)導(dǎo)則
- 倉庫管理警示標(biāo)語
- ISO9001質(zhì)量管理體系目錄結(jié)構(gòu)
- 5米對(duì)數(shù)視力表及E尺寸標(biāo)準(zhǔn)A4
- 十三五全國眼健康規(guī)劃(2016-2020年)終期自評(píng)報(bào)告
評(píng)論
0/150
提交評(píng)論