版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、概述語音信號(hào)的數(shù)字化和預(yù)處理語音信號(hào)的時(shí)域分析語音信號(hào)的頻域分析基間周期估計(jì)共振峰估計(jì)第三章 語音信號(hào)分析3.1 概述語音信號(hào)分析(提取表示語音信號(hào)特征的參數(shù)):短時(shí)分析技術(shù)特征參數(shù)均是隨時(shí)間而變化的-非平衡態(tài)過程在短時(shí)間范圍內(nèi)(10-30ms),其特性基本保持不變即相對(duì)穩(wěn)定,因而可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過程,即語音信號(hào)具有短時(shí)平穩(wěn)性。3.1 概述參數(shù)性質(zhì)的不同:時(shí)域分析頻域分析(倒頻域分析、線性預(yù)測分析)分析方法的不同:模型分析方法非模型分析方法3.2 語音信號(hào)的數(shù)字化和預(yù)處理語音信號(hào)分析的兩個(gè)步驟語音信號(hào)數(shù)字化:反混疊濾波、增益控制、采樣、A/D變換及編碼(PCM碼)預(yù)處理:一般包括預(yù)加重
2、、加窗和分幀等。帶通濾波器自動(dòng)增益控制 (AGC)模/數(shù)轉(zhuǎn)換(A/D)脈沖編碼調(diào)制(PCM)語音信號(hào)存入計(jì)算機(jī)數(shù)字化:預(yù)濾波 抑制語音信號(hào)中頻率超出fs/2的頻譜分量(fs為采樣頻率),防止混疊干擾。抑制50Hz的電源工頻干擾。預(yù)濾波器必須是一個(gè)帶通濾波器,設(shè)其上、下截止頻率分別是fH和fL:fH =3400Hz, fL=60-100Hz, fS=8kHz數(shù)字化:采樣、A/D變換數(shù)字化:采樣、A/D變換語音信號(hào)經(jīng)過預(yù)濾波和采樣后,由A/D變換器變換為二進(jìn)制數(shù)字碼。A/D要對(duì)信號(hào)進(jìn)行量化,不可避免地會(huì)產(chǎn)生誤差。量化后的信號(hào)值與原信號(hào)值之間的差值稱為量化誤差,又稱為量化噪聲。若信號(hào)波形的變化足夠大
3、,或量化間隔足夠小時(shí),量化噪聲符合具有下列特征: 是平穩(wěn)的白噪聲過程 量化噪聲與輸入信號(hào)不相關(guān) 量化噪聲在量化間隔內(nèi)均勻分布,即具有等概率密度分布數(shù)字化:采樣、A/D變換量化信噪比SNR(信號(hào)與量化噪聲的功率比):其中x2表示語音方差,2Xmax表示信號(hào)的峰值,B表示量化字長, e2表示噪聲方差。通常語音信號(hào)的幅度符合Laplacian分布,則表明量化器中的每bit字長對(duì)SNR的貢獻(xiàn)為6dB。預(yù)處理:預(yù)加重語音信號(hào)的平均功率譜受聲門激勵(lì)和口鼻輻射影響,預(yù)處理中要進(jìn)行預(yù)加重(Preemphasis)處理。其目的是提升高頻部分,使信號(hào)頻譜變得平坦,以便于頻譜分析或聲道參數(shù)分析。 預(yù)處理:分幀語音信
4、號(hào)預(yù)加重后,進(jìn)行加窗分幀處理。一般33-100s/幀。分幀可以采用連續(xù)分段,但一般要采用如交疊分段,這是為了使幀與幀之間平滑過渡,保持其連續(xù)性。前一幀和后一幀的交疊部分稱為幀移。幀移與幀長的比值一般取為0-1/2。預(yù)處理:分幀 預(yù)處理:加窗分幀加窗的過程:在時(shí)域用窗函數(shù)(n)對(duì)語音信號(hào)s(n)進(jìn)行截?cái)啵瑥亩纬杉哟靶盘?hào)s(n)=s(n)* (n)常用的窗函數(shù)是矩形窗和漢明窗(其中N為幀長):矩形窗:漢明窗:預(yù)處理:加窗窗函數(shù)的形狀和長度對(duì)短時(shí)參數(shù)特征影響很大1.窗口形狀時(shí)域:要減小時(shí)間窗兩端的坡度,使窗口邊緣兩端不引起急劇變化而平滑過渡到零,這樣可以使截取出的語音波形緩慢降為零,減小語音幀的截
5、斷效應(yīng);頻域:要有較窄的3dB帶寬以及較大的旁瓣衰減(較小的邊帶最大值)。這里只以典型的矩形窗和漢明窗為例進(jìn)行比較。預(yù)處理:加窗矩形窗與漢明窗的比較漢明窗的主瓣寬度比矩形窗大一倍,即帶寬約增加一倍,同時(shí)其帶外衰減也比矩形窗大一倍多,漢明窗比矩形窗更為合適。因此,對(duì)語音信號(hào)的短時(shí)分析來說,窗口的形狀是至關(guān)重要的。窗類型旁瓣峰值主瓣寬度最小阻帶衰減矩形窗-134/N-21漢明窗-418/N-53預(yù)處理:加窗預(yù)處理:加窗矩形窗、Hamming窗下信號(hào)功率譜的比較預(yù)處理:加窗預(yù)處理:加窗 2.窗口的長度 采樣周期Ts=1/fs,窗口長度N和頻率分辨率f之間存在下列關(guān)系:采樣率一定時(shí),f 隨窗口寬度N的
6、增加而減小,即頻率分辨率相應(yīng)得到提高窗口長,頻率分辨率高,時(shí)域分辨率降低窗口短,頻率分辨率低,時(shí)間分辨率提高預(yù)處理:加窗窗口長度的選擇,更重要的是要考慮語音信號(hào)的基音周期。通常認(rèn)為在一個(gè)語音幀內(nèi)應(yīng)包含17個(gè)基音周期。不同人的基音周期變化很大,從女性和兒童的2ms到老年男子的14ms(即基音頻率的變化范圍為50070Hz),所以N的選擇比較困難。通常在10kHz取樣頻率下,N折中選擇為100200點(diǎn)為宜(即1020ms持續(xù)時(shí)間)。數(shù)字化和預(yù)處理經(jīng)過數(shù)字化和預(yù)處理過程,語音信號(hào)就已經(jīng)被分割成一幀一幀的加過窗函數(shù)的短時(shí)平穩(wěn)信號(hào)對(duì)每一個(gè)短時(shí)語音幀,利用數(shù)字信號(hào)處理技術(shù)來提取語音特征參數(shù)。3.3 語音信
7、號(hào)的時(shí)域分析時(shí)域分析就是分析和提取語音信號(hào)的時(shí)域參數(shù),通常用于最基本的分析及應(yīng)用,如語音的分割、預(yù)處理、分類等,其特點(diǎn)表示語音信號(hào)比較直觀、物理意義明確。實(shí)現(xiàn)起來比較簡單、運(yùn)算量少??梢缘玫秸Z音的一些重要的參數(shù)。只使用示波器等通用設(shè)備,使用較為簡單等 1.短時(shí)能量及短時(shí)平均幅度分析語音波形時(shí)域信號(hào)為x(t)加窗分幀后的第n幀語音信號(hào)為xn(m)設(shè)第n幀語音信號(hào)xn(m)的短時(shí)能量用En表示,則其計(jì)算公式如下:1.短時(shí)能量及短時(shí)平均幅度分析En用于度量語音信號(hào)幅度值變化,其缺點(diǎn)是對(duì)高電平非常敏感(采用信號(hào)的平方)。可采用另一個(gè)度量語音信號(hào)幅度值變化的函數(shù),即短時(shí)平均幅度函數(shù)Mn:Mn用于表征一幀
8、語音信號(hào)能量大小,與En的區(qū)別在于計(jì)算時(shí)不會(huì)因?yàn)槿∑椒蕉斐奢^大差異。2.短時(shí)過零率分析短時(shí)過零率表示一幀語音中語音信號(hào)波形穿過橫軸(零電平)的次數(shù)。連續(xù)語音信號(hào),過零即意味著時(shí)域波形通過時(shí)間軸離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過零。過零率就是樣本改變符號(hào)的次數(shù)。定義語音信號(hào)xn(m)的短時(shí)過零率Zn為:式中,sgn是符號(hào)函數(shù),即2.短時(shí)過零率分析Zn可以從背景噪聲中找出語音信號(hào),可用于判斷寂靜無聲段和有聲段的起點(diǎn)和終點(diǎn)位置。在背景噪聲較小時(shí)用平均能量識(shí)別語音起止位置較為有效,而在背景噪聲較大時(shí)用平均過零率識(shí)別較為有效。對(duì)于一些特殊發(fā)音,只用其中一個(gè)參量來判別語音的起點(diǎn)和終點(diǎn)是有困難的,
9、必須同時(shí)使用這兩個(gè)參數(shù)。 3.短時(shí)相關(guān)分析相關(guān)分析有自相關(guān)和互相關(guān)之分。這里主要討論自相關(guān)函數(shù)。自相關(guān)函數(shù)的作用:濁音語音的基音周期估計(jì)。線性預(yù)測分析 3.短時(shí)相關(guān)分析1.短時(shí)自相關(guān)函數(shù)定義語音信號(hào)xn(m)的短時(shí)自相關(guān)函數(shù)Rn(k) :這里K是最大的延遲點(diǎn)數(shù)。短時(shí)自相關(guān)函數(shù)的性質(zhì):(1)如果xn(m)是周期的,則自相關(guān)函數(shù)是同周期(2)Rn(k)是偶函數(shù)(3) Rn(0)是最大值,且為確定信號(hào)的能量或隨機(jī)信號(hào)的功率。 3.短時(shí)相關(guān)分析 2.修正的短時(shí)自相關(guān)函數(shù)修正的短時(shí)自相關(guān)函數(shù)是用兩個(gè)長度不同的信號(hào)進(jìn)行乘積和,修正的短時(shí)自相關(guān)函數(shù)定義為 其中, 3.短時(shí)相關(guān)分析 2修正的短時(shí)自相關(guān)函數(shù) 4
10、.短時(shí)平均幅度差函數(shù)短時(shí)自相關(guān)函數(shù)是重要參量,其缺點(diǎn)是運(yùn)算量很大,其原因是乘法運(yùn)算所需要的時(shí)間較長。為了避免乘法,一個(gè)簡單的方法就是利用差值。為此常常采用另一種與自相關(guān)函數(shù)有類似作用的參量,即短時(shí)平均幅度差函數(shù)(AMDF)。平均幅度差函數(shù)能夠代替自相關(guān)函數(shù)進(jìn)行語音分析,是基于這樣一個(gè)事實(shí):如果信號(hào)是完全的周期信號(hào)(設(shè)周期為Np),則相距為周期的整數(shù)倍的樣點(diǎn)上的幅值是相等的,差值為零。 4.短時(shí)平均幅度差函數(shù)對(duì)于實(shí)際的語音信號(hào),差值不為零,但其值很小,這些極小值將出現(xiàn)在整數(shù)倍周期的位置上。為此,可定義短時(shí)平均幅度差函數(shù): 4.短時(shí)平均幅度差函數(shù)3.4 語音信號(hào)的頻域分析頻域分析就是分析語音信號(hào)的
11、頻域特征:語音信號(hào)的頻譜功率譜倒頻譜頻譜包絡(luò)分析常用的頻域分析方法:帶通濾波器組法傅里葉變換法線性預(yù)測法1.短時(shí)傅里葉變換對(duì)第n幀語音信號(hào)xn(m)進(jìn)行傅里葉變換(離散時(shí)域傅里葉變換,DTFT):語音信號(hào)的傅里葉變換,窗口函數(shù)不同,傅里葉變換的結(jié)果也將不同。1.短時(shí)傅里葉變換根據(jù)功率譜定義,短時(shí)功率譜與短時(shí)傅里葉變換之間的關(guān)系:或者:式中*表示復(fù)共軛運(yùn)算。并且功率譜Sn(ej)是短時(shí)自相關(guān)函數(shù)Rn(k)的傅里葉變換。2.倒譜分析語音信號(hào)的倒譜分析:求取語音倒譜特征參數(shù)的過程語音信號(hào)的解卷線性預(yù)測分析同態(tài)分析同態(tài)分析:也稱為同態(tài)濾波,將卷積關(guān)系變換為求和關(guān)系的分離處理。2.倒譜分析-同態(tài)處理許多
12、信號(hào)是乘積性信號(hào)或卷積性信號(hào),如語音信號(hào)、圖像信號(hào)、通信中的衰落信號(hào)、調(diào)制信號(hào)等,即非線性系統(tǒng)。同態(tài)信號(hào)處理就是將非線性問題轉(zhuǎn)化為線性問題的處理方法乘積同態(tài)處理卷積同態(tài)處理由于語音信號(hào)為聲門激勵(lì)和聲道沖擊響應(yīng)的卷積,這里僅討論卷積同態(tài)信號(hào)處理。2.倒譜分析-同態(tài)處理同態(tài)系統(tǒng)可分解為三個(gè)子系統(tǒng),即兩個(gè)特征子系統(tǒng)(只取決于信號(hào)的組合規(guī)則)和一個(gè)線性子系統(tǒng)(僅取決于處理的要求)。對(duì)于語音信號(hào),主要是第一個(gè)子系統(tǒng)D,完成將卷積性信號(hào)轉(zhuǎn)化為加性信號(hào)的運(yùn)算。2.倒譜分析-同態(tài)處理2.倒譜分析-同態(tài)處理第一個(gè)子系統(tǒng)D* 將卷積性信號(hào)轉(zhuǎn)化為加性信號(hào)的運(yùn)算,即對(duì)于信號(hào)x(n)=xl(n)*x2(n)進(jìn)行了如下運(yùn)
13、算處理:2.倒譜分析-同態(tài)處理復(fù)倒譜和倒譜D* 系統(tǒng)中的x(n)信號(hào)是時(shí)域序列,但其離散時(shí)域不同于x(n)的離散時(shí)域,稱之為“復(fù)倒頻譜域”。 x(n)是x(n)的“復(fù)倒頻譜”,簡稱為“復(fù)倒譜”,其英文原文為“Complex Cepstrum”,Cepstrum是一個(gè)新造的英文詞,是由Spectrum這個(gè)詞的前四個(gè)字母倒置而構(gòu)成的。2.倒譜分析-同態(tài)處理復(fù)倒譜和倒譜絕大多數(shù)信號(hào)系統(tǒng)而言,X(z),X(z) 的收斂域均包含單位圓,因而D*系統(tǒng)有如下形式:2.倒譜分析-同態(tài)處理X(n)傅里葉變換的對(duì)數(shù)形式為:即復(fù)數(shù)的對(duì)數(shù)仍是復(fù)數(shù)。注意,對(duì)數(shù)的虛部argX(ej)由于是X(ej)的相位,所以將產(chǎn)生不一
14、致性。2.倒譜分析-同態(tài)處理只考慮實(shí)部:顯然c(n)是x(n)對(duì)數(shù)幅度譜的傅里葉逆變換。c(n)稱為“倒頻譜”或簡稱為“倒譜”,量綱是時(shí)間。c(n)實(shí)際上就是語音信號(hào)倒譜特征。2.倒譜分析-同態(tài)處理復(fù)倒譜和倒譜特點(diǎn)和關(guān)系。復(fù)倒譜要進(jìn)行復(fù)對(duì)數(shù)運(yùn)算,而倒譜只進(jìn)行實(shí)對(duì)數(shù)運(yùn)算對(duì)于倒譜,一個(gè)序列經(jīng)過正逆兩個(gè)系統(tǒng)變換后,不能還原成自身,因?yàn)樾蛄械南辔恍畔G失。與復(fù)倒譜類似,如果c1(n)和c2(n)分別是x1(n)和x2(n)的倒譜,并且x(n)= x1(n)*x2(n),則x(n)的倒譜c(n)= c1(n)+c2(n) 。已知實(shí)數(shù)序列x(n)的復(fù)倒譜x(n),可以由x(n)求出倒譜c(n)。已知實(shí)數(shù)序
15、列x(n)的倒譜c(n),能否用它來求出復(fù)倒譜x(n)?2.倒譜分析-同態(tài)處理語音信號(hào)兩個(gè)卷積分量的復(fù)倒譜語音信號(hào)可看做是激勵(lì)信號(hào)和聲道響應(yīng)信號(hào)的卷積,因此下面將分別討論這兩個(gè)信號(hào)的復(fù)倒譜的性質(zhì)。2.倒譜分析-同態(tài)處理1.激勵(lì)信號(hào)清音的激勵(lì)是能量較小,頻譜均勻分布的白噪聲;濁音的門激勵(lì)是以基音為周期的沖激序列:其中M、r均為正整數(shù),r為幅度因子,Np為基音周期有限長的周期脈沖序列,其倒譜也是一個(gè)周期脈沖序列,且周期不變,只是序列變?yōu)闊o限長序列。倒譜振幅的衰減速度比原激勵(lì)信號(hào)快2.倒譜分析-同態(tài)處理2.聲道響應(yīng)序列倒譜是衰減序列。聲道脈沖的倒譜隨n增大而衰減的速度至少比1/n快。結(jié)論對(duì)于語音信號(hào)
16、而言,可以用“高時(shí)窗”從倒譜中提取濁音激勵(lì)信號(hào)的倒譜,從而提取出基音信號(hào)。2.倒譜分析-同態(tài)處理 1由同態(tài)分析求出的語音信號(hào)倒譜倒譜為頻譜模的自然對(duì)數(shù)的逆傅里葉變換(即設(shè)相位恒定為零)。設(shè)信號(hào)為s(n),則其倒譜為:語音信號(hào)s(n)是由聲門脈沖激勵(lì)e(n)經(jīng)聲道響應(yīng)v(n)濾波而得到:則在倒譜域有:2.倒譜分析-同態(tài)處理2.倒譜分析-同態(tài)處理 濁音倒譜2.倒譜分析-同態(tài)處理 清音倒譜2.倒譜分析-同態(tài)處理 2MEL頻率倒譜參數(shù)(MFCC)MFCC(Mel-Frequency Cepstral Coefficents,簡稱MFCC)的分析著眼于人耳的聽覺特性,因?yàn)?,人耳所聽到的聲音的高低與聲音的
17、頻率并不成線性正比關(guān)系,而用Mel頻率尺度則更符合人耳的聽覺特性。Mel頻率尺度,對(duì)應(yīng)于實(shí)際頻率的對(duì)數(shù)分布:2.倒譜分析-同態(tài)處理2.倒譜分析-同態(tài)處理濁音MFCC倒譜2.倒譜分析-同態(tài)處理清音MFCC倒譜3.線性預(yù)測分析線性預(yù)測分析的基本思想是:由于語音樣點(diǎn)之間存在相關(guān)性,可以用過去的樣點(diǎn)值來預(yù)測現(xiàn)在或未來的樣點(diǎn)值,即一個(gè)語音的抽樣能夠用過去若干個(gè)語音抽樣或它們的線性組合來逼近。通過使實(shí)際語音抽樣和線性預(yù)測抽樣之間的誤差在某個(gè)準(zhǔn)則下達(dá)到最小值來決定唯一的一組預(yù)測系數(shù)。這組預(yù)測系數(shù)就反映了語音信號(hào)的特性,可以作為語音信號(hào)特征參數(shù)用于語音識(shí)別、語音合成等。3.線性預(yù)測分析線性預(yù)測與語音數(shù)字模型關(guān)
18、系s(n)是生成的語音信號(hào),e(n)是激勵(lì)信號(hào),H(z)是生成模型:3.線性預(yù)測分析根據(jù)第二章關(guān)于語音信號(hào)的生成模型,聲道模型采用級(jí)聯(lián)(濁音-全極點(diǎn))、并聯(lián)(清音-零極點(diǎn))、混合型(濁音、清音)實(shí)際應(yīng)用中,濁音、清音均用全極點(diǎn)模型零極點(diǎn)模型可以用全極點(diǎn)模型進(jìn)行近似極點(diǎn)模型參數(shù)求解利用線性方程,計(jì)算復(fù)雜度低;而零極點(diǎn)模型參數(shù)求解采用非線性方程。3.線性預(yù)測分析全極點(diǎn)模型:時(shí)域形式:3.線性預(yù)測分析濁音,e(n)是周期性脈沖;清音,e(n)是白噪聲信號(hào)全極點(diǎn)模型就是估計(jì)參數(shù)ai,通常將下式稱為預(yù)測器:3.線性預(yù)測分析基本思想是:用過去p個(gè)樣點(diǎn)值來預(yù)測現(xiàn)在樣點(diǎn)值:預(yù)測誤差(n)為:3.線性預(yù)測分析通
19、常采用最小均方誤差準(zhǔn)則,即使預(yù)測誤差 (n)達(dá)到最小值的方法來決定線性預(yù)測系數(shù)ai(i=1,2,p)。3.線性預(yù)測分析均方誤差對(duì)aj求偏導(dǎo),并令其為零,有:3.線性預(yù)測分析 上式為Yule-Walker方程,等式左側(cè)是Toeplitz矩陣,可用萊文遜-杜賓Levinson-Durbin遞推算法來高效地求解。3.線性預(yù)測分析 LPC譜估計(jì)利用預(yù)測器系數(shù),就可以得到語音信號(hào)生成模型的頻率響應(yīng):在共振峰頻率上其頻率響應(yīng)特性會(huì)出現(xiàn)峰值,因此線性預(yù)測分析法又可以看做是一種短時(shí)譜估計(jì)法,其頻率響應(yīng)H(ej)即稱為LPC譜。3.線性預(yù)測分析LPC譜估計(jì)的特征:在譜峰值處,LPC譜和信號(hào)譜很接近譜谷底位置,則
20、相差比較大。對(duì)于諧波結(jié)構(gòu)的濁音語音譜來說,就是在諧波成分處LPC譜匹配信號(hào)譜的效果要遠(yuǎn)比諧波之間好得多。這一特點(diǎn)實(shí)際上來自均方誤差最小準(zhǔn)則。3.線性預(yù)測分析LPC譜估計(jì)的特征如果p選得很大,|H(ej)|精確地匹配于|S(ej)|,且極零模型也可用全極點(diǎn)模型來代替,但增加了計(jì)算量和存儲(chǔ)量p增加到一定程度以后,平方誤差的改善就很不明顯了,因此在語音信號(hào)處理中,p一般選在814之間。 3.線性預(yù)測分析線譜對(duì)(LSP)分析也是一種線性預(yù)測分析方法,只是它求解的模型參數(shù)是“線譜對(duì)”(Line Spectrum Pair,簡稱為LSP)。根據(jù)線性預(yù)測分析的ak系數(shù)構(gòu)成多項(xiàng)式,其多項(xiàng)式的零點(diǎn)頻率wi即為L
21、SP。LSP系數(shù)在構(gòu)成合成濾波器H(z)時(shí)容易保證其穩(wěn)定性,合成語音的數(shù)碼率也比用格型法求解時(shí)要低。 3.線性預(yù)測分析 3.線性預(yù)測分析濁音 3.線性預(yù)測分析濁音自相關(guān)和殘差信號(hào)自相關(guān)比較 3.線性預(yù)測分析清音 3.線性預(yù)測分析清音自相關(guān)和殘差信號(hào)自相關(guān)比較3.5 基音周期估計(jì)基音是指發(fā)濁音時(shí)聲帶振動(dòng)所引起的周期性,而基音周期是指聲帶振動(dòng)頻率的倒數(shù)基音周期是語音信號(hào)最重要的參數(shù)之一,它描述了語音激勵(lì)源的一個(gè)重要特征。漢語是一種有調(diào)語言,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息基音的提取和估計(jì)對(duì)漢語更是一個(gè)十分重要的問題。3.5 基音周期估計(jì)基音檢測算法:自相關(guān)函數(shù)(ACF)
22、法、峰值提取算法(PPA)、平均度差函數(shù)(AMDF)法倒譜法SIFT譜圖法小波法自相關(guān)法語音信號(hào)s(m)經(jīng)窗長為N的窗口截取為一段加窗信號(hào)Sn(m)后,定義Sn(m)的自相關(guān)函數(shù)為:Rn(k)不為零的范圍為是k=(-N+1)(N-1),且為偶函數(shù)。濁音信號(hào)的自相關(guān)函數(shù)在基音周期的整數(shù)倍位置上出現(xiàn)峰值;清音的自相關(guān)函數(shù)沒有明顯的峰值出現(xiàn)。因此檢測是否有峰值就可判斷是清音或濁音,檢測峰值的位置就可提取基音周期值。平均幅度差函數(shù)法(AMDF)語音信號(hào)的短時(shí)平均幅度差函數(shù)(AMDF) Fn(k)定義為:與短時(shí)自相關(guān)函數(shù)一樣,對(duì)周期性的濁音語音,F(xiàn)n(k)也呈現(xiàn)與濁音語音周期相一致的周期特性,不過不同的
23、是Fn(k)在周期的各個(gè)整數(shù)倍點(diǎn)上具有谷值特性而不是峰值特性,因而通過Fn(k)的計(jì)算同樣可以來確定基音周期。倒譜(CEP)法語音s(n)是由聲門脈沖激勵(lì)e(n)經(jīng)聲道響應(yīng)v(n)濾波而得,即:在倒譜域中則有:倒譜域中基音信息與聲道信息可以認(rèn)為是相對(duì)分離的。采取簡單的倒濾波方法可以分離并恢復(fù)出e(n)和v(n),根據(jù)激勵(lì)e(n)及其倒譜的特征可以求出基音周期。倒譜(CEP)法倒譜峰在過渡音和含噪語音中將變得不清晰甚至完全消失過渡音中周期激勵(lì)信號(hào)能量降低和類噪激勵(lì)信號(hào)干擾或含噪語音中的噪聲干擾所致。典型濁音語音的倒譜,其倒譜域中基音信息與聲道信息并不是完全分離的,在周期激勵(lì)信號(hào)能量較低的情況下,
24、聲道響應(yīng)(特別是其共振峰)對(duì)基音倒譜峰的影響就不可忽略。如果設(shè)法除去語音信號(hào)中的聲道響應(yīng)信息,對(duì)類噪激勵(lì)和噪聲加以適當(dāng)抑制,倒譜基音檢測算法的檢測結(jié)果將有所改善,特別對(duì)過渡語音的檢測結(jié)果將有明顯改善。 簡化逆濾波法(SIFT)簡化逆濾波跟蹤(SIFT)的基本思想是:語音信號(hào)進(jìn)行LPC分析和逆濾波,獲得語音信號(hào)的預(yù)測殘差,殘差信號(hào)通過自相關(guān)濾波器濾波,再作峰值檢測,進(jìn)而獲得基音周期。預(yù)測誤差是自相關(guān)器的輸入,通過與門限的比較可以確定濁音,通過輔助信息可以減少誤差。 簡化逆濾波法(SIFT)其工作過程為:語音信號(hào)經(jīng)過10kHz取樣后,通過0-900Hz的數(shù)字低通濾波,其目的是濾除聲道譜中聲道響應(yīng)部
25、分的影響,使峰值檢測更加容易。然后降低取樣率5倍(因?yàn)榧?lì)序列的寬度小于1 kHz,所以用2kHz取樣就足夠了);當(dāng)然,后面要進(jìn)行內(nèi)插。提取降低取樣率后的信號(hào)模型參數(shù)(LPC參數(shù)),檢測出峰值及其位置就得到基音周期值。最后進(jìn)行有/無聲判別。此處與倒譜法類似,有一個(gè)無聲檢測器,以減少運(yùn)算量。 簡化逆濾波法(SIFT) 小波變換法一個(gè)信號(hào)的小波變換具有這樣的性質(zhì):信號(hào)小波變換的極值點(diǎn)對(duì)應(yīng)于信號(hào)的銳變點(diǎn)或不連續(xù)點(diǎn)。濁音語是由氣流沖擊聲門,使聲門發(fā)生周期性的開啟或閉合。聲門的這種開啟與閉合,在語音信號(hào)中引起一個(gè)銳變。對(duì)語音信號(hào)作小波變換則其極值點(diǎn)對(duì)應(yīng)于聲門的開啟或閉合點(diǎn),相鄰極值點(diǎn)之距離就對(duì)應(yīng)著基音周
26、期。小波變換法 基音檢測的后處理無論采用哪一種基音檢測算法都可能產(chǎn)生基音檢測錯(cuò)誤,使求得的基音周期軌跡中有一個(gè)或幾個(gè)基音周期估值偏離了正常軌跡(通常是偏離到正常值的2倍或1/2),并稱這種偏離點(diǎn)為基音軌跡的“野點(diǎn)”。 基音檢測的后處理為了去除野點(diǎn),采用平滑算法,其中最常用的是中值平滑算法和線性平滑算法。1中值平滑處理在n0點(diǎn)的左右各取L個(gè)樣點(diǎn),共同構(gòu)成一組信號(hào)采樣值(共(2L+1)個(gè)樣值),然后將這(2L+1)個(gè)樣值按大小次序排成一隊(duì),取此隊(duì)列中的中間者作為平滑器的輸出。L值一般取為1或2,即中值平滑的“窗口”一般套住3或5個(gè)樣值,稱為3點(diǎn)或5點(diǎn)中值平滑。中值平滑的優(yōu)點(diǎn)是既可以有效地去除少量的
27、野點(diǎn),又不會(huì)破壞基音周期軌跡中兩個(gè)平滑段之間的階躍性變化。 基音檢測的后處理2.線性平滑處理線性平滑是用滑動(dòng)窗進(jìn)行線性濾波處理,即:其中(m),m = -L,-L+1,0,1,2,L為2L+1點(diǎn)平滑窗,滿足:例如三點(diǎn)窗的權(quán)值可取為,0.25。線性平滑在糾正輸入信號(hào)中不平滑處樣點(diǎn)值的同時(shí),也使附近各樣點(diǎn)的值做了修改。所以窗的長度加大雖然可以增強(qiáng)平滑的效果,但是也可能導(dǎo)致兩個(gè)平滑段之間階躍的模糊程度加重。以上兩種平滑技術(shù)可以結(jié)合起來使用。 基音檢測的后處理3組合平滑處理為了改善平滑的效果可以將兩個(gè)中值平滑串接,圖3-29a所示是將一個(gè)5點(diǎn)中值平滑和一個(gè)3點(diǎn)中值平滑串接.另一種方法是將中值平滑和線性平滑組合,如圖3-29b所示。為了使平滑的基音軌跡更貼近,還可以采用二次平滑的算法,全部算法的框圖如圖3-29
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 1.1 國家是什么(導(dǎo)學(xué)案) 高二政治 (統(tǒng)編版選擇性必修1)
- 2025年銷售傭金合同范本與業(yè)績激勵(lì)方案3篇
- 2025版木工行業(yè)培訓(xùn)與認(rèn)證服務(wù)合同范本4篇
- 2025年商業(yè)委托銷售協(xié)議
- 2025年合法住房公租房協(xié)議
- 二零二五年度駕校品牌推廣與市場拓展合作合同2篇
- 2025年度個(gè)人二手車轉(zhuǎn)讓及二手車增值服務(wù)合同3篇
- 二零二五年度林業(yè)苗木繁育基地承包合同4篇
- 二零二五年度集體產(chǎn)權(quán)房屋買賣合同樣本(含房屋產(chǎn)權(quán)調(diào)查及核實(shí)要求)
- 二零二五年度運(yùn)輸保險(xiǎn)合同匯編與風(fēng)險(xiǎn)保障方案
- 《醫(yī)院財(cái)務(wù)分析報(bào)告》課件
- 2025老年公寓合同管理制度
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級(jí)上冊(cè) 期末綜合卷(含答案)
- 2024中國汽車后市場年度發(fā)展報(bào)告
- 感染性腹瀉的護(hù)理查房
- 天津市部分區(qū)2023-2024學(xué)年高二上學(xué)期期末考試 物理 含解析
- 《人工智能基礎(chǔ)》全套英語教學(xué)課件(共7章)
- 廢鐵收購廠管理制度
- 物品賠償單范本
- 《水和廢水監(jiān)測》課件
- 滬教版六年級(jí)數(shù)學(xué)下冊(cè)課件【全冊(cè)】
評(píng)論
0/150
提交評(píng)論