




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 南京信息工程大學(xué) 實(shí)驗(yàn)(實(shí)習(xí))報(bào)告實(shí)驗(yàn)(實(shí)習(xí))名稱 基于matlab的lpc分析 實(shí)驗(yàn)(實(shí)習(xí))日期 2013.5.2 得分 _指導(dǎo)教師 院電子與信息工程專業(yè)電子信息工程年級(jí) 班次 姓名 學(xué)號(hào) 一、實(shí)驗(yàn)?zāi)康木€性預(yù)測(cè)分析是最有效的語(yǔ)音分析技術(shù)之一,在語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別和說(shuō)話人識(shí)別等語(yǔ)音處理領(lǐng)域中得到了廣泛的應(yīng)用。語(yǔ)音線性預(yù)測(cè)的基本思想是:一個(gè)語(yǔ)音信號(hào)的抽樣值可以用過(guò)去若干個(gè)取樣值的線性組合來(lái)逼近。通過(guò)使實(shí)際語(yǔ)音抽樣值與線性預(yù)測(cè)抽樣值的均方誤差達(dá)到最小,可以確定唯一的一組線性預(yù)測(cè)系數(shù)。采用線性預(yù)測(cè)分析不僅能夠得到語(yǔ)音信號(hào)的預(yù)測(cè)波形,而且能夠提供一個(gè)非常好的聲道模型。如果將語(yǔ)音模型看作激勵(lì)
2、源通過(guò)一個(gè)線性時(shí)不變系統(tǒng)產(chǎn)生的輸出,那么可以利用lp分析對(duì)聲道參數(shù)進(jìn)行估值,以少量低信息率的時(shí)變參數(shù)精確地描述語(yǔ)音波形及其頻譜的性質(zhì)。此外,lp分析還能夠?qū)舱穹?、功率譜等語(yǔ)音參數(shù)進(jìn)行精確估計(jì),lp分析得到的參數(shù)可以作為語(yǔ)音識(shí)別的重要參數(shù)之一。由于語(yǔ)音是一種短時(shí)平穩(wěn)信號(hào),因此只能利用一段語(yǔ)音來(lái)估計(jì)模型參數(shù)。此時(shí)有兩種方案:一種是將長(zhǎng)的語(yǔ)音序列加窗,然后對(duì)加窗語(yǔ)音進(jìn)行l(wèi)p分析,只要限定窗的長(zhǎng)度就可以保證分析的短時(shí)性,這種方案稱為自相關(guān)法;另一種方案不對(duì)語(yǔ)音加窗,而是在計(jì)算均方預(yù)測(cè)誤差時(shí)限制其取和區(qū)間,這樣可以導(dǎo)出lp分析的自協(xié)方差法。本實(shí)驗(yàn)要求掌握l(shuí)pc原理,會(huì)利用已學(xué)的知識(shí),編寫(xiě)程序估計(jì)線性預(yù)
3、測(cè)系數(shù)以及l(fā)pc的推演參數(shù),并能利用所求的相關(guān)參數(shù)估計(jì)語(yǔ)音的端點(diǎn)、清濁音判斷、基因周期、共振峰等。二、實(shí)驗(yàn)原理1 lp分析基本原理lp分析為線性時(shí)不變因果穩(wěn)定系統(tǒng)v(z)建立一個(gè)全極點(diǎn)模型,并利用均方誤差準(zhǔn)則,對(duì)已知的語(yǔ)音信號(hào)s(n)進(jìn)行模型參數(shù)估計(jì)。如果利用p個(gè)取樣值來(lái)進(jìn)行預(yù)測(cè),則稱為p階線性預(yù)測(cè)。假設(shè)用過(guò)去p個(gè)取樣值的加權(quán)之和來(lái)預(yù)測(cè)信號(hào)當(dāng)前取樣值,則預(yù)測(cè)信號(hào)為: (1)其中加權(quán)系數(shù)用表示,稱為預(yù)測(cè)系數(shù),則預(yù)測(cè)誤差為: (2)要使預(yù)測(cè)最佳,則要使短時(shí)平均預(yù)測(cè)誤差最小有: (3) (4)令 (5) 最小的可表示成: (6)顯然,誤差越接近于零,線性預(yù)測(cè)的準(zhǔn)確度在均方誤差最小的意義上為最佳,由此
4、可以計(jì)算出預(yù)測(cè)系數(shù)。通過(guò)lpc分析,由若干幀語(yǔ)音可以得到若干組lpc參數(shù),每組參數(shù)形成一個(gè)描繪該幀語(yǔ)音特征的矢量,即lpc特征矢量。由lpc特征矢量可以進(jìn)一步得到很多種派生特征矢量,例如線性預(yù)測(cè)倒譜系數(shù)、線譜對(duì)特征、部分相關(guān)系數(shù)、對(duì)數(shù)面積比等等。不同的特征矢量具有不同的特點(diǎn),它們?cè)谡Z(yǔ)音編碼和識(shí)別領(lǐng)域有著不同的應(yīng)用價(jià)值。2 自相關(guān)法在最佳線性預(yù)測(cè)中,若用下式定義的時(shí)間平均最小均方準(zhǔn)則代替(3)式的集合平均最小均方準(zhǔn)則,即令 (7) 事實(shí)上就是短時(shí)自相關(guān)函數(shù),因而 (8) (9)根據(jù)平穩(wěn)隨機(jī)信號(hào)的自相關(guān)性質(zhì),可得 (10) 由(6)式,可得: (11) 綜上所述,可以得到如下矩陣形式: (12)值
5、得注意的是,自相關(guān)法在計(jì)算預(yù)測(cè)誤差時(shí),數(shù)據(jù)段的兩端都需要加p個(gè)零取樣值,因而可造成譜估計(jì)失真。特別是在短數(shù)據(jù)段的情況下,這一現(xiàn)實(shí)更為嚴(yán)重。另外,當(dāng)預(yù)測(cè)系數(shù)量化時(shí),有可能造成實(shí)際系統(tǒng)的不穩(wěn)定。自相關(guān)解法主要有杜賓算法、格型算法和舒爾算法等幾種高效遞推算法。3 協(xié)方差法如果在最佳線性預(yù)測(cè)中,用下式定義的時(shí)間平均最小均方準(zhǔn)則代替(3)式的集合平均最小均方準(zhǔn)則,則可得到類似的方程: (13) 可以看出,這里的數(shù)據(jù)段兩端不需要添加零取樣值。在理論上,協(xié)方差法計(jì)算出來(lái)的預(yù)測(cè)系數(shù)有可能造成預(yù)測(cè)誤差濾波器的不穩(wěn)定,但在實(shí)際上當(dāng)每幀信號(hào)取樣足夠多時(shí),其計(jì)算結(jié)果將與自相關(guān)法的結(jié)果很接近,因而穩(wěn)定性一般是能夠保證的
6、 (當(dāng)然這種方法也有量化效應(yīng)可能引起不穩(wěn)定的缺點(diǎn))。協(xié)方差解法的最大優(yōu)點(diǎn)在于不存在自相關(guān)法中兩端出現(xiàn)很大預(yù)測(cè)誤差的情況,在n和p相差不大時(shí),其參數(shù)估值比自相關(guān)法要精確的多。但是在語(yǔ)音信號(hào)處理時(shí),往往取n在200左右。此時(shí),自相關(guān)法具有較大誤差的段落在整個(gè)語(yǔ)音段中所占的比例很小,參數(shù)估值也是比較準(zhǔn)確的。在這種情況下,協(xié)方差法誤差較小的優(yōu)點(diǎn)就不再突出,其缺乏高效遞推算法的缺點(diǎn)成為了制約因素。所以,在語(yǔ)音信號(hào)處理中往往使用高效的自相關(guān)法。4 全極點(diǎn)聲道模型將線性預(yù)測(cè)分析應(yīng)用于語(yǔ)音信號(hào)處理,不僅是為了利用其預(yù)測(cè)功能,更因?yàn)樗峁┝艘粋€(gè)非常好的聲道模型。將式(2)所示的方程看成是濾波器在語(yǔ)音信號(hào)激勵(lì)下的
7、輸入輸出方程,則該濾波器稱為預(yù)測(cè)誤差濾波器,其e(n)是輸出誤差。變換到z域,p階預(yù)測(cè)誤差濾波器的系統(tǒng)函數(shù)為 (14) 可以看出,如果將預(yù)測(cè)誤差e(n)作為激勵(lì)信號(hào),使其通過(guò)預(yù)測(cè)誤差濾波器的逆濾波器h(z),即 (15) 則h(z)的輸出為語(yǔ)音信號(hào)s(n),也就是說(shuō),h(z)在預(yù)測(cè)誤差e(n)的激勵(lì)下可以合成語(yǔ)音。因此,h(z)被稱為語(yǔ)音信號(hào)的全極點(diǎn)模型,也稱為語(yǔ)音合成器。該模型的參數(shù)就是p階線性預(yù)測(cè)的預(yù)測(cè)系數(shù)。因?yàn)轭A(yù)測(cè)誤差含有語(yǔ)音信號(hào)的基音信息,所以對(duì)于濁音,模型的激勵(lì)信號(hào)源是以基音周期重復(fù)的單位脈沖;對(duì)于清音,激勵(lì)信號(hào)源e(n)是自噪聲。語(yǔ)音信號(hào)的全極點(diǎn)模型是一種很重要的聲道模型,是許多應(yīng)
8、用和研究的基礎(chǔ)。5 lpcc如果聲道特性h(z)用式(14)所示的全極點(diǎn)模型表示,有 (16)式中,s(z)和i(z)分別為語(yǔ)音信號(hào)和激勵(lì)源的z變換。對(duì)人的聽(tīng)覺(jué)來(lái)說(shuō),濁音是最重要的語(yǔ)音信號(hào)。對(duì)于濁音,模型的激勵(lì)信號(hào)源e(n)是以基音周期重復(fù)的單位脈沖,此時(shí)有。可得的z變換s(z)為 (17)式中,為p階線性預(yù)測(cè)系數(shù)。根據(jù)倒譜的定義,對(duì)具有最小相位特征的語(yǔ)音信號(hào),有 (18)式中,為語(yǔ)音信號(hào)的倒譜。將式(16)代入式(17),并對(duì)兩邊求導(dǎo),得 (19)根據(jù)上式即可由線性預(yù)測(cè)系數(shù)通過(guò)遞推得到倒譜系數(shù),將這樣得到的倒譜稱為線性預(yù)測(cè)倒譜系數(shù)。6 結(jié)合語(yǔ)音幀能量構(gòu)成lpc組合參數(shù)由于人能從聲音的音色、頻
9、高等各種信息中感知說(shuō)話人的個(gè)性,因此可以想象,利用特征的有效組合可以得到比較穩(wěn)定的識(shí)別性能。一般來(lái)說(shuō),如果組合的各參量之間相關(guān)性不大,則會(huì)更有效一些,因?yàn)樗鼈兎謩e反映了語(yǔ)音信號(hào)中的不同特征。多年來(lái),人們對(duì)組合參數(shù)在說(shuō)話人識(shí)別中的應(yīng)用進(jìn)行了大量研究 。實(shí)驗(yàn)證明,組合參數(shù)可以提高系統(tǒng)的識(shí)別性能。組合參數(shù)雖然可以提高系統(tǒng)的性能,但很顯然,無(wú)論是在特征參數(shù)提取環(huán)節(jié),還是在模型訓(xùn)練和模型匹配環(huán)節(jié)都使運(yùn)算量有所增加。在特征參數(shù)提取環(huán)節(jié),要計(jì)算一種以上的特征參數(shù)。在模型訓(xùn)練和模型匹配環(huán)節(jié),由于組合參數(shù)特征矢量的維數(shù)較多,使運(yùn)算復(fù)雜度有所增加。運(yùn)算量的增加會(huì)使系統(tǒng)的識(shí)別速度受到影響。為使運(yùn)算量問(wèn)題得到較好的解
10、決,所以可以由lpc參數(shù)與語(yǔ)音幀能量構(gòu)成組合參數(shù),能夠在運(yùn)算量增加不明顯的情況下改進(jìn)系統(tǒng)的性能。語(yǔ)音幀能量是指一幀語(yǔ)音信號(hào)的能量,它等于該幀語(yǔ)音樣值的平方和。選取與語(yǔ)音幀能量構(gòu)成組合參數(shù)主要有以下考慮:1)語(yǔ)音幀能量是語(yǔ)音信號(hào)最基本的短時(shí)參數(shù)之一,它表征一幀語(yǔ)音信號(hào)能量的大小,是語(yǔ)音信號(hào)一個(gè)重要的時(shí)域特征;2)由一幀語(yǔ)音求出的語(yǔ)音幀能量是一個(gè)標(biāo)量值,與其它參量構(gòu)成組合參數(shù)不會(huì)使原特征矢量的維數(shù)明顯增加,特征矢量的維數(shù)越少,則需要的運(yùn)算復(fù)雜度越小,另外,獲取語(yǔ)音幀能量的運(yùn)算并不復(fù)雜;3)語(yǔ)音幀能量與lpc參數(shù)之間的相關(guān)性不大,它們反映的是語(yǔ)音信號(hào)的不同特征,應(yīng)該有較好的效果。7 模型增益g模型的
11、激勵(lì)信號(hào)表示為: (20) 預(yù)測(cè)誤差e(n)如式(2),這樣當(dāng)實(shí)際的預(yù)測(cè)系數(shù)與模型系數(shù)相等時(shí),有 (21) 這說(shuō)明激勵(lì)信號(hào)正比于誤差信號(hào),其比例常數(shù)等于模型增益g。通常假設(shè)誤差信號(hào)的能量等于輸入激勵(lì)信號(hào)的能量,因此可以得到: (22) 對(duì)于式中的激勵(lì)信號(hào),主要分為濁音和清音兩種情況。其中為濁音時(shí),考慮到此時(shí)實(shí)際的激勵(lì)信號(hào)為聲門脈沖,因此可以將激勵(lì)信號(hào)表示為時(shí)的單位抽樣。為了保證這個(gè)假設(shè)成立,要求分析的區(qū)間應(yīng)該大致和語(yǔ)音基因周期的長(zhǎng)度相等。當(dāng)語(yǔ)音為清音時(shí),我們假定激勵(lì)信號(hào)為一個(gè)零均值、單位方差的平穩(wěn)白噪聲過(guò)程。采用自相關(guān)解法時(shí),濁音的模型增益為 (23)清音計(jì)算模型增益的公式和濁音相同。三、實(shí)驗(yàn)
12、結(jié)果(參考)我們使用的原始語(yǔ)音為“北風(fēng)”,采樣頻率為11000hz,運(yùn)行程序見(jiàn)附錄。在這里我們?nèi)〉?0幀進(jìn)行觀察,線性預(yù)測(cè)階數(shù)為12,看到圖3.1所示的原始語(yǔ)音幀的波形,預(yù)測(cè)語(yǔ)音幀波形和它們之間預(yù)測(cè)誤差的波形。圖3.2為原始語(yǔ)音幀和預(yù)測(cè)語(yǔ)音幀的短時(shí)譜和lpc譜的波形圖3.1 原始語(yǔ)音幀、預(yù)測(cè)語(yǔ)音幀和預(yù)測(cè)誤差的波形圖3.2 原始語(yǔ)音幀和預(yù)測(cè)語(yǔ)音幀的短時(shí)譜和lpc譜的波形這里我們可以改變線性誤差的階數(shù)來(lái)觀察語(yǔ)音幀的短時(shí)譜和lp譜的變化情況,如圖3.3。圖3.3 預(yù)測(cè)階數(shù)對(duì)語(yǔ)音幀短時(shí)譜和lpc譜的影響從圖中可以看出,p越大,lpc譜越能反映出語(yǔ)音短時(shí)譜的細(xì)節(jié)部分,但lpc譜的光滑度隨之下降。由于我們
13、的目的只是用lpc譜反映聲道綜合效應(yīng)的譜的表示式,而具體的諧波形狀是通過(guò)激勵(lì)譜來(lái)控制的,因此lpc譜只要能夠體現(xiàn)出語(yǔ)音的共振峰的結(jié)構(gòu)和譜包絡(luò)就可以,因此從計(jì)算復(fù)雜性的角度分析,預(yù)測(cè)階數(shù)p應(yīng)該適中。圖3.4是原始語(yǔ)音和預(yù)測(cè)誤差的倒譜波形,我們可以從中計(jì)算出原始語(yǔ)音的基音周期。從圖中看出兩峰值之間的間隔為40點(diǎn)左右,基音周期為40/11000=3.6ms,頻率為278hz左右。圖3.4 原始語(yǔ)音和預(yù)測(cè)誤差的倒譜波形圖3.5給出了原始語(yǔ)音的語(yǔ)譜圖和預(yù)測(cè)語(yǔ)音的語(yǔ)譜圖,通過(guò)比較發(fā)現(xiàn),預(yù)測(cè)語(yǔ)音的預(yù)測(cè)效果還可以,基音頻率相差無(wú)幾。圖3.5 原始語(yǔ)音的語(yǔ)譜圖和預(yù)測(cè)語(yǔ)音的語(yǔ)譜圖三、lpc分析程序及實(shí)驗(yàn)結(jié)果mus
14、icsource = wavread(beifeng.wav);%讀取wav音頻文件“beifeng.wav”music_source = musicsource;n = 256;hamm = hamming(n); %形成一個(gè)漢明窗,長(zhǎng)度為256frame = input(請(qǐng)鍵入想要處理的幀位置 = );%提示用戶輸入數(shù)據(jù),提示內(nèi)容為“請(qǐng)鍵入想要處理的幀位置 =”% origin是當(dāng)前幀origin = music_source(frame - 1) * (n / 2) + 1):(frame - 1) * (n / 2) + n);frame = origin .* hamm;%短時(shí)傅里葉
15、變換s1,f1,t1 = specgram(musicsource,n,n/2,n);%生成語(yǔ)譜圖xs1,ys1 = size(s1);%用xs1和ys1兩個(gè)變量表示語(yǔ)譜圖向量的大小for i = 1:xs1ftframe1(i) = s1(i,frame);endn1 = input(請(qǐng)鍵入預(yù)測(cè)器階數(shù) = ); % 提示用戶輸入數(shù)據(jù),提示內(nèi)容為“請(qǐng)鍵入預(yù)測(cè)器階數(shù) = ”coef,gain = lpc(frame,n1); % 采用萊文森 - 德賓遞推進(jìn)行l(wèi)pc分析est_frame = filter(0 -coef(2:end),1,frame); % 估計(jì)幀(lp)fft_est = ff
16、t(est_frame);err = frame - est_frame; % 誤差% fft_err = fft(err);subplot(2,1,1),plot(1:n,frame,1:n,est_frame,-r);grid;title(原始語(yǔ)音幀vs.預(yù)測(cè)后語(yǔ)音幀)%在第1行生成2*1的坐標(biāo)軸,在1到256上畫(huà)出原始語(yǔ)音幀和預(yù)測(cè)后語(yǔ)音幀,顯示網(wǎng)格,并添加標(biāo)題“原始語(yǔ)音幀vs.預(yù)測(cè)后語(yǔ)音幀”subplot(2,1,2),plot(err);grid;title(誤差);%在第2行生成2*1的坐標(biāo)軸,畫(huà)出err的圖形,顯示網(wǎng)格,并添加標(biāo)題“誤差”pause%subplot(2,1,2),p
17、lot(f,20*log(abs(ftframe2);grid;title(短時(shí)譜)% gain solution using g2 = rn(0) - sum(ai*rn(i),i = 1,2,.,pflength(1 : 2 * n) = origin,zeros(1,n);xm = fft(flength,2 * n);%離散傅里葉變換x = xm .* conj(xm);%計(jì)算x的模y = fft(x , 2 * n);%離散傅里葉變換rk = y(1 : n);%截取y的1到256段送給rkpart = sum(coef(2 : n1 + 1) .* rk(1 : n1);g = s
18、qrt(sum(frame.2) - part);a = (ftframe1 - fft_est(1 : length(f1) ./ ftframe1 ; %逆濾波器 a(z)subplot(2,1,1),plot(f1,20*log(abs(ftframe1),f1,(20*log(abs(1 ./ a),-r);grid;title(短時(shí)譜);%在第一行作出短時(shí)譜函數(shù)subplot(2,1,2),plot(f1,(20*log(abs(g ./ a);grid;title(lpc譜);%在第二行作出lpc譜函數(shù)pause%plot(abs(ifft(ftframe1 ./ (g ./ a);grid;title(excited)%plot(f1,20*log(abs(fft_est(1 : length(f1) .* a / g );grid;%pause% find_pitch%temp = ftframe1 - fft_est(1 : length(f1);% not move higher frequncepitch1 = log(abs(temp);plength = length(pitch1);result1 = ifft(pitch1,n);% move higher frequn
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年湖北省黃石市單招職業(yè)適應(yīng)性測(cè)試題庫(kù)參考答案
- 科技助力智能化班組建設(shè)與員工滿意度
- 制藥公司合作合同范本
- 科技產(chǎn)品如何通過(guò)社交媒體提升用戶粘性
- 構(gòu)建多元文化背景下的全球老年大學(xué)網(wǎng)絡(luò)
- 2025年河南推拿職業(yè)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)含答案
- 2025年湖北云學(xué)名校聯(lián)盟高三年級(jí)2月聯(lián)考語(yǔ)文試卷
- 科技發(fā)展趨勢(shì)下的管理決策方法
- 施工中標(biāo)合同范本
- 2025-2030年中國(guó)甲醇制芳烴行業(yè)發(fā)展?fàn)顩r及營(yíng)銷戰(zhàn)略研究報(bào)告
- 《期末總結(jié)》課件
- 《企業(yè)安全生產(chǎn)費(fèi)用提取和使用管理辦法》專題培訓(xùn)
- 母嬰護(hù)工培訓(xùn)完整方案
- 第17講 新高考新結(jié)構(gòu)命題下的導(dǎo)數(shù)解答題綜合訓(xùn)練(教師版)-2025版高中數(shù)學(xué)一輪復(fù)習(xí)考點(diǎn)幫
- 01-衛(wèi)生法學(xué)與衛(wèi)生法概述課件
- 2024年世界職業(yè)院校技能大賽高職組“新型電力系統(tǒng)技術(shù)與應(yīng)用組”參考試題庫(kù)(含答案)
- 幼兒園家長(zhǎng)會(huì)安全保健
- (完整版)小升初英語(yǔ)語(yǔ)法總結(jié)+練習(xí)題及答案
- 全員營(yíng)銷激勵(lì)專項(xiàng)方案
- 云南省高中信息技術(shù)學(xué)業(yè)水平考試知識(shí)點(diǎn)復(fù)習(xí)
- DBJ33-T 1325-2024 螺栓連接全裝配混凝土墻板結(jié)構(gòu)技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論