版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、華南理工大學(xué)語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)名稱:LPC特征提取姓名:學(xué)號(hào):班級(jí):10級(jí)電信5班日期:2013年5月24日1.實(shí)驗(yàn)?zāi)康?、熟練運(yùn)用MATLAB軟件進(jìn)行語(yǔ)音信號(hào)實(shí)驗(yàn);2、熟悉短時(shí)分析原理、LPC的原理;3、學(xué)習(xí)運(yùn)用MATLAB編程進(jìn)行LPC的提??;4、學(xué)會(huì)利用短時(shí)分析原理提取LPC特征序列。2.實(shí)驗(yàn)原理1、LPC分析基本原理LPC分析為線性時(shí)不變因果穩(wěn)定系統(tǒng) V (z)建立一個(gè)全極點(diǎn)模型,并利用均方誤差準(zhǔn)則,對(duì)已知的語(yǔ)音信號(hào)s(n)進(jìn)行模型參數(shù)估計(jì)如果利用P個(gè)取樣值來(lái)進(jìn)行預(yù)測(cè),則稱為 P階線性預(yù)測(cè)。假設(shè)用過(guò)去P 個(gè)取樣值松U2),S(n-p”的加權(quán)之和來(lái)預(yù)測(cè)信號(hào)當(dāng)前取樣值S(n),則預(yù)
2、測(cè)信號(hào)SG)為:pS n 二、ak n -k(1)其中加權(quán)系數(shù)用ak表示,稱為預(yù)測(cè)系數(shù),則預(yù)測(cè)誤差為pe n =sn -Sn =s n -% ak n -kkw(2)要使預(yù)測(cè)最佳,則要使短時(shí)平均預(yù)測(cè)誤差最小有:一 2;=E e n= min-jle n一 =0,(1 MkMp)Zk i,k )=E s n -i ,S n -k(5)最小的可表示成:(6)min =0,0 Jk 0,k顯然,誤差越接近于零,線性預(yù)測(cè)的準(zhǔn)確度在均方誤差最小的意義上為最佳, 由此可以計(jì)算出預(yù)測(cè)系數(shù)。通過(guò)LPC分析,由若干幀語(yǔ)音可以得到若干組 LPC參數(shù),每組參數(shù)形成一 個(gè)描繪該幀語(yǔ)音特征的矢量,即LPC特征矢量。由L
3、PC特征矢量可以進(jìn)一步得 到很多種派生特征矢量,例如線性預(yù)測(cè)倒譜系數(shù)、線譜對(duì)特征、部分相關(guān)系數(shù)、 對(duì)數(shù)面積比等等。不同的特征矢量具有不同的特點(diǎn),它們?cè)谡Z(yǔ)音編碼和識(shí)別領(lǐng)域 有著不同的應(yīng)用價(jià)值。2、自相關(guān)法在最佳線性預(yù)測(cè)中,若用下式定義的時(shí)間平均最小均方準(zhǔn)則代替(3)式的集合平均最小均方準(zhǔn)則,即令n =min事實(shí)上就是短時(shí)自相關(guān)函數(shù),因而R k )=E|S n ,S n -k根據(jù)平穩(wěn)隨機(jī)信號(hào)的自相關(guān)性質(zhì),可得 i,k )=R i -k ,i =1,2l| p; k =0,1|H p由(6)式,可得:pmin =R 0 iaM kk 1(10)(11)綜上所述,可以得到如下矩陣形式:R(0 )R(1
4、 ) lR(P-1 )R(1 )R(0) WR(P2)R P -1R P -2 R 0a2a3R1 )R(2)R(3)(12)值得注意的是,自相關(guān)法在計(jì)算預(yù)測(cè)誤差時(shí),數(shù)據(jù)段叩網(wǎng)川鳥1)的 兩端都需要加P個(gè)零取樣值,因而可造成譜估計(jì)失真。特別是在短數(shù)據(jù)段的情 況下,這一現(xiàn)實(shí)更為嚴(yán)重。另外,當(dāng)預(yù)測(cè)系數(shù)量化時(shí),有可能造成實(shí)際系統(tǒng)的不 穩(wěn)定。自相關(guān)解法主要有杜賓算法、格型算法和舒爾算法等幾種高效遞推算法。3、協(xié)方差法如果在最佳線性預(yù)測(cè)中,用下式定義的時(shí)間平均最小均方準(zhǔn)則代替(3)式的集合平均最小均方準(zhǔn)則,則可得到類似的方程:1 N 1e n =min(13)可以看出,這里的數(shù)據(jù)段兩端不需要添加零取樣值
5、。在理論上,協(xié)方差法計(jì)N n學(xué)但在實(shí)際上當(dāng)每幀信號(hào)因而穩(wěn)定性一般是能夠)o算出來(lái)的預(yù)測(cè)系數(shù)有可能造成預(yù)測(cè)誤差濾波器的不穩(wěn)定, 取樣足夠多時(shí),其計(jì)算結(jié)果將與自相關(guān)法的結(jié)果很接近, 保證的(當(dāng)然這種方法也有量化效應(yīng)可能引起不穩(wěn)定的缺點(diǎn)協(xié)方差解法的最大優(yōu)點(diǎn)在于不存在自相關(guān)法中兩端出現(xiàn)很大預(yù)測(cè)誤差的情況,在N和P相差不大時(shí),其參數(shù)估值比自相關(guān)法要精確的多。但是在語(yǔ)音信號(hào)處理時(shí),往往取N在200左右。此時(shí),自相關(guān)法具有較大誤差的段落在整個(gè) 語(yǔ)音段中所占的比例很小,參數(shù)估值也是比較準(zhǔn)確的。在這種情況下,協(xié)方差法所以,誤差較小的優(yōu)點(diǎn)就不再突出,其缺乏高效遞推算法的缺點(diǎn)成為了制約因素 在語(yǔ)音信號(hào)處理中往往使用
6、高效的自相關(guān)法5、LPC由于頻率響應(yīng)H(ejw)反映聲道的頻率響應(yīng)和被分析信號(hào)的譜包絡(luò),因此用log | H (ejw) |做反傅里葉變換求出的LPC倒譜系數(shù)p通過(guò)線性預(yù)測(cè)分析得到的合成濾波器的系統(tǒng)函數(shù)為H(z)=1/(1-2 az),其i=4AA二二 AA沖激響應(yīng)為h(n)。h(n)的倒譜為h(n) , H(z)= h(n)z就是說(shuō)H (z)的逆變換n z4AAA: Ah(n)是存在的。設(shè) h(0)=0,將式H(z)= h(n)z”兩邊同時(shí)對(duì)z,求導(dǎo),得n 4PI 1-二二 A二 Aia z1710gP二-h(n)z得到工 nh(n)zJH4 = Jj-p1J aizdN nmnmf aiz
7、i 1iWPr、:; A(1- aiz,) nh(n)zH*= iaz*令其左右兩邊z的各次幕前系數(shù)分別相 i =1ngn 1等,得到h(n)和ai間的遞推關(guān)系h(1) =a anJ. . ah(n)=an+ (1)aih(nk),1 M n W p1n,按其可直接從預(yù)測(cè)系數(shù) ai求得ApAh(n) = (1 -)ai h(n -1), n p y n倒譜h(n)。這個(gè)倒譜是根據(jù)線性預(yù)測(cè)模型得到的,又稱為 LPC倒譜。LPC倒譜由于利用線性預(yù)測(cè)中聲道系統(tǒng)函數(shù) H (z)的最小相位特性,因此避免了一般同態(tài)處理中求復(fù)對(duì)數(shù)的麻煩.實(shí)驗(yàn)數(shù)據(jù)及平臺(tái)本實(shí)驗(yàn)所采用的數(shù)據(jù)是語(yǔ)音文件 phrase.WAV ft
8、 monologue speech_female ,平 臺(tái)是 MATLAB。.實(shí)驗(yàn)過(guò)程(步驟)(1)、實(shí)驗(yàn)步驟1、輸入原始語(yǔ)音2、對(duì)樣本語(yǔ)音進(jìn)行加窗處理3、計(jì)算LPC系數(shù)4、建立語(yǔ)音正則方程5、輸出原始樣本語(yǔ)音、預(yù)測(cè)語(yǔ)音波形和預(yù)測(cè)誤差6、輸出LPC譜7、求出預(yù)測(cè)誤差的倒譜8、輸出原始語(yǔ)音和預(yù)測(cè)語(yǔ)音的語(yǔ)譜圖(2)實(shí)驗(yàn)流程輸入原始語(yǔ)加窗處理計(jì)算LPC系數(shù)建立語(yǔ)音正則方程-d輸出圖像圖1 LPC系數(shù)實(shí)驗(yàn)流程圖.實(shí)驗(yàn)結(jié)果及討論我們使用的原始語(yǔ)音為“monologue speech_female ;運(yùn)行程序,得到原始語(yǔ)音語(yǔ)譜圖和原始語(yǔ)音波形:2Q04006008001000原始語(yǔ)音語(yǔ)譜圖60o O 4
9、2 交與 bSJLL01200Time圖2原始語(yǔ)音語(yǔ)譜圖和原始語(yǔ)音波形在這里我們選取線性預(yù)測(cè)階數(shù)為15,下圖是實(shí)驗(yàn)的結(jié)果,圖3上半部分中 藍(lán)色的線是原始語(yǔ)音幀波形,紅色的線是預(yù)測(cè)語(yǔ)音幀的波形;下半部分為預(yù)測(cè)誤 差;圖4為原始語(yǔ)音幀和預(yù)測(cè)語(yǔ)音幀的短時(shí)譜和 LPC譜的波形:X10原始語(yǔ)音和預(yù)測(cè)語(yǔ)音,波形圖31000 做 =-1000nn矩時(shí)譜1一E4 r : . I._L .rrv5 f, 1 一七 4 ;二VaPvitrvZUU C10050 做 log M 0-5。)10203040506070頻率/dB LPC譜:cInLrrn一)10203040506。70頻率/dB圖4短時(shí)譜和LPC譜-
10、6111111*TTTa - 1 - 1 .11iii原始語(yǔ)音帕倒譜0-250250CD0100150200語(yǔ)音幀預(yù)測(cè)誤差倒諳300-611111T ! 尸 Frq *&M .H_-riil1iii050250mw0100150200語(yǔ)音幀300圖5原始語(yǔ)音和預(yù)測(cè)誤差的倒譜波形0200,原始語(yǔ)音語(yǔ)i普?qǐng)D400600 BOD 10001200Time預(yù)測(cè)語(yǔ)音語(yǔ)譜圖圖6原始語(yǔ)音語(yǔ)譜圖和預(yù)測(cè)語(yǔ)音語(yǔ)譜圖LPC系數(shù):ai =Columns 1 through 81.0000-0.5313-0.1624-0.2005-0.07260.14810.0192-0.1592Columns 9 through 1
11、6-0.12480.18570.06360.0848-0.1475-0.05620.0129-0.0196通過(guò)計(jì)算LPC系數(shù)可以很好的利用先行預(yù)測(cè)中聲道系統(tǒng)函數(shù)的最小相位特 性來(lái)提取特征函數(shù).實(shí)驗(yàn)總結(jié)這次實(shí)驗(yàn)利用MATLAB對(duì)信號(hào)進(jìn)行分析和處理,主要就是進(jìn)行語(yǔ)音線性預(yù) 測(cè),語(yǔ)音線性預(yù)測(cè)的基本思想是:一個(gè)語(yǔ)音信號(hào)的抽樣值可以用過(guò)去若干個(gè)取樣 值的線性組合來(lái)逼近。通過(guò)使實(shí)際語(yǔ)音抽樣值與線性預(yù)測(cè)抽樣值的均方誤差達(dá)到 最小,可以確定唯一的一組線性預(yù)測(cè)系數(shù)。通過(guò)這個(gè)實(shí)驗(yàn),我對(duì)語(yǔ)音線性預(yù)測(cè)進(jìn) 行了探究和驗(yàn)證,鞏固了課內(nèi)所學(xué)的知識(shí)。.實(shí)驗(yàn)代碼I = wavread(E:yuuyinmonologue spe
12、ech_female.wav);%讀入原始語(yǔ)音%subplot(3,1,1),plot(I);title(原始語(yǔ)音波形)%對(duì)指定幀位置進(jìn)行加窗處理Q = I;N = 256; % 窗長(zhǎng)Hamm = hamming(N); % 力口窗frame = 60;%需要處理的幀位置M = Q(frame - 1) * (N / 2) + 1):(frame - 1) * (N / 2) + N);Frame = M .* Hamm;% 加窗后的語(yǔ)音幀B,F,T = specgram(I,N,N/2,N);m,n = size(B);for i = 1:mFTframe1(i) = B(i,frame);
13、endP =input(請(qǐng)輸入預(yù)測(cè)器階數(shù)=);ai = lpc(Frame,P); % 計(jì)算 Ipc 系數(shù)LP = filter(0 -ai(2:end),1,Frame); %建立語(yǔ)音幀的正則方程FFTlp = fft(LP);E = Frame - LP; % 預(yù)測(cè)誤差subplot(2,1,1),plot(1:N,Frame,1:N,LP,-r);grid;title(原始語(yǔ)音和預(yù)測(cè)語(yǔ)音波形)subplot(2,1,2),plot(E);grid;title(預(yù)測(cè)誤差);pausefLength(1 : 2 * N) = M,zeros(1,N);Xm = fft(fLength,2 *
14、 N);X = Xm .* conj(Xm);Y = fft(X , 2 * N);Rk = Y(1 : N);PART = sum(ai(2 : P + 1) .* Rk(1 : P);G = sqrt(sum(Frame.A2) - PART);A = (FTframel - FFTlp(1 : length(F) ./ FTframel ;subplot(2,1,1),plot(F,20*log(abs(FTframe1),F,(20*log(abs(1./A),-r);grid;xlabel(頻率/dB);ylabel(幅度);title(短時(shí)譜);subplot(2,1,2),plot(F,(20*log(abs(G ./ A);grid;xlabel(頻率/dB);ylabel(幅度);title(LPC 譜);pause%求出預(yù)測(cè)誤差的倒譜pitch = fftshift(rceps(E);M_pitch = fftshift(rceps(Frame);subplot(2,1,1),plot(M_pitch);grid;xlabel(語(yǔ)音幀);ylabel(/dB);title(原始語(yǔ)音幀倒譜);subplot(2,1,2),plot(p
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廊坊貨運(yùn)從業(yè)資格證考些什么內(nèi)容
- 2025年齊齊哈爾道路貨物運(yùn)輸從業(yè)資格證考試
- 2025年呼倫貝爾從業(yè)資格證貨運(yùn)考試答案
- 2025年長(zhǎng)沙貨運(yùn)從業(yè)資格證考試試題和答案
- 2024景區(qū)人才培養(yǎng)輸出合同
- 2024年物聯(lián)網(wǎng)設(shè)備租賃與服務(wù)合同
- 2024版法律文書離婚協(xié)議范本
- 2024版服務(wù)業(yè)保密協(xié)議模板
- 二零二五年度教育培訓(xùn)機(jī)構(gòu)師資力量培訓(xùn)與引進(jìn)合同3篇
- 二零二五年度智能農(nóng)業(yè)物聯(lián)網(wǎng)解決方案供應(yīng)合同
- 工地生活垃圾處理方案
- 初一數(shù)學(xué)上冊(cè)有理數(shù)加減混合運(yùn)算練習(xí)題及答案(共100題)
- 論蘇軾詩(shī)詞中的曠達(dá)風(fēng)格
- 肩部健身理論知識(shí)講座
- 電腦IT維護(hù)崗位 KPI績(jī)效考核指標(biāo)
- 部編人教版八年級(jí)下冊(cè)英語(yǔ)同步訓(xùn)練全套
- 運(yùn)輸成本核算
- 軟件技術(shù)開發(fā)公司經(jīng)營(yíng)分析報(bào)告
- SBT11229-2021互聯(lián)網(wǎng)舊貨交易平臺(tái)建設(shè)和管理規(guī)范
- 2024年房地產(chǎn)公司設(shè)計(jì)類技術(shù)筆試歷年真題薈萃含答案
- 2024年銀行考試-建設(shè)銀行紀(jì)檢監(jiān)察條線筆試歷年真題薈萃含答案
評(píng)論
0/150
提交評(píng)論