




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、南京郵電大學實驗報告實驗名稱語音編碼實驗課程名稱B13011413陳超2016/2017 學年,第-學期信息處理技術(shù)專業(yè)綜合實驗班級學號開課時間姓 名實驗語音編碼、實驗目的熟悉語音基本壓縮編碼的方法,觀察語音壓縮效果,加深對語音線性預測編碼 (LPC )的理解。、實驗內(nèi)容1、2、3、編寫并調(diào)試語音 LPC參數(shù)提取程序。 編寫并調(diào)試語音基音周期提取程序。編寫并調(diào)試語音 LPC合成程序。三、實驗原理語音信號中含有大量的冗余信息,采用各種信源編碼技術(shù)減除語音信號的冗余 度,并充分利用人耳的聽覺掩蔽效應,就可以將其編碼速率壓縮很多倍,而仍能提 供可懂語音。LPC聲碼器是一種比較簡單實用的語音壓縮方法,
2、其基本原理是:根據(jù)語音生 成模型,將語音看作激勵源通過一個線性時不變系統(tǒng)產(chǎn)生的輸出,利用線性預測分 析對聲道參數(shù)進行估值,將求得的線性預測系數(shù),結(jié)合基音周期等少量參數(shù)進行傳 輸,就可以在接收端利用合成濾波器重構(gòu)語音信號。M個語音樣值來進行預測線性預測系數(shù)的估計方法為:假設(shè)語音的當前樣值可以用過去的M(n )=ai Xn 1 )+a2X(n -2+ aM x(n - M ) = S ai Xn - i )i絲式中a 即為線性預測系數(shù)。實際值和預測值之間的均方誤差可表示為孑(n)=S要求均方誤差總和最小,將E關(guān)于a的偏導數(shù)設(shè)置為零,可以得到fMZ x(n-klx(n)S xln i ) =0nVy
3、丿ar。通過采用自相關(guān)法、協(xié)方差法或格形法求解該方程,即可得到最優(yōu)的四、實驗方法及程序1.調(diào)用xcorr命令計算一幀語音的自相關(guān)函數(shù)。2. 調(diào)用 toeplitz 命令形成該幀語音的自相關(guān)矩陣。3. 調(diào)用 durbin 命令,采用杜賓遞推算法計算該幀語音的線性預測系數(shù)。4. 編寫 lpcauto.m 函數(shù),求取一句語音信號的線性預測系數(shù)及預測殘差。選擇設(shè) 當?shù)拇昂瘮?shù)對語音信號進行分幀。5. 編寫 lpcpitch 函數(shù),由殘差信號計算該句語音的基音周期。6. 編寫 lpcgain 函數(shù),由預測殘差能量,求出該句語音的增益。7. 編寫 lpcsyn 函數(shù),由該句語音的基音周期、 預測殘差能量和增
4、益進行 LPC 合成。五、實驗結(jié)果與分析1. 如何對全極點模型的線性預測參數(shù)進行提取?加窗等預處理對提取結(jié)果有何 影響?2.3.如何實現(xiàn)線性預測參數(shù)的各種表現(xiàn)方式之間的轉(zhuǎn)換? 使用預測殘差求基音周期有何優(yōu)點? 如何根據(jù)線性預測系數(shù)求得 LPC 頻譜?LPC頻譜與基于 DFT求得的語音對數(shù)幅度譜相比有何不同?LPC 合成語音的質(zhì)量如何?有何改進措施?4.5.6.實驗過程記錄與結(jié)果分析1、計算短時自相關(guān)函數(shù)1.1分別計算正弦信號和白噪聲的短時自相關(guān)函數(shù),其Matlab代碼如下:估計正弦信號的基音周期。x=si n(2* pi*0.01*(0:499)'); r,eta=xcorr(x,10
5、0,' un biased'); stem(eta,r);w=ra ndn (500,1);r,eta=xcorr(w,100,' un biased'); stem(eta,r);1.210.80.60.40.2020406080100-0.2-100-80-60-40-201.2計算正弦信號疊加白噪聲的短時自相關(guān)函數(shù),其Matlab代碼如下:試估計正弦信號的基音周期。x=si n(2* pi*0.01*(0:499)');w=ra ndn (500,1);x1=x+w;r,eta=xcorr(x1,100,'u nbiased');
6、stem(eta,r);1.41.20.80.60.40.2-0.2-0.4k刪IFi-jrfi-0.6 '''-100-80-60-40-2002040601.3分別畫出一幀濁音和一幀清音的語音自相關(guān)波形(采樣頻率為 長為25.6ms,每幀有256個樣點),估計濁音的基音周期。load digits; x=digits.three1;m=2756; N=256; n=m-N+1:m; r,eta=xcorr(x (n ),250,' un biased'); plot(eta,r);m=500; N=256; n=m-N+1:m; r,eta=xcor
7、r(x (n ),250,' un biased'); plot(eta,r);80 10010kHz ,幀4X 1070605040302010LIHiI'hiIiHi;伽-10I II J-20-30 -250-200-150-100-50501001502002502、求取LPC系數(shù)2.1加載“ digits.three1 ”語音數(shù)據(jù)。基于自相關(guān)法,求出其中一幀數(shù)據(jù)(采樣頻率為10kHz,幀長為 25.6ms,每幀有256個樣點)的 14階LPC系數(shù)。畫出相應 的LPC譜。load digits; x=digits.three1;m=2756; N=256; n=
8、m-N+1:m; M=14; r,eta=xcorr(x (n ),250,' un biased');Rx=toe plitz(r(M+1:2*M); rx=r(M+2:2*M+1);a=Rxrx;NFFT=1024; k=1:NFFT/2;X=fft(x( n).*ha nn (N),NFFT);'X(k)Theta=1./fft(1:-a,NFFT);plot(k,20*log10(abs(353*Theta(k)axis(0 NFFT/2 -inf inf)2.2編寫一個用以實現(xiàn)杜賓遞推算法的函數(shù)“durbin.m ",其 Matlab 代碼如下:fu
9、nction a,xi,ka pp a=durb in(r,M)kappa = zeros (M,1);a = zeros (M, 1);xi=r(1); zeros(M,1);for (j=1:M)kapp a(j)=(r(j+1)-a(1:j-1)'*r(j:-1:2)/xi(j);a(j)=ka ppa(j);a(1:j-1)=a(1:j-1)-ka pp a(j)*a(j-1:-1:1);xi(j+1)=xi(j)*(1-ka pp a(j)A2);end2.3利用函數(shù)“ durbin.m ”,計算2.1中語音數(shù)據(jù)幀的14階LPC系數(shù),并與 2.1中的結(jié)果進行比較:x=digi
10、ts.three1;m=2756; N=256; n=m-N+1:m; M=14;r,eta=xcorr(x (n ),250,' un biased'); aLD,xi,ka pp a=durbi n(r(M+1:2*M+1),M);a, aLD, no rm(a-aLD)0, 35120. 20720. 38080.31630. 0522 -0, 1639 -0.2903 -0*2898 -0. 12220. 19000. 34920, 3024) 1713 -丄 3258aLD =0, 35120. 2072CL 38030.3163O.OS22 -0, 1639 -0,
11、2903 -0. 2S93 -CL 12220. iseo0. 34920, 30240, 1713 -0. 3253artsN 33fbe-0152.4編寫一個用以實現(xiàn)反射系數(shù)轉(zhuǎn)換為 碼如下:LPC系數(shù)的函數(shù)“ f2lpc.m ”,其 Matlab代function a = f2lp c(ka ppa)M = len gth(ka pp a);a = zeros(M,1);for (j=1:M)a(j) = kapp a(j);a(1:j-1) = a(1:j-1) - kapp a(j)*a(j-1:-1:1);end“Ipc2f.m ”,其 Matlab2.5編寫一個用以實現(xiàn)LPC系數(shù)轉(zhuǎn)
12、換為反射系數(shù)的函數(shù)代碼如下:function kappa = Ip c2rf(a)M = len gth(a);kappa = zeros(M,1);for (j=M:-1:1)kapp a(j) = a(j);a(1:j-1) = (a(1:j-1) + a(j)*a(j-1:-1:1)/(1 - kapp a(j)2);end2.6使用函數(shù)"f2lpc.m ”和“ Ipc2rf.m ",檢驗反射系數(shù)和LPC系數(shù)相互轉(zhuǎn)換結(jié)果。no rm(ka pp a-l pc2f(aLD)no rm(aLD-rf2 Ip c(ka ppa)ans2.2eO2e-Ot43、語音信號的逆濾
13、波3.1利用2.3中求出的一幀語音數(shù)據(jù)的 語音信號的殘差波形。LPC系數(shù),構(gòu)造逆濾波器,并畫出該幀ehat=filter(1;-1,1,x( n);plot(x (n) ehat)3.2編寫一個用以實現(xiàn)語音信號LPC分析的函數(shù)"lpcauto ",其 Matlab代碼如下:function ar,xi,e,m = lpcauto(x,M,win,Olap)Nx = length(x);N = length(win);if (N = 1)N = win;win = ones(N,1);endF = fix(Nx-Olap)/(N-Olap);ar = zeros(M+1,F)
14、;xi = zeros(M+1,F);e = zeros(Nx,1);m = zeros(F,1);n = 1:N;n1 = 1:Olap; n2 = N-Olap+1:N;n3 = Olap+1:N;win1 = win(n1)./(win(n1)+win(n2)+eps);win2 = win(n2)./(win(n1)+win(n2)+eps);for (f=1:F)r,eta = xcorr(x(n).*win,M,'biased');a,xi(:,f),kappa = durbin(r(M+1:2*M+1),M);ar(:,f) = 1; -a;-add.ehat =
15、 filter(ar(:,f),1,x(n);e(n) = e(n(n1).*win2 + ehat(n1).*win1; ehat(n3); % Overlap m(f) = n(N);n = n + (N-Olap);end3.3 加載“ timit1 ”語音數(shù)據(jù),利用“ lpcauto ”函數(shù)對該句語音進行 LPC 分析。 畫出語音信號及其殘差波形。load timit1; x=timit1;M=14; N=256;ar,xi,e,m=l pcauto(x,M,ha nn (N),N/2);plot(x,e)soun dsc(x)soun dsc(e)soun dsc(x-e)4、LPC
16、譜估計4.1編寫一個用以計算和顯示LPC譜的函數(shù)"lpcplot ",其 Matlab代碼如下:fun ction lp cplot(A,Nfft,Fs,m)M,N = size(A);if (N=1)Theta,F = freqz(1,A,Nfft,Fs);plot(F,20*log10(abs(Theta);xlabel('Freque ncy, it FHz');ylabel('Mag nitude, |theta(omega)|dB');elseif (le ngth(m) = N)error('The colu mn dim
17、e nsion of A must be equal to the len gth ofm.')endTheta = zeros(Nfft,N);for (n=1:N)Theta(:, n),F = freqz(1,A(:, n),Nfft,Fs);endMesh Hndl = meshz(m,F,20*log10(abs(Theta);axis ij; view(-45,45); set(MeshH ndl,'MeshStyle','Colum n');axis tight; axis 'auto y' axis 'auto z
18、'xlabel('Sa mp le Number, it n');ylabel('Freque ncy, it FHz');zlabel('Mag nitude, |theta(omega)|dB');end4.2利用“ Ipcplot ”函數(shù),畫出3.3中語音數(shù)據(jù)的幾幀(采樣頻率為長為32ms,每幀有 512個樣點)LPC譜。16kHz ,幀plot(x(m(71):m(147)0.80.60.40.20-0.2-0.4-0.6-0.8-1010002000300040005000600070008000900010000lp cplo
19、t(ar(:,71:147),512,16000,m(71:147)50 -eMWE '0 一、1.820001.640001.46000Freque ncy, F HzSamp le Number,|4 X 101.2-50 -I hi 01I-lp cplot(ar(:,82),512,16000,0)*nlp cplot(ar(:,110),512,16000,0)40-30011 11IL 1 11 111l1 1 、1/1-fX.八 1 I'l/ '1* ay41I1I、triTrE1r3020100-10-201000 2000700060003000400
20、05000Freque ncy, F Hz8000Ip cplot(ar(:,134),512,16000,0)2015IIILLL=iJJ1/ /L5"/ ; / 1r _/ /、一/Zt/rrrrirrr300040005000Freque ncy, F Hz6000700080002實驗結(jié)果與分析1. 如何對全極點模型的線性預測參數(shù)進行提???加窗等預處理對提取結(jié)果有 何影響?自相關(guān)法、協(xié)方差法求解線性預測方程組、格型法。協(xié)方差法是先把計算均方 誤差的間隔 N 固定下 來,再研究它對計算n(i,l) 的其中 N 是基音周期值。 添加海明窗和漢寧窗可以得到效果不錯的波形,很明顯兩個波形相似,矩形窗的波形 相對不是很平穩(wěn)。通過改變幀長、幀移后波形更加的清晰,特征更加的明顯, 更方便觀察 。2. 如何實現(xiàn)線性預測參數(shù)的各種表現(xiàn)方式之間的轉(zhuǎn)換?對于語音信號,確定了各線性預測系數(shù)后,根據(jù)H ( z )可得其頻率響應的估值即 LPC 譜 。3. 使用預測殘差求基音周期有何優(yōu)點? 該方法能進一步去除聲道共振峰的影響,簡化清濁音判決過程,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 離婚財產(chǎn)合同范本模板
- 合股餐廳合同范本
- 輪胎店轉(zhuǎn)讓合同范本
- 醫(yī)美會員合同范本模板
- 紡織原料采購合同范本
- 企業(yè)向個人租房合同范本
- 危險廢物管理處理合同范本
- 單位采購空調(diào)合同范本
- 個人債權(quán)轉(zhuǎn)讓合同范本
- 裝飾設(shè)計合同范本
- 安裝承包合同(2025年)
- 云上貴州大數(shù)據(jù)(集團)有限公司招聘筆試沖刺題2024
- 人教版四年級下冊數(shù)學第二單元觀察物體(二) 單元測試
- 護理技能培訓師競聘
- 2025屆東北師大附屬中學高考數(shù)學倒計時模擬卷含解析
- 智能交通監(jiān)控系統(tǒng)運維服務方案(純方案-)
- 【MOOC】中學教育見習與實習-河北師范大學 中國大學慕課MOOC答案
- 《社會應急力量建設(shè)基礎(chǔ)規(guī)范 第3部分:山地搜救》知識培訓
- 《世界各國簡介》課件
- 新質(zhì)生產(chǎn)力與產(chǎn)品創(chuàng)新
- 能力素質(zhì)模型的正確打開方式(分享)
評論
0/150
提交評論