用MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的時(shí)域分析.doc_第1頁(yè)
用MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的時(shí)域分析.doc_第2頁(yè)
用MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的時(shí)域分析.doc_第3頁(yè)
用MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的時(shí)域分析.doc_第4頁(yè)
用MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的時(shí)域分析.doc_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

實(shí)驗(yàn)一、用MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的時(shí)域分析1. 實(shí)驗(yàn)?zāi)康挠^察并驗(yàn)證語(yǔ)音信號(hào)的時(shí)域特性,理解并掌握典型的語(yǔ)音信號(hào)時(shí)域分析方法和時(shí)域特征,為深入學(xué)習(xí)語(yǔ)音信號(hào)處理的各種應(yīng)用奠定基礎(chǔ)。2. MATLAB程序代碼(1) 由麥克風(fēng)采集語(yǔ)音數(shù)據(jù),將采集的數(shù)據(jù)存成WAV文件(采樣率為8000Hz),存在本人的文件夾中。所用程序代碼為:clear;close all;Fs=8000;y=wavrecord(5*Fs,Fs,double);wavwrite(y,f:a);soundview(y,Fs,name) (2)讀取WAV文件,顯示語(yǔ)音信號(hào)的波形。所用程序代碼為:x = wavread(f:a.wav);figure;plot(x);axis(0,size(x,1),-0.35,0.3); %坐標(biāo)軸范圍title(語(yǔ)音信號(hào)時(shí)域波形);xlabel(樣點(diǎn)數(shù)); ylabel(幅度);(3) 讀取WAV文件,計(jì)算并顯示語(yǔ)音的短時(shí)能量(窗函數(shù)為矩形窗,幀長(zhǎng)為20)。所用程序代碼為:x = wavread(f:a.wav); x = double(x);f = enframe(x,20, 100); energy = sum(abs(f), 2); subplot(2,2,1);plot(x); axis(0,size(x,1),-0.7,0.9);title(語(yǔ)音信號(hào)時(shí)域波形);xlabel(樣點(diǎn)數(shù)); ylabel(幅度);subplot(2,2,2);plot(energy); title(語(yǔ)音信號(hào)的短時(shí)能量); legend(幀長(zhǎng)LEN = 20);f = enframe(x,20, 200); energy = sum(abs(f), 2); subplot(2,2,3);plot(energy); title(語(yǔ)音信號(hào)的短時(shí)能量); legend(幀長(zhǎng)LEN = 100);f = enframe(x,20, 400); energy = sum(abs(f), 2); subplot(2,2,4);plot(energy); title(語(yǔ)音信號(hào)的短時(shí)能量); legend(幀長(zhǎng)LEN = 200); (4)讀取WAV文件,計(jì)算并顯示語(yǔ)音的短時(shí)過(guò)零率(窗函數(shù)為矩形窗,幀長(zhǎng)為256,幀移為128),所用程序代碼為:x = wavread(f:a.wav); x = double(x);LEN =100;INC=100;f = enframe(x, LEN, INC); %分幀% 計(jì)算短時(shí)過(guò)零率z = zeros(size(f,1),1); difs =0.01; for i=1:size(f,1)s=f(i,:); for j=1:(length(s)-1)if s(j)* s(j+1)difs; z(i)= z(i)+1;endendendsubplot(2,1,1); plot(x); axis(0,size(x,1),-0.35,0.3);title(語(yǔ)音信號(hào)時(shí)域波形); xlabel(樣點(diǎn)數(shù)); ylabel(幅度);subplot(2,1,2);plot(z); title(語(yǔ)音信號(hào)的短時(shí)過(guò)零率);xlabel(幀數(shù)); ylabel(短時(shí)過(guò)零率);(5) 讀取WAV文件,當(dāng)窗函數(shù)為矩形窗、幀長(zhǎng)為20時(shí),計(jì)算一幀濁音的短時(shí)自相關(guān)函數(shù)所用的程序代碼為: x = wavread(f:a.wav); x = double(x);LEN = 100;INC= 100;f = enframe(x, LEN, INC); ff=f(72,:); %選取一幀濁音信號(hào) ff=ff.*rectwin(length(ff); % 計(jì)算短時(shí)自相關(guān)N=LEN; R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.5,0.5)title(加矩形窗的語(yǔ)音幀); xlabel(樣點(diǎn)數(shù)); ylabel(幅度);subplot(2,1,2); plot(R1); axis(0,N,-1,1)title(加矩形窗的短時(shí)自相關(guān)函數(shù)); xlabel(k); ylabel(R(k);3. 實(shí)驗(yàn)結(jié)果及其分析(1) 本實(shí)驗(yàn)利用8000Hz的采樣頻率對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行采樣,采樣點(diǎn)數(shù)為40000個(gè),持續(xù)時(shí)間為4秒,存儲(chǔ)格式為double。之后將數(shù)字語(yǔ)音數(shù)據(jù)寫入F盤的a.wav文件,這段波形是讀音為ke的波形,并通過(guò)放音設(shè)備進(jìn)行回放。回放的GUI界面如圖1所示,通過(guò)該界面可以觀察采集的語(yǔ)音信號(hào)。圖1 用soundview函數(shù)顯示的語(yǔ)音信號(hào)(2)本實(shí)驗(yàn)將L盤的a.wav文件讀取出來(lái),并顯示文件中的語(yǔ)音信號(hào)波形,顯示的波形如圖2所示。該波形是漢語(yǔ)拼音“ke”的時(shí)域波形。從圖2可以看出,K是清音,它的波形峰值較低;e是濁音,它的波形峰值較高。圖2 語(yǔ)音“ke”的時(shí)域波形(3) 本實(shí)驗(yàn)將L盤的a.wav文件讀取出來(lái),當(dāng)幀長(zhǎng)取不同值時(shí)計(jì)算語(yǔ)音信號(hào)的短時(shí)能量,如圖3所示。從圖3可以看出,濁音短時(shí)能量大,短時(shí)平均幅度大,短時(shí)過(guò)零率低,濁音具有較強(qiáng)的能量值,音段內(nèi)隱藏信息的能力高。清音短時(shí)能量小,短時(shí)平均幅度小,能量值較低,音段內(nèi)隱藏信息的能力較低;圖3 不同幀長(zhǎng)對(duì)應(yīng)的短時(shí)能量(4)本實(shí)驗(yàn)首先讀取a.wav中的語(yǔ)音數(shù)據(jù),之后計(jì)算每一幀的短時(shí)過(guò)零率,最后將原始語(yǔ)音信號(hào)和短時(shí)過(guò)零率顯示出來(lái),如圖4所示。從圖4可以看出,清音的過(guò)零率較高,濁音的過(guò)零率較低。圖4 短時(shí)過(guò)零率(5)本實(shí)驗(yàn)首先讀取a.wav中的語(yǔ)音數(shù)據(jù),之后對(duì)數(shù)據(jù)進(jìn)行分幀加窗處理,幀長(zhǎng)為256,幀移為128。選取其中的一幀濁音(第*幀)并計(jì)算這幀的短時(shí)自相關(guān)函數(shù)。當(dāng)窗函數(shù)分別為矩形窗和漢明窗時(shí),截取的語(yǔ)音信號(hào)和短時(shí)自相關(guān)函數(shù)如圖5和圖6所示。從圖5和圖6可以看出,矩形窗能夠比漢明窗更明顯的顯示出第一個(gè)峰值。當(dāng)窗函數(shù)為矩形窗,不同幀長(zhǎng)(幀移=幀長(zhǎng))的一幀濁音對(duì)應(yīng)的短時(shí)自相關(guān)函數(shù)如圖7和圖8所示。從圖7和圖8可以看出,幀長(zhǎng)越長(zhǎng),越容易區(qū)分其最大值。當(dāng)窗函數(shù)為矩形窗,幀長(zhǎng)為256,幀移為128,選取一幀清音,獲得的短時(shí)自相關(guān)函數(shù)如圖9所示。從圖5和圖9可以看出,濁音具有明顯的周期性,清音無(wú)明顯周期。圖5 加矩形窗的短時(shí)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論