語音信號處理實(shí)驗報告_第1頁
語音信號處理實(shí)驗報告_第2頁
語音信號處理實(shí)驗報告_第3頁
語音信號處理實(shí)驗報告_第4頁
語音信號處理實(shí)驗報告_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、語音信號處理實(shí)驗報告實(shí)驗一:語音信號的端點(diǎn)檢測學(xué)院:電子與信息學(xué)院專業(yè):11級信息工程姓名:學(xué)號:提交日期:2014.4.23實(shí)驗一:語音信號的端點(diǎn)檢測1、 實(shí)驗內(nèi)容語音信號端點(diǎn)檢測技術(shù)其目的就是從包含語音的一段信號中準(zhǔn)確地確定語音的起始點(diǎn)和終止點(diǎn),區(qū)分語音和非語音信號,它是語音處理技術(shù)中的一個重要方面。本實(shí)驗的目的就是要掌握基于matlab編程實(shí)現(xiàn)帶噪語音信號端點(diǎn)檢測,利用matlab對信號進(jìn)行分析和處理,學(xué)會利用短時過零率和短時能量,對語音信號的端點(diǎn)進(jìn)行檢測。2、 實(shí)驗方法本實(shí)驗中,端點(diǎn)檢測的方法有兩種:短時能量和短時過零率。2.1.1、短時能量語音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,語音

2、段的能量比噪聲段能量大,語音段的能量是噪聲段能量疊加語音聲波能量的和。在信噪比很高時,那么只要計算輸入信號的短時能量或短時平均幅度就能夠把語音段和噪聲背景區(qū)分開。這是僅基于短時能量的端點(diǎn)檢測方法。信號x(n)的短時能量定義為:2.1.2、短時平均過零率短時過零表示一幀語音信號波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時域分析中最簡單的一種。對于連續(xù)語音信號,過零意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值的改變符號稱為過零。過零率就是樣本改變符號次數(shù)。信號x(n)的短時平均過零率定義為:2.2、檢測方法利用過零率檢測清音,用短時能量檢測濁音,兩者配合。首先為短時能量和過零率分別

3、確定兩個門限,一個是較低的門限數(shù)值較小,對信號的變化比較敏感,很容易超過;另一個是比較高的門限,數(shù)值較大。低門限被超過未必是語音的開始,有可能是很短的噪聲引起的,高門限被超過并且接下來的自定義時間段內(nèi)的語音超過低門限,意味著信號開始。此時整個端點(diǎn)檢測可分為四段:靜音段、過渡段、語音段、結(jié)束。實(shí)驗時使用一個變量表示當(dāng)前狀態(tài)。靜音段,如果能量或過零率超過低門限,就開始標(biāo)記起始點(diǎn),進(jìn)入過渡段。過渡段當(dāng)兩個參數(shù)值都回落到低門限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。而如果過渡段中兩個參數(shù)中的任一個超過高門限,即被認(rèn)為進(jìn)入語音段。處于語音段時,如果兩參數(shù)降低到門限以下,而且總的計時長度小于最短時間門限,則認(rèn)為

4、是一段噪音,繼續(xù)掃描以后的語音數(shù)據(jù),否則標(biāo)一記結(jié)束端點(diǎn)。2.3、實(shí)驗過程1、錄取一段錄音,采樣率8k,單聲道2、用matlab的wavread函數(shù)把錄音都進(jìn)來并進(jìn)行歸一化處理3、對語音信號進(jìn)行預(yù)加重,分幀處理4、對每幀分別計算短時能量和短時門限過零率5、進(jìn)行短時能量閾值、過零率閾值等參數(shù)6、編寫程序?qū)崿F(xiàn)語音檢測端點(diǎn)并繪出檢測圖3、實(shí)驗結(jié)果4、實(shí)驗分析4.1結(jié)果分析從結(jié)果圖可知,本次實(shí)驗是成功的,語音信號的端點(diǎn)基本都檢測出來了。短時能量和短時過零率的檢測結(jié)果和信號的端點(diǎn)分布一致。語音段的能量值比過渡段和靜音段的能量都大,語音的過零率比過渡段和靜音段的也都大。4.2實(shí)驗總結(jié)這次實(shí)驗利用matlab

5、對信號進(jìn)行分析和處理,利用短時過零率和短時能量,對語音信號的端點(diǎn)進(jìn)行檢測。由于知識儲備的不足,在實(shí)驗過程中還是遇到比較大的困難,端點(diǎn)檢測代碼是參考網(wǎng)上的,在理解的基礎(chǔ)上加以修改和改進(jìn)。但是預(yù)處理、加窗分幀、短時能量、短時過零率的代碼都是我自己根據(jù)原理編寫的,所有總的來說收獲還是很大的。代碼如下:function point_check()s1=wavread(1_1.wav);s=s1/max(abs(s1);s=filter(1 -0.9375,1,s);%預(yù)加重plot(s);len=length(s);round=160;%幀長repeat=80;%幀移inc=round-repeat;

6、%b_len-2*repeat;ka=ceil(len-round)/(round-repeat)+1;%總幀數(shù)s=s;zeros(round-repeat)*(ka-1)+round-len,1);len=length(s);%以下進(jìn)行分針操作w=zeros(round,ka); for i=1:ka for k=1:round w(k,i)=s(k+(i-1)*(round-repeat),1); end end%計算過零率st=0.01;%過零門限f=zeros(ka,1);%計算短時能量幅度差f=zeros(ka,round);for i=1:ka for k=0:round-1 fo

7、r j=1:round-k f(ka,k+1)=f(ka,k+1)+abs(w(j,i)-w(j+k,i);%計算短時能量幅度差 end if(k0&w(k+2,i)0) z=sign(w(k+1,i)-st)-sign(w(k+2,i)+st);%計算過零率 elseif(w(k+1,i)0) z=sign(w(k+2,i)-st)-sign(w(k+1,i)+st);%計算過零率 end if(z=2) f(i,1)=f(i,1)+1;%計算過零率 end end endendamp=sum(abs(w).2,1);%計算端點(diǎn)amp1=10;%短時能量閾值?amp2=2;zcr1=10;%

8、過零率閾值?zcr2=6;minsilence=6;%用無聲的長度來判斷語音是否結(jié)束?minlen=15;%判斷是語音的最小長度?status=0;%記錄語音段的狀態(tài)?count=0;%語音序列的長度?silence=0;%無聲的長度xpoint=;amp1=min(amp1,max(amp)/4);amp2=min(amp2,max(amp)/8);%一下開始斷點(diǎn)檢測for n=1:ka %goto =0; switch status case 0,1;%?0?=?靜音,?1?=?可能開始 if amp(n) amp1 %?確信進(jìn)入語音段? x1=max(n-count-1,1);%?記錄語

9、音段的起始點(diǎn)? xpoint=xpoint,x1; status = 2; silence = 0; count = count + 1; elseif amp(n) amp2 | f(n) zcr2 % 可能處于語音段 status = 1; count = count + 1; else % 靜音狀態(tài) status = 0; count = 0; end case 2, % 2 = 語音段 if amp(n) amp2 |f(n) zcr2 % 保持在語音段 count = count + 1; else % 語音將結(jié)束 silence = silence+1; if silence mi

10、nsilence % 靜音還不夠長,尚未結(jié)束 count = count + 1; elseif count minlen % 語音長度太短,認(rèn)為是噪聲 status = 0; silence = 0; count = 0; else % 語音結(jié)束 status = 3; end end case 3, status=0; count = count-silence/2; x2 = x1 + count -1; %記錄語音段結(jié)束點(diǎn) xpoint=xpoint,x2; count=0; silence=0; endend subplot(3,1,1)plot(s)axis(1 length(s) -1 1)ylabel(speech);for i=1:length(xpoint) line(xpoint(i)*inc xpoint(i)*inc, -1 1, color, red);endsubplot(3,1,2)plot(amp);axis(1 length(amp) 0 max(amp)ylabel(energy);for i=1:length(xpoint) line(xpoint(i) xpoint(i),min(am

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論