實(shí)驗(yàn)一語音信號端點(diǎn)檢測_第1頁
實(shí)驗(yàn)一語音信號端點(diǎn)檢測_第2頁
實(shí)驗(yàn)一語音信號端點(diǎn)檢測_第3頁
實(shí)驗(yàn)一語音信號端點(diǎn)檢測_第4頁
實(shí)驗(yàn)一語音信號端點(diǎn)檢測_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、實(shí)驗(yàn)一語音信號端點(diǎn)檢測一、實(shí)驗(yàn)?zāi)康?學(xué)會(huì) MATLAB的使用,掌握MATLAB的程序設(shè)計(jì)方法;2掌握語音處理的基本概念、基本理論和基本方法;3掌握基于MATLAB編程實(shí)現(xiàn)帶噪語音信號端點(diǎn)檢測;4學(xué)會(huì)用MATLAB對信號進(jìn)行分析和處理。5. 學(xué)會(huì)利用短時(shí)過零率和短時(shí)能量,對語音信號的端點(diǎn)進(jìn)行檢測。二、實(shí)驗(yàn)儀器設(shè)備及軟件MATLAB三、實(shí)驗(yàn)原理端點(diǎn)檢測是語音信號處理過程中非常重要的一步,它的準(zhǔn)確性直接影響到語音信號處理的速度和結(jié)果。 本次實(shí)驗(yàn)利用短時(shí)過零率和短時(shí)能量相結(jié)合的語音端點(diǎn)檢測算法利用短時(shí)過零率來檢測清音, 用短時(shí)能量來檢測濁音,兩者相配合便實(shí)現(xiàn)了信號信噪比較大情況下的端點(diǎn)檢測。算法對于輸

2、入信號的檢測過程可分為短時(shí)能量檢測和短時(shí)過零率檢測兩個(gè)部分。算法以短時(shí)能量檢測為主,短時(shí)過零率檢測為輔。根據(jù)語音的統(tǒng)計(jì)特性,可以把語音段分為清音、濁音以及靜音(包括背景噪聲)三種。在本算法中,短時(shí)能量檢測可以較好地區(qū)分出濁音和靜音。對于清音, 由于其能量較小, 在短時(shí)能量檢測中會(huì)因?yàn)榈陀谀芰块T限而被誤判為靜音;短時(shí)過零率則可以從語音中區(qū)分出靜音和清音。將兩種檢測結(jié)合起來,就可以檢測出語音段(清音和濁音)及靜音段1、短時(shí)能量計(jì)算定義 n 時(shí)刻某語言信號的短時(shí)平均能量En 為:nEn x(m)w(nm) 2 x(m) w(nm) 2mn ( N1)式中 N 為窗長,可見短時(shí)平均能量為一幀樣點(diǎn)值的平

3、方和。特殊地,當(dāng)窗函數(shù)為n矩形窗時(shí),有 Enx2(m)m n ( N 1)2、短時(shí)過零率過零就是指信號通過零值。過零率就是每秒內(nèi)信號值通過零值的次數(shù)。對于離散時(shí)間序列,過零則是指序列取樣值改變符號,過零率則是每個(gè)樣本的改變符號的次數(shù)。對于語音信號,則是指在一幀語音中語音信號波形穿過橫軸(零電平)的次數(shù)??梢杂孟噜弮蓚€(gè)取樣改變符號的次數(shù)來計(jì)算。如果窗的起點(diǎn)是n=0 ,短時(shí)過零率Z 為波形穿過橫軸(零電平)的次數(shù)Z1N 1Sgn(S (n 1) |0| Sgn( S (n)ww2 n 0sgn( x)1,x01, x0短時(shí)過零可以看作信號頻率的簡單度量濁音的短時(shí)平均幅度最大,無聲的短時(shí)平均幅度最小

4、,清音的短時(shí)過零率最大,無聲居中,濁音的短時(shí)過零率最小。3、短時(shí)自相關(guān)函數(shù)Nk 1Rw (k)sw(n)sw( nk)n 0是偶函數(shù); s(n)是周期的,那么 R( k)也是周期的;可用于基音周期估計(jì)和線性預(yù)測分析4、判斷語音信號的起點(diǎn)和終點(diǎn)利用短時(shí)平均幅度和短時(shí)過零率可以判斷語音信號的起點(diǎn)和終點(diǎn)。語音端點(diǎn)檢測方法可采用測試信號的短時(shí)能量或短時(shí)對數(shù)能量、聯(lián)合過零率等特征參數(shù),并采用雙門限判定法來檢測語音端點(diǎn), 即利用過零率檢測清音,用短時(shí)能量檢測濁音,兩者配合。首先為短時(shí)能量和過零率分別確定兩個(gè)門限,一個(gè)是較低的門限數(shù)值較小,對信號的變化比較敏感,很容易超過 ;另一個(gè)是比較高的門限,數(shù)值較大。

5、低門限被超過未必是語音的開始,有可能是很短的噪聲引起的,高門限被超過并且接下來的自定義時(shí)間段內(nèi)的語音。四、實(shí)驗(yàn)步驟及程序(1) 實(shí)驗(yàn)步驟:1、取一段錄音作為音頻樣本。2、利用公式分別編程計(jì)算這段語音信號的短時(shí)能量和短時(shí)過零率,然后分別畫出它們的曲線。3、調(diào)整能量門限。4、進(jìn)行幅度歸一化并設(shè)置幀長、短時(shí)能量閾值、過零率閾值等參數(shù)。5、編寫程序?qū)崿F(xiàn)語音端點(diǎn)檢測。6、最后得到語音端點(diǎn)檢測圖像。(2) 語音信號的端點(diǎn)檢測程序流程圖:輸入語音信號幅度歸一化設(shè)置參數(shù)計(jì)算短時(shí)能量和過零率調(diào)整能量門限開始端點(diǎn)檢測輸出樣本端點(diǎn)檢測圖像圖 1.1 語音信號的端點(diǎn)檢測程序流程圖(3) 語音信號的端點(diǎn)檢測實(shí)驗(yàn)源程序:

6、x,fs,nbits=wavread(1.wavx = x / max(abs(x);FrameLen = 256;inc = 90;);amp1 = 10;amp2 = 2;zcr1 = 10;zcr2 = 5;minsilence = 6;minlen = 15;status = 0;count= 0;silence = 0;tmp1 = enframe(x(1:end-1), FrameLen,inc);tmp2 = enframe(x(2:end) , FrameLen,inc);signs = (tmp1.*tmp2)0.02;zcr= sum(signs.*diffs,2);amp

7、 = sum(abs(enframe(filter(1-0.9375,1, x), FrameLen,inc).2,2);amp1 = min(amp1, max(amp)/4);amp2 = min(amp2, max(amp)/8);forn=1:length(zcr)goto = 0;switchstatuscase0,1ifamp(n) amp1x1 = max(n-count-1,1);status = 2;silence = 0;count= count + 1;elseifamp(n) amp2 | zcr(n) zcr2status = 1;count = count + 1;

8、elsestatus = 0;count= 0;endcase2,ifamp(n) amp2 |zcr(n) zcr2count = count + 1;elsesilence = silence+1;ifsilence minsilencecount = count + 1;elseifcount minlenstatus = 0;silence = 0;count= 0;elsestatus = 3;endendcase3,break;endendcount = count-silence/2;x2 = x1 + count -1;subplot(3,1,1)plot(x)axis(1 l

9、ength(x) -1 1)xlabel( 幀數(shù) );ylabel(Speech);line(x1*inc x1*inc, -1 1,Color,red);line(x2*inc x2*inc, -1 1,Color,red);subplot(3,1,2)plot(amp);axis(1 length(amp) 0 max(amp)xlabel( 幀數(shù) );ylabel(Energy);line(x1 x1, min(amp),max(amp),Color,red);line(x2 x2, min(amp),max(amp),Color,red);subplot(3,1,3)plot(zcr)

10、;axis(1 length(zcr) 0 max(zcr)xlabel( 幀數(shù) );ylabel(ZCR );line(x1 x1, min(zcr),max(zcr),Color,red);line(x2 x2, min(zcr),max(zcr),Color,red);五、實(shí)驗(yàn)結(jié)果與分析圖 1.2 語音信號的端點(diǎn)檢測實(shí)驗(yàn)結(jié)果輸出圖像( 1)從圖中可以明顯看出,濁音的短時(shí)能量大、短時(shí)過零率低。清音的短時(shí)能量小、短時(shí)過零率高。( 2)門限的選取對語音檢測結(jié)果有很大影響。( 3)僅僅根據(jù)能量判斷是比較粗糙的,還需要根據(jù)過零率進(jìn)行判斷。因?yàn)榍逡艉驮肼暤亩虝r(shí)平均過零率比背景噪聲的平均過零率要高出好幾倍。六、實(shí)驗(yàn)體會(huì)這次的實(shí)驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論