音頻的采集及分析處理_第1頁(yè)
音頻的采集及分析處理_第2頁(yè)
音頻的采集及分析處理_第3頁(yè)
音頻的采集及分析處理_第4頁(yè)
音頻的采集及分析處理_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語(yǔ)音的采集及分析處理Sound acquisition and analysis02013435 趙斌指導(dǎo)教師 胡建中課程:機(jī)械工程測(cè)試與控制技術(shù)時(shí)間:2016年5月19日School of mechanical engineering SEU摘要:本項(xiàng)目是對(duì)信號(hào)采集、分析與處理相關(guān)知識(shí)的一次應(yīng)用,通過(guò)錄音軟件獲得三個(gè)實(shí)驗(yàn)者的聲音,并運(yùn)用MATLAB軟件對(duì)采集的語(yǔ)音信號(hào)進(jìn)行分析處理。此次項(xiàng)目研究主要分三個(gè)部分:首先是語(yǔ)音信號(hào)的采集,利用錄音軟件錄取三個(gè)實(shí)驗(yàn)者的聲音。其次是對(duì)錄取的語(yǔ)音信號(hào)進(jìn)行格式的轉(zhuǎn)換,統(tǒng)一轉(zhuǎn)換為MP3格式。最后是利用MATLAB對(duì)語(yǔ)音信號(hào)進(jìn)行時(shí)域和頻域分析與處理。項(xiàng)目最終研究

2、結(jié)果成功將采集的人聲區(qū)分,并通過(guò)改變采樣頻率對(duì)聲音做了處理,使其相較與源語(yǔ)音發(fā)生了較大變化。關(guān)鍵詞:語(yǔ)音采集,時(shí)域分析,頻域分析,MATLAB1、 語(yǔ)音采集1.1 題目Computer can convert analog signals to digital signals by sampling the voice or the video. The sentence of "mechanical engineering measurement and control technology" must be read by more than 3 people and

3、be recorded under the condition of different environmental noise using microphone and sound card in computer.First, the recorded voice is converted into a data file ASCII text with the help of professional software, then spectrum analysis is processed and the figure in time domain and frequency doma

4、in is drawn.Recording software, such as: 藍(lán)光影音MP3錄音機(jī)Matlab program of reading MP3 files: mp3readwriteDiscussion:1) Understand the sampling frequency and its effect on quality for the APE, MP3 and WMA audio format file.2) How to set the sampling frequency(采樣頻率)? what is the appropr

5、iate sampling length(采樣長(zhǎng)度)?3) According to your analysis, how to distinguish speech sound of different people?4) What measures can be taken to make your speech sound identified difficultly by others?1.2 原始信號(hào)采集與處理通過(guò)手機(jī)自帶錄音功能,錄取三位實(shí)驗(yàn)者的“機(jī)械工程測(cè)試與控制系統(tǒng)”語(yǔ)句,得到三個(gè)語(yǔ)音文件zb.m4a,hdh.m4a,lxy.m4a。2、語(yǔ)音信號(hào)的分析處理2

6、.1 語(yǔ)音格式轉(zhuǎn)換通過(guò)參考函數(shù)mp3write,將m4a格式轉(zhuǎn)換為mp3格式。在讀取語(yǔ)音文件時(shí),注意到MATLAB R2014版本函數(shù)庫(kù)中有讀取語(yǔ)音函數(shù)audioread,該函數(shù)支持mp3格式語(yǔ)音的讀取,所以在程序中沒(méi)有使用提供的函數(shù)mp3read。轉(zhuǎn)換完成保存。2.2 時(shí)域與頻域的分析處理對(duì)獲取的信號(hào)繪制時(shí)域波形,并通過(guò)FFT繪制頻域波形。圖(1) 實(shí)驗(yàn)者zb語(yǔ)音的時(shí)域波形和幅頻譜圖圖(2) 實(shí)驗(yàn)者h(yuǎn)dh語(yǔ)音的時(shí)域波形和幅頻譜圖圖(3) 實(shí)驗(yàn)者lxy語(yǔ)音的時(shí)域波形和幅頻譜圖3、討論3.1采樣頻率的影響采樣時(shí)在模數(shù)轉(zhuǎn)換過(guò)程中以一定規(guī)律,如時(shí)間間隔,對(duì)連續(xù)時(shí)間信號(hào)進(jìn)行取值的過(guò)程。其數(shù)學(xué)描述就是用

7、間隔為Ts的周期單位脈沖序列g(shù)(t)去乘以模擬信號(hào)x(t)。g(t)可寫為 ( )由函數(shù)性質(zhì)可知 ( ) 說(shuō)明經(jīng)時(shí)域采樣后,各采樣點(diǎn)的信號(hào)幅值為,其中Ts為采樣間隔,為采樣頻率。3.2采樣頻率的設(shè)置及采樣長(zhǎng)度的確定通過(guò)MATLAB中函數(shù)獲得錄取語(yǔ)音的采樣頻率為48000Hz。通過(guò)查閱資料知道人聲音的頻率一般是204000Hz,當(dāng)Fs=48000Hz時(shí),滿足采樣定理,所以這樣設(shè)置采樣頻率合理。根據(jù)圖(1)(2)(3)可以看出,這樣設(shè)置采樣頻率獲得的圖像時(shí)全保真的。采樣長(zhǎng)度取決于錄音的時(shí)間長(zhǎng)短,但不易過(guò)短,過(guò)短不能完整體現(xiàn)整個(gè)語(yǔ)音長(zhǎng)度的特征,過(guò)長(zhǎng)會(huì)增加運(yùn)算量,增加計(jì)算機(jī)負(fù)擔(dān)。3.3區(qū)分不同的聲音不

8、同的實(shí)驗(yàn)者,其說(shuō)話聲音的響度和音調(diào)不同,反應(yīng)到時(shí)域上就是信號(hào)幅值的不同,反應(yīng)到頻域上就是特征頻率在頻譜圖上的分布不同。三個(gè)實(shí)驗(yàn)者均為男生,錄制環(huán)境為圖書館,通過(guò)圖(1)(2)(3)可以看出,不同實(shí)驗(yàn)者時(shí)域圖的區(qū)別即為振幅的差異,頻域圖的區(qū)別為聲音特征頻率的分布不同,三個(gè)實(shí)驗(yàn)者語(yǔ)音的特征頻率分布大致集中在250Hz左右。理論上,區(qū)分不同人聲的主要靠特征頻率的不同,但實(shí)驗(yàn)對(duì)象均為男生,音調(diào)比較接近,在頻譜圖上看不出太大區(qū)別,但每個(gè)人的音調(diào)是不能改編的,所以用頻率特征區(qū)分不同人聲比較準(zhǔn)確。雖然三個(gè)實(shí)驗(yàn)者的時(shí)域波形有較大差異,但只要改變講話者的說(shuō)話輕重,就能改變時(shí)域波形,所以時(shí)域特征不能用來(lái)區(qū)分不同的

9、聲音。3.4 讓聲音沒(méi)有區(qū)分度的方法利用改變采樣頻率的處理方法,可使源語(yǔ)音的特征頻率改變。如圖圖(4)Fs=48000Hz時(shí)的時(shí)域圖和頻域圖圖(5)Fs=60000Hz時(shí)的時(shí)域圖和頻域圖圖(6)Fs=60000Hz時(shí)的時(shí)域圖和頻域圖通過(guò)對(duì)比圖(4)(5)(6)中的頻域圖,可以看出隨著采樣頻率的增大(減?。?,對(duì)應(yīng)語(yǔ)音的特征頻率也增大(減?。?,即語(yǔ)音的音調(diào)改變。利用MATLAB中的函數(shù)sound可明顯的聽(tīng)出語(yǔ)音音調(diào)的變化。致 謝感謝胡建中老師在測(cè)試系統(tǒng)學(xué)習(xí)方面給我的教導(dǎo)和幫助,在我做項(xiàng)目的過(guò)程中為我答疑解惑,解決難題,使我能夠順利完成項(xiàng)目?jī)?nèi)容。參考文獻(xiàn):1.賈平民,張洪亭主編. 測(cè)試技術(shù)(第二版)

10、. 北京:高等教育出版社. 2012. 31-692. Dan Ellis,demo_mp3readwriteEB/OL. 2009.附錄:matlab程序代碼x,fs=audioread('zb.m4a');mp3write(x,fs,'zb.mp3')x,fs=audioread('zb.mp3'); %read mp3 format file Fs=48000; % sampling frequencyL=length(x); t=(0:L-1)/Fs;subplot(211);plot(t,x);title('zb.mp3 waveform of time domain');xlabel('time/s');ylabel('amplitude'); Y = fft(x,L)*2;f = Fs/L*(0:1:L-1);A = abs(Y); %amplitudeP = angle(Y); %phasesu

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論