音訊讀寫錄制與播放.ppt_第1頁
音訊讀寫錄制與播放.ppt_第2頁
音訊讀寫錄制與播放.ppt_第3頁
音訊讀寫錄制與播放.ppt_第4頁
音訊讀寫錄制與播放.ppt_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

音訊讀寫、錄製與播放,張智星 .tw .tw/jang 清大資工系 多媒體檢索實驗室,20-1 音訊的基本介紹,聲音訊號(Audio Signal)簡稱音訊,泛指由人耳聽到的各種聲音的訊號。音訊有些基本的特質(zhì),可說明如下: 音量(Volume):聲音的大小稱為音量,又稱為力度、強度(Intensity)或是能量(Energy)。音量越大,代表音訊波形的震幅越大。 音高(Pitch):聲音的基本頻率(Fundamental Frequency)越高,代表音高越高(例如女高音的歌聲);反之,聲音的基本頻率越低,代表音高越低(例如男低音的歌聲)。(有關(guān)基本頻率的說明,將在本章其後各小節(jié)說明。) 音色(Timber):音訊波形在每個週期內(nèi)的變化,就形成了此音訊的音色。不同的音色即代表不同的音訊內(nèi)容,例如不同的字有不同的發(fā)音,或是不同的歌手有不同的特色,這些都是由於音色不同而產(chǎn)生。,20-2 WAV檔案的讀取範(fàn)例之一,例如,若要讀取光碟中的檔案 welcome.wav,畫出音訊的波形並播放出此音訊,可使用下列程式: 範(fàn)例20-1: readWave01.m,y, fs=wavread(welcome.wav); sound(y, fs); % 播放此音訊 time=(1:length(y)/fs; % 時間軸的向量 plot(time, y); % 畫出時間軸上的波形,20-2 WAV檔案的讀取範(fàn)例之一,執(zhí)行結(jié)果:歡迎光臨波形圖,20-2 WAV檔案的讀取範(fàn)例之二,若要知道 welcome.wav 的取樣點是由多少個位元來表示,可使用 y, fs, nbits = wavread(welcome.wav)。若要知道音訊長度,則可使用 length(y)/fs。以下範(fàn)例可以印出音訊檔 welcome.wav 的各種相關(guān)資訊: 範(fàn)例20-2: readWave02.m,fileName=welcome.wav; y, fs, nbits=wavread(fileName); fprintf(音訊檔案 “%s“ 的資訊:n, fileName); fprintf(音訊長度 = %g 秒n, length(y)/fs); fprintf(取樣頻率 = %g 取樣點/秒n, fs); fprintf(解析度 = %g 位元/取樣點n, nbits);,20-2 WAV檔案的讀取範(fàn)例之二,範(fàn)例20-2執(zhí)行結(jié)果: 音訊檔案 “welcome.wav“ 的資訊: 音訊長度 = 1.45134 秒 取樣頻率 = 11025 取樣點/秒 解析度 = 8 位元/取樣點,20-2 WAV檔案的讀取範(fàn)例之三,wav 檔案的 8 位元是以 unsigned integer的方式來儲存,因此所能表示的數(shù)值是介於 0 和 255 之間,MATLAB 再將此值設(shè)定至變數(shù) y 時,會自動將其數(shù)值調(diào)整至介於 1 和 1 之間,因此若要將 MATLAB 讀出之?dāng)?shù)值轉(zhuǎn)回原先 8 位元所表示之?dāng)?shù)值,只要將變數(shù) y 乘以 128,再加上 128,就可以得到原先的整數(shù)值,例如: 範(fàn)例20-3: readWave03.m difference = 0,fileName=welcome.wav; y, fs, nbits=wavread(fileName); y0=y*(2nbits/2)+(2nbits/2); % y0 是原先儲存在音訊檔案中的值 difference=sum(abs(y0-round(y0),20-2 WAV檔案的讀取範(fàn)例之四,wavread 也可以讀取雙聲道或立體聲(Stereo)的音訊檔案,此時傳回的變數(shù)為具有兩直行的陣列,每一直行代表一個聲道的音訊,例如: 範(fàn)例20-4: readWave04.m,fileName=flanger.wav; y, fs=wavread(fileName); % 讀取音訊檔 sound(y, fs); % 播放音訊 left=y(:,1); % 左聲道音訊 right=y(:,2); % 右聲道音訊 subplot(2,1,1), plot(1:length(left)/fs, left); subplot(2,1,2), plot(1:length(right)/fs, right);,20-2 WAV檔案的讀取範(fàn)例之四,此範(fàn)例會讀取雙聲道的音訊檔 flanger.wav,播放此雙聲道的音訊,並畫出兩個聲道的音訊波形如下:,20-2 WAV檔案的讀取範(fàn)例之五,如果音訊檔案很大,無法一次讀入記憶體,我們也可以使用 wavread 來讀出音訊檔的其中一部份,例如: 範(fàn)例20-5: readWave05.m,y,fs=wavread(welcome.wav, 4001 5000); % 讀取第4001至5000點 figure; plot(y),20-2 WAV檔案的讀取範(fàn)例之五,畫出之圖形如下:,20-2 WAV檔案的讀取範(fàn)例之六,若要取得 wav 檔案的更多資訊,可由 wavread 的第四個輸出變數(shù)得到,例如: 範(fàn)例20-6: readWave06.m ans = wFormatTag: 1 nChannels: 2 nSamplesPerSec: 22050 nAvgBytesPerSec: 88200 nBlockAlign: 4 nBitsPerSample: 16,y, fs, nbits, opts=wavread(flanger.wav); opts.fmt,20-3 聲音訊號的播放,一旦我們可以讀入 wav 檔案,就可以對聲音訊號進(jìn)行各種處理,例如增大或減小音量、提高或降低音高、消除雜訊等。要確認(rèn)處理後的聲音訊號是否符合所需,就要能夠把音訊直接透過 PC 喇叭播放出來,本節(jié)就是要介紹如何使用 MATLAB 來進(jìn)行音訊的播放。,20-3 WAV檔案的播放範(fàn)例之一,在前一節(jié)中,我們已經(jīng)知道如何讀 wav 檔案,一旦 MATLAB 讀入音訊資料,並將之設(shè)定成工作空間中的變數(shù)後,我們就可以使用 wavplay 指令來直接播放此變數(shù)。例如: 範(fàn)例20-7: wavPlay01.m,load handel.mat % 載入儲存於 handel.mat 的音訊 wavplay(y, Fs); % 播放此音訊,20-3 WAV檔案的播放範(fàn)例之二,我們在第一節(jié)提到過,聲音的音量是由聲波的震幅來決定,因此我們可藉由震幅的大小來改變音量,例如: 範(fàn)例20-8: playVolume01.m,y, fs=wavread(welcome.wav); wavplay(1*y, fs, sync); % 播放1倍震幅的音訊 wavplay(3*y, fs, sync); % 播放2倍震幅的音訊 wavplay(5*y, fs, sync); % 播放3倍震幅的音訊,20-3 WAV檔案的播放範(fàn)例之三,如果在播放時,改變?nèi)宇l率,就會改變整個音訊的時間長度,進(jìn)而影響到音高。在下例中,我們漸漸提高播放時的取樣頻率,聽到的聲音就會越來越快、越來越高,最後出現(xiàn)像唐老鴨的聲音: 範(fàn)例20-9: playFs01.m,y, fs=wavread(welcome.wav); wavplay(y, 1.0*fs, sync); % 播放 1.0 倍速度的音訊 wavplay(y, 1.2*fs, sync); % 播放 1.2 倍速度的音訊 wavplay(y, 1.5*fs, sync); % 播放 1.5 倍速度的音訊 wavplay(y, 2.0*fs, sync); % 播放 2.0 倍速度的音訊,20-3 WAV檔案的播放範(fàn)例之四,反之,如果漸漸降低播放的頻率,聽到的聲音就會越來越慢、越來越低,最後出現(xiàn)像牛叫的聲音: 範(fàn)例20-10: playFs02.m,y, fs=wavread(welcome.wav); wavplay(y, 1.0*fs, sync); % 播放 1.0 倍速度的音訊 wavplay(y, 0.9*fs, sync); % 播放 0.9 倍速度的音訊 wavplay(y, 0.8*fs, sync); % 播放 0.8 倍速度的音訊 wavplay(y, 0.6*fs, sync); % 播放 0.6 倍速度的音訊,20-3 WAV檔案的播放範(fàn)例之五,如果我們將聲波訊號上下顛倒,聽到的聲音基本上是一樣的,但是如果前後顛倒,聽到的聲音就如同錄音帶倒放的聲音,聽起來很像是某種外國語音,請試試下列範(fàn)例: 範(fàn)例20-11: playReverse01.m,y, fs=wavread(welcome.wav); wavplay(y, fs, sync); % 播放正常的音訊波形 wavplay(-y, fs, sync); % 播放上下顛倒的音訊波形 wavplay(flipud(y), fs, sync); % 播放前後顛倒的音訊波形,20-3 WAV檔案的播放範(fàn)例之六,通常在使用 wavplay 播放音訊時,MATLAB 會停止進(jìn)行其他動作,直到音訊播放完畢後,才會再進(jìn)行其他指令的運算,此種運作方式稱為同步式(Synchronous)。若需要一邊播放、一邊進(jìn)行其他運算,就必須使用非同步式(Asynchronous)的播放方式,例如: 範(fàn)例20-12: playSync01.m,y, fs=wavread(welcome.wav); wavplay(y, 1.0*fs, sync); % 同步播放 1.0 倍速度的音訊 wavplay(y, 0.8*fs, async); % 非同步播放 0.8 倍速度的音訊 wavplay(y, 0.6*fs, async); % 非同步播放 0.6 倍速度的音訊,20-3 WAV檔案的播放範(fàn)例之七,wavplay 只能用在微軟的視窗平臺,而且若在 MATLAB 5.x, 你還必須要有訊號處理工具箱,才能使用這個指令。若要使用適用於一般平臺的播放功能,就要改用 sound 指令。 在此例中,我們會聽到類似男女兩部合唱,一快一慢,這是因為 sound 指令的預(yù)設(shè)播放方式就是非同步。 範(fàn)例20-13: playSync02.m,load handel.mat sound(y, Fs); sound(y, 1.2*Fs);,20-3 WAV檔案的播放範(fàn)例之八,另一個類似的指令是 soundsc,此指令可針對音訊變數(shù)的數(shù)值先進(jìn)行正規(guī)化(介於 1 和 1 中間)後,再送到喇叭播放,以達(dá)到最好的播放效果。例如: 範(fàn)例20-14: soundsc01.m,y, fs=wavread(welcome.wav); sound(y, fs); fprintf(Press any key to continue.n); pause soundsc(y, fs);,20-4 聲音訊號的錄製,我們在第一節(jié)已經(jīng)說明了如何讀取 wav 檔案,並在第二節(jié)說明如何播放。MATLAB 也支援直接由麥克風(fēng)讀取訊號,因此可以直接進(jìn)行聲音的錄製,所使用的指令是 wavrecord,其基本格式為: y=wavrecord(n, fs),20-4 WAV檔案的錄製範(fàn)例之一,y=wavrecord(n, fs)代表由微軟視窗系統(tǒng)的音訊輸入裝置(即麥克風(fēng))讀入 n 點資料,取樣頻率是 fs,並將此音訊資料儲存於變數(shù) y。舉例來說: 範(fàn)例20-15: wavRecord01.m,fs=11025; % 取樣頻率 duration=2; % 錄音時間 fprintf(按任意鍵後開始 %g 秒錄音:, duration); pause fprintf(錄音中.); y=wavrecord(duration*fs, fs); % duration*fs 是錄音資料點數(shù) fprintf(錄音結(jié)束n); fprintf(按任意鍵後開始播放:); pause wavplay(y,fs);,20-4 WAV檔案的錄製範(fàn)例之二,在前一個範(fàn)例中,wavrecord 預(yù)設(shè)的錄音聲道數(shù)為 1(即單聲道),音訊資料型態(tài)為 double,若要改變這兩種預(yù)設(shè)值,可在 wavrecord 加入其他引數(shù),其完整的格式為y=wavrecord(n, fs, channel, dataType)其中channel(通常是 1 或 2)代表聲道數(shù),dataType 則代表音訊變數(shù) y 的資料型態(tài)可以是下列幾種:double、single、int16、uint8。不同的資料型態(tài),影響音訊資料的精準(zhǔn)度,所佔掉的儲存空間大小也不同。例如: 範(fàn)例20-16: wavRecord02.m,fs=11025; % 取樣頻率 duration=2; % 錄音時間 channel=1; % 單聲道 fprintf(按任意鍵後開始 %g 秒錄音:, duration); pause fprintf(錄音中.); y=wavrecord(duration*fs, fs, channel, uint8); % duration*fs 是錄音資料點數(shù) fprintf(錄音結(jié)束n); fprintf(按任意鍵後開始播放:); pause wavplay(y,fs);,20-5 聲音訊號的寫檔,我們也可以經(jīng)由 MATLAB 將音訊資料直接儲存為 wav 檔案,以便日後直接在微軟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論