音頻信號(hào)處理技術(shù)_第1頁(yè)
音頻信號(hào)處理技術(shù)_第2頁(yè)
音頻信號(hào)處理技術(shù)_第3頁(yè)
音頻信號(hào)處理技術(shù)_第4頁(yè)
音頻信號(hào)處理技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1 音頻信號(hào)處理技術(shù) 1 . 音頻的數(shù)字化處理 2 . 音頻處理技術(shù) 3 . 語(yǔ)音合成與識(shí)別技術(shù) 4 . MATLAB 與 音頻處理2音頻的數(shù)字化*3波形音頻的數(shù)字化過(guò)程麥克風(fēng)麥克風(fēng)/錄音機(jī)錄音機(jī)/CD激光唱盤激光唱盤聲卡聲卡A/D轉(zhuǎn)換轉(zhuǎn)換(采樣、量化采樣、量化)聲卡聲卡D/A轉(zhuǎn)換轉(zhuǎn)換混音器混合后由混音器混合后由揚(yáng)聲器輸出揚(yáng)聲器輸出計(jì)算機(jī)存儲(chǔ)計(jì)算機(jī)存儲(chǔ)*4 采樣頻率:每秒從模擬聲波中采集聲音樣本的個(gè)數(shù)。 頻率越高,采集的樣本數(shù)越多,聲音質(zhì)量越好,占用存儲(chǔ)空間越大。 人耳感受范圍:020kHz 一般采用:11.025kHz、22.05kHz、44.1kHz n對(duì)原始聲波采樣對(duì)原始聲波采樣n采樣后

2、得到的數(shù)據(jù)采樣后得到的數(shù)據(jù)*5 量化位數(shù):將采樣數(shù)據(jù)按大小存儲(chǔ)的過(guò)程。 一般有8、16、32位等,量化位數(shù)越大,聲音的幅度分辨率越高,還原時(shí)聲音的品質(zhì)越好,聲音數(shù)據(jù)占用的存儲(chǔ)空間越大*6 聲道數(shù):數(shù)字音頻聲音質(zhì)量的另一個(gè)因素。 一般有單聲道 、雙聲道、多聲道 存儲(chǔ)量計(jì)算:采樣頻率量化位數(shù)聲道數(shù)時(shí)間8 (字節(jié))舉例:采樣頻率44.1kHz,16位量化,雙聲道,一分鐘的音頻所需要的存儲(chǔ)量為:44.1100016260/8=10584000(字節(jié))*7音頻的格式1. WAV格式:Windows標(biāo)準(zhǔn)波形文件,多數(shù)音頻編輯軟件支持,文件較大。2. MP3格式:高壓縮比,文件較小,音質(zhì)接近CD。3. MI

3、DI文件:存儲(chǔ)指令,文件短小,播放效果因軟硬件而異。4. CD格式:音質(zhì)最好的數(shù)字音頻格式,CDA文件只含索引信息。5. RealAudio格式:適用網(wǎng)上在線音樂(lè)欣賞,可隨帶寬不同改變音質(zhì)。6. WMA格式:音質(zhì)強(qiáng)于MP3,內(nèi)置版權(quán)保護(hù)技術(shù),支持音頻流技術(shù)。8音頻處理技術(shù)9錄音n錄制從麥克風(fēng)輸入的聲音n錄制計(jì)算機(jī)中其他播放器通過(guò)聲卡播放的聲音聲音的編輯n剪裁波形n刪除波形n復(fù)制、粘貼波形n混音聲音的特效處理n調(diào)整音量n調(diào)整播放時(shí)間和播放速度n添加回聲n音樂(lè)淡入淡出效果n消除音樂(lè)中的靜音段*10語(yǔ)音合成與識(shí)別 *11語(yǔ)音合成與識(shí)別 一、語(yǔ)音合成技術(shù)n方法:語(yǔ)音合成方法、參數(shù)合成方法 n目標(biāo):可懂

4、、清晰、自然、具有表現(xiàn)力 n應(yīng)用:文語(yǔ)轉(zhuǎn)換(TTS)二、語(yǔ)音識(shí)別技術(shù) nViaVoice中文連續(xù)語(yǔ)音識(shí)別系統(tǒng)輸入速度:150漢字/分 識(shí)別率:95%n發(fā)展方向:n自然話語(yǔ)識(shí)別與理解n解決語(yǔ)音識(shí)別中的一系列難題應(yīng)用MATLAB 處理音頻信號(hào)的流程 音量標(biāo)準(zhǔn)化 :錄制聲音過(guò)程中需對(duì)聲音電平進(jìn)行量化處理 最理想的量化是最大電平對(duì)應(yīng)最高量化比特 但實(shí)際卻很難做到 常有音輕問(wèn)題 利用 MATLAB 很容易實(shí)現(xiàn)音量標(biāo)準(zhǔn)化 即最大電平對(duì)應(yīng)最高量化比特 基本步驟是 先用 wavread 函數(shù)將 WAV 文件轉(zhuǎn)換成列數(shù)組變量 再求出數(shù)組變量的極值并對(duì)所有元素作歸一化處理 最后用 wavwrite 函數(shù)還原成音量

5、標(biāo)準(zhǔn)化的 WAV 文件聲道分離合并與組合:立體聲或雙聲道音頻信號(hào)有左右兩個(gè)聲道 利用 MATLAB 實(shí)現(xiàn)雙聲道分離 兩路聲道合并和兩個(gè)單聲道組合成一個(gè)雙聲道等效果 實(shí)際上是利用了MATLAB 的矩陣抽取 矩陣相加和矩陣重組運(yùn)算數(shù)字濾波 數(shù)字濾波是常用的音頻處理技術(shù) 可根據(jù)技術(shù)指標(biāo) 先利用 FDATool 工具 設(shè)計(jì)一個(gè)數(shù)字濾波器2 再用 Filter 或 Filter2 函數(shù)即可實(shí)現(xiàn)濾波處理 調(diào)用的 Filter 函數(shù)格式是 Y = filte (B,A,X) 其中 B 和 A 是濾波器傳輸函數(shù)的分子和分母系數(shù) X 是輸入變量 Y是實(shí)現(xiàn)濾波后的輸出變量 如果處理立體聲音頻信號(hào) 可分開(kāi)處理 但用 FIR 濾波器時(shí)調(diào)用 Filter2 函數(shù)更方便數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)轉(zhuǎn)換是指改變音頻格式中的采樣頻率或量化位數(shù) 轉(zhuǎn)換原理是 先用矩陣插值或抽取技術(shù)實(shí)現(xiàn)變量變換 如果是抽取數(shù)據(jù)還需在變換前作濾波處理使之滿足采樣定理 變量變換完成后再用 Wavwrite 函數(shù)重新定義量化位數(shù)和采樣頻率即可實(shí)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論