




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
聲音是人們用來傳遞信息的一種方式,是攜帶大量信息的及其重要的媒體,因此音頻信息的處理在多媒體技術(shù)中是十分重要的。3.1聲音及其分類3.2數(shù)字音頻基礎(chǔ)知識(shí)3.3聲卡及其應(yīng)用3.4音頻信息的采集3.5音頻信息處理編輯3.6MIDI音樂的合成3.7語音識(shí)別技術(shù)與語音合成3.1聲音及其分類3.1.1聲音的概念
聲音是通過空氣傳播的一種連續(xù)的波,當(dāng)物體振動(dòng)時(shí)會(huì)激勵(lì)它周圍的空氣質(zhì)點(diǎn)振動(dòng),由于空氣的慣性和彈性,在空氣質(zhì)點(diǎn)的相互作用下,振動(dòng)就會(huì)逐漸向外傳播而產(chǎn)生聲波。聲音屬于聽覺媒體,其頻率范圍大約在20Hz~20KHz。幾個(gè)重要參數(shù):1.周期:聲波每完成一次振動(dòng)需要的時(shí)間稱為周期,通常用T表示,單位是秒。2.頻率:每秒鐘所完成的振動(dòng)次數(shù)稱為頻率,用來體現(xiàn)音調(diào)的高低,單位是赫茲(Hz)。3.振幅:振幅是指聲波的高低幅度,表示聲音的強(qiáng)弱。振幅用來定量研究空氣受到壓力的大小。4.帶寬:帶寬指頻率覆蓋的范圍。3.1.2聲音的分類在多媒體技術(shù)中,將聲音媒體分為語言、音樂和音響三類。1.語言:指具有人類約定成俗的和語言內(nèi)涵的特殊媒體。2.音樂:是指規(guī)范的符號(hào)化了的聲音。3.音響:是指人們熟悉的其他聲音,包括自然界的風(fēng)聲、雨聲以及機(jī)器發(fā)出的聲音等。3.1.3聲音的要素1.音調(diào):人耳對(duì)聲音頻率高低的感覺稱為音調(diào)。音調(diào)由聲源振動(dòng)頻率所決定。2.音色:音色是用來描述聲音品質(zhì)的,主要決定于聲音頻譜結(jié)構(gòu)中的泛音多少。3.音強(qiáng):音強(qiáng)是衡量聲波在傳播過程中聲音強(qiáng)弱的物理量,即與聲音信號(hào)的幅度成正比。3.2數(shù)字音頻基礎(chǔ)知識(shí)3.2.1聲音信號(hào)數(shù)字化過程1.采樣(sampling)采樣是將聲音信號(hào)在時(shí)間上離散化,即每隔一定的時(shí)間間隔對(duì)模擬信號(hào)進(jìn)行取樣。2.量化(quantization)是對(duì)采樣后的聲音樣本在幅值上離散化,即把信號(hào)強(qiáng)度劃分為不同的等級(jí),然后將每一個(gè)樣本歸入預(yù)先編排的量化等級(jí)上。3.編碼:是將量化后的離散值用二進(jìn)制代碼表示。3.2.1數(shù)字化聲音的技術(shù)指標(biāo)1.采樣頻率:單位時(shí)間內(nèi)采樣的個(gè)數(shù)稱為采樣頻率,用fs表示。奈奎斯特定理,即fs≥2fmax。2.量化位數(shù):每個(gè)取樣點(diǎn)能夠表示的數(shù)據(jù)范圍。3.聲道數(shù):指一次同時(shí)產(chǎn)生的聲波組數(shù)。4.數(shù)據(jù)文件格式:數(shù)據(jù)量(Byte)=(采樣頻率×量化位數(shù)×聲道數(shù)×聲音持續(xù)時(shí)間)/8表采樣頻率、量化位數(shù)、聲道數(shù)及存儲(chǔ)容量采樣頻率(KHz)量化位數(shù)(bit)單聲道(MB/min)雙聲道(MB/min)11.02580.631.2622.0581.262.5222.05162.525.0444.1165.0410.08表數(shù)字音頻等級(jí)聲音類型頻率范圍(Hz)采樣率(kHz)量化位數(shù)(bit)電話話音200~340088調(diào)幅廣播50~70001616調(diào)頻廣播20~15k22.0516高質(zhì)量音頻20~20k44.1163.2.3聲音質(zhì)量的度量聲音質(zhì)量的兩種方法:一種是客觀評(píng)價(jià),即音頻信號(hào)的技術(shù)指標(biāo),如:頻帶寬度、動(dòng)態(tài)范圍和信噪比;另一種是主觀評(píng)價(jià)。對(duì)于語音和圖像信號(hào)使用主觀評(píng)價(jià)更恰當(dāng)一些。1.音頻信號(hào)的技術(shù)指標(biāo):頻帶寬度:音頻信號(hào)的頻率范圍,是衡量音質(zhì)的標(biāo)準(zhǔn)。動(dòng)態(tài)范圍:音頻信號(hào)最大強(qiáng)度與最小強(qiáng)度之比。信噪比:有用信號(hào)的平均功率與噪音的平均功率之比。2.主觀評(píng)價(jià)法:聲音質(zhì)量主觀評(píng)價(jià)評(píng)分標(biāo)準(zhǔn)分?jǐn)?shù)質(zhì)量級(jí)別失真級(jí)別5優(yōu)(Excellent)無察覺4良(Good)(剛)察覺但不討厭3中(Fair)(察覺)有點(diǎn)討厭2差(Poor)討厭但不反感1劣(Bad)極討厭(令人反感)3.2.4數(shù)字音頻的文件格式1.波形文件擴(kuò)展名為*.wav,是通過對(duì)模擬音頻以不同的采樣頻率、不同的量化位數(shù)進(jìn)行數(shù)字化而得到的數(shù)字信號(hào)存入磁盤而形成的波形文件。適用于:記錄講話語音、CD音質(zhì)的音樂、單聲道或立體聲的聲音信息,并能保證聲音不失真。缺點(diǎn)是未經(jīng)壓縮的聲音文件占用存儲(chǔ)盤空間太大。2.PCM:由模擬音頻信號(hào)直接通過A/D轉(zhuǎn)換而形成的二進(jìn)制序列文件,特點(diǎn)是保真度高,解碼速度快,但編碼后數(shù)據(jù)量大。3.AIFF文件:.AIF/.AIFF蘋果公司開發(fā)的一種聲音文件格式,被Mac平臺(tái)及其應(yīng)用程序所支持,NetscapeNavigator瀏覽器中的LiveAudio也支持AIFF格式,SGI及其他專業(yè)音頻軟件包也同樣支持這種格式。4.VOC:多用于保存CreativeSoundBlaster系列聲卡所采集的聲音數(shù)據(jù),被Windows平臺(tái)和DOS平臺(tái)所支持。5.AU:SunMicrosystems公司推出的一種經(jīng)過壓縮的數(shù)字聲音格式,在Internet中經(jīng)常使用。6.RM:RealNetworks公司開發(fā)的一種適合于網(wǎng)絡(luò)實(shí)時(shí)流技術(shù)的音頻文件格式,主要用于在低速率的廣域網(wǎng)上實(shí)時(shí)傳輸音頻信息。7.MP3:MPEGAudioLayer3的簡寫,壓縮率高達(dá)10∶1~12∶1,音質(zhì)基本保持不失真。8.CD:一種數(shù)字化的聲音,其采樣頻率為44.1KHz,量化位數(shù)為16bit,可以高質(zhì)量地重現(xiàn)原始聲音。9.MIDI:文件本身不包含任何的音頻信息,主要記錄指令和數(shù)據(jù),文件所占用的空間非常小。MIDI文件與Wave文件的區(qū)別:首先,Wave文件是通過直接對(duì)模擬聲波進(jìn)行數(shù)字化得到的音頻信號(hào)數(shù)據(jù)。而MIDI文件只是記錄了一系列樂譜指令。其次,Wave文件是直接通過聲卡輸入端口獲取的音源,并可從輸出端口直接播放。而MIDI是通過MIDI接口由音序器記錄電子樂譜的指令數(shù)據(jù)。最后,采用MIDI格式記錄比采用Wave格式記錄的數(shù)據(jù)量小兩個(gè)數(shù)量級(jí)以上。3.2.5音頻信號(hào)處理的特點(diǎn)⑴由于音頻信息是在時(shí)間上連續(xù)的信號(hào),因此在處理時(shí)對(duì)時(shí)序性的要求很高。⑵由于人有左耳和右耳,類似于兩個(gè)通道,因此計(jì)算機(jī)輸出的聲音應(yīng)該是立體聲的。⑶由于語音信號(hào)攜帶了情感意向,因此對(duì)語音信號(hào)的處理還要抽取語意等其它信息。3.3音頻卡及其應(yīng)用3.3.1音頻卡功能聲卡主要是用來對(duì)不同來源的音頻信號(hào)進(jìn)行采集與回放,其功能就是使計(jì)算機(jī)能夠處理音頻信號(hào)。聲卡的功能主要有以下幾點(diǎn):⑴錄制、編輯與回放聲音文件。⑵在采集和回放過程中對(duì)文件進(jìn)行壓縮和解壓縮。⑶編輯與合成音樂文件。⑷文本轉(zhuǎn)換和語音識(shí)別。⑸MIDI音樂的合成。3.3.2音頻卡工作原理聲卡的主要作用是實(shí)現(xiàn)對(duì)音頻信息的采集與回放。音頻信息有很多來源,如磁帶錄音機(jī)、CD、錄像機(jī)等等。聲卡的工作原理1.聲卡處理需要的基本條件:⑴采樣頻率:一般的聲卡均支持雙聲道立體聲信號(hào)的采集。⑵量化位數(shù):聲卡中的量化位數(shù)一般為8位、16位、32位以及64位,量化位數(shù)越高,聲音質(zhì)量越好。⑶聲道數(shù):單聲道或立體聲。⑷實(shí)時(shí)硬件壓縮/軟件壓縮:2.混音器音頻卡上的混音器Mixer主要目的是將不同輸入音源的信號(hào)進(jìn)行混音,并且提供音量的軟件控制功能。通過I/O端口(地址和數(shù)據(jù)端口)可對(duì)混音器的各種功能進(jìn)行可編程設(shè)置。3.MIDI合成器與接口MIDI是一種用于在不同制造商的電子樂器設(shè)備和計(jì)算機(jī)之間進(jìn)行數(shù)據(jù)交換的國際標(biāo)準(zhǔn)。它指定硬件接口,同時(shí)指定通信協(xié)議,可以將數(shù)據(jù)從一個(gè)設(shè)備傳輸?shù)搅硪粋€(gè)設(shè)備。3.3.3聲卡的安裝和使用1.硬件安裝與使用聲卡的接口及與外部設(shè)備的連接硬件安裝步驟:首先關(guān)閉電源,拔下電源插頭,然后打開機(jī)箱外殼,將聲卡插入空閑的16位擴(kuò)展槽內(nèi),連接好外部的音頻輸入/輸出線,如麥克風(fēng)、線路輸入等。如果有CD-ROM驅(qū)動(dòng)器,將驅(qū)動(dòng)器的接口電纜插在卡的相應(yīng)接口上,并將CD-ROM的音頻輸出線接到聲卡的針形輸入線上。最后蓋上機(jī)箱外殼,插好電源插頭即可。2.軟件安裝包括驅(qū)動(dòng)程序和應(yīng)用軟件。當(dāng)安裝完聲卡并重新啟動(dòng)計(jì)算機(jī)后,系統(tǒng)能夠自動(dòng)識(shí)別聲卡,并且提示需要安裝驅(qū)動(dòng)程序。3.聲卡的技術(shù)指標(biāo)⑴采樣頻率和量化位數(shù)采樣頻率與量化位數(shù)越高,聲音的質(zhì)量越好。⑵FM合成與波表合成一般較好的聲卡采用的都是波表法合成。⑶總線類型⑷即插即用能力⑸DSP數(shù)字信號(hào)處理器⑹兼容性⑺音效⑻外圍接口⑼音頻壓縮3.4音頻信息的采集音頻文件的采集方法有以下幾種:1.音頻文件的直接采集2.利用Windows自帶的“錄音機(jī)”來錄制聲音。利用錄音機(jī)錄音的操作步驟如下:⑴準(zhǔn)備一份需要錄制的材料。⑵將麥克風(fēng)插到聲卡上的MICIN接口上。⑶選擇Windows中的【開始】菜單,在【程序/附件/娛樂】下面選擇【錄音機(jī)】,打開錄音機(jī),單擊紅色的【錄音】按鈕開始錄音。當(dāng)錄制結(jié)束后單擊【停止】按鈕。⑷執(zhí)行菜單中【文件/另存為】命令,在出現(xiàn)的【另存為】對(duì)話框中單擊【格式】選項(xiàng),選擇【更改】。在【聲音選定】對(duì)話框中選擇【屬性】項(xiàng)更改聲音的采樣頻率、量化位數(shù)、聲道數(shù)和數(shù)據(jù)率,單擊【確定】按鈕返回。選擇文件保存的路徑、保存的類型,并命名。記錄失敗時(shí)檢查一下系統(tǒng)右下角任務(wù)欄中聲音圖標(biāo)是否設(shè)置正確。將【回放】選項(xiàng)改為“錄音】,并在下方【顯示下列音量控制】中選擇【麥克風(fēng)】選項(xiàng),就可以正常錄音了。3.用其它音頻設(shè)備輸入錄像機(jī)、磁帶錄音機(jī)、電視機(jī)等都能提供不同內(nèi)容的音頻節(jié)目。這些設(shè)備需要通過線路輸入的方式(LINEIN)連接到計(jì)算機(jī)的聲卡上,通過相應(yīng)的軟件將音頻信號(hào)采集進(jìn)來,并以數(shù)字音頻的形式存儲(chǔ)在計(jì)算機(jī)中。4.MIDI音樂合成
3.5音頻信息處理編輯AdobeAudition是一款功能強(qiáng)大的音頻編輯軟件,其前身是CoolEditPro??梢詫?shí)現(xiàn):音頻的錄制:波形文件的存儲(chǔ):文件的編輯:利用軟件制作音頻節(jié)目時(shí)需要注意以下幾點(diǎn):⑴一般大段的旁白和背景音樂采用MIDI格式存儲(chǔ),這樣不僅可以減少存儲(chǔ)空間,而且處理的速度比較快。⑵注意音樂和音響效果的選擇應(yīng)該和節(jié)目的主題相一致,特別是背景音樂,一定不要喧賓奪主。下面就介紹AdobeAudition的使用方法。實(shí)例一:聲音的降噪處理:在這個(gè)實(shí)例中要將錄制好的一段帶有噪聲的語音做降噪處理。操作步驟:1.選擇【開始/程序/AdobeAudition1.5】啟動(dòng)軟件,AdobeAudition1.5基本的文件操作包括新建,打開,保存,剪切、復(fù)制和粘貼等。2.降噪處理。降噪處理是將噪音的樣本特征提取出來,然后將噪音從原始音頻信號(hào)中去除,使聲音清晰自然。通常用于錄制的音頻信號(hào),特別是通過麥克風(fēng)錄制的人聲或者是磁帶錄音中的噪聲。最關(guān)鍵的一步就是選擇噪聲樣本。為了便于觀察,將波形放大,選擇窗口下面的縮放工具即可。將噪聲區(qū)內(nèi)波形最平穩(wěn)且最長的一段選中。然后執(zhí)行菜單中【效果/降噪/降噪】命令,進(jìn)入降噪窗口。單擊【捕捉線圖】按鈕采集噪聲樣本,幾秒鐘后就會(huì)出現(xiàn)噪聲樣本輪廓圖。在降噪控制面板中將“降噪電平”數(shù)值改為80,“FFT大小”數(shù)值改為8192?!熬认禂?shù)”數(shù)值改為9。“平滑總計(jì)”數(shù)值改為9左右。當(dāng)各個(gè)參數(shù)都設(shè)置好之后,單擊【OK】按鈕,就開始進(jìn)行降噪處理了。3.進(jìn)行多軌混音編排。選擇【編輯/混合粘貼】命令,在這個(gè)功能中提供了混合時(shí)的音量設(shè)置和混合方式。其混合方式共有4種:插入、覆蓋(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 抗血吸蟲病藥戰(zhàn)略市場規(guī)劃報(bào)告
- 對(duì)頂角、余角和補(bǔ)角 教案 2024-2025學(xué)年北師大版數(shù)學(xué)七年級(jí)下冊
- 廠房使用合同范本
- 受托支付合同范本簡易
- 化肥提供合同范本
- 機(jī)械基礎(chǔ)考試模擬題+參考答案
- 信息保密合同范本
- 賣房給中介合同范本
- 保姆合同范本帶小孩
- 中電聯(lián)特許經(jīng)營合同范本
- 《康復(fù)工程學(xué)》課件-第一講 康復(fù)工程概論
- DeepSeek:從入門到精通
- 天津2025年天津中德應(yīng)用技術(shù)大學(xué)輔導(dǎo)員崗位招聘7人筆試歷年參考題庫附帶答案詳解
- 2025年無錫職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年??及鎱⒖碱}庫含答案解析
- 2025年銅材拉絲項(xiàng)目可行性研究報(bào)告
- 2025四川宜賓市高縣縣屬國企業(yè)第一次招聘3人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2024 年國家公務(wù)員考試《申論》(地市級(jí))真題及答案
- 南京2025年中國醫(yī)學(xué)科學(xué)院皮膚病醫(yī)院招聘13人第二批筆試歷年典型考點(diǎn)(頻考版試卷)附帶答案詳解
- 2025年1月浙江高考英語聽力試題真題完整版(含答案+文本+MP3)
- T-IMAS 087-2024 托克托縣辣椒地方品種提純復(fù)壯技術(shù)規(guī)程
- 2025年全國道路運(yùn)輸企業(yè)安全管理人員考試題庫(含答案)
評(píng)論
0/150
提交評(píng)論