ch2 數(shù)字音頻處理技術(shù)1_第1頁
ch2 數(shù)字音頻處理技術(shù)1_第2頁
ch2 數(shù)字音頻處理技術(shù)1_第3頁
ch2 數(shù)字音頻處理技術(shù)1_第4頁
ch2 數(shù)字音頻處理技術(shù)1_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

本章主要講解數(shù)字音頻的基礎(chǔ)知識、音頻卡的功能及音頻的制作方法。學(xué)習(xí)內(nèi)容:■音頻信號基本概念■音頻信號數(shù)字化的基本原理■數(shù)字音頻的編碼標(biāo)準(zhǔn)■音頻文件的常用格式■音樂合成和MIDI規(guī)范■聲卡的功能■用CEPro編輯音頻文件的基本方法2.1數(shù)字音頻基礎(chǔ)

2.1.1音頻信號規(guī)則音頻是一種連續(xù)變化的模擬信號,可用一條連續(xù)的曲線來表示,稱為聲波。聲波是在時間和幅度上都連續(xù)變化的量,稱為模擬量。模擬音頻信號有兩個基本參數(shù):

頻率和振幅。音頻信號的頻率體現(xiàn)音調(diào)的高低。音頻信號的幅度決定了信號音量的強弱程度。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程模擬音頻的數(shù)字化過程涉及到音頻的采樣、量化和編碼。采樣量化編碼2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

1.采樣把模擬音頻信號波形進(jìn)行分割,以轉(zhuǎn)換成數(shù)字信號,這種方法稱為采樣(Sampling)。采樣的過程是每隔一個時間間隔在模擬聲音的波形上取一個幅度值。該時間間隔稱為采樣周期,其倒數(shù)為采樣頻率。

采樣頻率越高,對聲音波形的表示也越精確。只有采樣頻率高于聲音信號最高頻率的兩倍時,才能把數(shù)字聲音較好地還原為原來的聲音。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

2.量化對聲波波形幅度的數(shù)字化表示稱為量化(quantization)。量化的過程是先將采樣后的信號按整個聲波的幅度劃分成有限個區(qū)段的集合,把落入某個區(qū)段內(nèi)的采樣值歸為一類,并賦于相同的量化值。表示樣信號的幅度二進(jìn)制的位數(shù)稱量化位數(shù)。

在相同的采樣頻率之下,量化位數(shù)愈高,聲音的質(zhì)量越好。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

3.編碼

編碼是按照一定的格式把經(jīng)過采樣和量化得到的離散數(shù)據(jù)記錄下來,并在有效的數(shù)據(jù)中加入一些用于糾錯同步和控制的數(shù)據(jù)。音頻信號編碼常用的是波形編碼方法,它是直接對波形采樣、量化和編碼,算法簡單,易于實現(xiàn)。而且,聲音恢復(fù)時能保持原有的特點,因此被廣泛應(yīng)用。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

3.編碼(1)PCM脈沖編碼調(diào)制

PCM可以直接對聲音信號做A/D轉(zhuǎn)換,用一組二進(jìn)制數(shù)字編碼表示,得到的是未經(jīng)壓縮的音頻數(shù)據(jù)。

PCM編碼方法不需要復(fù)雜的信號處理技術(shù)就能實現(xiàn)瞬時的數(shù)據(jù)的量化和還原,而且信噪比高。只要采樣頻率足夠高,量化位數(shù)足夠多,就會有很好的質(zhì)量。但是,這種編碼方法數(shù)據(jù)量很大。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

3.編碼(2)DPCM差分脈沖編碼調(diào)制

DPCM編碼是利用音頻信號的相關(guān)性,通過只傳輸聲音的預(yù)測值和樣本值的差值來降低音頻數(shù)據(jù)的編碼率的一種方法。它用預(yù)測編碼技術(shù)實現(xiàn)音頻數(shù)據(jù)的壓縮編碼。因為音頻信號相鄰的語音采樣值之間存在很大的相關(guān)性,采樣值的差值要比樣值本身小得多,只需要較少的比特數(shù)來表示。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

3.編碼(3)ADPCM(AdaptiveDifferentialPulseCodeModulation)自適應(yīng)差分編碼調(diào)制

ADPCM是對DPCM方法的改進(jìn),通過調(diào)整量化步長,對不同的頻段設(shè)置不同的量化字長,可使數(shù)據(jù)得到進(jìn)一步壓縮。

ADPCM壓縮方案壓縮倍率可達(dá)2~5倍,信噪比高,性能優(yōu)越,多媒體計算機所獲得的數(shù)字化的聲音信息大都采用此壓縮方法。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

4.用錄音機錄制聲音文件

(1)配置好錄音設(shè)備,選擇輸入聲源。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

4.用錄音機錄制聲音文件

(1)配置好錄音設(shè)備,選擇輸入聲源。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

4.用錄音機錄制聲音文件

(1)配置好錄音設(shè)備,選擇輸入聲源。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

4.用錄音機錄制聲音文件

(1)配置好錄音設(shè)備,選擇輸入聲源。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程

(2)打開“屬性”對話框,選擇錄制音源設(shè)備。2.1數(shù)字音頻基礎(chǔ)

2.1.2模擬音頻的數(shù)字化過程(3)啟動“錄音機”(4)結(jié)束錄音后存為.WAV文件。2.1數(shù)字音頻基礎(chǔ)

2.1.3數(shù)字音頻信息的質(zhì)量與存儲量

采樣、量化和編碼技術(shù)是音頻數(shù)字化的關(guān)鍵技術(shù)。采樣頻率、每個采樣值的量化位數(shù)以及音頻信息的聲道數(shù)目,是影響數(shù)字化音頻信息質(zhì)量和容量的三個重要因素。采樣頻率越高、量化為數(shù)越大、聲道數(shù)目越多,音頻的質(zhì)量就越高,但存儲量就越大。2.1數(shù)字音頻基礎(chǔ)

2.1.3數(shù)字音頻信息的質(zhì)量與存儲量

1.音頻質(zhì)量的評價(1)客觀質(zhì)量的度量對聲波的測量包括評價值的測量、聲源的測量和音質(zhì)的測量,其測量與分析工作,是使用帶計算機處理系統(tǒng)的高級聲學(xué)測量儀器來完成。(2)主觀質(zhì)量的度量主觀的質(zhì)量度量通常是對某編碼器的輸出的聲音質(zhì)量進(jìn)行評價。2.1數(shù)字音頻基礎(chǔ)

2.1.3數(shù)字音頻信息的質(zhì)量與存儲量(3)常用的數(shù)字化聲音技術(shù)指標(biāo)及音質(zhì)2.1數(shù)字音頻基礎(chǔ)

2.1.3數(shù)字音頻信息的質(zhì)量與存儲量

2.音頻信息的存儲量計算公式

S=R×r×N×D/8S表示文件的大小,單位是B;

R表示采樣頻率,單位是Hz;

r表示量化位數(shù),單位是bit;

N表示聲道數(shù);

D表示錄音時間,單位是s。2.1數(shù)字音頻基礎(chǔ)

2.1.4數(shù)字音頻編碼標(biāo)準(zhǔn)

1.G.711

給出了A律和μ律的定義。

2.G.721

采用自適應(yīng)差值量化的算法對音頻波形編碼。

3.G.722

采用子帶自適應(yīng)差分脈沖編碼技術(shù)。

4.G.728

在短延時碼激勵編碼方案的基礎(chǔ)上,公布了浮點和定點算法的G.728語音編碼標(biāo)準(zhǔn)。2.1數(shù)字音頻基礎(chǔ)

2.1.4數(shù)字音頻編碼標(biāo)準(zhǔn)

5.MPEG中的音頻編碼已公布和正在討論的標(biāo)準(zhǔn)有MPEGI,MPEGE,MPEGN,MPEGU。

MPEGI標(biāo)準(zhǔn)對應(yīng)于ISO/IEC11172-3(MPEG音頻)。這部分規(guī)定了高質(zhì)量音頻編碼方法、存儲表示和解碼方法。編碼器的輸入和解碼器的輸出與現(xiàn)存的PCM標(biāo)準(zhǔn)兼容。2.1數(shù)字音頻基礎(chǔ)

2.1.4數(shù)字音頻編碼標(biāo)準(zhǔn)

6.AC-3編碼和解碼

AC-3音頻編碼標(biāo)準(zhǔn)起源于由美國的杜比(DOLBY)公司推出的DOLBYAC-1。

AC-1應(yīng)用自適應(yīng)增量調(diào)制(ADM)編碼技術(shù)。立體聲編碼標(biāo)準(zhǔn)AC-2,應(yīng)用在PC聲卡和綜合業(yè)務(wù)數(shù)字網(wǎng)等方面。在AC-2的基礎(chǔ)上,開發(fā)了DOLBYAC-3的數(shù)字音頻編碼技術(shù)。2.1數(shù)字音頻基礎(chǔ)

2.1.4數(shù)字音頻編碼標(biāo)準(zhǔn)

6.AC-3編碼和解碼

AC-3提供了五個聲道從20Hz到20kHz的全通帶頻:正前方的左(L)、中(C)和右(R),后邊的兩個獨立的環(huán)繞聲通道左后(LS)和右后(RS),同時還提供了一個100Hz以下的超低音聲道供用戶選用,以彌補低音之不足,此聲道僅為輔助而已,故稱為0.1聲道。

AC-3被稱為5.1聲道。2.1數(shù)字音頻基礎(chǔ)

2.1.5音頻文件的格式

1.WAV文件

WAV文件是Microsoft公司的音頻文件格式。來源于對聲音波形的采樣,以不同的量化位數(shù)把這些采樣值轉(zhuǎn)換成二進(jìn)制數(shù),存入磁盤。

2.VOC文件

VOC文件是Creative公司所使用的標(biāo)準(zhǔn)音頻文件格式,其文件結(jié)構(gòu)與WAV文件類似。2.1數(shù)字音頻基礎(chǔ)

2.1.5音頻文件的格式

3.MP3文件符合MPEG音頻格式,是一種有損壓縮。根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為3層(MPEGAudioLayer1/2/3),分別對應(yīng)MP1、MP2和MP3這三種聲音文件。

CD音質(zhì)的音樂,未經(jīng)壓縮需要10MB存儲空間,而經(jīng)過MP3壓縮編碼后只有1MB左右,其音質(zhì)基本保持不失真。

MP3文件在播放時需要專門的工具軟件。2.1數(shù)字音頻基礎(chǔ)

2.1.5音頻文件的格式

4.RealAudio文件

RealAudio文件(即時播音系統(tǒng))是RealNetworks公司開發(fā)的一種新型流式音頻文件格式,主要用于在低速率的廣域網(wǎng)上實時傳輸音頻信息。

5.AIFF文件

AIFF是音頻交換文件格式(AudioInterchangeFileFormat)的英文縮寫,是一種文件格式存儲的數(shù)字音頻(波形)的數(shù)據(jù),AIFF應(yīng)用于個人電腦及其它電子音響設(shè)備以存儲音樂數(shù)據(jù)。AIFF支持ACE2、ACE8、MAC3和MAC6壓縮,支持16位44.1kHz立體聲。音頻交換文件格式AIFF是蘋果計算機公司開發(fā)的聲音文件格式,被Macintosh平臺及其應(yīng)用程序所支持,其他專業(yè)音頻軟件包也支持這種格式。2.2音樂合成和MIDI規(guī)范2.2.1音樂合成一個樂音必備的三要素是:音高、音色和音強。運動的旋律中的樂音還應(yīng)具備時值,即持續(xù)時間。音高:音高指聲音的基頻。音色:音色是由聲音的頻譜決定的。音強:是指聲音信號的強弱程度,是由聲波振動的振幅決定的。時值:聲波振動的持續(xù)時間稱為時值。2.2音樂合成和MIDI規(guī)范2.2.1音樂合成任何一種波形信號都可以被分解成若干個頻率不同的正弦波,一個樂器的聲音也可以由若干個正弦波合成得到。調(diào)頻(FM)是使高頻振蕩波的頻率按調(diào)制信號規(guī)律變化的一種調(diào)制方式。采用不同調(diào)制波頻率和調(diào)制指數(shù),就可以方便地合成具有不同頻譜分布的波形,再現(xiàn)某些樂器的音色。為使音樂更加真實,人們開發(fā)出波形表(wavetable)音樂合成技術(shù)。2.2音樂合成和MIDI規(guī)范2.2.2MIDI規(guī)范

1.什么是MIDIMIDI(樂器數(shù)字接口)是一種技術(shù)規(guī)范,定義了為把電子樂器連接到計算機所需要的電纜和端口的硬件標(biāo)準(zhǔn),計算機和具有MIDI接口的設(shè)備之間進(jìn)行信息交換的規(guī)則,電子樂器之間傳送數(shù)據(jù)的通信協(xié)議。

MIDI是將樂曲進(jìn)行一種數(shù)字化的描述,這種描述稱為MIDI消息。播放音樂時,從MIDI文件中讀出MIDI消息,由合成器生成所需要的樂器的聲音波形,經(jīng)放大后由揚聲器輸出。

2.2音樂合成和MIDI規(guī)范2.2.2MIDI規(guī)范

MIDI聲音的優(yōu)點:(1)存儲容量??;(2)可以提供背景音樂或音響效果的配音;(3)便于編輯和修改;(4)可以在MIDI合成器中完全重現(xiàn)原來的演奏。

MIDI是把MIDI設(shè)備上產(chǎn)生的每個活動記錄下來,形成MIDI文件,把它再傳送到MIDI合成器時,就可以完全重現(xiàn)原來的演奏效果。2.2音樂合成和MIDI規(guī)范2.2.2MIDI規(guī)范

2.MIDI的有關(guān)術(shù)語(1)MIDI文件

MIDI文件是存放MIDI信息的標(biāo)準(zhǔn)文件。(2)通道(Channels)每個通道可以訪問一個獨立的邏輯合成器。(3)音序器(Sequencer)音序器是為了MIDI作曲而設(shè)計的計算機程序或電子裝置,用于記錄、編輯、播放MIDI文件。2.2音樂合成和MIDI規(guī)范2.2.2MIDI規(guī)范

2.MIDI的有關(guān)術(shù)語(4)合成器(Synthesizer)合成器是利用數(shù)字信號處理器或其他芯片產(chǎn)生音樂或聲音的電子設(shè)備。(5)樂器(Instrument)合成器能產(chǎn)生的特定聲音稱為樂器。(6)復(fù)音(Polyphony)復(fù)音是合成器同時支持的最多音符數(shù)。2.2音樂合成和MIDI規(guī)范2.2.2MIDI規(guī)范

2.MIDI的有關(guān)術(shù)語(7)音色(Timbre)音色指的是聲音的音質(zhì),取決于聲音頻率。(8)音軌(Track)一種用通道把MIDI數(shù)據(jù)分隔成單獨組、并行組的文件的概念。(9)合成音色映射器(Patchappear)是一種為特定的合成器重新分配編號軟件。2.2音樂合成和MIDI規(guī)范2.2.2MIDI規(guī)范

2.MIDI的有關(guān)術(shù)語(10)通道映射(Channelmapping)通道映射把發(fā)送裝置的MIDI通道號變換成適當(dāng)?shù)慕邮昭b置的通道號。2.2音樂合成和MIDI規(guī)范2.2.2MIDI規(guī)范

3.M1Dl規(guī)范

MIDI規(guī)范主要包括以下3個方面的內(nèi)容:

(1)MIDI的硬件規(guī)范各種MIDI設(shè)備之間連接的硬件接口標(biāo)準(zhǔn)和信號傳輸機制。(2)MIDI聲音信息的規(guī)范使音樂信息互相交換的一種編碼標(biāo)準(zhǔn)。(3)MIDI聲音合成的規(guī)范各種聲音的表達(dá)方式。2.3聲卡的應(yīng)用

2.3.2聲卡的輸入輸出(I/O)接口

2.4音頻數(shù)據(jù)制作

2.4.1音頻的獲取聲音文件的獲取就是為音頻的編輯進(jìn)行素材的積累和準(zhǔn)備。獲得聲音文件的途徑很多:可以從CD唱盤、VCD上獲得;可以從網(wǎng)上下載;也可以自己動手用Windows自帶的錄音機或用專業(yè)的數(shù)字聲音處理軟件錄制。2.4音頻數(shù)據(jù)制作

2.4.2CEPro2.0簡介1.CEPro2.0的窗口及基本操作工具欄顯示范圍條音軌控制面板聲音播放工具軌道1波形顯示區(qū)VU電平縮放工具時間顯示區(qū)2.4音頻數(shù)據(jù)制作

2.4.2CEPro2.0簡介(錄音軟件)1.CEPro2.0的窗口及基本操作單擊此按鈕可將多軌模式切換為單軌模式

黑框表示聲音波形的時間總長,綠條表示當(dāng)前顯示在波形顯示區(qū)的波形在整個聲音波形中所占的位置和長度。2.4音頻數(shù)據(jù)制作

2.4.2CEPro2.0簡介1.CEPro2.0的窗口及基本操作要在這一音軌中錄音,需點亮“R”

“M”表示靜音“S”表示獨奏2.4音頻數(shù)據(jù)制作

2.4.2CEPro2.0簡介1.CEPro2.0的窗口及基本操作波形上豎直的黃線指示了當(dāng)前選擇點、播放點或插入點的位置。波形的橫坐標(biāo)表示時間

波形的縱坐標(biāo)表示振幅

VU電平顯示正在播放或記錄文件的波形的峰值。

2.4音頻數(shù)據(jù)制作

2.4.2CEPro2.0簡介2.使用CEPro2.0錄制聲音創(chuàng)建一個新的聲音文件,在NewWaveform對話框選擇聲音格式。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件1.聲音的放大與縮小Amplification滑塊可以調(diào)節(jié)要放大或減小的音量同原始音量的比值。

一些預(yù)置選項的名稱放在“Presets”選項組中。用鼠標(biāo)選取某個名稱后,對話框中的其他部分就會被相應(yīng)設(shè)置。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件1.聲音的放大與縮小

選中該復(fù)選框,其他數(shù)字框里就會變成以分貝為單位的數(shù)值。

DCBias選項組可以用來進(jìn)行直流偏差的調(diào)整。

2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件1.聲音的放大與縮小Normalization選項組用來規(guī)格化聲音音量

按下Preview按鈕可以預(yù)聽一下對話框中的設(shè)置所產(chǎn)生的效果。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件2.去除雜音在語音停頓的地方選取一段有代表性的環(huán)境噪音。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件

打開NoiseReduction(降噪器)對話框。FFTSize取值設(shè)為4096,其他各項就取CEPro設(shè)好的默認(rèn)值。

2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件

在NoiseProfile選項組中記錄噪音輪廓。

水平方向表示頻率,豎直方向表示噪音的量。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件

關(guān)閉對話框,回到CEPro的工作界面,使用水平縮放工具使整個聲音波形都顯示在波形顯示區(qū)中,雙擊波形顯示區(qū)選取整個波形。再次打開NoiseReduction對話框,按下OK按鈕,CEPro就可以自動清除環(huán)境噪音了。我們可以把噪音數(shù)據(jù)保存在一個以.fft為擴展名的文件中,在完全相同的環(huán)境下錄制的聲音文件都可以按這個文件記錄的噪音信息處理環(huán)境噪音。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件

去除一些別的雜音。使選擇區(qū)的左右邊緣調(diào)整到選擇區(qū)內(nèi)離原先邊緣最近且振幅為0的點上。

按Delete鍵將選擇區(qū)部分的波形刪除。也可單擊“靜音”工具將選擇區(qū)內(nèi)的波形變成靜音。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件3.增加回響效果Presets選項組提供了豐富的預(yù)置選項,當(dāng)我們選擇某一預(yù)置選項,按下Preview按鈕可試聽一下效果,如果不滿意,就換另一種預(yù)置選,直到滿意,就可以按下OK按鈕?!癉ecay”數(shù)字框表示一系列連續(xù)的回聲中的一個回聲相對于前一個回聲衰減的百分比。

2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件3.增加回響效果“Delay”數(shù)字框表示一系列連續(xù)的回聲中,相鄰兩個回聲之間的時間間隔,單位是毫秒。

InitialEchoVolume數(shù)字框表示在最終輸出的聲音中,混合到原始聲音信號中的回聲信號的量。2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件

4.聲音的淡入淡出InitialAmplification的上下兩個滑塊分別控制左右聲道最初音量放大的倍數(shù)

FinalAmplification的上下兩個滑塊分別控制左右聲道最終音量放大的倍數(shù)

2.4音頻數(shù)據(jù)制作

2.4.3用CEPro編輯音頻文件

4.聲音的淡入淡出選中LinearFades單選框就是線性變化,選中LogarithmicFade單選框則是對數(shù)變化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論