第二章-音頻信號(hào)的獲取與處理_第1頁(yè)
第二章-音頻信號(hào)的獲取與處理_第2頁(yè)
第二章-音頻信號(hào)的獲取與處理_第3頁(yè)
第二章-音頻信號(hào)的獲取與處理_第4頁(yè)
第二章-音頻信號(hào)的獲取與處理_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2.1多媒體音頻基礎(chǔ)知識(shí)12.2音頻編輯軟件CoolEdit的使用2第2章音頻信號(hào)的獲取與處理2.1.1聲音信號(hào)的數(shù)字化2.1.2數(shù)字音頻的獲取方式2.1.3數(shù)字音頻的文件格式12.1多媒體音頻基礎(chǔ)知識(shí)

最初的音頻是用電信號(hào)記錄下來(lái)進(jìn)行存儲(chǔ)和傳輸?shù)模悄M信號(hào),而計(jì)算機(jī)處理的是數(shù)字音頻,數(shù)字音頻有獨(dú)特的獲取和處理方式。振幅:表示信號(hào)的強(qiáng)弱,即音量的大小周期:重復(fù)出現(xiàn)的時(shí)間間隔頻率:指信號(hào)每秒鐘變化的次數(shù)F=1/T(HZ)重要指標(biāo)t振幅周期A聲波21、聲音的基礎(chǔ)知識(shí)聲音是通過(guò)一定介質(zhì)(如空氣、水等)傳播的一種連續(xù)的波,是連續(xù)型(時(shí)間與幅度)時(shí)基媒體。聲音的主要傳播介質(zhì)是空氣,固體、液體也能傳播聲音。(日本地震聲波)聲音的本質(zhì)是空氣振動(dòng),由于空氣振動(dòng)引起耳膜的振動(dòng),然后被人耳所感知,但并不是所有的空氣振動(dòng)都能被人耳所感知。2.1.1聲音信號(hào)的數(shù)字化3人耳所能感覺(jué)到空氣振動(dòng)的頻率范圍大約為20Hz~20kHz,即人耳能識(shí)別的聲音。人類(lèi)說(shuō)話聲音頻率范圍:300Hz-3kHz,語(yǔ)音信號(hào)是指頻率范圍和人說(shuō)話的信號(hào)頻率范圍一致的信號(hào),而實(shí)際上人的發(fā)音器官發(fā)出的聲音頻率范圍大約在80~3400HZ之間。2.1.1聲音信號(hào)的數(shù)字化1020502003.4k7k15k20kCD-DAFM廣播AM廣播(MW)電話f(Hz)頻帶4聲音信號(hào)的頻率是指聲音信號(hào)每秒鐘變化的次數(shù),用Hz表示。不同的聲音就是不同的振動(dòng)方式,具有不同的振動(dòng)頻率。人耳能夠分辨風(fēng)聲、雨聲和不同人的聲音,也能分辨各種言語(yǔ)聲,它們都是來(lái)自聲源體的不同信息波。語(yǔ)音信號(hào)是典型的連續(xù)信號(hào),不僅在時(shí)間上是連續(xù)的,而且在幅度上也是連續(xù)的(指幅度的數(shù)值有無(wú)窮多個(gè))。我們把在時(shí)間和幅度上都是連續(xù)的信號(hào)稱(chēng)為模擬信號(hào)。2.1.1聲音信號(hào)的數(shù)字化5非語(yǔ)音是指語(yǔ)音信號(hào)范圍外的人耳所能識(shí)別的音頻信號(hào),主要包括樂(lè)音和雜音,非語(yǔ)音信號(hào)的特點(diǎn)是不具有復(fù)雜的語(yǔ)義和語(yǔ)法信息,信息量比較低,因此識(shí)別簡(jiǎn)單。次聲波是一種人耳感受不到的聲波,是能長(zhǎng)距離傳播,具有強(qiáng)穿透性,甚至能傷害人的神精系統(tǒng)的一種聲波。雖然次聲波看不見(jiàn),聽(tīng)不見(jiàn),可它卻無(wú)處不在.地震、火山爆發(fā)、風(fēng)暴、海浪沖擊、槍炮發(fā)射、熱核爆炸等都會(huì)產(chǎn)生次聲波,科學(xué)家借助儀器可以“聽(tīng)到”它。2.1.1聲音信號(hào)的數(shù)字化61883年8月,南蘇門(mén)答臘島和爪哇島之間的克拉卡托火山爆發(fā),產(chǎn)生的次聲波繞地球三圈,全長(zhǎng)十多萬(wàn)公里,歷時(shí)108小時(shí).1961年,蘇聯(lián)在北極圈內(nèi)新地島進(jìn)行核試驗(yàn)激起的次聲波繞地球轉(zhuǎn)了5圈。1948年初,一艘荷蘭貨船在通過(guò)馬六甲海峽時(shí),一場(chǎng)風(fēng)暴過(guò)后,全船海員莫名其妙地死光;在匈牙利鮑拉得利山洞入口,3名旅游者齊刷刷地突然倒地,停止了呼吸......應(yīng)該好好利用次聲波......還有超聲波。2.1.1聲音信號(hào)的數(shù)字化72.1.1聲音信號(hào)的數(shù)字化復(fù)音波形

自然界的聲音、樂(lè)器發(fā)出的聲音,一般是由若干個(gè)頻率和振幅都不同的純音所組成的復(fù)音。復(fù)音中頻率最低的純音稱(chēng)基音,它是決定音調(diào)的基本要素。復(fù)音中存在的其他頻率是復(fù)音中的次要成分,稱(chēng)為諧音或泛音?;艉椭C音合成復(fù)音,決定了特定的聲音音質(zhì)和音色。8男生和女生的聲音的主要區(qū)別是音調(diào)的高低不同,男聲音調(diào)低,女聲音調(diào)高。

這是因?yàn)槟械穆晭л^長(zhǎng)、較寬、較厚,所以振動(dòng)時(shí)頻率低,發(fā)出的音調(diào)低。女的聲帶較短、較薄、較窄,所以振動(dòng)時(shí)頻率高,發(fā)出的音調(diào)高。

2.1.1聲音信號(hào)的數(shù)字化9聲音3要素: (1)音調(diào):表示聲音的高低,由聲音信號(hào)的頻率所決定,在音樂(lè)中稱(chēng)為音高,頻率高則音調(diào)高,頻率低則音調(diào)低。 (2)音強(qiáng):又稱(chēng)響度、音量,決定聲音能量的強(qiáng)弱程度,由聲音信號(hào)的幅度決定,通常用音量來(lái)描述音強(qiáng),以分貝(dB)為單位。人類(lèi)能感知的聲音的幅度范圍在0~120(dB)之間。就同一聲源來(lái)說(shuō),人對(duì)聲音的感覺(jué)強(qiáng)度與聲源的方向與距離相關(guān)。 (3)音色:又稱(chēng)音品,表示聲音的品質(zhì),由聲音的頻譜和混入基音中的泛音所決定的。2.1.1聲音信號(hào)的數(shù)字化10例題:1、下列關(guān)于聲現(xiàn)象的說(shuō)法中,不正確的是()A、用一根棉線和兩個(gè)紙杯可以制成“土電話”,說(shuō)明固體能夠傳聲B、在音樂(lè)會(huì)上,人們常用響度來(lái)區(qū)分是何種樂(lè)器發(fā)出的聲音C、廣播發(fā)出的聲音,在向遠(yuǎn)處傳播的過(guò)程中,會(huì)不斷減小的是響度D、公路邊植樹(shù),既可以?xún)艋諝?,也可以減弱噪聲2、下列幾對(duì)詞語(yǔ)與對(duì)應(yīng)物理意義的連接中,錯(cuò)誤的是()A、震耳欲聾--響度大B、悅耳動(dòng)聽(tīng)--音色好C、低聲細(xì)語(yǔ)--音調(diào)低D、掌聲雷鳴--響度大

2.1.1聲音信號(hào)的數(shù)字化112、模擬音頻和數(shù)字音頻模擬音頻是連續(xù)的電信號(hào),然而計(jì)算機(jī)只能處理以0和1的形式表示的離散的信號(hào)量。要想在計(jì)算機(jī)中對(duì)音頻信號(hào)進(jìn)行存儲(chǔ)、傳輸、播放、處理,就必須進(jìn)行音頻的模/數(shù)轉(zhuǎn)換,即把模擬音頻信號(hào)數(shù)字化,形成數(shù)字音頻。2.1.1聲音信號(hào)的數(shù)字化采樣量化編碼模擬信號(hào)數(shù)字信號(hào)第一步第二步第三步122.1.1聲音信號(hào)的數(shù)字化音頻經(jīng)過(guò)數(shù)字化采樣和量化得到的時(shí)間和幅度都離散的數(shù)字信號(hào)就稱(chēng)為數(shù)字音頻信號(hào)。13(1)采樣(Sampling):在某些特定的時(shí)刻對(duì)模擬信號(hào)進(jìn)行測(cè)量叫做采樣。采樣的時(shí)間間隔稱(chēng)為采樣周期,采樣可分為均勻采樣和非均勻采樣,每秒鐘采樣的次數(shù)稱(chēng)為采樣頻率。2.1.1聲音信號(hào)的數(shù)字化14(2)量化(Quantization):經(jīng)過(guò)采樣獲得的離散時(shí)間信號(hào)的幅度值依然是連續(xù)的,因此需要對(duì)這些幅度值進(jìn)行量化。把幅度區(qū)間劃分成n個(gè)區(qū)間,一個(gè)區(qū)間對(duì)應(yīng)于一個(gè)幅度值,對(duì)于所有落入第i個(gè)區(qū)間的任何幅度值,都用同一個(gè)幅度值來(lái)表示。這個(gè)過(guò)程稱(chēng)為量化。量化的幅度間隔均等的稱(chēng)為線性量化,否則稱(chēng)為非線性量化。2.1.1聲音信號(hào)的數(shù)字化15(3)編碼指按照一定的格式把經(jīng)過(guò)采樣和量化得到的離散數(shù)據(jù)記錄下來(lái),并在有效的數(shù)據(jù)中加入一些用于糾錯(cuò)、同步和控制的數(shù)據(jù)。音頻信號(hào)編碼通常采用的是波形編碼方法,它直接對(duì)波形采樣、量化和編碼,算法簡(jiǎn)單,易于實(shí)現(xiàn),在聲音恢復(fù)時(shí)能保持原有的特點(diǎn),因此被廣泛應(yīng)用。常用的聲音編碼格式有:PCM編碼方法、DPCM編碼、ADPCM壓縮編碼等。2.1.1聲音信號(hào)的數(shù)字化162.1.1聲音信號(hào)的數(shù)字化奈奎斯特采樣定理:采樣頻率不應(yīng)低于聲音信號(hào)最高頻率的兩倍,這樣才能把以數(shù)字表達(dá)的聲音還原成原來(lái)的聲音。其中fs為采樣頻率,Ts為采樣周期,f為被采樣信號(hào)的最高頻率,T為被采樣信號(hào)的最小周期。采樣頻率的高低是根據(jù)奈奎斯特理論和聲音信號(hào)本身的最高頻率決定的。例如,電話話音的信號(hào)最高頻率約為3.4kHz,采樣頻率通常選為8kHz。fs≥2f或者Ts≤T/2172.1.1聲音信號(hào)的數(shù)字化量化樣本的位數(shù)由計(jì)算機(jī)的性能和對(duì)聲音質(zhì)量的要求決定,一般有8位量化、16位量化和32位量化,即分別用一個(gè)字節(jié)、兩個(gè)字節(jié)和四個(gè)字節(jié)存放一個(gè)采樣點(diǎn)的幅度值。量化位數(shù)越高,需要的存儲(chǔ)空間越大,但此時(shí)聲音細(xì)節(jié)的丟失比較少,聲音的質(zhì)量較好。聲音數(shù)字化三要素采樣頻率量化位數(shù)聲道數(shù)每秒鐘抽取聲波幅度樣本的次數(shù)每個(gè)采樣點(diǎn)用多少二進(jìn)制位表示數(shù)據(jù)范圍使用聲音通道的個(gè)數(shù)采樣頻率越高聲音質(zhì)量越好數(shù)據(jù)量也越大量化位數(shù)越多音質(zhì)越好數(shù)據(jù)量也越大立體聲比單聲道的表現(xiàn)力豐富,但數(shù)據(jù)量翻倍11.025kHz22.05kHz44.1kHz8位=256個(gè)值16位=65536個(gè)值32位==232單聲道立體聲182.1.1聲音信號(hào)的數(shù)字化聲音數(shù)字化計(jì)算公式數(shù)據(jù)量=采樣頻率×量化位數(shù)

×聲道數(shù)/8(字節(jié)/秒)×?xí)r間采樣頻率(kHz)量化位數(shù)(bit)數(shù)據(jù)量(KB/s)單聲道立體聲11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.27192.1.2數(shù)字音頻的獲取方式

在多媒體應(yīng)用軟件中,經(jīng)常要使用音頻素材。數(shù)字音頻的獲取主要有以下幾種方式:(1)使用聲卡采集模擬設(shè)備上的聲音信息,并以文件的形式存儲(chǔ)在計(jì)算機(jī)中。(2)使用聲卡錄制聲音信息,并以文件的形式存儲(chǔ)在計(jì)算機(jī)中。(3)使用聲卡及MIDI設(shè)備在計(jì)算機(jī)上創(chuàng)作樂(lè)曲。(4)從互聯(lián)網(wǎng)下載或購(gòu)買(mǎi)音頻光盤(pán)。(5)從CD或VCD上截取音頻數(shù)據(jù)。(6)從視頻上獲取音頻數(shù)據(jù)。202.1.3數(shù)字音頻的文件格式1.WAV格式音頻文件2.VOC格式音頻文件3.MP3格式音頻文件4.RA格式音頻文件5.MIDI格式音頻文件6.WMA格式音頻文件212.1.3數(shù)字音頻的文件格式1.WAV格式音頻文件

WAV是最早出現(xiàn)的數(shù)字音頻格式,即波形聲音文件,由Microsoft公司和IBM公司共同開(kāi)發(fā)。優(yōu)點(diǎn):支持多種音頻量化位數(shù)、采樣頻率和聲道,音質(zhì)較好,是一種標(biāo)準(zhǔn)數(shù)字音頻。采用44.1kHz的采樣頻率、16位量化位數(shù)的WAV文件的音質(zhì)與CD相差無(wú)幾。缺點(diǎn):數(shù)據(jù)量大。2.VOC格式音頻文件

是CreativeLab公司開(kāi)發(fā)的聲音文件,是SoundBlaster(聲霸卡)使用的音頻文件格式,被Windows平臺(tái)支持。每個(gè)VOC文件由文件頭塊和音頻數(shù)據(jù)塊組成。文件頭包含一個(gè)標(biāo)識(shí)、版本號(hào)和一個(gè)指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類(lèi)型的子塊,如聲音數(shù)據(jù)、靜音、標(biāo)記、ASCII文件以及終止標(biāo)志、擴(kuò)展塊等。223.MP3格式音頻文件

MP3的全稱(chēng)是MPEG-1AudioLayer3,是近年來(lái)頗為流行的音樂(lè)文件,它在1992年被合并至MPEG規(guī)范中。MP3音頻文件的壓縮是一種有損壓縮,能基本保持低音頻部分不失真,但MP3壓縮算法犧牲了聲音文件中12KHz到16KHz高音頻部分的質(zhì)量來(lái)減小文件存儲(chǔ)空間。

優(yōu)點(diǎn):音質(zhì)較好且文件的數(shù)據(jù)量較小。4.RA格式音頻文件

RA文件是RealNetwork公司開(kāi)發(fā)的一種流式音頻文件,主要應(yīng)用于網(wǎng)絡(luò)上進(jìn)行音頻傳輸,網(wǎng)絡(luò)連接連率不同,客戶(hù)端所獲得的聲音質(zhì)量也不盡相同。2.1.3數(shù)字音頻的文件格式232.1.3數(shù)字音頻的文件格式5.MIDI格式音頻文件

MIDI又稱(chēng)做樂(lè)器數(shù)字接口,是數(shù)字音樂(lè)/電子合成樂(lè)器的統(tǒng)一國(guó)際標(biāo)準(zhǔn)。MIDI文件中存儲(chǔ)的是一些指令,這些指令包括指定發(fā)聲樂(lè)器、力度、音量、延遲時(shí)間和通信編號(hào)等信息,聲卡接收到這些指令后就按照指令將聲音合成出來(lái),重放的效果完全依賴(lài)聲卡的檔次。一個(gè)30分鐘的MIDI音樂(lè)只要200KB。MIDI音樂(lè)網(wǎng):/6.WMA格式音頻文件

WMA文件是Microsoft公司開(kāi)發(fā)的一種音頻壓縮格式,其最大的特點(diǎn)是具有版權(quán)保護(hù)功能并且比MP3更強(qiáng)大的壓縮能力,能限定播放機(jī)器、播放時(shí)間及播放次數(shù),

但音質(zhì)稍差。24常用的音頻編輯處理軟件CoolEdit(2003年被Adobe公司收購(gòu))GoodwaveAdobeAudition3.0cs5cs6WaveEditSoundForge2526272829302.2音頻編輯軟件CoolEdit的使用2.2.1CoolEditPro

2.1簡(jiǎn)介2.2.2CoolEdit

Pro

2.1

的基本操作2.2.3使用CoolEdit

Pro

2.1

進(jìn)行音頻編輯的綜合實(shí)例31CoolEditPro由美國(guó)Syntrillium軟件公司開(kāi)發(fā),2003年該軟件被實(shí)力更為強(qiáng)大的Adobe公司收購(gòu)。CoolEdit的主要功能有:錄制和采集音頻文件;對(duì)音頻文件進(jìn)行剪切、粘貼、合并、重疊聲音等操作;提供多種特效(如放大、降低噪音、擴(kuò)展、回聲、延遲、失真、調(diào)整音調(diào)等);可以生成噪音、低音、靜音、電話信號(hào)等聲音;可以實(shí)現(xiàn)自動(dòng)靜音檢測(cè)和刪除、自動(dòng)節(jié)拍查找等功能;可以在多種音頻文件格式之間進(jìn)行轉(zhuǎn)換。2.2.1CoolEditPro

2.1簡(jiǎn)介321.聲音的錄制錄音方式有:(1)利用本機(jī)錄音機(jī)錄音開(kāi)始-程序-附件-娛樂(lè)-錄音機(jī)(將屬性修改為錄音,鉤選麥克風(fēng))(2)利用錄音軟件聲音的錄制還可分為內(nèi)錄和外錄兩種。設(shè)備要素:(1)聲卡(2)音箱(3)麥克風(fēng)2.2.2CoolEdit的基本操作33注意:

一般麥克風(fēng)錄音都是單聲道,如果要立體聲,那你就必須要有兩個(gè)麥克風(fēng),并按照嚴(yán)格的立體聲擺位錄音才可以,要分開(kāi)軌道錄制。如果你要雙聲道,你復(fù)制單聲道之后粘貼在另外一個(gè)聲道就可以了,但這樣只是雙聲道,并非立體聲。立體聲的定義是兩邊聲道同時(shí)發(fā)音,但是發(fā)出的聲音在空間,聲像,電平上都是不同的,所以叫立體聲。雙聲道也是兩個(gè)聲道同時(shí)發(fā)音,但是兩個(gè)聲道發(fā)出的聲音都是一模一樣的,所以只能叫雙聲道,不能叫立體聲。2.2.2CoolEdit的基本操作342.音頻數(shù)據(jù)的編輯三種音頻粘貼方式:(1)普通粘貼(2)粘貼到新文件(3)混合粘貼注:在多軌中,按鼠標(biāo)右鍵,可隨意拖動(dòng)波形聲音。2.2.2CoolEdit的基本操作35注:重點(diǎn)了解“效果”的編輯主要操作有:(1)設(shè)置聲音的淡入與淡出(2)提高音量與單調(diào)的操作(3)加入混音與低音效果(4)消除人聲,制作簡(jiǎn)單伴奏(5)制作回聲(6)降噪2.2.2CoolEdit的基本操作361.CoolEdit界面2.2.3CoolEdit軟件介紹與系列操作37CoolEdit有兩種編輯狀態(tài),即波形編輯狀態(tài)和多音軌編輯狀態(tài),如圖2-4和圖2-5所示,這兩種狀態(tài)可以通過(guò)快捷鍵【F12】或默認(rèn)工具欄的第一個(gè)按鈕進(jìn)行切換。波形編輯狀態(tài)主要用來(lái)對(duì)音頻進(jìn)行編輯,多音軌編輯狀態(tài)主要用來(lái)進(jìn)行音頻合成。CoolEditPro2.1波形編輯狀態(tài)從上到下共分為標(biāo)題欄、菜單欄、工具欄、資源管理區(qū)、波形顯示區(qū)、操作區(qū)、狀態(tài)欄顯示區(qū)六個(gè)部分,如圖2-4所示。2.2.3CoolEdit軟件介紹與系列操作38

2.2.3CoolEdit軟件介紹與系列操

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論