版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章音頻處理技術(shù)(一)西安交通大學(xué)計(jì)算機(jī)教學(xué)實(shí)驗(yàn)中心2007多媒體技術(shù)及應(yīng)用教學(xué)要求論文外文翻譯1問題的提出什么是聲音?聲音有哪些物理特征?音樂1、2、歌曲1、2、3、MIDI1、2、3、樂器伴唱……當(dāng)我們看到“聲音”這個(gè)字時(shí),聯(lián)想到的是什么?……2一.聲音的基本特性聲音的表現(xiàn)形式有三類:語(yǔ)音是指具有語(yǔ)言內(nèi)涵和人類約定的特殊媒體;音樂是規(guī)范的符號(hào)化了的聲音;音響指其他自然聲音,如動(dòng)物的叫聲、機(jī)器的轟鳴聲、風(fēng)雨雷電聲等。3聲音什么是聲音?聲波機(jī)械振動(dòng)或氣流擾動(dòng)引起周圍彈性媒質(zhì)發(fā)生波動(dòng)而產(chǎn)生聲波。聲源產(chǎn)生聲波的物體為聲源(如人聲帶、樂器等)。聲場(chǎng)聲波所及的空間范圍稱為聲場(chǎng)。聲音聲波傳到人耳,經(jīng)過人類聽覺系統(tǒng)的感知就是聲音。聲音是振動(dòng)的波,是隨時(shí)間連續(xù)變化的物理量。聲音依靠介質(zhì)的振動(dòng)進(jìn)行傳播。聲源就是振動(dòng)源。4聲波的表示聲波可以用一條連續(xù)的曲線來表示,它在時(shí)間和幅度上都是連續(xù)的,稱為模擬音頻信號(hào)。在任一時(shí)刻t,聲波可以分解成一系列正弦波的線性疊加:An是振幅,表示聲音的強(qiáng)弱ω是聲波的基頻,表示聲音音調(diào)的高低φn是n次諧波的初相位nω是ω的n次諧波分量,或稱為泛音5音頻信號(hào)的特征聲音的物理特性頻率、聲壓和聲強(qiáng)、動(dòng)態(tài)范圍、頻譜聲音的心理特性音調(diào)、響度、音色、掩蔽效應(yīng)、方位感、空間感聲音的音質(zhì)頻帶寬度、信噪比、數(shù)據(jù)量6聲音的物理特性周期/頻率/帶寬
兩個(gè)相鄰波之間的時(shí)間長(zhǎng)度為周期T,單位為秒;每秒鐘聲源振動(dòng)的次數(shù)稱為頻率f,單位Hz;
f=1/T描述組成復(fù)合信號(hào)的頻率范圍,稱為帶寬。t振幅周期7聲音頻帶示意圖高于20kHz頻率的聲音人耳聽不到。人類對(duì)聲音的感覺是有限的,即只能在一個(gè)頻帶范圍內(nèi)有效。有的音響產(chǎn)品工作頻率上限為50kHz,調(diào)音臺(tái)的最高工作頻率設(shè)計(jì)到100kHz。
8聲波的頻率范圍在自然界中,人耳接收的音域:20~20,000Hz次聲波(大象):<20Hz超聲波(海豚):>20,000Hz9聲源的頻率范圍日常生活中的不同聲源頻率范圍:男聲:100~9,000Hz
女聲:150~10,000Hz
電話聲:200~3,400Hz
收音機(jī)AM調(diào)幅廣播聲:50~7,000Hz收音機(jī)FM調(diào)頻廣播聲:20~15,000Hz
專業(yè)級(jí)音響放大器聲:10~40,000Hz10聲壓和聲強(qiáng)聲壓P聲波在空氣傳播造成空氣中的氣壓發(fā)生變化而產(chǎn)生的壓強(qiáng)(相當(dāng)于在無聲波下空氣中的氣壓上疊加一個(gè)變化的壓強(qiáng)),被稱為聲壓,記作P。單位有帕斯卡(Pa)和微巴(μbar)。聲強(qiáng)I描述聲音傳播所需能量的強(qiáng)度(聲波是由能量來維持傳播的。如揚(yáng)聲器紙盆的振動(dòng)是由電能轉(zhuǎn)換而來)。單位時(shí)間內(nèi)通過垂直于聲波傳播方向的單位面積內(nèi)的聲波能量為聲場(chǎng)中某點(diǎn)的聲強(qiáng),記作I,單位為瓦/米2(W/m2)。聲強(qiáng)與聲壓最大值的平方成正比。11在聲學(xué)中,量級(jí)定義為一個(gè)量與同類基準(zhǔn)量之比的以10為底對(duì)數(shù)。單位是dB。聲壓級(jí)Lp
為:
Lp=20lgP/P0
聲壓基準(zhǔn)量為P0=2×10-4μbar,聲壓級(jí)為0~120dB。聲強(qiáng)級(jí)LI為:
LI=10lgI/I0
聲強(qiáng)的基準(zhǔn)量為I0=10-12W/m2。聲壓級(jí)&聲強(qiáng)級(jí)12閾閾值是指臨界值。可聽閾引起人耳剛能聽到聲音時(shí)的聲壓,與年齡有關(guān)。中音頻時(shí)約為0.0002微巴。痛閾使人耳膜感到疼痛的聲壓,超過200微巴的聲壓,能使人耳膜產(chǎn)生疼痛。13分貝(dB)自然現(xiàn)象:揚(yáng)聲器的功率增加一倍發(fā)出的聲音,人聽到的聲音強(qiáng)度并不是增加一倍。在聲學(xué)中用分貝來表示聲壓或聲強(qiáng)的變化程度。人聽覺神經(jīng)的刺激程度不與刺激量大小成正比,而是按刺激量以10為底的對(duì)數(shù)增長(zhǎng)。成對(duì)數(shù)關(guān)系變化。14動(dòng)態(tài)范圍指聲音最大聲壓級(jí)和最小聲壓級(jí)之間的差值。每種聲源的動(dòng)態(tài)范圍依據(jù)各自的特性有所不同。如女聲的動(dòng)態(tài)范圍為25~50dB,男聲為30~50dB,交響樂隊(duì)的動(dòng)態(tài)范圍大于100dB。動(dòng)態(tài)范圍不僅用來表示一個(gè)聲源產(chǎn)生的最大聲壓級(jí)與最小聲壓級(jí)之間的差值,錄音設(shè)備或記錄聲音的載體(磁帶、光盤、硬盤)同樣可用動(dòng)態(tài)范圍表示能夠處理信號(hào)電平的范圍。15動(dòng)態(tài)范圍的相對(duì)強(qiáng)度動(dòng)態(tài)范圍可以用信號(hào)的相對(duì)強(qiáng)度表示:信號(hào)的動(dòng)態(tài)范圍=20×lg(信號(hào)最大強(qiáng)度/信號(hào)最小強(qiáng)度)(dB)其中信號(hào)可以用電壓或功率衡量。因?yàn)槭且环N比例關(guān)系,故只要采用相同的度量單位,其結(jié)果都是一致的。
16頻譜物體在一定位置的附近作來回往復(fù)的運(yùn)動(dòng),稱為簡(jiǎn)諧振動(dòng)。簡(jiǎn)諧振動(dòng)會(huì)產(chǎn)生一個(gè)特定音調(diào)的純音,聽起來感覺單薄。樂器很少產(chǎn)生單一頻率的純音,而是復(fù)音。復(fù)音的產(chǎn)生基于物體的復(fù)雜振動(dòng),可以分解為許多不同振幅和不同頻率的簡(jiǎn)諧振動(dòng)(即看成簡(jiǎn)諧振動(dòng)的疊加)。簡(jiǎn)諧振動(dòng)的振幅按頻率排列的圖形稱為頻譜。頻譜可一目了然地看出復(fù)雜振動(dòng)的頻率結(jié)構(gòu)。17鋼琴的復(fù)音頻譜鋼琴(基頻為253Hz)的復(fù)音頻譜18聲音的心理學(xué)特性
從聲學(xué)心理角度分析,聲音有三個(gè)要素:音調(diào)、響度和音色。它們與聲波的頻率、聲壓和頻譜結(jié)構(gòu)對(duì)應(yīng)。19音調(diào)音調(diào)代表聲音的高低,與頻率有關(guān)。頻率越高,音調(diào)越高,反之亦然。人對(duì)聲音頻率的感覺表現(xiàn)為音調(diào)的高低,在音樂中稱為音高。音調(diào)與基頻的對(duì)數(shù)(20×lg)成線性關(guān)系,單位為美(mei)?;l越低,給人的感覺越低沉?;l頻率增加一倍,音樂上稱提高了一個(gè)八度。在編輯聲音時(shí),如果對(duì)聲音的頻率進(jìn)行調(diào)整,其音調(diào)也會(huì)隨之而變;不同聲源有自己特定的音調(diào),若改變了聲源的音調(diào),聲音會(huì)發(fā)生質(zhì)的轉(zhuǎn)變。20頻率與音調(diào)的關(guān)系
21響度響度也稱音強(qiáng),是人耳對(duì)聲音強(qiáng)弱的感覺程度。常說的“音量”也是指響度。響度與聲波的振幅成正比,振幅越大,響度越大。唱盤、CD激光盤等播放出來的聲音響度是一定的,但通過控制、調(diào)整播放設(shè)備的音量,可以改變聆聽時(shí)的響度。22等響度曲線人的耳道會(huì)對(duì)某段頻率產(chǎn)生共鳴,使靈敏度提高。因此人耳聽到聲音的響度與聲音的頻率有關(guān)。描述響度、聲壓以及聲源頻率之間的關(guān)系曲線稱為等響度曲線。從曲線看出,當(dāng)音量開到使聲壓級(jí)為80dB時(shí),就可做到高、低頻聲音豐滿。23音色音色是聲音的特色,又稱音品。通常說法是:聲音的音調(diào)和響度以外的音質(zhì)差異叫做音色。影響音色主要因素是復(fù)音。所謂“復(fù)音”是指不同頻率和不同振幅的混合聲音,自然聲中大部分是復(fù)音。在復(fù)音中,最低頻率的聲音是“基音”(聲音的基調(diào)),其他頻率的聲音稱為“諧音”(也叫泛音)?;艉椭C音是構(gòu)成聲音音色的重要因素。各種聲源都具有自己獨(dú)特的音色,例如每種樂器的聲音、每個(gè)人的聲音等,人是根據(jù)音色來辨別聲源種類的。24音色(續(xù))高次諧波越豐富,音色就越有明亮感和穿透力。此外,音色還與諸多其他因素有關(guān),如聽音條件等。音色是一個(gè)主觀量,常用柔和、刺耳、飽滿等詞描述。25掩蔽效應(yīng)稱聽不到的聲音為被掩蔽聲,而起掩蔽作用的聲音為掩蔽聲。掩蔽效應(yīng)的實(shí)質(zhì)是掩蔽聲的出現(xiàn)使人耳聽覺的等響度曲線的最小可聽閾抬高。掩蔽效應(yīng)的一般規(guī)律是強(qiáng)音壓低音、低頻率聲音壓高頻率。利用掩蔽效應(yīng)可以用有用信號(hào)去掩蔽無用的聲信號(hào),只需要把無用聲音的聲壓級(jí)降低到掩蔽閾以下即可。在數(shù)字音頻處理中,還可以利用掩蔽效應(yīng)去掉人耳聽不到的那部分信號(hào)進(jìn)行聲音數(shù)據(jù)的壓縮。26方位感人憑借雙耳在一定聲學(xué)環(huán)境內(nèi)能夠?qū)β曉炊ㄎ?,這種能力來自于聲源發(fā)出的聲波到達(dá)雙耳間的強(qiáng)度差、時(shí)間差等因素。聲源到達(dá)聽者耳朵的聲音有兩個(gè),一個(gè)聲音直接到達(dá),而另一個(gè)由于人頭部遮蔽,需繞過頭部才能到達(dá)。稱前者為直達(dá)聲,而后者為繞射聲。若有兩個(gè)聲源,增大其中一個(gè)聲源的強(qiáng)度,由于該聲音源發(fā)出的直達(dá)聲或繞射聲的聲壓大于另一個(gè)聲源,雙耳將會(huì)產(chǎn)生聲壓級(jí)差。使聽者感受的聲源(聲像)位置向強(qiáng)度較大的聲源方向移,使人感受到聲音的立體感。27空間感一個(gè)聲源發(fā)出的聲音同時(shí)向各個(gè)方向散開,其發(fā)散的角度取決于聲源所具有的指向性,發(fā)散的聲波有一小部分直接傳給聽者,而大部分會(huì)被空間表面反射,然后到達(dá)聽者。由于直接和經(jīng)反射到達(dá)聽者的兩個(gè)聲音途徑存在差別(取決于環(huán)境)而帶來時(shí)間差。當(dāng)時(shí)間差超過一定數(shù)量時(shí),聽者會(huì)聽到先后到達(dá)的兩個(gè)聲音,從而產(chǎn)生回音。經(jīng)多次反射,造成余聲。即使聲源已停止發(fā)聲,但聽者仍能聽到聲音存在?;芈暸c余音的感覺可使聽者感受出房間體積大小、房間高低及內(nèi)表面結(jié)構(gòu)上的差異,這便是空間感。28
音頻信號(hào)的質(zhì)量指標(biāo)
頻帶寬度動(dòng)態(tài)范圍信噪比數(shù)據(jù)量29(1)頻帶寬度音頻信號(hào)所包含的諧波分量越豐富,音色越好。在廣播通信和數(shù)字音響系統(tǒng)中,以聲音信號(hào)所包含的諧波分量的頻率范圍來衡量聲音的質(zhì)量,即帶寬。不同質(zhì)量的聲音的頻帶對(duì)比示意圖
30動(dòng)態(tài)范圍動(dòng)態(tài)范圍越大,說明音頻信號(hào)強(qiáng)度的相對(duì)變化范圍越大,音響效果越好。動(dòng)態(tài)范圍一般用dB為單位來計(jì)量。FM(調(diào)頻)廣播的動(dòng)態(tài)范圍約60dB,AM(調(diào)幅)廣播的動(dòng)態(tài)范圍約40dB。CD-DA的動(dòng)態(tài)范圍約100dB,數(shù)字電話約50dB。31信噪比信噪比SNR(SignalNoiseRatio)是有用信號(hào)與噪聲之比的簡(jiǎn)稱。信噪比大,在一定程度上能夠掩蔽噪聲,從而獲得較好的聲音效果。信噪比不僅是聲音設(shè)備的性能指標(biāo),在聲音的錄制和播放時(shí),也要注意環(huán)境噪聲。錄制時(shí)應(yīng)盡可能減小環(huán)境噪音。輸出時(shí)應(yīng)使音量適當(dāng)大,以減少環(huán)境噪音對(duì)聽音的影響。一般話筒和音箱的信噪比在75dB以上。聲卡的信噪比在85~95dB。32數(shù)據(jù)量音質(zhì)與數(shù)據(jù)采樣頻率和數(shù)據(jù)位數(shù)有關(guān):采樣頻率越低,位數(shù)越少,音質(zhì)越差;采樣頻率越高,位數(shù)越多,音質(zhì)越好。33二、數(shù)字音頻聲音的數(shù)字化
數(shù)字化就是將連續(xù)信號(hào)變成離散信號(hào)。對(duì)音頻信號(hào),首先在時(shí)間上離散,取有限個(gè)時(shí)間點(diǎn),稱為采樣。然后在幅度上離散,取有限個(gè)幅度值,稱為量化。再將得到的數(shù)據(jù)表示成計(jì)算機(jī)容易識(shí)別的格式,稱為編碼。34PCM編碼
PCM是把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的編碼方法,它主要包括采樣、量化和編碼3個(gè)過程。采樣按時(shí)間間隔測(cè)量,把時(shí)間連續(xù)的模擬信號(hào)轉(zhuǎn)換成時(shí)間離散、幅度連續(xù)的采樣信號(hào)。如果采樣時(shí)間間隔相等,稱為均勻采樣;量化是按“四舍五入”等方法將采樣得到的數(shù)值限定在幾個(gè)有限的數(shù)值中,將采樣信號(hào)轉(zhuǎn)換成時(shí)間離散、幅度離散的數(shù)字信號(hào);編碼(coding)是將量化后的信號(hào)轉(zhuǎn)換成一個(gè)二進(jìn)制碼組輸出。例如,量化得到的數(shù)據(jù)中只會(huì)出現(xiàn)兩個(gè)數(shù)值51和80,則只用一位二進(jìn)制數(shù)表示即可,用0表示51,用1表示80。這種編碼方法稱為自然編碼。35模擬聲音信號(hào)的采樣和量化過程示意
模擬聲音信號(hào)的波形采樣得到的離散時(shí)間信號(hào)再量化得到的數(shù)字信號(hào)36例2.1例2.1設(shè)一個(gè)連續(xù)信號(hào)的波形可以表示為:設(shè)采樣頻率為21Hz,[-10,10]內(nèi)的量化間隔取為1,試計(jì)算出該信號(hào)0到1秒內(nèi)的量化數(shù)據(jù)。在0-1秒內(nèi),取21個(gè)采樣點(diǎn)。在1、1/20、2/20、……19/20、1秒時(shí)刻采樣,將采樣得到的數(shù)值取整,即得到量化數(shù)據(jù)。37表2-1連續(xù)波形的數(shù)字化
序號(hào)采樣點(diǎn)采樣數(shù)據(jù)量化值序號(hào)采樣點(diǎn)采樣數(shù)據(jù)量化值00.009.414219
110.55-9.37474-910.05-7.66754-8120.604.73547520.101.308671130.65-2.56445-330.151.079301140.700.40759040.20-3.46729-3150.756.34915650.258.934339160.80-9.36672-9…………90.45-1.63831-2201.004.400904100.507.89216838舉例對(duì)于CD-DA,采樣頻率為44.1kHz,即每秒取44,100個(gè)點(diǎn)。幅度的取值范圍是限制在216=65,536以內(nèi),量化間隔為1,即量化幅度可以取65,536個(gè)不同的值,計(jì)算機(jī)中用16位的存儲(chǔ)空間就可以表示一個(gè)量化后的數(shù)值。動(dòng)態(tài)范圍為20×lg(216)≈96dB39PCM編碼原理編碼的過程:采樣。用一組脈沖采樣時(shí)鐘信號(hào)乘以輸入的模擬音頻信號(hào),得到離散時(shí)間信號(hào)。量化。對(duì)采樣后的信號(hào)幅值進(jìn)行量化。量化過程由量化器來完成。編碼。對(duì)經(jīng)量化器變換后的信號(hào)再進(jìn)行編碼,即把量化的信號(hào)電平轉(zhuǎn)換成二進(jìn)制碼組,得到離散的二進(jìn)制數(shù)據(jù)序列x(n)。數(shù)據(jù)處理。計(jì)算機(jī)對(duì)量化后的二進(jìn)制數(shù)據(jù)可以用文件的形式存儲(chǔ)、編輯和處理,并可還原成原始的模擬信號(hào)播放。40PCM編碼示意圖
41
均勻量化和非均勻量化
均勻量化采用相等的量化間隔(“等分尺”)對(duì)采樣得到的信號(hào)作量化,也稱為線性量化。缺點(diǎn):增加的樣本位數(shù)不能得到充分的利用。42非均勻量化非線性量化思想是大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔;這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。43非均勻量化算法非均勻量化采用兩種算法(定義采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系):μ律(μ-Law)壓擴(kuò)A律(A-Law)壓擴(kuò)44律壓擴(kuò)
μ律(μ-Law)壓擴(kuò)主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的公式確定量化輸入和輸出的關(guān)系。
45A律(A-Law)A律(A-Law)壓擴(kuò)主要用在歐洲和中國(guó)大陸等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系。46舉例對(duì)于采樣頻率為8kHz,樣本精度為13位、14位或者16位的輸入信號(hào),使用μ律壓擴(kuò)編碼或者使用A律壓擴(kuò)編碼,經(jīng)過PCM編碼器之后每個(gè)樣本需8位二進(jìn)制存儲(chǔ),輸出的數(shù)據(jù)率為64kb/s。這個(gè)數(shù)據(jù)就是CCITT推薦的G.711標(biāo)準(zhǔn):話音頻率脈沖編碼調(diào)制。
47數(shù)字音頻的技術(shù)指標(biāo)采樣頻率采樣精度聲道數(shù)音頻數(shù)據(jù)傳輸率編碼算法與音頻數(shù)據(jù)壓縮比48采樣頻率采樣頻率是指一秒鐘采樣的次數(shù)。采樣頻率越高,單位時(shí)間內(nèi)采集的樣本數(shù)越多,得到波形越接近于原始波形,音質(zhì)就越好。
根據(jù)奈奎斯特(HarryNyquist)采樣理論:如果采樣頻率高于輸入信號(hào)最高頻率的兩倍,重放時(shí)就能從采樣信號(hào)序列無失真地重構(gòu)原始信號(hào)。例如,電話話音的信號(hào)頻率約為3.4kHz,若采樣頻率選為8kHz,就能無失真地重放原始聲音。49采樣的3個(gè)常用頻率分別為:11.025kHz——AM(調(diào)幅)廣播22.05kHz——FM(調(diào)頻)廣播44.1kHz——CD高保真音質(zhì)聲音現(xiàn)在聲卡的采樣頻率一般為48kHz甚至96kHz。50采樣精度
采樣精度用每個(gè)聲音樣本的位數(shù)表示,也叫樣本精度或量化位數(shù),反映度量聲音波形幅度的精度。例如,每個(gè)聲音樣本用16位表示,則量化樣本值在0~65535之間,它的精度是輸入信號(hào)的1/65536。
采樣精度決定了模擬信號(hào)數(shù)字化以后的動(dòng)態(tài)范圍。若以8位量化,則其波形的幅值可分為28=256等份,等效的動(dòng)態(tài)范圍為20×lg(256)=48dB。若以16位采樣,則可分為216=65536等份,等效動(dòng)態(tài)范圍為20×lg(65536)=96dB。采樣精度影響到聲音的質(zhì)量位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲(chǔ)空間也越多;位數(shù)越少,聲音的質(zhì)量越低,需要的存儲(chǔ)空間越少。51聲道數(shù)
單聲道(mono)信號(hào)一次產(chǎn)生一組聲波數(shù)據(jù)。雙聲道或立體聲(stereo)一次產(chǎn)生兩組聲波數(shù)據(jù)。雙聲道在硬件中占兩條線路,一條是左聲道,一條是右聲道。立體聲不僅音質(zhì)、音色好,而且能產(chǎn)生逼真的空間感。但立體聲數(shù)字化后所占空間比單聲道多一倍。52其他因素除采樣頻率、采樣精度、聲道數(shù)影響聲音質(zhì)量外,聲音錄制時(shí)環(huán)境噪聲、聲卡內(nèi)部噪聲以及采樣數(shù)據(jù)丟失等都會(huì)造成聲音質(zhì)量的下降。實(shí)際收聽時(shí),音響(功率放大器、揚(yáng)聲器等)的質(zhì)量對(duì)音質(zhì)的表現(xiàn)也起很大作用。53音頻數(shù)據(jù)傳輸率
音頻信號(hào)數(shù)字化后,產(chǎn)生大量數(shù)據(jù)。產(chǎn)生數(shù)據(jù)的速度或播放聲音時(shí)需要傳輸數(shù)據(jù)的速度影響聲音的播放質(zhì)量。數(shù)據(jù)傳輸率用每秒鐘傳輸?shù)臄?shù)據(jù)位數(shù)表示,記為bps(bitpersecond)。未經(jīng)壓縮的數(shù)字音頻數(shù)據(jù)傳輸率為:
數(shù)據(jù)傳輸率(bit/s)=采樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)54聲音質(zhì)量和數(shù)字化指標(biāo)
質(zhì)量采樣頻率(kHz)樣本精度(bit)單道聲/立體聲數(shù)據(jù)率(kB/s)(未壓縮)頻率范圍電話*88單道聲8200~3400HzAM11.0258單道聲11.050~7000HzFM22.05016立體聲88.220~15000HzCD44.116立體聲176.420~20000HzDAT4816立體聲192.020~20000Hz55例2-2例2.2高保真立體聲數(shù)字音頻的量化位數(shù)為16,試計(jì)算其數(shù)據(jù)傳輸率。
解:高保真立體聲數(shù)字音頻采樣頻率為44.1kHz,雙聲道,其數(shù)據(jù)傳輸率為:數(shù)據(jù)傳輸率=44.1(kHz)×16(bit)×2(聲道)=1411.2(kbps)
如果采用PCM編碼,數(shù)字音頻文件所占用的空間可用如下的公式計(jì)算:
音頻數(shù)據(jù)量(Byte)=數(shù)據(jù)傳輸率×持續(xù)時(shí)間/8(bit/Byte)
其中數(shù)據(jù)量以字節(jié)(Byte)為單位;數(shù)據(jù)傳輸率以每秒比特(bps)為單位;持續(xù)時(shí)間以秒(s)為單位。
56例2-3例2.3計(jì)算1分鐘未經(jīng)壓縮的高保真立體聲數(shù)字聲音文件的大小。
解:高保真立體聲數(shù)字音頻采樣頻率為44.1kHz,16位量化,雙聲道,其數(shù)據(jù)傳輸率為:
數(shù)據(jù)傳輸率=44.1(kHz)×16(bit)×2(聲道)=1411.2(kbps)
1分鐘這樣的聲音文件的大小為:音頻數(shù)據(jù)量=1411.2(kb/s)×60(s)/8(bit/Byte)=10584kB未經(jīng)壓縮的4分鐘的歌曲文件約42M數(shù)據(jù),128M的MP3播放器只能存放3首這樣的歌曲。
57
編碼算法與音頻數(shù)據(jù)壓縮比
未壓縮的音頻數(shù)據(jù)量非常大,因此在編碼的時(shí)候常采用壓縮的方式。實(shí)際上,編碼的作用一是記錄數(shù)字?jǐn)?shù)據(jù),二是采用一定的算法來壓縮數(shù)據(jù)以減少存儲(chǔ)空間和提高傳輸效率。壓縮編碼的基本指標(biāo)之一就是壓縮比,一般為數(shù)據(jù)壓縮前后的數(shù)據(jù)量之比:58數(shù)據(jù)壓縮說明數(shù)字化指標(biāo)不同反映在采用了不同數(shù)據(jù)壓縮比。如果PCM編碼采用4bit量化對(duì)CD音質(zhì)信號(hào)壓縮,其壓縮比為4:1。這種情況下,用來記錄幅值的比特位越少,編碼后數(shù)據(jù)量就越小,壓縮比越大。但壓縮比越大,丟掉的信息就會(huì)越多,信號(hào)還原后失真就越大。(對(duì)有損壓縮)壓縮算法包括有損壓縮和無損壓縮:有損壓縮解壓后數(shù)據(jù)不能完全復(fù)原,要丟失一部分信息。無損壓縮不丟失任何信息,能較好地復(fù)原原始信號(hào)。59數(shù)字音頻文件格式
數(shù)字聲音文件格式是數(shù)字音頻在磁盤文件中的存放形式,相同的數(shù)據(jù)可以有不同的文件格式,而不同的數(shù)據(jù)也可以有相同的文件格式。WAVE格式MP3格式RA格式60WAVE文件格式WAVE文件是一種通用的音頻數(shù)據(jù)文件,文件擴(kuò)展名為“.WAV”,Windows系統(tǒng)和一般的音頻卡都支持這種格式文件的生成、編輯和播放。WAVE文件由三部分組成:文件頭(標(biāo)明是WAVE文件、文件結(jié)構(gòu)和數(shù)據(jù)的總字節(jié)數(shù))、數(shù)字化參數(shù)(如采樣率、聲道數(shù)、編碼算法等),最后是實(shí)際波形數(shù)據(jù)。CD激光唱盤中包含的就是WAVE格式的波形數(shù)據(jù)。一般說來,聲音質(zhì)量與其WAVE格式的文件大小成正比。WAVE文件的特點(diǎn)是易于生成和編輯,但在保證一定音質(zhì)的前提下壓縮比不夠,不適合在網(wǎng)絡(luò)上播放。61MP3文件MP3文件是采用MP3算法壓縮生成的數(shù)字音頻數(shù)據(jù)文件,以“.MP3”為文件后綴。MP3利用MPEG(MotionPictureExpertGroup,運(yùn)動(dòng)圖像專家組)制定的MPEG-1Audiolayer3的壓縮標(biāo)準(zhǔn),將音頻信息用10:1甚至12:1壓縮率變成容量較小的數(shù)據(jù)文件。MPEG-1壓縮主要用于VCD數(shù)據(jù)的壓縮,也用來壓縮不包含圖像的純音頻數(shù)據(jù),音頻壓縮算法包括MPEGAudioLayer1、MPEGAudioLayer2等,而MPEGAudioLayer3有很高的壓縮比。雖然MP3是一種利用了人類心理聲學(xué)特性的有損壓縮,人耳基本不能分辨出失真,音質(zhì)幾乎達(dá)到了CD音質(zhì)標(biāo)準(zhǔn)。按照這種算法,10張CD-DA的內(nèi)容可以壓縮到l張CD-ROM中,而且視聽效果相當(dāng)好。62RA文件
RealAudio是Realnetworks推出的一種音樂壓縮格式,它的壓縮比可達(dá)到96:1,因此在網(wǎng)上比較流行。經(jīng)過壓縮的音樂文件可以在通過速率為14.4kb/s的MODEM上網(wǎng)的計(jì)算機(jī)中流暢回放。其最大特點(diǎn)是可以采用流媒體的方式實(shí)現(xiàn)網(wǎng)上實(shí)時(shí)播放,即邊下載邊播放。
63三、電子合成音樂
在多媒體系統(tǒng)中,除了用數(shù)字音頻的方式以外,還可以用合成的方式產(chǎn)生音樂。音樂合成的方式根據(jù)一定的協(xié)議標(biāo)準(zhǔn),使用音樂符號(hào)來記錄和解釋樂譜,并組合成相應(yīng)的音樂信號(hào),這就是MIDI(MusicalInstrumentDigitalInterface樂器數(shù)字接口)。
64電子合成音樂的有關(guān)概念
MIDI不是把音樂的波形進(jìn)行數(shù)字化采樣和編碼,而是將數(shù)字式電子樂器的彈奏過程以命令符號(hào)的形式記錄下來,如按了哪一個(gè)鍵、力度多大、時(shí)間多長(zhǎng)等。當(dāng)需要播放這首樂曲時(shí),根據(jù)記錄的樂譜指令,通過音樂合成器生成音樂聲波,經(jīng)放大后由揚(yáng)聲器播出。
65電子音樂中的常用術(shù)語(yǔ)電子合成器(musicalsynthesizer)是由數(shù)字信號(hào)處理器和其他集成電路芯片構(gòu)成的電子設(shè)備,用來產(chǎn)生并修改正弦波形,然后通過聲音產(chǎn)生器和揚(yáng)聲器發(fā)出特定的聲音。復(fù)調(diào)(polyphony)指合成器同時(shí)演奏若干音符時(shí)發(fā)出的聲音。如鋼琴、吉他等樂器可以同時(shí)演奏幾種音符,而雙簧管就不能。復(fù)調(diào)著重于同時(shí)演奏的音符數(shù),如鋼琴的和弦音符。多音色(timbre)指同時(shí)演奏幾種不同樂器時(shí)發(fā)出的聲音。它著重同時(shí)演奏的樂器數(shù)。例如,具有6音符復(fù)音的4種樂器合成器,可以同時(shí)演奏4種不同聲音的6個(gè)音符,如3個(gè)鋼琴的合弦音符、1個(gè)長(zhǎng)笛、1個(gè)小提琴和1個(gè)薩克斯管的音符。66與MIDI有關(guān)的術(shù)語(yǔ)(1)MIDI電子樂器它是能產(chǎn)生特定聲音的合成器,如電子鍵盤、吉他、薩克斯管等;它們相互間的數(shù)據(jù)傳送符合MIDI的通信約定。(2)MIDI消息(message)或指令MIDI軟件通信協(xié)議,實(shí)際上是用數(shù)字指令描述的音樂樂譜,其中包含音符、強(qiáng)度、定時(shí)及樂器的指派等。(3)MIDI接口(interface)MIDI硬件通信協(xié)議,可使電子樂器互連或與計(jì)算機(jī)硬件端口相連,可發(fā)送和接收MIDI消息。(4)MIDI通道(channel)MIDI標(biāo)準(zhǔn)提供了16個(gè)通道,每種通道對(duì)應(yīng)一種邏輯的合成器,即對(duì)應(yīng)一種樂器的合成。(5)音序器(sequencer)它指可用來記錄、編輯和播放MIDI文件的計(jì)算機(jī)程序。67電腦合成音樂的制作原理
電腦合成音樂需要使用MIDI語(yǔ)言。MIDI語(yǔ)言利用字節(jié)傳送來告知相應(yīng)的設(shè)備能夠做什么和不能做什么。MIDI字節(jié)通知樂器、聲卡和其他MIDI設(shè)備什么時(shí)候開始和什么時(shí)候結(jié)束演奏音符。MIDI自身并不產(chǎn)生和傳送聲音,只是傳送產(chǎn)生聲音的控制符號(hào)。使用MIDI語(yǔ)言的設(shè)備(MIDI設(shè)備)可以互聯(lián)。典型設(shè)備是合成器或者M(jìn)IDI控制鍵盤,也可以是外掛式音響效果單元、計(jì)算機(jī)、配備有MIDI接口的吉他等。68
MIDI音樂的產(chǎn)生過程
69MIDI通道
當(dāng)MIDI設(shè)備交流信息時(shí),需要遵循一定的事件序列。例如,兩個(gè)MIDI設(shè)備在建立連接之后首先要做的事情就是在使用相同的MIDI通道方面達(dá)成一致。MIDI可以在16個(gè)這樣的通道上進(jìn)行操作,這些通道用數(shù)字分別標(biāo)記為0~15。只要兩個(gè)MIDI設(shè)備進(jìn)行交流,就必須使用相同的通道。對(duì)電腦合成音樂,每個(gè)邏輯通道可指定一種樂器,音樂鍵盤可設(shè)置在這16個(gè)通道之中的任何一個(gè),而MIDI聲源或者聲音模塊可被設(shè)置在指定的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年VIVO手機(jī)項(xiàng)目籌資方案
- 電子技術(shù)基礎(chǔ)復(fù)習(xí)題+答案
- 養(yǎng)老院老人生活設(shè)施維修人員培訓(xùn)制度
- 2024年桶裝水原水采購(gòu)與供應(yīng)合作協(xié)議范本3篇
- 2024年度企業(yè)入駐文化娛樂孵化基地合作協(xié)議3篇
- 2024年度航空航天材料委托加工及研發(fā)合作協(xié)議3篇
- 2024年服務(wù)合同范本:某電力企業(yè)電網(wǎng)運(yùn)維服務(wù)
- 2025工程承包的合同范文
- 2025企業(yè)宣傳片影視制作合同書
- 2024年度設(shè)備回購(gòu)與原廠零配件供應(yīng)及維修合同范本3篇
- 高中英語(yǔ)新課標(biāo)新增詞匯匯總1
- GB/T 31586.2-2015防護(hù)涂料體系對(duì)鋼結(jié)構(gòu)的防腐蝕保護(hù)涂層附著力/內(nèi)聚力(破壞強(qiáng)度)的評(píng)定和驗(yàn)收準(zhǔn)則第2部分:劃格試驗(yàn)和劃叉試驗(yàn)
- GB/T 20734-2006液化天然氣汽車專用裝置安裝要求
- GB/T 20197-2006降解塑料的定義、分類、標(biāo)志和降解性能要求
- GB/T 15561-2008靜態(tài)電子軌道衡
- GB/T 1412-2005球墨鑄鐵用生鐵
- 軍事理論論述題
- 寧德時(shí)代財(cái)務(wù)報(bào)表分析
- 門式起重機(jī)安裝施工方案
- 高中語(yǔ)文語(yǔ)法知識(shí)課件
- 《國(guó)際法》形成性考核參考資料廣東開放大學(xué)2022年10月題庫(kù)
評(píng)論
0/150
提交評(píng)論