音頻處理技術(shù)詳解課件_第1頁(yè)
音頻處理技術(shù)詳解課件_第2頁(yè)
音頻處理技術(shù)詳解課件_第3頁(yè)
音頻處理技術(shù)詳解課件_第4頁(yè)
音頻處理技術(shù)詳解課件_第5頁(yè)
已閱讀5頁(yè),還剩261頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

西安交通大學(xué)計(jì)算機(jī)教學(xué)實(shí)驗(yàn)中心1音頻處理技術(shù)1音頻處理技術(shù)簡(jiǎn)述2音頻是多媒體技術(shù)中媒體的一種,由于音頻信號(hào)是一種連續(xù)變化的模擬信號(hào),而計(jì)算機(jī)只能處理和記錄二進(jìn)制的數(shù)字信號(hào),因此,音頻信號(hào)必須經(jīng)過(guò)一定的變化和處理,變成二進(jìn)制數(shù)據(jù)后才能送到計(jì)算機(jī)進(jìn)行編輯和存儲(chǔ)。簡(jiǎn)述2音頻是多媒體技術(shù)中媒體的一種,由于音頻信號(hào)是一種連續(xù)變聲音的基本特性3音頻信號(hào)所攜帶的信息大體上可分為語(yǔ)音、音樂(lè)和音響三類。語(yǔ)音是指具有語(yǔ)言內(nèi)涵和人類約定的特殊媒體;音樂(lè)是規(guī)范的符號(hào)化了的聲音;而音響指其他自然聲音,如動(dòng)物的叫聲、機(jī)器的轟鳴聲、風(fēng)雨雷電聲等聲音的基本特性3音頻信號(hào)所攜帶的信息大體上可分為語(yǔ)音、音樂(lè)音頻信號(hào)的特征4機(jī)械振動(dòng)引起周圍彈性媒質(zhì)發(fā)生波動(dòng),產(chǎn)生聲波。產(chǎn)生聲波的物體為聲源(如人的聲帶、樂(lè)器等),聲波傳到人耳,經(jīng)過(guò)人類聽(tīng)覺(jué)系統(tǒng)的感知就是聲音。聲波在時(shí)間和幅度上都是連續(xù)的,稱為模擬音頻信號(hào)。聲波可以分解成一系列正弦波的線性疊加:音頻信號(hào)的特征4機(jī)械振動(dòng)引起周圍彈性媒質(zhì)發(fā)生波動(dòng),產(chǎn)生聲波聲音的物理特性5頻率/周期/帶寬單位時(shí)間內(nèi)聲源振動(dòng)的次數(shù)稱為聲源的頻率f,單位赫茲(Hz)頻帶寬度:帶寬,它描述組成復(fù)合信號(hào)的頻率范圍聲音的物理特性5頻率/周期/帶寬聲壓和聲強(qiáng)6聲波造成空氣中的氣壓發(fā)生變化,相當(dāng)于在無(wú)聲波氣壓上疊加一個(gè)變化的壓強(qiáng),疊加上的壓強(qiáng)稱為聲壓,記作P。單位有帕斯卡(Pa)和微巴(μbar)。人耳剛能聽(tīng)到聲音時(shí)的聲壓稱為可聽(tīng)閾聲波有能量。單位時(shí)間內(nèi)通過(guò)垂直于聲波傳播方向的單位面積內(nèi)的聲波能量為聲強(qiáng),記作I,單位為瓦/米2(W/m2)。聲強(qiáng)與聲壓最大值的平方成正比關(guān)系。聲壓和聲強(qiáng)6聲波造成空氣中的氣壓發(fā)生變化,相當(dāng)于在無(wú)聲波氣壓7在聲學(xué)中引用分貝來(lái)表示聲壓或聲強(qiáng)的變化程度。人的聽(tīng)覺(jué)神經(jīng)的刺激程度不與刺激量大小成正比,而是按刺激量以10為底的對(duì)數(shù)增長(zhǎng)聲壓和聲強(qiáng)7在聲學(xué)中引用分貝來(lái)表示聲壓或聲強(qiáng)的變化程度。人的聽(tīng)覺(jué)神經(jīng)的88動(dòng)態(tài)范圍9聲音的動(dòng)態(tài)范圍指聲音的最大聲壓級(jí)和最小聲壓級(jí)之間的差值。每種聲源的動(dòng)態(tài)范圍依據(jù)各自的特性有所不同。如女聲的動(dòng)態(tài)范圍為25~50dB,男聲為30~50dB,交響樂(lè)隊(duì)的動(dòng)態(tài)范圍大于100dB。動(dòng)態(tài)范圍不僅用來(lái)表示一個(gè)聲源產(chǎn)生的最大聲壓級(jí)與最小聲壓級(jí)之間的差值,錄音設(shè)備或聲音載體用動(dòng)態(tài)范圍表示能夠處理信號(hào)的電平范圍。如磁帶的動(dòng)態(tài)范圍為50dB~60dB,CD光盤96dB,動(dòng)態(tài)范圍9聲音的動(dòng)態(tài)范圍指聲音的最大聲壓級(jí)和最小聲壓級(jí)之間頻譜10物體在一定位置的附近作來(lái)回往復(fù)的運(yùn)動(dòng),稱為簡(jiǎn)諧振動(dòng)。簡(jiǎn)諧振動(dòng)會(huì)產(chǎn)生一個(gè)特定音調(diào)的純音,聽(tīng)起來(lái)感覺(jué)單薄。樂(lè)器很少產(chǎn)生單一頻率的純音,而是復(fù)音。復(fù)音可以分解為許多不同振幅和不同頻率的簡(jiǎn)諧振動(dòng)疊加。簡(jiǎn)諧振動(dòng)的振幅按頻率排列的圖形稱為頻譜。頻譜可一目了然地看出復(fù)雜振動(dòng)的頻率結(jié)構(gòu)。頻譜10物體在一定位置的附近作來(lái)回往復(fù)的運(yùn)動(dòng),稱為簡(jiǎn)諧振動(dòng)11鋼琴(基頻為253Hz)的復(fù)音頻譜11鋼琴(基頻為253Hz)的復(fù)音頻譜(2)聲音的心理學(xué)特性12從聲學(xué)心理角度,聲音的三個(gè)要素是音調(diào)、響度和音色。它們與聲波的頻率、聲壓和頻譜結(jié)構(gòu)對(duì)應(yīng)。音調(diào)人對(duì)聲音頻率的感覺(jué)表現(xiàn)為音調(diào)的高低,即音高。音調(diào)與基頻的對(duì)數(shù)(20×lg)成線性關(guān)系,單位為美(mei)?;l越低,給人的感覺(jué)越低沉?;l頻率增加一倍,音樂(lè)上稱提高了一個(gè)八度(2)聲音的心理學(xué)特性12從聲學(xué)心理角度,聲音的三個(gè)要素是頻率與音調(diào)的關(guān)系13頻率與音調(diào)的關(guān)系13響度14響度是人耳對(duì)聲音強(qiáng)弱的感覺(jué)程度響度與聲壓有一定關(guān)系,但聲壓大的感覺(jué)不一定響。響度還與頻率有關(guān)。等響度曲線描述響度、聲壓以及聲源頻率之間的關(guān)系。從曲線看出,當(dāng)音量開(kāi)到使聲壓級(jí)為80dB時(shí),就可做到高低頻聲音豐滿響度的單位是宋(Sone)響度14響度是人耳對(duì)聲音強(qiáng)弱的感覺(jué)程度響度還與頻率有關(guān)。等音色15音色又稱音品,是聲音的音調(diào)和響度以外的音質(zhì)差異。聲音的音色取決于該聲音的頻譜結(jié)構(gòu)或是頻譜包絡(luò)(聲波曲線)。高次諧波越豐富,音色就越有明亮感和穿透力。此外,音色還與諸多其他因素有關(guān),如聽(tīng)音條件等。它是一個(gè)主觀量,常用柔和、刺耳、飽滿等詞描述。音色15音色又稱音品,是聲音的音調(diào)和響度以外的音質(zhì)差異。掩蔽效應(yīng)16稱聽(tīng)不到的聲音為被掩蔽聲,而起掩蔽作用的聲音為掩蔽聲。掩蔽效應(yīng)的一般規(guī)律是強(qiáng)音壓低音、低頻率聲音壓高頻率。利用掩蔽效應(yīng)可以用有用信號(hào)去掩蔽無(wú)用的信號(hào),只需要把無(wú)用聲音的聲壓級(jí)降低到掩蔽閾以下即可。在數(shù)字音頻處理中,還可以利用掩蔽效應(yīng)去掉人耳聽(tīng)不到的那部分信號(hào)進(jìn)行聲音數(shù)據(jù)的壓縮。掩蔽效應(yīng)16稱聽(tīng)不到的聲音為被掩蔽聲,而起掩蔽作用的聲音為掩空間感17一個(gè)聲源發(fā)出的聲音同時(shí)向各個(gè)方向散開(kāi),直接和經(jīng)反射到達(dá)的兩個(gè)聲音存在時(shí)間差。當(dāng)時(shí)間差超過(guò)一定數(shù)量時(shí),聽(tīng)者會(huì)聽(tīng)到先后到達(dá)的兩個(gè)聲音,從而產(chǎn)生回音。經(jīng)多次反射,造成余聲。回聲與余音的感覺(jué)可使聽(tīng)者感受出房間大小、高低及內(nèi)表面結(jié)構(gòu)上的差異,這便是空間感??臻g感17一個(gè)聲源發(fā)出的聲音同時(shí)向各個(gè)方向散開(kāi),直接和經(jīng)反2.音頻信號(hào)的質(zhì)量指標(biāo)18(1)頻帶寬度音頻信號(hào)所包含的諧波分量越豐富,音色越好。用聲音信號(hào)所包含的諧波分量的頻率范圍來(lái)衡量聲音的質(zhì)量,即帶寬。不同質(zhì)量的聲音的頻帶對(duì)比示意圖

2.音頻信號(hào)的質(zhì)量指標(biāo)18(1)頻帶寬度不同質(zhì)量的聲音(2)動(dòng)態(tài)范圍19動(dòng)態(tài)范圍越大,說(shuō)明音頻信號(hào)強(qiáng)度的相對(duì)變化范圍越大,音響效果越好。動(dòng)態(tài)范圍一般用dB為單位來(lái)計(jì)量。FM廣播的動(dòng)態(tài)范圍約60dB,AM廣播的動(dòng)態(tài)范圍約40dB。CD—DA的動(dòng)態(tài)范圍約100dB,數(shù)字電話約50dB。(2)動(dòng)態(tài)范圍19動(dòng)態(tài)范圍越大,說(shuō)明音頻信號(hào)強(qiáng)度的相對(duì)變化(2)信噪比20信噪比SNR(SignalNoiseRatio)是有用信號(hào)與噪聲之比的簡(jiǎn)稱,即有用信號(hào)的平均功率與噪聲的平均功率之比信噪比大,在一定程度上能夠掩蔽噪聲,從而獲得較好的聲音效果。錄制時(shí)應(yīng)盡可能減小環(huán)境噪音。輸出時(shí)應(yīng)使音量適當(dāng)大,以減少環(huán)境噪音對(duì)聽(tīng)音的影響。(2)信噪比20信噪比SNR(SignalNoiseR2.2數(shù)字音頻211.聲音的數(shù)字化數(shù)字化就是將連續(xù)信號(hào)變成離散信號(hào)。對(duì)音頻信號(hào),首先在時(shí)間上離散,取有限個(gè)時(shí)間點(diǎn),稱為采樣。然后在幅度上離散,取有限個(gè)幅度值,稱為量化。再將得到的數(shù)據(jù)表示成計(jì)算機(jī)容易識(shí)別的格式,稱為編碼。2.2數(shù)字音頻211.聲音的數(shù)字化(1)PCM編碼22PCM是一種把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的最基本的編碼方法,它主要包括采樣、量化和編碼3個(gè)過(guò)程。采樣是每隔一定的時(shí)間測(cè)量一次聲音信號(hào)的幅值。如果采樣的時(shí)間間隔相等,稱為均勻采樣;量化是將采樣得到的數(shù)值限定在幾個(gè)有限的數(shù)值中;編碼(coding)是將量化后的信號(hào)轉(zhuǎn)換成一個(gè)二進(jìn)制碼。比如,量化得到的數(shù)據(jù)中只會(huì)出現(xiàn)兩個(gè)數(shù)值51和80,則只用一位二進(jìn)制的數(shù)表示即可,用0表示51,用1表示80。若量化級(jí)別為256(有256級(jí)量化數(shù)據(jù)),則可用8位二進(jìn)制數(shù)表示,這種編碼方法稱為自然編碼。(1)PCM編碼22PCM是一種把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)模擬聲音信號(hào)的采樣和量化過(guò)程示意23模擬聲音信號(hào)的采樣和量化過(guò)程示意23PCM編碼原理24編碼的過(guò)程首先用一組脈沖采樣時(shí)鐘信號(hào)與輸入的模擬音頻信號(hào)相乘,相乘的結(jié)果就是離散時(shí)間信號(hào),然后對(duì)采樣后的信號(hào)幅值進(jìn)行量化。量化過(guò)程由量化器來(lái)完成。對(duì)經(jīng)量化器A/D(模/數(shù))變換后的信號(hào)再進(jìn)行編碼,即把量化的信號(hào)電平轉(zhuǎn)換成二進(jìn)制碼組,就得到了離散的二進(jìn)制數(shù)據(jù)序列x(n),計(jì)算機(jī)對(duì)量化后的二進(jìn)制數(shù)據(jù)可以用文件的形式存儲(chǔ)、編輯和處理,并可還原成原始的模擬信號(hào)播放。還原的過(guò)程稱為解碼,它是A/D變換的逆過(guò)程,即D/A(數(shù)/模)變換PCM編碼原理24編碼的過(guò)程首先用一組脈沖采樣時(shí)鐘信號(hào)與輸PCM編碼示意圖25PCM編碼示意圖PCM編碼示意圖25PCM編碼示意圖(2)均勻量化和分均勻量化26量化時(shí),如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱為均勻量化。均勻量化采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱為線性量化.缺點(diǎn):增加樣本位數(shù).(2)均勻量化和分均勻量化26量化時(shí),如果采用相等的量化間非均勻量化27非線性量化的思想是大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔,這樣就可以在滿足精度要求的情況下用較少的位數(shù)來(lái)表示。聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。非均勻量化27非線性量化的思想是大的輸入信號(hào)采用大的量化間隔(3)律壓擴(kuò)

28μ律(μ-Law)壓擴(kuò)主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系

(3)律壓擴(kuò)28μ律(μ-Law)壓擴(kuò)主要用在北美(4)A律(A-Law)29A律(A-Law)壓擴(kuò)主要用在歐洲和中國(guó)大陸等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系

(4)A律(A-Law)29A律(A-Law)壓擴(kuò)主要用在30對(duì)于采樣頻率為8kHz,樣本精度為13位、14位或者16位的輸入信號(hào),使用μ律壓擴(kuò)編碼或者使用A律壓擴(kuò)編碼,經(jīng)過(guò)PCM編碼器之后每個(gè)樣本需8位二進(jìn)制存儲(chǔ),輸出的數(shù)據(jù)率為64kb/s。這個(gè)數(shù)據(jù)就是CCITT推薦的G.711標(biāo)準(zhǔn):話音頻率脈沖編碼調(diào)制30對(duì)于采樣頻率為8kHz,樣本精度為13位、14位或者162.數(shù)字音頻的技術(shù)指標(biāo)31(1)采樣頻率采樣頻率是指一秒鐘采樣的次數(shù)。采樣頻率越高,得到波形越接近于原始波形,音質(zhì)就越好。根據(jù)奈奎斯特(HarryNyquist)采樣理論:如果采樣頻率高于輸入信號(hào)最高頻率的兩倍,重放時(shí)就能從采樣信號(hào)序列無(wú)失真地重構(gòu)原始信號(hào)。例如,電話話音的信號(hào)頻率約為3.4kHz,若采樣頻率選為8kHz,就能無(wú)失真地重放原始聲音。2.數(shù)字音頻的技術(shù)指標(biāo)31(1)采樣頻率32采樣的3個(gè)常用頻率分別為11.025kHz——AM廣播22.05kHz——FM廣播44.1kHz——CD高保真音質(zhì)聲音現(xiàn)在聲卡的采樣頻率一般為48kHz甚至96kHz。32采樣的3個(gè)常用頻率分別為(2)采樣精度

33采樣精度用每個(gè)聲音樣本的位數(shù)表示,也叫樣本精度或量化位數(shù)。它反映聲音波幅度的精度。例如,每個(gè)聲音樣本用16位表示,則量化樣本值在0~65535的整數(shù)范圍內(nèi),它的精度是輸入信號(hào)的1/65536

采樣精度決定了模擬信號(hào)數(shù)字化以后的動(dòng)態(tài)范圍。若以8位量化,則其波形的幅值可分為28=256等份,等效的動(dòng)態(tài)范圍為20×lg(256)=48dB。若以16位采樣,則可分為216=65536等份,等效動(dòng)態(tài)范圍為20×lg(65536)=96dB。采樣精度影響到聲音的質(zhì)量位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲(chǔ)空間也越多;位數(shù)越少,聲音的質(zhì)量越低,需要的存儲(chǔ)空間越少。(2)采樣精度33采樣精度用每個(gè)聲音樣本的位數(shù)表示,也叫樣(3)聲道數(shù)34單聲道(mono)信號(hào)一次產(chǎn)生一組聲波數(shù)據(jù)。如果一次產(chǎn)生兩組聲波數(shù)據(jù),則稱其為雙聲道或立體聲(stereo)。雙聲道在硬件中占兩條線路,一條是左聲道,一條是右聲道。立體聲不僅音質(zhì)、音色好,而且能產(chǎn)生逼真的空間感。但立體聲數(shù)字化后所占空間比單聲道多一倍。除采樣頻率、采樣精度、聲道數(shù)影響聲音質(zhì)量外,聲音錄制時(shí)環(huán)境噪聲、聲卡內(nèi)部噪聲以及采樣數(shù)據(jù)丟失等都會(huì)造成聲音質(zhì)量的下降。實(shí)際收聽(tīng)時(shí),音響(功率放大器、揚(yáng)聲器等)的質(zhì)量對(duì)音質(zhì)的表現(xiàn)也起很大作用(3)聲道數(shù)34單聲道(mono)信號(hào)一次產(chǎn)生一組聲波數(shù)據(jù)(4)音頻數(shù)據(jù)傳輸率35音頻信號(hào)數(shù)字化后,產(chǎn)生大量數(shù)據(jù)播放聲音時(shí)需要傳輸數(shù)據(jù)的速度影響聲音的播放質(zhì)量。數(shù)據(jù)傳輸率用每秒鐘傳輸?shù)臄?shù)據(jù)位數(shù)表示,記為bps(bitpersecond)。未經(jīng)壓縮的數(shù)字音頻數(shù)據(jù)傳輸率為數(shù)據(jù)傳輸率(bit/s)=采樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)(4)音頻數(shù)據(jù)傳輸率35音頻信號(hào)數(shù)字化后,產(chǎn)生大量數(shù)據(jù)聲音質(zhì)量和數(shù)字化指標(biāo)

36質(zhì)量采樣頻率(kHz)樣本精度(bit)單道聲/立體聲數(shù)據(jù)率(kB/s)(未壓縮)頻率范圍電話*88單道聲8200~3400HzAM11.0258單道聲11.050~7000HzFM22.05016立體聲88.220~15000HzCD44.116立體聲176.420~20000HzDAT4816立體聲192.020~20000Hz聲音質(zhì)量和數(shù)字化指標(biāo)36質(zhì)量采樣頻率樣本精度單道聲/數(shù)據(jù)率(5)編碼算法與音頻數(shù)據(jù)壓縮比

37未壓縮的音頻數(shù)據(jù)量非常大,因此在編碼的時(shí)候常常要采用壓縮的方式。實(shí)際上,編碼的作用一是記錄數(shù)字?jǐn)?shù)據(jù),二是采用一定的算法來(lái)壓縮數(shù)據(jù)以減少存儲(chǔ)空間和提高傳輸效率。壓縮編碼的基本指標(biāo)之一就是壓縮比,一般為數(shù)據(jù)壓縮前后的數(shù)據(jù)量之比(5)編碼算法與音頻數(shù)據(jù)壓縮比37未壓縮的音頻數(shù)據(jù)量非常大38采用不同的數(shù)字化指標(biāo)實(shí)際上也是進(jìn)行了不同比例的數(shù)據(jù)壓縮。如果PCM編碼采用4bit量化對(duì)CD音質(zhì)信號(hào)壓縮,其壓縮比為4:1。這種情況下,用來(lái)記錄幅值的比特位越少,編碼后數(shù)據(jù)量就越小,壓縮比越大。但壓縮比越大,丟掉的信息就會(huì)越多,信號(hào)還原后失真就越大。(對(duì)有損壓縮)壓縮算法包括有損壓縮和無(wú)損壓縮;有損壓縮解壓后數(shù)據(jù)不能完全復(fù)原,要丟失一部分信息。無(wú)損壓縮不丟失任何信息,能較好地復(fù)原原始信號(hào)38采用不同的數(shù)字化指標(biāo)實(shí)際上也是進(jìn)行了不同比例的數(shù)據(jù)壓縮。3.數(shù)字音頻文件格式

39數(shù)字聲音文件格式是數(shù)字音頻在磁盤文件中的存放形式,相同的數(shù)據(jù)可以有不同的文件格式.(1)WAVE文件格式

WAVE文件是一種通用的音頻數(shù)據(jù)文件,文件擴(kuò)展名為“.WAV”,Windows系統(tǒng)和一般的音頻卡都支持這種格式文件的生成、編輯和播放。WAVE文件由三部分組成:文件頭(標(biāo)明是WAVE文件、文件結(jié)構(gòu)和數(shù)據(jù)的總字節(jié)數(shù))、數(shù)字化參數(shù)(如采樣率、聲道數(shù)、編碼算法等),最后是實(shí)際波形數(shù)據(jù)。CD激光唱盤中包含的就是WAVE格式的波形數(shù)據(jù),只是擴(kuò)展名沒(méi)寫成“.WAV”。一般說(shuō)來(lái),聲音質(zhì)量與其WAVE格式的文件大小成正比。WAVE文件的特點(diǎn)是易于生成和編輯,但在保證一定音質(zhì)的前提下壓縮比不夠,不適合在網(wǎng)絡(luò)上播放

3.數(shù)字音頻文件格式39數(shù)字聲音文件格式是數(shù)字音頻在磁盤文(2)MP3文件40MP3文件是采用MP3算法壓縮生成的數(shù)字音頻數(shù)據(jù)文件,以“.MP3”為文件后綴。MP3利用MPEG(MotionPictureExpertGroup,運(yùn)動(dòng)圖像專家組)制定的MPEG-1Audiolayer3的壓縮標(biāo)準(zhǔn),將音頻信息用10:1甚至12:1的壓縮率。MPEG—1壓縮主要用于VCD數(shù)據(jù)的壓縮,也用來(lái)壓縮不包含圖像的純音頻數(shù)據(jù),音頻壓縮算法包括MPEGAudioLayer1、MPEGAudioLayer2等,而MPEGAudioLayer3有很高的壓縮比。雖然MP3是一種利用了人類心理聲學(xué)特性的有損壓縮,人耳基本不能分辨出失真,音質(zhì)幾乎達(dá)到了CD音質(zhì)標(biāo)準(zhǔn)。按照這種算法,10張CD—DA的內(nèi)容可以壓縮到l張CD—ROM中,而且視聽(tīng)效果相當(dāng)好。

(2)MP3文件40MP3文件是采用MP3算法壓縮生成的數(shù)(3)RA文件

41RealAudio是Realnetworks推出的一種音樂(lè)壓縮格式,它的壓縮比可達(dá)到96:1,因此在網(wǎng)上比較流行。經(jīng)過(guò)壓縮的音樂(lè)文件可以在通過(guò)速率為14.4kb/s的MODEM上網(wǎng)的計(jì)算機(jī)中流暢回放。其最大特點(diǎn)是可以采用流媒體的方式實(shí)現(xiàn)網(wǎng)上實(shí)時(shí)播放,即邊下載邊播放。

(3)RA文件41RealAudio是Realnet電子合成音樂(lè)

42在多媒體系統(tǒng)中,除了用數(shù)字音頻的方式以外,還可以用合成的方式產(chǎn)生音樂(lè).音樂(lè)合成的方式根據(jù)一定的協(xié)議標(biāo)準(zhǔn),使用音樂(lè)符號(hào)來(lái)記錄和解釋樂(lè)譜,并組合成相應(yīng)的音樂(lè)信號(hào),這就是MIDI(MusicalInstrumentDigitalInterface樂(lè)器數(shù)字接口)。

電子合成音樂(lè)42在多媒體系統(tǒng)中,除了用數(shù)字音頻的方式以外,1.電子合成音樂(lè)的有關(guān)概念

43MIDI將數(shù)字式電子樂(lè)器的彈奏過(guò)程以命令符號(hào)的形式記錄下來(lái),如按了哪一個(gè)鍵、力度多大、時(shí)間多長(zhǎng)等。當(dāng)需要播放這首樂(lè)曲時(shí),根據(jù)記錄的樂(lè)譜指令,通過(guò)音樂(lè)合成器生成音樂(lè)聲波,經(jīng)放大后由揚(yáng)聲器播出。

1.電子合成音樂(lè)的有關(guān)概念43MIDI將數(shù)字式電子樂(lè)器的彈44(1)MIDI電子樂(lè)器它是能產(chǎn)生特定聲音的合成器,如電子鍵盤、吉他、薩克斯管等;它們相互間的數(shù)據(jù)傳送符合MIDI的通信約定。(2)MIDI消息(message)或指令MIDI軟件通信協(xié)議,實(shí)際上是用數(shù)字指令描述的音樂(lè)樂(lè)譜,其中包含音符、強(qiáng)度、定時(shí)及樂(lè)器的指派等。(3)MIDI接口(interface)MIDI硬件通信協(xié)議,可使電子樂(lè)器互連或與計(jì)算機(jī)硬件端口相連,可發(fā)送和接收MIDI消息。(4)MIDI通道(channel)MIDI標(biāo)準(zhǔn)提供了16個(gè)通道,每種通道對(duì)應(yīng)一種邏輯的合成器,即對(duì)應(yīng)一種樂(lè)器的合成。(5)音序器(sequencer)它指可用來(lái)記錄、編輯和播放MIDI文件的計(jì)算機(jī)程序。44(1)MIDI電子樂(lè)器電腦合成音樂(lè)的制作原理

45電腦合成音樂(lè)需要使用MIDI語(yǔ)言。MIDI語(yǔ)言利用字節(jié)傳送來(lái)告知相應(yīng)的設(shè)備做什么。MIDI字節(jié)通知樂(lè)器、聲卡和其他MIDI設(shè)備什么時(shí)候開(kāi)始和什么時(shí)候結(jié)束演奏音符

.MIDI自身并不產(chǎn)生和傳送聲音,只是傳送產(chǎn)生聲音的控制符號(hào).使用MIDI語(yǔ)言的設(shè)備(MIDI設(shè)備)可以互聯(lián)。典型設(shè)備是合成器或者M(jìn)IDI控制鍵盤,也可以是外掛式音響效果單元、計(jì)算機(jī)、配備有MIDI接口的吉他等

電腦合成音樂(lè)的制作原理45電腦合成音樂(lè)需要使用MIDI語(yǔ)言(1)MIDI音樂(lè)的產(chǎn)生過(guò)程

46(1)MIDI音樂(lè)的產(chǎn)生過(guò)程46(2)MIDI通道

47當(dāng)MIDI設(shè)備交流信息時(shí),需要遵循一定的事件序列。例如,兩個(gè)MIDI設(shè)備在建立連接之后首先要做的事情就是在使用相同的MIDI通道方面達(dá)成一致。MIDI可以在16個(gè)這樣的通道上進(jìn)行操作,這些通道用數(shù)字分別標(biāo)記為0~15。只要兩個(gè)MIDI設(shè)備進(jìn)行交流,就必須使用相同的通道。對(duì)電腦合成音樂(lè),每個(gè)邏輯通道可指定一種樂(lè)器,音樂(lè)鍵盤可設(shè)置在這16個(gè)通道之中的任何一個(gè),而MIDI聲源或者聲音模塊可被設(shè)置在指定的MIDI通道上接收

(2)MIDI通道47當(dāng)MIDI設(shè)備交流信息時(shí),需要遵循(3)MIDI接口和計(jì)算機(jī)的連接

48MIDI接口由三個(gè)端口組成:輸入端口(In)、輸出端口(0ut)和直達(dá)端口(Thru)

直達(dá)端口對(duì)MIDI數(shù)據(jù)只是進(jìn)行簡(jiǎn)單傳輸,來(lái)自直達(dá)端口的數(shù)據(jù)僅僅是來(lái)自輸入端口數(shù)據(jù)的拷貝,在離開(kāi)直達(dá)端口前數(shù)據(jù)不會(huì)發(fā)生任何的改變

(3)MIDI接口和計(jì)算機(jī)的連接48MIDI接口由三個(gè)端4.MIDI音樂(lè)合成器

49MIDI指令送到合成器,由合成器(synthesizer)產(chǎn)生相應(yīng)的聲音。同樣的樂(lè)譜如選擇不同的樂(lè)器播放,會(huì)聽(tīng)到不同的音色

MIDI制造商協(xié)會(huì)(MIDIManufacturersAssociation)制定了通用MIDI規(guī)格(GeneralMIDIMode),簡(jiǎn)稱GM規(guī)格。通用MIDI標(biāo)準(zhǔn)同時(shí)定義了GM音色庫(kù)(一個(gè)音色庫(kù),也被稱為音色映射,支持128種樂(lè)器聲音)和GM打擊音色庫(kù)(只包含打擊樂(lè)器發(fā)出的聲音),另外還定義了其他一些與音樂(lè)相關(guān)的性能,如每個(gè)GM設(shè)備應(yīng)支持的聲音數(shù)量和MIDI消息種類。

4.MIDI音樂(lè)合成器49MIDI指令送到合成器,由合成器不同類別MIDI設(shè)備的音色代碼區(qū)間

50程序號(hào)樂(lè)器族程序號(hào)樂(lè)器族1~8鋼琴65~72簧管樂(lè)器9~16半音打擊樂(lè)器73~80笛17~24風(fēng)琴81~88合成主音25~32吉他89~96合成衰減33~40貝司97~104合成效果41~48琴弦105~112民間樂(lè)器49~56合唱113~120打擊樂(lè)器57~64銅管樂(lè)器121~128聲音效果不同類別MIDI設(shè)備的音色代碼區(qū)間50程序號(hào)樂(lè)器族程序號(hào)樂(lè)51MIDI合成的產(chǎn)生方式有兩種:FM(frequencymodulation)合成和波表(Wavetable)合成。FM頻率調(diào)制合成是通過(guò)硬件(稱為發(fā)生器)產(chǎn)生正弦信號(hào),再經(jīng)處理合成音樂(lè)。合成的方式是將波形組合在一起。這種方式在理論上有無(wú)限多組波形,即可以模擬任何聲音,而且可以任意修改音色。由此模擬的樂(lè)器較高或較低頻率的信號(hào)失真度很大,音色真實(shí)度很差

51MIDI合成的產(chǎn)生方式有兩種:FM(frequency52波表的原理是在ROM中以數(shù)字格式存儲(chǔ)各種實(shí)際樂(lè)器的聲音采樣,聲音采樣以聲波的形式被組織到能夠?qū)ζ溥M(jìn)行單獨(dú)處理的庫(kù)中或者表內(nèi),需要合成某種樂(lè)器的聲音時(shí),調(diào)用相應(yīng)的實(shí)際聲音采樣合成該樂(lè)器的樂(lè)音。ROM存儲(chǔ)器的容量越大,合成的效果越好

52波表的原理是在ROM中以數(shù)字格式存儲(chǔ)各種實(shí)際樂(lè)器的聲音采3.MIDI文件

53用樂(lè)譜指令代替聲音數(shù)據(jù)

有效記錄和重現(xiàn)各種樂(lè)器聲音

MIDI聲音僅適于重現(xiàn)打擊樂(lè)或一些電子樂(lè)器的聲音

占用存儲(chǔ)空間極小

例如一個(gè)8位、22.05kHz的波形音頻文件持續(xù)2s就需超過(guò)40KB的容量,而一個(gè)MIDI文件播放2分鐘所需的空間不超過(guò)8KB。

適合樂(lè)曲創(chuàng)作和遠(yuǎn)距離傳輸3.MIDI文件53用樂(lè)譜指令代替聲音數(shù)據(jù)數(shù)字音頻處理

54數(shù)字音頻處理54多媒體數(shù)據(jù)的編碼技術(shù)

551.數(shù)據(jù)壓縮的基本原理

數(shù)據(jù)壓縮的對(duì)象是數(shù)據(jù)。數(shù)據(jù)是信息的載體,用來(lái)記錄和傳送信息。真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。大的數(shù)據(jù)量并不代表含有大的信息量

.多媒體數(shù)據(jù)的編碼技術(shù)551.數(shù)據(jù)壓縮的基本原理(1)信息和熵56香農(nóng)(C.E.Shannon)信息論應(yīng)用概率來(lái)描述不確定性。事件出現(xiàn)的概率小,不確定性越多,信息量就大,反之則少。在數(shù)學(xué)上,所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。所謂信息是指從N個(gè)相等可能事件中選出一個(gè)事件,所需要的信息度量或含量,也就是在辨識(shí)N個(gè)事件中特定的一個(gè)事件過(guò)程中所需要提問(wèn)“是”或“否”的最少次數(shù)。如從64個(gè)數(shù)中選定某一個(gè)數(shù),提問(wèn):“是否大于32?”,則不論回答是與否,都消去了半數(shù)的可能事件,如此下去,只要問(wèn)6次這類問(wèn)題,就可以從64個(gè)數(shù)中選定一個(gè)數(shù)。我們可以用二進(jìn)制的6個(gè)位來(lái)記錄這一過(guò)程,就可以得到這條信息。

(1)信息和熵56香農(nóng)(C.E.Shannon)信息論應(yīng)57575858香儂理論的要點(diǎn)是

59信源中含有自然冗余度,這些冗余度既來(lái)自于信源本身的相關(guān)性,又來(lái)自于信源概率分布的不均勻性,只要找到去除相關(guān)性或改變概率分布不均勻性的手段和方法,也就找到了信息熵編碼的方法。但信源所含有的平均信息量(熵)是進(jìn)行無(wú)失真編碼的理論的極限,只要不低于此極限,就能找到某種適宜的編碼方法,去逼近信息熵,實(shí)現(xiàn)數(shù)據(jù)壓縮。

香儂理論的要點(diǎn)是59信源中含有自然冗余度,這些冗余度既來(lái)自(2)信息冗余60多媒體數(shù)據(jù)中大的數(shù)據(jù)量并不完全等于它們所攜帶的信息量。在信息論中,稱為冗余。冗余是指信息存在的各種性質(zhì)的多余度.減少數(shù)據(jù)冗余可以節(jié)省存儲(chǔ)空間,有效利用網(wǎng)絡(luò)帶寬。(2)信息冗余60多媒體數(shù)據(jù)中大的數(shù)據(jù)量并不完全等于它們所數(shù)據(jù)冗余的類型61(1)空間冗余(2)時(shí)間冗余(3)信息熵冗余(4)視覺(jué)冗余(5)聽(tīng)覺(jué)冗余(6)知識(shí)冗余數(shù)據(jù)冗余的類型61(1)空間冗余(3)壓縮算法的分類62(1)從信息量有無(wú)損失劃分,有可逆編碼和不可逆編碼1)可逆編碼也叫無(wú)失真編碼、冗余度壓縮、熵編碼等。其原理是減少數(shù)據(jù)中的冗余度,而不損失任何信息。解壓時(shí)可以完全恢復(fù)出原來(lái)的數(shù)據(jù),亦稱無(wú)損壓縮。典型的無(wú)損壓縮有Huffman編碼、算術(shù)編碼和行程編碼等??赡婢幋a由于不會(huì)產(chǎn)生失真,因此在多媒體技術(shù)中常用于文本、數(shù)據(jù)的壓縮,它能保證完全地恢復(fù)原始數(shù)據(jù)。但這種方法的壓縮比較低,一般在2:1~5:1之間。(3)壓縮算法的分類62(1)從信息量有無(wú)損失劃分,有可逆632)不可逆編碼是有失真壓縮,信息論中叫熵壓縮。由于壓縮了熵,會(huì)減少信息而不能再恢復(fù)。因此這種壓縮又稱有損壓縮。在語(yǔ)音和圖像中,由于存在視覺(jué)冗余和聽(tīng)覺(jué)冗余,減少這種信息并不影響人們的聽(tīng)覺(jué)效果和視覺(jué)效果,所以經(jīng)常采用這種方法,有損壓縮常用于數(shù)字化存儲(chǔ)的模擬數(shù)據(jù),并且主要應(yīng)用于圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓縮。如果用混合編碼的JPEG標(biāo)準(zhǔn),對(duì)自然景物的彩色圖像,壓縮比可達(dá)到幾十倍甚至上百倍。632)不可逆編碼是有失真壓縮,信息論中叫熵壓縮。由于壓縮了64(2)根據(jù)壓縮原理劃分有預(yù)測(cè)編碼、變換編碼、矢量編碼、子帶編碼、熵編碼等。

1)預(yù)測(cè)編碼對(duì)于語(yǔ)音,就是通過(guò)預(yù)測(cè)去除語(yǔ)音信號(hào)時(shí)間上的相關(guān)性。而對(duì)于圖像,幀內(nèi)預(yù)測(cè)去除了空間上的冗余,幀間預(yù)測(cè)則可以去除時(shí)間上冗余。目前大多數(shù)語(yǔ)音、圖像編碼中都采用了預(yù)測(cè)技術(shù)。例如語(yǔ)音中的LPC(linearPredictiveCoding,線性預(yù)測(cè))、CELP(碼激勵(lì)線性預(yù)測(cè))、圖像中的ADPCM(自適應(yīng)差分脈沖編碼調(diào)制)等。64(2)根據(jù)壓縮原理劃分有預(yù)測(cè)編碼、變換編碼、矢量編碼、子652)變換編碼變換編碼首先把要壓縮的數(shù)據(jù)變換到某個(gè)變換域中,然后再進(jìn)行編碼。變換域中表現(xiàn)為能量集中在某些區(qū)域,就可以利用這一特點(diǎn)在不同區(qū)域間有效地分配量化比特?cái)?shù),或者去掉這些能量很小的區(qū)域,從而達(dá)到數(shù)據(jù)壓縮的目的。例如聲音中的頻譜分析實(shí)際上是對(duì)語(yǔ)音波形進(jìn)行了快速傅里葉變換(FFT),將時(shí)域信號(hào)變到了頻域中,可以清楚地看到能量集中在哪些頻率范圍內(nèi)。652)變換編碼663)矢量量化矢量量化是利用相鄰數(shù)據(jù)間的相關(guān)性,將數(shù)據(jù)序列分組進(jìn)行量化的一種壓縮方法。和預(yù)測(cè)編碼一樣,矢量量化本質(zhì)也是利用數(shù)據(jù)序列的統(tǒng)計(jì)相關(guān)性進(jìn)行壓縮的。4)子帶編碼子帶編碼首先讓原始數(shù)據(jù)分別通過(guò)若干個(gè)具有不同通頻帶的濾波器,將信號(hào)分成多個(gè)子帶信號(hào)輸出,然后分別對(duì)各個(gè)濾波器的輸出進(jìn)行編碼。當(dāng)濾波器選取得合適時(shí),它們的輸出將各自具有不同的分布特性,對(duì)各頻段進(jìn)行不同的量化處理,可以有效地進(jìn)行數(shù)據(jù)壓縮。663)矢量量化675)熵編碼根據(jù)信息墑的原理,用短碼表示出現(xiàn)概率大的數(shù)據(jù),用長(zhǎng)碼表示出現(xiàn)概率小的數(shù)據(jù)。這是一種無(wú)損數(shù)據(jù)壓縮技術(shù),在語(yǔ)音和圖像編碼中常常和其它有損壓縮編碼方法結(jié)合使用。675)熵編碼2.基本壓縮編碼方法68(1)霍夫曼編碼霍夫曼(Huffman)編碼在1952年為文本文件而建立。霍夫曼編碼的碼長(zhǎng)是變化的,對(duì)于出現(xiàn)頻率高的信息,編碼的長(zhǎng)度較短;而對(duì)于出現(xiàn)頻率低的信息,編碼長(zhǎng)度較長(zhǎng)。這樣,處理全部信息的總碼長(zhǎng)一定小于實(shí)際信息的符號(hào)長(zhǎng)度。(1)將信號(hào)源的符號(hào)按照出現(xiàn)概率遞減的順序排列。(2)將兩個(gè)最小出現(xiàn)概率進(jìn)行合并相加,得到的結(jié)果作為新符號(hào)的出現(xiàn)概率。(3)重復(fù)進(jìn)行步驟1和2,直到概率相加的結(jié)果等于1為止。(4)在合并運(yùn)算時(shí),概率大的符號(hào)用編碼1表示,概率小的符號(hào)用編碼0表示。(5)記錄下概率為1處到當(dāng)前信號(hào)源符號(hào)之間的0、1序列,從而得到每個(gè)符號(hào)的編碼2.基本壓縮編碼方法68(1)霍夫曼編碼69例2.12

設(shè)信號(hào)源為X={、a、e、I、m、t、c、h、r}。對(duì)應(yīng)的概率為p={O.22、0.22、0.14、O.07、0.07、0.07、0.07、0.07、0.07},試給出該信源的霍夫曼編碼方案。若傳送一個(gè)串字符串“Iamateacher”,共14個(gè)字符。若用ASCII傳送,每個(gè)字符8位,共需112位。該字符串中有9個(gè)不同的符號(hào),至少需要4位二進(jìn)制才能表示,這樣傳送該字符串也要56位。若用剛計(jì)算的Huffman編碼,只需要42位。

69例2.12設(shè)信號(hào)源為X={、a、e、I、m、t霍夫曼編碼過(guò)程70霍夫曼編碼過(guò)程70(2)行程編碼原理

71由字符(或信號(hào)采樣值)構(gòu)成的數(shù)據(jù)流中相同的字符(或字符串)會(huì)連續(xù)重復(fù)出現(xiàn),重復(fù)出現(xiàn)的字符長(zhǎng)度稱為游程長(zhǎng)度RL(RunLength)。如果給出了形成串的字符,串的長(zhǎng)度及串的位置,就能復(fù)出原來(lái)的數(shù)據(jù)流。行程編碼RLC(RunLengthCoding)就是用二進(jìn)制碼字給出上述信息的一類方法。行程編碼又稱“運(yùn)行長(zhǎng)度編碼”或“游程編碼”

(2)行程編碼原理71由字符(或信號(hào)采樣值)構(gòu)成的數(shù)據(jù)流中72例2.13

設(shè)有數(shù)據(jù)流“AAABBBBCCCCCDAAAAAA”,試計(jì)算該數(shù)據(jù)的行程編碼。解:A重復(fù)3次,B重復(fù)4次,C重復(fù)5次,D不重復(fù),A重復(fù)6次,RLC數(shù)據(jù)流為:“SA3SB4SC5DSA6”,其中S為指示符??偣舱加?3個(gè)字節(jié),而源數(shù)據(jù)占用19個(gè)字節(jié)。有時(shí)行程編碼不用指示符,重復(fù)與否相同對(duì)待,則相應(yīng)的RLC為“A3B4C5D1A6”占用10個(gè)字節(jié)。■

72例2.13設(shè)有數(shù)據(jù)流“AAABBBBCCCCCDAAA3.數(shù)字音頻壓縮標(biāo)準(zhǔn)

731.電話質(zhì)量的語(yǔ)音壓縮標(biāo)準(zhǔn)

電視會(huì)議的語(yǔ)音編碼、為提高線路利用率的多媒體多路復(fù)用裝置、數(shù)字錄音電活的數(shù)字記錄部件以及高質(zhì)量的語(yǔ)音合成器;數(shù)字移動(dòng)通信、無(wú)繩電話ITU國(guó)際電信聯(lián)盟InternationalTelecommunicationUnion標(biāo)準(zhǔn)編號(hào)要點(diǎn)G.711采用PCM編碼,采樣頻率8kHz,采樣精度8bit,數(shù)據(jù)率64kb/s,非線性量化G.721基于ADPCM編碼,采樣頻率8kHz,數(shù)值差分用4位量化,數(shù)據(jù)率32kb/sG.723ADPCM編碼,數(shù)據(jù)率24k/sG.728LD-CELP編碼技術(shù),數(shù)據(jù)率16k/s,音質(zhì)與G.721相當(dāng)3.數(shù)字音頻壓縮標(biāo)準(zhǔn)731.電話質(zhì)量的語(yǔ)音壓縮標(biāo)準(zhǔn)標(biāo)準(zhǔn)編(2)調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)74調(diào)幅廣播質(zhì)量音頻信號(hào)的頻率范圍是50Hz~7kHz,又稱“7kHz音頻信號(hào)”,當(dāng)使用16kHz的采樣頻率和14bit的量化位數(shù)時(shí),信號(hào)速率為224kb/s。1988年ITU制定了G.722標(biāo)準(zhǔn),它可把信號(hào)速率壓縮成64kb/s。G.722標(biāo)準(zhǔn)基于子帶ADPCM技術(shù)(SB—ADPCM),將現(xiàn)有的帶寬分成兩個(gè)獨(dú)立的子帶信道,使輸入信號(hào)進(jìn)入濾波器組分成高子帶信號(hào)和低子帶信號(hào),然后分別進(jìn)行ADPCM編碼,最后進(jìn)入混合器形成輸出碼流。這種壓縮方法能夠在每秒8kB的存儲(chǔ)量下給出相當(dāng)好的音樂(lè)信號(hào),也很適合于需要存儲(chǔ)大量高質(zhì)量音頻信號(hào)的多媒體系統(tǒng)使用

(2)調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)74調(diào)幅廣播質(zhì)量音頻信號(hào)的頻(3)高保真立體聲音頻壓縮標(biāo)準(zhǔn)

75高保真立體聲音頻信號(hào)的頻率范圍50Hz~20kHz,在44.1kHz采樣頻率下用16bit量化,信號(hào)速率為每聲道1410kb/s。目前國(guó)際上比較成熟的高保真立體聲音頻壓縮標(biāo)準(zhǔn)為MPEG音頻。MPEGAudio是一個(gè)子帶編碼系統(tǒng),聲音數(shù)據(jù)壓縮算法的根據(jù)是心理聲學(xué)模型。心理聲學(xué)模型中一個(gè)最基本的概念是聽(tīng)覺(jué)系統(tǒng)中存在一個(gè)聽(tīng)覺(jué)閾值電平,低于這個(gè)電平的聲音信號(hào)就聽(tīng)不到。聽(tīng)覺(jué)閾值的大小隨聲音頻率的改變而改變,各個(gè)人的聽(tīng)覺(jué)閾值也不同。大多數(shù)人的聽(tīng)覺(jué)系統(tǒng)對(duì)2kHz~5kHz之間的聲音最敏感。一個(gè)人是否能聽(tīng)到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽(tīng)覺(jué)閾值。(3)高保真立體聲音頻壓縮標(biāo)準(zhǔn)75高保真立體聲音頻信號(hào)的頻76MPEG聲音(ISO/IEC11172-3)壓縮算法是世界上第一個(gè)高保真聲音數(shù)據(jù)壓縮國(guó)際標(biāo)準(zhǔn),并且得到了極其廣泛的應(yīng)用。MPEG聲音標(biāo)準(zhǔn)是MPEG標(biāo)準(zhǔn)的一部分,但它也完全可以獨(dú)立應(yīng)用。MPEG聲音標(biāo)準(zhǔn)提供三個(gè)獨(dú)立的壓縮層次:層1(Layer1)、層2(Layer2)和層3(Layer3),用戶對(duì)層次的選擇可在復(fù)雜性和聲音質(zhì)量之間進(jìn)行權(quán)衡。

76MPEG聲音(ISO/IEC11172-3)壓縮算法是

調(diào)音臺(tái)本章要點(diǎn)調(diào)音臺(tái)的分類與作用調(diào)音臺(tái)的組成與性能指標(biāo)調(diào)音臺(tái)的使用與操作要點(diǎn)調(diào)音臺(tái)的調(diào)音技巧調(diào)音臺(tái)本章要點(diǎn)調(diào)音臺(tái)的分類與作用調(diào)音臺(tái)的分類與作用調(diào)音臺(tái)的分類1.按輸入路數(shù)分4路、6路、8路、12路、16路、24路、32路、40路、48路、56路等。在歌舞廳及專業(yè)演出系統(tǒng)中常用8~24路。2.按主輸出路數(shù)分單聲道、雙聲道(立體聲)、三聲道、四聲道、多聲道等。專業(yè)演出系統(tǒng)中常用雙聲道調(diào)音臺(tái)。此外,輸出路數(shù)有時(shí)還需考慮編組輸出、輔助輸出路數(shù)。調(diào)音臺(tái)的分類1.按輸入路數(shù)分3.按用途分

擴(kuò)聲調(diào)音臺(tái)、錄音調(diào)音臺(tái)、播音調(diào)音臺(tái)、迪斯科專用調(diào)音臺(tái)(又稱DJ混音臺(tái))。在會(huì)堂、舞臺(tái)演出及歌舞廳中常用擴(kuò)聲調(diào)音臺(tái)。4.按信號(hào)處理方式分模擬式調(diào)音臺(tái)和數(shù)字式調(diào)音臺(tái)。數(shù)字式調(diào)音臺(tái)含有模數(shù)轉(zhuǎn)換(A/D)、數(shù)模轉(zhuǎn)換(D/A)和數(shù)字信號(hào)處理(DSP)等功能單元,目前在歌舞廳、會(huì)堂中應(yīng)用還不多,現(xiàn)在廣泛使用的是模擬式調(diào)音臺(tái)。3.按用途分調(diào)音臺(tái)的基本功能1.信號(hào)放大2.信號(hào)處理3.信號(hào)混合4.信號(hào)分配

除了上述四大功能之外,調(diào)音臺(tái)還有顯示、監(jiān)聽(tīng)、編組、遙控、對(duì)講等功能。調(diào)音臺(tái)的基本功能

調(diào)音臺(tái)主要由三部分組成,即輸入通道部分、主控輸出部分、外接效果器接口及內(nèi)部混響延時(shí)器部分。調(diào)音臺(tái)的組成與性能指標(biāo)調(diào)音臺(tái)主要由三部分組成,即輸入通道部分、主控輸出部分、外接7.2.1.調(diào)音臺(tái)的組成1.輸入通道部分

(1)主干通道

(2)輔助通道7.2.1.調(diào)音臺(tái)的組成2.主控輸出部分2.主控輸出部分3.外接效果器接口及內(nèi)部混響延時(shí)器部分

外接效果器接口電路由放大器、主電平控制(SENDLEVEL)、效果輸出接口(SEND)、效果返送輸入插口(RETURN-L和RETURN-R)、環(huán)繞聲控制(BLEVEL)及聲像控制(PAN)等電路組成。該電路的輸入信號(hào)取自效果總線(EFFBUS),經(jīng)外接效果器后的輸出分配到左右總線(LEFTBUS和RIGHTBUS)上。外接效果自動(dòng)將內(nèi)部的混響延時(shí)器(DIGITALDELAY)切斷。3.外接效果器接口及內(nèi)部混響延時(shí)器部分外接效4.LED、VU表和PPM表在調(diào)音臺(tái)的輸入部分和輸出部分中還有顯示單元,用以指示信號(hào)音量的大小,調(diào)音臺(tái)的顯示部件有LED(發(fā)光二極管)、VU表(音量單位表)和PPM表(峰值音量表)三種,其中LED燈一般用于指示輸入單元的信號(hào)大小,VU表和PPM表一般用于輸出部分,用來(lái)指示輸出的信號(hào)電平。例如,接在輸入單元的均衡器EQ之后的峰值(PEAK)LED或過(guò)載削波(CHIP)LED指示燈,用來(lái)指示該輸入通道信號(hào)的峰值。當(dāng)它閃亮太頻繁或總是亮著時(shí),表明輸入信號(hào)過(guò)強(qiáng),這時(shí)需調(diào)小調(diào)音臺(tái)輸入放大器增益,或調(diào)節(jié)節(jié)目源的輸出電平使輸入信號(hào)減小,否則就會(huì)產(chǎn)生過(guò)載削波失真。反之,如果該LED燈長(zhǎng)滅不亮,表明激勵(lì)不足,應(yīng)將輸入信號(hào)幅度調(diào)大,否則會(huì)導(dǎo)致信噪比下降。4.LED、VU表和PPM表在調(diào)音臺(tái)的輸入部分和輸出部分中調(diào)音臺(tái)的主要性能指標(biāo)1.增益2.等效輸入噪聲電平3.頻率響應(yīng)4.非線性諧波失真5.動(dòng)態(tài)余量6.串音調(diào)音臺(tái)的主要性能指標(biāo)

調(diào)音臺(tái)系統(tǒng)的基本接法調(diào)音臺(tái)系統(tǒng)的接法與使用調(diào)音臺(tái)系統(tǒng)的基本接法調(diào)音臺(tái)系統(tǒng)的接法與使用調(diào)音臺(tái)與周邊設(shè)備的連接1.接在輔助輸出與輔助輸入之間2.接在輔助輸出與某一輸入通道之間3.接在調(diào)音臺(tái)輸入通道中4.接在調(diào)音臺(tái)輸出通道中調(diào)音臺(tái)與周邊設(shè)備的連接調(diào)音臺(tái)與周邊設(shè)備的連接位置調(diào)音臺(tái)與周邊設(shè)備的連接位置調(diào)音臺(tái)的操作要點(diǎn)

1.調(diào)音臺(tái)與周邊設(shè)備的連接調(diào)音臺(tái)的操作要點(diǎn)調(diào)音臺(tái)與外圍設(shè)備連接圖調(diào)音臺(tái)與外圍設(shè)備連接圖2.調(diào)音臺(tái)的操作要點(diǎn)(1)開(kāi)機(jī)前

先按前面所述接好系統(tǒng)。并且將調(diào)音臺(tái)的分推子、主推子置最小位置,臺(tái)上均衡器(EQ)和聲像電位器(PAN)置中央位置,輸入通道增益(GAIN)、輔助電位器(如效果AUX2、返聽(tīng)AUX1電位器)置最小位置,總之所有控制鈕都回到起始狀態(tài)。2.調(diào)音臺(tái)的操作要點(diǎn)(2)開(kāi)機(jī)后①先將音源設(shè)備(如CD)的音量電位器開(kāi)到最大不失真狀態(tài)。②調(diào)節(jié)輸入增益(GAIN)旋鈕到其旁邊的PEAK(峰值)指示燈到剛亮未亮處;調(diào)節(jié)調(diào)音臺(tái)該輸入通道的分推子(FADER)于70%處。③調(diào)節(jié)調(diào)音臺(tái)輸出主推子,使主輸出的VU表指針大致在0VU附近擺動(dòng)(不允許長(zhǎng)時(shí)間指針超過(guò)+3VU),此時(shí)主推子位置也宜在50~75%的位置內(nèi)。如果不在此范圍,可相應(yīng)調(diào)整輸入增益或音源輸出電平。(2)開(kāi)機(jī)后④如果還覺(jué)得音箱響度不夠,可開(kāi)大功放音量旋鈕到所需擴(kuò)聲聲壓級(jí)。注意此時(shí)功放不得進(jìn)入削波狀態(tài),否則應(yīng)換用大功率功放。⑤以上調(diào)控順序是由輸入逐步向輸出調(diào)整。如果不是音源而只是用話筒,由于話筒輸入信號(hào)很小,初學(xué)者調(diào)輸入通道時(shí)聽(tīng)不到聲音而常常感到茫然不知所措,此時(shí)可先將輸出主推子置70%處,再調(diào)輸入增益旋鈕和分推子(分推子也宜在50~70%范圍內(nèi)),再按上述②~④步驟調(diào)整。這種調(diào)音方法對(duì)初學(xué)者比較適合。⑥按照節(jié)目要求,分別調(diào)節(jié)調(diào)音臺(tái)上的EQ、PAN及效果等。④如果還覺(jué)得音箱響度不夠,可開(kāi)大功放音量旋鈕到所需擴(kuò)聲聲壓級(jí)(3)關(guān)機(jī)

將主推子和分推子均推回最小位置。然后先關(guān)功放電源,后關(guān)調(diào)音臺(tái)及其他設(shè)備電源。(3)關(guān)機(jī)3.調(diào)音臺(tái)上的音色和效果的調(diào)控

調(diào)音臺(tái)輸入通道的均衡器(EQ)是用來(lái)對(duì)輸入信號(hào)的音色進(jìn)行補(bǔ)正。由于是單路控制,所以調(diào)音臺(tái)可以對(duì)每一路進(jìn)行均衡調(diào)控而不會(huì)相互干擾。通常調(diào)音臺(tái)的輸入均衡器分為三段,即高頻(HIGH)、中頻(MID)、低頻(LOW),其中中頻又往往為中心頻率可調(diào)(半?yún)⒘渴剑?。三段的中心頻率或轉(zhuǎn)折頻率一般為:高音(10kHz)、中音(350Hz~5kHz可調(diào))、低頻(100Hz)。3.調(diào)音臺(tái)上的音色和效果的調(diào)控

調(diào)音臺(tái)還常用四頻段EQ方式,通常四段為:高頻(HF)為6~16kHz,它主要影響音色的表現(xiàn)力、解析力;中高頻(MIDHF)為600Hz~6kHz,主要影響音色的明亮度、清晰度;中低頻(MIDLF)為200~600Hz,主要影響音色的力度感和結(jié)實(shí)度;低頻(LP)為20~200Hz,主要影響音色的渾厚感和豐滿度。調(diào)音臺(tái)還常用四頻段EQ方式,通常四段為:高頻(HF)為四段均衡器的頻率特性

人耳的聽(tīng)覺(jué)感受過(guò)度衰減適中過(guò)度提升高音(6~20kHz)單高、平淡色彩鮮明富于表現(xiàn)力尖噪、嘶啞刺耳中高音(600Hz~6kHz)暗淡、朦朧明亮、清晰呆板中低音(200~600Hz)空虛無(wú)力圓潤(rùn)有力生硬低音(20~200Hz)蒼白單薄豐滿、混厚深沉渾濁不清四段均衡器的頻率特性人耳的聽(tīng)覺(jué)感受過(guò)度衰減適中過(guò)度面板各旋鈕和插孔的作用MX-200型調(diào)音臺(tái)分析MX-200調(diào)音臺(tái)的調(diào)控?cái)?shù)字信號(hào)效果處理器的應(yīng)用圖示均衡器的調(diào)整調(diào)音臺(tái)操作實(shí)例面板各旋鈕和插孔的作用調(diào)音臺(tái)操作實(shí)例YAMAHAMX-200型調(diào)音臺(tái)系統(tǒng)現(xiàn)場(chǎng)演出應(yīng)用接線圖YAMAHAMX-200型調(diào)音臺(tái)系統(tǒng)現(xiàn)場(chǎng)演出應(yīng)用接線圖①A/B:輸人選擇開(kāi)關(guān)按鈕。②PAD:衰減開(kāi)關(guān)按鈕。③GAIN:增益旋鈕。④PEAK:峰值電平指示燈。⑤:低切開(kāi)關(guān)按鍵。⑥三段頻率均衡(EQ)旋鈕。⑦輔助(AUX)輸出。⑧PAN:聲像控制旋鈕。⑨ON:通道開(kāi)關(guān)按鍵。⑩PFL:推子前監(jiān)聽(tīng)。11

FADER:音量推子。

面板各旋鈕和插孔的作用①A/B:輸人選擇開(kāi)關(guān)按鈕。面板各旋鈕和插孔的作用1、ON:主輸出開(kāi)關(guān)。2、立體聲(ST)左右主推子3、MONOON:?jiǎn)温暤篱_(kāi)關(guān)4、AFL:推子后監(jiān)聽(tīng)5、單聲道(MONO)輸出推子6、輔助輸出監(jiān)聽(tīng)(AFL)按鍵7、輔助輸出推子8、AUXRETURN:輔助返回通道控制鈕9、RECOUT:錄音輸出電平控制鈕10、TAPEIN:磁帶輸入電平控制鈕11、PHONES:耳機(jī)音量控制鈕12、耳機(jī)插座13、METERSELECT:表頭顯示選擇按鍵14、PHANTOM:幻象供電指示燈15、監(jiān)聽(tīng)(PFL)指示燈1、ON:主輸出開(kāi)關(guān)。YAMAHAMX-200型調(diào)音臺(tái)的系統(tǒng)方框圖MX-200型調(diào)音臺(tái)分析YAMAHAMX-200型調(diào)音臺(tái)的系統(tǒng)方框圖MX-2MX-200調(diào)音臺(tái)及周邊設(shè)備的接線圖MX-200調(diào)音臺(tái)的調(diào)控MX-200調(diào)音臺(tái)及周邊設(shè)備的接線圖MX-200調(diào)音臺(tái)數(shù)字信號(hào)效果處理器的應(yīng)用數(shù)字信號(hào)效果處理器的應(yīng)用圖示均衡器的調(diào)整圖示均衡器的調(diào)整調(diào)音臺(tái)的調(diào)音技巧各類樂(lè)器樂(lè)音的拾音、調(diào)音技巧1.小提琴

2.中提琴3.大提琴4.貝司提琴5.長(zhǎng)笛6.單簧管(黑管)7.銅管樂(lè)器8.吉他9.電吉他10.架子鼓

調(diào)音臺(tái)的調(diào)音技巧各類樂(lè)器樂(lè)音的拾音、調(diào)音技巧

小提琴

小提琴的基音由G3至E6,高次諧波可達(dá)20kHz。小提琴500Hz以下的聲能向各方向輻射是均勻的。當(dāng)頻率增高時(shí),輻射方向?qū)⒅饕性诖怪庇诼暟宓姆较?,因而在垂直方向的?5度夾角范圍內(nèi)拾音,可以獲得全頻帶的聲音。除此之外,拾音傳聲器還應(yīng)該對(duì)準(zhǔn)小提琴的f形孔。因此選擇話筒的位置時(shí),一般可將其置于靠近小提琴、并且高于小提琴的位置放置,如圖所示。

對(duì)于小提琴類的弦樂(lè)器拾音,適合使用頻帶寬的電容式傳聲器。當(dāng)對(duì)小提琴作遠(yuǎn)距離拾音時(shí),應(yīng)選用質(zhì)量最佳的電容傳聲器,一般選擇心形或超心形指向特性的傳聲器都可獲得很好的效果。小提琴

中提琴

與小提琴的拾音基本相同,所不同的是,中提琴的基頻在131~1046Hz之間,高次諧波可達(dá)12kHz。中提琴的音高比小提琴低5度。另外,主要共振峰頻率是200Hz、600Hz和1.6kHz。150~300Hz是中提琴的主要基音頻率,如果提升這一頻段,它音色的響亮度就會(huì)增強(qiáng)。3~6kHz是代表中提琴音色表現(xiàn)力度的頻段,即中高頻泛音的頻率,它是代表音色個(gè)性表現(xiàn)力的頻段。如果這個(gè)頻段豐滿,其音色的清晰度、透明度、解析力就會(huì)增強(qiáng)。中提琴

大提琴

大提琴的基頻由C2到C5,即65~520Hz,高次諧波可達(dá)14kHz,全頻帶的輻射方向是10°~15°。根據(jù)大提琴的輻射特征,拾音時(shí)傳聲器應(yīng)放在輻射角內(nèi),如圖7-22所示。由于大提琴是支撐在地面演奏的,傳聲器最好用落地式架子,使它的高度與大提琴f形孔的高度相同。大提琴小提琴拾音示意圖大提琴拾音示意圖小提琴拾音示意圖大提琴拾音示意圖銅管樂(lè)器

銅管樂(lè)器(小號(hào)、拉管、圓號(hào))與木管樂(lè)器相比,前者的聲輻射圖形要簡(jiǎn)單得多。因?yàn)樗鼈兌际敲荛]系統(tǒng),所以聲能全部由管口輻射出來(lái)。

在小號(hào)的頻譜中,泛音十分豐富,一直延伸到15kHz。它的基音由E3到D6,對(duì)應(yīng)的頻率范圍是165Hz到1175Hz。500Hz以下,小號(hào)的聲能輻射是全向的。15kHz以上輻射圖形變得十分尖銳。從5kHz再向上,全頻段的3分貝帶寬的輻射角度僅僅是30°(演奏者的視線方向是0°)。銅管樂(lè)器單簧管、薩克斯拾音示意圖單簧管、薩克斯拾音示意圖小號(hào)、長(zhǎng)號(hào)、圓號(hào)拾音示意圖小號(hào)、長(zhǎng)號(hào)、圓號(hào)拾音示意圖架子鼓

鼓樂(lè)器的拾音方法很多,但拾音方案應(yīng)當(dāng)根據(jù)鼓樂(lè)器在音樂(lè)作品中的作用,以盡可能簡(jiǎn)單的傳聲器設(shè)置為原則來(lái)確定。通常用兩只全指向形或闊心形傳聲器,彼此間隔一定的距離,設(shè)置在鼓的上方來(lái)拾取整套鼓的聲音。為了避免傳聲器對(duì)拾取到太多的釵聲音,可以將傳聲器架設(shè)置得稍高一些,以取得整套鼓中各樂(lè)器間的平衡。由于低音大鼓的振動(dòng)面產(chǎn)生的是前后方向的振動(dòng),而其他樂(lè)器基本上是上下振動(dòng),所以一般要為低音大鼓單獨(dú)設(shè)置一只傳聲器來(lái)拾音,以免大鼓在弱擊時(shí)被釵聲淹沒(méi)。架子鼓架子鼓拾音示意圖架子鼓拾音示意圖

語(yǔ)音演唱調(diào)音技巧

1.對(duì)演講人的聲音調(diào)整(1)語(yǔ)言聲發(fā)聲頻率(基音)100Hz~lkHz,泛音成分可達(dá)8kHz,不過(guò)占的比例5%以下。(2)拾音話筒:多采用電容話筒,或使用領(lǐng)夾式駐極體無(wú)線話筒。(3)拾音位置:距講話人0.5m,領(lǐng)夾式話筒夾在胸前衣領(lǐng)處。(4)混響時(shí)間:小于0.5秒。(5)調(diào)節(jié):演講聲應(yīng)清澈、明亮,降低渾濁的聲音,在調(diào)音臺(tái)上按下相應(yīng)聲道的低切鍵,提升中高頻3dB~6dB,同時(shí),對(duì)4kHz~8kHz成分提升4dB左右,減弱8kHz以上成分,以免出現(xiàn)齒音。語(yǔ)音演唱調(diào)音技巧2.對(duì)演唱聲的調(diào)整(1)演唱聲的基音頻率范圍:

童音:高音260Hz~880Hz

低音196Hz~700Hz

女聲:高音220Hz~1.1kHz

低音200Hz~700Hz

男聲:高音160Hz~523Hz

低音80Hz~358Hz

人們唱歌利用肌肉拉動(dòng)聲帶,可以發(fā)出許多泛音成分,其頻率高達(dá)8kHz~10kHz。利用鼻腔,還可以對(duì)某些頻率成分(基音和泛音成分)產(chǎn)生共鳴使發(fā)聲更加宏亮。2.對(duì)演唱聲的調(diào)整(2)拾音話筒:美聲多用電容式話筒,通俗演唱常用動(dòng)圈式演唱話筒。(3)拾音位置:電動(dòng)式話筒采用手持,近距離拾音。電容式話筒采用0.5m遠(yuǎn)拾音。(4)混響時(shí)間:女聲兒童演唱,混響時(shí)間在1.3秒~1.8秒(美聲唱1.3秒,通俗唱1.8秒左右)。男聲演唱,混響時(shí)間在1.1秒~1.6秒(美聲唱1.1秒,通俗唱1.6秒左右)。(2)拾音話筒:美聲多用電容式話筒,通俗演唱常用動(dòng)圈式演(5)調(diào)節(jié):用調(diào)音臺(tái)上每路的參量均衡進(jìn)行音質(zhì)補(bǔ)償,歌聲首先要求明亮,明亮的歌聲人們最為喜愛(ài),最能扣人心弦,感人肺腑。為此,將中高頻提衰量調(diào)節(jié)放在+6dB上,中高頻中心頻率調(diào)節(jié)采用掃頻法,從低往高掃,到達(dá)頂端后,再?gòu)母咄蛼?。?jīng)過(guò)兩次掃描,便可發(fā)現(xiàn),當(dāng)掃到某一頻點(diǎn)時(shí),突然覺(jué)得聲音明亮度增大,便固定在該頻點(diǎn)上,適當(dāng)調(diào)節(jié)提升量,使明亮度得到補(bǔ)償。對(duì)于不同的人,發(fā)聲頻譜各不相同,補(bǔ)償?shù)念l點(diǎn)各異。用同樣方法,也能在中低頻段找到歌聲的力度補(bǔ)償頻點(diǎn)。對(duì)于高頻段的頻率成分,應(yīng)根據(jù)聽(tīng)音的感受,作適當(dāng)調(diào)整,齒音、氣音過(guò)多,有刺耳感,應(yīng)衰減2dB~3dB;若清晰度不夠,應(yīng)提升2dB~3dB。對(duì)于低頻段成分,例如:100Hz附近,男聲應(yīng)衰減3dB~6dB,女聲則應(yīng)提升3dB~6dB,保證聲音渾厚而不混濁,豐滿而不單薄。(5)調(diào)節(jié):用調(diào)音臺(tái)上每路的參量均衡進(jìn)行音質(zhì)補(bǔ)償,歌聲首3.對(duì)節(jié)目主持人的聲音調(diào)整

節(jié)目主持人多為女性,一般聲音都比較明亮,調(diào)音時(shí),應(yīng)注意以下幾點(diǎn):(1)發(fā)聲的基音頻率范圍:200Hz~1.1kHz。(2)拾音話筒:采用動(dòng)圈式近講話筒。(3)拾音位置:手持話筒,近距離拾音。(4)混響時(shí)間:不加混響,利用廳堂自然混響。(5)調(diào)節(jié):在調(diào)音臺(tái)上作均衡補(bǔ)償,提升2kHz~4kHz成分約3dB~6dB,使聲音透亮清晰,音域?qū)捄?,親切感人,降低6kHz左右的成分,減弱可能出現(xiàn)的齒音。同時(shí),要保持適度的音量,使后面的觀眾能聽(tīng)清。3.對(duì)節(jié)目主持人的聲音調(diào)整話筒動(dòng)圈式電容式(供電)指向靜音話筒話筒動(dòng)圈式指向指向音頻處理技術(shù)詳解課件音頻處理技術(shù)詳解課件音頻處理技術(shù)詳解課件音頻處理技術(shù)詳解課件音頻接口簡(jiǎn)單來(lái)說(shuō),音頻接口是連接麥克風(fēng)和其他聲源與計(jì)算機(jī)的設(shè)備,其在模擬和數(shù)字信號(hào)之間起到了橋梁連接的作用。音頻接口通常與前置麥克風(fēng)、線路輸入和其他一系列的輸入設(shè)備配合使用音頻接口簡(jiǎn)單來(lái)說(shuō),音頻接口是連接麥克風(fēng)和其他聲源與計(jì)算機(jī)的設(shè)音頻處理技術(shù)詳解課件接口接口大三芯大三芯設(shè)備話放功放耳機(jī)分配器設(shè)備話放西安交通大學(xué)計(jì)算機(jī)教學(xué)實(shí)驗(yàn)中心134音頻處理技術(shù)1音頻處理技術(shù)簡(jiǎn)述135音頻是多媒體技術(shù)中媒體的一種,由于音頻信號(hào)是一種連續(xù)變化的模擬信號(hào),而計(jì)算機(jī)只能處理和記錄二進(jìn)制的數(shù)字信號(hào),因此,音頻信號(hào)必須經(jīng)過(guò)一定的變化和處理,變成二進(jìn)制數(shù)據(jù)后才能送到計(jì)算機(jī)進(jìn)行編輯和存儲(chǔ)。簡(jiǎn)述2音頻是多媒體技術(shù)中媒體的一種,由于音頻信號(hào)是一種連續(xù)變聲音的基本特性136音頻信號(hào)所攜帶的信息大體上可分為語(yǔ)音、音樂(lè)和音響三類。語(yǔ)音是指具有語(yǔ)言內(nèi)涵和人類約定的特殊媒體;音樂(lè)是規(guī)范的符號(hào)化了的聲音;而音響指其他自然聲音,如動(dòng)物的叫聲、機(jī)器的轟鳴聲、風(fēng)雨雷電聲等聲音的基本特性3音頻信號(hào)所攜帶的信息大體上可分為語(yǔ)音、音樂(lè)音頻信號(hào)的特征137機(jī)械振動(dòng)引起周圍彈性媒質(zhì)發(fā)生波動(dòng),產(chǎn)生聲波。產(chǎn)生聲波的物體為聲源(如人的聲帶、樂(lè)器等),聲波傳到人耳,經(jīng)過(guò)人類聽(tīng)覺(jué)系統(tǒng)的感知就是聲音。聲波在時(shí)間和幅度上都是連續(xù)的,稱為模擬音頻信號(hào)。聲波可以分解成一系列正弦波的線性疊加:音頻信號(hào)的特征4機(jī)械振動(dòng)引起周圍彈性媒質(zhì)發(fā)生波動(dòng),產(chǎn)生聲波聲音的物理特性138頻率/周期/帶寬單位時(shí)間內(nèi)聲源振動(dòng)的次數(shù)稱為聲源的頻率f,單位赫茲(Hz)頻帶寬度:帶寬,它描述組成復(fù)合信號(hào)的頻率范圍聲音的物理特性5頻率/周期/帶寬聲壓和聲強(qiáng)139聲波造成空氣中的氣壓發(fā)生變化,相當(dāng)于在無(wú)聲波氣壓上疊加一個(gè)變化的壓強(qiáng),疊加上的壓強(qiáng)稱為聲壓,記作P。單位有帕斯卡(Pa)和微巴(μbar)。人耳剛能聽(tīng)到聲音時(shí)的聲壓稱為可聽(tīng)閾聲波有能量。單位時(shí)間內(nèi)通過(guò)垂直于聲波傳播方向的單位面積內(nèi)的聲波能量為聲強(qiáng),記作I,單位為瓦/米2(W/m2)。聲強(qiáng)與聲壓最大值的平方成正比關(guān)系。聲壓和聲強(qiáng)6聲波造成空氣中的氣壓發(fā)生變化,相當(dāng)于在無(wú)聲波氣壓140在聲學(xué)中引用分貝來(lái)表示聲壓或聲強(qiáng)的變化程度。人的聽(tīng)覺(jué)神經(jīng)的刺激程度不與刺激量大小成正比,而是按刺激量以10為底的對(duì)數(shù)增長(zhǎng)聲壓和聲強(qiáng)7在聲學(xué)中引用分貝來(lái)表示聲壓或聲強(qiáng)的變化程度。人的聽(tīng)覺(jué)神經(jīng)的1418動(dòng)態(tài)范圍142聲音的動(dòng)態(tài)范圍指聲音的最大聲壓級(jí)和最小聲壓級(jí)之間的差值。每種聲源的動(dòng)態(tài)范圍依據(jù)各自的特性有所不同。如女聲的動(dòng)態(tài)范圍為25~50dB,男聲為30~50dB,交響樂(lè)隊(duì)的動(dòng)態(tài)范圍大于100dB。動(dòng)態(tài)范圍不僅用來(lái)表示一個(gè)聲源產(chǎn)生的最大聲壓級(jí)與最小聲壓級(jí)之間的差值,錄音設(shè)備或聲音載體用動(dòng)態(tài)范圍表示能夠處理信號(hào)的電平范圍。如磁帶的動(dòng)態(tài)范圍為50dB~60dB,CD光盤96dB,動(dòng)態(tài)范圍9聲音的動(dòng)態(tài)范圍指聲音的最大聲壓級(jí)和最小聲壓級(jí)之間頻譜143物體在一定位置的附近作來(lái)回往復(fù)的運(yùn)動(dòng),稱為簡(jiǎn)諧振動(dòng)。簡(jiǎn)諧振動(dòng)會(huì)產(chǎn)生一個(gè)特定音調(diào)的純音,聽(tīng)起來(lái)感覺(jué)單薄。樂(lè)器很少產(chǎn)生單一頻率的純音,而是復(fù)音。復(fù)音可以分解為許多不同振幅和不同頻率的簡(jiǎn)諧振動(dòng)疊加。簡(jiǎn)諧振動(dòng)的振幅按頻率排列的圖形稱為頻譜。頻譜可一目了然地看出復(fù)雜振動(dòng)的頻率結(jié)構(gòu)。頻譜10物體在一定位置的附近作來(lái)回往復(fù)的運(yùn)動(dòng),稱為簡(jiǎn)諧振動(dòng)144鋼琴(基頻為253Hz)的復(fù)音頻譜11鋼琴(基頻為253Hz)的復(fù)音頻譜(2)聲音的心理學(xué)特性145從聲學(xué)心理角度,聲音的三個(gè)要素是音調(diào)、響度和音色。它們與聲波的頻率、聲壓和頻譜結(jié)構(gòu)對(duì)應(yīng)。音調(diào)人對(duì)聲音頻率的感覺(jué)表現(xiàn)為音調(diào)的高低,即音高。音調(diào)與基頻的對(duì)數(shù)(20×lg)成線性關(guān)系,單位為美(mei)。基頻越低,給人的感覺(jué)越低沉?;l頻率增加一倍,音樂(lè)上稱提高了一個(gè)八度(2)聲音的心理學(xué)特性12從聲學(xué)心理角度,聲音的三個(gè)要素是頻率與音調(diào)的關(guān)系146頻率與音調(diào)的關(guān)系13響度147響度是人耳對(duì)聲音強(qiáng)弱的感覺(jué)程度響度與聲壓有一定關(guān)系,但聲壓大的感覺(jué)不一定響。響度還與頻率有關(guān)。等響度曲線描述響度、聲壓以及聲源頻率之間的關(guān)系。從曲線看出,當(dāng)音量開(kāi)到使聲壓級(jí)為80dB時(shí),就可做到高低頻聲音豐滿響度的單位是宋(Sone)響度14響度是人耳對(duì)聲音強(qiáng)弱的感覺(jué)程度響度還與頻率有關(guān)。等音色148音色又稱音品,是聲音的音調(diào)和響度以外的音質(zhì)差異。聲音的音色取決于該聲音的頻譜結(jié)構(gòu)或是頻譜包絡(luò)(聲波曲線)。高次諧波越豐富,音色就越有明亮感和穿透力。此外,音色還與諸多其他因素有關(guān),如聽(tīng)音條件等。它是一個(gè)主觀量,常用柔和、刺耳、飽滿等詞描述。音色15音色又稱音品,是聲音的音調(diào)和響度以外的音質(zhì)差異。掩蔽效應(yīng)149稱聽(tīng)不到的聲音為被掩蔽聲,而起掩蔽作用的聲音為掩蔽聲。掩蔽效應(yīng)的一般規(guī)律是強(qiáng)音壓低音、低頻率聲音壓高頻率。利用掩蔽效應(yīng)可以用有用信號(hào)去掩蔽無(wú)用的信號(hào),只需要把無(wú)用聲音的聲壓級(jí)降低到掩蔽閾以下即可。在數(shù)字音頻處理中,還可以利用掩蔽效應(yīng)去掉人耳聽(tīng)不到的那部分信號(hào)進(jìn)行聲音數(shù)據(jù)的壓縮。掩蔽效應(yīng)16稱聽(tīng)不到的聲音為被掩蔽聲,而起掩蔽作用的聲音為掩空間感150一個(gè)聲源發(fā)出的聲音同時(shí)向各個(gè)方向散開(kāi),直接和經(jīng)反射到達(dá)的兩個(gè)聲音存在時(shí)間差。當(dāng)時(shí)間差超過(guò)一定數(shù)量時(shí),聽(tīng)者會(huì)聽(tīng)到先后到達(dá)的兩個(gè)聲音,從而產(chǎn)生回音。經(jīng)多次反射,造成余聲?;芈暸c余音的感覺(jué)可使聽(tīng)者感受出房間大小、高低及內(nèi)表面結(jié)構(gòu)上的差異,這便是空間感??臻g感17一個(gè)聲源發(fā)出的聲音同時(shí)向各個(gè)方向散開(kāi),直接和經(jīng)反2.音頻信號(hào)的質(zhì)量指標(biāo)151(1)頻帶寬度音頻信號(hào)所包含的諧波分量越豐富,音色越好。用聲音信號(hào)所包含的諧波分量的頻率范圍來(lái)衡量聲音的質(zhì)量,即帶寬。不同質(zhì)量的聲音的頻帶對(duì)比示意圖

2.音頻信號(hào)的質(zhì)量指標(biāo)18(1)頻帶寬度不同質(zhì)量的聲音(2)動(dòng)態(tài)范圍152動(dòng)態(tài)范圍越大,說(shuō)明音頻信號(hào)強(qiáng)度的相對(duì)變化范圍越大,音響效果越好。動(dòng)態(tài)范圍一般用dB為單位來(lái)計(jì)量。FM廣播的動(dòng)態(tài)范圍約60dB,AM廣播的動(dòng)態(tài)范圍約40dB。CD—DA的動(dòng)態(tài)范圍約100dB,數(shù)字電話約50dB。(2)動(dòng)態(tài)范圍19動(dòng)態(tài)范圍越大,說(shuō)明音頻信號(hào)強(qiáng)度的相對(duì)變化(2)信噪比153信噪比SNR(SignalNoiseRatio)是有用信號(hào)與噪聲之比的簡(jiǎn)稱,即有用信號(hào)的平均功率與噪聲的平均功率之比信噪比大,在一定程度上能夠掩蔽噪聲,從而獲得較好的聲音效果。錄制時(shí)應(yīng)盡可能減小環(huán)境噪音。輸出時(shí)應(yīng)使音量適當(dāng)大,以減少環(huán)境噪音對(duì)聽(tīng)音的影響。(2)信噪比20信噪比SNR(SignalNoiseR2.2數(shù)字音頻1541.聲音的數(shù)字化數(shù)字化就是將連續(xù)信號(hào)變成離散信號(hào)。對(duì)音頻信號(hào),首先在時(shí)間上離散,取有限個(gè)時(shí)間點(diǎn),稱為采樣。然后在幅度上離散,取有限個(gè)幅度值,稱為量化。再將得到的數(shù)據(jù)表示成計(jì)算機(jī)容易識(shí)別的格式,稱為編碼。2.2數(shù)字音頻211.聲音的數(shù)字化(1)PCM編碼155PCM是一種把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的最基本的編碼方法,它主要包括采樣、量化和編碼3個(gè)過(guò)程。采樣是每隔一定的時(shí)間測(cè)量一次聲音信號(hào)的幅值。如果采樣的時(shí)間間隔相等,稱為均勻采樣;量化是將采樣得到的數(shù)值限定在幾個(gè)有限的數(shù)值中;編碼(coding)是將量化后的信號(hào)轉(zhuǎn)換成一個(gè)二進(jìn)制碼。比如,量化得到的數(shù)據(jù)中只會(huì)出現(xiàn)兩個(gè)數(shù)值51和80,則只用一位二進(jìn)制的數(shù)表示即可,用0表示51,用1表示80。若量化級(jí)別為256(有256級(jí)量化數(shù)據(jù)),則可用8位二進(jìn)制數(shù)表示,這種編碼方法稱為自然編碼。(1)PCM編碼22PCM是一種把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)模擬聲音信號(hào)的采樣和量化過(guò)程示意156模擬聲音信號(hào)的采樣和量化過(guò)程示意23PCM編碼原理157編碼的過(guò)程首先用一組脈沖采樣時(shí)鐘信號(hào)與輸入的模擬音頻信號(hào)相乘,相乘的結(jié)果就是離散時(shí)間信號(hào),然后對(duì)采樣后的信號(hào)幅值進(jìn)行量化。量化過(guò)程由量化器來(lái)完成。對(duì)經(jīng)量化器A/D(模/數(shù))變換后的信號(hào)再進(jìn)行編碼,即把量化的信號(hào)電平轉(zhuǎn)換成二進(jìn)制碼組,就得到了離散的二進(jìn)制數(shù)據(jù)序列x(n),計(jì)算機(jī)對(duì)量化后的二進(jìn)制數(shù)據(jù)可以用文件的形式存儲(chǔ)、編輯和處理,并可還原成原始的模擬信號(hào)播放。還原的過(guò)程稱為解碼,它是A/D變換的逆過(guò)程,即D/A(數(shù)/模)變換PCM編碼原理24編碼的過(guò)程首先用一組脈沖采樣時(shí)鐘信號(hào)與輸PCM編碼示意圖158PCM編碼示意圖PCM編碼示意圖25PCM編碼示意圖(2)均勻量化和分均勻量化159量化時(shí),如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱為均勻量化。均勻量化采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱為線性量化.缺點(diǎn):增加樣本位數(shù).(2)均勻量化和分均勻量化26量化時(shí),如果采用相等的量化間非均勻量化160非線性量化的思想是大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔,這樣就可以在滿足精度要求的情況下用較少的位數(shù)來(lái)表示。聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。非均勻量化27非線性量化的思想是大的輸入信號(hào)采用大的量化間隔(3)律壓擴(kuò)

161μ律(μ-Law)壓擴(kuò)主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系

(3)律壓擴(kuò)28μ律(μ-Law)壓擴(kuò)主要用在北美(4)A律(A-Law)162A律(A-Law)壓擴(kuò)主要用在歐洲和中國(guó)大陸等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系

(4)A律(A-Law)29A律(A-Law)壓擴(kuò)主要用在163對(duì)于采樣頻率為8kHz,樣本精度為13位、14位或者16位的輸入信號(hào),使用μ律壓擴(kuò)編碼或者使用A律壓擴(kuò)編碼,經(jīng)過(guò)PCM編碼器之后每個(gè)樣本需8位二進(jìn)制存儲(chǔ),輸出的數(shù)據(jù)率為64kb/s。這個(gè)數(shù)據(jù)就是CCITT推薦的G.711標(biāo)準(zhǔn):話音頻率脈沖編碼調(diào)制30對(duì)于采樣頻率為8kHz,樣本精度為13位、14位或者162.數(shù)字音頻的技術(shù)指標(biāo)164(1)采樣頻率采樣頻率是指一秒鐘采樣的次數(shù)。采樣頻率越高,得到波形越接近于原始波形,音質(zhì)就越好。根據(jù)奈奎斯特(HarryNyquist)采樣理論:如果采樣頻率高于輸入信號(hào)最高頻率的兩倍,重放時(shí)就能從采樣信號(hào)序列無(wú)失真地重構(gòu)原始信號(hào)。例如,電話話音的信號(hào)頻率約為3.4kHz,若采樣頻率選為8kHz,就能無(wú)失真地重放原始聲音。2.數(shù)字音頻的技術(shù)指標(biāo)31(1)采樣頻率165采樣的3個(gè)常用頻率分別為11.025kHz——AM廣播22.05kHz——FM廣播44.1kHz——CD高保真音質(zhì)聲音現(xiàn)在聲卡的采樣頻率一般為48kHz甚至96kHz。32采樣的3個(gè)常用頻率分別為(2)采樣精度

166采樣精度用每個(gè)聲音樣本的位數(shù)表示,也叫樣本精度或量化位數(shù)。它反映聲音波幅度的精度。例如,每個(gè)聲音樣本用16位表示,則量化樣本值在0~65535的整數(shù)范圍內(nèi),它的精度是輸入信號(hào)的1/65536

采樣精度決定了模擬信號(hào)數(shù)字化以后的動(dòng)態(tài)范圍。若以8位量化,則其波形的幅值可分為28=256等份,等效的動(dòng)態(tài)范圍為20×lg(256)=48dB。若以16位采樣,則可分為216=65536等份,等效動(dòng)態(tài)范圍為20×lg(65536)=96dB。采樣精度影響到聲音的質(zhì)量位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲(chǔ)空間也越多;位數(shù)越少,聲音的質(zhì)量越低,需要的存儲(chǔ)空間越少。(2)采樣精度33采樣精度用每個(gè)聲音樣本的位數(shù)表示,也叫樣(3)聲道數(shù)167單聲道(mono)信號(hào)一次產(chǎn)生一組聲波數(shù)據(jù)。如果一次產(chǎn)生兩組聲波數(shù)據(jù),則稱其為雙聲道或立體聲(stereo)。雙聲道在硬件中占兩條線路,一條是左聲道,一條是右聲道。立體聲不僅音質(zhì)、音色好,而

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論