多媒體技術與應用-第4章課件_第1頁
多媒體技術與應用-第4章課件_第2頁
多媒體技術與應用-第4章課件_第3頁
多媒體技術與應用-第4章課件_第4頁
多媒體技術與應用-第4章課件_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1.什么是聲音?聲音的種類

聲音的種類繁多。人聲馬嘶、獸鳴鳥叫、風雨雷電、機器轟鳴、悠揚琴聲等……

因此,聲音根據(jù)內(nèi)容可以分為:天籟之音,語音,樂音等;根據(jù)頻率可分為:高音、低音、重低音、超聲波與次聲波等;根據(jù)特性分為樂聲和噪聲。聲音的實質(zhì)

從信息處理的角度來看,聲音實質(zhì)上是一種信號,稱之為音頻信號。第四部分聲音和音頻信號處理創(chuàng)點教程網(wǎng)2.聲音信號的特點

聲波具有時間和幅度上的連續(xù)性;聲音的傳播具有反射、折射、衍射等形式;(聲速和多普勒效應)振幅A反映了信號的強度;就是聲音的大小。頻率F反映了音調(diào)的高低;也即尖細或是低粗。

5.聲音質(zhì)量的度量聲品質(zhì)可定義為聽覺事件對個人各方面需求的滿足程度,影響聲品質(zhì)的因素包括物理(聲場)、心理聲學(聽覺感知)、心理(聽覺評價)等幾方面。人類的聽覺頻率范圍:20~20KHz。語音質(zhì)量等級:根據(jù)聲音頻帶,聲音質(zhì)量分5個等級,依次為:電話、調(diào)幅廣播(AM)、調(diào)頻廣播(FM)、CD光盤、數(shù)字錄音帶(DAT,DigitalAudioTape)7.人類的聽覺特性1)人耳只能察覺出3dB以上音強變化2)人耳對不同頻段的聲音敏感度不同人耳對1~3KHZ的聲音最為靈敏3)人的聽覺具有掩蔽效應3.聲波的應用聲納,B超。4.聲音的三要素音調(diào):指聲音的基音頻率;(音階的劃分)音色:指聲音的泛音頻率;(音頻帶寬)音強:指聲音的聲音幅度;(音量的計量-分貝dB)。模擬信號的數(shù)字化處理模擬到數(shù)字的轉(zhuǎn)換-A/D轉(zhuǎn)換(AnalogtoDigitalConversion)模擬信號數(shù)字化的步驟:1.采樣在連續(xù)信號中每隔一定時間取一個值;2.量化

把其大小取整為n位二進制數(shù)所能表示的數(shù);例如:n=4,

即有24=16個級別可用于表示一個采樣,量化后只能以0,1,2……15這16個數(shù)之一來表示3.編碼按一定的規(guī)律產(chǎn)生二進制位數(shù)據(jù)。采樣定理采樣頻率要高于被采樣信號最高頻率的兩倍,信號才可能完全復原。話音最高頻率為4000Hz,則需每秒采樣8000次;聲音的最高頻率為20kHz,所以在多媒體計算機中使用的多是44.1kHz的采樣頻率。

量化精度取決于表示一個采樣值的二進制位數(shù)。位數(shù)越多,精度也越高。用16個二進制位(bit)表示聲音,可將聲音分為216=65536級,而若用8位則僅能區(qū)分出28=256級。用16位表示的聲音比用8位的聲音質(zhì)量高得多。模擬信號數(shù)字化的原理——將檢測到的電壓值轉(zhuǎn)換成數(shù)字信息模擬信號的數(shù)字化-4bit音頻數(shù)據(jù)壓縮處理1.音頻壓縮的理論基礎是人的聽覺特性。2.音頻壓縮算法的分類:

1)有損壓縮和無損壓縮 2)時域壓縮,子帶壓縮和變換壓縮 三種語音編碼器: 波形編碼器 音源編碼器(聲碼器) 混合編碼器3.最基本的音頻壓縮處理方法-PCM編碼PCM算法是最簡單、最完善、最常見也是壓縮效率最低的編碼方法。它用一組二進制數(shù)碼來代替連續(xù)信號的抽樣值,具有極強的抗干擾能力。

步驟:僅對輸入信號進行采樣-量化-編碼。兩種常見PCM體制:1)μ律壓擴算法

2)A律壓擴算法MP3壓縮標準 MP3是一種有損數(shù)字音頻壓縮格式,其全稱是MPEG-1AudioLayer3。 MPEG-1音頻壓縮標準是第一個高保真音頻數(shù)據(jù)壓縮標準。 除AC-3之外,其他的音頻壓縮算法只適用于語言(如碼激勵線性預測CELP)或只有中等壓縮質(zhì)量(如自適應差分脈沖編碼調(diào)制ADPCM)。 MPEG-1音頻壓縮標準雖然是MPEG-1標準的一部分,但它完全可獨立應用。

在MPEG-1標準中,按復雜程度劃分了三種音頻壓縮模式即層Ⅰ,層Ⅱ,層Ⅲ。 目前廣泛使用的VCD音頻壓縮方案為層Ⅰ,其典型碼率為每通道192Kbps,共2通道。 層Ⅱ即稱掩蔽模式,采用通用子帶集成編碼與多路復用,典型碼率為每通道128Kbps,廣泛應用于數(shù)字音頻廣播、數(shù)字演播室、CD-I等數(shù)字音頻專業(yè)的制作、交流、存儲和傳送。 層Ⅲ是綜合層Ⅱ和自適應譜感知熵編碼(ASPEC)的優(yōu)點提出的混合壓縮技術,MP3的復雜度相對較高,不利于實時編碼,典型碼率為64Kbps,在低碼率下有高品質(zhì)的音質(zhì)。用于ISDN語音通話。PHILIPS芯片方案

PHILIPS解碼芯片屬于高端產(chǎn)品。其系列芯片SAA7750,SAA7751,PNX0101ET本身僅是解碼芯片,必須搭配控制芯片才能使用。 代表產(chǎn)品:iRiver的IFP-100、300、500系列和MPIO的FD100、FL100、FY200、FG100等。SIGMATEL芯片方案

美國SIGMATEL的STMP34和35系列芯片是目前市場占有率較大的芯片,采用獨立控制方式,成本較低。代表產(chǎn)品:愛國者月光寶盒系列、三星YP-55H,JNCSSF-800等TELECHIPS芯片方案

韓國TELECHIPS的TCC730、TCC731也是性能較好的MP3解碼芯片之一,同樣需要外圍元件的配合,成本比飛利浦較低。代表產(chǎn)品:丹丁328系列、DEC街舞系列,朝華魔音系列。對三款主流芯片來說,音質(zhì)排列順序為:Philips>Sigmatel>Telchips

樂器數(shù)字接口MIDI

樂器數(shù)字接口規(guī)范MIDI(MusicalInstrumentDigitalInterface)于1983年提出。MIDI是一種利用合成器產(chǎn)生的音樂技術。 MIDI由三個部分組成,分別是: 通信協(xié)議CommunicationProtocol; 連接器Connector(硬件接口); 傳播規(guī)范,稱為標準MIDI文件StandardMIDIFiles。4.4聲卡簡介

聲卡的基本功能:將來自話筒、磁帶、光盤的原始聲音信號進行轉(zhuǎn)換,輸出到耳機、揚聲器、擴音機、錄音機等聲響設備,或通過音樂設備數(shù)字接口(MIDI)使樂器發(fā)出美妙的聲音。4.1聲卡的發(fā)展歷史

1984年,英國ADLIBAUDIO公司推出第一款聲卡。 1995年,創(chuàng)新推出AWE32系列,具有硬件波表合成能力,而以往的聲卡僅具備FM合成能力,具有一個32復音的波表引擎,并集成了1MB容量的音色庫,MIDI的表現(xiàn)力獲得大大提升,硬件波表合成能力成為高檔聲卡的象征。 1996年,創(chuàng)新推出AWE64系列,具有64復音的波表合成能力,成為當時MIDI表現(xiàn)力最佳的聲卡,這個系列中的AWE64Gold,是公認最優(yōu)秀的聲卡之一。聲卡主要由以下幾個部分組成:●聲音的合成與處理

是聲卡的核心部分。由數(shù)字聲音處理器、調(diào)頻(FM)音樂合成器及MIDI控制器組成。完成聲波信號的A/D和D/A轉(zhuǎn)換,利用調(diào)頻技術控制聲音的音調(diào)、音色和幅度等?!窕旌闲盘柼幚砥?/p>

其中內(nèi)置數(shù)字/模擬混音器,混音器的聲源由以下幾種信號:MIDI信號、CD音頻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論