多媒體技術(shù)第二章 數(shù)字聲音_第1頁
多媒體技術(shù)第二章 數(shù)字聲音_第2頁
多媒體技術(shù)第二章 數(shù)字聲音_第3頁
多媒體技術(shù)第二章 數(shù)字聲音_第4頁
多媒體技術(shù)第二章 數(shù)字聲音_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第二章數(shù)字聲音2.1數(shù)字聲音基礎2.1.1音頻信號的特征聲音信號由不同的振幅與頻率合成而成,稱為復音。復音包括基頻和諧音,兩者決定聲音的音質(zhì)和音色。規(guī)則音頻分為語音、音樂和音效。聲音三要素:音調(diào)、音強和音色?;l與音調(diào)諧波與音色幅度與音強頻帶與音寬2.1.2聲音信號數(shù)字化模擬信號模擬信號是指幅度隨時間連續(xù)變化的信號。

數(shù)字信號數(shù)子信號是指時間和幅度都是離散的信號,即離散信號,通常是僅含高低電平的“方波”信號。模擬信號的數(shù)字化PCM(pulsecodemodulation脈沖編碼調(diào)制)采樣:將時間連續(xù)信號變?yōu)闀r間不連續(xù)信號。量化:將幅度變?yōu)槟骋蛔钚×康恼麛?shù)倍,即將幅值離散化,量化過程必定產(chǎn)生量化誤差。編碼:按一定規(guī)律產(chǎn)生二進制位流輸出信號。數(shù)字化過程兩個主要參數(shù):采樣頻率:采樣頻率遵從采樣定理

fs

>=2f

或者Ts=<T/2量化精度:取決于表示一個采樣樣本值的二進制位數(shù),位數(shù)越多,精度越高。2.1.2聲音信號數(shù)字化聲音20-20kHz話音300-3000Hz

采樣頻率越高,量化精度越高,聲道越多,則聲音質(zhì)量越好,而數(shù)字化后的數(shù)據(jù)量也越大。每秒聲音所占數(shù)據(jù)量為采樣頻率*量化位數(shù)*聲道數(shù)2.1.3音頻的主要技術(shù)參數(shù)

聲音質(zhì)量與數(shù)據(jù)率質(zhì)量采樣頻率(kHz)量化精度(bit)單聲道/立體聲數(shù)據(jù)率(kB/s)頻率范圍(Hz)電話88單聲道8200~3400AM11.0258單聲道11.050~7000FM22.0516立體聲88.220~15000CD44.1016立體聲176.410~20000DAT4816立體聲192.010~200002.1.3音頻的主要技術(shù)參數(shù)44.100次/秒的采樣頻率值根據(jù)以下的原則確定:

人耳能夠聽見的最高聲音頻率為20kHz,為了避免高于20kHz的高頻信號干擾采樣,在進行采樣之前,需要對輸入的聲音信號進行濾波??紤]到濾波器在20kHz處大約有10%的衰減,因此再將其提高10%成為22kHz。這個值再乘以2就得到44kHz的采樣頻率。但是,為了能夠與電視信號同步,PAL電視的場掃描為50Hz,NTSC電視的場掃描為60Hz,所以取50和60的整數(shù)倍,選用了44,100Hz(或44.1kHz)作為激光唱盤聲音的采樣標準。2.1.3音頻的主要技術(shù)參數(shù)采樣率為1,000Hz、量化等級為10的采樣量化過程2.1.3音頻的主要技術(shù)參數(shù)經(jīng)過D/A轉(zhuǎn)換器得到的信號波形有較大的失真2.1.3音頻的主要技術(shù)參數(shù)采樣率為2000Hz、量化等級為40的采樣量化過程2.1.3音頻的主要技術(shù)參數(shù)采樣率為4000Hz、量化等級為40的采樣量化過程2.1.3音頻的主要技術(shù)參數(shù)采樣頻率、量化位數(shù)設置2.1.3音頻的主要技術(shù)參數(shù)PCM編碼PCM方法可以按量化方式的不同,分為均勻量化PCM、非均勻量化PCM和自適應量化PCM等幾種。如果采用相等的量化間隔對采樣得到的信號做量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化。2.1.4數(shù)字化聲音的壓縮均勻量化2.1.4數(shù)字化聲音的壓縮改進PCM編碼技術(shù)的一個方法是采用非均勻量化,即讓量化級高度隨信號幅度而變化。信號幅度小,則縮小量化級高度,信號幅度大時,則增大量化級高度。這樣就可以在滿足精度要求的情況下用較少的位數(shù)實現(xiàn)編碼。在聲音數(shù)據(jù)還原時,采用相同的規(guī)則。在非均勻量化中,采樣輸入信號幅度和量化輸出數(shù)據(jù)之間定義了兩種對應關(guān)系,一種稱為μ律(μ-Law)壓(縮)擴(展)算法,另一種稱為A律(A-Law)壓(縮)擴(展)算法。這兩種算法主要用于數(shù)字電話通信中。2.1.4數(shù)字化聲音的壓縮μ律的壓縮特性2.1.4數(shù)字化聲音的壓縮音頻壓縮編碼的標準國際電信聯(lián)盟(ITU,原CCITT)先后提出了一系列有關(guān)語音壓縮編碼的建議。1972年制定了G.711,采用的是μ律或A律的PCM編碼技術(shù).數(shù)據(jù)速率為64kb/s。1984年.公布G.721標準.它來用的是ADPCM編碼技術(shù).數(shù)據(jù)速率為32kb/s。以上兩個標準均適用于300Hz--3,400Hz窄帶語音信號.也可用于公用電話網(wǎng)。針對寬帶語音信號(50Hz--7kHz),ITU制定了G.722編碼標準,它的數(shù)據(jù)速率為64kb/s,用此標準編碼,可在ISDN(綜合業(yè)務數(shù)據(jù)網(wǎng))的B通道上傳輸音頻數(shù)據(jù)。2.1.4數(shù)字化聲音的壓縮ISO(國際標準化組織)也制定了一系列的相應的標準其運動圖像專業(yè)組(MPEG)在制定運動圖像編碼標準的同時,制定了高保真立體聲音頻壓縮標準“MPEG音頻”。雖然MPEG聲音標準是MPEG標準的一部分,但它同時也完全可以獨立應用。MPEG聲音壓縮算法是第一個高保真聲音數(shù)據(jù)壓縮的國際標準。MPEG音頻根據(jù)不同的算法分為3個層次。層次1與層次2具有大致相同的算法。MPEG音頻的層次3進一步引入了輔助子帶、非均勻量化和熵編碼等技術(shù),可以進一步提高壓縮率。立體聲信號的編碼也可以在MPEG音頻中作為附加功能實現(xiàn)。MPEG音頻壓縮技術(shù)的傳輸速率為每聲道32kb/s--448kb/s。2.1.4數(shù)字化聲音的壓縮2.1.5數(shù)字音頻的文件格式文件的擴展名說明wav(Waveform)Windows采用的波形聲音文件存儲格式voc(CreativeVoice)聲霸卡存儲的聲音文件存儲格式mid(MIDI)Windows的MIDI文件存儲格式mp2MPEGAudioLayer1,2mp3MPEGAudioLayer3ra(RealAudio)RealNetworks公司的流式聲音文件格式wmaWindowsMediaAudioauSun和NeXT公司的聲音文件存儲格式aiffApple計算機上的聲音文件存儲格式sndSGI圖形工作站上的聲音存儲文件seq,sngMIDI文件存儲格式2.1.5數(shù)字音頻的文件格式MP3是Internet上流行的音樂格式MP3

為MPEGAudioLayer3的縮寫,是由ISO/MPEG語音編碼標(AudioCodingStandard)所制定的一種聲音壓縮技術(shù),壓縮比是CD的1:10到1:12,采樣率為44kHz、比特率為112kbit/s。MP3音樂是以數(shù)字方式儲存的音樂,如果要播放,就必須有相應的數(shù)字解碼播放系統(tǒng),一般通過專門的軟件進行MP3數(shù)字音樂的解碼,再還原成波形聲音信號播放輸出,這種軟件就稱為MP3播放器,如Winamp等。

MP3格式文件在播放時需要專門的工具軟件,Realplayer是一個集強大的功能和小巧玲現(xiàn)于一體的MP3播放器。它能夠?qū)P3文件的播放做全面的控制,支持MMX(多媒體指令集)技術(shù)。它內(nèi)置的圖形化均衡器可以方便地調(diào)節(jié)音色,使之更符合個人喜好。此外,應用較為廣泛的MP3播放軟件還有Winplay3和MusicMatch等2.1.5數(shù)字音頻的文件格式2.1.5數(shù)字音頻的文件格式WAV(WaveAudioFileFormat)

是Windows用來儲存數(shù)碼聲音的格式。它使用三個參數(shù)來表示聲音:采樣位數(shù)、采樣頻率和聲道數(shù)。聲道有單聲道和立體聲之分。MIDI

是MusicalInstrumentDataInterface的簡稱,即樂器數(shù)字化接口。它采用數(shù)字方式對樂器所奏出來的聲音進行記錄(每個音符記錄為一個數(shù)字),然后,播放時再對這些記錄通過FM或波表合成:FM合成是通過多個頻率的聲音混合來模擬樂器的聲音;波表合成是將樂器的聲音樣本存儲在聲卡波形表中,播放時從波形表中取出產(chǎn)生聲音。RA、RAM和RM

都是Real公司成熟的網(wǎng)絡音頻格式,采用了“音頻流”技術(shù),所以非常適合網(wǎng)絡廣播。在制作時可以加入版權(quán)、演唱者、制作者、Mail和歌曲的Title等信息。RA可以稱為互聯(lián)網(wǎng)上多媒體傳播的霸主,適合于網(wǎng)絡上進行實時播放,是目前在線收聽網(wǎng)絡音樂最好的一種格式。WMA

是WindowsMediaAudio的縮寫,相當于只包含音頻的ASF文件。WMA文件在80kbps、44kHz的模式下壓縮比可達1∶18,基本上和VQF(是一種比較先進的技術(shù),通常認為96kbpsVQF與128kbpsMP3質(zhì)量相同)相同。而且壓縮速度比MP3提高一倍。Ogg

全稱是OGGVobis是一種新的音頻壓縮格式,類似于MP3等現(xiàn)有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。OGGVobis有一個很出眾的特點,就是支持多聲道.

波形聲音文件

波形聲音文件,是一種為交換多媒體資源而開發(fā)的資源交換文件格式。它支持各種采樣頻率和量化精度的聲音數(shù)據(jù),并支持聲音數(shù)據(jù)的壓縮。2.1.5數(shù)字音頻的文件格式電腦音樂的出現(xiàn)使人們的音樂思維方式產(chǎn)生了革命性的突破,為音樂的表現(xiàn)表達提供了全新的工具和工作方式。電子音樂與傳統(tǒng)音樂的本質(zhì)區(qū)別在于,它打破了千萬年來傳統(tǒng)音樂用“聲樂語言”和“器樂語言”表達樂思的基本格局,可以創(chuàng)作出聞所未聞的聲音,即所謂的“天籟之音”,并且這種擴展是無窮無盡的。在音樂創(chuàng)作領域,由于MIDI、電子樂器和多媒體計算機的結(jié)合,給人們提供了一種快捷、獨特的制作方式,它更加強調(diào)音色的非常規(guī)化、電子化、空間感和對比等,并且逐漸形成一種嶄新的音樂風格。2.2音樂合成和MIDI技術(shù)2.2.1什么是MIDIMIDI(MusicalInstrumentDigitalInterface電子樂器數(shù)字接口)是用于樂器合成器、樂器和計算機之間交換音樂信息的一種標準協(xié)議。MIDI是將電子樂器鍵盤的演奏信息(包括鍵名、力度、時間長短等)記錄下來,這些信息成為MIDI消息。對應一段音樂的MIDI文件不記錄任何聲音信息,而只是包含一系列產(chǎn)生音樂的MIDI消息。播放時只需從中讀出MIDI消息,通過音樂合成器芯片解釋這些指令并產(chǎn)生音樂。MIDI是由軟件部分和硬件部分組成的系統(tǒng)規(guī)范,這個規(guī)范定義了MIDI設備間數(shù)字傳送時電纜硬件接口和協(xié)議。規(guī)范定制的目的是使各生產(chǎn)樂器廠家之間通過統(tǒng)一的MIDI交換信息及控制信號,從而完成音樂的合成。這樣,任何電子樂器,只要有處理MIDI信息的處理器和適當?shù)挠布涌诙寄茏兂蒑IDI裝置。2.2.1什么是MIDI合成器是利用數(shù)字信號處理器DSP或其他芯片來產(chǎn)生音樂或聲音的電子裝置。利用合成器產(chǎn)生MIDI樂音的主要方法是FM合成法和波表合成法。2.2.2MIDI合成方式FM合成法FM合成法是20世紀80年代初由美國斯坦福大學的JohnChowning發(fā)明的,稱為“數(shù)字式頻率調(diào)制合成法”,簡稱FM合成法。FM合成法生成樂音的基本原理是,用數(shù)字信號來表示不同樂音的波形,然后把它們組合起來,再通過數(shù)模轉(zhuǎn)換器(DAC)生成樂音播放。各種不同樂音的產(chǎn)生是通過組合各種波形參數(shù)、采用各種不同的算法實現(xiàn)的。FM合成器的算法包括確定用什么樣的波形作為數(shù)字載波波形,用什么樣的波形作為調(diào)制波形,用什么樣的波形參數(shù)去組合來產(chǎn)生所希望的樂音。例如,改變數(shù)字載波頻率;可以改變樂音的音調(diào),改變它的幅度,可以改變它的音量。選擇的算法不同,載波器和調(diào)制器的相互作用不同,生成的音色也不同。2.2.2MIDI合成方式波表合成法使用FM合成法來產(chǎn)生各種逼真的樂音是相當困難的,有些樂音幾乎不能產(chǎn)生。為了能真實地再現(xiàn)樂音,目前的聲卡一般采用樂音樣本合成法,即波表合成法。這種方法就是把真實樂器發(fā)出的聲音以數(shù)字的形式記錄下來,播放時改變播放速度,從而改變音調(diào)周期,生成各種音節(jié)的音符。樂音樣本的采集相對比較直觀,音樂家在真實樂器上演奏不同的音符,選擇44.1kHz的采樣頻率、16bit的量化位數(shù),這相當于CD-DA的質(zhì)量,把不同音符的真實聲音記錄下來,這就完成了樂音樣本的采集。2.2.2MIDI合成方式軟、硬波表合成硬波表的音色庫是存放在聲卡的ROM或RAM中軟波表的音色庫以文件的形式存放在硬盤里,需要是再通過CPU進行調(diào)用?!翱上螺d樣本”的合成技術(shù)(DLS)2.2.2MIDI合成方式2.2.3GM--標準MIDI樂器排序表以前各生產(chǎn)商在設計MIDI發(fā)聲工具(如聲卡、音源器、合成器等)時并沒有一個統(tǒng)一的樂器排序標準,基于這種情況,各生產(chǎn)商終于達成了共識,共同編制了一份“標準MIDI樂器排序表”(GeneralMIDIInstrumentMap,GM)。GM共收錄了十六類不同的樂器,每類各選八種音色,共有128種音色。在第十號MIDI通道(MIDIChannel10)收錄了各種鼓和其他打擊樂器。表中最后一類(第十六類)并非樂器聲,而是一些聲效(SoundEffect),如電話鈴聲、小鳥叫聲、海浪聲、直升機聲、槍聲等?,F(xiàn)在大部分的MIDI發(fā)聲工具均以這“標準MIDI樂器排序表”作為樂器排序的標準。2.2.4MIDI系統(tǒng)的組成MIDI系統(tǒng)實際就是一個作曲、配器、電子模擬的演奏系統(tǒng)?;谟嬎銠C的MIDI音樂系統(tǒng)有多種構(gòu)筑方案,但基本上都由以下幾部分組成:多媒體計算機、輸入設備(MIDI鍵盤)、音序器、發(fā)生設備、合成器、聲音處理設備和還聲設備等。這些設備可以是獨立的,也可以是集成的。如果在計算機上安裝了MIDI軟件,可將音樂的創(chuàng)作、樂譜的打印、節(jié)目編排、音樂的調(diào)整、音響的幅度、節(jié)奏的速度、各聲部之間的協(xié)調(diào)、混響都可由MIDI軟件控制完成?;谟嬎銠C的MIDI音樂制作系統(tǒng)2.2.4MIDI系統(tǒng)的組成輸入設備具有USB接口MIDI鍵盤2.2.4MIDI系統(tǒng)的組成音序器是用來記錄、編輯和播放MIDI文件的設備。音序器分硬件和軟件兩種。最早的是硬件音序器,也稱為編曲機。它可以是一個獨立的設備,也可以內(nèi)置于合成器中。這類音序器的編輯和修改必須在它的面板上進行,使用是很不方便的。常見的型號有YamahaQY700等。2.2.4MIDI系統(tǒng)的組成YamahaQY700音序器2.2.4MIDI系統(tǒng)的組成發(fā)聲設備音源只是一個資源庫音源分硬件和軟件兩種。硬件音源是現(xiàn)在專業(yè)MIDI制作不可缺少的設備,因為它們可以提供比任何一塊聲卡上的波表都要好很多的音色,這些獨立音源基本上是專業(yè)人士使用的,常見的型號有RolandJV1080和YamahaMU100R等。多媒體聲卡上都有一個128種音色的GM音色庫。2.2.4MIDI系統(tǒng)的組成聲音處理設備通過調(diào)音臺、效果器、均衡器等聲音處理設備對音頻信號進行均衡、限幅、壓縮、延時、混響等特技處理,也可以用軟件進行處理。2.2.4MIDI系統(tǒng)的組成2.2.5MIDI的工作過程

MIDI電子樂器通過MIDI接口與計算機相連,MIDI靠這個接口傳遞消息(Message)來進行彼此通信。這樣,計算機可通過音序器軟件來采集MIDI電子樂器發(fā)出的一系列消息或指令。這一系列消息可記錄到以(.MID)為擴展名的MIDI文件中。在計算機上音序器可對MIDI文件進行編輯和修改。最后,將MIDI文件送往音樂合成器,由合成器將MIDI文件進行解釋并產(chǎn)生波形,然后通過聲音發(fā)生器送往揚聲器播放出來。2.2.5MIDI的工作過程2.2.6MIDI的特點及與WAV文件的比較MIDI的特點生成的文件比較小,因為MIDI文件存儲的是命令,而不是聲音波形;容易編輯,因為編輯命令比編輯聲音波形容易的多;使用MIDI文件,其聲卡上必需含有硬件音序器或配置有軟件音序器;可以作背景音樂,因為MIDI音樂可以和其它的媒體,如數(shù)字電視、圖形、動畫、語音等一起播放,這樣可以加強演示效果。WAV與MIDI文件的比較MIDI消息實際上就是樂譜的數(shù)字表示,MIDI數(shù)據(jù)不是聲音而是指令,因此它的數(shù)據(jù)量要比波形聲音少得多;對MIDI的編輯靈活,可以自由地改變曲調(diào)、音色等屬性,波形聲音很難做到這點;波形聲音與設備無關(guān),MIDI數(shù)據(jù)與設備有關(guān)。2.2.6MIDI的特點及與WAV文件的比較MIDI數(shù)據(jù)一般用于下列情況由于無法獲得足夠的RAM存儲器、硬盤存儲空間、CPU處理能力或帶寬而不能使用數(shù)字音頻;擁有高質(zhì)量的MIDI聲源;您對將要發(fā)布的應用軟件具有完全的控制能力,因此您的用戶將會具有高性能的MIDI播放硬件;無需處理口語對話。2.2.6MIDI的特點及與WAV文件的比較數(shù)字音頻一般用于下列情況您無法控制回放硬件;您擁有處理數(shù)字文件的計算機資源和帶寬;您需要處理口語對話。2.2.6MIDI的特點及與WAV文件的比較2.3聲卡2.3.1聲卡介紹聲卡的功能播放數(shù)字音樂錄音實時的效果器音頻解碼音樂合成2.3.1聲卡介紹聲卡的分類按數(shù)據(jù)采樣位數(shù)分類:8位、16位、24位按總線方式分類:ISA、PCI、USB按與計算機的連接方式分類:獨立聲卡、集成聲卡按用途分類:普通聲卡、專業(yè)聲卡聲卡的性能指標采樣和量化能力芯片類型輸出聲道數(shù)合成技術(shù)兼容性2.3.1聲卡介紹2.3.1聲卡介紹2.3.2聲卡的工作原理2.3.2聲卡的工作原理主芯片主芯片承擔著三維音效處理的運算和加速、MP3解碼、MIDI的合成及硬件等級的聲音處理。CODEC芯片I/O控制芯片負責和協(xié)調(diào)聲卡輸入/輸出控制音樂合成器

MIDI合成器有兩種:頻率調(diào)制合成器、波形表合成器

I/O設備輸出線路輸入(LineIn):可與盒式錄音機、唱機等相連進行錄音。話筒輸入(MicIn):可與話筒相連,進行語音錄入。線路輸出(LineOut):可跳過音頻卡的內(nèi)置放大器,而連接一個有源揚聲器或外接放大器進行音頻的輸出。揚聲器輸出(Speakerout):從音頻卡內(nèi)置功率放大器連接揚聲器進行輸出,該插口的輸出功率一般為2一4W。游戲棒/MIDI接口(Joystick/MIDI):可連接游戲捧或MIDI設備如MIDI鍵盤。2.3.2聲卡的工作原理音頻卡上的插口和接口2.3.2聲卡的工作原理2.4音頻處理軟件音頻編輯軟件CoolEditPro(AdobeAudition)

CoolEditPro2.0是SyntrilliumSoftware公司出品的,由CoolEditPro1.2版本升級而來,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論