版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
音頻技術(shù)基礎(chǔ)
人類(lèi)從外界獲得的信息大約有16%是從耳朵得到的。在多媒體技術(shù)中,音頻信息占有很重要的地位,比如在視頻會(huì)議系統(tǒng)中,音頻信息的優(yōu)先級(jí)最高。了解音頻信息的相關(guān)知識(shí)對(duì)更進(jìn)一步掌握多媒體技術(shù)是很重要的。第2頁(yè),共98頁(yè),2024年2月25日,星期天一切能發(fā)出聲音的物體稱(chēng)為聲源。聲音是由于聲源的振動(dòng)而產(chǎn)生的,由于聲源的振動(dòng),借助于它們周?chē)慕橘|(zhì),把這種振動(dòng)以機(jī)械波的形式由近及遠(yuǎn)地傳向遠(yuǎn)方,這就是聲波。聲波傳入人耳,致使耳膜也產(chǎn)生振動(dòng),這種振動(dòng)被傳導(dǎo)到聽(tīng)覺(jué)神經(jīng),人們就產(chǎn)生了“聲音”的感覺(jué)。我們?nèi)粘B?tīng)到的聲音是一種模擬信號(hào).聲學(xué)基礎(chǔ)知識(shí)●聲音定義聲音是振動(dòng)波,具有振幅、周期和頻率.●聲音的質(zhì)量簡(jiǎn)稱(chēng)音質(zhì)。音質(zhì)與頻率范圍成正比,頻率范圍越寬音質(zhì)越好.聲音具有連續(xù)性和過(guò)程性,數(shù)據(jù)前后相關(guān),數(shù)據(jù)量大,具有實(shí)時(shí)性.●聲音的連續(xù)時(shí)基性●聲音三要素(1)音調(diào)—(高低)(2)音強(qiáng)—(強(qiáng)弱)(3)音色—(特質(zhì))第3頁(yè),共98頁(yè),2024年2月25日,星期天聲音的三要素音調(diào):(高低)與聲音的頻率有關(guān),頻率快則聲音高,頻率慢則聲音低。音強(qiáng):(強(qiáng)弱)又稱(chēng)響度,取決于聲音的振幅,也即振幅的大小和強(qiáng)弱。音色:(特質(zhì))由混入基音的諧音決定。每個(gè)基音都有其固定頻率,和不同音強(qiáng)的諧音混合,使得每個(gè)聲音具有特殊的音色效果。第4頁(yè),共98頁(yè),2024年2月25日,星期天聲音的頻率范圍第5頁(yè),共98頁(yè),2024年2月25日,星期天模擬波信號(hào)有三個(gè)要素:基線、周期和振幅。振幅即波形的最高點(diǎn)(或最低點(diǎn))與基線間的距離,它表示了聲音音量的大小。周期是波形中兩個(gè)相鄰波峰之間的距離,它表示完成一次振動(dòng)過(guò)程所需的時(shí)間,其大小體現(xiàn)了振動(dòng)的速度。頻率是周期的倒數(shù),周期越短,頻率越高。頻率的單位為赫茲(Hz)。人的耳朵只能感覺(jué)到振動(dòng)頻率在20Hz到20000Hz之間的聲波,超出此范圍的振動(dòng)波不能引起聽(tīng)覺(jué)器官的感覺(jué)。其中,人耳對(duì)400-4000HZ的聲波最敏感。
次聲波人耳可聽(tīng)域超聲波<20Hz20~20,000Hz>20,000Hz女性語(yǔ)音150Hz~10,000Hz電話語(yǔ)音200Hz~3,400Hz調(diào)幅廣播(AM)50Hz~7,000Hz調(diào)頻廣播(FM)20Hz~15,000Hz高級(jí)音響10Hz~40,000Hz男性語(yǔ)音100Hz~9,000Hz聲源種類(lèi)頻帶寬度第6頁(yè),共98頁(yè),2024年2月25日,星期天頻帶寬度
聲音質(zhì)量等級(jí)與信號(hào)帶寬的關(guān)系電話AM廣播FM廣播CD-DA1020502003.4K7K15K22Kf(Hz)第7頁(yè),共98頁(yè),2024年2月25日,星期天音頻信號(hào)特性分析●時(shí)域特性起始——穩(wěn)定——結(jié)束●頻域特性聲音信號(hào)由正弦分量組成——周期、非周期頻譜分析——線狀譜、連續(xù)譜聲音信號(hào)的描述——聲波頻率、聲壓、聲強(qiáng)人耳對(duì)聲音的感覺(jué)通過(guò)聲壓或聲壓級(jí)描述——非線性聽(tīng)閾(1kHz):2×10-5Pa——
0dB痛閾:20Pa——
120dB第8頁(yè),共98頁(yè),2024年2月25日,星期天聲音的強(qiáng)度在1kHz頻率的正弦波中,能被人耳察覺(jué)的最弱聲壓大約是2Х10-5Pa,這個(gè)最弱音已經(jīng)作為國(guó)際標(biāo)準(zhǔn)的參照聲。描述聲音強(qiáng)度的量值是采用分貝表示:分貝是指兩個(gè)相同的物理量(例A1和A0)之比,取以10為底的對(duì)數(shù)并乘以10(或20)。N=10*lg(A1/A0)分貝符號(hào)為“dB”。N是被量度量的“級(jí)”,也被稱(chēng)為聲壓級(jí)。A1是被量度量。A0是基準(zhǔn)量,第9頁(yè),共98頁(yè),2024年2月25日,星期天如果2Х10-5Pa被看作0dB(聲壓級(jí))那么在特別安靜的環(huán)境中,單獨(dú)檢測(cè):動(dòng)物的呼吸聲大約20dB人們正常的談話聲約60dB汽車(chē)的喇叭聲約100dB飛機(jī)起飛的聲音約120dB120dB以上的強(qiáng)度可使人產(chǎn)生痛苦的感覺(jué)。第10頁(yè),共98頁(yè),2024年2月25日,星期天人耳聽(tīng)覺(jué)特性●人耳對(duì)聲音強(qiáng)弱的感覺(jué)特性人耳對(duì)聲音強(qiáng)弱的感覺(jué)不與聲壓成正比,而與聲壓級(jí)成正比。安靜的環(huán)境和嘈雜的環(huán)境中人耳可以分辨的聲音不同。掩蔽:一個(gè)頻率聲音的聽(tīng)閾由于另一個(gè)聲音的存在而上升的現(xiàn)象。掩蔽效應(yīng):復(fù)合聲音信號(hào)中,響度較低的聲音頻率分量被高者淹沒(méi)。響度是聽(tīng)覺(jué)判斷聲音強(qiáng)弱的屬性——主觀,響度與聲壓級(jí)有一定關(guān)系:聲壓級(jí)每增加10dB,響度增加1倍?!耥懚群晚懚燃?jí)●人耳聽(tīng)覺(jué)的掩蔽效應(yīng)第11頁(yè),共98頁(yè),2024年2月25日,星期天●聲音質(zhì)量評(píng)價(jià)◆我們經(jīng)常會(huì)對(duì)某一位歌手的歌聲發(fā)表意見(jiàn),并與其他歌手進(jìn)行比較,這其實(shí)是在對(duì)聲音的質(zhì)量進(jìn)行評(píng)價(jià)。◆聲音質(zhì)量的度量有兩種基本方法:客觀質(zhì)量度量、主觀質(zhì)量的度量。
聲波的測(cè)量與分析傳統(tǒng)的方法是先用機(jī)電換能器把聲波轉(zhuǎn)換為相應(yīng)的電信號(hào),然后用電子儀表放大到一定的電壓級(jí)進(jìn)行測(cè)量與分析。由于計(jì)算技術(shù)的發(fā)展,使許多計(jì)算和測(cè)量工作都使用了計(jì)算機(jī)或程序?qū)崿F(xiàn)。這些帶計(jì)算機(jī)處理系統(tǒng)的高級(jí)聲學(xué)測(cè)量?jī)x器,能完成下列一些測(cè)量工作:●評(píng)價(jià)值的測(cè)量——響度和響度級(jí),噪音級(jí),清晰度指數(shù),噪音評(píng)價(jià)數(shù)?!衤曉吹臏y(cè)量——頻譜的時(shí)間變化,聲功率,指向性,效率,頻譜特征,幅值分布等?!褚糍|(zhì)的測(cè)量——混響時(shí)間,隔音量,吸音量。
●聲音客觀質(zhì)量的度量方法第12頁(yè),共98頁(yè),2024年2月25日,星期天聲測(cè)量的基本儀器是聲級(jí)計(jì)。聲級(jí)計(jì)是一種能對(duì)聲音作出類(lèi)似人耳的反應(yīng)的儀器,同時(shí),它能進(jìn)行客觀而可重復(fù)的聲壓和聲級(jí)測(cè)量。聲壓測(cè)量的好處很多:它能幫助音樂(lè)廳提高音響效果;能對(duì)煩擾聲音進(jìn)行精密的、科學(xué)的分析。聲級(jí)測(cè)量還能明確地告訴我們什么聲音會(huì)引起聽(tīng)力損害,并提醒人們采用適當(dāng)?shù)穆?tīng)力保護(hù)措施。因此,聲測(cè)量是不可少的。度量聲音客觀質(zhì)量的一個(gè)主要指標(biāo)是信噪比SNR(SignaltoNoiseRation)。其單位是分貝(dB)。第13頁(yè),共98頁(yè),2024年2月25日,星期天●聲音主觀質(zhì)量的度量
采用客觀標(biāo)準(zhǔn)方法很難真正評(píng)定某種編碼器的質(zhì)量,在實(shí)際評(píng)價(jià)中,主觀的質(zhì)量度量比客觀質(zhì)量的度量更為恰當(dāng)和合理。通常是對(duì)某編碼器的輸出的聲音質(zhì)量進(jìn)行評(píng)價(jià),例如播放一段音樂(lè),記錄一段話,然后重放給實(shí)驗(yàn)者聽(tīng),再由實(shí)驗(yàn)者進(jìn)行綜合評(píng)定??梢哉f(shuō),人的感覺(jué)機(jī)理最具有決定意義。當(dāng)然,可靠的主觀度量值是較難獲得的。第14頁(yè),共98頁(yè),2024年2月25日,星期天
平均判分(MeanOpinionScore-MOS)過(guò)程是召集一批實(shí)驗(yàn)者,請(qǐng)每個(gè)實(shí)驗(yàn)者對(duì)某個(gè)編解碼器的輸出進(jìn)行質(zhì)量判分,采用類(lèi)似于考試的五級(jí)分制,不同的MOS分對(duì)應(yīng)的質(zhì)量級(jí)別和失真級(jí)別見(jiàn)下表。●聲音主觀質(zhì)量的度量方法MOS質(zhì)量級(jí)別失真級(jí)別5優(yōu)(Excellent)不察覺(jué)4良(Good)剛察覺(jué)但不可厭3中(Fair)察覺(jué)及稍微可厭2差(Poor)可厭(但不令人反感)1劣(Unacceptable)極可厭(令人反感)第15頁(yè),共98頁(yè),2024年2月25日,星期天數(shù)字化聲音用聲音錄制軟件記錄的英文單詞“Hello”的語(yǔ)音實(shí)際波形第16頁(yè),共98頁(yè),2024年2月25日,星期天模擬信號(hào)很容易受到電子干擾,因此隨著技術(shù)的發(fā)展,聲音信號(hào)就逐漸過(guò)渡到了數(shù)字存儲(chǔ)階段,A/D轉(zhuǎn)換和D/A轉(zhuǎn)換技術(shù)便應(yīng)運(yùn)而生。A:“Analog”(類(lèi)比、模擬)D:“Digital”(數(shù)字、數(shù)碼)A/D轉(zhuǎn)換就是把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的過(guò)程,模擬電信號(hào)變?yōu)榱擞伞?”和“1”組成的Bit信號(hào)。這樣做的好處是顯而易見(jiàn)的,聲音存儲(chǔ)質(zhì)量得到了加強(qiáng),數(shù)字化的聲音信息使計(jì)算機(jī)能夠進(jìn)行識(shí)別、處理和壓縮,這也就是為什么如今磁帶逐漸被淘汰,CD唱片卻趨于流行的原因。
A/D轉(zhuǎn)換的一個(gè)關(guān)鍵步驟是聲音的采樣和量化,得到數(shù)字音頻信號(hào),它在時(shí)間上是不連續(xù)的離散信號(hào)。第17頁(yè),共98頁(yè),2024年2月25日,星期天借助于A/D或D/A轉(zhuǎn)換器,模擬信號(hào)和數(shù)字信號(hào)可以互相轉(zhuǎn)換
8位可編程A/D轉(zhuǎn)換芯片第18頁(yè),共98頁(yè),2024年2月25日,星期天●
聲音采樣——聲音數(shù)字化(模/數(shù)轉(zhuǎn)換)聲音采樣1101110011001101把聲音(模擬量)按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列●
聲音重放——聲音模擬化(數(shù)/模轉(zhuǎn)換)聲音重放11011100把數(shù)字化聲音轉(zhuǎn)換成模擬量,經(jīng)過(guò)音響單元重放出來(lái)●
設(shè)備和軟件(1)聲音適配器(聲卡)8bit、16bit、…128bit¥80.00~3800.00(2)聲卡驅(qū)動(dòng)軟件以及各種聲音處理軟件人耳聽(tīng)到的聲音是一種具有振幅、周期(頻率)的聲波,計(jì)算機(jī)要處理這種聲波,可以通過(guò)話筒把機(jī)械振動(dòng)轉(zhuǎn)變成相應(yīng)的電信號(hào),這也是一種連續(xù)的模擬信號(hào)。模擬信號(hào)的幅度,表示聲音的強(qiáng)弱。計(jì)算機(jī)只能處理數(shù)字量,不能處理這種模擬量,只有把這種模擬量轉(zhuǎn)換成數(shù)字量,計(jì)算機(jī)才有可能處理聲音,這種轉(zhuǎn)換就是模/數(shù)轉(zhuǎn)換(A/D轉(zhuǎn)換),它是由模/數(shù)轉(zhuǎn)換電路實(shí)現(xiàn)的。聲音經(jīng)A/D轉(zhuǎn)換后得到的數(shù)字聲音信號(hào)交給計(jì)算機(jī)處理,處理后的數(shù)據(jù)需經(jīng)過(guò)數(shù)/模(D/A)轉(zhuǎn)換電路,還原成模擬信號(hào),再進(jìn)行放大輸出到喇叭或耳機(jī),變成人耳能夠聽(tīng)到的聲音。第19頁(yè),共98頁(yè),2024年2月25日,星期天從模擬到數(shù)字聲源聲波傳聲器模擬電信號(hào)數(shù)字聲音第20頁(yè),共98頁(yè),2024年2月25日,星期天聲音的數(shù)字化原理模擬聲音信號(hào)是個(gè)連續(xù)量,可能由許多具有不同振幅和頻率的正弦波組成。計(jì)算機(jī)獲取實(shí)際聲音信號(hào)的過(guò)程就是聲音的數(shù)字化的處理過(guò)程。右圖表示了模擬聲音數(shù)字化的三個(gè)步驟:采樣、量化和編碼。第21頁(yè),共98頁(yè),2024年2月25日,星期天數(shù)字音頻的處理●采樣(Sampling)
、采樣頻率采樣是將連續(xù)變化的模擬音頻信號(hào)變成計(jì)算機(jī)能處理的離散化數(shù)字信號(hào)的第一步。每隔一定時(shí)間,對(duì)模擬音頻信號(hào)的幅值進(jìn)行采樣測(cè)試,得到離散的幅值,并用該值表示兩次采樣之間的模擬幅值。單位時(shí)間采樣的次數(shù)稱(chēng)為采樣頻率。采樣頻率越高,所得到的離散幅值的數(shù)據(jù)點(diǎn)就越逼近于連續(xù)音頻信號(hào),同時(shí)采樣所得到的數(shù)據(jù)量也越大。多媒體電腦中支持的采樣頻率通常為44.1kHz、22.05kHz及11.025kHz,8kHz。第22頁(yè),共98頁(yè),2024年2月25日,星期天t模擬輸入t0t0采樣時(shí)鐘量化,編碼0tX(0)X(1)…X(n)…第23頁(yè),共98頁(yè),2024年2月25日,星期天聲音的采樣聲音在數(shù)字化后的波形圖第24頁(yè),共98頁(yè),2024年2月25日,星期天標(biāo)準(zhǔn)采樣頻率采樣頻率采樣次數(shù)/s聲音質(zhì)量8KHz8000電話音質(zhì)11.025KHz11025AM音質(zhì)22.05KHz22050FM音質(zhì)44.1KHz44100CD音質(zhì)48KHz48000DAT音質(zhì)說(shuō)明:DAT指數(shù)字錄音帶格式(Digitalaudiotype)第25頁(yè),共98頁(yè),2024年2月25日,星期天采樣定理:
奈奎斯特理論認(rèn)為:數(shù)字采樣頻率的大小由聲音信號(hào)本身的最高頻率決定。指出:進(jìn)行無(wú)損的數(shù)字化轉(zhuǎn)換,采樣頻率至少是所采信號(hào)所含最高頻率的2倍。fs>=2f聲音類(lèi)型帶寬采樣頻率(kHz)電話語(yǔ)音200Hz-3.4kHz8調(diào)幅廣播50Hz-7kHz11.025調(diào)頻廣播20Hz-15kHz22.050CD20Hz-20kHz44.1第26頁(yè),共98頁(yè),2024年2月25日,星期天●量化(Quantization)
采樣所得到的數(shù)據(jù)是一定的離散值,將這些離散值用若干二進(jìn)制的位來(lái)表示,這一過(guò)程稱(chēng)為量化。用8位二進(jìn)制表示十進(jìn)制整數(shù),只能表示出0~255之間的整數(shù)值。也就是256個(gè)量化級(jí)。量化級(jí)對(duì)應(yīng)的二進(jìn)制位數(shù)稱(chēng)為量化位數(shù)。雖然量化位數(shù)越多,對(duì)原始波形的模擬越細(xì)膩,聲音的音質(zhì)就越好,但數(shù)據(jù)量也越大。量化即是將采樣所得到的信號(hào)振幅值用一組二進(jìn)制脈沖序列來(lái)表示。離散化的數(shù)據(jù)經(jīng)量化變成二進(jìn)制表示一般會(huì)損失一些精度,這主要是因?yàn)橛?jì)算機(jī)只能表示有限的數(shù)值。第27頁(yè),共98頁(yè),2024年2月25日,星期天均勻量化如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱(chēng)為均勻量化。均勻量化就是采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱(chēng)為線性量化。第28頁(yè),共98頁(yè),2024年2月25日,星期天非均勻量化--非線性量化的基本想法是,對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔,如圖所示。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來(lái)表示。聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。第29頁(yè),共98頁(yè),2024年2月25日,星期天
在非線性量化中,采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系,一種稱(chēng)為m律壓擴(kuò)(companding)算法,另一種稱(chēng)為A律壓擴(kuò)算法。
m律壓擴(kuò)
m律(m-Law)壓擴(kuò)(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中
A律壓擴(kuò)
A律(A-Law)壓擴(kuò)(G.711)主要用在歐洲和中國(guó)大陸等地區(qū)的數(shù)字電話通信中
第30頁(yè),共98頁(yè),2024年2月25日,星期天量化噪聲:量化誤差,隨階距變大而增加。量化位數(shù)/采樣精度(字長(zhǎng)):表示采樣值的二進(jìn)制位數(shù)(比特?cái)?shù)),決定了采樣值的精度。例如:量化位數(shù)16bit,可以表示65536個(gè)不同量化值,精度(階距)1/65536。量化位數(shù)8bit,可以表示256個(gè)不同量化值,精度(階距)1/256。第31頁(yè),共98頁(yè),2024年2月25日,星期天動(dòng)態(tài)范圍(DynamicRange)20×lg(信號(hào)的最大強(qiáng)度/最小強(qiáng)度)(dB)信噪比(SignaltoNoiseRatio,SNR)-有用信號(hào)的能量和噪聲能量的比。-常用單位:dB
衡量信號(hào)質(zhì)量的標(biāo)準(zhǔn):第32頁(yè),共98頁(yè),2024年2月25日,星期天量化位數(shù)幅值動(dòng)態(tài)范圍(dB)效果825648數(shù)字電話1664K96CD-DA60FM廣播40AM廣播量化位與動(dòng)態(tài)范圍第33頁(yè),共98頁(yè),2024年2月25日,星期天根據(jù)抽樣理論可知,一個(gè)數(shù)字信源的信噪比大約等于采樣精度乘以6分貝。 8位的數(shù)字系統(tǒng)其信噪比只有48分貝, 16位的數(shù)字系統(tǒng)的信噪比可達(dá)96分貝,信噪比低會(huì)出現(xiàn)背景噪聲以及失真。 因此,量化位數(shù)越多,保真度越好。量化位與信噪比第34頁(yè),共98頁(yè),2024年2月25日,星期天在多媒體電腦中,要對(duì)音頻進(jìn)行處理,必須在PC機(jī)上添加一塊聲卡。聲卡是多媒體升級(jí)套件中的核心部件之一,其外形與插在計(jì)算機(jī)主機(jī)箱內(nèi)的其他硬件插板相仿,也是一塊可以插在擴(kuò)展槽內(nèi)的電路板,但包含有完成音頻處理功能的電子元件。聲卡通過(guò)一秒內(nèi)對(duì)聲音進(jìn)行上千次的采樣、閱讀,把模擬聲波轉(zhuǎn)換成數(shù)字信息、數(shù)字化的聲音存儲(chǔ)在波形文件中。當(dāng)聲音被記錄時(shí),聲卡中的模/數(shù)轉(zhuǎn)換器把模擬聲波轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù);當(dāng)聲音重放時(shí),聲卡中的數(shù)/模轉(zhuǎn)換器把波形文件里的數(shù)字?jǐn)?shù)據(jù)變成模擬波形輸出。聲音的壓縮第35頁(yè),共98頁(yè),2024年2月25日,星期天第36頁(yè),共98頁(yè),2024年2月25日,星期天聲音文件數(shù)據(jù)量的計(jì)算影響數(shù)字化聲音質(zhì)量的因素主要有三個(gè),即
采樣頻率,量化精度和聲道個(gè)數(shù)。聲道數(shù):指一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。單聲道只有一個(gè)數(shù)據(jù)流,立體聲的數(shù)據(jù)流至少在兩個(gè)以上。由于立體聲聲音具有多聲道、多方向的特征,因此,聲音的播放在時(shí)間和空間性能方面都能顯示更好的效果,但相應(yīng)數(shù)據(jù)量將成倍增加。
第37頁(yè),共98頁(yè),2024年2月25日,星期天數(shù)字聲音相關(guān)的參數(shù)質(zhì)量采樣頻率(kHz)量化精度單道聲/立體聲數(shù)據(jù)率(kb/s)頻率范圍(kHz)電話88單道聲64200~3400AM11.0258單道聲8850~7000FM22.05016立體聲705.620~15000CD44.116立體聲1411.220~20000DAT4816立體聲153620~20000第38頁(yè),共98頁(yè),2024年2月25日,星期天聲音文件所需的存儲(chǔ)空間可用下式來(lái)計(jì)算:采樣率越大,數(shù)字信號(hào)越接近模擬信號(hào),但所要求的存儲(chǔ)空間也越大。
量化位數(shù)越多,所得的量化值越接近原始波形采樣值,但所要求的信息存儲(chǔ)量也越大。雙聲道立體聲比單聲道的聲音逼真豐富,但需要成倍于單聲道的信息容量。以16位、22.05kHz的頻率錄制1分鐘的立體聲,所需存儲(chǔ)空間為5.047MB。如果錄制1小時(shí)的立體聲。其所要求的存儲(chǔ)空間為60×5.047=302.81MB。第39頁(yè),共98頁(yè),2024年2月25日,星期天計(jì)算:一張CD唱盤(pán)容量為640MB,問(wèn)最多能存儲(chǔ)多長(zhǎng)時(shí)間的CD音質(zhì),采樣字長(zhǎng)為16bit的雙聲道立體聲歌曲?每秒:(44.1K*16*2/8)=176400Byte(640*1024*1024)/176400=3804s=1h3min24s第40頁(yè),共98頁(yè),2024年2月25日,星期天聲音壓縮通常采用有損壓縮的方式進(jìn)行,主要用在重構(gòu)的信號(hào)不必要與原始信號(hào)完全相同的場(chǎng)合。這種壓縮采取在壓縮的過(guò)程中丟掉某些不致對(duì)原始數(shù)據(jù)產(chǎn)生誤解的信息,以大大提高壓縮比。
從第一個(gè)音頻編碼方法產(chǎn)生到現(xiàn)在,出現(xiàn)了很多的壓縮編碼方法??梢詫⑺麄兎譃槿?lèi):波形編碼、參數(shù)編碼和混合編碼。第41頁(yè),共98頁(yè),2024年2月25日,星期天波形編碼基于對(duì)語(yǔ)音信號(hào)波形的數(shù)字化處理,試圖使處理后重建的語(yǔ)音信號(hào)波形與原語(yǔ)音信號(hào)波形保持一致。優(yōu)點(diǎn):實(shí)現(xiàn)簡(jiǎn)單(計(jì)算量不大)、語(yǔ)音質(zhì)量(保真度)好、適應(yīng)性強(qiáng),有成熟的技術(shù)實(shí)現(xiàn)方法;缺點(diǎn):壓縮程度不高、實(shí)現(xiàn)的碼速率較高,碼率低于32kbit/s時(shí)音質(zhì)降低明顯,16kbit/s時(shí)音質(zhì)就非常差了。常見(jiàn)方法:脈沖編碼調(diào)制(PCM)、增量調(diào)制(DM)、差值脈沖編碼調(diào)制(DPCM)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)、子帶編碼(SBC)和矢量量化編碼(VQ)等。編碼信號(hào)的速率計(jì)算:編碼速率=采樣頻率×編碼比特?cái)?shù)播放某音頻信號(hào)所需存儲(chǔ)量=播放時(shí)間×速率÷8(字節(jié))第42頁(yè),共98頁(yè),2024年2月25日,星期天參數(shù)編碼(聲源編碼)通過(guò)構(gòu)造發(fā)聲模型作為基礎(chǔ),用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來(lái)描述這個(gè)模型,在發(fā)送端從模擬語(yǔ)音信號(hào)中提取各個(gè)特征參量并進(jìn)行量化編碼,以實(shí)現(xiàn)語(yǔ)音信息的數(shù)字化。優(yōu)點(diǎn):語(yǔ)音編碼速率較低(2~9.6kbit/s),壓縮比特率低;缺點(diǎn):合成語(yǔ)音質(zhì)量較差(保真度欠佳),實(shí)現(xiàn)的復(fù)雜度高。典型代表:線性預(yù)測(cè)編碼器(LPC)語(yǔ)聲信號(hào)產(chǎn)生模型周期性信號(hào)隨機(jī)性信號(hào)基音周期Tp濁音清音線性時(shí)變?yōu)V波器合成語(yǔ)音信號(hào)輸出C(n)u(n)v(n)G增益控制時(shí)變參數(shù)ai第43頁(yè),共98頁(yè),2024年2月25日,星期天混和編碼波形編碼:保真度好,計(jì)算量小,但編碼后速率高;參數(shù)編碼:碼速率較低,但保真度欠佳,計(jì)算復(fù)雜。波形編碼與參數(shù)編碼結(jié)合——混和編碼:克服弱點(diǎn),結(jié)合優(yōu)點(diǎn)壓縮比特率:4~16kbit/s編碼器:多脈沖激勵(lì)線性預(yù)測(cè)編碼器(MPE-LPC)、規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼器(RPE-LPC)、碼激勵(lì)線性預(yù)測(cè)編碼器(CELP)、矢量和激勵(lì)線性預(yù)測(cè)編碼器(VSELP)和多帶激勵(lì)線性預(yù)測(cè)編碼器。與參數(shù)編碼的差別:信號(hào)激勵(lì)源的選取更加精細(xì)——通過(guò)調(diào)整激勵(lì)信號(hào)使語(yǔ)音輸入信號(hào)與重構(gòu)的語(yǔ)音信號(hào)誤差最小(合成分析法AbS-analysisbysynthesis)。第44頁(yè),共98頁(yè),2024年2月25日,星期天三種壓縮編碼的性能比較24616832kbit/s
主觀音質(zhì)評(píng)價(jià)混和法參數(shù)法波形法54321第45頁(yè),共98頁(yè),2024年2月25日,星期天差分脈沖編碼調(diào)制DPCM出發(fā)點(diǎn):對(duì)相鄰樣值的差值進(jìn)行量化編碼實(shí)現(xiàn):對(duì)樣值與其對(duì)應(yīng)的預(yù)測(cè)值的差值進(jìn)行量化編碼
預(yù)測(cè)表達(dá)式預(yù)測(cè)編碼
關(guān)鍵:預(yù)測(cè)系數(shù)的獲得——使預(yù)測(cè)估值的均方差為最小的預(yù)測(cè)系數(shù)自適應(yīng)差值脈沖編碼調(diào)制ADPCM自適應(yīng)量化:使量化間隔的變化與輸入語(yǔ)聲信號(hào)的方差相匹配
自適應(yīng)預(yù)測(cè)預(yù)測(cè)系數(shù)隨輸入信號(hào)而變化2.線性預(yù)測(cè)編碼LPC語(yǔ)聲激勵(lì)信號(hào):濁音信號(hào)(準(zhǔn)周期脈沖序列)+清音信號(hào)(白色隨機(jī)噪聲)雖然碼速率低,但在噪聲環(huán)境下語(yǔ)音質(zhì)量不好,現(xiàn)已被淘汰。常用壓縮編碼方法第46頁(yè),共98頁(yè),2024年2月25日,星期天預(yù)測(cè)編碼基本思想預(yù)測(cè)表達(dá)式預(yù)測(cè)系數(shù)的求取第47頁(yè),共98頁(yè),2024年2月25日,星期天圖DPCM系統(tǒng)原理框圖DPCM預(yù)測(cè)器量化器編碼器解碼器預(yù)測(cè)器信道接收端輸出XN’+++XNe’NXNeNe’NXN’++輸入^XN^發(fā)送端+-預(yù)測(cè)值抽樣值eN=XN-XN^存在量化誤差第48頁(yè),共98頁(yè),2024年2月25日,星期天3.矢量量化編碼:將輸入信號(hào)樣值按某種方式分組(矢量),并量化理論基礎(chǔ):香農(nóng)率失真理論基本原理:用碼書(shū)中與輸入矢量最匹配的碼字的索引(下標(biāo))代替輸入矢量進(jìn)行傳輸和存儲(chǔ),解碼時(shí)只需簡(jiǎn)單的查表操作。關(guān)鍵技術(shù):碼書(shū)設(shè)計(jì)、碼字搜索、碼字(下標(biāo))索引分配。應(yīng)用:中速率和低速率語(yǔ)音編碼——G.723.1、G.728、G.729待續(xù)4.子帶編碼基本思想:將輸入信號(hào)分解為若干子頻帶,然后對(duì)各子帶分量根據(jù)其不同的統(tǒng)計(jì)特性采取不同的壓縮策略,以降低碼率。子帶劃分依據(jù):話音信號(hào)自身特性?xún)?yōu)點(diǎn):不僅可以很好地控制各個(gè)子帶的量化電平數(shù),還可以很好地控制在重建信號(hào)時(shí)的量化誤差方差值,進(jìn)而獲得更好的主觀聽(tīng)音質(zhì)量。相對(duì)獨(dú)立的量化噪聲被束縛在各自子帶內(nèi),互不影響。各個(gè)子帶的采樣頻率大大降低。第49頁(yè),共98頁(yè),2024年2月25日,星期天矢量量化數(shù)據(jù)分組,每個(gè)組有K個(gè)數(shù)據(jù),一組數(shù)據(jù)構(gòu)成一個(gè)K維矢量;每個(gè)矢量有對(duì)應(yīng)的下標(biāo);每個(gè)矢量視為一個(gè)碼字;所有碼字排列形成一個(gè)表即為碼本或(碼書(shū));設(shè)計(jì)一個(gè)良好的碼本C(具有N個(gè)K維矢量的集合)C={yi};yi為碼字,下標(biāo)i=1,2,3,,N。
第50頁(yè),共98頁(yè),2024年2月25日,星期天矢量量化編碼矢量量化編碼原理框圖矢量量化編碼中,不傳輸對(duì)應(yīng)的矢量;發(fā)送端和接收端都有相同的碼本,只需傳送每個(gè)矢量的下標(biāo)i。下標(biāo)數(shù)據(jù)比矢量本身數(shù)據(jù)小得多,實(shí)現(xiàn)了壓縮。第51頁(yè),共98頁(yè),2024年2月25日,星期天5.感知編碼基本原理:以人類(lèi)聽(tīng)覺(jué)系統(tǒng)的心理聲學(xué)為基礎(chǔ),只記錄能夠被人耳感覺(jué)到的聲音,從而達(dá)到壓縮數(shù)據(jù)量的目的。理論基礎(chǔ):基于人耳的聞閾、臨界頻段和掩蔽效應(yīng)。人耳對(duì)不同頻段聲音的反應(yīng)靈敏度有差異,在編碼時(shí),對(duì)被掩蔽的弱音不進(jìn)行編碼,從而達(dá)數(shù)據(jù)壓縮的目的。應(yīng)用:在音頻壓縮編碼中,感知編碼比較成功,如MPEG-1、MPEG-2、AC-3第52頁(yè),共98頁(yè),2024年2月25日,星期天音頻信息壓縮編碼標(biāo)準(zhǔn)標(biāo)準(zhǔn)的描述對(duì)象:編碼速率、編碼的壓縮算法、編碼器結(jié)構(gòu)、話音質(zhì)量以及彼此的關(guān)系。目標(biāo):用盡可能低的數(shù)碼率來(lái)獲得盡可能好的合成語(yǔ)音質(zhì)量。G.711、G.721、G.722●波形編碼標(biāo)準(zhǔn)第53頁(yè),共98頁(yè),2024年2月25日,星期天G.711針對(duì)50Hz到3.2kHz的語(yǔ)音信號(hào)進(jìn)行A律和
律PCM編碼,屬于非均勻量化。式中:x為輸入信號(hào)幅度,規(guī)格化成-1x
1;
律主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:A律主要用在歐洲和中國(guó)大陸等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:0
|x|1/A1/A
|x|1式中:x為輸入信號(hào)幅度,規(guī)格化成-1x
1;
第54頁(yè),共98頁(yè),2024年2月25日,星期天G.721一個(gè)代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù),實(shí)現(xiàn)64kb/s(A律或μ律壓擴(kuò)技術(shù))PCM速率和32kb/s速率的ADPCM之間的相互轉(zhuǎn)換。ADPCM編碼器第55頁(yè),共98頁(yè),2024年2月25日,星期天G.722一種高質(zhì)量語(yǔ)音信號(hào)的壓縮標(biāo)準(zhǔn)。取樣頻率為16kHz,每個(gè)樣值量化到14b,采用子帶編碼和ADPCM進(jìn)行壓縮編碼。7kHz音頻信號(hào)64kb/s數(shù)據(jù)率的編譯碼方塊圖第56頁(yè),共98頁(yè),2024年2月25日,星期天G.728該標(biāo)準(zhǔn)利用低延時(shí)碼本激勵(lì)線性預(yù)測(cè)LD-CELP方法將一般語(yǔ)音信號(hào)壓縮至16Kb/s。CELP編碼綜合了波形編碼和參數(shù)編碼,還采用矢量量化的壓縮算法。CELP實(shí)際上是一個(gè)閉環(huán)LPC系統(tǒng),由輸入語(yǔ)音信號(hào)確定最佳參數(shù),再根據(jù)某種最小誤差準(zhǔn)則從碼本中找出最佳激勵(lì)碼本矢量。CELP具有較強(qiáng)的抗干擾能力,在4~16kbit/s傳輸速率下,即可獲得較高質(zhì)量的語(yǔ)音信號(hào)。G.728、G.729、G.723.1●混和編碼標(biāo)準(zhǔn)第57頁(yè),共98頁(yè),2024年2月25日,星期天G.729低碼率的語(yǔ)音壓縮標(biāo)準(zhǔn),采用共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測(cè)CS-ACELP,將語(yǔ)音信號(hào)壓縮至8Kb/s。G.723.1采用ACELP(代數(shù)碼激勵(lì)線性預(yù)測(cè))算法,根據(jù)激勵(lì)碼本的不同可以將一般語(yǔ)音信號(hào)壓縮至5.3Kb/s和6.3Kb/s。在6.3Kb/s編碼器內(nèi)采用了多脈沖激勵(lì),可以得到較高的音質(zhì)。第58頁(yè),共98頁(yè),2024年2月25日,星期天MPEG-1、MPEG-2BC●MPEG音頻編碼標(biāo)準(zhǔn)●MPEG-2AAC編碼標(biāo)準(zhǔn)●MPEG-4音頻標(biāo)準(zhǔn)第59頁(yè),共98頁(yè),2024年2月25日,星期天MPEG1音頻壓縮標(biāo)準(zhǔn)包括3種壓縮模式:層次1、2、3;向下兼容;壓縮算法主要由子帶劃分和變換編碼構(gòu)成,主要步驟為:(1)音頻信號(hào)通過(guò)濾波器組分成為32個(gè)子帶;
(2)用FFT將子帶變換到頻率域;
(3)利用生理聲學(xué)模型對(duì)能感知的噪聲閾值進(jìn)行估計(jì);
(4)根據(jù)對(duì)噪聲閾值的估計(jì)進(jìn)行比特分配和量化。編碼器解碼器第60頁(yè),共98頁(yè),2024年2月25日,星期天其音頻編碼分為3層:Layer-1、Layer-2和Layer-3。Layer-1的壓縮比為1:4,編碼速率為384kb/s;Layer-2的壓縮比為1:6~1:8之間,編碼速率為192~256kb/s;Layer-3的壓縮比為1:10~1:12,壓縮碼率可以達(dá)到64kb/s。Layer-1的編碼器最為簡(jiǎn)單,主要用于小型數(shù)字盒式磁帶;Layer-2編碼器的復(fù)雜程度是中等,主要用于數(shù)字廣播音頻、數(shù)字音樂(lè)、只讀光盤(pán)交互系統(tǒng)和視盤(pán);Layer-3的編碼器最為復(fù)雜,主要用于ISDN上的聲音傳輸。第61頁(yè),共98頁(yè),2024年2月25日,星期天表MPEG1Audio音頻文件壓縮比率和播放媒體最低位率Layer大約壓縮比率播放媒體最低位率11:4348Kbit/s21:6~1:8256Kbit/s~192Kbit/s31:10~1:12128Kbit/s~112Kbit/sMP3(Layer3)編碼是MPEG1Audio音頻壓縮標(biāo)準(zhǔn)之一。第62頁(yè),共98頁(yè),2024年2月25日,星期天 MPEG-2BC聲音標(biāo)準(zhǔn)是在MPEG-1的基礎(chǔ)上發(fā)展來(lái)的,是MPEG為多聲道聲音開(kāi)發(fā)的低碼率編碼方案,并與MPEG-1的聲音標(biāo)準(zhǔn)保持后向兼容。與MPEG-1相比主要增加了下面幾個(gè)方面的內(nèi)容:MPEG-2BC聲音壓縮標(biāo)準(zhǔn)支持5.1多路環(huán)繞立體聲:5個(gè)全帶寬聲道,分為左、右、中、和兩個(gè)環(huán)繞聲道,另加一個(gè)低頻效果增強(qiáng)聲道擴(kuò)展了編碼器的輸出范圍,從32~384kb/s擴(kuò)展到8~640kb/s。增加了更低的取樣頻率和低碼率:在保持MPEG-1原有的取樣頻率的基礎(chǔ)上,又增加了三種取樣頻率,新增的取樣頻率為16kHz、22.05kHz和24kHz,是將原有MPEG-1的取樣頻率降低了一半,以便提高碼率低于64kb/s時(shí)的每個(gè)聲道的聲音質(zhì)量。第63頁(yè),共98頁(yè),2024年2月25日,星期天AC-3音頻壓縮標(biāo)準(zhǔn)DOLBY5.1聲道音頻壓縮標(biāo)準(zhǔn):左(L)、中(C)、右(R)、左環(huán)繞(LS)、右環(huán)繞(RS)和低頻增強(qiáng)。前5聲道帶寬20Hz~20kHz;0.1聲道,提供100Hz以下的超低音聲道,彌補(bǔ)低音的不足。AC-3將六個(gè)聲道進(jìn)行數(shù)字編碼,并將它們壓縮成一個(gè)通道,而比特率僅是320kb/s。美國(guó)HDTV的音頻標(biāo)準(zhǔn)第64頁(yè),共98頁(yè),2024年2月25日,星期天 MPEG-2AAC(AdvancedAudioCoding)是MPEG-2標(biāo)準(zhǔn)中一種非常靈活的編碼標(biāo)準(zhǔn),采用感知編碼方法,主要是利用聽(tīng)覺(jué)系統(tǒng)的掩蔽特性來(lái)減少聲音編碼的數(shù)據(jù)量;并且通過(guò)子帶編碼將量化噪聲分散到各個(gè)子帶中,用全局的聲音信號(hào)將噪聲掩蔽掉。MPEG-2AAC編碼標(biāo)準(zhǔn)AAC定義了3種配置:
基本配置在三種配置中提供最好的聲音質(zhì)量,除沒(méi)有使用增益控制模塊外,其余模塊都使用。
低復(fù)雜性配置沒(méi)有使用預(yù)測(cè)模塊和預(yù)處理模塊,使用的瞬時(shí)噪聲定形濾波器模塊的級(jí)數(shù)也有限,聲音質(zhì)量低于基本配置。
可變采用率配置使用增益控制作預(yù)處理,沒(méi)有使用預(yù)測(cè)模塊,對(duì)TNS(瞬時(shí)噪聲定性)濾波器的級(jí)數(shù)和帶寬也有限制,是最簡(jiǎn)單的一種配置。第65頁(yè),共98頁(yè),2024年2月25日,星期天音頻編碼算法和標(biāo)準(zhǔn)算法名稱(chēng)
數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用波形編碼PCM脈沖編碼調(diào)制
公共網(wǎng)ISDN配音μ-law,A-lawμ-律,A-律
64kbpsG.711APCM自適應(yīng)脈沖編碼調(diào)制
DPCM差分脈沖編碼調(diào)制
ADPCM自適應(yīng)差分脈沖編碼調(diào)制
32kbpsG.721SB-ADPCM子帶-自適應(yīng)差分脈沖編碼調(diào)制
64kbpsG.7225.3kbps6.3kbpsG.723參數(shù)編碼LPC線性預(yù)測(cè)編碼
2.4kbps保密話聲混合編碼CELPC碼激勵(lì)LPC4.6kbps移動(dòng)通信VSELP矢量和激勵(lì)LPC8kbps語(yǔ)音郵件RPE-LTP規(guī)則碼激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)
13.2kbpsISDNLD-CELP低延時(shí)碼激勵(lì)LPC16kbpsG.728G.729MPEG多子帶,感知編碼
128kbPsCDDolbyAC-3感知編碼
音響第66頁(yè),共98頁(yè),2024年2月25日,星期天聲音的合成數(shù)字化的聲音首先要轉(zhuǎn)換成模擬信號(hào),才能播放。對(duì)于存儲(chǔ)的采樣音頻,有兩種處理方法:FM頻率調(diào)制合成波形表(Wavetable)合成第67頁(yè),共98頁(yè),2024年2月25日,星期天頻率調(diào)制(FM)合成法數(shù)字式頻率調(diào)制合成法,簡(jiǎn)稱(chēng)為FM合成法。FM電子合成器先由震蕩器產(chǎn)生一個(gè)載波作為基音,然后再產(chǎn)生若干個(gè)調(diào)制波帶著許多泛音加在載波之上,可以對(duì)這個(gè)組合加以任意調(diào)整,然后加上典型的聲音包絡(luò)線(ADSR),再通過(guò)數(shù)控濾波器和數(shù)控放大器送往數(shù)字/模擬轉(zhuǎn)換器,從而形成最后的聲音。第68頁(yè),共98頁(yè),2024年2月25日,星期天由于一個(gè)物體不可能總是一成不變的振動(dòng),所以它的頻率和振幅都會(huì)隨著時(shí)間的改變而改變,并最終趨于靜止。我們把一聲音的發(fā)展過(guò)程分為四個(gè)階段,分別是觸發(fā)、衰減、保持和消失。這四個(gè)階段我們統(tǒng)稱(chēng)為“包絡(luò)”。包絡(luò)的發(fā)生時(shí)間,也決定了一個(gè)樂(lè)音的時(shí)值。第69頁(yè),共98頁(yè),2024年2月25日,星期天FM聲音合成器的工作原理由以下五部分組成:數(shù)字載波器調(diào)制器聲音包絡(luò)發(fā)生器數(shù)字運(yùn)算器數(shù)模轉(zhuǎn)換器第70頁(yè),共98頁(yè),2024年2月25日,星期天波形表合成(Wavetablesynthesis)也叫樂(lè)音樣本合成法,就是把各種真實(shí)樂(lè)器發(fā)出的聲音以數(shù)字的形式記錄下來(lái),形成波形表,播放時(shí)調(diào)用相應(yīng)樂(lè)器的波形記錄,改變播放速度,從而改變音調(diào)周期,生成各種音階的音符。
專(zhuān)業(yè)聲卡采用此方式。波形表一般存儲(chǔ)在聲卡的ROM中。ROM存儲(chǔ)器的容量越大,合成的效果越好,開(kāi)銷(xiāo)更大。產(chǎn)生豐富、逼真的音頻和音樂(lè)
第71頁(yè),共98頁(yè),2024年2月25日,星期天CoolEditPro2.0一款非常出色的音頻錄制、編輯、處理、混縮軟件第72頁(yè),共98頁(yè),2024年2月25日,星期天CoolEditPro2.0的中文界面標(biāo)題欄菜單欄工具欄狀態(tài)欄多軌編輯模式第73頁(yè),共98頁(yè),2024年2月25日,星期天CoolEditPro2.0的功能特點(diǎn)
CoolEditPro2.0軟件提供32-bit高精度音頻處理,支持視頻、CD、MIDI等設(shè)備。能方便地抓取CD音軌,也能抽取并編輯視頻文件中的音頻。
播放控制縮放控制當(dāng)前時(shí)間音節(jié)屬性所選部分和視圖中音頻屬性文件管理窗口調(diào)音窗口工具欄第74頁(yè),共98頁(yè),2024年2月25日,星期天CoolEditPro2.0支持單軌或多軌編輯模式,編輯時(shí)可互相切換。同時(shí)具有強(qiáng)大的音頻編輯功能,支持可選的插件、崩潰恢復(fù)、自動(dòng)靜音檢測(cè)和刪除、自動(dòng)節(jié)拍查找、錄制等??梢詣?chuàng)建音調(diào)、歌曲、聲音、弦樂(lè)、顫音、噪音。并在單軌和多軌編輯模式下,分別提供了不同的編輯功能。軟件還提供了音頻分析器和相位分析器。第75頁(yè),共98頁(yè),2024年2月25日,星期天多媒體音頻信號(hào)文件格式.wav●WAVE(WaveformAudio)波形音頻文件
多媒體系統(tǒng)、音樂(lè)光盤(pán)制作,記錄物理波形,數(shù)據(jù)量大WAV文件來(lái)源于對(duì)聲音模擬波形的采樣。用不同的采樣頻率對(duì)聲音的模擬波形進(jìn)行采樣,可以得到一系列離散的采樣點(diǎn);以不同的精度(8位或16位)把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制碼,然后存磁盤(pán),就產(chǎn)生了聲音的WAV文件,即波形文件。
●
WAV文件是由采樣數(shù)據(jù)組成的,所以它需要的存儲(chǔ)容量很大。一般情況下,WAV文件是不可能壓縮的。這是因?yàn)閃AV文件所記錄的音頻數(shù)字信息中很少有像圖像中存在的大量數(shù)據(jù)重復(fù)現(xiàn)象,一般數(shù)據(jù)壓縮算法很難有所作為,即使經(jīng)過(guò)壓縮,壓縮比也不高,壓縮結(jié)果也仍然需要很大的存儲(chǔ)空間。第76頁(yè),共98頁(yè),2024年2月25日,星期天MIDI(MusicalInstrumentDigitalInterface)樂(lè)器數(shù)字化接口,是數(shù)字音樂(lè)的工業(yè)標(biāo)準(zhǔn),是用于音樂(lè)合成器、樂(lè)器和計(jì)算機(jī)之間交換音樂(lè)信息的一種硬件和軟件國(guó)際標(biāo)準(zhǔn)。MIDI文件并沒(méi)有記錄任何聲音信息,而只是記載了用于描述樂(lè)曲演奏過(guò)程中的一系列指令,這些指令包含了音高、音長(zhǎng)、通道號(hào)等主要信息,并以擴(kuò)展名為.MID的文件格式存儲(chǔ)起來(lái)。MIDI文件只是將樂(lè)器彈奏的每個(gè)音符記錄為一連串?dāng)?shù)字,然后用聲卡上的合成器根據(jù)這個(gè)數(shù)字所代表的含義進(jìn)行合成,最后通過(guò)揚(yáng)聲器播放音樂(lè)。.mid●
MIDI(MusicalInstrument
Digital
Interface)樂(lè)器數(shù)字化接口。用于合成、游戲音樂(lè),記錄音符時(shí)值、頻率、音色特征,數(shù)據(jù)量小。WAV文件的優(yōu)點(diǎn)是可以從任何聲源錄制聲音,且可以保證它仍在任意一臺(tái)計(jì)算機(jī)上播放的效果大致相同,而MIDI文件則要受合成器中樂(lè)器組合的限制,其聲音質(zhì)量很大程度上取決于聲卡重新合成樂(lè)器聲音功能的強(qiáng)弱。相比之下,MIDI文件的錄制較復(fù)雜,這需要掌握一些使用MIDI創(chuàng)作編輯作業(yè)的專(zhuān)業(yè)知識(shí),并且還須有專(zhuān)門(mén)的工具。第77頁(yè),共98頁(yè),2024年2月25日,星期天MIDI消息,是指樂(lè)譜的數(shù)字描述,包括電子樂(lè)器鍵盤(pán)的彈奏的鍵名、力度、時(shí)值長(zhǎng)短等參數(shù)。任何電子樂(lè)器,只要有處理MIDI消息的微處理器和合適的硬件接口,就構(gòu)成了一個(gè)MIDI設(shè)備。當(dāng)一組MIDI消息通過(guò)音樂(lè)合成芯片處理時(shí),合成器能解釋這些符號(hào)并且產(chǎn)生音樂(lè)。第78頁(yè),共98頁(yè),2024年2月25日,星期天計(jì)算機(jī)上處理MIDI音樂(lè)的基本過(guò)程計(jì)算機(jī)中的MIDI文件通常來(lái)自于音樂(lè)創(chuàng)作軟件或合成音樂(lè)設(shè)備。許多播放器都能播放MIDI音樂(lè),播放時(shí)(如圖所示)需要從相應(yīng)的MIDI文件或設(shè)備中讀出MIDI指令,接著由MIDI文件系統(tǒng)解釋指令,然后通過(guò)MIDI播放器輸出和轉(zhuǎn)換信號(hào),再經(jīng)過(guò)聲音合成器生成對(duì)應(yīng)的聲音波形,最后經(jīng)放大后由揚(yáng)聲器輸出。圖5-8計(jì)算機(jī)中MIDI音樂(lè)的處理
圖計(jì)算機(jī)中MIDI音樂(lè)的處理過(guò)程第79頁(yè),共98頁(yè),2024年2月25日,星期天MIDI術(shù)語(yǔ)MIDI文件通道Channels音序器Sequencer合成器Synthesizer樂(lè)器Instrument通道映象ChannelMapping復(fù)音Polyphony音色Timbre音軌Track合成音色映射程序PatchMapper第80頁(yè),共98頁(yè),2024年2月25日,星期天MIDI的通道單個(gè)物理MIDI通道分為16個(gè)邏輯通道,每個(gè)邏輯通道可指定一種樂(lè)器。在MIDI消息中,用4個(gè)二進(jìn)制位來(lái)表示這16個(gè)邏輯通道。MIDI鍵盤(pán)可設(shè)置在16個(gè)通道中任何一個(gè),MIDI合成器可以被設(shè)置在指定的通道上接受。
第81頁(yè),共98頁(yè),2024年2月25日,星期天MIDI的物理接口標(biāo)準(zhǔn)MIDIIn(輸入口)接收從其他MIDI設(shè)備傳來(lái)的消息。MIDIOut(輸出口)發(fā)送某設(shè)備生成的原始MIDI消息。向其他設(shè)備發(fā)送MIDI消息。MIDIThru(轉(zhuǎn)發(fā)口)傳送從輸入口接收的消息到其他MIDI設(shè)備。在MIDI設(shè)備之間傳送消息。第82頁(yè),共98頁(yè),2024年2月25日,星期天各個(gè)MIDI設(shè)備通過(guò)專(zhuān)用的串行電纜(MIDI線)連接,并以31.25kbps(每字節(jié)10位-1位開(kāi)始位,8位數(shù)據(jù)位和1位停止位)的速度傳送著數(shù)字音樂(lè)信息。MIDIThruOutInMIDI1.0規(guī)范中,使用的MIDI接頭是一個(gè)5針DIN接頭。第83頁(yè),共98頁(yè),2024年2月25日,星期天MIDI是樂(lè)器和計(jì)算機(jī)使用的標(biāo)準(zhǔn)語(yǔ)言,是一套指令(命令/消息)的約定,它指示合成器(MIDI設(shè)備)要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號(hào),在MIDI電纜上傳送的不是聲音,而是動(dòng)作指令。第84頁(yè),共98頁(yè),2024年2月25日,星期天第85頁(yè),共98頁(yè),2024年2月25日,星期天MIDI設(shè)備的連接不妨把MIDI理解成一種局域網(wǎng),網(wǎng)絡(luò)的各個(gè)部分通過(guò)專(zhuān)用的串行電纜(MIDI線)連接,并以31.25kbps的速度傳送著數(shù)字音樂(lè)信息。第86頁(yè),共98頁(yè),2024年2月25日,星期天第87頁(yè),共98頁(yè),2024年2月25日,星期天Cakewalk
ProAudio
V9.03最著名和老牌的MIDI工具軟件,功能強(qiáng)大,可編輯、創(chuàng)作、調(diào)試MIDI音樂(lè)。第88頁(yè),共98頁(yè),2024年2月25日,星期天TT作曲大師TT作曲家1.2標(biāo)準(zhǔn)版是一個(gè)集簡(jiǎn)譜編曲、自動(dòng)伴奏和打印功能為一體的作曲軟件。
可以利用直觀的簡(jiǎn)譜方式進(jìn)行音樂(lè)編配,還可以選擇內(nèi)置的100種具有中國(guó)特色的伴奏風(fēng)格,迅速制作出音樂(lè)成品。通過(guò)導(dǎo)入和導(dǎo)出MIDI文件的功能,您可以方便的與其它音樂(lè)軟件相互配合,將樂(lè)曲進(jìn)行精細(xì)的再加工。智能的歌詞輸入功能,讓您輕松制作和打印中文歌曲。
第89頁(yè),共98頁(yè),2024年2月25日,星期天MIDI文件實(shí)際上是一張表格,就好比是一張樂(lè)譜,它描述了各種音符以及這些音符的播放及延時(shí),所以MIDI文件比WAV文件要小得多。例如,一段持續(xù)10余秒的立體聲音樂(lè),若用MIDI格式只需2KB的存儲(chǔ)空間,而以WAV格式存放則需2MB左右。由于MIDI文件比WAV文件要小得多,所以預(yù)先裝入MIDI文件比裝入WAV文件容易,這為設(shè)計(jì)多媒體項(xiàng)目和指定何時(shí)播放音樂(lè)帶來(lái)很大的靈活性。MIDI文件的主要缺點(diǎn)是處理語(yǔ)音能力差,缺乏重現(xiàn)自然語(yǔ)言的能力
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東酒店管理職業(yè)技術(shù)學(xué)院《俄語(yǔ)詞匯學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東交通職業(yè)技術(shù)學(xué)院《精密機(jī)械設(shè)計(jì)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工商職業(yè)技術(shù)大學(xué)《視覺(jué)形象識(shí)別設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 《如何對(duì)待批評(píng)》課件
- 培訓(xùn)課件-車(chē)輛消防安全知識(shí)培訓(xùn)
- 《新藥研發(fā)概論》課件
- 廣安職業(yè)技術(shù)學(xué)院《專(zhuān)業(yè)韓語(yǔ)1》2023-2024學(xué)年第一學(xué)期期末試卷
- 共青科技職業(yè)學(xué)院《人文采風(fēng)》2023-2024學(xué)年第一學(xué)期期末試卷
- 《素材卡通圖》課件
- 《性格分析與溝通》課件
- 2024-2025學(xué)年銅官山區(qū)數(shù)學(xué)三年級(jí)第一學(xué)期期末調(diào)研試題含解析
- ISO 56001-2024《創(chuàng)新管理體系-要求》專(zhuān)業(yè)解讀與應(yīng)用實(shí)踐指導(dǎo)材料之18:“7支持-7.1資源”(雷澤佳編制-2025B0)
- ISO 56001-2024《創(chuàng)新管理體系-要求》專(zhuān)業(yè)解讀與應(yīng)用實(shí)踐指導(dǎo)材料之17:“6策劃-6.6合作”(雷澤佳編制-2025B0)
- ISO 56001-2024《創(chuàng)新管理體系-要求》專(zhuān)業(yè)解讀與應(yīng)用實(shí)踐指導(dǎo)材料之16:“6策劃-6.5組織結(jié)構(gòu)”(雷澤佳編制-2025B0)
- GB/T 45016-2024發(fā)動(dòng)機(jī)附件帶傳動(dòng)系統(tǒng)機(jī)械式自動(dòng)張緊輪試驗(yàn)方法
- 南寧市三好學(xué)生主要事跡(8篇)
- 2024版玻璃幕墻工程材料采購(gòu)合同2篇
- 全國(guó)英語(yǔ)教師賽課一等獎(jiǎng)七年級(jí)上冊(cè)(人教2024年新編)《Unit 7 Happy Birthday》教學(xué)設(shè)計(jì)
- 2025年婦產(chǎn)科工作計(jì)劃
- JGJ46-2024 建筑與市政工程施工現(xiàn)場(chǎng)臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)
- 江西省2023-2024學(xué)年高二上學(xué)期期末教學(xué)檢測(cè)數(shù)學(xué)試題 附答案
評(píng)論
0/150
提交評(píng)論