四川大學(xué)計算機學(xué)院多媒體基礎(chǔ)MPEG聲音1_第1頁
四川大學(xué)計算機學(xué)院多媒體基礎(chǔ)MPEG聲音1_第2頁
四川大學(xué)計算機學(xué)院多媒體基礎(chǔ)MPEG聲音1_第3頁
四川大學(xué)計算機學(xué)院多媒體基礎(chǔ)MPEG聲音1_第4頁
四川大學(xué)計算機學(xué)院多媒體基礎(chǔ)MPEG聲音1_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多媒體技術(shù)基礎(chǔ)1MPEG聲音一、MPEG-1Audio

二、MPEG-2Audio三、MPEG-2ACC四、MPEG-4Audio2MPEG-1Audio、MPEG-2Audio、MPEG-2ACC聲音數(shù)據(jù)壓縮編碼——感知聲音編碼(perceptualaudiocoding)利用人的聽覺系統(tǒng)的感知特性來達到壓縮聲音數(shù)據(jù)的目的不同于與波形聲音壓縮編碼(如ADPCM)和參數(shù)編碼(如LPC):依據(jù)波形本身的相關(guān)性和模擬人的發(fā)音器官的特性)MPEG聲音3對響度的感知

“聽閾—頻率”曲線MPEG聲音4對音高的感知“音高—頻率”曲線MPEG聲音5掩蔽效應(yīng)一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音的現(xiàn)象頻域掩蔽一個強純音會掩蔽在其附近同時發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時掩蔽時域掩蔽在時間上相鄰的聲音之間的掩蔽現(xiàn)象。兩種時閾掩蔽:超前掩蔽和滯后掩蔽MPEG聲音6心理聲學(xué)模型(psychoacousticmodel)聽覺閾值電平聽覺閾值的大小隨聲音頻率的改變而改變,各個人的聽覺閾值也不同。(大多數(shù)人2kHz~5kHz)一個人是否能聽到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽覺閾值。聽覺掩飾特性聽覺閾值電平是自適應(yīng)的,即聽覺閾值電平會隨聽到的不同頻率的聲音而發(fā)生變化。MPEG聲音7MPEGAudio采用的兩種感知編碼:感知子帶編碼(perceptualsub-bandcoding)思想是首先把時域中的聲音數(shù)據(jù)變換到頻域,對頻域內(nèi)的子帶分量分別進行量化和編碼,然后根據(jù)心理聲學(xué)模型確定樣本的精度,從而達到壓縮數(shù)據(jù)量的目的。不局限于只對話音進行編碼,也不局限于哪一種聲源。DolbyAC-3編碼MPEG聲音8感知子帶編碼壓縮算法框圖MPEG-1Audio9DolbyAC-3壓縮編碼算法框圖MPEG-1Audio10MPEG聲音編碼器結(jié)構(gòu)圖MPEG-1Audio11MPEG聲音解碼器結(jié)構(gòu)圖MPEG-1Audio12ISO/MPEGaudio層1和層2編碼器和解碼器的結(jié)構(gòu)MPEG-1Audio13ISO/MPEGaudio層3編碼器和解碼器的結(jié)構(gòu)MPEG-1Audio14MPEG-1和-2的聲音數(shù)據(jù)規(guī)格參數(shù)名稱LinearPCMDolbyAC-3MPEG-2AudioMPEG-1Audio采用頻率48/96kHz32/44.1/48kHz16/22.05/24/32/44.1/48kHz32/44.1/48kHz樣本精度

(每個樣本的比特數(shù))16/20/24壓縮(16bits)壓縮(16bits)16最大數(shù)據(jù)傳輸率6.144Mb/s448kb/s8~640kb/s32~448kb/s最大聲道數(shù)85.15.1/7.12MPEG-2Audio15MPEG-2AAC(Advancedaudiocoding)編碼思想:主要使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個子帶中,用全局信號把噪聲掩蔽掉。與MPEG-1聲音格式不兼容

適用范圍:AAC支持的采用頻率可從8kHz到96kHzAAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。(AAC標準可支持48個主聲道、16個低頻音效加強通道LFE(lowfrequencyeffects)、16個配音聲道(overdubchannel)或者叫做多語言聲道(multilingualchannel)和16個數(shù)據(jù)流。)MPEG-2AAC16MPEG-2AAC(Advancedaudiocoding)壓縮率:MPEG-2AAC壓縮比為11:1(即每個聲道的數(shù)據(jù)率為(44.1×16)/11=64kb/s)。在5個聲道的總數(shù)據(jù)率為320kb/s的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別。與MPEG的層2相比,MPEG-2AAC的壓縮率可提高1倍,而且質(zhì)量更高;與MPEG的層3相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。MPEG-2AAC17MPEG-2AAC的配置開發(fā)MPEG-2AAC標準采用模塊化的方法:把整個AAC系統(tǒng)分解成一系列模塊,用標準化的AAC工具(advancedaudiocodingtools)對模塊進行定義(MPEGAudio標準是對整個系統(tǒng)進行標準化)AAC標準定義了三種配置:基本配置低復(fù)雜性配置可變采樣率配置MPEG-2AAC18MPEG-2AACMPEG-2AAC編碼器框圖19MPEG-2AAC解碼器框圖MPEG-2AAC20MPEG-4Audio標準:集成從話音~高質(zhì)量的多通道聲音;從自然聲音~合成聲音編碼方法:參數(shù)編碼(parametriccoding)碼激勵線性預(yù)測(codeexcitedlinearpredictive,CELP)編碼時間/頻率T/F(time/frequency)編碼結(jié)構(gòu)化聲音SA(structuredaudio)編碼合成聲音:MIDI;TTSMPEG-4Audio21自然聲音

(naturalaudio)MPEG-4聲音編碼器支持數(shù)據(jù)率2kb/s~64kb/s之間的自然聲音。三種類型聲音編碼器:

MPEG-4Audio221、參數(shù)編碼器

參數(shù)編碼提供了兩種編碼工具:HVXC和HILN。

諧音矢量激勵編碼HVXC(HarmonicVectorXcitationCoding)編碼工具允許對語言信號在2kbit/s和4kbit/s之間進行可分級性編碼。

諧音和獨立線性加性噪聲HILN(HarmonicandIndividualLine

plus

Noise)編碼工具允許對非語言信號,例如音樂以4kbit/s和更高的碼率進行編碼。HILN支持在速度、音調(diào)、碼率和復(fù)雜度上的可分級性。可以將HVXC和HILN聯(lián)合起來使用以獲得更寬范圍內(nèi)的信號和碼率。可以在兩者編碼器的輸出之間動態(tài)地切換或混合。MPEG-4Audio232、CELP編碼器

CELP的解碼器包括一個激勵源、一個合成濾波器和一個需要時添加的后置濾波器。

激勵源擁有兩種分量,一是由自適應(yīng)碼書產(chǎn)生的周期分量,另一個是由一個或多個固定碼書產(chǎn)生的隨機分量。在解碼器中,使用碼書索引和增益索引來重建激勵信號。激勵信號接著通過線性預(yù)測合成濾波器,最后,為了獲得增強的語言質(zhì)量,可以使用后置濾波器。CELP支持兩種采樣率:8kHz和16kHz輸出數(shù)據(jù)率6~24kb/sMPEG-4Audio243、T/F編碼器(時間-頻率(time-to-frequency,T/F)技術(shù))當碼率為每聲道64kbit/s時就是MPEG-2

AAC編碼標準,此時可以獲得極好的音頻質(zhì)量。

比特分片算述編碼BSAC(the

bit-sliced

arithmetic

coding),作為一種無噪聲編碼它能提供從16kbit/s至64kbit/s之間以1kbit/s的步率實現(xiàn)碼率的分可級性。變換域加權(quán)插入矢量量化TwinVQ作為一種無噪聲編碼和量化工具也是一種選擇,它使用線性預(yù)測編碼(LPC)模型來定義量化器步階,對插入和量化的頻譜系數(shù)進行矢量量化,特別適用于需要碼率可分級性和強糾錯的系統(tǒng)中。

MPEG-4Audio25MPEG-4Audio編碼方框圖MPEG-4Audio26文-語轉(zhuǎn)換TTS(tex

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論