版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、基本概念1 比特率:表示經(jīng)過編碼(壓縮)后的音頻數(shù)據(jù)每秒鐘需要用多少個比特來表示,單位常為kbps。2 響度和強(qiáng)度:聲音的主觀屬性響度表示的是一個聲音聽來有多響的程度。響度主要隨聲音的強(qiáng)度而變化,但也受頻率的影響??偟恼f,中頻純音聽來比低頻和高頻純音響一些。3 采樣和采樣率:采樣是把連續(xù)的時間信號,變成離散的數(shù)字信號。采樣率是指每秒鐘采集多少個樣本。nyquist采樣定律:采樣率大于或等于連續(xù)信號最高頻率分量的2倍時,采樣信號可以用來完美重構(gòu)原始連續(xù)信號。二、常見音頻格式1. wav格式,是微軟公司開發(fā)的一種聲音文件格式,也叫波形聲音文件,是最早的數(shù)字音頻格式,被windows平臺及其應(yīng)用
2、程序廣泛支持,壓縮率低。2. midi是musical instrument digital interface的縮寫,又稱作樂器數(shù)字接口,是數(shù)字音樂/電子合成樂器的統(tǒng)一國際標(biāo)準(zhǔn)。它定義了計算機(jī)音樂程序、數(shù)字合成器及其它電子設(shè)備交換音樂信號的方式,規(guī)定了不同廠家的電子樂器與計算機(jī)連接的電纜和硬件及設(shè)備間數(shù)據(jù)傳輸?shù)膮f(xié)議,可以模擬多種樂器的聲音。midi文件就是midi格式的文件,在midi文件中存儲的是一些指令。把這些指令發(fā)送給聲卡,由聲卡按照指令將聲音合成出來。3. mp3全稱是mpeg-1 audio layer 3,它在1992年合并至mpeg規(guī)范中。mp3能夠以高音質(zhì)、低采樣率對數(shù)字音頻
3、文件進(jìn)行壓縮。應(yīng)用最普遍。4. mp3pro是由瑞典coding科技公司開發(fā)的,其中包含了兩大技術(shù):一是來自于coding科技公司所特有的解碼技術(shù),二是由mp3的專利持有者法國湯姆森多媒體公司和德國fraunhofer集成電路協(xié)會共同研究的一項(xiàng)譯碼技術(shù)。mp3pro可以在基本不改變文件大小的情況下改善原先的mp3音樂音質(zhì)。它能夠在用較低的比特率壓縮音頻文件的情況下,最大程度地保持壓縮前的音質(zhì)。5. mp3pro是由瑞典coding科技公司開發(fā)的,其中包含了兩大技術(shù):一是來自于coding科技公司所特有的解碼技術(shù),二是由mp3的專利持有者法國湯姆森多媒體公司和德國fraunhofer集成電路協(xié)會
4、共同研究的一項(xiàng)譯碼技術(shù)。mp3pro可以在基本不改變文件大小的情況下改善原先的mp3音樂音質(zhì)。它能夠在用較低的比特率壓縮音頻文件的情況下,最大程度地保持壓縮前的音質(zhì)。6. wma (windows media audio)是微軟在互聯(lián)網(wǎng)音頻、視頻領(lǐng)域的力作。wma格式是以減少數(shù)據(jù)流量但保持音質(zhì)的方法來達(dá)到更高的壓縮率目的,其壓縮率一般可以達(dá)到1:18。此外,wma還可以通過drm(digital rights management)保護(hù)版權(quán)。7. realaudio是由real networks公司推出的一種文件格式,最大的特點(diǎn)就是可以實(shí)時傳輸音頻信息,尤其是在網(wǎng)速較慢的情況下,仍然可以較為流
5、暢地傳送數(shù)據(jù),因此realaudio主要適用于網(wǎng)絡(luò)上的在線播放?,F(xiàn)在的realaudio文件格式主要有ra(realaudio)、rm(realmedia,realaudio g2)、rmx(realaudio secured)等三種,這些文件的共同性在于隨著網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量,在保證大多數(shù)人聽到流暢聲音的前提下,令帶寬較寬敞的聽眾獲得較好的音質(zhì)。8. audible擁有四種不同的格式:audible1、2、3、4。a網(wǎng)站主要是在互聯(lián)網(wǎng)上販賣有聲書籍,并對它們所銷售商品、文件通過四種a 專用音頻格式中的一種提供保護(hù)。每一種格式主要考慮音頻源以及所使用的收聽的設(shè)備。格式1、2和 3采
6、用不同級別的語音壓縮,而格式4采用更低的采樣率和mp3相同的解碼方式,所得到語音吐辭更清楚,而且可以更有效地從網(wǎng)上進(jìn)行下載。audible 所采用的是他們自己的桌面播放工具,這就是audible manager,使用這種播放器就可以播放存放在pc或者是傳輸?shù)奖銛y式播放器上的audible格式文件9aac實(shí)際上是高級音頻編碼的縮寫。aac是由fraunhofer iis-a、杜比和at&t共同開發(fā)的一種音頻格式,它是mpeg-2規(guī)范的一部分。aac所采用的運(yùn)算法則與mp3的運(yùn)算法則有所不同,aac通過結(jié)合其他的功能 來提高編碼效率。aac的音頻算法在壓縮能力上遠(yuǎn)遠(yuǎn)超過了以前的一些壓縮算法
7、(比如mp3等)。它還同時支持多達(dá)48個音軌、15個低頻音軌、更多種采樣率和比特率、多種語言的兼容能力、更高的解碼效率??傊?,aac可以在比mp3文件縮小30%的前提下提供更好的音質(zhì)。10. ogg vorbis 是一種新的音頻壓縮格式,類似于mp3等現(xiàn)有的音樂格式。但有一點(diǎn)不同 的是,它是完全免費(fèi) 、開放和沒有專利限制的。vorbis 是這種音頻壓縮機(jī)制的名字,而ogg則是一個計劃的名字,該計劃 意圖設(shè)計 一個完全開放性的多媒體系統(tǒng)。vorbis也是有損壓縮,但通過使用更加先進(jìn)的聲學(xué)模型去減少損失,因此,同樣位速率(bit rate)編碼的ogg與mp
8、3相比聽起來更好一些。11. ape是一種無損壓縮音頻格式,在音質(zhì)不降低的前提下,大小壓縮到傳統(tǒng)無損格式 wav 文件的一半.12 .flac即是free lossless audio codec的縮寫,是一套著名的自由音頻無損壓縮編碼,其特點(diǎn)是無損壓縮。三、音頻編碼基本原理語音編碼致力于:降低傳輸所需要的信道帶寬,同時保持輸入語音的高質(zhì)量。語音編碼的目標(biāo)在于:設(shè)計低復(fù)雜度的編碼器以盡可能低的比特率實(shí)現(xiàn)高品質(zhì)數(shù)據(jù)傳輸。1 靜音閾值曲線:只在安靜環(huán)境下,人耳在各個頻率能聽到聲音的閾值。 2 臨界頻帶由于人耳對不同頻率的解析度不同,mpeg1/audio將22khz內(nèi)可感知的
9、頻率范圍,依不同編碼層,不同取樣頻率,劃分成2326個臨界頻帶。下圖列出理想臨界頻帶的中心頻率與頻寬。圖中可看到,人耳對低頻的解析度較好。
10、60; 圖53 頻域上的掩蔽效應(yīng):幅值較大的信號會掩蔽頻率相近的幅值較小的信號,如下圖: 4 時域上的遮蔽效應(yīng):在一個很短的時間內(nèi),若出現(xiàn)了2個聲音,spl(sound pressure level)較大的聲音會掩蔽spl較小的聲音。時域掩蔽效應(yīng)分前向掩蔽(pre-masking)和后向掩蔽(post-masking),其中post-masking的時間會比較長,約是pr
11、e-masking的10倍。 時域遮蔽效應(yīng)有助于消除前回音。四、編碼基本手段1 量化和量化器量化和量化器:量化是把離散時間上的連續(xù)信號,轉(zhuǎn)化成離散時間上的離散信號。常見的量化器有:均勻量化器,對數(shù)量化器,非均勻量化器。量化過程追求的目標(biāo)是:最小化量化誤差,并盡量減低量化器的復(fù)雜度(這2者本身就是一個矛盾)。(a)均勻量化器:最簡單,性能最差,僅適應(yīng)于電話語音。(b)對數(shù)量化器:比均勻量化器復(fù)雜,也容易實(shí)現(xiàn),性能比均勻量化器好。(c)non-uniform量化器:根據(jù)信號的分布情況,來設(shè)計量化器。信號密集的地方進(jìn)行細(xì)致的量化,稀疏的地方進(jìn)行粗略量化。2 語音編碼器語音編碼器分為三種類形
12、:(a)波形編器 ;(b)聲碼器 ;(c)混合編碼器 。波形編碼器以構(gòu)造出背景噪單在內(nèi)的模擬波形為目標(biāo)。作用于所有輸入信號,因此會產(chǎn)生高質(zhì)量的樣值并且耗費(fèi)較高的比特率。 而聲碼器 (vocoder)不會再生原始波形。這組編碼器 會提取一組參數(shù) ,這組參數(shù)被送到接收端,用來導(dǎo)出語音產(chǎn)生模形。聲碼器語音質(zhì)量不夠好?;旌暇幋a器,它融入了波形編碼器和聲器的長處。2.1 波形編碼器波形編碼器的設(shè)計常獨(dú)立于信號。所以適應(yīng)于各種信號的編碼而不限于語音。1 時域編碼a)pcm:pulse code modulation,是最簡單的編碼方式。僅僅是對信
13、號的離散和量化,常采用對數(shù)量化。b)dpcm:differential pulse code modulation,差分脈沖編碼,只對樣本之間的差異進(jìn)行編碼。前一個或多個樣本用來預(yù)測當(dāng)前樣本值。用來做預(yù)測的樣本越多,預(yù)測值越精確。真實(shí)值和預(yù)測值之間的差值叫殘差,是編碼的對象。 c)adpcm:adaptive differential pulse code m
14、odulation,自適應(yīng)差分脈沖編碼。即在dpcm的基礎(chǔ)上,根據(jù)信號的變化,適當(dāng)調(diào)整量化器和預(yù)測器,使預(yù)測值更接近真實(shí)信號,殘差更小,壓縮效率更高。(2)頻域編碼頻域編碼是把信號分解成一系列不同頻率的元素,并進(jìn)行獨(dú)立編碼。a)sub-band coding:子帶編碼是最簡單的頻域編碼技術(shù)。是將原始信號由時間域轉(zhuǎn)變?yōu)轭l率域,然后將其分割為若干個子頻帶,并對其分別進(jìn)行數(shù)字編碼的技術(shù)。它是利用帶通濾波器(bpf)組把原始信號分割為若干(例如m個)子頻帶(簡稱子帶)。將各子帶通過等效于單邊帶調(diào)幅的調(diào)制特性,將各子帶搬移到零頻率附近,分別經(jīng)過bpf(共m個)之后,再以規(guī)定的速率(奈奎斯特速率)對各子帶
15、輸出信號進(jìn)行取樣,并對取樣數(shù)值進(jìn)行通常的數(shù)字編碼,其設(shè)置m路數(shù)字編碼器。將各路數(shù)字編碼信號送到多路復(fù)用器,最后輸出子帶編碼數(shù)據(jù)流。對不同的子帶可以根據(jù)人耳感知模型,采用不同量化方式以及對子帶分配不同的比特數(shù)。b)transform coding:dct編碼。6 聲碼器channel vocoder:利用人耳對相位的不敏感。homomorphic vocoder:能有效地處理合成信號。formant vocoder:以用語音信號的絕大部分信息都位于共振峰的位置與帶寬上。linear predictive vocoder:最常用的聲碼器。7 混合編碼器波形編碼器試圖保留被編碼信號的波形,能以中等比特率(32kbps)提供高品質(zhì)語音,但無法應(yīng)用在低比特率場合。聲碼器試圖產(chǎn)生在聽覺上與被編碼信號相似的信號,能以低比特率提供可以理解的語音,但是所形成的語音聽起來不自然?;旌暇幋a器結(jié)合了2者的優(yōu)點(diǎn)。relp:在線性預(yù)測的基
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024政府采購評審專家考試真題庫及答案
- 網(wǎng)頁設(shè)計課程設(shè)計模板
- 疾字趣味識字課程設(shè)計
- 統(tǒng)編版七年級下冊語文《鄧稼先》教學(xué)設(shè)計1
- 文化傳媒行業(yè)營銷策略總結(jié)
- 電信行業(yè)薪資調(diào)研報告
- 旅游行業(yè)前臺接待工作總結(jié)
- 二年級班主任期中工作總結(jié)溫馨關(guān)懷成長陪伴
- 秘書工作的職業(yè)素養(yǎng)培養(yǎng)計劃
- 公園服務(wù)員工作內(nèi)容
- 學(xué)生公寓管理員培訓(xùn)
- 2024年中國電建集團(tuán)新能源開發(fā)有限責(zé)任公司招聘筆試參考題庫含答案解析
- (高清版)DZT 0203-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 稀有金屬類
- 《中小學(xué)消防安全教育:森林防火》課件模板
- 手術(shù)供應(yīng)室培訓(xùn)課件總結(jié)
- 亞馬遜衛(wèi)浴行業(yè)分析
- 發(fā)運(yùn)工作總結(jié)
- 地方蠶絲被質(zhì)量整改方案
- 2024年北京社會管理職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 腦出血病人的護(hù)理
- 神經(jīng)外科術(shù)后病人健康宣教
評論
0/150
提交評論