




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、研究音頻的本質(zhì),詳解各個(gè)音頻格式的區(qū)別總共分為6個(gè)部分,分別是wav格式的介紹,有損格式的介紹,無(wú)損壓縮格式的介紹,各音頻格式的頻譜分析,以及基于分析在音頻文件選擇上做的推薦,后添加有損壓縮格式的比較。1.wav音頻格式的三大參數(shù),及各參數(shù)對(duì)于音頻文件的含義wav文件有4個(gè)參數(shù),分別是采樣頻率,聲道數(shù),量化位數(shù),以及碼率共4個(gè)而這4個(gè)參數(shù)里最好理解的就是聲道數(shù),所以不對(duì)此參數(shù)進(jìn)行介紹那么我將要介紹的參數(shù)就是采樣頻率F,量化位數(shù)B,和碼率R采樣頻率在三個(gè)參數(shù)里面最重要的是采樣頻率,后面兩個(gè)參數(shù)都是基于在傳輸存儲(chǔ)過(guò)程中根據(jù)要求而得到的,唯獨(dú)采樣頻率,它是把模擬世界的信號(hào)帶到數(shù)字世界的橋梁。在講采樣
2、頻率前,我們可以先回憶一下我們初中時(shí)學(xué)拋物線時(shí)的情景。在初中時(shí),老師教我們畫(huà)拋物線時(shí),是用什么方法畫(huà)的?如果大家回想起來(lái)的話,就應(yīng)該記得,是5點(diǎn)法。是的,用5個(gè)點(diǎn)就可以近似的把拋物線給畫(huà)出來(lái)。音頻信號(hào)是啥呢?其實(shí)是余弦波,只是這個(gè)余弦波的頻率和幅值都是隨時(shí)間的變量而已。我們要對(duì)這個(gè)音頻信號(hào)進(jìn)行記錄,不可能把每一時(shí)刻的值都記錄,但是,我們可以參考畫(huà)拋物線的方法,用盡量少的點(diǎn)去精確的描繪這個(gè)音頻信號(hào)。而采樣頻率,它干的就是這個(gè)活,也就是一秒內(nèi)我們要記錄這個(gè)音頻信號(hào)多少個(gè)點(diǎn),就能近似精確的表達(dá)這個(gè)音頻信號(hào)。在信號(hào)處理,有這么一個(gè)定理,叫奈奎斯特定理。這個(gè)定理怎么得來(lái),你們不用知道,這個(gè)是信號(hào)處理專業(yè)
3、的人才需要知道。我們只需了解的是,這個(gè)定理它告訴我們,如果我們要精確的記錄一個(gè)信號(hào),我們的采樣頻率必須大于等于音頻信號(hào)的最大頻率的兩倍,記住,是最大頻率。 也就是F>=2*fmax。而在wav格式里,F(xiàn)=44.1kHz。我們知道,人耳的聽(tīng)音頻率范圍是20-20kHz,也就是說(shuō),如果我們要精確記錄這個(gè)音頻信號(hào),采樣頻率最低起碼是40kHz。這就是為啥是44.1kHz而不是其他的頻率 。量化位數(shù)雖然有了采樣頻率,我們可以精確記錄音頻信號(hào),然而,這些記錄過(guò)的音頻信號(hào)是模擬量,對(duì)于計(jì)算機(jī)而言,是無(wú)法處理的。講到這里,我們會(huì)出現(xiàn)一個(gè)新的概念,模擬量和數(shù)字量。模擬量和數(shù)字量是有區(qū)別的,我簡(jiǎn)單的介紹一
4、下。例如0-1這個(gè)范圍。一個(gè)線段內(nèi)我們可以任意的取一個(gè)點(diǎn),這個(gè)點(diǎn)的值可以確定,這個(gè)點(diǎn)的取值范圍可以確定,唯獨(dú)這個(gè)點(diǎn)的可取值的個(gè)數(shù)無(wú)法確定,這就是模擬量。一個(gè)可能取值個(gè)數(shù)無(wú)法確定的量,計(jì)算機(jī)是無(wú)法處理的。而數(shù)字量則是其余一樣,第三點(diǎn)不一樣,可取值的個(gè)數(shù)是可以確定的,這樣,計(jì)算機(jī)可以處理了。0-1這個(gè)范圍,根據(jù)精度要求,我們可以確定需要取值的個(gè)數(shù)。而量化位數(shù),這是干這活,確定音頻信號(hào)的一個(gè)記錄點(diǎn),它的取值的可能個(gè)數(shù)。我們知道,wav的量化位數(shù)B是16,這個(gè)是一個(gè)2進(jìn)制的位數(shù)。他告訴我們,一個(gè)記錄點(diǎn)可以取值的個(gè)數(shù)是2的16次方,也就是65536。(0-1-平分65536次,我想,這個(gè)精度也是夠了。)
5、 碼率現(xiàn)在,采樣頻率和量化精度都講了,輪到碼率。碼率是怎么得來(lái)的?非常簡(jiǎn)單,就是采樣頻率X量化位數(shù)X聲道數(shù),也就是R=F*B*2。R=44.1kHz*16b*2=1411.2kbps=1411kbps。碼率1411就是這么得來(lái)的,雖然碼率是通過(guò)計(jì)算得到,但是,他卻有一個(gè)確切的含義,就是一秒內(nèi)它能存儲(chǔ)的信息量,記住是信息量。講到這里,大家可能會(huì)聯(lián)想到,MP3的320kbps,aac的512kbps,無(wú)損壓縮格式的700+kbps。然后有人疑惑,是不是,碼率越大就越好?對(duì)于有損格式而言,那么,碼率越大是越好然而,這里有一個(gè)前提,被轉(zhuǎn)換的歌必須是從正版cd刻錄下來(lái)的無(wú)損格式,并且轉(zhuǎn)換是同一種有損格式
6、,例如都是MP3。不然,你用一個(gè)128kbs的MP3的歌轉(zhuǎn)成320kbps碼率的MP3,音質(zhì)是不會(huì)有改善的。對(duì)于無(wú)損壓縮格式而言,碼率的大小比較將沒(méi)有意義。碼率的大小只是告訴你,他的壓縮算法是否足夠好而已。碼率的意義也就這樣,他不能告訴你,這些保存的信息是好是壞,他只能告訴你,他存了這么多信息而已。是的,他其實(shí)是一個(gè)倉(cāng)庫(kù),他不管倉(cāng)庫(kù)里放的啥,他只管放滿沒(méi)。好了,到此,wav格式的三大參數(shù)都講完了,也許會(huì)有很多人疑惑,為啥先講wav這個(gè)這么古董的格式,而不是MP3啊aac啦這些有損格式,或者flac、ape這些無(wú)損壓縮格式。理由很簡(jiǎn)單,因?yàn)閣av是最接近模擬量的數(shù)字量,是最原始的數(shù)據(jù),后面的格式
7、都是基于wav根據(jù)自己的特色進(jìn)行處理而已。而且,上面講到的三個(gè)參數(shù),后面的格式依然用到。自然,先把wav這個(gè)老大先介紹咯。 2.有損格式的壓縮原理在這部分里以及后面的無(wú)損格式壓縮原理,不專門對(duì)某個(gè)格式講行介紹,而是介紹,這些格式是基于什么理念得到。當(dāng)我們了解wav格式三大參數(shù)的含義后,可能有人會(huì)疑惑,既然wav是最接近模擬量的數(shù)字格式,為啥還整來(lái)后面的有損格式和無(wú)損格式呢,直接wav多好啊。是的,直接wav很好,然而,他的碼率太大了。1411kbps,啥概念,就是說(shuō)一個(gè)10秒的音頻,居然要用到3.36MB去存儲(chǔ)!、在過(guò)去存儲(chǔ)技術(shù)不發(fā)達(dá)的年代,這個(gè)量太大了,讓人無(wú)法接收。因此,必須壓縮,必須把沒(méi)
8、用或者不重要的信息給去掉減少存儲(chǔ)量。因此,有損格式誕生了。 那么,有損格式又是基于什么原理得到的,接下來(lái)就是我將要講的內(nèi)容。對(duì)于一個(gè)音頻信號(hào)而言,他是一個(gè)時(shí)間相關(guān)的信號(hào),也就是說(shuō),前后兩個(gè)記錄點(diǎn),他們有時(shí)間上的順序。然而,對(duì)于計(jì)算機(jī)而言,處理與時(shí)間相關(guān)的信息,這個(gè)不是強(qiáng)項(xiàng)。因此,必須對(duì)這個(gè)兩個(gè)記錄點(diǎn)的信息進(jìn)行變換,變換成對(duì)時(shí)間順序無(wú)關(guān),彼此是獨(dú)立的一個(gè)信息。在這里,感謝早期那些數(shù)字信號(hào)處理的科學(xué)家,他們提供了這么個(gè)方法,就是快速傅里葉變換,簡(jiǎn)稱FFT。我們不需知道FFT是怎么來(lái)的,我們只需知道,一個(gè)信號(hào)經(jīng)過(guò)FFT變換后,這個(gè)信號(hào)變成與頻率相關(guān)的信息,而頻率相關(guān)的信息,是可以被計(jì)算機(jī)處理。我們可
9、以回想一下,音頻信號(hào)是一個(gè)個(gè)余弦波,處理一個(gè)余弦波無(wú)非是處理頻率、幅值,初相角。初相角我們不管,幅值和頻率這個(gè)在經(jīng)過(guò)FFT變換之后,就可以處理了。經(jīng)過(guò)FFT變換之后,如果用圖來(lái)表示,就是頻譜圖。頻譜圖:這個(gè)頻譜圖的橫坐標(biāo)就是頻率,縱坐標(biāo)是對(duì)應(yīng)頻率的增益,或者理解成強(qiáng)度也行。對(duì)于人耳而言,我們接受的音頻信號(hào)大部分都集中在中低頻部分,高頻部分我們相對(duì)不是那么敏感。既然這樣,我們就可以把不敏感的高頻部分,直接去掉,這樣,就減少了信息量,這是方法之一。還有另一個(gè),對(duì)于音頻信號(hào)而言,相鄰的幾個(gè)記錄點(diǎn),他們的取值范圍是非常接近的。既然非常接近,我們可以用一個(gè)平均值,以及取這個(gè)平均值的點(diǎn)的個(gè)數(shù)來(lái)記錄。舉個(gè)例
10、子,有5個(gè)記錄點(diǎn),0.45 0.446 0.461 0.45 0.447,我們可以用0.45(5)來(lái)記錄。這樣,記錄的信息量同樣少了,其實(shí)還有其他壓縮方法,但是,大概的意思是和上面兩種方法差不多,就不介紹了。 通過(guò)各種手法,我們把不需要的信息去掉,把不重要的信息用近似值代替,從而達(dá)到有損壓縮。、同樣用碼率這個(gè)參數(shù)做對(duì)比。同樣一個(gè)10秒音頻,經(jīng)過(guò)有損壓縮后,其碼率值為320kbp,則大小才787KB!為wav格式的五分之一!用盡量少的數(shù)據(jù),存儲(chǔ)盡量多有用的信息,有損格式做到了!這也是為啥有損格式流行起來(lái)的原因。 3.無(wú)損壓縮格式的壓縮原理隨著存儲(chǔ)技術(shù)的發(fā)展,我們可以存儲(chǔ)的信息量變得越來(lái)越大,存儲(chǔ)
11、wav格式變得“毫無(wú)壓力”了。既然毫無(wú)壓力,為啥要推出無(wú)損壓縮格式?理由很簡(jiǎn)單,既然我40MB可以存儲(chǔ)2首無(wú)損壓縮格式,為啥我還存儲(chǔ)1首wav格式,這不是跟自己過(guò)不去嘛。所以,無(wú)損壓縮格式發(fā)展起來(lái)了。無(wú)損壓縮格式和有損格式有個(gè)共同點(diǎn),就是壓縮。不同點(diǎn)是,無(wú)損。那么,要怎么才能做到無(wú)損壓縮呢,我們可以參考有損壓縮的第二個(gè)方法。舉個(gè)例子,同樣是5個(gè)記錄點(diǎn),0.4 0.4 0.5 0.5 0.3,如果要無(wú)損壓縮,我們只需這樣記錄0.4(2),0.5(2),0.3(1)。這樣,我們只需用三個(gè)記錄點(diǎn),就能記錄原來(lái)需要5個(gè)記錄點(diǎn),同樣壓縮了。而且,做到無(wú)損壓縮。這是其中一種思路,但是,他告訴我們,無(wú)損壓縮
12、對(duì)于信息處理而言,是可以做到的。要完整記錄一個(gè)音頻,不需用到wav格式,無(wú)損壓縮就行了。同樣用碼率這個(gè)參數(shù)做比較,一個(gè)10秒音頻,經(jīng)過(guò)無(wú)損壓縮后,碼率值為727kbps,大小為1.73MB。大概為wav的一半。大容量播放器支持無(wú)損壓縮格式,小容量播放器則玩轉(zhuǎn)有損格式,各有各的位置,技術(shù)發(fā)展確實(shí)是一件好事啊。經(jīng)常見(jiàn)到有人問(wèn)wav、flac和ape是不是有區(qū)別,那么我就在這里做個(gè)總結(jié)。經(jīng)過(guò)上面的算法原理介紹,我們可以了解到,如果單純從文件本身,wav和其他所有無(wú)損壓縮格式在保存的信息上是無(wú)區(qū)別的。經(jīng)常會(huì)看到有人問(wèn)無(wú)損格式相關(guān)的兩個(gè)問(wèn)題:無(wú)損壓縮格式之間有沒(méi)有區(qū)別和無(wú)損壓縮格式與wav有沒(méi)有區(qū)別。第
13、一個(gè)問(wèn)題,我現(xiàn)在就可以回答,有。但,區(qū)別不是在信息記錄的完整程,而是其壓縮算法以及算法所采用的格式的區(qū)別。這也是為啥,同一首歌,ape格式比f(wàn)lac小,因?yàn)樗惴ú煌?。至于音質(zhì)表現(xiàn)將會(huì)和第二個(gè)問(wèn)題一起,在第五部分講到4.音頻文件頻譜分析這一部分是對(duì)不同的音頻格式以及同一音頻格式不同的碼率進(jìn)行分析。專門為那些選擇哪種音頻格式而煩惱的人提供參考的。待分析的音頻格式有MP3,aac三種格式,無(wú)損格式作為參考格式。由于用fb轉(zhuǎn)換,MP3格式只有vbr模式和最高的cbr320。所以,可能與大家熟悉的碼率有所不同。不過(guò),我用括號(hào)標(biāo)明了其對(duì)應(yīng)的碼率值,是個(gè)大概值,不一定準(zhǔn),不過(guò)可以參考。MP3的碼率有VBR的
14、V5(130kbps)V2(190kbps)V0(245kbps)和CBR的320kbps。為了對(duì)應(yīng)MP3的VBR模式,aac同樣采用VBR模式aac的碼率有,q04(125kbps)q05(175kbps)q06(225kbps)q08(325kbps)q10(400bps)之所以這么選擇,是因?yàn)榇蠹伊?xí)慣的碼率值有128kbps 196kbps 256kbps 和320kbps。在選擇MP3的轉(zhuǎn)換模式時(shí)其參考碼率盡量靠近習(xí)慣碼率值。因?yàn)閍ac在編碼上比MP3優(yōu)秀得多,所以aac的轉(zhuǎn)換模式是轉(zhuǎn)換后的文件體積大小盡量接近MP3大小。至于來(lái)個(gè)q10模式,則是與無(wú)損壓縮格式做對(duì)比的。先來(lái)張各音頻格式
15、與對(duì)應(yīng)碼率的文件體積對(duì)比圖事先說(shuō)明,該音頻文件截取的是eason的十年(40s-60s)這段范圍,用的是網(wǎng)上下載的無(wú)損,截取軟件用goldwave。先來(lái)個(gè)體積分析。顯然,這里體積最小的是V5MP3(130kbps),對(duì)應(yīng)是的q04aac(125kbps)。第二檔次是V2MP3(192kbps)對(duì)應(yīng)q05aac(175kbps)。第三檔次是V0MP3(245kbps)對(duì)應(yīng)q08aac(225kbps)。第四檔次是cbrMP3(320kbps)與對(duì)應(yīng)的q08aac(325kbps)。最后是q10aac(400kbps)與對(duì)應(yīng)的flac。假設(shè)原盤是正版的,則其對(duì)應(yīng)的音質(zhì)檔次是低級(jí)、初級(jí)、中級(jí)、高級(jí)、
16、以及最高。先上最高級(jí)別的聲譜圖無(wú)損聲譜圖q10aac聲譜圖先說(shuō)明一下,橫坐標(biāo)是時(shí)間,縱坐標(biāo)是頻率,點(diǎn)的白色度程度是對(duì)應(yīng)時(shí)間與頻率的聲音強(qiáng)度。所以叫聲譜圖。通過(guò)對(duì)比,我們發(fā)現(xiàn),q10aac在聲音的頻率再現(xiàn)范圍與無(wú)損無(wú)差別,干到22kHz無(wú)壓力。但是聲音的頻率再現(xiàn)強(qiáng)度則有缺陷,在一些時(shí)間段的頻率聲音強(qiáng)度缺失下圖q10aac缺陷紅色圈住部分則是缺失的部分??梢钥闯?,q10aac在細(xì)節(jié)部分依然無(wú)法完美記錄(畢竟是有損),但是,從整體而言,其保留的信息已經(jīng)非常接近無(wú)損。(個(gè)人認(rèn)為,作為高保真的格式,高碼率aac是合格的。)然后是高級(jí)檔次的聲譜對(duì)比圖q08aac320MP3通過(guò)對(duì)比,我們可以發(fā)現(xiàn),320M
17、P3的聲譜就是一刀切,把高于20kHz的頻率都去掉,而q08aac則是干到22khz無(wú)鴨梨,在細(xì)節(jié)上,兩者都差不多,我就不上圖了,所以,這回合aac贏了。中級(jí)檔次聲譜對(duì)比圖q06aacv0mp3到了中級(jí)檔次,MP3格式在頻譜再現(xiàn)范圍達(dá)到19kHz,而aac則是18kHz。在聲音細(xì)節(jié)方面,兩者基本差不多,這回合,是MP3格式勝了。初級(jí)檔次聲譜圖q05aacv2mp3在初級(jí)檔次,MP3格式的頻率平均在16kHz,不少能上到18kHz,而aac格式,同樣如此。但是,在細(xì)節(jié)呈現(xiàn)方面,aac超過(guò)16kHz的聲音比MP3多得多。而低于16kHz部分,兩者差不多。所以說(shuō),這回合aac贏了。低級(jí)檔次q04aa
18、cv5mp3在低級(jí)檔次,MP3是一刀切的到16kHz,而aac則是平均16kHz下不少能干到17kHz。低于16kHz部分,aac記錄的反而沒(méi)有MP3完整。個(gè)人認(rèn)為,這回合打和。通過(guò)這次對(duì)比,我們可以發(fā)現(xiàn)MP3與aac在有損壓縮的理念區(qū)別,MP3是在他能記錄的頻率范圍內(nèi),盡量保留。而aac則是犧牲低頻部分細(xì)節(jié)去換取高頻部分的保留,在低碼率下,誰(shuí)好誰(shuí)不好看個(gè)人選擇。到了高碼率下,aac則明顯優(yōu)于MP3,無(wú)論在低頻部分還是高頻部分,aac都能盡量保留,而MP3則對(duì)高頻部分依然無(wú)能為力。5.音頻格式選擇的個(gè)人推薦在第三部分,我曾經(jīng)提了兩個(gè)問(wèn)題,無(wú)損壓縮格式之間的音質(zhì)區(qū)別以及wav與無(wú)損壓縮格式的區(qū)別
19、,在這里我將解答在第四部分,我們通過(guò)聲譜圖對(duì)比了解到有損音頻格式的優(yōu)缺點(diǎn),為下面的有損格式選擇做下鋪墊不過(guò),在對(duì)第三部分的解答和做格式推薦前,我想先介紹一下音頻在播放時(shí)的流程圖wav格式:wav數(shù)據(jù)流DAC濾波電路放大電路輸出有損格式:有損數(shù)據(jù)流解碼DAC濾波電路放大電路輸出無(wú)損壓縮格式:無(wú)損壓縮數(shù)據(jù)流解壓縮DAC濾波電路放大電路輸出說(shuō)明:DAC的作用是把數(shù)字信號(hào)變成模擬信號(hào),濾波電路是把無(wú)用的頻率成分去掉,放大電路這是對(duì)模擬信號(hào)進(jìn)行放大,以便于輸出通過(guò)播放流程圖,我們可以看到,wav格式的播放是最簡(jiǎn)單的,而有損格式和無(wú)損壓縮格式都多了一個(gè)步驟。在信號(hào)處理里面,有這么一句話“誤差無(wú)處不在”。這
20、一句話的含義是,每多一步的處理,誤差產(chǎn)生的可能性會(huì)越大以及誤差的積累可能會(huì)越多。對(duì)于有損格式而言,在格式上本來(lái)對(duì)于無(wú)損格式唯一的優(yōu)點(diǎn)就是壓縮率足夠大,而這個(gè)壓縮率是以犧牲音質(zhì)為前提,音質(zhì)不如無(wú)損,正常。那些提問(wèn)“ape和flac是否有區(qū)別,wav是不是比無(wú)損壓縮格式更好”的人,我現(xiàn)在一一做出解答在回答前,我們先對(duì)比無(wú)損壓縮格式和wav的播放流程,可以看到,無(wú)損壓縮格式比wav多了一個(gè)“解壓縮”這個(gè)步驟。對(duì)于不同的無(wú)損壓縮格式而言,解壓縮的算法也是不同的。那些說(shuō)wav比無(wú)損壓縮格式好的人,他們的看法有合理之處。為啥我會(huì)這么說(shuō),不是說(shuō)無(wú)損壓縮嘛,既然無(wú)損,就應(yīng)該無(wú)區(qū)別。是的,在文件的信息完整度上而
21、言,沒(méi)錯(cuò),wav和其他無(wú)損壓縮格式都沒(méi)有任何區(qū)別!有區(qū)別不是在文件本身,而是播放過(guò)程!因?yàn)闊o(wú)損壓縮格式在播放的過(guò)程中走的步驟比wav格式多了一個(gè)!那就是解壓縮!假設(shè)我們可以保證后面的DAC、濾波電路、放大電路兩者是一樣的,然而,多了解壓縮的這個(gè)步驟,則可能對(duì)音質(zhì)產(chǎn)生影響。為啥我要這么說(shuō),解壓縮可能會(huì)對(duì)音質(zhì)產(chǎn)生影響。產(chǎn)生影響的原理我不清楚,不過(guò),可以參照之前說(shuō)的,誤差無(wú)處不在。意味著,解壓縮這個(gè)步驟,其產(chǎn)生的誤差有可能對(duì)整體的音質(zhì)造成影響。至于這個(gè)影響是否能忽略,就看生產(chǎn)商的功力了。同樣,那些無(wú)損壓縮格式在最終的音質(zhì)區(qū)別看的也不是格式本身,而是這個(gè)“解壓縮”做的是否足夠好,好到忽視誤差的影響。有
22、了上面播放的流程的介紹,還有第四部分的聲譜分析,我們就可以根據(jù)使用的環(huán)境,進(jìn)行格式推薦。不在乎音頻文件體積大小的,追求音質(zhì)的,首選當(dāng)然是無(wú)損格式。如果你的前端能支持無(wú)損壓縮格式,而你的播放系統(tǒng)能聽(tīng)出wav和無(wú)損壓縮格式的差距(就是說(shuō)解壓縮的誤差你能聽(tīng)出來(lái)),上wav。不然,上無(wú)損壓縮格式。在乎音頻文件體積大小的,又追求音質(zhì)的,上高碼率aac。不過(guò),這里有個(gè)前提,你的播放系統(tǒng)得能聽(tīng)出高碼率aac與320MP3的區(qū)別,不然,還是乖乖的上MP3,別折騰。不在意音質(zhì)的,上MP3就行了。這里都有一個(gè)大前提,這些音頻文件都是由真無(wú)損轉(zhuǎn)的,而不是假無(wú)損轉(zhuǎn)的。不然,換個(gè)大倉(cāng)庫(kù),里面存的東西依然垃圾。后記:總算
23、把這篇音頻格式研究文搞定,不過(guò),得感謝學(xué)院里的老師,聽(tīng)歌去了6.有損壓縮格式的比較AAC、mp3、wma、ogg格式比較AAC實(shí)際上是高級(jí)音頻編碼的縮寫(xiě),目前已經(jīng)有不少的MP3、mp4支持這一種格式。AAC是由Fraunhofer IIS-A、杜比和AT&T共同開(kāi)發(fā)的一種音頻格式,它是MPEG-2規(guī)范的一部分。AAC所采用的運(yùn)算法則與MP3的運(yùn)算法則有所不同,AAC通過(guò)結(jié)合其他的功能 來(lái)提高編碼效率。AAC的音頻算法在壓縮能力上遠(yuǎn)遠(yuǎn)超過(guò)了以前的一些壓縮算法(比如MP3等)。它還同時(shí)支持多達(dá)48個(gè)音軌、15個(gè)低頻音軌、更多種采樣率和比特率、多種語(yǔ)言的兼容能力、更高的解碼效率??傊珹AC
24、可以在比MP3文件縮小30%的前提下提供更好的音質(zhì)。AAC(高級(jí)音頻編碼技術(shù) Advanced Audio Coding),出現(xiàn)于1997年,是基于MPEG-2的音頻編碼技術(shù)。由Fraunhofer IIS、杜比、蘋果、AT&T、索尼等公司共同開(kāi)發(fā),以取代mp3格式。2000年,MPEG-4標(biāo)準(zhǔn)出臺(tái),AAC從新整合了其特性,故現(xiàn)又稱MPEG-4 AAC,即m4a。 作為一種高壓縮比的音頻壓縮算法,AAC通常壓縮比為18:1,也有資料說(shuō)為20:1,遠(yuǎn)勝mp3,而音質(zhì)由于采用多聲道,和使用低復(fù)雜性的描述方式,使其比幾乎所有的傳統(tǒng)編碼方式在同規(guī)格的情況下更勝一籌。不過(guò)直到2006年,使用這一
25、格式儲(chǔ)存音頻的并不多,可以播放該格式的mp3播放器更是少之又少,目前所知僅有蘋果iPod,而手機(jī)支持AAC的相對(duì)要多一些,此外電腦上很多音頻播放軟件都支持AAC格式。aac與mp3對(duì)比:AAC是在MP3基礎(chǔ)上開(kāi)發(fā)出來(lái)的,所以兩者的編碼系統(tǒng)有一些相同之處。但是對(duì)比一下兩者的編碼流程圖,你會(huì)發(fā)現(xiàn)AAC的編碼工序更為復(fù)雜。 (1)AAC和MP3的關(guān)鍵性不同:濾波器組(Filter bank):時(shí)域噪音修整(Temporal Noise Shaping,TNS):這項(xiàng)神奇的技術(shù)可以通過(guò)在頻率域上的預(yù)測(cè),來(lái)修整時(shí)域上的量化噪音的分布。在一些特殊的語(yǔ)音和劇烈變化信號(hào)的量化上,TNS技術(shù)對(duì)音質(zhì)的提高貢獻(xiàn)巨大
26、!預(yù)測(cè)(Prediction):對(duì)音頻信號(hào)進(jìn)行預(yù)測(cè)可以減少重復(fù)冗余信號(hào)的處理,提高效率。量化(Quantization):AAC的量化過(guò)程是使用兩個(gè)巢狀循環(huán)進(jìn)行反復(fù)運(yùn)算。通過(guò)對(duì)量化分析的良好控制,比特率能夠被更高效地利用。比特流格式(Bitstream format):在AAC中,信息的傳輸都要經(jīng)過(guò)熵編碼,以保證冗余盡可能少。此外AAC擁有一個(gè)彈性的比特流結(jié)構(gòu),使得編碼效率進(jìn)一步提高。長(zhǎng)時(shí)期預(yù)測(cè)(Long Term Prediction,LTP):這是一個(gè)MPEG4 AAC中才有的工具,它用來(lái)減少連續(xù)兩個(gè)編碼音框之間的信號(hào)冗余,對(duì)于處理低碼率的語(yǔ)音非常有效。知覺(jué)噪音代替(Perceptual
27、Noise Substitution,PNS):這也是MPEG4 AAC中才有的工具,當(dāng)編碼器發(fā)現(xiàn)類似噪音的信號(hào)時(shí),并不對(duì)其進(jìn)行量化,而是作個(gè)標(biāo)記就忽略過(guò)去,當(dāng)解碼時(shí)再還原出來(lái),這樣就提高了效率。(2)AAC的特點(diǎn):提升的壓縮率:可以以更小的文件大小獲得更高的音質(zhì);支持多聲道:可提供最多48個(gè)全音域聲道;更高的解析度:最高支持96KHz的采樣頻率;提升的解碼效率:解碼播放所占的資源更少; 關(guān)于MP3: MP3本來(lái)就是丟高頻,損細(xì)節(jié)的壓縮方法.尤其是音場(chǎng),由于是JOINT STEREO,明顯被壓窄了.后來(lái)的MP3 PRO就是專門解決高頻的,不過(guò)沒(méi)流行起來(lái). MP3實(shí)在太流行,加上很多人的耳朵并不
28、像我們這么挑剔,不像WMA存在版權(quán)問(wèn)題,于是MP3就活到了今天,任你什么MP4,OGG,VQF,WMA等等都拿它沒(méi)辦法. 關(guān)于wma:WMA的全稱是Windows Media Audio,它是微軟公司推出的與MP3格式齊名的一種新的音頻格式。由于WMA在壓縮比和音質(zhì)方面都超過(guò)了MP3,更是遠(yuǎn)勝于RA(Real Audio),即使在較低的采樣頻率下也能產(chǎn)生較好的音質(zhì)。一般使用Windows Media Audio編碼格式的文件以WMA作為擴(kuò)展名,一些使用Windows Media Audio編碼格式編碼其所有內(nèi)容的純音頻ASF文件也使用WMA作為擴(kuò)展名。 WMA在技術(shù)上遠(yuǎn)比MP3先進(jìn),96KBP
29、S就比128KBPS的MP3強(qiáng),支持?jǐn)?shù)字簽名防盜版,支持樓主說(shuō)的TAG等,最新的WMA甚至還支持5.1。在64kbps的數(shù)據(jù)速率時(shí),在13000-20000Hz頻率段就能保留了大部分信息。 但64kbps的WMA的低頻表現(xiàn)實(shí)在有點(diǎn)令人失望,聽(tīng)上去比較硬,如同加入了哇聲效果一般,感覺(jué)非常不好,當(dāng)然比同比特64K的mp3要好感覺(jué)聲音更集中。聽(tīng)覺(jué)上64WMA的表現(xiàn)基本接近128kbps mp3的音質(zhì)水平,但沒(méi)有達(dá)到。96K的wma略好于128K的mp3,WMA在高于128以上的各種比特率表現(xiàn)相差不大,高頻和泛音都很豐富,一般人聽(tīng)不出WMA128Kbps以上的音質(zhì)和音色的差異,總體感覺(jué)WMA的聲音偏硬,適合流行搖滾,如果是古典或者純?nèi)寺暤脑?感覺(jué)有點(diǎn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 淋巴專業(yè)培訓(xùn)
- 基于課程標(biāo)準(zhǔn)的教學(xué)設(shè)計(jì)
- 胃竇粘膜下腫瘤護(hù)理查房
- 2025中考化學(xué)知識(shí)點(diǎn)梳理
- 肖像權(quán)有關(guān)必回法律知識(shí)
- 18-三體綜合征的健康宣教
- 2025企業(yè)與個(gè)體工商戶合作合同
- 2025建設(shè)用地使用權(quán)出讓合同模板
- 化膿性盆腔血栓靜脈炎的健康宣教
- 原發(fā)性血小板增多癥的健康宣教
- 血液透析瘙癢癥的發(fā)病機(jī)制及藥物治療(2024)解讀
- DGTJ08-2002-2006上海懸挑式腳手架安全技術(shù)規(guī)程
- 2023年河北省普通高中學(xué)業(yè)水平12月會(huì)考物理試題(含答案解析)
- 2024年蘇州市軌道交通集團(tuán)有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 網(wǎng)絡(luò)營(yíng)銷:推廣與策劃(第3版 慕課版)課件 項(xiàng)目三感悟網(wǎng)絡(luò)營(yíng)銷策略(知識(shí)基石)
- 動(dòng)物的遷徙行為與地球生態(tài)系統(tǒng)
- LY-T 3332-2022 森林保險(xiǎn)查勘定損技術(shù)規(guī)程
- 總成修理工安全操作規(guī)程
- 2025年日歷日程表含農(nóng)歷可打印
- 校園金話筒大賽(臨沂賽區(qū))策劃書(shū)
- 讀書(shū)分享讀書(shū)交流會(huì)《朝聞道》劉慈欣科幻小說(shuō)讀書(shū)分享
評(píng)論
0/150
提交評(píng)論