版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
本文格式為Word版,下載可任意編輯——數(shù)字音頻作業(yè)及其答案第一次作業(yè):
1:、聲音可分為兩種:純音和復(fù)合音,平常人們說話的聲音屬于哪一種?語音的頻率范圍是多少?音頻尋常包括哪幾種聲音信號?其頻率范圍是多少?2、請說明音頻信號數(shù)字化的三個步驟?3、如何理解“量化是信號數(shù)字化過程中重要的一步,而這一過程又是引入噪聲的主要根源〞這句話的含義?通過哪些途徑可以減小量化誤差?
4對雙極性信號若采用均勻量化,則量化信噪比SNR與量化比特數(shù)之間的關(guān)系為:SNR=6.02xN+1.76dB,試分析此式對實際量化與編碼的指導(dǎo)意義?5:、A/D、D/A轉(zhuǎn)換器的技術(shù)指標(biāo)有哪些?
答:1:人們說話的聲音為復(fù)合音,語言的頻率范圍為300HZ-3000HZ。音頻暴多語音、音樂、效果聲等聲音信號,頻率范圍為20HZ-20KHZ。
2:1取樣:對連續(xù)信號按一定的時間間隔取樣。奈奎斯特取樣定理認(rèn)為,只要取樣頻率大于等于信號中所包含的最高頻率的兩倍,則可以根據(jù)其取樣完全恢復(fù)出原始信號,這相當(dāng)于當(dāng)信號是最高頻率時,每一周期至少要采取兩個點。但這只是理論上的定理,在實際操作中,人們用混疊波形,從而使取得的信號更接近原始信號。2量化:取樣的離散音頻要轉(zhuǎn)化為計算機能夠表示的數(shù)據(jù)范圍,這個過程稱為量化。量化的等級取決于量化精度,也就是用多少位二進制數(shù)來表示一個音頻數(shù)據(jù)。一般有8位,12位或16位。量化精度越高,聲音的保真度越高。以8位的舉例稍微說明一下其中的原理。若一臺計算機能夠接收八位二進制數(shù)據(jù),則相當(dāng)于能夠接受256個十進制的數(shù),即有256個電平數(shù),用這些數(shù)來代表模擬信號的電平,可以有256種,但是實際上采樣后的某一時刻信號的電平不一定和256個電平某一個相等,此時只能用最接近的數(shù)字代碼表示取樣信號電平。3編碼:對音頻信號取樣并量化成二進制,但實際上就是對音頻信號進行編碼,但用不同的取樣頻率和不同的量化位數(shù)記錄聲音,在單位時間中,所需存貯空間是不一樣的。波形聲音的主要參數(shù)包括:取樣頻率.量化位數(shù).聲道數(shù).壓縮編碼方案和數(shù)碼率等,未壓縮前,波形聲音的碼率計算公式為:波形聲音的碼率=取樣頻率*量化位數(shù)*聲道數(shù)/8。波形聲音的碼率一般比較大,所以必需對轉(zhuǎn)換后的數(shù)據(jù)進行壓縮。3:量化是按四舍五入對采樣的樣本值進行計量的,這個過程會產(chǎn)生誤差可對噪聲進行整形,提高采樣頻率等方法減小量化誤差
4:量化比特數(shù)增加一位,則信噪比提高6dB,信噪比提高意味著聲音動態(tài)范圍的加寬,若采用量化比特N=16的A/D變換器的數(shù)字聲記錄在磁帶上可以擴展到98dB,接近于交響樂動態(tài)范圍,若將量化比特提高到N=20,可擴至人兒的122dB動態(tài)范圍。
5:A/D的技術(shù)指標(biāo)有:分辯率、轉(zhuǎn)換速率、量化誤差、偏移誤差、滿刻度誤差和線性度誤差等。D/A轉(zhuǎn)換器的技術(shù)指標(biāo)有:分辯率和建立時間。其次次作業(yè):
1.什么叫最小可聞閾?什么叫掩蔽閾?什么叫頻域掩蔽?什么叫時域掩蔽?掩蔽效應(yīng)的一般規(guī)律是什么?
2.何謂臨界頻帶?簡述它在音頻編碼中的應(yīng)用。
3.音頻編碼尋常分為哪幾類?它們各有什么優(yōu)缺點?
4.聲音壓縮的依據(jù)是什么?MPEG-1音頻編碼利用了聽覺系統(tǒng)的什么特性?
5.子帶編碼的基本思想是什么?進行子帶編碼的好處是什么?6.在MUSICAM的MPEGLayerI編碼器的比特分派中,請讀/寫出32位“標(biāo)題〞:11111111111100101101000101011101所表示的信息。7.什么叫做5.1聲道環(huán)繞立體聲?
8.MUSICAM音頻比特流數(shù)據(jù)幀中的比例因子起什么作用?
9.簡述杜比AC-3的音頻編碼原理,并比較AC-3與MPEG2(AAC)音頻編碼的異同。10.怎樣理解AC-3的音頻編碼中的“指數(shù)〞、“尾數(shù)〞、“指數(shù)策略〞?
11.MPEG-4音頻編碼有何特點?MPEG-4音頻編碼標(biāo)準(zhǔn)具有良好的發(fā)展前景,主要表達在哪些方面?答:
1、最小可聞閾:等響度曲線中的0方曲線以下區(qū)域為不可聞區(qū),他表示雖然人耳處存在一
定的聲壓,卻感覺不到,因此把0方等響度曲線命名為最小可聞閾;掩蔽閾:當(dāng)出現(xiàn)一
個強度高于原頻率的另一個頻率聲音時的最小可聞閾;頻域掩蔽:強純音掩蔽在其附近同時發(fā)生的弱純音的特性;強音壓弱音,低頻音壓高頻音
2、當(dāng)噪聲掩蔽純音是起作用的是以純音頻率為中心頻率的一定頻帶寬度內(nèi)噪音頻率。假使
頻帶內(nèi)的噪聲功率等于在噪聲中剛能響到該純音的功率所對應(yīng)的頻率。臨界頻率表征了人類的主要聽覺特性,他是研究純音對窄帶噪聲掩蔽時被發(fā)現(xiàn)的,在家款噪聲帶寬時,最初是掩蔽量大增,但帶寬超過一定值后,掩蔽量是不同增加;這種音頻編碼中的主要作用在于去掉大量的冗余,壓縮數(shù)碼率。
3、(1)波形編碼,包括自適應(yīng)變換編碼和子帶編碼:適應(yīng)性強,算法繁雜度低,編解碼
延時短,重建音頻信號質(zhì)量一般較高,但壓縮比不高。(2)參數(shù)編碼:優(yōu)點壓縮比高,但計算量大,重建音頻信號的質(zhì)量差,自然度低,不適合高保真度要求的場合。(3)混合編碼:在較低的數(shù)碼率上得到較高的音質(zhì)。:
4、壓縮編碼結(jié)合人的聽覺特性將對聽覺無關(guān)的信號刪除,充分利用聲音冗余度以進一步儉約數(shù)碼率而對恢復(fù)后的聲音質(zhì)量無影響。MPEG-1利用了掩蔽效應(yīng)的心理聲學(xué)模型
5、子帶編碼的基本思想:利用聲音信號頻譜分布的不均勻,將其分割成大量子頻帶,就每一個子帶分別進行編碼。好處:(1)減少了各子帶信號能量分布不均勻的程度,減少了動態(tài)范圍。(2)可根據(jù)每個子帶信號在感知上的重要性(即利用人對聲音信號的感知模型),對每個子帶內(nèi)的采樣值分派不同的比特數(shù)。
6、同步字,算法為其他算法,layerIII,參與冗余度信息列音頻數(shù)據(jù)內(nèi),比特率為256kbit/s,
采樣頻率44.1KHZ,它含有附加信道。個人專用,開啟強度立體聲,關(guān)閉MS立體聲,有片反權(quán)比特流為整體,?
7、5.1聲道環(huán)繞立體聲:三個前方的左聲道、右聲道和中置聲道以及兩個后方的左、右環(huán)
繞聲道,這五個聲道皆為全頻帶的(20HZ~20KHZ),另一個超低音聲道,其頻帶范圍只有(20~120HZ)將此超低音稱為0.1聲道,加上前面的五個聲道,就構(gòu)成了杜比數(shù)字的5.1聲道。
8、1充分利用量化器的量化范圍,通過比特分派和比例因子相結(jié)合,可以表示動態(tài)范圍超
過120db;2若一個給定的子帶中的量化噪聲超過了心理聲學(xué)模型所提供的掩蔽閾值,那么該子帶的比例因子就該將調(diào)整減少量化噪聲
9、原理:采用知壓縮編碼技術(shù),將每一聲道的音頻數(shù)據(jù)通過時域混迭消除(TDAC)技術(shù)濾
波后,根據(jù)人耳聽覺特性劃分為大量最優(yōu)的狹窄頻段,對于每個頻段,頻段內(nèi)噪聲信號
的頻率與有用信號的頻率十分接近,可以使遮掩效應(yīng)發(fā)揮最大作用,頻段以外的所有信號可以全部被濾除掉而不會損傷有用信號,進行由時域變換到頻域的指數(shù)變換,變換系數(shù)的指數(shù)部分經(jīng)編碼后構(gòu)成了整個信號大致的頻譜包絡(luò),利用512個采樣值點和256個采樣值點兩種長度組成塊的切換,得到較好的頻率分辯力,同時也能得到較高的編碼效率
比較:杜比AC-3和MPEG-2(AAC)都是利用人耳聽覺系統(tǒng)在頻域時域中的掩蔽效應(yīng)以及心理聲學(xué)模型,但那不同的是MPEG-2(AAC)比AC-3有更大的靈活性,做到了極低的數(shù)據(jù)比特率下聲音達到了廣播級。
10、時域的PCM取樣信號從時域變換到頻域,得到一系列的頻率系統(tǒng),每個頻率以二進制指數(shù)形式表示,即由一個指數(shù)和一個尾數(shù)構(gòu)成,指數(shù)反映信號的頻譜包絡(luò),用頻譜包絡(luò)決定分派給每個尾數(shù),獲取高的聲音質(zhì)量,因此需對每一個歸一化尾數(shù)的比特進行優(yōu)選化分派,用頻譜包絡(luò)(指數(shù))決定分派給每個尾數(shù)多少比特11、特點:高度的靈活性和可擴展性。
發(fā)展前景主要表達在:與以前的音頻編碼標(biāo)準(zhǔn)相比,MPEG-4增加了大量新的關(guān)于合成內(nèi)容及場景描述等的領(lǐng)域的工作,增加了諸如可分級性,音調(diào)變化、可編輯性及延遲等新功能。MPEG-4將以前發(fā)展良好但相互獨立的高質(zhì)量音頻編碼、計算機音樂及合成語音等第一次合并在一起,在諸多領(lǐng)域內(nèi)給予高度的靈活性。為了實現(xiàn)基于內(nèi)容的編碼,MPEG-4音頻編碼也引入了音頻對象的概念。AO可以是混合聲音中的任一種基本音,例如交響樂中某一種樂器的演奏者,或者電影聲音中人物的對白。通過不同AO的混合和去除,用戶就能得到所需要的某種基本的混合音。此外,MPEG-4還支持自然聲音、合成聲音以及自然和合成聲音混合在一起的合成/自然混合編碼。以算法和工具形式對音頻對象進行壓縮和控制。第三次作業(yè):
1.什么是MIDI?它有什么特點?
2.常用的MIDI樂音合成法有哪些?請說明它們的基本原理。
3.什么是MP3,它有哪些特點?請說明MP3與mp3PRO的區(qū)別、聯(lián)系?4.數(shù)字音頻文件的格式尋常分為哪兩類?它們各有什么特點?
5.常見的非壓縮格式音頻文件有哪些,壓縮格式音頻文件有哪些?
6.數(shù)字音頻物理接口有哪些?又有哪些數(shù)字音頻接口標(biāo)準(zhǔn)?請畫出IEC958(AES/EBU)音頻接口數(shù)據(jù)格式,并加以詳細說明。
答案:
1:MIDI是MIDI協(xié)會設(shè)計的音樂文件標(biāo)準(zhǔn)時目前最常用的格式、MIDI文件記錄的是指令而非數(shù)據(jù),因此站有空間?。惶攸c:1非數(shù)據(jù)文件,而是指令;2所需存儲空間??;3聲音質(zhì)量取決于聲音的輸出設(shè)備,不會產(chǎn)生數(shù)據(jù)損耗問題
2:常用的MIDI樂音合成法有:頻率調(diào)制(FM)合成法;波形表合成法。原理:FM合成法:數(shù)字式頻率調(diào)制合成音樂,使用數(shù)學(xué)模型描述音樂波形,找到生成基波和諧波的方法,并且將其用數(shù)字的方法合成樂音是其核心。波形合成法:;預(yù)先錄制各種典型樂器音符,利用采樣的方法將其數(shù)字化,然后將數(shù)字化的樣本樂音做成一張波形表,用他們代替頻率合成中產(chǎn)生基本樂音的方法,然后經(jīng)過合成和包絡(luò)處理生成需要的樂音。
3:MP3是MPEG-1標(biāo)準(zhǔn)音頻層III;特點:MP3的壓縮碼結(jié)合了MUSICAM和ASPEC兩種算法,利用了人體聽覺系統(tǒng)掩蔽效應(yīng)中的頻域掩蔽效應(yīng)。MP3與MP3PRO的區(qū)別與聯(lián)系:MP3與MP3PRO的音質(zhì)一致,MP3PRO部分編碼與MP3一致,但是MP3PRO比MP3pro相比將壓縮率提高了兩倍。
4:數(shù)字音頻文件的格式尋常分為兩大類:波形音頻文件和MIDI文件。波形音頻文件是通過聲音錄入設(shè)備錄制的原始聲音,直接記錄了原始真實聲音信息的數(shù)據(jù)文件,尋常文件較大。
MIDI文件是一種音樂演奏指令序列,相當(dāng)于樂譜,可利用聲音輸出設(shè)備或與計算機相連的電子樂器進行演奏,其文件記錄的是一系列指令而不是數(shù)字化后的波形數(shù)據(jù),因此它占用存儲空間比較小。
5:常見的非壓縮格式音頻文件有:wave和MIDI;壓縮格式音頻文件有REAL和MP3。6:數(shù)字音頻物理接口有:SCSI、ATA、USB、IEEE1394;音頻接口標(biāo)準(zhǔn):AES/EBU數(shù)字音頻接口,CCIR數(shù)字音頻接口,IEC數(shù)字音頻接口,SPDIF數(shù)字音頻接口,MADI多信道數(shù)字音頻接口,MIDI音樂設(shè)備數(shù)字接口。見P126。
第四次作業(yè)
1.什么是數(shù)字域頻率均衡?它有哪些類型及其特點?2.請描述CD盤的結(jié)構(gòu),以及CD激光唱機的工作原理。
3.請說明雙聲道旋轉(zhuǎn)磁頭式(R-DAT)數(shù)字磁帶錄音機的磁帶類型,以及磁跡規(guī)格。4.請說明磁光盤的記錄讀出原理。
5.請說明調(diào)音臺的功能及結(jié)構(gòu)。
6.請說明多聲道固定磁頭式(S-DAT)數(shù)字磁帶錄音機的磁帶格式。
答案:1、數(shù)字域頻率均衡:通過某種手段調(diào)整復(fù)合信號總所含有的頻率分量幅度,致使某些頻率分量的幅度增大或降低。類型:1、斜坡型:頻率均衡隨頻率變化浮現(xiàn)單調(diào)指開或衰減,可在較寬的頻率段對低頻或高頻進行補償,但不適合對窄頻進行音色的調(diào)整;2、峰谷型、均衡特性相像諧振峰,僅對某些頻率點補償量最強,偏離流點頻率的兩側(cè),頻率浮現(xiàn)下降或上升趨勢,其補償量的上升若,而衰減若山谷;3、圖式型:在20HZ~20000KHZ整個音頻范圍內(nèi),依照1/3或2/3倍頻程安排多個固定頻點實行峰谷型補償;4:參量型:它是在峰谷型補償基礎(chǔ)上增加了峰點兩側(cè)頻率范圍的幅變改變。
2、CD盤是由透明塑料、信息坑、反射光的金屬膜以及保護層共同組成。形狀是圓形的外半徑為60mm,信息坑用來存儲信息;內(nèi)徑25mm,凹槽圓孔半徑為5mm。
工作原理:由半導(dǎo)體激光器產(chǎn)生780~630mm范圍內(nèi)的一束波長紅光,經(jīng)光學(xué)系統(tǒng)聚焦成光點。照射到數(shù)字音頻光盤上的有無信號坑處,將產(chǎn)生強度不同的反射光。經(jīng)光電轉(zhuǎn)換器件的轉(zhuǎn)換可將存儲在光盤上的數(shù)字音頻信號轉(zhuǎn)換為脈沖信號,再經(jīng)數(shù)字信號處理,輸出音頻模擬信號,也可直接以數(shù)字音頻信號輸出。
3、磁帶類型:外形尺寸為73mmx54mmx10.5mm,比模擬機帶盒的長邊短,短邊也短,容量大,能連續(xù)記錄2小時;磁跡規(guī)格:區(qū)域型信號配置,共分為上邊緣區(qū)域、上副邊緣區(qū)域、上ATF區(qū)域、主區(qū)域、下ATF區(qū)域、下副區(qū)域、下邊緣區(qū)域等七個區(qū)域。
4、將磁性體加溫到居里溫度時,矯頑力將變至最小,用外部的弱磁場(偏磁場)很簡單地改變磁性體內(nèi)磁單元的磁化方向,以信號極性形成的磁單元的磁化方向與周邊不同的一系列微小區(qū)段來進行信號記錄存儲;再對數(shù)據(jù)進行讀取時,剛
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報參考:教育家精神引領(lǐng)高校思政課教師職業(yè)素養(yǎng)評價體系建構(gòu)研究
- 二零二五版鋁合金建筑模板采購協(xié)議書4篇
- 商場內(nèi)品牌專賣店裝修許可協(xié)議(2025年)2篇
- 2025年度苗木種植與林業(yè)產(chǎn)業(yè)發(fā)展合作合同4篇
- 二手房合作投資合同模板2024版B版
- 二零二五年度人工智能教育培訓(xùn)合同補充協(xié)議6篇
- 二零二五年度旅行社與航空公司合作協(xié)議書3篇
- 2025年度品牌跨界合作與品牌授權(quán)合作協(xié)議4篇
- 二零二五版?zhèn)€人貸款居間中介服務(wù)協(xié)議書6篇
- 2025年度個人房產(chǎn)抵押借款合同規(guī)范文本8篇
- 【寒假預(yù)習(xí)】專題04 閱讀理解 20篇 集訓(xùn)-2025年人教版(PEP)六年級英語下冊寒假提前學(xué)(含答案)
- 2024年智能監(jiān)獄安防監(jiān)控工程合同3篇
- 2024年度窯爐施工協(xié)議詳例細則版B版
- 幼兒園籃球課培訓(xùn)
- 【企業(yè)盈利能力探析的國內(nèi)外文獻綜述2400字】
- 統(tǒng)編版(2024新版)七年級《道德與法治》上冊第一單元《少年有夢》單元測試卷(含答案)
- 100道20以內(nèi)的口算題共20份
- 高三完形填空專項訓(xùn)練單選(部分答案)
- 護理查房高鉀血癥
- 項目監(jiān)理策劃方案匯報
- 《職業(yè)培訓(xùn)師的培訓(xùn)》課件
評論
0/150
提交評論