AMBE算法及其實現(xiàn)方式_第1頁
AMBE算法及其實現(xiàn)方式_第2頁
AMBE算法及其實現(xiàn)方式_第3頁
AMBE算法及其實現(xiàn)方式_第4頁
AMBE算法及其實現(xiàn)方式_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

AMBEA算法及其實現(xiàn)方式在數(shù)字移動通信系統(tǒng)中,語音編碼部分是很重要的一個環(huán)節(jié),它的性能直接關系到整個移動通信系統(tǒng)的工作質量。首先綜述在以數(shù)字集群為代表的移動通信系統(tǒng)開發(fā)的背景下,語音編碼的概念、分類和發(fā)展情況,并介紹目前世界上常見移動通信系統(tǒng)所用的語音編碼方案,從而明確語音編碼算法的比較對象。今天我就自己手頭了解的一些知識對AMBE算法進行初步的概括:1.MBE算法的概念AMBE是基于MBE技術的低比特率、高質量的改進語音壓縮算法,該技術在低比特率壓縮系統(tǒng)中能提供極優(yōu)的語音質量,卻對指令執(zhí)行速度和存儲器容量的要求大大降低,在背景噪聲和信道誤碼方面也有極強的魯棒性,比基于線性預測編碼的CELP、RELP、VESLP、LPC-10等要優(yōu)越。那么了解AMBE之前我們先來了解下MBE算法:MBE編碼算法是用基音諧波處的譜抽樣來表示短時譜,并且在諧波間隔頻段上分別進行清/濁音判決。合成端用一組正弦波合成譜,用噪聲譜的傅立葉反變換來合成清音譜。這種算法提出了一種由正弦模型引出的頻域模型—多帶激勵模型。MBE模型如圖1所示。首先按基音各諧波頻率,將一幀語音的頻譜分成若干個諧波帶,再以若干個諧波帶為一組進行分帶,分別對各帶進行清濁(V/U)判決,總的激勵信號由各帶激勵信號相加構成。對于濁音帶,用以基音周期為周期的脈沖序列譜作為激勵信號譜對于清音帶,則使用白噪聲譜作為激勵信號譜。時變數(shù)字濾波器的作用是確定各諧波帶的相對幅度和相位,起到了將這種混合的激勵信號譜映射成語音譜的作用。這種模型使合成語音譜同原語音譜在細致結構上能夠擬合得很好,其合成端的語音質量必然較高。AMBE算法實現(xiàn)形式2.1AMBE編碼的基本方式AMBE編碼的基本方法為:首先將輸入的每幀160個數(shù)字話音取樣點分成交疊的段,經(jīng)模型分析后得出該幀的模型參數(shù)。編碼器量化這些模型參數(shù),加上糾錯碼,然后以4.8kbps的數(shù)據(jù)流發(fā)送。解碼器接收比特流,重構模型參數(shù),在利用這些產(chǎn)生合成的語音信息。流程如圖2所示。由此可知,AMBE算法的實現(xiàn)步驟可分為五步,即模型分析、量化、糾錯(FEC)、重建及合成。下面簡要說明一下這五個步驟。1、 模型分析MBE算法模型:設輸入信號S(n),定義窗口化的語音信號為:S(n)=S(n)?W(n)設S(n)是激勵e(n)經(jīng)過線性濾波器h(n)的響應,則w w wS(n)=h(n)*e(n)w w w將幀分成兩類:話音和非話音。對于話音e(n)是周期脈沖序列,w各脈沖間的距離為脈沖周期P0;對于非話音:e(n)為白噪聲oMBE將w激勵信號譜分成若干段,再對每一段進行話音/非話音(V/UV)判決。因此,激勵信號是周期信號能量(V)和噪聲能量(UV)之和。2、 量化在編碼之前,必須對譜高M](1WIWL)進行量化。量化的過程為:先由預測的譜高得出預測的留數(shù)r(lWIWL),然后將其分成8段,對每一段進行離散余弦變換(DTC),得到增益矢量R(lWiWiL)和高階DTC相關系數(shù)C。量化器的輸出就是編碼器的輸出,包括ik基帶頻率,不同頻率的話音/非話音判決門限和譜高[1]。3、 糾錯由于幀長為20ms,傳輸速率為4.8kbps,所以每幀有96個比特。在AMBE算法中,72比特用來量化模型參數(shù),而其余24比特用于前向糾錯(FEC)。將72比特分為5個向量組:v,v,v,v,v,設輸出的501234個向量組為:u,u,u,u,u,則01234v=u?G000v=u?gH,forlWiW3iiv=u44其中,gG和gH分別為[24,12]格雷(Golay)碼和[15,11]漢明(Hamming)碼的生成器。這樣u為24比特,u,u,u均為15比特,u0 1 2 3 4為27比特,總的輸出為96比特。4、重建解碼時,需要重建譜高叫(1WIWL)首先,必須由b計算出L:l03=2n/(b+20)00L=0.9254(n/w+0.25)0然后,解碼和重建得到譜高。解碼和重建類似量化和編碼的逆過程:第一步先要將譜高分為8段,根據(jù)L決定每段的長度J(1WiW8)1。這些段中的元素用C(1WiW8,表示段號,2WkWJ,表示段內ik i的元素號)表示。每一段的第一個元素設為解碼增益R,其余元素為i高階DCT相關系數(shù)。5、合成解碼斷輸入的比特經(jīng)過重建以后,得到的一系列模型參數(shù)包括基帶頻率3,不同頻率的話音/非話音(V/UV)判決門限vk和譜高M。然0l后將這些模型參數(shù)合成話音。話音合成算法將每一組模型參數(shù)分為話音譜(V)和非話音譜(UV),用話音合成算法和非話音合成算法分別對這兩部分進行話音合成,將話音譜的能量合成產(chǎn)生話音信號suv(n),而非話音譜的能量則合成產(chǎn)生非話音信號suv(n)。2.2AMBE-2000DVSI公司的AMBE-2000語音編碼芯片是一種非常靈活、高性能、單片的語音壓縮編碼器它提供了在低數(shù)據(jù)速率時出色的語音質量,也提供了一個實時、全雙工的備有標準AMBE語音壓縮軟件算法設置的設備。DVSI享有專利權的AMBE語音壓縮技術已經(jīng)被證明是與同之前的ECELP,CELP,RELP,VSELP,MELP,MP-MLQ,LPCT0和其他壓縮技術有更好的性能⑵。AMBE語音壓縮算法在全世界有著廣泛的應用,其中也包括下一代數(shù)字移動通信系統(tǒng)的應用。AMBE-2000語音編碼器在選擇語音和FEC(前向糾錯)數(shù)據(jù)速率上提供了很高的靈活性。用戶可以以

50bps為增量全速地從2.0kbps到9.6kbps單獨地選擇這些參數(shù)。對于更高的差錯速率信道,用戶將被分配更大百分比的FEC編碼全比特速率。AMBE-2000語音編碼在每秒2.4kbps的低速下能保持自然聲音質量和語音的可性性oAMBE算法的低復雜性允許它被完全地集成到一個低價格、低功耗的集成電路—AMBE-2000語音編碼芯片中。在最簡易模型中,AMBE-2000被看作兩個分離元件:編碼器和解碼器。編碼器接收8kHz采樣語音數(shù)據(jù)流(16-bit線性、8-bitp率,或8-bitp率)并以所期望的速率將數(shù)據(jù)流輸出信道。相反地,解碼器接收信道數(shù)據(jù)流,合成語音流。對AMBE-2000編、解碼器接口的時間控制是完全異步的。語音接口是外圍的A/D-D/A芯片。輸入輸出語音數(shù)據(jù)流必須是相同的格式(16-bit線性,8-bitA率,或s-bitp率)。信道接口是普通的8或16位微處理器或其它相應的在AMBE-2000信道格式和被設計的系統(tǒng)信道格式中能體現(xiàn)其基本功能的外圍元件。AMBE-2000 __: 7AMBE-2000玄AMBE-2000 __: 7AMBE-2000玄I1Z語音敵據(jù)2.2AMBE-1000AMBE-1000是DVSI公司開發(fā)的基于AMBE算法的一種高性能的多速率語音編碼/解碼芯片,非常適合于數(shù)字語音通信及處理的場合。本文基于AMBE-1000設計了一個語音壓縮系統(tǒng),該系統(tǒng)具有設計簡便、語音編碼速率可變、音質良好、功耗小等優(yōu)點,可應用于多種需要。AMBE-1000是基于AMBE算法的語音編碼/解碼芯片,其語音編碼/解碼速率可以在2400?9600bps之間以50bits的間隔變化。在芯片內部有相互獨立的語音編碼和解碼通道,可同時完成語音的編碼和解碼任務;并且所有的編碼和解碼操作都在芯片內部完成,不需要外擴的存儲器.AMBE-1000最基本的組成部分就是一個編碼器和一個解碼器,兩者相互獨立。編碼器接收8kHz采樣的語音數(shù)據(jù)流(16bit線性,8bitA律,8bitu律)并以一定的速率輸出信道數(shù)據(jù)。相反,解碼器接收信道數(shù)據(jù)并合成語音數(shù)據(jù)流。編碼器和解碼器接口的時序是完全異步的。AMBE-1000采用A/D-D/A芯片作為語音信號的接口。送往解碼器用于控制的數(shù)據(jù)和語音數(shù)據(jù)是不同的。輸入輸出的語音數(shù)據(jù)流的格式必

須是相同的(16bit線性的,8bitA律,8bitu律),信道接口采用8位或16位的微控制器。其工作原理如下圖:AMBE^lDOO解碼器 8KHZ吾音魏據(jù)雷音數(shù)據(jù)AMBE1000AMBE^lDOO解碼器 8KHZ吾音魏據(jù)雷音數(shù)據(jù)AMBE1000編碼器AMBE-2000聲碼器不同于AMBE-1000,AMBE-2000只有串行接口模式,沒有并行接口模式。AMBE算法與其它算法的優(yōu)勢3.1編碼速率和占用帶寬從編碼速率和占用帶寬角度來看,由于波形編碼為了能夠獲得較高的重建語音質量,所以直接對時域波形或在變換域進行編碼,所以壓縮比較低,編碼速率一般較高。而目前比較常用的一些語音壓縮算法,比如CELP、數(shù)字集群TETRA標準里用的ACELP編碼、MOTORLA的IDEN標準所用的編碼都屬于混合編碼。這些編碼方式將波形編碼的優(yōu)點與參量編碼的優(yōu)點結合起來,使語音質量有了明顯的提高,但是它們的編碼速率一般都在4.8kbps以上,試圖更大幅度地降低這些編碼方式的壓縮速率,如降到4kbps以下,由于沒有足夠的比特表示激勵矢量,余量信號的量化將產(chǎn)生較大的誤差,那么話音質量將會急劇下降。MBE和CELP區(qū)別在于如果允許碼率提高,則CELP編碼器可令人信服地重現(xiàn)精確的原始語音,而MBE類編碼器則不能,因其僅僅捕獲了一些參數(shù)。這是混合編碼性能特點介于波形編碼與參數(shù)編碼之間的一個必然結果。3.2算法時延在算法時延方面,波形編碼的時延非常小,一般為零點幾個毫秒,4.8kbps的CELP編碼時延為30ms,基于CELP算法的其他編碼方案也多數(shù)在幾或二十毫秒左右,VSELP編碼時延相對較高。4.8kbps的AMBE算法時延為32ms,MBE類編碼處適中水平,小于VSELP編碼,但大于CELP和CE-ACEL編碼。3.3編碼原理方面

在編碼原理方面,MBE類與CELP類編碼的一個主要差別在于MBE將每一語音段分割成不同的頻帶并對每一頻帶進行清濁音判決,這使得實際語音段的激勵信號成為周期〔濁音〕和類噪聲(清音)能量的混合。這樣,在激勵信號模型中增加的自由度使得MBE語音模型產(chǎn)生出比常規(guī)語音模型更高質量的語音,甚至在速率低至2.4kbps時仍可維持語音的可理解度和自然度。此外,它使得MBE語音模型在存在背景噪聲時魯棒性強。H@tnH@tnLLISAsq擊僧醴卷盤10無哩環(huán)境交通干錢卡主噲聲唱車噪函備嘶細語ffl2兩種背瑪黑噪聲害祥性禪怙(MOS)線性預測聲碼器的固有問題是線性預測模型在沒有附加的預測殘余時不產(chǎn)生高質量的語音,預測殘余可看作糾錯信號,它糾正線性預測模型中的不精確度。線性預測類的各種編碼方式之間的主要差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論