AMR語音編碼算法研究及復(fù)雜度剖析_鄭雪帆_第1頁
AMR語音編碼算法研究及復(fù)雜度剖析_鄭雪帆_第2頁
AMR語音編碼算法研究及復(fù)雜度剖析_鄭雪帆_第3頁
AMR語音編碼算法研究及復(fù)雜度剖析_鄭雪帆_第4頁
AMR語音編碼算法研究及復(fù)雜度剖析_鄭雪帆_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、文章編號:1001-893X(200301-0092-05AM R 語音編碼算法研究及復(fù)雜度剖析*y鄭雪帆 劉 春 陸 誠 匡鏡明 趙勝輝(北京理工大學(xué)電子工程系,北京100081摘 要:作為3GPP WCDMA 的語音編碼(Speech Coding 候選方案,自適應(yīng)多速率(AMR語音編碼是一種多模式集成的ACELP 類語音編碼方案。本文根據(jù)該編碼方案的標(biāo)準(zhǔn),分析了其方案實(shí)現(xiàn)中的關(guān)鍵算法:高性能碼本設(shè)計(jì)、高效碼本搜索算法、多級矢量量化技術(shù)、預(yù)處理算法的簡化等。最后,設(shè)計(jì)了定點(diǎn)ANSI-C 程序?qū)M R 語音編碼算法各部分的復(fù)雜度進(jìn)行了測算。關(guān)鍵詞:第三代移動(dòng)通信;語音編碼;自適應(yīng)多速率;碼

2、激勵(lì)線性預(yù)測;計(jì)算復(fù)雜度;算法中圖分類號:TN91213 文獻(xiàn)標(biāo)識(shí)碼:AAMR Speech Coding Algorithm and its ComplexityZH EN G X ue -f an ,L I U Chun,L U Cheng ,K UAN G Jing -ming ,ZH A O Sheng -hui(E.E.Dept.,Beijing Institute of T echnolog y,Beijing 100081,ChinaAbstract:As a proposed speech coding plan for 3GPP WCDMA,Adaptive Multi-Ra

3、te(AM Rvocoder is a multimode integrated ACELP.According to the standard,a detail dissection of the core algorithm for the implementation of the vocoder is sug gested,such as high-performing codebook design,code -vector search,multileveled VQ technique,as well as simplification for the preprocess pa

4、rt.Finally,by u -tilizing the fixed-point ANSI-C algorithm simulating program,the authors compute and profile the complex ity of operations w ith regard to each part of the w hole algorithm.Key words:3G mobile communication;Speech coding;AMR;ACELP (Alg ebraic Code Excited Linear Prediction;Operation

5、 complex ity,Algorithm一、引 言3GPP(WCDMA標(biāo)準(zhǔn)制定組織之一的ETSI 選擇了一種CELP 1聲碼器AM R(自適應(yīng)多速率作為其第三代移動(dòng)通信系統(tǒng)及其改進(jìn)的第二代移動(dòng)通信系統(tǒng)的語音編碼(Speech Coding 標(biāo)準(zhǔn)2。AMR 的8種速率模式:(12.2kbps 、10.2kbps 、7.95kbps 、7.4kbps 、6.7kbps 、5.9kbps 、5.15kbps 、4.75kbps共用ACELP 結(jié)構(gòu),引入了/多模式0系統(tǒng)集成的思想。此外還采用了/LSP 矢量量化0、/增益聯(lián)合矢量量化0、/子幀預(yù)處理簡化0、/分?jǐn)?shù)基音搜索0等新技術(shù)。二、關(guān)鍵算法分析

6、圖1為編碼器框圖。語音樣本以20ms 為一幀,每幀等分為4個(gè)子幀。解碼器的0合成0部分可以蘊(yùn)含在編碼器當(dāng)中,故只需研究合成后的/后濾波0部分。#92#y收稿日期:2002-06-12基金項(xiàng)目:愛力信合作項(xiàng)目圖1A M R編碼器系統(tǒng)流程圖1.LSP的矢量量化和內(nèi)插AMR編碼器各模式都使用10階合成濾波器:H(z=11+E p i=1a i z-i,p=10(1LPC分析(除12.2kbps模式2次每幀進(jìn)行1次,用Levinson-Durbin3算法求解LP系數(shù)a i,并轉(zhuǎn)換為動(dòng)態(tài)范圍較小、量化精度要求低的線譜對LSP4傳輸。AMR的特點(diǎn)是LSP采用矢量量化。首先用1階MA模型預(yù)測得到殘差r(n:

7、r(n=z(n-p(n(2p(n=a jr j(n-1j=1,10(3其中z(n為在第n幀去平均LSF矢量,r(n為預(yù)測殘差,p(n表示預(yù)測值,a j為預(yù)測系數(shù)。r(n再采用獨(dú)特的動(dòng)態(tài)加權(quán)失真準(zhǔn)則5量化,即尋找使下式最小的k:E LSP=E10i=1f i w i-fi k w i2(4w i=3.347-1.547450d i d i<4501.8-0.81050(d i-450其他(5其中,f為待量化LSP矢量,fk表示第k個(gè)量化后的LSP矢量,d i=f i+1-f i-1,并且f0=0,f11=4000。為保持時(shí)變性,AM R用內(nèi)插6重建每子幀計(jì)算H(z所需的LSP參數(shù)。2.語音

8、加重AM R采用/先分析、再合成0的方法加重語音。首先,將原始語音通過殘差濾波器:A(z=1+E p i=1ai z-i(6通過加重濾波器W(z=A(z/r1/A(z/r2和合成濾波器H(z,得到加重語音:s w(n=s(n+E10i=1a i r1i s(n-i-E10i=1a i r2i s w(n-i,n=0,K,L-1(7W(z和H(z為IIR濾波器,需遞歸實(shí)現(xiàn)7,其遞歸狀態(tài)在/后處理0部分更新。3.子幀預(yù)處理和后處理的簡化自適應(yīng)碼本搜索、固定碼本搜索、增益量化3部分成為一個(gè)子幀流程。流程開始前首先進(jìn)行子幀預(yù)處理:計(jì)算/加重合成濾波器0H(zW(z=A(z/r1/A(zA(z/r2的沖

9、激響應(yīng)h(n#93# 和碼本搜索目標(biāo)矢量x n。流程結(jié)束前進(jìn)行子幀后處理:剔除H(zW(z的零輸入響應(yīng),更新所有IIR濾波器的遞歸狀態(tài)。AM R對這兩部分都進(jìn)行了簡化,顯著減少了復(fù)雜度。首先對于h(n的計(jì)算,AMR采用0分級濾波0的方法:將H(zW(z分解為1個(gè)FIR和2個(gè)IIR 濾波器A(z/r1和2個(gè)I IR濾波器1/A(z、1/A(z/ r2。利用沖激響應(yīng)的定義,將單位沖激序列通過這3個(gè)濾波器,即可得h(n。該算法的優(yōu)點(diǎn)是:FIR的沖激響應(yīng)無需計(jì)算,只是其傳函系數(shù)加上0的擴(kuò)展;而后2個(gè)IIR的計(jì)算可以重復(fù)利用前面/語音加重0模塊的遞歸算法,共用了代碼,減少結(jié)構(gòu)復(fù)雜度。另一個(gè)重要簡化是計(jì)算

10、目標(biāo)矢量x n。理論上看,x n應(yīng)為加重語音信號s w(n減去H(zW(z的零輸入響應(yīng)。計(jì)算的關(guān)鍵是計(jì)算/H(zW(z的零輸入響應(yīng)0。如果直接計(jì)算,必然用遞歸算法,復(fù)雜度較高;更為復(fù)雜的是,計(jì)算零輸入響應(yīng)前還需知道H(zW(z在2個(gè)碼本聯(lián)合激勵(lì)下前一幀的輸出值,而該值不能直接得到。為此,AMR巧妙地將/預(yù)處理0和/后處理0結(jié)合,最大程度利用其他過程的中間結(jié)果,設(shè)計(jì)更簡單等效算法來計(jì)算零輸入響應(yīng)。其過程為:第一步,在預(yù)處理過程中將/加重語音計(jì)算0部分的中間結(jié)果/LP殘差res0通過量化后的合成器1/A(z和感覺加重濾波器A(z/r1/A(z/r2,其輸出即為x n。其中2個(gè)IIR濾波器1/A(z

11、和1/A(z/r2直接利用前面遞歸算法,但是,其遞歸狀態(tài)不能用本身狀態(tài)更新,而是強(qiáng)制用后處理部分計(jì)算的/零輸入抵消狀態(tài)0來更新。第二步,進(jìn)入后處理部分,將res 與碼本搜索得到的激勵(lì)u(n的差值res L p(n-u(n仿照預(yù)處理過程,依次通過1/A(z和A(z/r1/A(z/r2,保留后10個(gè)輸出狀態(tài)值,即為所求的/零輸入抵消狀態(tài)0。該狀態(tài)的值用于下一子幀的/第一步0即可達(dá)到剔除零輸入響應(yīng)的目的。這兩步的原理可以用線性系統(tǒng)定義來證明:第一步,由線性系統(tǒng)零輸入響應(yīng)也有疊加性可知由res LP(n-u(n激勵(lì)H(zW (z產(chǎn)生的零輸入響應(yīng)可以表達(dá)為res LP(n單獨(dú)產(chǎn)生的部分mem-res加上

12、-u(n單獨(dú)產(chǎn)生的部分mem-u。H(zW(z總的輸出顯然為e w(n=s w(n -sw(n,(sw(n為合成加重語音,則總輸出也可相應(yīng)表達(dá)為s w(n和-sw(n2個(gè)部分:s w(n是在輸入res LP(n和狀態(tài)mem-res下的輸出,而-sw(n是在輸入-u(n和狀態(tài)mem-u下的輸出。已知第二步中用上一步的mem-res+mem-u替換原來的遞歸狀態(tài),此時(shí)x n可以看作是輸入為res L P(n、狀態(tài)為mem-res+mem-u下的輸出,進(jìn)一步可等價(jià)為/輸入為res LP(n、狀態(tài)為mem-res的輸出0加上/輸入為0、狀態(tài)為mem-u的輸出0,而后者恰為H(zW(z在u (n激勵(lì)下的

13、零輸入響應(yīng)的負(fù)值。這就達(dá)到剔除的效果。上述算法的優(yōu)點(diǎn)在于極大減少了運(yùn)算量:后處理端,mem-res+mem-u的計(jì)算所需的3個(gè)濾波器可以巧妙省略。因?yàn)閙em-res+mem-u實(shí)際上就是e w(n的后10個(gè)狀態(tài)值,而e w(n=x(n-gp y(n -gc cz(n,y(n、z(n分別是自適應(yīng)碼矢量和固定碼矢量與h(n的卷積,可見e w(n已經(jīng)作為碼本搜索的中間結(jié)果得到。4.兩級自適應(yīng)碼本搜索(長時(shí)基音預(yù)測AM R采用獨(dú)特的開環(huán)閉環(huán)兩級和分?jǐn)?shù)時(shí)延基音搜索。開環(huán)基音搜索采用自相關(guān)法,只搜索3個(gè)近似的整數(shù)基音值。閉環(huán)搜索則在這3個(gè)值附近,采用MM SE8準(zhǔn)則,以分?jǐn)?shù)基音步進(jìn)來搜索,即在L min,

14、L max范圍內(nèi)搜索最佳延時(shí)Lopt:L o p t=max(E N-1n=0 S w(n-LS w(n2E N-1n=0S w2(n-L(8其中S w(n為加重語音。然后可得到自適應(yīng)碼本增益g p:g p=E N-1n=0S w(n-LS w(、En=0S w2(n-L(95.固定碼本的設(shè)計(jì)和搜索固定碼本搜索采用MM SE判決同公式(8、(9,特殊點(diǎn)在于:AMR采用/規(guī)則排列的代數(shù)碼本0。以7.95kbps模式為例,每個(gè)固定碼元矢量長為40個(gè)樣點(diǎn),其中只在4個(gè)按規(guī)則排列的位置上有幅度為?1的脈沖,其它36個(gè)樣點(diǎn)為0。搜索時(shí),只要尋找這4個(gè)位置即可。碼本采用/矩陣搜索0:首先根據(jù)前一幀加重合成

15、濾波器零狀態(tài)響應(yīng)h(-1,h(-39,構(gòu)造一個(gè)40維下三角Toepliz矩陣H,其對角線為h(0,低對角線為h(1,h(39:# 94 #H =h(0 h (-1 h (-2 , h(-39 h(1 h (0 h (-38h(2 h(0 s M O w s h(39 h(38 , h(0(10記y(n為目標(biāo)矢量,x i (n為第i 個(gè)碼子c i (n與h(n的卷積,則MM SE 判決式為:i o p t =m ax(EN-1n=0y (nx i (n2E N-1n =0x i2(n(11因x i (n和c i (n的關(guān)系可以表達(dá)為矢量形式:X i =H C i(12則可以推出(11等價(jià)為搜索:

16、A k =(C k 2E Dk =(d t c k 2c k t 5c k(13其中d=H t Y 是目標(biāo)矢量y (n和H 的矢量相關(guān):d (n =E 39i =nx 2(n h(i -n,n =0,39(145為H tH :<(i,j =E 39n=j h (n -ih(n -j ,(j E i(15以7.95kbps 模式為例,碼本矢量C i 可以表示為4個(gè)單脈沖矢量 m i (k,k=1,2,3,4之和,即C i =E 3k =0Sgn i (m k mi (k (16其中,Sg n i (k為第k 個(gè)單脈沖矢量的符號函數(shù),m i (k為單位脈沖位于m i 的第i 個(gè)固定碼矢量。以

17、;i 表示該位置的幅度,將(16代入(13可得實(shí)際搜索的式(13的分子分母為C =E N P-1i=0;i d (m i (17E D =E N P-1i =0<(m i ,m i +2E N P-2i=0EN P-1j=i+1;i ;j <(m i ,m j (18/矩陣搜索0的優(yōu)點(diǎn)在于:由脈沖的稀疏性可知,在計(jì)算(17、(18的時(shí)候,大量位置上為0,于是很大程度上減少了運(yùn)算量;此外,由于采用規(guī)則碼本,如按照4個(gè)脈沖i0i1i2i3出現(xiàn)的可能位置進(jìn)行全搜索,其總循環(huán)次數(shù)為88816=65536,遠(yuǎn)小于不采用規(guī)則位置的P 404=2193360次,從而提高了搜索速率。規(guī)則碼本的另一

18、個(gè)好處是易于多模式擴(kuò)展:由于規(guī)則碼本無需存儲(chǔ),因此不同速率的規(guī)則碼本之間只要相應(yīng)地增加或減少脈沖即可,而核心的/矩陣搜索0部分可以完全復(fù)用,這在實(shí)際物理實(shí)現(xiàn)時(shí)也簡化了結(jié)構(gòu)復(fù)雜度。從后面WMOPS 統(tǒng)計(jì)可知,即便采用了這種規(guī)則碼本和/矩陣搜索0,固定碼本搜索的運(yùn)算復(fù)雜度占整體的比例仍高達(dá)2040%,可見這種改進(jìn)具有明顯的實(shí)際意義。 6.增益的聯(lián)合矢量量化AM R 采用獨(dú)特的/碼本增益聯(lián)合矢量量化0。與傳統(tǒng)標(biāo)量量化相比,雖然引入了量化表的存儲(chǔ),加大了運(yùn)算復(fù)雜度,但卻具有更優(yōu)越的量化效率。記c(i為固定碼本矢量,固定碼本增益為g c , E 為固定碼本激勵(lì)的平均能量,E(n為其去平均能量(以dB 表

19、示:E (n=10log 1nN g c 2E N-1i =0c 2(i- E N =40(19首先使用4階MA 11預(yù)測E(n:E (n=E 4i=1b i R(n -ib 1b 2b 3b 4=0.680.580.340.19(20R (k是第k 子幀的量化后預(yù)測能量誤差。將 E (n代替式(19的E(n,可以反求出預(yù)測的固定碼本增益g c c :g c c =100.05( E(n+ E -E 1其中E 1=10log 1NE N-1j =0c2(j (21進(jìn)一步求出相關(guān)系數(shù):r gc =g c /g c c(22最后將自適應(yīng)碼本增益g p 和r gc 二維矢量量化后傳輸。三、運(yùn)算復(fù)雜度

20、(WM OPC的測算1.運(yùn)算復(fù)雜度的選取評估聲碼器的運(yùn)算復(fù)雜度,對于其技術(shù)改進(jìn)效果和實(shí)用性能的評估,都具有重要意義。廣義的運(yùn)算復(fù)雜度應(yīng)該包括/計(jì)算量0和/DSP 生成目標(biāo)代碼的復(fù)用效率02個(gè)指標(biāo)。后者的準(zhǔn)確測定需要在#95#DSP實(shí)際物理實(shí)現(xiàn)時(shí)完成,而通過前面所述的算法研究可以粗略了解到AMR聲碼器在代碼復(fù)用方面所作的改進(jìn)。我們的評估只限于/計(jì)算量0的測算,且為了更多地展現(xiàn)算法本身復(fù)雜度,而獨(dú)立于具體DSP指令集之外,我們采用了WMOPS9(Weighted M illion Operations Per Second即加權(quán)百萬操作每秒的測算標(biāo)準(zhǔn)。實(shí)際物理實(shí)現(xiàn)時(shí),只需要根據(jù)具體的DSP類型,將

21、operation轉(zhuǎn)化為對應(yīng)的instruction,就可以直接得到重要的M IPS參數(shù)。2.仿真的設(shè)計(jì)鑒于AMR聲碼器主要在定點(diǎn)DSP上物理實(shí)現(xiàn),我們選擇構(gòu)造聲碼器的定點(diǎn)C仿真程序。為了最大程度的逼近定點(diǎn)DSP實(shí)現(xiàn)時(shí)的運(yùn)算效果,我們仿照通用定點(diǎn)指令構(gòu)造了一個(gè)/定點(diǎn)運(yùn)算類0,如表1所示。該運(yùn)算類實(shí)際只有部分為基本運(yùn)算,其他運(yùn)算均仿照定點(diǎn)運(yùn)算,按實(shí)際流程通過微程序?qū)崿F(xiàn)。結(jié)合實(shí)現(xiàn)流程,為每條指令換算出其轉(zhuǎn)化為基本運(yùn)算的等效指令條數(shù),并把該值賦給運(yùn)算類作為統(tǒng)計(jì)權(quán)重因子。表1定點(diǎn)運(yùn)算類權(quán)重add1L_macN s1msu_r2sub1L_msuN s1L_deposit_h2abs_s1L_add2L

22、_shr_r2shl1L_sud2L_shr_r3shr1L_add_c2L_shift_r3ex tract_h1L_sub_c2L_abs3ex tract_11L_negate2L_sat4mult1L_shl2norm_s15L_mult1L_shr2div_s18neg ate1mult_r2nor m_130round1shr_r2DataM ove161L_mac1shift_r2DataM ove322L_msu1mac_r2Logic161L ogic322T est2仿真程序的模塊設(shè)計(jì)結(jié)合前面的0算法研究0,流程參考14。所有模塊的數(shù)值運(yùn)算,都轉(zhuǎn)化為定點(diǎn)運(yùn)算類包含的指令實(shí)現(xiàn)

23、,以方便自動(dòng)統(tǒng)計(jì)。除了統(tǒng)計(jì)編碼器,解碼器總體的WMOPS值外,還結(jié)合前面所述的/算法研究0分模塊統(tǒng)計(jì)。編碼器分為/LPC分析0、/開環(huán)基音搜索0、/預(yù)處理0、/閉環(huán)基音搜索0、/固定碼本搜索0、/增益量化0、/后處理08個(gè)模塊;解碼器分為/合成0、/后濾波1002個(gè)模塊。仿真所用的語音樣本為NTT提供的96句不加噪漢語普通話樣本,平均長度為400幀,基本模擬了AMR聲碼器實(shí)際工作時(shí)的漢語環(huán)境。根據(jù)程序?qū)嶋H流程的不同,我們構(gòu)造了不同的仿真流程,計(jì)算并統(tǒng)計(jì)了WM OPS的/平均值0和/最差值02種結(jié)果。四、結(jié)論由統(tǒng)計(jì)結(jié)果可看出:固定碼本搜索部分所占用的比例最大,當(dāng)速率增加時(shí),尤為明顯;低速率模式如

24、4.75kbps,因?yàn)椴捎昧似媾紟謩e處理和增益矢量量化的原因,在/預(yù)處理0和/后處理0以及/增益量化0部分的運(yùn)算開銷增大。由這兩點(diǎn)可以看出, AM R聲碼器采用的高效率規(guī)則固定碼本,對降低運(yùn)算復(fù)雜度具有明顯的實(shí)際效果。而且AMR聲碼器對于速率和復(fù)雜度作了一定的平衡,在高速率狀態(tài)下,采用了簡單、低性能的算法,而在低速率狀態(tài)下,則相反。這種制約使各種速率模式都保持了相對穩(wěn)定的計(jì)算復(fù)雜度,并且在低速率模式下,用計(jì)算復(fù)雜度增加的代價(jià)換取了性能的提高,具有重要實(shí)際應(yīng)用價(jià)值。參考文獻(xiàn)1M.R.Schroeder,B.S.Atal.Co de-Excited Linear Pre-diction(CEL P:Hig h quality speech at ver y low bit ratesA.in Proc.ICASSP.85C,1985.pp.937940.2ET SI GSM06.90,ver7.2.0,Digital cellular telecom-munications system(P hase2+,pp.37.3楊行峻,遲惠生.語音信號數(shù)字處理M.電子工業(yè)出版社,pp.6669.4 F.Itakura.L ine spectral representation of linear

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論