語(yǔ)音編碼總結(jié)_第1頁(yè)
語(yǔ)音編碼總結(jié)_第2頁(yè)
語(yǔ)音編碼總結(jié)_第3頁(yè)
語(yǔ)音編碼總結(jié)_第4頁(yè)
語(yǔ)音編碼總結(jié)_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

語(yǔ)音編碼總結(jié)一、歷史與概念1、模擬的聲音信號(hào)話音信號(hào):(口語(yǔ)發(fā)聲的)200Hz~3400Hz調(diào)幅廣播信號(hào):(無(wú)線廣播)50Hz到7000Hz調(diào)頻廣播信號(hào):(無(wú)線廣播)20Hz到16000Hz激光唱機(jī)信號(hào)(CD):10Hz~20000Hz2、話音編碼技術(shù)的歷史回顧高保真立體音頻16位44.1k905.6kPCMISO1990壓縮64k?128kMPEG每聲道在32k?448ki- nn=]TOC\o"1-5"\h\zI無(wú)線FM_ ? !無(wú)線AM14位16k224kPCM64k|I|II64kPCM8位8k;子帶ADPCMI!(Toll)G.711 ! 88年G.722! !Illi - M " I . ■1020 50 200 3400 7000160020000Hz話音編碼研究的歷史表明,這一領(lǐng)域的研究成果直接為通信產(chǎn)業(yè)發(fā)展提供了源動(dòng)力。目前訐所用的編碼的標(biāo)準(zhǔn)有G.723.1,G.728,G.729。具有低延遲、低碼率、低復(fù)雜性、高音質(zhì)的話音編碼算法將是未來(lái)IP網(wǎng)絡(luò)的奠基石。3、若干概念術(shù)語(yǔ)(1)數(shù)字信號(hào):標(biāo)稱(chēng)的不連續(xù)信號(hào)。它可以用離散的步差從一個(gè)狀態(tài)轉(zhuǎn)變到另一個(gè)狀態(tài)。(2)采樣:按周期T對(duì)模擬信號(hào)進(jìn)行測(cè)量,稱(chēng)為采樣。采樣頻率Fs=1/T.在滿(mǎn)足奈奎斯特定理時(shí),從采樣值可準(zhǔn)確的恢復(fù)原信號(hào)。(3)量化用數(shù)字信號(hào)表示話音的過(guò)程稱(chēng)為量化。(4)非均勻量化非均勻量化可以兼顧動(dòng)態(tài)圍和小信號(hào)的系統(tǒng)精度。Reeves提出概念。即對(duì)大信號(hào)取較大的量化步長(zhǎng)。對(duì)小信號(hào)取較小的量化步長(zhǎng)。二、矢量量化將k個(gè)樣點(diǎn)構(gòu)成的有序集(信源矢量集合)映射為M個(gè)恢復(fù)失量構(gòu)成的有限集A(碼書(shū),碼本)中的某個(gè)矢量Yi(碼字,碼元)的映射,稱(chēng)為矢量量化,它是對(duì)標(biāo)量量化在K維空間的一個(gè)推廣。標(biāo)量量化矢量量化量化對(duì)象單個(gè)采樣點(diǎn)K個(gè)采樣點(diǎn)集合劃分在一維幅度軸上劃分有限個(gè)區(qū)間1=[a0a1)…n=[an-1an)在k維空間里,劃分成有限個(gè)子空間S={Si|i=1,2,…M}量化過(guò)程在每個(gè)區(qū)間里,選一個(gè)代表值fii I=1,2,…n在每個(gè)子空間里,選一個(gè)代表矢量Yi={Yi1,Yi2,Yii}Yi {Si} i=1,2,…M量化方法對(duì)任一模擬信號(hào),當(dāng)其標(biāo)稱(chēng)值屬于區(qū)間i時(shí),就用數(shù)字信號(hào)fi代表值對(duì)任一k維模擬信號(hào)的矢量。當(dāng)其標(biāo)稱(chēng)值屬于子區(qū)間Si時(shí),就用代表矢量Yi去量化之。1、碼本設(shè)計(jì)的LBG方法(1)在矢量空間X中,進(jìn)行最佳劃分,即,把X劃分成M個(gè)子空間Sii=,1.2….m使平均失真最小。(2)對(duì)劃分后的子空間Si求出其形心作為新的最佳代表矢量Yi,從而構(gòu)成新的碼本。將上述步驟反復(fù)迭代,最終求出最佳碼本和量化器。(3)初始碼本的選擇:A、隨機(jī)選取,迭代時(shí)間較長(zhǎng)B、分裂法(4)LBG方法不是最優(yōu)化方法,即迭代過(guò)程不能保證收斂到全局最小值。后來(lái)有人提出模擬退火法,將LBG方法收斂到局部最小值時(shí),采用某種擾動(dòng)將迭代過(guò)程繼續(xù)進(jìn)行下去。2、空間分布對(duì)矢量量化的影響LBG算法把問(wèn)題簡(jiǎn)化為:在矢量空間中,樣點(diǎn)的分布是均勻的。但實(shí)際的應(yīng)用場(chǎng)合往往不滿(mǎn)足這個(gè)前提。因此應(yīng)考慮空間分布,空間分布對(duì)量化值的選擇有很重要的影響。對(duì)矢量的情況,影響依然存在。3、語(yǔ)音編碼方案的三種類(lèi)型語(yǔ)音編碼的主要任務(wù):對(duì)量化的話音信號(hào)施加某種數(shù)字變化,使其具有適于數(shù)字信道傳輸?shù)男问?,同時(shí)盡可能多信號(hào)所承載的信息。話音信號(hào)的剩余度主要表現(xiàn)在三個(gè)方面:(1)相鄰樣點(diǎn)存在較強(qiáng)的相關(guān)性(2)對(duì)濁音信號(hào)存在周期(準(zhǔn)周期)性(3)信號(hào)短時(shí)平穩(wěn),時(shí)不變性此外,人類(lèi)聽(tīng)覺(jué)對(duì)話音有選擇效應(yīng),即當(dāng)一個(gè)強(qiáng)音與一個(gè)弱音同時(shí)存在時(shí),人類(lèi)聽(tīng)覺(jué)能夠自動(dòng)抑制弱音的效果,稱(chēng)為人耳的“掩蔽效應(yīng)”。這些是話音壓縮編碼的出發(fā)點(diǎn)。波型編碼:對(duì)話音信號(hào)的每一個(gè)樣點(diǎn)進(jìn)行量化、編碼和傳輸。因此,波型編碼是沒(méi)有延遲的話音編碼方案。差值脈碼調(diào)制(DPCM和△-調(diào)制)一位的DPCM系統(tǒng)成為4-調(diào)制或增量調(diào)制DM。流程圖如下:

編碼器 解碼器編碼器 解碼器這里,「表示對(duì)應(yīng)的量化值,上標(biāo)?表示對(duì)應(yīng)的預(yù)測(cè)值,用ei表示差值di的量化誤差。收端恢復(fù)的量化信號(hào)只與差值信號(hào)的量化誤差有關(guān),而與預(yù)測(cè)器性質(zhì)無(wú)關(guān)。(1)當(dāng)信號(hào)變化快時(shí),恢復(fù)波形跟不上信號(hào)的變化,稱(chēng)為"斜率過(guò)載“(2)對(duì)于零信號(hào),DM方法交替輸出一串0和1,這種隨機(jī)交變電平成為“顆粒噪聲”。解決辦法是在量化器引入自適應(yīng)階矩調(diào)整機(jī)制(ADM)。如果自適應(yīng)調(diào)整依據(jù)輸入信號(hào),稱(chēng)為前向自適應(yīng)。如果自適應(yīng)調(diào)整依據(jù)是量化器輸,稱(chēng)為后向自適應(yīng)。前向自適應(yīng)將導(dǎo)致延遲的產(chǎn)生,后向自適應(yīng)有可能不穩(wěn)定。連續(xù)可變斜率增量調(diào)制(CVSD)其原理可用下圖說(shuō)明:ALL"0"其原理可用下圖說(shuō)明:ALL"0"當(dāng)反饋回路中,出現(xiàn)連續(xù)四個(gè)“1”或連續(xù)四個(gè)“0”時(shí),表明系統(tǒng)出現(xiàn)斜率過(guò)載的情況,此時(shí)或門(mén)輸出一個(gè)高電平,驅(qū)動(dòng)觸發(fā)器改變量化的階矩的大小,以便適應(yīng)輸入信號(hào)的變化。自適應(yīng)差值脈碼調(diào)制(ADPCM)PCM:非均勻量化。D:調(diào)制。差值調(diào)制。CVSD:自適應(yīng)概念將脈碼調(diào)制、差值調(diào)制和自適應(yīng)技術(shù)三者結(jié)合起來(lái)。使編碼算法不僅適用于幅值起伏較大的話音信號(hào),而且能很好的適合于平穩(wěn)信號(hào)(如話帶數(shù)據(jù))。信息壓縮的基本思路1、信息與消息(1)消息是由符號(hào)、數(shù)字、文字或語(yǔ)言組成的序列。(2)信息是消息中不確定的容。消息是信息的載體,信息是消息的含。由于信息是消息中承載的不確定性因素(差別、變化、區(qū)別等),因此必然與通信雙方的知識(shí)(約定)有關(guān)。越少見(jiàn)的事件,其出現(xiàn)帶來(lái)的信息越多.2、信息壓縮的主要手段(1)減少不確定性差值編碼:相當(dāng)于用前一個(gè)值來(lái)預(yù)測(cè)當(dāng)前值,引出線性預(yù)測(cè)的概念pd(n)=s(n)—zas(n-i)i=1(2)通信雙方建立某種知識(shí)約定,如碼書(shū)或算法(3)對(duì)變化的規(guī)律、不確定性因素建立描述機(jī)制或?qū)W習(xí)機(jī)制參數(shù)編碼就是對(duì)每幀語(yǔ)音信號(hào),將濾波器系數(shù)和殘差。(門(mén))分別

進(jìn)行量化編碼。由于e(n)的平均能量和幅度變化圍遠(yuǎn)遠(yuǎn)小于信號(hào)$(「),因此在信噪比相同的條件下,可以用較少的比特對(duì)其編碼。參數(shù)編碼時(shí),將激勵(lì)按清音、濁音分成高斯隨機(jī)白噪聲或準(zhǔn)周期信號(hào)。倒譜參數(shù)C(n)構(gòu)成的同態(tài)聲碼器,用共振峰參數(shù)構(gòu)成的共振峰聲碼器,都是參數(shù)編碼方法。1、基音提?。翰⒙?lián)基音提取方法。(1)短時(shí)平均幅度差函數(shù)AMDF(2)中心削波法是對(duì)信號(hào)的一個(gè)非線性變換:[S(n)-C S(n)>C1 /C[S(n)]=10 1<S(n)<C/S(n)+C S(n)<—Ci i式中,Cl稱(chēng)為削波電平,它取信號(hào)最大值Smax的一個(gè)百分比(30%?80%)iCiSiCiS(n)<C-CiS(n)>Cf[S(n)]=10 -C<1S(n)<用Y[S(n)]表示三電平中心削波器的輸出,在自相關(guān)函數(shù)中有1 y(n+m)=y(n+m-k)y(n+m)y(n+m-k)T° y(n+m)=°”-y(n+m-k)=01 y(n+m)豐y(n+m-k)用三電平中心削波信號(hào)計(jì)算自相關(guān)函數(shù),找到自相關(guān)函數(shù)最大值,并將峰值與一個(gè)固定門(mén)限[例如Rn(0)的1/3]比較,如果低于門(mén)限判為清音,如果高于門(mén)限則最大峰位置判為基音周期。2、并聯(lián)基音提取基本方法原理:(1)先對(duì)信號(hào)進(jìn)行處理產(chǎn)生若干沖激串,沖激串只保留原始信號(hào)的周期性而去除了與基音檢測(cè)無(wú)關(guān)的信息。(2)估計(jì)每個(gè)沖激串的周期。(3)對(duì)這些周期進(jìn)行邏輯判斷,最后確定語(yǔ)音信號(hào)的周期,將進(jìn)過(guò)低通濾波的信號(hào)按如下原則求出六個(gè)沖激串3.3混合編碼波形編碼音質(zhì)好但碼率高,參數(shù)編碼可以獲得很低的碼率但音質(zhì)不好,為了兼顧二者的長(zhǎng)處和不足,提出了殘差激勵(lì)模型,多脈沖激勵(lì)模型和碼激勵(lì)模型。此外,對(duì)LPC參數(shù)模型也提出了噪聲加權(quán)整形技術(shù)和長(zhǎng)時(shí)預(yù)測(cè)濾波器等方法。1、混合編碼中的新技術(shù)(1)長(zhǎng)時(shí)預(yù)測(cè)濾波器濁音信號(hào)存在準(zhǔn)周期性,當(dāng)用濾波器pe(n)=s(n)—Zas(n-i)i=1描述語(yǔ)音信號(hào)時(shí),殘差序列e(n)保留著中準(zhǔn)周期性。為此,用一個(gè)稱(chēng)為長(zhǎng)時(shí)預(yù)測(cè)濾波器的B(z)來(lái)去除這種準(zhǔn)周期性。B(z)=ZIbz-(m+j)M+jj=-I

式中M是對(duì)應(yīng)于基音周期的樣點(diǎn)數(shù)。I根據(jù)濾波器階數(shù)一般取0或1。殘差。(「)經(jīng)B(z)濾波器濾波后將得到更加白化的噪聲譜。2、噪聲整形信號(hào)經(jīng)短時(shí)長(zhǎng)時(shí)濾波后,噪聲譜一般是平坦的。由于在兩個(gè)共振峰之間,信號(hào)譜低于噪聲譜,因此盡管總的信噪比是高的,但在陰影區(qū)域?qū)?yīng)的頻率上,噪聲能明顯被人耳感覺(jué)到。采用噪聲譜變形后,總的信噪比有所降低,但在所有頻率上信號(hào)的能量大于噪聲的能量,由于人耳的選擇性,可以形成對(duì)噪聲的聽(tīng)覺(jué)屏蔽效應(yīng),所以采用噪聲整形。功率譜dB頻率kHz(a)加噪聲譜變形3、合成分析法(AnalasysBySythesisA-B-S)波形編碼器一般要嵌入一個(gè)解碼器,使得解碼信號(hào)與原始信號(hào)作差,提供一個(gè)比較信息或形成后向自適應(yīng)。在參數(shù)編碼時(shí)也用這一類(lèi)方法,將合成信號(hào)與原始信號(hào)作差(加權(quán))并比較,以次為依據(jù)進(jìn)行參數(shù)修正或選擇激勵(lì),這種方法稱(chēng)為A-B-S。LPC編碼方法的二元激勵(lì)模型過(guò)于簡(jiǎn)化。(1)多脈沖激勵(lì)線性預(yù)測(cè)編碼器MPLPC的關(guān)鍵問(wèn)題是,如果一幀中允許用M個(gè)激勵(lì)脈沖,如何求出

這M個(gè)脈沖的位置和幅度,使得合成語(yǔ)音與原始語(yǔ)音的感覺(jué)加權(quán)均方誤差最小。用自相關(guān)法求出短時(shí)濾波器A(z)后經(jīng)聽(tīng)覺(jué)加權(quán)處理,其沖擊響應(yīng)為:一 c P 一h(n)=b(n)+zarjh(n一j) 1<n<Nj=i它們激勵(lì)綜合濾波器合成語(yǔ)音信號(hào)為:s(n)=z1gh(n一m)① in ii=1(2) 規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼器(RPE-LPC)規(guī)則脈沖是多脈沖的一種,即脈沖間隔固定的多脈沖激勵(lì)。對(duì)于規(guī)則脈沖激勵(lì),算法可以簡(jiǎn)化。其結(jié)構(gòu)圖如下:5(口)原始語(yǔ)音&) r(n)殘差―4激勵(lì)發(fā)生器V'X^ 11/A(z/r)一—|均方誤差最小估值|<__ew(n 規(guī)則脈沖是讓原始語(yǔ)音經(jīng)短時(shí)濾波后的信號(hào)r(n)與激勵(lì)信號(hào)作差,然后對(duì)感覺(jué)加權(quán)后的差值信號(hào)求均方誤差最小來(lái)確定最佳激勵(lì)。規(guī)則脈沖激勵(lì)的問(wèn)題是A、確定規(guī)則脈沖最佳的相位B、為每個(gè)非零脈沖確定一個(gè)幅度。(4)碼激勵(lì)CELP通過(guò)LPC分析去除信號(hào)的短時(shí)相關(guān)性,再用長(zhǎng)時(shí)基音分析去除基音周期性,得到的是信號(hào)具有高斯白噪聲特性。(5)G.728低延遲碼激勵(lì)話音編碼算法(LD-CELP)A、特點(diǎn)a、每5個(gè)樣點(diǎn)為一幀,延遲為0.625msb、采用50階LPC濾波器,不用長(zhǎng)時(shí)預(yù)測(cè)和基音檢測(cè)c、50階LPC濾波器參數(shù)每4幀(20個(gè)樣點(diǎn),2.5ms)更新一次,具有時(shí)變參數(shù)特性d、3位增益碼書(shū),7位波形碼書(shū)的結(jié)構(gòu),增益碼書(shū)與波形碼書(shū)分別有0.5位冗余e、采用后向?yàn)V波技術(shù),因此不傳遞參數(shù)信息,只傳遞激勵(lì)信息f、采用對(duì)數(shù)增益濾波技術(shù),有效地降低碼書(shū)尺寸B、G.728原理可歸納為一個(gè)判據(jù),三個(gè)模塊。1)判據(jù)ming,HLminLPC分析模塊:3)包括四個(gè)濾波器:a.50階綜合濾波器10階感覺(jué)加權(quán)濾波器10階對(duì)數(shù)增益濾波器10階后濾波器(6)G.729:共軛結(jié)構(gòu)的代數(shù)碼激勵(lì)CS-ACELPG.729編碼器屬于CELP型編碼器,幀長(zhǎng)為10ms,采樣率為8kHz。通過(guò)對(duì)輸入語(yǔ)音信號(hào)進(jìn)行分析,提取出CELP模型參數(shù),包括線性預(yù)測(cè)濾波器系數(shù)、自適應(yīng)碼書(shū)和代數(shù)碼書(shū)的標(biāo)號(hào)和增益,將這些參數(shù)編碼后發(fā)往解碼器。A、編碼器原理框圖預(yù)處理綜合濾波器固定碼書(shū)LP分析量化內(nèi)插預(yù)處理綜合濾波器固定碼書(shū)LP分析量化內(nèi)插圖G.729編碼器原理基本框圖8、解碼器原理解碼器對(duì)接收到的碼流進(jìn)行解碼,得到對(duì)應(yīng)的編碼器參數(shù),利用這些參數(shù),構(gòu)成重建語(yǔ)音,再將重建語(yǔ)音送給后處理級(jí),后處理級(jí)包括基于長(zhǎng)時(shí)和短時(shí)合成濾波器的后濾波器,后面跟有一個(gè)高通濾波器加窗括基于長(zhǎng)時(shí)和短時(shí)合成濾波器的后濾波器,后面跟有一個(gè)高通濾波器加窗LP分析窗由兩部分組成:第一部分是半個(gè)哈明窗,第二部分是四分之一個(gè)余弦函數(shù)窗D、感覺(jué)加權(quán)濾波器卬(z)=禁儲(chǔ)=21+XYiaz-i1卬(z)=禁儲(chǔ)=21+XYiaz-i2ii=1濾波器系數(shù)ai是通過(guò)對(duì)輸入語(yǔ)音進(jìn)行LP分析而得到的,ai值每幀更新一次,以達(dá)到加權(quán)的作用。E、開(kāi)環(huán)基音分析為降低搜索閉環(huán)基音的復(fù)雜性,可以先把搜索圍限制在開(kāi)環(huán)基

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論