




已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
語音信號編碼早期的語音信號處理及傳輸均是以模擬的方式進(jìn)行的。20世紀(jì)30年代末脈沖編碼調(diào)制(PCM,Pulse Code Modulation)原理和聲碼器(Vocoder)概念被提出后,語音數(shù)字編碼便一直沿著這兩個方向發(fā)展。語音數(shù)據(jù)壓縮目的是能在盡可能低的傳輸速率上獲得高質(zhì)量的語音效果,即希望語音信號可以在帶寬較窄的信道中傳輸而語音質(zhì)量下降的不多或盡可能不下降。語音編碼系統(tǒng)早期用的是波形編碼方法,也叫波形編碼(或非參數(shù)編碼),其目的是力圖使重建的語音波形保持原語音信號的波形形狀。這種編碼器是把語音信號當(dāng)成一般的波形信號來處理,而并未考慮語音信號的冗佘度。它的優(yōu)點是具有較強(qiáng)的適應(yīng)能力,有較好的合成語音質(zhì)量,然而編碼速率高(64Kbits),編碼效率極低。脈沖編碼調(diào)制(PCM)、自適應(yīng)增量調(diào)制(ADM)、自適應(yīng)差分編碼(ADPCM)、自適應(yīng)編碼(APC)等都是屬于波形編碼(非參數(shù)編碼)。而聲碼器則是不同于波形編碼器的高效編碼方式。聲碼器又稱參數(shù)編碼(或模型編碼),它主要是對提取的語音信號特征參數(shù)進(jìn)行編碼,目的主要是使重建的語音信號具有盡可能高的可懂度,而不是要求重建波形保持原語音波形的形狀。因此,可能出現(xiàn)的情況是即使重建語音的可懂度高,但其時域波形與原語音的時域波形有較大的差別。這種編碼器的優(yōu)點是可達(dá)到極低的編碼速率而語音依然可懂,編碼速率可達(dá)到8Kbits、48Kbits甚至更低。主要缺點是重建語音自然度低,韻律感差,合成語音質(zhì)量差。聲碼器的典型代表是通道聲碼器、共峰聲碼器及線性預(yù)測聲碼器等。廣告插播信息維庫最新熱賣芯片: LM2901DR2 MC7805BT LM2676T-ADJ LA3430 RYT113432 CY62147CV18LL-70BAIT NJM072D KA8603 MC145160P AT45DB161D-TU20世紀(jì)80年代至今,不僅聲碼器和波形編碼器得到了很大發(fā)展,并且還有一種全新的革命性編碼方法被普遍推廣,這類編碼器叫混合編碼器。這種編碼器在傳送器中對給定編碼結(jié)構(gòu)的所有可能性進(jìn)行綜合,找出輸人語音的最好編碼形式,并從這些可能性中發(fā)現(xiàn)輸入語音的最優(yōu)主觀匹配,然后用數(shù)碼表示這種主觀匹配并發(fā)送到接收器。利用線性預(yù)測、VQ、ABS、感覺加權(quán)、后濾波等技術(shù)得到的多脈沖激勵線性預(yù)測(MPELP,Multi Pulse Enspirit LinePrognosticate),規(guī)則脈沖激勵線性預(yù)測(RPELP,Rule Pulse Enspirit Line Prognosticate),碼本激勵線性預(yù)測(CELP,Code Enspirit Line Prognosticate) 編碼速率達(dá)到816Kbits甚至更底,其話音質(zhì)量高、編碼速率低,但算法復(fù)雜。近年來,ITUT在多媒體數(shù)字通信方面(包括電視會議等)制定了一系列國際標(biāo)準(zhǔn)(按ITU的說法是建議)。表1 ITUT多媒體會議標(biāo)準(zhǔn)(基本模式)在現(xiàn)有的網(wǎng)路設(shè)施條仵下,H320和H323比較適用的標(biāo)準(zhǔn)。H320的基本音頻模式是G711 log-PCM(對數(shù)脈碼調(diào)制)編碼解碼器,它是一種簡單的8kHz采樣頻率對數(shù)脈碼調(diào)制模式,長期以來它都是數(shù)字電話網(wǎng)絡(luò)主要的編碼方法(長途電話盡管起源于模擬電話,現(xiàn)在長途電話在數(shù)字網(wǎng)絡(luò)上傳輸)。G711定義為8位編碼,速率為64Kbits,但在H320中采樣截短為6或7比特位,因為速率相應(yīng)變?yōu)?8Kbits或56Kbits。G711提供了出色的長話音質(zhì)窄帶(3kHz音頻帶寬)語音、不太明顯的編解碼延遲(低于1ms)以及非常低的實現(xiàn)復(fù)雜性。為了提供與普通G711音頻電話的兼容性,所有的H320呼叫在H221 FAS和BAS信道中進(jìn)行同步初始化和模式協(xié)商時開始發(fā)送和接收G711音頻。G711有很多優(yōu)點,但是G711指定了兩個不同的編碼A律和律,在采用G711標(biāo)準(zhǔn)的區(qū)域,不同地方使用上述兩種不同的方法。CCITT不能達(dá)成統(tǒng)一的編碼方法。結(jié)果是H320系統(tǒng)必須由遠(yuǎn)端在每次呼叫開始時自動發(fā)現(xiàn)使用的編碼律,或者避免使用音頻直到H320控制過程能用來建立另一音頻模式。而且,G711因為它的低復(fù)雜性和與普遍電話的兼容性成為H320的基本音頻模式,但與其他H320音頻模式相比在使用帶寬方面它是效率低下的。如果轉(zhuǎn)到其他音頻模式下節(jié)省的數(shù)據(jù)帶寬可用來傳送更多的視頻位,將使H320視頻質(zhì)量有很大不同,特別是在普通的2B(128Kbits)H320呼叫上。鑒于G711語音壓縮協(xié)議本身的一些缺點,人們一直在找一種替代它的協(xié)議,現(xiàn)在已經(jīng)開始用的有G722協(xié)議和G728協(xié)議。G728是目前H320中用得較多的窄帶音頻模式。它是基于通常的8kHz窄帶采樣和5個采樣(0625ms)的音頻幀的低時延碼本激勵線性編碼(LDCELP),比特率為16Kbits,提供很好的長話音質(zhì),總延遲為大約1875ms。在現(xiàn)有網(wǎng)絡(luò)條件下,需要一個窄帶音頻模式,但是又要有相當(dāng)好的語音質(zhì)量。 最近建立的8Kbits電話標(biāo)準(zhǔn)真正提高了該速率下的語音品質(zhì)并改善了復(fù)雜性,這種編碼器在某種程度上是一個突破,因此它的嚴(yán)格規(guī)范使性能達(dá)到或超過了32Kbits的G726 ADPCM,但速率僅為8Kbits。ITU G729 SKbits標(biāo)準(zhǔn)在性能上不亞于G726,其算法延時少于16ms,隨機(jī)誤碼和背景噪聲的性能都不低于G726,具有與自身的非同步串聯(lián)能力。比如說,兩級串聯(lián)的性能不低于G726四級串聯(lián)的性能,達(dá)到這個水平的編碼稱為共扼結(jié)構(gòu)代數(shù)碼激勵線性預(yù)測(CSACELP),它采用特殊的碼本結(jié)構(gòu)簡化碼本查找。由于G729的優(yōu)點突出,特別適合目前網(wǎng)絡(luò)條件,因此其在多媒體會議中的應(yīng)用越來越受到重視。G729的算法被稱作共軛結(jié)構(gòu)代數(shù)碼激線性預(yù)測(CSACELP,ConjugateStructuredAlgebraic Code Excited Linear Predictive),它構(gòu)成了G729標(biāo)準(zhǔn)的基礎(chǔ)。CSACELP在標(biāo)準(zhǔn)PCM或線性PCM的話音采樣基礎(chǔ)上,每10ms生成一個10字節(jié)長的話音幀。對于每一個語音幀提取CELP模型參數(shù),再對這些參數(shù)在編碼后以每幀80bit進(jìn)行信道傳輸,在解碼端,接收到的比特流通過激勵碼本解碼成相應(yīng)的CELP參數(shù),再通過短時綜合濾波器和長時綜合濾波器重建語音幀,最后經(jīng)過后向濾波進(jìn)行語音增強(qiáng)。該算法提供了優(yōu)秀音質(zhì),且延時很小。CSACELP也是為先進(jìn)的定點運算數(shù)字信號處理器設(shè)計的,因為它要求強(qiáng)大的運算處理能力。CSACELP編碼步驟的方框圖如圖1所示。圖1 CS-ACELP編碼步驟其固定的碼本具有一個代數(shù)結(jié)構(gòu),稱為交錯單脈沖排列設(shè)計(1SPP)。碼本中每40個樣本激勵向量僅有4個非零脈沖,記為i0,i1,i2和i3,其幅值和位置見表2,每個激勵碼字可寫成:c(n)=S0(n-m0)+S1(n-m1)+S2(n-m2)+S3(n-m3),n=0,39其中(n)是時刻n的單位沖激函數(shù)。表2 脈沖幅值和位置從表中可看到,脈沖幅值僅為1或1,由于這種限制,再加上碼字的稀疏,使得碼本搜索大大簡化了,各個脈沖的位置也存在限制,如表2所示,可以看到脈沖i1僅能位于m1=16,6,1116,2126,3136中的某一位置。這些位置與其他3個脈沖的位置都不相同,為了提高這些限制激勵的諧波結(jié)構(gòu),碼向量要通過一個自適應(yīng)間隔濾波器:其中是自適應(yīng)增益,T是當(dāng)前子幀的間隔延遲,碼本搜索是從碼向量的一個脈沖開始,然后進(jìn)行4個嵌套循環(huán),每次循環(huán)對應(yīng)一個新加人的脈沖。由于4個脈沖的位置不連續(xù),我們使用一個共扼搜索,這是局部碼本搜索,它在第3個循環(huán)之后限制碼本搜索的努力,這種搜索產(chǎn)生的語音品質(zhì)和SNR與全搜索相當(dāng),但碼本搜索量只有它的5。前3個脈沖的位置每個用3bit表示,第4個用4bit,脈沖幅度每個用1bit表示,所以每個子幀不包括增益的位數(shù)是17bit。圖2表示CSACELP解碼器,表3列出圖中的參數(shù)和每個子幀為5ms長時其更新的快慢程度??梢钥吹剑?Kbits中有6200bits的比特率用于表示激勵。圖2 CSACELP解碼步驟表3 參數(shù)和每個子幀實現(xiàn)G729算法需要有很強(qiáng)的運算能力的芯片,因此以運算能力強(qiáng)大的DSP來實現(xiàn)其算法比較好。TI的C54系列的DSP擁有強(qiáng)的定點運算能力,作為高性價比DSP中的16位定點DSP芯片,C54x和C540x都適用于語音通信等實時嵌入應(yīng)用場合。C54x和C540x具有高度靈活的可操作性和高速的處理能力。實現(xiàn)G729算法程序較大,下面介紹一種簡單的易于實現(xiàn)的線性增量調(diào)制算法(CVSD,Continuously Variable Slope Delta)編碼方法,實現(xiàn)對語音信號的編碼以及相應(yīng)的解碼算法。CVSD是一種量階隨著輸人語音信號平均斜率大小而連續(xù)變化的增量調(diào)制方式。它的工作原理是使用多個連續(xù)可變斜率的線段來逼近語音信號,當(dāng)斜率為正時,對應(yīng)的數(shù)字編碼為1;當(dāng)斜率為負(fù)時,對應(yīng)的數(shù)字編碼為0。當(dāng)CVSD工作于編碼方式時,其系統(tǒng)框圖如3所示。語音輸人信號fin(t)經(jīng)采樣得到數(shù)字信號f(n),數(shù)字信號f(n)與積分器輸出信號g(n)比較后輸出偏差信號e(n),偏差信號經(jīng)判決后輸出數(shù)字編碼y(n),該信號同時作為積分器輸出斜率的極性控制信號和積分器輸出斜率大小邏輯的輸人信號。在每個時鐘周期內(nèi),若語音信號大于積分器輸出信號,則判決輸出為1,積分器輸出上升一個量階;若語音信號小于積分器輸出信號,則判決輸出為0,積分器輸出下降一個量階。圖3 CVSD編碼系統(tǒng)框圖當(dāng)CVSD工作于解碼方式時,其系統(tǒng)框圖如圖4所示。在每個時鐘周期內(nèi),數(shù)字編碼y(n)被送到連碼檢測器,然后送到斜率幅度控制電路以控制積分器輸出斜率的大小。若數(shù)字編碼y(n)輸入為1,則積分器的輸出上升一個量階;若數(shù)字輸入為0,則積分器的輸出下降一個量階,這相當(dāng)于編碼過程的逆過程。積分器的輸出通過低通濾波器平滑濾波后將重現(xiàn)輸入語音信號fin(t)。圖4 CVSD解碼系統(tǒng)框圖可見輸人信號的波形上升越快,輸出的連1碼就越多,同樣下降越快連0碼越多,CVSD編碼能夠很好地反映輸入信號的斜率大小。為使積分器的輸出能夠更好地逼近輸人語音信號,量階隨著輸入信號斜率大小而變化,當(dāng)信號斜率絕對值很大,編碼出現(xiàn)3個連1或連0碼時,則量階加一個增量,當(dāng)不出現(xiàn)上述碼型時,量階則相應(yīng)地減少。為了減少編碼及譯碼的偏差,要求編碼和譯碼過程使用相同的時鐘頻率,而且采樣頻率應(yīng)符合奈奎斯特采樣定理,即至少為語音輸人頻率的兩倍。CVSD通過不斷改變量階大小來跟蹤信號的變化以減小顆粒噪聲與斜率過載失真,量階調(diào)整是基于過去的3個或4個樣值輸出。具體編碼程序流程如圖5所示,具體解碼程序流程如圖6所示。經(jīng)過編碼和解碼后的語音信號和原始信號的比較如圖7所示。圖5 語音編碼流程圖圖6 語音
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年化工廠事故應(yīng)急預(yù)案演練計劃
- 高三班主任學(xué)科競賽組織工作計劃
- 醫(yī)療數(shù)據(jù)質(zhì)量管理與安全保護(hù)計劃
- 建筑企業(yè)安全質(zhì)量雙重培訓(xùn)計劃
- 2025年公務(wù)員考試時事政治??寄M試題【模擬題】附答案詳解
- 蘇少版四年級下冊美術(shù)教學(xué)資源計劃
- 物流中心安全保障年度應(yīng)急演練計劃
- 2025年公共衛(wèi)生中心感控培訓(xùn)計劃
- 2025年公務(wù)員考試時事政治每日一練試卷含完整答案詳解【典優(yōu)】
- 高新技術(shù)企業(yè)廠房使用權(quán)轉(zhuǎn)讓合同
- 帆狀胎盤的臨床護(hù)理
- 外研版(2024)七年級英語上冊++課文中文翻譯
- 【MOOC】結(jié)構(gòu)力學(xué)基礎(chǔ)-西南交通大學(xué) 中國大學(xué)慕課MOOC答案
- 2024廣東省勞動合同范本范本下載
- 水利信息化水質(zhì)監(jiān)測系統(tǒng)單元工程質(zhì)量驗收評定表、檢查記錄
- 心胸外科管理制度
- 客戶月結(jié)協(xié)議合同模板
- 2024年重慶十八中小升初數(shù)學(xué)試卷
- Starter Unit 2 Keep Tidy教學(xué)設(shè)計 2024-2025學(xué)年人教版英語七年級上冊
- 簡易呼吸器的使用-
- 天津市城市道路工程施工及驗收標(biāo)準(zhǔn)
評論
0/150
提交評論