版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、語音編碼語音編碼(speech coding)將模擬話音信號變?yōu)閿?shù)字信號的過程。是數(shù)字通信中的一項重要技術(shù)。目的 在保持一定的算法復(fù)雜程度和通信時延的前提下,運(yùn)用盡可能少的信道容量傳遞盡可能高質(zhì)量的語音。高質(zhì)量低速率的語音編碼技術(shù)在各類通信網(wǎng)中得到了廣泛應(yīng)用。近年來,為了適應(yīng)數(shù)字移動通信網(wǎng)的發(fā)展,提出了一些適合移動信道的語言編碼技術(shù),主要包括歐洲GSM系統(tǒng)使用的規(guī)則脈沖激勵長期預(yù)測編碼(RPE-LTP)與美國提出的矢量和激勵線性預(yù)測編碼(VSELP)。分類 語音編碼技術(shù)通常分為3類:波形編碼、參量編碼和混合編碼,其中波形編碼和參量編碼是2 種基本類型。波形編碼 將時間域信號直接變換為數(shù)字代碼,
2、其目的是盡可能精確地再現(xiàn)原來的話音波形。波形編碼的基本原理是在時間軸上對模擬話音按一定的速率抽樣,然后將幅度樣本分層量化,并用代碼表示。解碼是其反過程,將收到的數(shù)字序列經(jīng)過解碼和濾波恢復(fù)成模擬信號。對于比特速率較高的編碼信號(例如:從1664 kbit/s),波形編碼技術(shù)能夠提供相當(dāng)好的話音質(zhì)量。但對于低速語音編碼信號(即比特率低于16 kbit/s),波形編碼的話音質(zhì)量顯著下降。 因而,波形編碼在對信號帶寬要求不太嚴(yán)格的通信中得到應(yīng)用。但對頻率資源相當(dāng)緊張的移動通信來說,這種編碼方式顯然不適合。脈沖編碼調(diào)制(PCM)和增量調(diào)制(M)以及它們的各種改進(jìn)型都屬于波形編碼技術(shù)。參量編碼 又稱為聲源
3、編碼,將信源信號在頻率域或其他正交變換域中提取特征參量,并將其變換為數(shù)字代碼進(jìn)行傳輸;解碼為其反過程,將接收到的數(shù)字序列經(jīng)變換恢復(fù)特征參量,再根據(jù)特征參量重建語音信號。具體地說,聲源編碼以發(fā)音機(jī)制的模型作為基礎(chǔ),用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來描述這個模型。在發(fā)送端從模擬話音信號中提取各個特征參量并進(jìn)行量化編碼,在接收端根據(jù)接收到的濾波器系數(shù)和聲源參數(shù)恢復(fù)原來的語音。這種編碼技術(shù)可實現(xiàn)低速率語音編碼,比特速率可壓縮到2 4.8 kbit/s)5,甚至更低,但語音質(zhì)量只能達(dá)到中等。線性預(yù)測編碼(LPC)及其各種改進(jìn)型都屬于參量編碼?;旌暇幋a 近年來提出的一類新的語言編碼技術(shù),它
4、將波形編碼和參量編碼結(jié)合起來,力圖保持波形編碼的高質(zhì)量的優(yōu)點(diǎn)以及參量編碼的低速率的優(yōu)點(diǎn)?;旌暇幋a數(shù)字語音信號中既包括若干語音特征參量又包括部分波形編碼信息。混合編碼可將比特速率請壓縮到4 16kbit/s,在816kbit/s范圍內(nèi)能達(dá)到良好的話音質(zhì)量。規(guī)則碼激勵長期預(yù)測編碼就是一種混合編碼方案??梢钥闯?,混合編碼是適合于數(shù)字移動通信的語音編碼技術(shù)。要實現(xiàn)低速、高質(zhì)量的語音編碼,必須采用信息壓縮技術(shù)。一般說來信息壓縮技術(shù)可分為2類:波形處理技術(shù)和量化技術(shù)。波形處理技術(shù)的目標(biāo)是消減語音波形的冗余度,包擴(kuò)線性預(yù)測分析,頻帶分割、正交變換和分析合成等。量化技術(shù)的目標(biāo)是在幅度量化上實現(xiàn)優(yōu)化,包括自適應(yīng)
5、量化、自適應(yīng)比特分配和矢量量化。典型的語音編碼方式與信息壓縮技術(shù)的關(guān)系如下圖所示。語音編碼方式與信息壓縮技術(shù)的關(guān)系框圖APC自適應(yīng)預(yù)測編碼;ADPCM自適應(yīng)差分脈碼調(diào)制;APC-AB帶自適應(yīng)比特分配的自適應(yīng)預(yù)測編碼;SBC子帶編碼;ATC自適應(yīng)變換編碼;TC-WVQ變換編碼(波形矢量量化);MPC多脈沖激勵編碼;CELP碼激勵線性預(yù)測編碼。語音質(zhì)量 在語音編碼技術(shù)中,對語音質(zhì)量的評價是一個重要問題。語音質(zhì)量高低的直接感受是聽者的主觀感覺,所以要客觀對語音質(zhì)量進(jìn)行測量是一個長期存在的難題。目前,廣泛采用的評定方法是所謂主觀評定等級(Subjective Opinion Scale),或稱為平均評
6、價得分(Mean Opinion Score,MOS)。其方法是,有數(shù)十名試聽者在不同信道環(huán)境中試聽并給予評分,然后對評分進(jìn)行統(tǒng)計處理,求出平均得分,分?jǐn)?shù)等級采用五級分制。需要指出的是,聽者對語音質(zhì)量的主觀感覺往往是和其注意力集中的程度相聯(lián)系的,因而,對應(yīng)于主觀評定等級,還有一個收聽注意力等級(Listening Effort Scale)。語音解碼 在接收端將收到的數(shù)字還原為模擬話音的過程。語音解碼的原理、方法和過程與語音編碼相反。語音編碼技術(shù)的應(yīng)用與發(fā)展語音數(shù)字化的技術(shù)基本可以分為兩大類:第一類方法是在盡可能遵循波形的前提下,將模擬波形進(jìn)行數(shù)字化編碼;第二類方法是對模擬波形進(jìn)行一定處理,但
7、僅對語音和收聽過程中能時候到的語音進(jìn)行編碼。其中語音編碼的三種最常用的技術(shù)是脈沖編碼調(diào)制(PCM)、差分PCM(DPCM)和增量調(diào)制(DM)。通常,公共交換電話網(wǎng)中的數(shù)字電話都采用這三種技術(shù)。第二類語音數(shù)字化方法主要與用于窄帶傳輸系統(tǒng)或有限容量的數(shù)字設(shè)備的語音編碼器有關(guān)。采用該數(shù)字化技術(shù)的設(shè)備一般被稱為聲碼器,聲碼器技術(shù)現(xiàn)在開始展開應(yīng)用,特別是用于幀中繼和IP上的語音。除壓縮編碼技術(shù)外,人們還應(yīng)用許多其它節(jié)省帶寬的技術(shù)來減少語音所占帶寬,優(yōu)化網(wǎng)絡(luò)資源。ATM和幀中繼網(wǎng)中的靜音抑制技術(shù)可將連接中的靜音數(shù)據(jù)消除,但并不影響其它信息數(shù)據(jù)的發(fā)送。語音活動檢測(SAD)技術(shù)可以用來動態(tài)的跟蹤噪音電平,并
8、為這個噪音電平設(shè)置一個享用的語音檢測閥值,這樣就使得語音靜音檢測器可以動態(tài)匹配用戶的背景噪聲環(huán)境,并將靜音抑制的可聽度降到最小。為了置換掉網(wǎng)絡(luò)中的音頻信號,這些信號不再穿過網(wǎng)絡(luò),舒適的背景聲音在網(wǎng)絡(luò)的任一端被集成到信道中,以確保話路兩端的語音質(zhì)量和自然聲音的連接。語音編碼技術(shù)的類別語音編碼方法歸納起來可以分成三大類:波形編碼、信源編碼、混合編碼。1波形編碼波形編碼比較簡單,編碼前采樣定理對模擬語音信號進(jìn)行量化,然后進(jìn)行幅度量化,再進(jìn)行二進(jìn)制編碼。解碼器作數(shù)模變換后再由低通濾波器恢復(fù)出現(xiàn)原始的模擬語音波形,這就是最簡單的脈沖編碼調(diào)制(PCM),也稱為線性PCM。可以通過非線性量化,前后樣值的差分
9、、自適應(yīng)預(yù)測等方法實現(xiàn)數(shù)據(jù)壓縮。波形編碼的目標(biāo)是讓解碼器恢復(fù)出的模擬信號在波形上盡量與編碼前原始波形相一致,也即失真要最小。波形編碼的方法簡單,數(shù)碼率較高,在64kbit/s至32kbit/s之間音質(zhì)優(yōu)良,當(dāng)數(shù)碼率低于32kbit/s的時候音質(zhì)明顯降低,16 kbit/s時音質(zhì)非常差。2信源編碼信源編碼又稱為聲碼器,是根據(jù)人的發(fā)生機(jī)理,在編碼端對語音信號進(jìn)行分析,分解成有聲音和無聲音兩部分。聲碼器每隔一定時間分析一次語音,傳送一次分析的的道德有無聲和濾波參數(shù)。在解碼端根據(jù)接收的參數(shù)再合成聲音。聲碼器編碼后的碼率可以做得很低,如1.2kbit/s、2.4kbit/s,但是也有其缺點(diǎn)。首先是合成語
10、音質(zhì)量較差,往往清晰度可以而自然度沒有,難于辨認(rèn)說話人是誰,其次是復(fù)雜度比較高。3混合編碼混合編碼是將波形編碼和聲碼器的原理結(jié)合起來,數(shù)碼率約在4kbit/s16kbit/s之間,音質(zhì)比較好,最近有個別算法所取得的音質(zhì)可與波形編碼相當(dāng),復(fù)雜程度介乎與波形編碼器和聲碼器之間。上述的三大語音編碼方案還可以分成許多不同的編碼方案。語音編碼屬性可以分為四類,分別是比特速率,時延、復(fù)雜性和質(zhì)量。比特律是語音編碼很重要的一方面。比特速率的范圍可以是從保密的電話通信的2.4kbit/s到64kbit/s的G.711PCM編碼和G.722寬帶(7KHz)語音編碼器。脈沖幅度調(diào)制數(shù)字化模擬波形的第一步建立一套用
11、于輸入信號波形抽樣的離散時間集。一般的數(shù)字化技術(shù)是基于使用周期性,規(guī)律間隔抽樣時間的。如果抽樣發(fā)生足夠頻繁,原始波形就能夠從抽樣序列中完全恢復(fù),使用低通濾波器在抽樣值之間插入波形值或進(jìn)行平滑。脈沖編碼調(diào)制上文中講述了脈沖幅度調(diào)制,使用離散抽樣的時間以模擬抽樣幅度來從不斷變化的模擬信號中提取信息。脈沖編碼調(diào)制是對PAM的擴(kuò)展,這里每一個模擬抽樣制備量化為代表某個數(shù)字編碼的離散值。因此,PA M系統(tǒng)通過在信源端加上模擬數(shù)字信號轉(zhuǎn)換器就能夠轉(zhuǎn)化成為PCM系統(tǒng)。典型的量化過程是其中量化間隔中心的單個離散值表示。在這種方式中,量化過程對信號抽樣值引入了一定程度的誤差或失真。這種誤差,就是所謂的量化噪聲,
12、可以通過建立大量小量化間隔來最小化。當(dāng)然,隨著量化數(shù)目的增加,需要唯一識別量化間隔的比特數(shù)也增加了。差分脈沖編碼差分脈沖編碼是專門設(shè)計充分利用在典型語音波形中抽樣與抽樣之間冗余的。因為抽樣間差異的范圍遠(yuǎn)小于單個抽樣的范圍,因此只需要更少的比特用于編碼抽樣間差異。抽樣速率通常是與可比較的PCM系統(tǒng)一樣的。因此在編碼器中的帶限濾波器和解碼器中的平滑濾波器基本上與那些用在傳統(tǒng)PCM系統(tǒng)中的濾波器是一樣的。對DPCM編碼器產(chǎn)生不同抽樣的簡單方法就是將前一個輸入抽樣直接存儲在抽樣保持電路中并使用模擬減法器來測試抽樣變化。信號的變化于是被量化并被編碼去傳輸。若采用DPCM結(jié)構(gòu),則更為復(fù)雜,當(dāng)然,因為一個輸
13、入是由被編碼的抽樣間差異進(jìn)行積分的反饋環(huán)路來重建的。實質(zhì)上,反饋的信號是對輸入信號的估計,該輸入信號是通過對被編碼的抽樣間差異進(jìn)行積分來獲得的。因此用于在解碼器中重建波形的反饋信號也是以同樣的方式獲得的。增量調(diào)制增量調(diào)制(DM)是又一種在語音波形中專門利用抽樣與抽樣之間冗余的數(shù)字化技術(shù)。實際上。DM能被認(rèn)為是DPCM的一個特殊情況,差信號的每抽樣僅使用1比特。唯一的1比特僅指出差異抽樣的極性,因此指示出了信號從上個抽樣開始時增加還是減少。對輸入波形的大致近似在反饋通路中進(jìn)行構(gòu)建的,當(dāng)差異為正的時侯通過上升一個量化階,或當(dāng)差異為負(fù)的時候,下降一個量化階來進(jìn)行。用這種方法,輸入信號被按照上升或下降
14、的序列以類似樓梯的方式來編碼。反饋信號會向一個方向上升直到近似信號超過了輸入信號,同時反饋會向反方向進(jìn)行直到輸入信號超過了近似信號。因此,當(dāng)跟蹤輸入信號時,DM輸出在輸入波形附近來回跳動,運(yùn)行通過平滑濾波器來精確的重建輸入信號。實現(xiàn)IP電話應(yīng)用的關(guān)鍵技術(shù)從最初的PC到PC的話音通信開始,IP電話已經(jīng)逐步走向成熟。目前的IP電話業(yè)務(wù)主要借助于網(wǎng)關(guān)來實現(xiàn)。從技術(shù)的角度看,IP電話信息經(jīng)過網(wǎng)關(guān)變成打包后的數(shù)據(jù),通過IP網(wǎng)絡(luò)輿到被叫一方的IP接入端,對端的網(wǎng)關(guān)接收到話音數(shù)據(jù)包后,進(jìn)行處理后將數(shù)據(jù)還原成模擬信號,再送給電話聽往筒或傳真機(jī)。IP電話是計算機(jī)通信和電話通信相結(jié)合的產(chǎn)物,它涉及許多技術(shù)領(lǐng)域,其
15、中最重要的包括以下幾項技術(shù)。語音壓縮編碼技術(shù)。1995年,國妹電聯(lián)批準(zhǔn)了一個被稱為G.729的新的話音壓縮標(biāo)準(zhǔn)。該標(biāo)采用的算法,可以僅用8KBPS的帶寬傳輸話音,話音質(zhì)量與32KBPSADPCM(差分脈沖編碼市制)相同。ADPCM在全球的公共電話網(wǎng)絡(luò)中被用于提供長話級話音。此后,這一壓縮話音標(biāo)準(zhǔn)又得到了進(jìn)一步的優(yōu)化改進(jìn)。話音優(yōu)先級技術(shù)。話音通信是一種對實時性要求高的業(yè)務(wù)。目前,由于因特網(wǎng)是一個廣域公用網(wǎng),因此網(wǎng)上的各種實時或非實時應(yīng)用都在占用帶寬。為了能保證提供高度音質(zhì)的IP電話通信,在廣域網(wǎng)寬不足的IP網(wǎng)絡(luò)上,一般需要話音優(yōu)先技術(shù)。目前,很多IP網(wǎng)絡(luò)的路由器都把話音包的優(yōu)先級作為最高,這樣,
16、路由器一旦發(fā)現(xiàn)話音包,就會將它們插入到IP包隊列的最前面優(yōu)先發(fā)送。這樣,網(wǎng)絡(luò)的昝與抖動情況對話音通信的影響均將得到改善。另一種提高話音處理優(yōu)先處理優(yōu)先級的技術(shù)是資源預(yù)留協(xié)議(RSVP),它專門為話音通信預(yù)留帶寬。只要有話音呼叫請求,網(wǎng)絡(luò)就根據(jù)規(guī)則為話音通信預(yù)留出設(shè)定帶寬,直到通話結(jié)束,帶寬才釋放。靜音抑制技術(shù)。一般說來,人們在進(jìn)行電話交談時,很多情況下處于靜音狀態(tài),例如,一方在講話時,另一方在聽,而且講話過程中有大量顯著的停頓。有關(guān)調(diào)查結(jié)果表明,在一路全雙工電話交談中,只有40%左右的信號是有效的。靜音抑制技術(shù)會檢測通話過程或傳真過程中的安靜時段,并在這些安靜時段停止發(fā)送語音包。這樣,大量的網(wǎng)
17、絡(luò)帶寬節(jié)省下來用于其他話音或數(shù)據(jù)通信。清除回聲的技術(shù)?;芈暿窃谟脩艚粨Q機(jī)或局用交換機(jī)一端,有少量未能被充分轉(zhuǎn)換而且沿原路返回而形成的。如果呼叫方離交換機(jī)不遠(yuǎn),回聲返回很快,人耳聽不出來,這種情況無關(guān)緊要。但要當(dāng)回聲返回時超過地10毫秒時,人耳就可聽到明顯的回聲了。為了防止回聲了。為了防止回聲,一般需要回聲消除技術(shù),在處理器中有特殊的軟件代碼監(jiān)聽回聲信號,并將它從聽話人的語音信號中清除。對于IP電話設(shè)備,回聲消除技術(shù)是十分重要的,因為一般IP網(wǎng)絡(luò)的時延很容易就達(dá)到50毫秒。處理話音抖動的技術(shù)。IP網(wǎng)絡(luò)的一個特征就是網(wǎng)絡(luò)延時與網(wǎng)絡(luò)抖動,這可能導(dǎo)致IP電話音質(zhì)下降。網(wǎng)絡(luò)延時是指一個IP包在網(wǎng)絡(luò)上傳輸
18、平均所需的時間網(wǎng)絡(luò)抖動是指IP包傳輸時間的長短時間的長短變化。當(dāng)?shù)母鞣N因素造成的話音延時超過200毫秒時,通話雙方一般就傾向于采用半雙工的通話方式。一方說完后另一方再說。另一方面,如果網(wǎng)絡(luò)抖動較嚴(yán)重,那么有的話音包因遲到被丟棄,會產(chǎn)生話音的斷續(xù)及部分失真,嚴(yán)重影響音質(zhì)。為了防止這種抖動,很多公司采用了抖動緩沖技術(shù),即在接收設(shè)定一個緩沖池中取出,解壓,播放給受話者。這種緩沖技術(shù)可以在一定限度內(nèi)有效地處理話音抖動,并提高音質(zhì)。小結(jié)在IP、FR和ATM上傳遞語音時選擇適當(dāng)?shù)恼Z音編碼技術(shù),充分利用資源并最大限度的利用語音編碼方案自身的技術(shù)特點(diǎn)是很重要的。語音壓縮一般用來描述速率小于64kbit/s語音的數(shù)字化。一般情況下,啟動時PCM的速率為64kbit/s,壓縮后速率變小。在理想狀態(tài)下,語音
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 云制造服務(wù)行業(yè)營銷策略方案
- 廣告材料制作行業(yè)相關(guān)項目經(jīng)營管理報告
- 家用電動打蠟機(jī)產(chǎn)業(yè)鏈招商引資的調(diào)研報告
- 為第人創(chuàng)建設(shè)計開發(fā)和維護(hù)網(wǎng)站行業(yè)營銷策略方案
- 發(fā)行預(yù)付費(fèi)代金券行業(yè)市場調(diào)研分析報告
- 心理治療服務(wù)行業(yè)市場調(diào)研分析報告
- 冷鏈智能包裝行業(yè)相關(guān)項目經(jīng)營管理報告
- 人工智能在醫(yī)療行業(yè)營銷策略方案
- 電競產(chǎn)業(yè)全解析-洞察電子競技的未來趨勢
- 定制生產(chǎn)假發(fā)套行業(yè)市場調(diào)研分析報告
- 基督教追悼會悼詞 一個母親去世追悼詞3篇
- Creo-7.0基礎(chǔ)教程-配套課件
- 幼兒園玩具安全教育(兒童版)
- 網(wǎng)課-文化之旅答案
- 馬克思主義經(jīng)典著作選讀智慧樹知到課后章節(jié)答案2023年下四川大學(xué)
- 小學(xué)數(shù)學(xué)《倍的認(rèn)識》教案基于學(xué)科核心素養(yǎng)的教學(xué)設(shè)計及教學(xué)反思
- 高中生如何交往人際關(guān)系主題班會課件
- GB/T 20638-2023步進(jìn)電動機(jī)通用技術(shù)規(guī)范
- 四年級作文-記一次活動之有趣的搶凳子游戲(課堂PPT)
- 國企領(lǐng)導(dǎo)人員管理暫行規(guī)定
- 高校學(xué)生干部培訓(xùn)會新聞稿
評論
0/150
提交評論