互聯(lián)網(wǎng)實(shí)時(shí)語音通信技術(shù)的研究_第1頁
互聯(lián)網(wǎng)實(shí)時(shí)語音通信技術(shù)的研究_第2頁
互聯(lián)網(wǎng)實(shí)時(shí)語音通信技術(shù)的研究_第3頁
互聯(lián)網(wǎng)實(shí)時(shí)語音通信技術(shù)的研究_第4頁
互聯(lián)網(wǎng)實(shí)時(shí)語音通信技術(shù)的研究_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、互聯(lián)網(wǎng)實(shí)時(shí)語音通信技術(shù)的研究互聯(lián)網(wǎng)實(shí)時(shí)語音通信技術(shù)的研究1引言Internet在全世界范圍內(nèi)的快速開展和語音信號(hào)處理技術(shù)的進(jìn)步,促進(jìn)了vP(IP網(wǎng)絡(luò)下的語音技術(shù))業(yè)務(wù)的興起。由于VIP務(wù)以傳統(tǒng)的Iternet為根本平臺(tái),具有不可比較的價(jià)格優(yōu)勢(shì),因此開展前景非常廣闊。我門通過設(shè)計(jì)的兩臺(tái)計(jì)算機(jī)間的語音通信軟件,實(shí)現(xiàn)了全雙上語音通信信。P-P的語音傳輸,需要麥克風(fēng)、音響。聲卡本文由論文聯(lián)盟.LL.搜集整理等設(shè)備就可以通過IP網(wǎng)實(shí)現(xiàn)這種應(yīng)用。這種VIP方案的顯著優(yōu)點(diǎn)就是可以支持多媒體通信,主要適用于計(jì)算機(jī)用戶。其原理是利用 軟件把送入話筒的聲音進(jìn)展編碼壓縮、分組,變成IP數(shù)據(jù)報(bào),經(jīng)Inteet網(wǎng)絡(luò)傳送

2、;接收端利用軟件進(jìn)展解碼,復(fù)原成原來的信號(hào)后送到揚(yáng)聲器中。由于軟件所需要的設(shè)備較為簡(jiǎn)單,尤其是隨著計(jì)算機(jī)的日益普及、各種硬件設(shè)備不斷開展;局域網(wǎng)不斷增加;通信信道容量不斷增加;計(jì)算機(jī)PU處理才能不斷增強(qiáng);具有人工智能的可即插即用軟件代碼技術(shù)的出現(xiàn)等等,這些郡為VIP的開展提供了強(qiáng)有力的技術(shù)支持。在以上處理過程中,要用到一系列的網(wǎng)絡(luò)接口以及緩沖區(qū)來處理數(shù)據(jù),但是當(dāng)前還沒有一種固定的和通用的策略可以完全解決VlP應(yīng)用中的QS問題。本文就存在的問題進(jìn)展了分析,并給出了一組解決問題的策略。2問題的提出(1)時(shí)延、抖動(dòng)和丟包三者之間的關(guān)系從網(wǎng)絡(luò)的角度來看,時(shí)廷、抖動(dòng)和丟包三省同時(shí)制約于網(wǎng)絡(luò)的運(yùn)行狀況,當(dāng)

3、網(wǎng)絡(luò)的效勞質(zhì)量下降時(shí),三者均迅速惡化,從終端處理的角度來看,時(shí)延。抖動(dòng)和丟包三者之間又互相影響,比方:在終端處理中,為減小抖動(dòng)帶來的影響,就要采用抗抖動(dòng)緩沖區(qū),這就引入了額外的時(shí)延;為了減小遲到的語音包數(shù)量,可以延遲語音的回放,但也會(huì)引入額外的時(shí)延;為了采用丟包恢復(fù)技術(shù),往往需要利用后續(xù)幀信息,這樣也就引入了一定的時(shí)延;假如抖動(dòng)效應(yīng)加強(qiáng),勢(shì)必會(huì)引起遲到的語音包數(shù)量增多。為理解決好話音質(zhì)量出問題,就必須在這三者當(dāng)中效蝦權(quán)衡。(2)緩沖區(qū)機(jī)制對(duì)語音實(shí)時(shí)傳輸性能的影響緩沖區(qū)機(jī)制對(duì)語音實(shí)時(shí)傳輸性能的影響也就是對(duì)語音從采樣到回放這一時(shí)間延遲的影響,特別是當(dāng)為了滿足內(nèi)存分配的需求而挪動(dòng)全局內(nèi)存塊和拋棄可拋

4、棄的內(nèi)存塊時(shí),消耗的系統(tǒng)時(shí)間將對(duì)一些實(shí)時(shí)性操作產(chǎn)生嚴(yán)重影響,在語音實(shí)時(shí)通信中,用擴(kuò)大內(nèi)存的有效的頁面技術(shù)和磁盤交換技術(shù)將不再適用,因?yàn)檫@些語音數(shù)據(jù)塊不能放在真正的主存中以滿足實(shí)時(shí)性要求,需要通過設(shè)計(jì)數(shù)據(jù)構(gòu)造和信息列表實(shí)現(xiàn)優(yōu)化的緩沖機(jī)制。同時(shí)緩沖機(jī)制對(duì)語音的連續(xù)性也有很大影響,假如定制的錄音緩沖區(qū)過小,就會(huì)使錄制的語音幀過小,從而使語音蠻得不連接。對(duì)內(nèi)存資源的過度占用將導(dǎo)致系統(tǒng)資源的缺乏。因此需要一種既高效利用內(nèi)存,又盡量減少語音傳輸時(shí)延的緩沖區(qū)管理機(jī)制。(3)網(wǎng)絡(luò)分組信息的喪失分組喪失對(duì)語音質(zhì)量有非常大的不良影響。當(dāng)語音經(jīng)過個(gè)使用分組喪失作為手段來管理數(shù)據(jù)網(wǎng)絡(luò)阻塞的略由器的,這是很費(fèi)事的。對(duì)于

5、TP的數(shù)據(jù),端站簡(jiǎn)單地重新發(fā)送喪失的數(shù)據(jù)并降低它們的通信速率,緩解阻塞,保證數(shù)據(jù)正確性,而對(duì)于UDP協(xié)議的語音,沒有時(shí)間進(jìn)展重新發(fā)送,所以VlP系統(tǒng)只能適應(yīng)這種喪失。除了由于中間網(wǎng)絡(luò)部件引起的分組喪失外,語音網(wǎng)絡(luò)中由于超出抖動(dòng)緩沖區(qū)的可忍受的到達(dá)延時(shí)也引起分組喪失。在分組被喪失的情況下,假如語音分組喪失是隨機(jī)的、不相關(guān)的,當(dāng)前的語音編碼器的聲碼器在分組喪失率小于10的情況下,簡(jiǎn)單的方法是在喪失包的間隔處插入最后接收到的包,仍能恢復(fù)出質(zhì)量可承受的語音信號(hào)。當(dāng)然,也可以設(shè)計(jì)出優(yōu)化的緩沖區(qū),從而前向糾錯(cuò)以減少對(duì)語音質(zhì)量的影響。3網(wǎng)絡(luò)協(xié)議的選擇策略實(shí)時(shí)語音的特點(diǎn):實(shí)時(shí)性要求高,且允許語音數(shù)據(jù)在一定的范

6、圍內(nèi)出錯(cuò);IP語音的特點(diǎn):由于IPV4不可以提供效勞質(zhì)量保證,所以丟包率和抖動(dòng)是不可預(yù)知的,并且把它們帶到了上層協(xié)議IPUDP中。TP的特點(diǎn):能提供面向連接的流傳輸,可靠性很高,但是會(huì)占用網(wǎng)絡(luò)較多的資源;UDP的特點(diǎn):能提供無連接的數(shù)據(jù)包傳輸,不可靠,對(duì)網(wǎng)絡(luò)的資源占用較少。由于TP在傳輸數(shù)據(jù)前建立的是虛鏈路,它不能保證各個(gè)語音包在相等的時(shí)間內(nèi)到達(dá),即無法防止話音抖動(dòng)現(xiàn)象。而且當(dāng)網(wǎng)絡(luò)狀況不佳時(shí),也無法防止喪失語音包,即使重傳也有可能無法滿足語音的實(shí)坷性。更有甚者,它的窗口技術(shù)也會(huì)造成較大的附加抖動(dòng)。至于UDP,那么有可能出現(xiàn)語音包的喪失、重復(fù)和失序(好在語音通信允許出錯(cuò)),話音抖動(dòng)現(xiàn)象也無法避(

7、比TP好),效率較TP要高。但需要在應(yīng)用層增添排序、抗抖、抗重復(fù)和抗丟包等功能。所以,對(duì)于網(wǎng)絡(luò)時(shí)延較大的場(chǎng)合,一般選用UDP來傳輸語音包;而在網(wǎng)絡(luò)負(fù)載較小的場(chǎng)合,TP更為方便。如圖分別為TPAJDP編程時(shí)序圖。隨著IPv6的成熟應(yīng)用,不僅用于解決In-ternet網(wǎng)絡(luò)地址的危機(jī),而且在解決Internet網(wǎng)絡(luò)性能方面也有很大的打破;在4ESV中提供了對(duì)QS的支持,在IPv6中定義了兩個(gè)參數(shù);業(yè)務(wù)類別域和數(shù)據(jù)流標(biāo)志位。業(yè)務(wù)類別域?qū)P包的優(yōu)先級(jí)分為16級(jí),優(yōu)先級(jí)分為兩類:0-7用于在網(wǎng)絡(luò)發(fā)生擁塞時(shí)通過減少數(shù)據(jù)包的發(fā)送速度來實(shí)現(xiàn)擁塞控制的業(yè)務(wù);8-15用于一些實(shí)時(shí)性很強(qiáng)的業(yè)務(wù),它在網(wǎng)絡(luò)擁塞時(shí)不作任

8、何減少流量的控制。對(duì)于那些需要特殊QS的業(yè)務(wù),可在IP數(shù)據(jù)包中設(shè)置相應(yīng)的優(yōu)先級(jí),路由器根據(jù)IP包的優(yōu)先級(jí)來處理數(shù)據(jù)。因此,vIP將得到更好的應(yīng)用。4緩沖區(qū)的設(shè)計(jì)謀略(1)發(fā)送端緩沖區(qū)的設(shè)計(jì)在語音發(fā)送端,語音采集時(shí)必需要申請(qǐng)緩沖區(qū),而且這種緩沖區(qū)既用作語音信號(hào)的輸入,又用作語音幀的輸出。假如采用單一緩沖區(qū)機(jī)制,將有可能出現(xiàn)數(shù)據(jù)覆蓋問題。數(shù)據(jù)發(fā)送操作中也存在此問題,實(shí)際應(yīng)用必須通過實(shí)驗(yàn)確定緩沖區(qū)的數(shù)目,既保證語音數(shù)據(jù)庫不喪失,又不會(huì)多用內(nèi)存。決定發(fā)送緩沖區(qū)的數(shù)目的因素有兩個(gè),一個(gè)是編碼緩沖區(qū)的數(shù)目;另一個(gè)是一個(gè)數(shù)據(jù)分組的發(fā)送的最長(zhǎng)時(shí)間與一個(gè)數(shù)據(jù)分組的最短打包時(shí)間的比值,由于實(shí)際應(yīng)用中,實(shí)時(shí)語音的傳

9、送一般采用非連接的網(wǎng)絡(luò)傳輸協(xié)議,所以發(fā)送緩沖區(qū)的數(shù)目可以小于或者等于編碼緩沖區(qū)的數(shù)目。決定編碼緩沖區(qū)的數(shù)目的因素有兩個(gè),一個(gè)是錄音緩沖區(qū)的數(shù)據(jù)目;另一個(gè)是一個(gè)數(shù)據(jù)分組的最長(zhǎng)打包時(shí)間與一個(gè)數(shù)據(jù)分組的最短編碼時(shí)間的比值,假如這個(gè)比值小于1,那么對(duì)編碼緩沖區(qū)的數(shù)目沒有特殊要求,假如大于1,那么要求有盡可能大的編碼緩沖區(qū)數(shù)目,但一般不要超過錄音緩沖區(qū)的數(shù)目,這是由語音數(shù)據(jù)的實(shí)時(shí)性和連續(xù)性所決定的。(2)接收端緩沖區(qū)數(shù)目在語音接收端必須有一組接收緩沖區(qū),理由有三:IP網(wǎng)絡(luò)阻塞狀況不穩(wěn)定,數(shù)據(jù)到達(dá)有時(shí)非常集中,而接收數(shù)據(jù)又會(huì)花費(fèi)一定的時(shí)間,太少的緩沖區(qū)會(huì)造成數(shù)據(jù)的喪失;由于IP網(wǎng)絡(luò)只提供一種盡力型效勞,不

10、可防止地造成分組喪失和亂序,假如不加以處理,必然會(huì)影響實(shí)時(shí)語音的效果。而處理這些情況都需要存儲(chǔ)空間,表現(xiàn)為一定數(shù)目的緩沖區(qū);必須對(duì)接收到的數(shù)據(jù)進(jìn)展后續(xù)的處理,而這些處理要產(chǎn)生一定的時(shí)延,假如只有一個(gè)接收緩沖區(qū),有可能接收到的數(shù)據(jù)來不及得到處理就被覆蓋了。另外,與語音發(fā)送方相對(duì)應(yīng),在語音接收方需要解碼緩沖區(qū)和回放緩沖區(qū)。由于網(wǎng)絡(luò)延遲抖動(dòng)的存在和語音應(yīng)用天然的等時(shí)性要求,必須對(duì)語音回放設(shè)定一個(gè)回放延遲,即按照一定的時(shí)間間隔回放語音幀,這就需要有一定數(shù)目的緩沖區(qū)來存放等待回放的語音鄭(3)緩沖區(qū)的大小錄音時(shí),緩沖區(qū)大小的選擇也是一個(gè)關(guān)鍵性的問題。因?yàn)榧偃缇彌_區(qū)過小,生成的語音幀也就會(huì)過小,語音的連續(xù)

11、性遭到破壞,同時(shí)數(shù)據(jù)分組的有效數(shù)據(jù)率也會(huì)過小,相對(duì)增加了網(wǎng)絡(luò)負(fù)擔(dān)。假如緩沖區(qū)過大,會(huì)在語音錄制時(shí)和其它處理時(shí)造成比較大的處理時(shí)延,還有可能造成發(fā)送的數(shù)據(jù)分組過大而導(dǎo)致某協(xié)議層的數(shù)據(jù)分割與合并,形成很大的傳輸時(shí)延。所以錄音緩沖區(qū)要選擇適宜的大小,必須在語音的連續(xù)性和時(shí)延之間進(jìn)展平衡。編碼緩沖區(qū)的大小取決于錄音緩沖區(qū)的大小和所采用的編碼算法。實(shí)際應(yīng)用中有可能采用不同的編碼算法,以適應(yīng)多變的網(wǎng)絡(luò)傳輸狀況。緩沖區(qū)的大小要采用所需的最大值。計(jì)算方法如下:針對(duì)一個(gè)語音包,包長(zhǎng)度RTP頭+UDP頭+IP頭+Etheet頭+有效載荷。其中RTP頭96bit(12byte);UDP頭=64bit(8byte);

12、IP頭=160bit(20byte);Ethernet頭=208bit(26byte)。所以,包長(zhǎng)度(96+64+160+208)十有效載荷528bit+有效載荷。有效載荷打包周期(秒)x每秒的比特?cái)?shù)帶寬包長(zhǎng)度x每秒包數(shù)(528打包周期)+每秒比特?cái)?shù)因此,要根據(jù)不同的語音編解碼技術(shù),設(shè)計(jì)不同的緩沖區(qū):G711,每秒比特?cái)?shù)是64kG729,每秒比特?cái)?shù)是8kG723,兩種,一種是53k,另一種是63kG711,20s打包,帶寬為(52820+64)kbitsG711,30s打包,帶寬為(52830+64)kbitsG729,20s打包,帶寬為(52820+8)kbitsG723,53k,30s打包,帶寬為(52830+53)kbits(4)緩沖區(qū)的申請(qǐng)和釋放語音通信中對(duì)數(shù)據(jù)塊的使用是一次性的。在各個(gè)語音數(shù)據(jù)模塊中,一個(gè)數(shù)據(jù)塊只會(huì)在某個(gè)操作中作短暫緩存,處理之后,該數(shù)據(jù)塊對(duì)操作不再有任何意義。我們根據(jù)實(shí)時(shí)語音數(shù)據(jù)的需要,充分利用內(nèi)存硬件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論