版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語(yǔ)音信號(hào)矢量量化論文摘要:隨著科學(xué)技術(shù)日新月異的變化,矢量量化技術(shù)也將在方法、理論上有新的發(fā)展,特別是在語(yǔ)音識(shí)別方面,同隱馬爾可夫鏈結(jié)合使用,直接用于構(gòu)成語(yǔ)音識(shí)別和說(shuō)話(huà)人識(shí)別系統(tǒng)。在低速語(yǔ)音編碼和合成方面,用于特定的人和非特定的人的語(yǔ)音識(shí)別,許多研究是很有實(shí)用性的。隨著半導(dǎo)體技術(shù)和微電子工藝的成熟發(fā)展,針對(duì)各種硬件,例如各種DSP的特點(diǎn),開(kāi)發(fā)對(duì)應(yīng)的矢量量化算法已成為熱點(diǎn),進(jìn)一步的研究會(huì)使其在今后的語(yǔ)音通信中發(fā)揮越來(lái)越大的效用。關(guān)鍵詞:矢量量化;語(yǔ)音信號(hào);碼書(shū);語(yǔ)音質(zhì)量語(yǔ)音通信中語(yǔ)音技術(shù)的不斷發(fā)展和應(yīng)用實(shí)踐,讓人們?cè)絹?lái)越關(guān)心傳輸速度和語(yǔ)音質(zhì)量等相關(guān)問(wèn)題。20世紀(jì)70年代后期,一種新的數(shù)據(jù)壓縮技術(shù)發(fā)展起來(lái),就是矢量量化。這種數(shù)據(jù)壓縮技術(shù)迎合了人們對(duì)語(yǔ)音信號(hào)的要求,它把語(yǔ)音數(shù)據(jù)進(jìn)行壓縮編碼,在不損失語(yǔ)音信息的前提下,力求用盡可能低的編碼速率傳輸高語(yǔ)音質(zhì)量的信息,從而解決語(yǔ)音數(shù)字通信中語(yǔ)音質(zhì)量和傳輸數(shù)碼率在技術(shù)上相互矛盾的問(wèn)題。通常情況下我們關(guān)心的是語(yǔ)音質(zhì)量是否失真,傳輸速度是否夠快,能否用最少的參數(shù)體現(xiàn)語(yǔ)音特征,矢量量化技術(shù)就考慮到了這些問(wèn)題,并給出了很好的解決方法。1矢量量化的基本原理語(yǔ)音信號(hào)經(jīng)過(guò)預(yù)處理,分成一幀一幀,矢量量化的過(guò)程是將語(yǔ)音信號(hào)波形的k個(gè)樣點(diǎn)的每一幀或有k個(gè)參數(shù)的每一參數(shù)幀,構(gòu)成k維歐氏空間中的一個(gè)矢量,然后將此矢量進(jìn)行整體量化。矢量量化理論從標(biāo)量量化發(fā)展而來(lái),兩者對(duì)比,標(biāo)量量化是k=1的一維矢量量化。它們的區(qū)別是標(biāo)量量化設(shè)置若干個(gè)量化間隔,而矢量量化是將k維無(wú)限空間劃分為M個(gè)區(qū)域邊界,然后將輸入信號(hào)的矢量和這些間隔或邊界進(jìn)行比較,根據(jù)最小失真測(cè)度公式,選擇距離最小的區(qū)域邊界或間隔的中心矢量值來(lái)量化。目前,對(duì)失真測(cè)度已有不少研究,例如曾提出過(guò)均方誤差、加權(quán)的均方誤差和線性預(yù)測(cè)失真測(cè)度等。理想的失真測(cè)度失真小,語(yǔ)音質(zhì)量好,并且計(jì)算簡(jiǎn)單。在劃分好區(qū)域建立好失真測(cè)度公式后輸入語(yǔ)音信號(hào),將其變?yōu)槭噶窟M(jìn)行量化,對(duì)所有的k維矢量都用有限的M個(gè)碼字表示,并將所有碼字編號(hào),作為存儲(chǔ)或傳輸?shù)膮?shù),這樣所有的k維矢量都可以用這些碼字的碼號(hào)表示。在恢復(fù)時(shí),直接復(fù)原或進(jìn)行反變換,就可以得到恢復(fù)的時(shí)域信號(hào)。2量化過(guò)程中的關(guān)鍵問(wèn)題在矢量量化過(guò)程中,找到最佳的矢量量化器和最佳的碼本設(shè)計(jì)是關(guān)鍵。實(shí)現(xiàn)矢量量化器最佳設(shè)計(jì),要具備以下兩個(gè)條件:①對(duì)給定的碼本在矢量空間X中輸入信號(hào)矢量,信號(hào)矢量可以用矢量空間某區(qū)域邊界Si的角標(biāo)i來(lái)表示;②對(duì)給定的區(qū)域邊界Si找出最佳碼本矢量,使平均失真最小,得到碼本。整個(gè)設(shè)計(jì)過(guò)程是實(shí)現(xiàn)上述兩個(gè)條件的反復(fù)迭代過(guò)程,矢量量化器的設(shè)計(jì)就是為了得到最佳劃分、最佳碼書(shū)。這個(gè)過(guò)程就是對(duì)初始碼書(shū)進(jìn)行優(yōu)化,一直到系統(tǒng)性能得到滿(mǎn)足為止。研究人員經(jīng)過(guò)多年的努力,在最基本的矢量量化器基礎(chǔ)上,已經(jīng)研究出了各種各樣矢量量化器的變種。這樣做主要是為了降低一些碼書(shū)大、維數(shù)高的矢量量化系統(tǒng)的復(fù)雜度,使其在實(shí)際應(yīng)用中發(fā)揮優(yōu)越性。約束矢量量化、預(yù)測(cè)矢量量化、有記憶的矢量量化、有限狀態(tài)矢量量化和帶反饋計(jì)算的自適應(yīng)矢量量化等都是各國(guó)學(xué)者研究的重點(diǎn)方向。3語(yǔ)音信號(hào)矢量量化技術(shù)的研究現(xiàn)狀早在20世紀(jì)70年代后期,矢量量化的技術(shù)就開(kāi)始發(fā)展,80年代開(kāi)始逐步完善起來(lái)。最初,只是提出了分組量化的一般性理論,后來(lái),由Linde,Buzo和Gray將標(biāo)量量化的Lloyd-Max算法推廣,產(chǎn)生了第一個(gè)可行的矢量量化碼書(shū)設(shè)計(jì)算法——LBG算法。從此,矢量量化技術(shù)的研究進(jìn)入了一個(gè)全面高速的發(fā)展時(shí)期。目前,用于語(yǔ)音信號(hào)矢量量化的主要是語(yǔ)音波形的矢量量化和語(yǔ)音參數(shù)的矢量量化。3.1語(yǔ)音波形的矢量量化過(guò)去,語(yǔ)音波形的壓縮編碼大多采用標(biāo)量量化的方法,并且已經(jīng)研究得相當(dāng)深入。例如,自適應(yīng)預(yù)測(cè)編碼和自適應(yīng)變換等都可在16kb/s數(shù)碼率條件下工作得很好。它和近年提出的多脈沖線性預(yù)測(cè)編碼都可在保證語(yǔ)音質(zhì)量的同時(shí)在集成電路上實(shí)現(xiàn)傳輸。但是,當(dāng)誤差量化的比特?cái)?shù)下降時(shí),尤其降到了1bit/樣本以下時(shí),性能就會(huì)迅速變差,這就是標(biāo)量量化的局限性。與矢量的整體量化相比,各樣本的標(biāo)量量化性能更優(yōu)越。在理論上,在相同SNR情況下前者可以用較低的傳輸數(shù)碼率。但是,目前語(yǔ)音波形的矢量量化只能做到8kb/s左右時(shí)才可以得到好的語(yǔ)音質(zhì)量,這也就是矢量量化尚需人們?nèi)ド钊胙芯康脑?。從?shí)踐經(jīng)驗(yàn)知,當(dāng)每樣本比特?cái)?shù)為1bit/樣本時(shí),矢量量化的SNR才達(dá)到12~15dB。如果想降低數(shù)碼率,又要達(dá)到上述的SNR,似乎只有增大矢量的維數(shù)——k維數(shù)。語(yǔ)音波形矢量量化的一個(gè)問(wèn)題是k增大,會(huì)導(dǎo)致運(yùn)算量和存儲(chǔ)量增大,也就增大了算法的復(fù)雜度。雖然人們可以在碼本構(gòu)造、搜索算法等方面部分解決這個(gè)問(wèn)題,但k的增大仍是需要關(guān)注的重點(diǎn)問(wèn)題。另一個(gè)問(wèn)題是,語(yǔ)音波形的矢量量化在合成時(shí)會(huì)出現(xiàn)語(yǔ)音波形的不連續(xù)現(xiàn)象,特別在低碼率時(shí)顯得更為突出。雖然這個(gè)問(wèn)題可以用交疊一些樣本構(gòu)成矢量的方法來(lái)緩解,或者用剩余誤差序列來(lái)構(gòu)成矢量而不用波形直接構(gòu)成矢量,但這終究是一個(gè)需要解決的問(wèn)題。這種理論上的先進(jìn)性和實(shí)踐上的落后性之間的矛盾,正是研究矢量量化的依據(jù)和動(dòng)力。3.2語(yǔ)音參數(shù)的矢量量化語(yǔ)音信號(hào)通過(guò)預(yù)處理,提取出特征參數(shù),例如線性預(yù)測(cè)參數(shù),把這些參數(shù)組構(gòu)成矢量,進(jìn)行整體矢量量化,就是對(duì)語(yǔ)音參數(shù)的矢量量化。線性預(yù)測(cè)參數(shù)的矢量量化是研究最廣泛的參數(shù)矢量量化。這方面最早和最簡(jiǎn)單的工作是在原來(lái)2.4kb/s的10階線性預(yù)測(cè)聲碼器的基礎(chǔ)上進(jìn)行的。矢量量化前,每幀22.5m/s,用54bit量化;矢量量化后,傳輸數(shù)碼率為800b/s。其做法是:每三個(gè)連續(xù)幀為一組矢量,只對(duì)該組線性預(yù)測(cè)系數(shù)進(jìn)行矢量量化。設(shè)計(jì)這個(gè)方案的要點(diǎn)是,采用與能量和增益無(wú)關(guān)的對(duì)數(shù)似然比失真測(cè)度作為VQ的距離測(cè)度。碼本尺寸為1024bit,即用10來(lái)表示其角標(biāo)。碼本是用10個(gè)人大約30min的隨機(jī)對(duì)話(huà)語(yǔ)音來(lái)進(jìn)行測(cè)試而產(chǎn)生的。碼本分為濁音和清音兩種,都用LBG算法訓(xùn)練。通常,清音碼本比濁音碼本失真率低,所以,在相同的失真指標(biāo)下,清音碼本的尺寸可以小一些。根據(jù)各種評(píng)估系統(tǒng)的測(cè)試可知,結(jié)果同2400b/s的LPC-10聲碼器的音相近。同時(shí),他們還對(duì)上述已矢量量化了的LPC聲碼器作了進(jìn)一步的碼率壓縮研究,提出了兩種方法:①幀重復(fù)LPC矢量量化法。在800b/s的LPCVQ的基礎(chǔ)上,用這個(gè)方法之后,可達(dá)到250b/s的碼率。②矩陣量化法。這實(shí)際上是考慮了語(yǔ)音信號(hào)的段特性,這種量化的基元是一個(gè)矩陣——不是采用一幀幀的的矢量幀來(lái)量化,而是采用矢量段來(lái)進(jìn)行矢量量化。這種方法最后的傳輸數(shù)碼率可低達(dá)150b/s。4研究發(fā)展方向和對(duì)策針對(duì)目前的現(xiàn)狀,許多學(xué)者在以下兩方面進(jìn)行探討。4.1改進(jìn)LBG算法各種算法都有優(yōu)點(diǎn)和缺點(diǎn),LBG算法容易實(shí)現(xiàn),但它也有缺點(diǎn),這也正是需要人們改進(jìn)的方向。LBG算法的缺點(diǎn)是:在每次迭代的最佳劃分階段,要減少?gòu)拇a書(shū)中搜索訓(xùn)練矢量的最近碼字時(shí),就需要大量的存儲(chǔ)空間和煩瑣的計(jì)算;如何提高碼書(shū)訓(xùn)練的收斂速度和最終碼書(shū)的性能;如何增強(qiáng)碼書(shū)的自適應(yīng)能力。各種改進(jìn)算法紛紛發(fā)表,主要目的就是為了獲得更好的初始碼書(shū),以提高碼書(shū)性能或加快設(shè)計(jì)速度。4.2新的碼書(shū)設(shè)計(jì)算法為了改善碼書(shū)性能,采用各種各樣的全局優(yōu)化技術(shù)進(jìn)行碼書(shū)設(shè)計(jì)也是一個(gè)研究方向。人們分別將基于模糊聚類(lèi)理論的設(shè)計(jì)算法、模擬退火算法和演化算法應(yīng)用到矢量量化碼書(shū)設(shè)計(jì)中,同時(shí)將人工神經(jīng)網(wǎng)絡(luò)同矢量量化結(jié)合。所有這些全局優(yōu)化算法的性能都要比LBG算法高。近年來(lái),雖然在矢量量化方面有好多算法不斷被提出,它們也各有優(yōu)勢(shì)和不足,但提出一套具有較高計(jì)算精度、較低計(jì)算復(fù)雜度和存儲(chǔ)復(fù)雜度及優(yōu)越的量化性能的完整算法,是需要人們不斷深入探討的課題。目前,矢量量化技術(shù)的研究進(jìn)展很快,不僅在理論研究上,而且在系統(tǒng)結(jié)構(gòu)、計(jì)算機(jī)模擬和硬件實(shí)現(xiàn)等方面也取得了不少成果,例如采用矢量量化技術(shù),已能將聲碼器的傳輸速率從2400bit/s降低到150~180bit/s,而仍能保持較好的語(yǔ)音質(zhì)量和可懂度。在語(yǔ)音識(shí)別方面,矢量量化研究也得到很好的應(yīng)用,各種各樣的矢量量化系統(tǒng)得以提出和進(jìn)一步的實(shí)現(xiàn)。5結(jié)束語(yǔ)隨著科學(xué)技術(shù)日新月異的變化,矢量量化技術(shù)也將在方法、理論上有新的發(fā)展,特別是在語(yǔ)音識(shí)別方面,同隱馬爾可夫鏈結(jié)合使用,直接用于構(gòu)成語(yǔ)音識(shí)別和說(shuō)話(huà)人識(shí)別系統(tǒng)。在低速語(yǔ)音編碼和合成方面,用于特定的人和非特定的人的語(yǔ)音識(shí)別,許多研究是很有實(shí)用性的。隨著半導(dǎo)體技術(shù)和微電子工藝的成熟發(fā)展,針對(duì)各種硬件,例如各種DSP的特點(diǎn),開(kāi)發(fā)對(duì)應(yīng)的矢量量化算法已成為熱點(diǎn),進(jìn)一步的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度醫(yī)院醫(yī)技人員技能提升合同4篇
- 打雜工合同范本(2篇)
- 二零二五年度農(nóng)村土地整治項(xiàng)目承包合同書(shū)4篇
- 二零二五年度充電樁充電服務(wù)補(bǔ)貼資金管理合同3篇
- 二零二五版高端鎳氫電池產(chǎn)品定制研發(fā)合同范本4篇
- 二零二五年度農(nóng)場(chǎng)租賃合同農(nóng)業(yè)生態(tài)修復(fù)與保護(hù)協(xié)議4篇
- 2025年度房地產(chǎn)租賃合同房屋質(zhì)量及維修責(zé)任約定4篇
- 2025年互聯(lián)網(wǎng)+內(nèi)資股東股權(quán)投資合同
- 二零二五版智能門(mén)禁系統(tǒng)與電梯聯(lián)動(dòng)工程合同3篇
- 2025年度互聯(lián)網(wǎng)企業(yè)程序員聘用合同模板
- 2024年中考語(yǔ)文滿(mǎn)分作文6篇(含題目)
- 第一節(jié)-貨幣資金資料講解
- 如何提高售后服務(wù)的快速響應(yīng)能力
- 北師大版 2024-2025學(xué)年四年級(jí)數(shù)學(xué)上冊(cè)典型例題系列第三單元:行程問(wèn)題“拓展型”專(zhuān)項(xiàng)練習(xí)(原卷版+解析)
- 2023年譯林版英語(yǔ)五年級(jí)下冊(cè)Units-1-2單元測(cè)試卷-含答案
- Unit-3-Reading-and-thinking課文詳解課件-高中英語(yǔ)人教版必修第二冊(cè)
- 施工管理中的文檔管理方法與要求
- DL∕T 547-2020 電力系統(tǒng)光纖通信運(yùn)行管理規(guī)程
- 種子輪投資協(xié)議
- 執(zhí)行依據(jù)主文范文(通用4篇)
- 浙教版七年級(jí)數(shù)學(xué)下冊(cè)全冊(cè)課件
評(píng)論
0/150
提交評(píng)論