版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第一語本章中將基于數(shù)字濾波器和 z 變換等基礎(chǔ)知識,應(yīng)用第一篇講授編程術(shù),在第一語本章中將基于數(shù)字濾波器和 z 變換等基礎(chǔ)知識,應(yīng)用第一篇講授編程術(shù),在語音分領(lǐng)域做一些練習(xí)。通過本章的練習(xí),可以增進對 z 變換和濾波器的理知識,第二部分給出詳細(xì)的練習(xí)內(nèi)容和編程步驟。相信讀者對此會產(chǎn)生強。機從物理原理來看,語音信號是由肺擠壓出的空氣激振動產(chǎn)生的包括喉、聲道和嘴。喉位于氣管的上端,實際上是由氣管末端的一圈軟的一個框架喉中有兩片肌肉,它們和周圍的韌帶稱為聲帶。聲帶張開時空氣可地流過喉和氣管,如正常呼吸時;聲帶閉合,將喉封住,所以吃東西時食物不會落入氣管。兩片聲帶之間的空隙稱為聲門。說話時聲帶相互靠攏
2、但不完全封閉,這樣聲門變成一條窄縫,當(dāng)氣流通過時其間壓力減小,從而聲帶完全合攏使氣流不能通過;在氣流被阻斷時壓力恢復(fù)正常,因聲帶間形成空隙,氣流再次通過。這一過程周而復(fù)始,就形成了一串周期性的脈沖氣流送入聲道。如圖 1.1 所示。這個脈沖串的周期稱為“基音周期”,其倒數(shù)是“基音頻率”說 氣流從喉向上經(jīng)過口腔或者鼻腔后向外輻射,經(jīng)過的傳輸通道稱為聲道。氣流流過聲1 1.1: 道猶如通過一個具有某種諧振特性的腔體。如所示。輸出氣流的頻率特性既取 1.1: 道猶如通過一個具有某種諧振特性的腔體。如所示。輸出氣流的頻率特性既取聲門脈沖串的特性,又取決于聲道特性。聲道包括口腔和鼻腔兩部分,對成腔段約 1
3、7cm ,鼻腔段約 13cm ,氣流在軟腭的控制下分別流向這兩個通道。所以聲道的截面積是變化的,而聲道的頻率特性主要取決于聲道截面的最小值(收緊點)出現(xiàn)的位置,了軟腭控制一些外,收緊點主要由舌頭的位置來決定1.2: 1.3: 語音的另一種產(chǎn)生方式是聲門完全閉合,此時聲道不是受聲門周期脈沖氣流而是利用口腔內(nèi)存有的空出來。該氣流在口腔中形成湍流,因而表現(xiàn)為隨機噪聲。這種方式發(fā)出的音就(男生如果把手放在脖子前面喉結(jié)上部的倒三角位置,發(fā)濁音“啊”的音時可以感覺到,發(fā)清音“是的音時就語音信號的時一段女聲發(fā)音”的波形如所示,可以看出語音能量的起伏從而大1.5 部分,可以看出語音的濁音段能量較大(右上圖有明
4、顯的周期特征,而清音段能量很?。ㄓ蚁聢D于噪聲化2322010.155 0.165 0.17 0201.4: 女聲發(fā)音”1.5: 女聲發(fā)音語音模語音生成模通過對聲管的研究,發(fā)現(xiàn)它可以用若干段截面積不等的均勻管道級聯(lián)起來描述,如,一般稱作級聯(lián)無損聲管模型。采用流體力學(xué)的方法322010.155 0.165 0.17 0201.4: 女聲發(fā)音”1.5: 女聲發(fā)音語音模語音生成模通過對聲管的研究,發(fā)現(xiàn)它可以用若干段截面積不等的均勻管道級聯(lián)起來描述,如,一般稱作級聯(lián)無損聲管模型。采用流體力學(xué)的方法可以證明每一截均勻管道能夠用一個單極點模型來近 N 段管道組成的聲管就可以用一N 階全極點濾波器表述,GP=
5、V(z)= NN1(1k=1 對于典型的男聲,N = 10 再綜合考慮清音信號,就可以得到語音信號產(chǎn)生的離散語音模型,如圖 所示準(zhǔn)確的清遠(yuǎn)遠(yuǎn)超出了本書的范疇,因?qū)ι鲜瞿P瓦M行充分簡化。首先去掉隨機信號激勵部分認(rèn)為激勵信號是一個脈沖序列,不考慮有無周期。其次去掉聲門脈沖模型和口唇的輻射模型,從而得到圖 1.7 所示最簡單的語音模型,現(xiàn)用 變換的知識就可以應(yīng)對了e(ns(ns(n) aks(nk)+從可以用聲管模型對激勵信號進行濾波得到語音信號3乥 乥 1.6: 1.7: 語??傻秸Z音信號 s(n) ,也已經(jīng)知道了它的生成模型如1.7 所示,但不e(nV(zai7.7 問題,而且它是更復(fù)雜的盲解卷
6、,因為激勵和濾波器系數(shù)兩者都不知道。如果進一步做些合理的假設(shè),這個問題還是可以解決的,比如約束 是一個周期脈沖序列和一白噪聲序列之和就可以用一些信號處理方法,如自相關(guān)法和自協(xié)方差法求出系Durbin遞推算法和Schurai1.7測模型即語音信號s(n) 送濾波器得e(n) e(n) = s(n) aks(n 這模型在通信中用來增加每個信道上傳輸語音信號的通道數(shù)。假設(shè)信號的發(fā)端ai e(n) ) ) e(n是輸出。事實上,ai4V ,ai 因而采技術(shù)后,總是可以大幅度地降低語音的帶寬。這種通過線方法壓縮語音數(shù)據(jù)量的技術(shù)叫做線編碼(Linear Prediction Coding, LPC)技 ,
7、ai 因而采技術(shù)后,總是可以大幅度地降低語音的帶寬。這種通過線方法壓縮語音數(shù)據(jù)量的技術(shù)叫做線編碼(Linear Prediction Coding, LPC)技術(shù)語音重建模 用語音生成模型重建語音(n) (n(n) x(n) e(n) s(n) ai1020就會發(fā)生一些變化以產(chǎn)生不同的音節(jié)。在這種情況下,濾波過程也要分段進行,即每次用不同的濾波器系數(shù),但相鄰兩次濾波必須要保持濾波器的狀態(tài)不發(fā)生變化諧振語音生成模型的每一對共軛極點都對應(yīng)一個衰減的正弦信號的特征響應(yīng)。例如一對共| pi | ej A | 度,幅角決定振蕩頻率cos(n對語,用數(shù)字的正弦信號表示抽樣后的連續(xù)正弦信號。在這種情況下T
8、,T 表示抽樣間隔, 表示模擬頻率(弧度f /2稱(N 10)5分析語的分系統(tǒng)如圖 1.8 所示們就可以用適當(dāng)?shù)妮斎胝Z音。對于濁音信號,一種可取的激勵模型就是以特定頻率重復(fù)樣值序列,這個頻率就是基音頻率。對清音,最好選擇隨機噪聲或白噪聲作為5 ex1.8: 分析語音的系統(tǒng)框圖輸入。但在不做清的情況下,全部采用周期激勵質(zhì)量也是可以接受的(們就是這么做的分析過程 ex1.8: 分析語音的系統(tǒng)框圖輸入。但在不做清的情況下,全部采用周期激勵質(zhì)量也是可以接受的(們就是這么做的分析過程是:先將語音采樣信號以 10 毫秒進行分段,然后對得到的每段數(shù)據(jù)進行統(tǒng)計分析并計算相鄰樣點的相關(guān)性,最終求得最系數(shù)過程就是
9、利用系數(shù),以及周期樣值序列作為輸入,依次得到每語音變速不變速不變調(diào)技術(shù)廣泛應(yīng)用于消費類電子產(chǎn)品,如英語復(fù)讀機等。所謂變速不變調(diào),是指聲時,速度的改變不會導(dǎo)致音調(diào)的變化。一般來說,用隨身聽聽音樂,快和慢,其音調(diào)是不一致的,如快,頻率會變高,男聲聽起來會感(T ,如T 卻減小了 會怎樣?)為了實現(xiàn)變速不因是什么兩個部分,一峰頻率模型的參數(shù);二是基音周期,即激勵信號的參數(shù)。下面了。即將對應(yīng)的工作就是在不改變這兩種參數(shù)的前提下改變數(shù)據(jù)長個樣點的激勵變成對應(yīng)于 毫秒個樣點(注意保20 毫秒毫秒內(nèi)保模型系數(shù)不變,不就語音了么?新語音的變調(diào)不前,最簡單的男聲變女聲只要讓隨身聽就可以了。但快改變的不僅是聲調(diào),
10、語速也會發(fā)生很大變化,快得讓人聽不清楚。為了解決這個問題,就需要調(diào)不變速的技術(shù)。同上分析過程一樣,還是需峰頻率和基音周期上做改變。女和男聲的最大區(qū)別是頻率高,一方面表現(xiàn)在基音頻率高,另一方峰對應(yīng)的諧振頻率也更高一些,所可以考慮將激勵信號的頻率增加(注意不改變信號長度6振峰頻率也相應(yīng)增大一些(即極點的幅角絕對值增大,或者說上半平面的極點逆時針旋轉(zhuǎn),下半平面的順時針旋轉(zhuǎn),但注意兩者都要旋轉(zhuǎn)同樣角度而且不要轉(zhuǎn)過負(fù)實軸。這振峰頻率也相應(yīng)增大一些(即極點的幅角絕對值增大,或者說上半平面的極點逆時針旋轉(zhuǎn),下半平面的順時針旋轉(zhuǎn),但注意兩者都要旋轉(zhuǎn)同樣角度而且不要轉(zhuǎn)過負(fù)實軸。這樣得語音會更“女聲”一些后兩項技
11、術(shù)是典型的語音信號數(shù)字處理技術(shù)。它們的基礎(chǔ)z變換和線用傳統(tǒng)的模擬信號處理方法不可能實現(xiàn),這正體現(xiàn)了數(shù)字信號處理的優(yōu)點。最后還,這兩項技術(shù)并,事實上,它們可以完美地結(jié)合在一起,你能做出一種速度和音調(diào)都發(fā)生變化語音算法來么語模(1)給e(n)=s(n)a1s(n1)a2s(ne(n是輸入信號,s(n) = = 0.9506 上模型 樣值響應(yīng)。用 filter 繪 impz 的是否相同極點率響應(yīng)(2)閱讀 speechproc.m 程序,理解基本流程。程序中已經(jīng)完成了語音分幀、加窗、和基音周期提取等功能。注意:不要求掌握線和基音周期提取的算法原理function % 定義常FL = % % %WL
12、= P=% 載入語音% 讀入語s=L=7計算FN = floor(L/FL)-%和重建濾%誤差exc = %濾波zi_pre = %重建s_rec = %zi_rec = %的激勵信號(脈沖串exc_syn = %語s_syn = % 變調(diào)不變速濾%的激勵信號(脈沖串計算FN = floor(L/FL)-%和重建濾%誤差exc = %濾波zi_pre = %重建s_rec = %zi_rec = %的激勵信號(脈沖串exc_syn = %語s_syn = % 變調(diào)不變速濾%的激勵信號(脈沖串exc_syn_t = %語%s_syn_t = 變速不變調(diào)濾波器(假設(shè)速度減慢一倍的激勵信號(脈沖串e
13、xc_syn_v = %語s_syn_v = %漢明hw = % 依次處理每幀%n = % 計系數(shù)(不需要掌握s_w = %漢明激勵的能量后的% A系數(shù),E會被用來計%用線法計算P系A(chǔ) E lpc(s_w, if n = % (3) 在此位置寫程序系統(tǒng)的零% 本幀語音,下面就要對它做s_f = s(n-% (4) 在此位置寫程序,用filter函數(shù)和s_f計算激勵,注意保持濾波將你計算得到的激勵寫在% exc(n-1)*FL+1:n*FL) = 8 ( 將你計算得到的重建語音寫% s_rec(n-1)*FL+1:n*FL)=注意下面只有在得到exc后才會計算s_Pitch = exc(n*FL
14、-PT = % 計算基音周期PT(不要求掌握% 計激勵的能量G(不 ( 將你計算得到的重建語音寫% s_rec(n-1)*FL+1:n*FL)=注意下面只有在得到exc后才會計算s_Pitch = exc(n*FL-PT = % 計算基音周期PT(不要求掌握% 計激勵的能量G(不要求掌握G= % exc_syn(n-激勵,并用激勵和filter函數(shù)產(chǎn)將你計算得到激勵寫%將你計算得到語音寫%s_syn(n-1)*FL+1:n*FL) = %的輸入得到新語音,聽一聽是不是速度變慢了,而且音調(diào)沒有變%將你計算得到的加語音寫在%(13) %=%將你計算得到的變語音寫在=% %后面聽語音的題目也都可以在
15、這里寫,不再做特別注明% 保存所有9% 從PCM文件讀入function s = fid = fopen(filename, s = fread(fid, L, % 從PCM文件讀入function s = fid = fopen(filename, s = fread(fid, L, % 把語音寫入PCMfunction fid = fwrite(fid, s, % 計算一段語音的基音周期,不要求掌握function PT = A = butter(5, s R R(k) = s(144:223)*s(144-k:223-R1,T1 = T1 = T1 + R1/(norm(s(144-T1
16、:223-R2,T2 = T2 = T2 + R2/(norm(s(144-T2:223-R3,T3 = T3 = T3 + R3 R3/(norm(s(144-T3:223-Top Rop if = Rop Top end if Rop Top T3 = T3 + R3 R3/(norm(s(144-T3:223-Top Rop if = Rop Top end if Rop Top PT = (3)運行該程序到 27 幀時停住,用(1)中的方法觀察零極點圖(4)在循環(huán)中添加程序:對每幀語音信號 s(nfilter 激勵信。注意:在系數(shù)變化的情況下連續(xù)濾波,需維持濾波器的狀態(tài)不變,要利用filterzizf(5)speechproc.m e(n) 和 (n) 語模(7)生成一8kHz 抽樣的持1 秒鐘的數(shù)字信號,該信號是一個頻率200Hz 的x(n)(n位樣值“串”并試聽,有何區(qū)別?事實上,這個信號將是后面要用到的以基音為周期的人工位樣值“串”并試聽,有何區(qū)別?事實上,這個信號將是后面要用到的以基音為周期的人工e(n) (8)真實語音信號的基音周期總是隨著時間變化的首先將信號分成若毫秒長的段,假設(shè)每個段內(nèi)基音周期固定不變,但段和段之間則不同,具體PT =80+5mod(m,其中 PT 表示基音周期,m 表示段序號。生成 1 秒鐘的上述信號(提示:用段實現(xiàn),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版環(huán)保物流綠色包裝運輸合同規(guī)范3篇
- 二零二五版?zhèn)€人房產(chǎn)抵押貸款債權(quán)轉(zhuǎn)讓合同3篇
- 二零二五版財務(wù)會計崗位聘用合同9篇
- 二零二五版智能家居股份制合作合同范本3篇
- 二零二五年度鋼結(jié)構(gòu)工程鋼筋加工與配送合同范本3篇
- 二零二五版工業(yè)4.0工廠生產(chǎn)承包服務(wù)合同模板3篇
- 二零二五年房產(chǎn)共有權(quán)份額轉(zhuǎn)讓產(chǎn)權(quán)買賣合同范本含份額調(diào)整方案3篇
- 二零二五版?zhèn)€人承包公司物流運輸合作合同書6篇
- 二零二五版安徽省勞動合同解除爭議調(diào)解服務(wù)合同2篇
- 二零二五年度能源股權(quán)轉(zhuǎn)讓居間服務(wù)合同范本2篇
- 大型活動聯(lián)合承辦協(xié)議
- 工程項目采購與供應(yīng)鏈管理研究
- 2024年吉林高考語文試題及答案 (2) - 副本
- 拆除電纜線施工方案
- 搭竹架合同范本
- Neo4j介紹及實現(xiàn)原理
- 焊接材料-DIN-8555-標(biāo)準(zhǔn)
- 工程索賠真實案例范本
- 重癥醫(yī)學(xué)科運用PDCA循環(huán)降低ICU失禁性皮炎發(fā)生率品管圈QCC持續(xù)質(zhì)量改進成果匯報
- 個人股權(quán)證明書
- 醫(yī)院運送工作介紹
評論
0/150
提交評論