




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.,3.6 語音信號的線性預測 (linear prediction LPC),3.6.1 線性預測基本原理 3.6.2 線性預測和信號模型之間的關系 3.6.3 Levinson-Durbin 算法 3.6.4 格型濾波器 3.6.5 由已知數據計算預測系統(tǒng)的方法,.,傳輸函數,Av,沖激序列 發(fā)生器,聲門脈沖 模型G(z),隨機噪聲 發(fā)生器,基音周期TP,AN,線性系統(tǒng) 聲道V(z),輻射模型 R(z),清/濁音開關,.,3.6.1 線性預測分析的基本原理,1.線性預測分析的基本思想:,由于語音樣點之間存在相關性,所以可以用過去的樣點值來預測現(xiàn)在或未來的樣點值。,線性預測,x(n-p),x
2、(n-p+1),.x(n-1),.,時間(樣點),x(n),x(n-1),x(n-p),p個點,線性預測:,Auto-Regressive Modeling,.,通過使實際語音x(n)和線性預測結果 之間的誤差e(n)在某個準則下達到最小值來決定唯一的一組預測系數 。 這組系數就能反映語音信號的特性,可以作為語音信號特征參數來用于語音編碼、語音合成和語音識別等應用中去。,.,Z-1,Z-1,Z-1,x(n),e(n),+,-,根據e(n)最小均方誤差準則,來決定唯一的一組預測系數,.,2.均方誤差是預測系數的二次函數,.,在信號平穩(wěn)的情況下,均方誤差為權矢量的二次函數。是一個N+1維空間中一個
3、下凹的超拋物面,有唯一的最低點,2個權系數構成的3維空間中一個下凹的拋物面,.,預測誤差與過去的樣點不相關,3.均方誤差最小導致預測誤差與過去的樣點不相關,.,.,4.標準方程式,.,.,5.最小均方誤差的另一種求解方法,.,取遍所有的k,組成一個矩陣,稱為Yule-Walker方程。,5. Yule-Walker方程,.,Toeplitz矩陣,.,(1)根據最小均方誤差準則,求出預測系數ak (2)已知預測系數ak,求出最小均方誤E(e2(n)min,.,對e(n)進行Z變換,有:,e(n),x(n),4.用e(n)和ak求x(n)(合成),.,3.6.2 線性預測和信號模型之間的關系,Av
4、,沖激序列 發(fā)生器,聲門脈沖 模型G(z),隨機噪聲 發(fā)生器,基音周期TP,AN,線性系統(tǒng) 聲道V(z),輻射模型 R(z),清/濁音開關,一、語音生成模型,.,清/濁開關,聲道模擬 濾波器H(z),基音周期,沖激序列 發(fā)生器,隨機噪聲 發(fā)生器,增益,u(n),輸出 語音x(n),將語音生成模型簡化,將輻射、聲道和聲門激勵進行組合,用一個時變數字濾波器來表示。,.,用全極點模型來描述聲道濾波器特性,.,e(n),x(n),二、語音信號的線性預測模型,全極點的IIR濾波器,.,三、兩模型中信號之間的關系為:,生成模型,線性預測模型,對同一語音信號,有:,.,預測誤差e(n)就是激勵信號Gu(n)
5、,預測系數apk就是聲道濾波器的系數dk。 線性預測分析可以對生成模型的增益參數G和濾波器系數dk進行直接和高效率的計算。這樣,結合清濁音的判斷和基音周期的估計,得到語音信號生成模型的全部參數,實現(xiàn)語音的產生。,.,清/濁開關,基音周期,沖激序列 發(fā)生器,隨機噪聲 發(fā)生器,增益G,u(n),輸出 語音x(n),LPC系數 a1,a2, ap,.,激勵信號u(n)正比于誤差信號e(n),其比例為增益常數G。求出G的依據是,在一幀中,誤差信號的能量等于輸入激勵信號(Gu(n))的能量。,激勵信號具有單位方差,N為幀長,e(n)Gu(n),四、求解G,.,在一幀內誤差信號e(n)均方誤差最小的原則來
6、求解ak。這個方法是合理的。,e(n) 均方誤差最小對應其頻譜是平坦的。而在頻譜是平坦的只有脈沖波和白噪聲兩種,正好對應濁音和清音。,.,求出G和ak,可得時變?yōu)V波器的系統(tǒng)函數。在輸入激勵的作用下,可合成語音。語音的參數合成是就是在發(fā)送端利用線性預測方法求出G和ak,結合激勵信號u(n),進行編碼,傳送到接收端,進行組合,合成聲音。,參數 合成,a1,a2,ap,Gu(n),輸入語音x(n),語音輸出x(n),線性 預測 分析,五. 線性預測分析用于語音編碼和語音合成,.,根據語音信號的短時平穩(wěn)性,在短時幀內(20ms)認為信號是不變,則將激勵信號u(n)和濾波器系數ak、G每隔20ms刷新一
7、次,相當于對激勵信號u(n)和濾波器系數dk、G的采樣頻率為50Hz。由于采樣頻率大大降低,因此編碼速率較低,可達2.41.2kb/s。,20ms,20ms,u(n)、ak、G,u(n)、ak、G,.,編碼速率,用比特/秒(b/s或bps)來度量,用I表示。 I=R fs ,R代表每個語音采樣值編碼所需的比特數;fs是采樣頻率。 當fs=8kHz,每個采樣值用8比特位來編碼,則編碼速率為64kb/s。,.,一般情況下,而是傳遞以下參數: (1)濁音的基音頻率和振幅 (2)清/濁音標志 (3)G,a1,語音輸出x(n),線性 預測 分析 基音頻率 清/濁音判別,參數 合成,a2,ap,基音頻率,
8、輸入語音x(n),清/濁音標志,G,.,CDMA系統(tǒng)的關鍵技術 CDMA系統(tǒng)是以擴頻調制技術和碼分多址接入技術為基礎的數字蜂窩移動通信系統(tǒng)。 可變速率聲碼器:聲碼器是對模擬語音信號進行數字化編譯碼的部件,其目的是在保證語音傳輸質量的同時數據傳輸速率盡可能低。 在移動通信中,一般采用線性預測編碼(LPC)方式,其組成原理如圖所示。,.,.,線性預測編碼原理是,首先通過A/D轉換器將模擬語音信號變成數字語音信號,經過線性預測分析從語音信號中求出一組預測器系數,一般為12組預測濾波器系數,使得一幀語音波形均方預測誤差最小。另外,再經過基音檢測、清濁音判決提取語音信號中的基音周期Tp、清濁音判決信息U
9、/V和代表語音強度的增益控制參數G。連同12組預測濾波器系數,共15個參數包含了語音信號中的主要信息。通過對每幀語音信號的分析,得到這15個參數,經過量化編碼后發(fā)送出去。,.,在接收端,通過參數譯碼得到一幀語音信號的特征參數,包括基音周期Tp、清濁音判決信息U/V、增益控制參數G和預測濾波器系數。將這一組參數作用于語音合成濾波器,再經過D/A轉換器就得到合成語音信號。,.,利用線性預測系數求共振峰,離散頻譜|A(k)|的谷點就是共振峰的位置。通過求A(z)多項式的系數序列1,a1,a2,ap的DFT,就可以得到|A(k)|。,六. 線性預測系數用于共振峰估計,的峰值對應共振峰,的谷點對應共振峰
10、,.,離散頻譜|A(k)|,谷點,1,-1.45,0.9,-0.45,-0.12,0.36,-0.30,0.39,0.12,-0.34,0.06 p=10 利用FFT,補零至2N。,.,求出預測系數,需要對自相關矩陣(已知的)求逆,一般Toeplitz矩陣是非奇異矩陣,它的逆矩陣存在。p表示階數。,七、線性預測方程組的求解,系數矩陣,.,在已知自相關函數的前提下,根據e(n)均方誤差最小的原則來求解ak,有:Levinson-Durbin算法和格型濾波算法。 Levinson-Durbin算法遞推解Yule-Walker 方程。,.,3.6.3 Levinson-Durbin 算法(求預測系數
11、),Levinson算法逐階梯推導示意圖,1階,2階,3階,p階,.,一、相鄰兩階的預測系數的關系推導,p階,p+1階,濾波器系數,.,p階和p1階Yule-Walker方程,.,p階的Yule-Walker方程進行變換,增加一行一列得到擴大方程,.,擴大方程倒置得到預備方程,.,預備 方程,擴大 方程,p1階Yule-Walker方程,.,p階預測系數和p1階預測系數的關系 p+1階的解寫成擴大方程和預備方程的解的組合,第p+1階反射系數,.,第p+1階反射系數的求解,上式各項左乘p+1階系數矩陣,.,二、完整的預測系數的公式 已知p階預測系數求p+1階預測系數,p階,p+1階,.,p=1階
12、的預測系數和最小均方誤差,p=2階的預測系數和最小均方誤差,p=3階的預測系數和最小均方誤差,.,濾波器系數,三、濾波器系數的倒序列構成新濾波器,濾波器系數的倒序列構成新的濾波器,.,四、p+1階預測濾波器,.,五、p+1階預測系數矩陣倒置構成的新濾波器,.,直接對預測系數ak量化后再傳輸是不合適的,因為系數ak的很小變化都將導致合成濾波器極點位置的極大變化,造成不穩(wěn)定的現(xiàn)象。因此必須將預測系數變換成其他更適合編碼和傳輸的參數形式。,3.6.4 格型濾波器,.,1.前向預測和反向預測,H(z)是一個全極點IIR濾波器,可能造成濾波器不穩(wěn)定。因此在濾波器的結構上采用格型結構,引入反饋,解決不穩(wěn)定
13、的弱點。同時在算法上,不需要先計算相關矩陣,直接從語音樣點上得到預測器系數。,.,前向預測,p階,.,p階,后向預測,.,前向預測誤差,反向預測誤差,按前向均方誤差最小的準則來求得的預測系數,對于反向預測預測器也是最佳預測系數。,.,2. 和 的關系,.,3. 和 的關系,.,4.格型濾波器結構,x(n),.,5.零階預測,6.預測誤差濾波器分析濾波器,.,7.預測誤差濾波器的逆濾波器合成濾波器,Z-1,Z-1,Z-1,x(n),.,線性 預測 分析 基音頻率 清/濁音判別,參數 合成,r2,rp,基音頻率,輸入語音x(n),清/濁音標志,G,r1,8.格型濾波器語音合成技術框圖,合成 語音,
14、一幀典型的LPC參數包括1bit清濁音標志,大約5bit增益參數G,6bit基音周期,56bit的每個反射系數(共有812個),故每幀約需60bit.若一幀時間為25ms,則編碼速率為2.4kb/s。,.,9.格型濾波器的性質,(1)各階反射系數的模值小于1,由于各階預測誤差功率均大于零,故:,(2)各階反向預測誤差互不相關或正交,各級間去耦,局部最優(yōu)能保證全局最優(yōu),.,3.6.5 由已知有限個數據計算預測系統(tǒng)的方法(用其他量來代替自相關函數,得到預測系數 ),1.自相關法,代替,帶入Yule-Walker方程,利用Levsion-Durbion 算法和格型濾波器求出預測系數和預測誤差功率的估
15、計值。,.,依據:用時間平均的最小平方準則,代替集合平均的最小平方準則,得到同一個Yule-Walker方程,.,的求解,.,例題:已知信號的四個觀察數據為x(n)=x(0),x(1),x(2),x(3)=2,4,1,3,求,p=1,N=4,.,2. 協(xié)方差法,代替集合平均的最小平方準則,.,例題:已知信號的四個觀察數據為x(n)=x(0),x(1),x(2),x(3)=2,4,1,3,求,N=4,p=1,.,的求解,.,3. Burg法,(1)盡可能利用能夠獲得的有限個數的數據計算預測誤差。采用類似協(xié)方差方法。,(2)保證濾波器的穩(wěn)定性。采用格型濾波器,其反射系數,.,.,(3),(1)初始化,(2)計算下列各量,具體迭代時,從p=1,開始,.,(6),(5),(4),.,A = LPC(X,N) finds the coefficients, A= 1 A(2) . A(N+1) , of an Nth order forward linear predictor Xp(n) = -A(2)*X(n-1) - A(3)*X(n-2) - . - A(N+1)*X(n-N) such that the sum of the squares of the errors err(n) = X(n) - Xp(n) is minimized.,MATLAB命令,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同變更備注說明
- 保教常規(guī)培訓
- 商品質量糾紛處理協(xié)議(2篇)
- 保潔倉庫管理制度
- 2025年統(tǒng)編版小學道德與法治四年級下冊《我們的衣食之源》說課課件
- 2025年統(tǒng)編版小學道德與法治二年級下冊《我們有新玩法》說課課件
- 會議視頻制作服務合同
- 施工現(xiàn)場材料耗損責任協(xié)議
- 德育主題教育
- 剖宮產疤痕憩室護理查房
- 2024年廣東省五年一貫制學校招生考試數學試卷
- 2024年河南鄭州黃河文化旅游發(fā)展有限公司招聘筆試真題
- 學校德育工作與心理健康教育的融合研究
- 數學-廣東省廣州市2025屆高三一模試題和解析
- 2024年關于突發(fā)事件應急預案(34篇)
- 高中入團考試試題及答案
- 招標代理機構遴選投標方案(技術標)
- 《2021國標電氣弱電圖集資料》09X700 智能建筑弱電工程設計與施工(下冊)(不清晰)
- 沈陽市終止(解除)勞動合同證明書
- 高一數學必修一全套講義(含答案)
- 關于市戰(zhàn)略性新興產業(yè)發(fā)展情況的調研報告
評論
0/150
提交評論