ARMA模型在語(yǔ)音信號(hào)線性預(yù)測(cè)分析中的應(yīng)用_第1頁(yè)
ARMA模型在語(yǔ)音信號(hào)線性預(yù)測(cè)分析中的應(yīng)用_第2頁(yè)
ARMA模型在語(yǔ)音信號(hào)線性預(yù)測(cè)分析中的應(yīng)用_第3頁(yè)
ARMA模型在語(yǔ)音信號(hào)線性預(yù)測(cè)分析中的應(yīng)用_第4頁(yè)
ARMA模型在語(yǔ)音信號(hào)線性預(yù)測(cè)分析中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、ARMA模型在語(yǔ)音信號(hào)線性預(yù)測(cè)分析中的應(yīng)用摘要:語(yǔ)音信號(hào)是一種典型的非平穩(wěn)隨機(jī)信號(hào),對(duì)語(yǔ)音做分幀處理后可以將其看作準(zhǔn)平穩(wěn)隨機(jī)信號(hào),從而使用處理平穩(wěn)隨機(jī)信號(hào)的方法進(jìn)行處理。由于語(yǔ)音信號(hào)的產(chǎn)生可以用一個(gè)有理函數(shù)式來(lái)表達(dá),因此可以用ARMA模型來(lái)對(duì)語(yǔ)音信號(hào)進(jìn)行建模分析。本文介紹了用于隨機(jī)時(shí)間序列的ARMA模型,線性預(yù)測(cè)分析的原理及方法,分析了ARMA模型中的AR模型在語(yǔ)音線性預(yù)測(cè)分析中的應(yīng)用,闡述了在線性預(yù)測(cè)分析中AR模型參數(shù)求解的具體方法以及影響因素。關(guān)鍵詞:ARMA模型,AR模型,線性預(yù)測(cè)分析,語(yǔ)音信號(hào),隨機(jī)信號(hào),隨機(jī)時(shí)間序列引言語(yǔ)音信號(hào)是一種隨機(jī)信號(hào),其特性及表征本質(zhì)特征的參數(shù)均是隨時(shí)間而變化

2、的,是一種非平穩(wěn)隨機(jī)過(guò)程,所以語(yǔ)音信號(hào)的數(shù)學(xué)模型中的參數(shù)應(yīng)該是隨時(shí)間而變化的。雖然語(yǔ)音信號(hào)具有時(shí)變特性,但是它的特性隨時(shí)間變化是很緩慢的在一個(gè)短時(shí)間范圍內(nèi)(一般為1030ms),其特性基本保持不變,即短時(shí)平穩(wěn)性。所以可以做出一些合理的假設(shè),將語(yǔ)音信號(hào)分為一些相繼的短段進(jìn)行處理,在這些短段內(nèi)認(rèn)為語(yǔ)音信號(hào)特性是不隨時(shí)間變化的平穩(wěn)隨機(jī)過(guò)程,然后應(yīng)用平穩(wěn)隨機(jī)過(guò)程的方法來(lái)處理語(yǔ)音信號(hào)。將語(yǔ)音信號(hào)分為一幀一幀來(lái)分析其特征參數(shù)(幀長(zhǎng)取為1030ms),這樣對(duì)于整體的語(yǔ)音信號(hào)而言,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)隨機(jī)時(shí)間序列。因?yàn)檎Z(yǔ)音信號(hào)是一種隨機(jī)過(guò)程,所以在語(yǔ)音信號(hào)處理的很多方面可以應(yīng)用隨機(jī)模型分析

3、法對(duì)語(yǔ)音信號(hào)進(jìn)行處理分析。ARMA模型是常用的擬合隨機(jī)時(shí)間序列的模型,語(yǔ)音信號(hào)的線性預(yù)測(cè)分析(LPC)就是ARMA模型在語(yǔ)音信號(hào)處理中的一種具體應(yīng)用。下文首先闡述ARMA模型,然后介紹它在語(yǔ)音信號(hào)線性預(yù)測(cè)分析中的應(yīng)用方法。1. ARMA模型ARMA模型全稱(chēng)自回歸滑動(dòng)平均模型(Auto Regressive Moving Average Model),是研究平穩(wěn)隨機(jī)過(guò)程有理譜的典型方法,適用于很大一類(lèi)實(shí)際問(wèn)題。ARMA模型頻譜分辨率高,已成為隨機(jī)信號(hào)和現(xiàn)代譜分析中的一種重要的參數(shù)模型。ARMA模型由博克斯(Box)和詹金斯(Jenkins)創(chuàng)立,也稱(chēng)B-J方法,其基本思想是:某些時(shí)間序列是依賴(lài)于

4、時(shí)間的一組時(shí)間變量,構(gòu)成該時(shí)序的單個(gè)序列值雖然具有不確定性,但整個(gè)序列的變化確有一定的規(guī)律性,可以用相應(yīng)的數(shù)學(xué)模型近似描述。通過(guò)對(duì)該數(shù)學(xué)模型的分析和研究,能夠更本質(zhì)地認(rèn)識(shí)時(shí)間序列的結(jié)構(gòu)和特征,達(dá)到最小均方誤差意義下的最優(yōu)預(yù)測(cè)。實(shí)際應(yīng)用中所遇到的很多隨機(jī)過(guò)程可以用有理傳輸函數(shù)模型很好地逼近,如圖所示,輸入激勵(lì)是均值為0、方差為的白噪聲序列,系統(tǒng)的傳輸函數(shù)為:。式中,是前饋(動(dòng)平均)支路的系數(shù),稱(chēng)為MA系數(shù);是反饋(自回歸)支路的系數(shù),稱(chēng)為AR系數(shù)。系統(tǒng)的輸出序列是被建模的離散隨機(jī)信號(hào)。該模型的輸出和輸入之間滿(mǎn)足差分方程:,設(shè)。輸出功率譜和輸入功率譜存在以下關(guān)系: 。 ARMA模型可以細(xì)分為以下三

5、種:AR模型、MA 模型和ARMA模型三類(lèi)。因?yàn)榈闹祪H與系統(tǒng)的增益有關(guān),所以可以歸結(jié)到中去,不失一般性,可令。下面具體討論這三種模型。(一) AR模型(Auto Regression Model):如果除外其它的MA系數(shù)都等于零,則,這種模型稱(chēng)為p階自回歸模型或簡(jiǎn)稱(chēng)為模型,其傳輸函數(shù)為,模型的輸出功率譜密度為,這是一個(gè)全極點(diǎn)模型。在模型中,系統(tǒng)的輸出僅與白噪聲序列的當(dāng)前值和的p個(gè)過(guò)去值有關(guān)。(二) MA模型(Moving Average Model):如果除外其它的AR系數(shù)都等于零,則,這種模型稱(chēng)為q階滑動(dòng)平均模型或簡(jiǎn)稱(chēng)為模型,其傳輸函數(shù)為,模型的輸出功率譜為,這是一個(gè)全零點(diǎn)模型。在模型中,系

6、統(tǒng)的輸出僅與白噪聲序列的當(dāng)前值和的q個(gè)過(guò)去值有關(guān)。(三) ARMA模型:設(shè),其它的和不全為零,則,這種模型稱(chēng)為自回歸滑動(dòng)平均模型或簡(jiǎn)稱(chēng)為,這是一個(gè)零極點(diǎn)模型。AR模型和MA模型是ARMA模型的特例,模型是由模型經(jīng)過(guò)q=0退化而來(lái),模型是由模型經(jīng)過(guò)p=0退化而來(lái)。Wold分解定理闡明了上述三種模型之間的聯(lián)系。該定理認(rèn)為:任何廣義平穩(wěn)隨機(jī)過(guò)程都可以分解為一個(gè)完全隨機(jī)的部分和一個(gè)確定的部分。確定性隨機(jī)過(guò)程是一個(gè)可以根據(jù)其過(guò)去的無(wú)限個(gè)采樣值完全加以預(yù)測(cè)的隨機(jī)過(guò)程。例如,一個(gè)由純正弦信號(hào)(具有隨機(jī)相位以保證廣義平穩(wěn))和白噪聲組成的隨機(jī)過(guò)程,可以分解為一個(gè)純隨機(jī)成分(白噪聲)和一個(gè)確定性成分(正弦信號(hào))。

7、或者可以把這種分解看成是把功率譜分解為一個(gè)表示白噪聲的連續(xù)成分和一個(gè)表示正弦信號(hào)的離散成分(具有沖擊信號(hào)的形式)。Wold分解定理的一個(gè)推論是:如果功率譜完全是連續(xù)的,那么任何的或過(guò)程都能用無(wú)限階的(p為無(wú)窮大)過(guò)程表示;同樣,任何的或過(guò)程都能用無(wú)限階的(q為無(wú)窮大)過(guò)程表示。這個(gè)定理很重要,因?yàn)槿绻x擇了一個(gè)不合適的模型,只要模型的階足夠高,它任然能夠比較好地逼近被建模的隨機(jī)過(guò)程。估計(jì)ARMA或MA模型參數(shù)一般需要解一組非線性方程,而估計(jì)AR模型參數(shù)通常只需要解一組線性方程組,因此AR模型的應(yīng)用更廣泛。如果被估計(jì)過(guò)程是P階自回歸過(guò)程,那么用模型即能夠很精確地模擬它;如果被估計(jì)過(guò)程是ARMA或

8、MA過(guò)程,或者是高于p階的AR過(guò)程,那么用模型作為它們的模型時(shí),雖然不可能很精確,但卻可以盡可能地逼近之,關(guān)鍵是要選擇足夠高的階。2. 線性預(yù)測(cè)的基本原理線性預(yù)測(cè)分析是語(yǔ)音處理中的核心技術(shù),它在語(yǔ)音識(shí)別、合成、編碼、說(shuō)話人識(shí)別等方面都得到了成功的應(yīng)用。由于語(yǔ)音樣點(diǎn)之間存在相關(guān)性,所以可以用過(guò)去的樣點(diǎn)值來(lái)預(yù)測(cè)現(xiàn)在或未來(lái)的樣點(diǎn)值,即一個(gè)語(yǔ)音的抽樣能夠用過(guò)去若干個(gè)語(yǔ)音抽樣或它們的線性組合來(lái)逼近。通過(guò)使實(shí)際語(yǔ)音抽樣和線性預(yù)測(cè)抽樣之間的誤差在某個(gè)準(zhǔn)則下達(dá)到最小值來(lái)決定唯一的一組預(yù)測(cè)系數(shù)。這種線性預(yù)測(cè)分析最早應(yīng)用在語(yǔ)音編碼中,因此也常被稱(chēng)為L(zhǎng)PC(Linear Prediction Coding)。線性預(yù)

9、測(cè)的數(shù)學(xué)表達(dá)如下:用過(guò)去p個(gè)樣點(diǎn)值來(lái)預(yù)測(cè)現(xiàn)在或未來(lái)的樣點(diǎn)值,預(yù)測(cè)誤差,這樣就可通過(guò)在某個(gè)準(zhǔn)則下使預(yù)測(cè)誤差達(dá)到最小值的方法來(lái)決定惟一的一組線性預(yù)測(cè)系數(shù)。下面將線性預(yù)測(cè)分析和語(yǔ)音信號(hào)的數(shù)學(xué)模型聯(lián)系起來(lái)。根據(jù)人的發(fā)聲器官的特點(diǎn)和語(yǔ)音產(chǎn)生的機(jī)理,可以將語(yǔ)音生成系統(tǒng)分成3個(gè)部分,在聲門(mén)(聲帶)以下,稱(chēng)為“聲門(mén)子系統(tǒng)”,它負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng),是“激勵(lì)系統(tǒng)”;從聲門(mén)到嘴唇的呼氣通道,是“聲道系統(tǒng)”;語(yǔ)音從嘴唇輻射出去,所以嘴唇以外是“輻射系統(tǒng)”;語(yǔ)音信號(hào)的數(shù)學(xué)模型如圖所示,由準(zhǔn)周期脈沖(在濁音語(yǔ)音期間)或白噪聲(在清音語(yǔ)音期間)激勵(lì)一個(gè)線性時(shí)不變系統(tǒng)(聲道)所產(chǎn)生的輸出作為語(yǔ)音的模型。這里,系統(tǒng)的輸入是語(yǔ)音激

10、勵(lì),是輸出語(yǔ)音。模型的系統(tǒng)函數(shù)可以寫(xiě)成有理分式的形式,式中,系數(shù)、及增益因子G是模型的參數(shù)。顯然,這是一個(gè)ARMA模型,p、q是選定的模型的階數(shù)。當(dāng)同時(shí)含有零點(diǎn)和極點(diǎn),此時(shí)系統(tǒng)模型即為自回歸滑動(dòng)平均模型,是一種一般的模型;當(dāng)上式中的分子多項(xiàng)式為常數(shù),即,為全極點(diǎn)模型,此時(shí)模型的輸出只取決于過(guò)去的信號(hào)值,模型成為自回歸模型;如果上式中分母多項(xiàng)式為1,即,為全零點(diǎn)模型,此時(shí)的系統(tǒng)模型成為滑動(dòng)平均模型,模型的輸出只由模型的輸入來(lái)決定。實(shí)際上語(yǔ)音信號(hào)處理中最常用的是全極點(diǎn)模型,這是因?yàn)椋海?)如果不考慮鼻音和摩擦音,那么語(yǔ)音的聲道傳遞函數(shù)就是一個(gè)全極點(diǎn)模型;對(duì)于鼻音和摩擦音,細(xì)致的聲學(xué)理論表明,其聲道

11、傳遞函數(shù)既有零點(diǎn)也有極點(diǎn),但這時(shí)如果模型的階數(shù)p足夠高,可以用全極點(diǎn)模型來(lái)近似表示零極點(diǎn)模型,即。(2)對(duì)全極點(diǎn)模型做參數(shù)估計(jì)是對(duì)線性方程的求解過(guò)程,而若模型中含有有限個(gè)零點(diǎn),則是解非線性方程組,實(shí)現(xiàn)起來(lái)非常困難。采用全極點(diǎn)模型,輻射、聲道以及聲門(mén)激勵(lì)的組合譜效應(yīng)的傳輸函數(shù)為,式中,p是預(yù)測(cè)器階數(shù),是預(yù)測(cè)器系數(shù), G是聲道濾波器增益,用于控制系統(tǒng)輸出序列的幅度大小。由此,語(yǔ)音信號(hào)的抽樣序列和激勵(lì)信號(hào)序列之間的關(guān)系可用差分方程來(lái)表示:,即語(yǔ)音樣點(diǎn)間有相關(guān)性,可以用過(guò)去的樣點(diǎn)值預(yù)測(cè)未來(lái)樣點(diǎn)值。對(duì)于濁音,激勵(lì)是以基音周期重復(fù)的單位沖激,對(duì)于清音,是穩(wěn)衡白噪聲。 在信號(hào)分析中,模型的建立實(shí)際上是由信號(hào)

12、來(lái)估計(jì)模型參數(shù)的過(guò)程。因?yàn)樾盘?hào)是實(shí)際客觀存在的,用模型表示它不可能是完全精確的,總是存在誤差。且預(yù)測(cè)階數(shù)p無(wú)法事先確定,可能選的過(guò)大或者過(guò)小,況且信號(hào)是時(shí)變的。因此求解模型參數(shù)的過(guò)程是一個(gè)逼近過(guò)程。根據(jù)前面介紹的ARMA模型的基本原理可知,當(dāng)預(yù)測(cè)階數(shù)p(即的階p)足夠高時(shí),模型就能夠很好地逼近被建模的語(yǔ)音信號(hào)。 在模型參數(shù)估計(jì)程中,把如下系統(tǒng)稱(chēng)為線性預(yù)測(cè)器:。式中稱(chēng)為線性預(yù)測(cè)系數(shù)。從而,p階線性預(yù)測(cè)器的系統(tǒng)函數(shù)為,預(yù)測(cè)誤差為。線性預(yù)測(cè)分析要解決的問(wèn)題是:給定語(yǔ)音序列(鑒于語(yǔ)音信號(hào)的時(shí)變特性,LPC分析必須按幀進(jìn)行),使預(yù)測(cè)誤差在某個(gè)準(zhǔn)則下最小,求預(yù)測(cè)系數(shù)的最佳估值,這個(gè)準(zhǔn)則通常采用最小均方誤差

13、準(zhǔn)則。這樣,將參數(shù)解卷問(wèn)題歸結(jié)為估計(jì)預(yù)測(cè)器階數(shù)p和各個(gè)系數(shù)的過(guò)程。如果s(n)是由全極點(diǎn)模型產(chǎn)生的話,那么最佳預(yù)測(cè)階數(shù)p、最佳預(yù)測(cè)系數(shù)等于該全極點(diǎn)模型的參數(shù)。如果模型階數(shù)是已知的,那么可以設(shè)置預(yù)測(cè)階數(shù)p,進(jìn)一步計(jì)算使均方預(yù)測(cè)誤差達(dá)到最小時(shí)的一組預(yù)測(cè)系數(shù),就可求出模型參數(shù)。如果模型階數(shù)不確定,可以觀察均方最小預(yù)測(cè)誤差隨p的變化規(guī)律,從而確定階數(shù)。在確定了階數(shù)p以后,下面具體推導(dǎo)線性預(yù)測(cè)方程。把某一幀內(nèi)的短時(shí)平均預(yù)測(cè)誤差定義為。顯然,越接近于零,線性預(yù)測(cè)的準(zhǔn)確度在均方誤差最小的意義上為最佳。為使最小,對(duì) 求偏導(dǎo),并令其為0,有。上式表明采用最佳預(yù)測(cè)系數(shù)時(shí),預(yù)測(cè)誤差與過(guò)去的語(yǔ)音樣本點(diǎn)正交。由于語(yǔ)音信

14、號(hào)的短時(shí)平穩(wěn)性,要分幀處理(10-30ms),對(duì)于一幀從n時(shí)刻開(kāi)窗選取的N個(gè)樣點(diǎn)的語(yǔ)音段,記為,則有:所以。顯然,如果能找到一種有效的方法求解這組包含p個(gè)未知數(shù)的p個(gè)方程,就可以得到在語(yǔ)音段上使均方預(yù)測(cè)誤差為最小的預(yù)測(cè)系數(shù)。為求解這組方程,必須首先計(jì)算出,一旦求出這些數(shù)值即可按上式求出預(yù)測(cè)系數(shù)。因此從原理上看,線性預(yù)測(cè)分析是非常直觀的。然而,的計(jì)算及方程組的求解都是十分復(fù)雜的,因此必須選擇適當(dāng)?shù)乃惴?。另外,最小均方預(yù)測(cè)誤差為,再考慮及,可得。由此可見(jiàn),最小預(yù)測(cè)誤差由一個(gè)固定分量和一個(gè)依賴(lài)于預(yù)測(cè)器系數(shù)的分量組成。3. 線性預(yù)測(cè)方程組的求解在LPC分析中,對(duì)線性預(yù)測(cè)方程組的求解,有自相關(guān)法和協(xié)方差

15、法兩種經(jīng)典解法,另外還有效率較高的格型法等。下文著重介紹自相關(guān)法。設(shè)從n時(shí)刻開(kāi)窗選取N個(gè)樣點(diǎn)的語(yǔ)音段 ,即只用語(yǔ)音樣本點(diǎn)分析該幀的預(yù)測(cè)系數(shù)。對(duì)于語(yǔ)音段,它的自相關(guān)函數(shù)為。自相關(guān)函數(shù)是偶函數(shù),且的大小只與 有關(guān)。因此,可以定義為。結(jié)合可得: 。把上式展開(kāi)寫(xiě)成矩陣形式:這個(gè)方程叫做Yule-Walker方程,方程左邊的矩陣稱(chēng)為托普利茲(Toeplitz)矩陣,它是以主對(duì)角線對(duì)稱(chēng)的,而且其沿著主對(duì)角線平行方向的各軸向的元素值都相等。這種Yule-Walker方程可用萊文遜-杜賓(LevinsonDurbin)遞推算法來(lái)高效地求解。下面利用Durbin快速遞推算法求解上述方程組。如果把上面的矩陣形式簡(jiǎn)

16、寫(xiě)為,求解就是對(duì)自相關(guān)矩陣求逆。一般Toeplitz矩陣是非奇異矩陣,它的逆矩陣存在,則,其中上標(biāo)p代表階數(shù),中的i代表p階全極點(diǎn)模型系數(shù)標(biāo)號(hào)。這樣,對(duì)于p+1階模型參數(shù)的估值,則有,其中, 是列矢量的倒置,是列矢量的轉(zhuǎn)置。由此可得:將上式分為上下兩部分運(yùn)算,相應(yīng)的運(yùn)算式為:,令,則上兩式為:。由于是托普利茲矩陣,從可以導(dǎo)出,相應(yīng)下面兩式成立:將兩邊乘以,得到: (a)將上式代入和,得到,將其代入,解出: (b) (c)上面(a)、(b)、(c)三式是從遞推出的遞推公式。式(c)的分母等于,它等于p階最佳線性預(yù)測(cè)反濾波余數(shù)能量。與的遞推關(guān)系為。歸納起來(lái):因此,Durbin算法從零階預(yù)測(cè)開(kāi)始,此

17、時(shí),p=0,,可以逐步遞推出一直到最后用確定增益G值。這說(shuō)明激勵(lì)信號(hào)正比于誤差信號(hào),其比例常數(shù)等于模型增益G。這就是p階線性預(yù)測(cè)快速遞推算法的過(guò)程。在運(yùn)算過(guò)程中出現(xiàn)的各階預(yù)測(cè)系數(shù)的最末一個(gè)值被定義為偏相關(guān)系數(shù) 。完整的遞推過(guò)程總結(jié)如下:1),2) 3)4)5),if , go to (1)6)顯然,在Durbin算法中,起到很關(guān)鍵的作用,它也是格型網(wǎng)絡(luò)的基本參數(shù),稱(chēng)為反射系數(shù)。4. LPC譜估計(jì)LPC系數(shù)是線性預(yù)測(cè)分析的基本參數(shù),可以把這些系數(shù)變換為其他參數(shù),以得到語(yǔ)音的其他替代表示方法。當(dāng)求出一組預(yù)測(cè)器系數(shù)后,就可以得到語(yǔ)音產(chǎn)生模型的頻率響應(yīng),即:因此在共振峰頻率上其頻率響應(yīng)特性會(huì)出現(xiàn)峰值。

18、所以線性預(yù)測(cè)分析法又可以看作是一種短時(shí)譜估計(jì)法。其頻率響應(yīng)即稱(chēng)為L(zhǎng)PC譜。也就是序列 的傅立葉變換的倒數(shù)。它的對(duì)數(shù)功率譜為:用表示模型的頻率響應(yīng)、(信號(hào)譜)表示語(yǔ)音信號(hào)的傅立葉變換、 表示語(yǔ)音信號(hào)的功率譜??梢宰C明如果信號(hào)s(n)是一個(gè)嚴(yán)格的p階AR模型,則可以滿(mǎn)足。但事實(shí)上,語(yǔ)音信號(hào)并非是嚴(yán)格的AR模型,而應(yīng)該是ARMA模型。因此,可用一個(gè)AR模型來(lái)逼近ARMA模型,即。式中p為H(z)的階數(shù)。雖然時(shí),但是不一定存在,因?yàn)镠(z)的全部極點(diǎn)在單位圓內(nèi),而卻不一定滿(mǎn)足這個(gè)條件。LPC譜估計(jì)具有一個(gè)特點(diǎn):在信號(hào)能量較大的區(qū)域即接近譜的峰值處,LPC譜和信號(hào)譜很接近;而在信號(hào)能量較低的區(qū)域即接近譜

19、的谷底處,則相差比較大。這個(gè)特點(diǎn)對(duì)于呈現(xiàn)諧波結(jié)構(gòu)的濁音語(yǔ)音譜來(lái)說(shuō),就是在諧波成分處LPC譜匹配信號(hào)譜的效果要遠(yuǎn)比諧波之間好得多。LPC譜估計(jì)的這一特點(diǎn)實(shí)際上來(lái)自均方誤差最小準(zhǔn)則。從以上討論我們知道如果p選得很大,可以使精確地匹配于,而且極零模型也可以用全極點(diǎn)模型來(lái)代替,但卻增加了計(jì)算量和存儲(chǔ)量,且p增加到一定程度以后,預(yù)測(cè)平方誤差的改善就很不明顯了,因此在語(yǔ)音信號(hào)處理中,p一般選在814之間,此時(shí)就可以對(duì)絕大多數(shù)語(yǔ)音信號(hào)的聲道模型取得足夠近似的逼近。LPC系數(shù)可以表示整個(gè)LPC系統(tǒng)沖激響應(yīng)的復(fù)倒譜。設(shè)通過(guò)線性預(yù)測(cè)分析得到的聲道模型系統(tǒng)函數(shù)為,其沖激響應(yīng)為h(n),設(shè)表示h(n)的復(fù)倒譜,則有。

20、LPC復(fù)倒譜由于利用了線性預(yù)測(cè)中聲道系統(tǒng)函數(shù)H(z)的最小相位特性,避免了相位卷繞問(wèn)題;而且LPC復(fù)倒譜的運(yùn)算量小,它僅是用FFT求復(fù)倒譜時(shí)運(yùn)算量的一半;又因?yàn)楫?dāng)p時(shí),語(yǔ)音信號(hào)的短時(shí)復(fù)頻譜滿(mǎn)足,因而可以認(rèn)為包含了語(yǔ)音信號(hào)頻譜包絡(luò)信息,即可近似把當(dāng)作s(n)的短時(shí)復(fù)倒譜,來(lái)分別估計(jì)出語(yǔ)音短時(shí)譜包絡(luò)和聲門(mén)激勵(lì)參數(shù)。在實(shí)時(shí)語(yǔ)音識(shí)別中也經(jīng)常采用LPC復(fù)倒譜作為特征矢量。5. 影響LPC的因素要使模型的假定較好地符合語(yǔ)音產(chǎn)生模型,主要有兩個(gè)因素要考慮:首先是模型的階數(shù)p要與共振峰個(gè)數(shù)相吻合,其次是聲門(mén)脈沖形狀和口唇輻射影響的補(bǔ)償。通常一對(duì)極點(diǎn)對(duì)應(yīng)一個(gè)共振峰,10kHz采樣的語(yǔ)音信號(hào)通常有5個(gè)共振峰,取p=10,對(duì)于8kHz采用的語(yǔ)音信號(hào)可取p=8,此外為了彌補(bǔ)鼻音中存在的零點(diǎn)以及其他因素引起的偏差,通常在上述階數(shù)的基礎(chǔ)上再增加兩個(gè)極點(diǎn),即分別取p=12和p=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論