隱馬爾科夫模型-孤立字語音識別_第1頁
隱馬爾科夫模型-孤立字語音識別_第2頁
隱馬爾科夫模型-孤立字語音識別_第3頁
隱馬爾科夫模型-孤立字語音識別_第4頁
隱馬爾科夫模型-孤立字語音識別_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隱馬爾科夫模型隱馬爾科夫模型-孤立字語音識別孤立字語音識別1.馬爾科夫鏈馬爾科夫鏈2.馬爾科夫模型馬爾科夫模型3.隱馬爾科夫模型隱馬爾科夫模型4.孤立字語音識別孤立字語音識別1.1.馬爾科夫鏈馬爾科夫鏈設(shè)設(shè)S S是一個由有限個狀態(tài)組成的集合。是一個由有限個狀態(tài)組成的集合。 S=1, 2, 3, ,n-1, n S=1, 2, 3, ,n-1, n可以把馬爾科夫鏈看做小球隨時間在可以把馬爾科夫鏈看做小球隨時間在n n種種狀態(tài)跳動的過程。狀態(tài)跳動的過程。TS123n.0123t.11220011|,|ttttttttttP qi qi qiqiP qi qi由小球的跳動產(chǎn)生的狀態(tài)序列由小球的跳動產(chǎn)

2、生的狀態(tài)序列X X如果序列如果序列X X在在t t時刻處在狀態(tài)時刻處在狀態(tài) ,若有,若有tq則隨機序列則隨機序列X X構(gòu)成一個一階馬爾科夫鏈。構(gòu)成一個一階馬爾科夫鏈。(Markov Chain)(Markov Chain)2.2.馬爾科夫模型馬爾科夫模型 一階馬爾科夫模型可以描述為一個二元一階馬爾科夫模型可以描述為一個二元組組( S, A ) ( S, A ) ,S S是狀態(tài)的集合,而是狀態(tài)的集合,而A A是所有是所有狀態(tài)轉(zhuǎn)移概率組成的一個狀態(tài)轉(zhuǎn)移概率組成的一個n n行行n n列的矩陣,其列的矩陣,其中每一個元素中每一個元素 為從狀態(tài)為從狀態(tài)i i轉(zhuǎn)移到狀態(tài)轉(zhuǎn)移到狀態(tài)j j的的概率。概率。ij

3、a一個馬爾科夫模型的應(yīng)用一個馬爾科夫模型的應(yīng)用天氣預(yù)測:天氣預(yù)測:我們假設(shè)天氣只有我們假設(shè)天氣只有3個狀態(tài)個狀態(tài)1(陰天陰天),2(多云多云),3(晴天晴天)對以往天氣的觀察我們已經(jīng)統(tǒng)計出了狀態(tài)轉(zhuǎn)移矩陣。對以往天氣的觀察我們已經(jīng)統(tǒng)計出了狀態(tài)轉(zhuǎn)移矩陣。陰天陰天晴天晴天多云多云0.30.20.60.40.30.10.20.80.10.40.30.30.20.60.20.10.10.8A假設(shè)我們今天是晴天,那么我們怎樣預(yù)測假設(shè)我們今天是晴天,那么我們怎樣預(yù)測明天的天氣呢?明天的天氣呢?因為晴天是因為晴天是3狀態(tài),多以我們只要找出矩陣狀態(tài),多以我們只要找出矩陣A中第三行的轉(zhuǎn)移概率最大的那一列即可。中第

4、三行的轉(zhuǎn)移概率最大的那一列即可。因為因為A的第三行第三列最大,也就是或如果的第三行第三列最大,也就是或如果今天是晴天則有今天是晴天則有0.8的概率明天仍然是晴天。的概率明天仍然是晴天。3.3.隱馬爾科夫模型隱馬爾科夫模型壇子與小球問題壇子與小球問題.12n壇子和小球的問題壇子和小球的問題n n個壇子代表馬爾科夫模型的個壇子代表馬爾科夫模型的n n個狀態(tài)的,某人按照馬爾科夫模型在個狀態(tài)的,某人按照馬爾科夫模型在n n個壇子個壇子中選擇,這是一個馬爾科夫過程,當他選擇到中選擇,這是一個馬爾科夫過程,當他選擇到一個壇子他就從壇子中取出一個小球,記錄小一個壇子他就從壇子中取出一個小球,記錄小球的顏色。

5、假設(shè)壇子中各種顏色的球的個數(shù)是球的顏色。假設(shè)壇子中各種顏色的球的個數(shù)是不一樣的,所以他拿到每種顏色球的概率也是不一樣的,所以他拿到每種顏色球的概率也是一個隨機過程。這種雙隨機過程就是隱馬爾科一個隨機過程。這種雙隨機過程就是隱馬爾科夫模型。夫模型。隱馬爾可夫模型隱馬爾可夫模型 可以表示為一個五元組可以表示為一個五元組( S, V, A, B, ) S 是一組狀態(tài)的集合。是一組狀態(tài)的集合。 S = 1, 2, 3, , N (狀態(tài)狀態(tài)n對應(yīng)壇子對應(yīng)壇子n) V 是一組輸出符號組成的集合。是一組輸出符號組成的集合。 V = ( 對應(yīng)紅色小球?qū)?yīng)紅色小球) A 是狀態(tài)轉(zhuǎn)移矩陣,是狀態(tài)轉(zhuǎn)移矩陣,N 行行

6、N 列。列。 A = = ,1 i, j N B 是輸出符號的概率分布。是輸出符號的概率分布。 B = 表示在狀態(tài)表示在狀態(tài)j時輸出符號時輸出符號 的概的概率率 = P( | j ), 1kM ,1jN 是初始狀態(tài)概率分布是初始狀態(tài)概率分布 = = P( = i ) 表示時刻表示時刻1選擇某個狀態(tài)的概率。選擇某個狀態(tài)的概率。ijaija1P|ttqj qi123v , ,Mv vv1vi1q jbk jb kkv jb kkvi 隱馬爾可夫過程是一個雙重隨機過程,隱馬爾可夫過程是一個雙重隨機過程,其中一重隨機過程不能直接觀察到,通過狀其中一重隨機過程不能直接觀察到,通過狀態(tài)轉(zhuǎn)移概率矩陣描述。另

7、一重隨機過程輸出態(tài)轉(zhuǎn)移概率矩陣描述。另一重隨機過程輸出可以觀察的觀察符號,這由輸出概率來定義??梢杂^察的觀察符號,這由輸出概率來定義。 可以把隱馬爾可夫模型看做符號序列的可以把隱馬爾可夫模型看做符號序列的生成裝置,按照一定的步驟,隱馬爾可夫模生成裝置,按照一定的步驟,隱馬爾可夫模型可以生成下面的符號序列:型可以生成下面的符號序列:O= ( )= ( )123To ooo拋擲硬幣問題拋擲硬幣問題 三枚硬幣,隨機選擇一枚,進行拋擲,記錄拋擲三枚硬幣,隨機選擇一枚,進行拋擲,記錄拋擲結(jié)果。可以描述為一個三個狀態(tài)的隱馬爾科夫模型結(jié)果。可以描述為一個三個狀態(tài)的隱馬爾科夫模型 。 = (S, V, A,

8、B, ) = (S, V, A, B, ),其中,其中 S = 1, 2, 3 S = 1, 2, 3 V = H,T V = H,T = 1/3, 1/3, 1/3A12310.90.050.0520.450.10.4530.450.450.1B123H0.50.750.25T0.50.250.75問題一:問題一:給定上述模型,觀察到下列拋擲結(jié)果的概率是給定上述模型,觀察到下列拋擲結(jié)果的概率是多少?多少?O = (H H H H T H T T T T) = (H H H H T H T T T T)( (估算問題估算問題) () (另一種語言模型另一種語言模型) )問題二:問題二:給定上述

9、模型,若觀察到上述拋擲結(jié)果,最可給定上述模型,若觀察到上述拋擲結(jié)果,最可能的硬幣選擇序列能的硬幣選擇序列( (狀態(tài)轉(zhuǎn)換序列狀態(tài)轉(zhuǎn)換序列) )是什么?是什么?( (解碼問題解碼問題) )問題三:問題三:若上述模型中的狀態(tài)轉(zhuǎn)移矩陣若上述模型中的狀態(tài)轉(zhuǎn)移矩陣A A、狀態(tài)輸出概、狀態(tài)輸出概率率B B 和初始狀態(tài)分布和初始狀態(tài)分布 均未知,如何根據(jù)觀察均未知,如何根據(jù)觀察序列得到它們?序列得到它們?( (學習問題或訓練問題學習問題或訓練問題) )隱馬爾科夫模型的三大問題隱馬爾科夫模型的三大問題第1幀4.孤立字語音識別孤立字語音識別4.1特征提取特征提取第2幀第3幀第4幀第5幀每一幀我們可以取每一幀我們可

10、以取24維特征矢量來表示,這相當維特征矢量來表示,這相當于隱馬爾科夫模型中的觀察序列。但唯一的問題于隱馬爾科夫模型中的觀察序列。但唯一的問題是拿小球壇子問題來說就是它的小球種類是無數(shù)是拿小球壇子問題來說就是它的小球種類是無數(shù)種,因為是種,因為是24維矢量。所以我們要把這些無數(shù)種維矢量。所以我們要把這些無數(shù)種的矢量歸類,這就是矢量量化過程。的矢量歸類,這就是矢量量化過程。舉例舉例:以二維矢量為例以二維矢量為例所有可能的二維矢量就構(gòu)成了一個平面。所有可能的二維矢量就構(gòu)成了一個平面。第第i i個二維矢量記為:個二維矢量記為: Xi=xi1,xi2 Xi=xi1,xi2。先把這個平。先把這個平面劃分成

11、面劃分成J J塊互不相交的子區(qū)域,從每個子區(qū)域中塊互不相交的子區(qū)域,從每個子區(qū)域中找出一個代表矢量。如找出一個代表矢量。如J=7J=7。矢量量化的基本原理矢量量化的基本原理矢量空間的劃分矢量空間的劃分Y Y1 1Y Y2 2Y Y3 3Y Y4 4Y Y5 5Y Y6 6Y Y7 7x1x2碼本碼本 Y=YY=Y1 1,Y,Y2 2,Y,YJ J 碼本長度碼本長度 J=7J=7碼字碼字 Y Yj j=x=xj1j1,x,xj2j2 ,j=1,2,Jj=1,2,J矢量量化的基本原理矢量量化的基本原理矢量空間的劃分矢量空間的劃分按照上面的原理把按照上面的原理把2424維的語音特征歸類維的語音特征歸

12、類到碼本中,語音識別的碼本一般選到碼本中,語音識別的碼本一般選64,64,128128,或,或256256。觀察序列就產(chǎn)生了觀察序列就產(chǎn)生了這里的這里的T T就是孤立字語音分割出來的幀數(shù)就是孤立字語音分割出來的幀數(shù), ,O是碼本中的碼字是碼本中的碼字構(gòu)造隱馬爾科夫模型構(gòu)造隱馬爾科夫模型(S, V, A, B, )(S, V, A, B, )其中其中A A的狀態(tài)數(shù)的狀態(tài)數(shù)N N一般選在一般選在3-83-8之間效果最好,之間效果最好,V V的大小就是碼本長度,它的值就是碼字。的大小就是碼本長度,它的值就是碼字。123To o oo4.24.2形成隱馬爾科夫模型形成隱馬爾科夫模型設(shè)設(shè) = =(A A,B B, ),構(gòu)造好模型),構(gòu)造好模型訓練訓練 的值使的值使P(P(O| )| )最大。最大。儲存每個孤立字訓練出來的儲存每個孤立字訓練出來的 和該和該對應(yīng)的字對應(yīng)的字

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論