語音識別在多媒體課件中的應(yīng)用研究_第1頁
語音識別在多媒體課件中的應(yīng)用研究_第2頁
語音識別在多媒體課件中的應(yīng)用研究_第3頁
語音識別在多媒體課件中的應(yīng)用研究_第4頁
語音識別在多媒體課件中的應(yīng)用研究_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語音識別在多媒體課件中的應(yīng)用研究于洪濤121內(nèi)蒙古民族大學(xué)教育科學(xué)學(xué)院內(nèi)蒙古通遼 0280002吉林大學(xué)高等教育研究所吉林長春 130012內(nèi)容提要:在介紹Macromedia公司的多媒體開發(fā)工具Authorware和微軟公司的 Speech SDK 5.1語音開發(fā)包的基礎(chǔ)上,通過FLASH動畫設(shè)計課件實例,詳細的論述了Authorware中結(jié)合MS Speech SDK 5.1開發(fā)語音識別多媒體課件的方法。關(guān)鍵詞:Authorware MS Speech SDK 多媒體課件語音識別一、引言語言是人類交流信息最自然、最有效和方便的手段,讓多媒體課件能聽懂我們說的話,并按照我們的命令去運行,是多

2、媒體課件開發(fā)所追求的目標。利用語音識別技術(shù),就能夠?qū)崿F(xiàn)這個目標。語音識別是機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本文件或命令的技術(shù)。目前,語音識別技術(shù)已經(jīng)從實驗室走向?qū)嵱茫S多公司都提供語音識別引擎,IBM公司的ViaVoice嵌入式語音識別系統(tǒng),微軟公司推出的Speech SDK提供了一個語音識別和語音合成的二次開發(fā)平臺,可以識別英語、簡體中文和日語,這些語音識別系統(tǒng)為開發(fā)語音識別多媒體課件提供了物質(zhì)條件。目前,國內(nèi)許多學(xué)者利用Speech SDK開發(fā)出了語音識別系統(tǒng)。例如火車票查詢系統(tǒng)中語音識別的研究及實現(xiàn)1,機器人手術(shù)網(wǎng)絡(luò)遙控系統(tǒng)中的語音識別2,都是利用Speech SDK結(jié)合V

3、C+開發(fā)的。VC+開發(fā)工具,并不適合普通教師用來開發(fā)多媒體課件,那么,能不能在教師熟悉的開發(fā)軟件,如Authorware中實現(xiàn)語音識別功能就是有待于解決的問題。二、Authorware開發(fā)語音識別多媒體課件概述微軟公司 Speech SDK提供關(guān)于語音(Speech)處理的一套應(yīng)用程序編程接口SAPI(Speech Application Programming Interface)。SAPI提供了實現(xiàn)文字-語音轉(zhuǎn)換(Text-to-Speech)和語音識別(Speech Recognition)程序的基本函數(shù),簡化了語音編程的難度,降低了語音編程的工作量。Speech SDK采用COM標準開

4、發(fā),地層協(xié)議都以COM組件的形式完全獨立于應(yīng)用程序?qū)樱瑸閼?yīng)用人員屏蔽掉復(fù)雜的語音技術(shù),充分體現(xiàn)了COM的優(yōu)點。VC+、VB等程序都可以開發(fā)語音識別程序,目前,大部分基于Speech SDK語音識別程序都是用VC+開發(fā)的,用VC+、VB等開發(fā)工具開發(fā)多媒體課件,對大多數(shù)教師來說有一定的難度。Authorware是開發(fā)多媒體課件最常用的工具之一,提供了十一種交互,利用這些交互方式可以開發(fā)出優(yōu)秀課件。許多教師都在運用Authorware開發(fā)課件,并且取得了豐富的研究成果。在論文在Authorware中實現(xiàn)多媒體數(shù)據(jù)庫的構(gòu)造與查詢3中介紹了如何在Authorware中訪問本地數(shù)據(jù)庫,在論文運用Auth

5、orware7.0制作多媒體課件的幾點技巧4中介紹制多媒體課件經(jīng)驗技巧。筆者查閱了大量關(guān)于語音識別和Authorware的資料,目前國內(nèi)還沒有用Authorware結(jié)合Speech SDK開發(fā)具有語音識別的功能的多媒體課件的案例。而大部分教師都參加Authorware培訓(xùn),有一定的Authorware開發(fā)多媒體課件的經(jīng)驗,那么能不能用Authorware結(jié)合Speech SDK開發(fā)語音識別多媒體課件那?Authorware并不支持COM編程,不能直接調(diào)用Speech SDK。筆者通過搜索發(fā)現(xiàn)alSR.U32擴展函數(shù)5,alSR.U32是Authorware的一個外部函數(shù),里面提供了一組函數(shù)可以

6、讓Authorware利用Speech SDK實現(xiàn)語音識別。因此我們可以在Authorware中通過調(diào)用外部函數(shù)來調(diào)用Speech SDK來開發(fā)語音識別多媒體課件。三、FLASH動畫設(shè)計語音識別課件實例(一)FLASH動畫設(shè)計課件簡介FLASH動畫設(shè)計多媒體課件是用Authorware開發(fā)的,講解FLASH的五種動畫設(shè)計方法,既能用與課堂教學(xué),又適合于個別化學(xué)習(xí),課件主菜單如圖1所示圖1Flash動畫設(shè)計課件菜單(二)FLASH動畫設(shè)計課件語音識別實現(xiàn)FLASH動畫設(shè)計課件提供了鼠標交互和語音識別兩中方式來選取教學(xué)內(nèi)容,用鼠標選取按鈕或說出按鈕的名稱都能進入相應(yīng)教學(xué)內(nèi)容,關(guān)于鼠標交互請參考其他

7、書籍,這里只討論語音識別的方式。我們可以運用語音來控制課件的運行,說出教學(xué)內(nèi)容的名字,進入相應(yīng)的學(xué)習(xí)內(nèi)容,說“上一頁”、“下一頁”來進行翻頁,說“返回”返回到主菜單,說“退出”關(guān)閉課件。Speech SDK提供了兩種識別方式,聽寫識別方式和命令識別方式,由于聽寫識別方式識別率底,不能滿足教學(xué)要求,在這里采用命令識別方式。本程序是用Authorware6.5開發(fā),結(jié)構(gòu)如圖2。圖2 Flash動畫設(shè)計結(jié)構(gòu)圖1命令識別模式在命令識別模式計算圖標中輸入如下代碼:alSRActivate(WindowHandle,2,FileLocation111.xml,srevent)功能是選擇從111.xml文件

8、中讀取命令詞庫,并把識別的文字賦給變量srevent。其中111.xml是命令詞庫,在本例中,內(nèi)容如下: /804是漢語識別ID,409是英語識別ID HYPERLINK l # HYPERLINK l # 逐幀動畫 形狀漸變動畫 移動補間動畫 引導(dǎo)線動畫 遮罩動畫 返回 退出 下一頁 上一頁 2判斷識別內(nèi)容根據(jù)識別到的語音命令,利用條件交互,結(jié)合goto()函數(shù)跳轉(zhuǎn)到相關(guān)的學(xué)習(xí)內(nèi)容,實現(xiàn)用命令來控制課件的運行。例如,用srevent =逐幀動畫來判斷學(xué)生是否說的是“逐幀動畫”如果是用goto(Iconid”逐幀動畫”)來跳轉(zhuǎn)到指定的教學(xué)內(nèi)容。四、結(jié)論本文討論了Authorware調(diào)用Speech SDK實現(xiàn)語音識別的一種方法,并開發(fā)了FLASH動畫設(shè)計課件,經(jīng)過測試Speech SDK命令語音識別模式的識別率能夠滿足教學(xué)要求。在多媒體課件中運用語音識別技術(shù)更能體現(xiàn)出多媒體課件的人性化和智能化。參考文獻:1、吳萍,胡瑞敏,等.火車票查詢系統(tǒng)中語音識別的研究及實現(xiàn)J.計算機工程與應(yīng)用,2003,(33).2272、周振輝,富鋼, 陳文楷.機器人手術(shù)網(wǎng)絡(luò)遙控系統(tǒng)中的語音識別J

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論