




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、語音識(shí)別在多媒體課件中的應(yīng)用研究于洪濤121內(nèi)蒙古民族大學(xué)教育科學(xué)學(xué)院內(nèi)蒙古通遼 0280002吉林大學(xué)高等教育研究所吉林長(zhǎng)春 130012內(nèi)容提要:在介紹Macromedia公司的多媒體開發(fā)工具Authorware和微軟公司的 Speech SDK 5.1語音開發(fā)包的基礎(chǔ)上,通過FLASH動(dòng)畫設(shè)計(jì)課件實(shí)例,詳細(xì)的論述了Authorware中結(jié)合MS Speech SDK 5.1開發(fā)語音識(shí)別多媒體課件的方法。關(guān)鍵詞:Authorware MS Speech SDK 多媒體課件語音識(shí)別一、引言語言是人類交流信息最自然、最有效和方便的手段,讓多媒體課件能聽懂我們說的話,并按照我們的命令去運(yùn)行,是多
2、媒體課件開發(fā)所追求的目標(biāo)。利用語音識(shí)別技術(shù),就能夠?qū)崿F(xiàn)這個(gè)目標(biāo)。語音識(shí)別是機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本文件或命令的技術(shù)。目前,語音識(shí)別技術(shù)已經(jīng)從實(shí)驗(yàn)室走向?qū)嵱?,許多公司都提供語音識(shí)別引擎,IBM公司的ViaVoice嵌入式語音識(shí)別系統(tǒng),微軟公司推出的Speech SDK提供了一個(gè)語音識(shí)別和語音合成的二次開發(fā)平臺(tái),可以識(shí)別英語、簡(jiǎn)體中文和日語,這些語音識(shí)別系統(tǒng)為開發(fā)語音識(shí)別多媒體課件提供了物質(zhì)條件。目前,國內(nèi)許多學(xué)者利用Speech SDK開發(fā)出了語音識(shí)別系統(tǒng)。例如火車票查詢系統(tǒng)中語音識(shí)別的研究及實(shí)現(xiàn)1,機(jī)器人手術(shù)網(wǎng)絡(luò)遙控系統(tǒng)中的語音識(shí)別2,都是利用Speech SDK結(jié)合V
3、C+開發(fā)的。VC+開發(fā)工具,并不適合普通教師用來開發(fā)多媒體課件,那么,能不能在教師熟悉的開發(fā)軟件,如Authorware中實(shí)現(xiàn)語音識(shí)別功能就是有待于解決的問題。二、Authorware開發(fā)語音識(shí)別多媒體課件概述微軟公司 Speech SDK提供關(guān)于語音(Speech)處理的一套應(yīng)用程序編程接口SAPI(Speech Application Programming Interface)。SAPI提供了實(shí)現(xiàn)文字-語音轉(zhuǎn)換(Text-to-Speech)和語音識(shí)別(Speech Recognition)程序的基本函數(shù),簡(jiǎn)化了語音編程的難度,降低了語音編程的工作量。Speech SDK采用COM標(biāo)準(zhǔn)開
4、發(fā),地層協(xié)議都以COM組件的形式完全獨(dú)立于應(yīng)用程序?qū)?,為?yīng)用人員屏蔽掉復(fù)雜的語音技術(shù),充分體現(xiàn)了COM的優(yōu)點(diǎn)。VC+、VB等程序都可以開發(fā)語音識(shí)別程序,目前,大部分基于Speech SDK語音識(shí)別程序都是用VC+開發(fā)的,用VC+、VB等開發(fā)工具開發(fā)多媒體課件,對(duì)大多數(shù)教師來說有一定的難度。Authorware是開發(fā)多媒體課件最常用的工具之一,提供了十一種交互,利用這些交互方式可以開發(fā)出優(yōu)秀課件。許多教師都在運(yùn)用Authorware開發(fā)課件,并且取得了豐富的研究成果。在論文在Authorware中實(shí)現(xiàn)多媒體數(shù)據(jù)庫的構(gòu)造與查詢3中介紹了如何在Authorware中訪問本地?cái)?shù)據(jù)庫,在論文運(yùn)用Auth
5、orware7.0制作多媒體課件的幾點(diǎn)技巧4中介紹制多媒體課件經(jīng)驗(yàn)技巧。筆者查閱了大量關(guān)于語音識(shí)別和Authorware的資料,目前國內(nèi)還沒有用Authorware結(jié)合Speech SDK開發(fā)具有語音識(shí)別的功能的多媒體課件的案例。而大部分教師都參加Authorware培訓(xùn),有一定的Authorware開發(fā)多媒體課件的經(jīng)驗(yàn),那么能不能用Authorware結(jié)合Speech SDK開發(fā)語音識(shí)別多媒體課件那?Authorware并不支持COM編程,不能直接調(diào)用Speech SDK。筆者通過搜索發(fā)現(xiàn)alSR.U32擴(kuò)展函數(shù)5,alSR.U32是Authorware的一個(gè)外部函數(shù),里面提供了一組函數(shù)可以
6、讓Authorware利用Speech SDK實(shí)現(xiàn)語音識(shí)別。因此我們可以在Authorware中通過調(diào)用外部函數(shù)來調(diào)用Speech SDK來開發(fā)語音識(shí)別多媒體課件。三、FLASH動(dòng)畫設(shè)計(jì)語音識(shí)別課件實(shí)例(一)FLASH動(dòng)畫設(shè)計(jì)課件簡(jiǎn)介FLASH動(dòng)畫設(shè)計(jì)多媒體課件是用Authorware開發(fā)的,講解FLASH的五種動(dòng)畫設(shè)計(jì)方法,既能用與課堂教學(xué),又適合于個(gè)別化學(xué)習(xí),課件主菜單如圖1所示圖1Flash動(dòng)畫設(shè)計(jì)課件菜單(二)FLASH動(dòng)畫設(shè)計(jì)課件語音識(shí)別實(shí)現(xiàn)FLASH動(dòng)畫設(shè)計(jì)課件提供了鼠標(biāo)交互和語音識(shí)別兩中方式來選取教學(xué)內(nèi)容,用鼠標(biāo)選取按鈕或說出按鈕的名稱都能進(jìn)入相應(yīng)教學(xué)內(nèi)容,關(guān)于鼠標(biāo)交互請(qǐng)參考其他
7、書籍,這里只討論語音識(shí)別的方式。我們可以運(yùn)用語音來控制課件的運(yùn)行,說出教學(xué)內(nèi)容的名字,進(jìn)入相應(yīng)的學(xué)習(xí)內(nèi)容,說“上一頁”、“下一頁”來進(jìn)行翻頁,說“返回”返回到主菜單,說“退出”關(guān)閉課件。Speech SDK提供了兩種識(shí)別方式,聽寫識(shí)別方式和命令識(shí)別方式,由于聽寫識(shí)別方式識(shí)別率底,不能滿足教學(xué)要求,在這里采用命令識(shí)別方式。本程序是用Authorware6.5開發(fā),結(jié)構(gòu)如圖2。圖2 Flash動(dòng)畫設(shè)計(jì)結(jié)構(gòu)圖1命令識(shí)別模式在命令識(shí)別模式計(jì)算圖標(biāo)中輸入如下代碼:alSRActivate(WindowHandle,2,FileLocation111.xml,srevent)功能是選擇從111.xml文件
8、中讀取命令詞庫,并把識(shí)別的文字賦給變量srevent。其中111.xml是命令詞庫,在本例中,內(nèi)容如下: /804是漢語識(shí)別ID,409是英語識(shí)別ID HYPERLINK l # HYPERLINK l # 逐幀動(dòng)畫 形狀漸變動(dòng)畫 移動(dòng)補(bǔ)間動(dòng)畫 引導(dǎo)線動(dòng)畫 遮罩動(dòng)畫 返回 退出 下一頁 上一頁 2判斷識(shí)別內(nèi)容根據(jù)識(shí)別到的語音命令,利用條件交互,結(jié)合goto()函數(shù)跳轉(zhuǎn)到相關(guān)的學(xué)習(xí)內(nèi)容,實(shí)現(xiàn)用命令來控制課件的運(yùn)行。例如,用srevent =逐幀動(dòng)畫來判斷學(xué)生是否說的是“逐幀動(dòng)畫”如果是用goto(Iconid”逐幀動(dòng)畫”)來跳轉(zhuǎn)到指定的教學(xué)內(nèi)容。四、結(jié)論本文討論了Authorware調(diào)用Speech SDK實(shí)現(xiàn)語音識(shí)別的一種方法,并開發(fā)了FLASH動(dòng)畫設(shè)計(jì)課件,經(jīng)過測(cè)試Speech SDK命令語音識(shí)別模式的識(shí)別率能夠滿足教學(xué)要求。在多媒體課件中運(yùn)用語音識(shí)別技術(shù)更能體現(xiàn)出多媒體課件的人性化和智能化。參考文獻(xiàn):1、吳萍,胡瑞敏,等.火車票查詢系統(tǒng)中語音識(shí)別的研究及實(shí)現(xiàn)J.計(jì)算機(jī)工程與應(yīng)用,2003,(33).2272、周振輝,富鋼, 陳文楷.機(jī)器人手術(shù)網(wǎng)絡(luò)遙控系統(tǒng)中的語音識(shí)別J
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商品房預(yù)售抵押合同
- 筒倉鋼管樓梯施工方案
- 變壓器采購合同采購合同
- 商鋪物業(yè)服務(wù)合同
- 酒店裝修改造施工方案
- 外墻面鋁鋼板加固施工方案
- 2025屆甘肅省蘭州市部分學(xué)校高三一模地理試題(原卷版+解析版)
- 計(jì)劃生育手術(shù)器械項(xiàng)目風(fēng)險(xiǎn)識(shí)別與評(píng)估綜合報(bào)告
- 2025年人力資源制度:04 -藝人簽約合同書
- 2025年陜西國防工業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試題庫學(xué)生專用
- 2025年浙江寧波市奉化區(qū)農(nóng)商控股集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 2025年中考百日誓師大會(huì)校長(zhǎng)發(fā)言稿:激揚(yáng)青春志 決勝中考時(shí)
- YY/T 1860.1-2024無源外科植入物植入物涂層第1部分:通用要求
- 中央2025年全國婦聯(lián)所屬在京事業(yè)單位招聘93人筆試歷年參考題庫附帶答案詳解
- 上海浦東新區(qū)2024-2025高三上學(xué)期期末教學(xué)質(zhì)量檢測(cè)(一模)物理試卷(解析版)
- 人教版高中物理選擇性必修第二冊(cè)電磁波的發(fā)射與接收課件
- 2025河南中煙工業(yè)限責(zé)任公司一線崗位招聘128人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 《建筑冷熱源》全冊(cè)配套最完整課件1
- 廣州2025年廣東廣州市番禺區(qū)小谷圍街道辦事處下屬事業(yè)單位招聘5人筆試歷年參考題庫附帶答案詳解
- 2025年春新人教版生物七年級(jí)下冊(cè)全冊(cè)教學(xué)課件
評(píng)論
0/150
提交評(píng)論