服務機器人中嵌入式語音識別交互系統(tǒng)的研究_第1頁
服務機器人中嵌入式語音識別交互系統(tǒng)的研究_第2頁
服務機器人中嵌入式語音識別交互系統(tǒng)的研究_第3頁
服務機器人中嵌入式語音識別交互系統(tǒng)的研究_第4頁
服務機器人中嵌入式語音識別交互系統(tǒng)的研究_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、服務機器人中嵌入式語音識別交互系統(tǒng)的研究服務機器人中嵌入式語音識別交互系統(tǒng)的研究前 言隨著現(xiàn)代科技和計算機技術(shù)的不斷發(fā)展,人們在與機器的信息交流中,需要一種更加方便、自然的方式,而語言是人類最重要、最有效的信息源。另外實現(xiàn)人機之間語音交互,讓機器“聽懂”人的話也是人們夢寐以求的事情。隨著語音識別技術(shù)的出現(xiàn),使得這一理想得以實現(xiàn)。特別是在智能服務機器人系統(tǒng)中,基于語音識別的人機交互是最為直接的交互手段。近年來,隨著智能化小產(chǎn)品和消費類電子產(chǎn)品的迅速發(fā)展,語音識別系統(tǒng)大量從PC平臺轉(zhuǎn)移到嵌入式設(shè)備中,嵌入式語音識別技術(shù)得到越來越多的應用。語音識別技術(shù)的應用語音識別的基本原理嵌入式語音識別交互系統(tǒng)硬

2、件設(shè)計嵌入式語音識別交互系統(tǒng)軟件設(shè)計目 錄目前,語音識別技術(shù)應用最廣泛的就是在家電方面的應用。此外在通訊、自動控制和各種智能機器人等方面都有著越來越廣泛的應用。語音識別技術(shù)的應用語音識別技術(shù)的應用該機器人具有語音識別及語音合成功能,可自由對話及講解、背誦唐詩、演唱歌曲、跳舞等。游客通過語音識別系統(tǒng)可以和機器人進行簡單的對話。該種機器人可應用于科技館、商店和旅游場所進行導游服務。1海爾哈工大機器人技術(shù)公司研制的系列導游機器人語音識別技術(shù)的應用該機器人進一步提高了語音識別能力,可與兒童對話并實現(xiàn)部分兒童監(jiān)護功能。NEC公司稱,PaPeRo機器人增加了“噪聲環(huán)境下分辨聲音的能力、對手寫筆記、文字和動

3、畫的認識能力,還有與人自然溝通的能力” 。2日本NEC 機器人PaPaRo語音識別技術(shù)的應用東芝試制出家用機器人的概念模型。該概念模型利用語音識別和語音合成技術(shù)可以與人交談,利用圖像識別技術(shù)可以識別事先注冊的人。該產(chǎn)品通過語音識別功能可以根據(jù)語音來指示其行動。如果在遠處召喚則可以確定聲音發(fā)出的位置并且走過來。另外還可以利用語音合成功能發(fā)出聲音。3日本東芝家用機器人ApriAlpha語音識別技術(shù)的應用本田公司在類人型機器人“ASIMO” 中新配備了語音識別技術(shù),可以進行簡單的對話。比如,除了可以回答諸如“請問你的出生年月日”、“為什么取名為ASIMO”、“很可愛喔”等50 種提問以外,還可以按照

4、“向右轉(zhuǎn)”、“鞠躬”、“揮動雙手”等30 種命令做出相應的動作。4日本本田機器人ASIMO語音識別的基本原理語言識別語言學計算機科學信號處理心理學一個語音識別系統(tǒng)主要包括訓練和識別兩個階段。在訓練階段,用戶輸入若干次訓練語音,系統(tǒng)經(jīng)過上述預處理和特征提取后得到特征矢量參數(shù),然后通過特征建模建立訓練語音的參考模型庫。在識別階段,將輸入語音的特征矢量參數(shù)和參考模型庫中的參考模型進行相似性度量比較,將相似性最高的輸入特征矢量作為識別結(jié)果輸出。語音識別的基本原理語音識別的基本原理語音識別原理框圖嵌入式語音識別交互系統(tǒng)硬件設(shè)計嵌入式語音識別交互系統(tǒng)硬件設(shè)計系統(tǒng)硬件結(jié)構(gòu)框圖多通道語音輸入模塊采用模擬加法器

5、來實現(xiàn)。將經(jīng)由多個麥克輸入的模擬語音信號進行疊加,然后求其均值,便可獲得一路輸出語音信號。輸入語音經(jīng)MIC 后轉(zhuǎn)化為電信號,一般在音頻信號處理過程中,前端都會混入50Hz 的交流電源噪聲,所以前端采用濾波電路進行預濾波。輸出語音資源事先經(jīng)壓縮編碼后存入單片機內(nèi)存中,語音交互時經(jīng)D/A 轉(zhuǎn)換后經(jīng)由SPY0030(語音集成放大器)由喇叭輸出。通訊部分包括32 位I/O 接口和通用異步串行接口(UART),可以實現(xiàn)與控制板之間的通訊,實現(xiàn)對機器人的語音控制。嵌入式語音識別交互系統(tǒng)軟件設(shè)計語音識別交互主函數(shù)流程圖語音識別前先要對系統(tǒng)進行語音訓練,將訓練語音的參考模板存儲于芯片內(nèi),以供識別時與輸入語音信號特征模型進行匹配識別。系統(tǒng)主函數(shù)的具體流程是:訓練完成后系統(tǒng)便會進入等待狀態(tài),等待主控板發(fā)出開始語音識別的觸發(fā)指令,在收到指令前系統(tǒng)是不進行語音識別交互過程的。收到主控板發(fā)出的開始語音識別交互的指令后,系統(tǒng)便進入了語音識別交互狀態(tài)。初始化識別器后系統(tǒng)就會等待用戶的語音命令了。用戶發(fā)出語音命令,系統(tǒng)識別后便會根據(jù)所識別語音命令的種類做出相應的動作,當系統(tǒng)沒有識別出語音命令,便會根據(jù)不同的情況(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論