AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)_第1頁(yè)
AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)_第2頁(yè)
AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)_第3頁(yè)
AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、【W(wǎng)ord版本下載可任意編輯】 AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì) 0 引言 傳統(tǒng)的人機(jī)交互依靠復(fù)雜的鍵盤(pán)或按鈕來(lái)實(shí)現(xiàn),隨著科技的發(fā)展,一些新型的人機(jī)交互方式也隨之誕生,帶給人們?nèi)碌捏w驗(yàn)?;谡Z(yǔ)音識(shí)別的人機(jī)交互方式是目前熱門(mén)的技術(shù)之一。但是語(yǔ)音識(shí)別功能算法復(fù)雜、計(jì)算量大,一般在計(jì)算機(jī)上實(shí)現(xiàn),即使是嵌入式方面,多數(shù)方案也需要運(yùn)算能力強(qiáng)的ARM或DSP,并且外擴(kuò)RAM、FLASH等資源,增加了硬件成本,這些特點(diǎn)無(wú)疑限制了語(yǔ)音識(shí)別技術(shù)的應(yīng)用,尤其是嵌入式領(lǐng)域。 本系統(tǒng)采用的主控MCU為Atmel公司的ATMEGA128,語(yǔ)音識(shí)別功能則采用ICRoute公司的單芯片LD3320。LD3320內(nèi)部集成優(yōu)化

2、過(guò)的語(yǔ)音識(shí)別算法,無(wú)需外部FLASH,RAM資源,可以很好地完成非特定人的語(yǔ)音識(shí)別任務(wù)。 1 整體方案設(shè)計(jì) 1.1 語(yǔ)音識(shí)別原理 在計(jì)算機(jī)系統(tǒng)中,語(yǔ)音信號(hào)本身的不確定性、動(dòng)態(tài)性和連續(xù)性是語(yǔ)音識(shí)別的難點(diǎn)。主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論,原理如圖1所示。 語(yǔ)音識(shí)別通常需要兩個(gè)階段完成。階段是訓(xùn)練,主要是提取語(yǔ)音特征,用戶往往需要開(kāi)展幾次語(yǔ)音訓(xùn)練,經(jīng)過(guò)預(yù)處理和特征提取后獲得相應(yīng)特征參數(shù)。第二階段是識(shí)別,識(shí)別過(guò)程就是將輸入的語(yǔ)音特征參數(shù)和模型庫(kù)中的參數(shù)開(kāi)展相似性比較,輸出匹配度的特征參數(shù)完成識(shí)別過(guò)程。 2 硬件電路設(shè)計(jì) 硬件框架如圖2所示,電路主要由主控制器電路和語(yǔ)音識(shí)別電路組成。AT

3、MEGA128控制LD3320語(yǔ)音識(shí)別電路,輸出結(jié)果由ATMEGA128處理,然后通過(guò)總線來(lái)控制不同的設(shè)備。 2.1 控制器電路 控制器選用Atmel公司生產(chǎn)的ATMEGA128芯片,采用先進(jìn)的RISC構(gòu)造,內(nèi)置128 KB FLASH,4 KB SRAM,4 KB E2PROM等豐富資源。該芯片 是業(yè)界高性能、低功耗的8位微處理器,并在8位單片機(jī)市場(chǎng)有著廣泛應(yīng)用。 2.2 LD3320語(yǔ)音識(shí)別電路 LD3320芯片是一款“語(yǔ)音識(shí)別”專用芯片。該芯片集成了語(yǔ)音識(shí)別處理器和一些外部電路,包括AD、DA轉(zhuǎn)換器、麥克風(fēng)接口、聲音輸出接口等,而且可以播放MP3。不需要外接任何的輔助芯片如FLASH,R

4、AM等,直接集成到產(chǎn)品中即可以實(shí)現(xiàn)語(yǔ)音識(shí)別、聲控、人機(jī)對(duì)話功能。 圖3為L(zhǎng)D3320電路原理圖,與MCU通信采用SPI總線方式,時(shí)鐘不能超過(guò)1.5MHz。 麥克風(fēng)工作電路如圖4所示,音頻輸出只需將揚(yáng)聲器連接到SPOP和SPON即可。使用SPI總線方式時(shí),LD3320的MD要設(shè)為高電平,SPIS設(shè)為低電平。SPI總線的引腳有SDI,SDO,SDCK以及SCS。INTB為中斷端口,當(dāng)有識(shí)別結(jié)果或MP3數(shù)據(jù)缺陷時(shí),會(huì)觸發(fā)中斷,通知MCU處理。RSTB引腳是LD3320復(fù)位端,低電平有效。LED1,LED2作為上電指示燈。 3 軟件系統(tǒng)設(shè)計(jì) 軟件設(shè)計(jì)主要有兩部分,分別為移植LD3320代碼和編寫(xiě)語(yǔ)音識(shí)

5、別應(yīng)用程序。 3.1 移植LD3320源代碼 LD3320源代碼是基于51單片機(jī)實(shí)現(xiàn)的,SPI部分采用的是軟件模擬方式,但在播放MP3數(shù)據(jù)時(shí)會(huì)有停頓現(xiàn)象,原因是51單片機(jī)主頻較低,導(dǎo)致SPI速率很慢,不能及時(shí)更新MP3數(shù)據(jù)。移植到ATMEGA128需要修改底層存放器讀寫(xiě)函數(shù)、中斷函數(shù)等。底層驅(qū)動(dòng)在Reg_RW.c文件中,首先在Reg_RW.h使用HARD_PARA_PORT宏定義,以支持硬件SPI。然后在Reg_RW.c文件中找到HARD_PARA_PORT對(duì)應(yīng)條件宏的代碼段,保存AVR的SPI接口代碼。 3.2 應(yīng)用程序?qū)崿F(xiàn) 在代碼中預(yù)先設(shè)定幾個(gè)單詞:“你好”,“播放音樂(lè)”,“打開(kāi)”。當(dāng)用戶

6、說(shuō)“播放音樂(lè)”時(shí),MCU控制LD3320播放一段音樂(lè),如果是其他詞語(yǔ),則在串口中打印識(shí)別結(jié)果,然后再次轉(zhuǎn)換到語(yǔ)音識(shí)別狀態(tài)。 3.2.1 MP3播放代碼 LD3320支持MP3數(shù)據(jù)播放,播放聲音的操作順序?yàn)椋?通用初始化MP3播放用初始化調(diào)節(jié)播放音量開(kāi)始播放。 將MP3數(shù)據(jù)順序放入數(shù)據(jù)存放器,芯片播放完一定數(shù)量的數(shù)據(jù)時(shí)會(huì)發(fā)出中斷請(qǐng)求,在中斷函數(shù)中連續(xù)送入聲音數(shù)據(jù),直到聲音數(shù)據(jù)結(jié)束。MP3播放函數(shù)實(shí)現(xiàn)代碼如下: 由于MCU容量限制,選取測(cè)試的MP3文件不能太大。首先在計(jì)算機(jī)上將MP3文件的二進(jìn)制數(shù)據(jù)轉(zhuǎn)為標(biāo)準(zhǔn)C數(shù)組格式文件,然后將該文件參加工程中。源代碼中MP3文件存儲(chǔ)在外擴(kuò)的SPI FLASH中,

7、工程中需要注釋和移除全部相關(guān)代碼。MP3數(shù)據(jù)讀取函數(shù)是LD_ReloadMp3Data(),只需將讀取的SPI FLASH數(shù)據(jù)部分改成以數(shù)組數(shù)據(jù)讀取的方式即可。 3.2.2 語(yǔ)音識(shí)別程序 LD3320語(yǔ)音識(shí)別芯片完成的操作順序?yàn)椋和ㄓ贸跏蓟疉SR初始化添加關(guān)鍵詞開(kāi)啟語(yǔ)音識(shí)別。在源代碼中的RunASR()函數(shù)已經(jīng)實(shí)現(xiàn)了上面的過(guò)程,直接調(diào)用即可開(kāi)啟語(yǔ)音識(shí)別功能。 RunASR()函數(shù)代碼如下: 用戶說(shuō)完話后,LD3320通過(guò)打分的方式,將關(guān)鍵詞列表中特征相似的一個(gè)作為輸出。然后LD3320會(huì)產(chǎn)生一個(gè)中斷信號(hào),此時(shí)MCU跳入中斷函數(shù)讀取C5存放器的值,該值即為識(shí)別結(jié)果,得到結(jié)果后,用戶可以根據(jù)數(shù)值來(lái)實(shí)現(xiàn)一些功能,比方讀取到1,說(shuō)明是“播放音樂(lè)”,那么可以調(diào)用前面的PlaySound()函數(shù)來(lái)播放音樂(lè)。 語(yǔ)音識(shí)別控制的關(guān)鍵點(diǎn)在于語(yǔ)音識(shí)別的準(zhǔn)確率。表1給出了測(cè)試結(jié)果,當(dāng)然也可以在識(shí)別列表中參加更多的關(guān)鍵詞來(lái)做測(cè)試。通過(guò)測(cè)試結(jié)果可以看出,LD3320的識(shí)別率在95上,能夠滿足用戶需求。 4 結(jié)語(yǔ) 本文討論了基于AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)的可行性,并給出了設(shè)計(jì)方案。通過(guò)多次測(cè)試結(jié)果說(shuō)明,本系統(tǒng)具有電路運(yùn)行穩(wěn)定,語(yǔ)音識(shí)別率高,成本低等優(yōu)點(diǎn)。同時(shí)借助于LD3320的MP3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論