




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、0信息與電氣工程學院電子信息工程電子信息工程 CDIO 二級項目二級項目(2013/2014 學年第二學期)題 目 : 語音識別控制燈 專業(yè)班級 : 電子信息 學生姓名 : 學 號: 指導教師 : 馬永強老師 設(shè)計周數(shù) : 15 周 設(shè)計成績 : 2014 年 6 月 4 日1目目 錄錄1 1 項目設(shè)計目的及任務(wù)項目設(shè)計目的及任務(wù).2 22 2 項目設(shè)計思路項目設(shè)計思路.2 2 2.2.1 1 LD3320LD3320 芯片芯片 .2 2 2.1.2.1.1 1 LD3320LD3320 芯片的功能芯片的功能 .2 2 2.2.1 1.2.2 寄存器介紹寄存器介紹.2 2 2.2.1.31.3
2、 寄存器的操作寄存器的操作.3 3 2.2.1.41.4 驅(qū)動程序驅(qū)動程序.4 4 2.2.1.51.5 播放聲音播放聲音.7 73 3 設(shè)計電路設(shè)計電路.1111 3.3.1 1 仿真電路仿真電路.1111 3.3.2 2 電路工作原理分析電路工作原理分析.1111 3.2.3.2.1 1 程序流程程序流程.1111 3.2.3.2.2 2 原理說明原理說明.12124 4 項目設(shè)計心得項目設(shè)計心得.1 12 25 5 參考文獻參考文獻.1 13 321 1 項目設(shè)計目的及任務(wù)項目設(shè)計目的及任務(wù)要求完成一個語音識別控制燈系統(tǒng)的設(shè)計,基于 LD3320 芯片的語音識別系統(tǒng)。最基本的要求做到語音
3、說出一些簡單的命令,系統(tǒng)會識別并且做出相應(yīng)地動作或運作,以此來控制燈的亮和滅。要求設(shè)計出原理圖,并且利用 proteus 軟件進行了仿真試驗。2 2 項目設(shè)計思路項目設(shè)計思路 2.12.1 LD3320LD3320 芯片芯片 2.1.12.1.1 LD3320LD3320 芯片的功能芯片的功能語音識別是對基于生理學和行為特征的說話者嗓音和語言學模式的運用。它與語言識別不同在于這項技術(shù)不對說出的詞語本身進行辨識。而是通過分析語音的唯一特性,例如發(fā)音的頻率,來識別出說話的人。語音識別技術(shù)使得人們可以通過說話的嗓音來控制能否出入限制性的區(qū)域。舉例來說,通過電話撥入銀行、數(shù)據(jù)庫服務(wù)、購物或語音郵件,以
4、及進入保密的裝置。語音識別與其他生物識別技術(shù)相比,不僅具有不會遺失和忘記、不需記憶、使用方便等特點,而且還具有用戶接受程度高,聲音輸入設(shè)備造價低廉等優(yōu)點。由于涉及不到用戶的隱私問題,所以可以方便的推廣應(yīng)用。LD3320 芯片是一款“語音識別”專用芯片。該芯片集成了語音識別處理器和一些外部電路,包括 AD、DA 轉(zhuǎn)換器、麥克風接口、聲音輸出接口等。本芯片不需要外接任何的輔助芯片如 Flash、RAM 等,直接集成在現(xiàn)有的產(chǎn)品中即可以實現(xiàn)語音識別/聲控/人機對話功能。并且,識別的關(guān)鍵詞語列表是可以任意動態(tài)編輯的。該芯片不需要外接任何的輔助芯片,直接集成在現(xiàn)有的產(chǎn)品中,即可實現(xiàn)語音識別,聲控,人機對
5、話功能。LD3320 完成非特定人語音識別,每次識別最多可以設(shè)置 50 項候選識別語句,每個識別句可以是單字,詞組或短句,長度為不超過 10 個漢字或者 79 個字節(jié)的拼音串。另一方面,識別句內(nèi)容可以動態(tài)編輯修改,因此可由一個系統(tǒng)支持多種場景。芯片采用 48 腳 QFN 塑料封裝,工作供電為 3.3V。核心是語音識別運算器,配合輸入和輸出,AD/DA 轉(zhuǎn)換等模塊,完成語音識別的功能。LD3320 芯片還支持并行和串口接口,串行方式可以簡化與其他模塊的連接。 2.1.22.1.2 寄存器介紹寄存器介紹寄存器大部分都是有讀和寫的功能,有的是接受數(shù)據(jù)的,有的是設(shè)置開關(guān)和狀態(tài)的。3寄存器的地址空間為
6、8 位,可能的值為 00H 到 FFH。 ASR: 自動語音識別技術(shù)(Automatic Speech Recognition) 。 FIFO:英文 First In First Out 的縮寫,是一種先進先出的數(shù)據(jù)緩存器, 它與普通存儲器的區(qū)別是沒有外部讀寫地址線,這樣使用起來非常簡單。 LD3320 芯片內(nèi)部有 2 個 FIFO,分別是: FIFO_EXTFIFO_DATA FIFO_DATA 主數(shù)據(jù)處理 FIFO 緩存器,ASR 或者 MP3 的主數(shù)據(jù)區(qū) FIFO_EXT 語音識別添加關(guān)鍵詞用 FIFO 緩存器 MCU: 本文檔中專指外部電路板的主控芯片,對 LD3320 芯片進行控制的
7、微處理器。 DSP:本文檔中專指本芯片 LD3320 內(nèi)部的專用 DSP,實現(xiàn)語音識別和語音播放的算法。 2.1.32.1.3 寄存器的操作寄存器的操作本芯片的各種操作,都必須通過寄存器的操作來完成。比如設(shè)置標志位、讀取狀態(tài)、向 FIFO 寫入數(shù)據(jù)等。寄存器讀寫操作有 2 種方式,即標準并行方式和串行 SPI 方式。(1)并行方式第 46 腳(MD)接低電平時按照此方式工作,寫和讀的時序圖如下:圖 1 并行方式寫時序4圖 2 并行方式讀時序由時序圖可以看到,A0 負責通知芯片是數(shù)據(jù)段還是地址段。A0 為高時是地址,而 A0 為低時是數(shù)據(jù)。發(fā)送地址時 CSB*和 WRB*必須有效,寫數(shù)據(jù)時同樣
8、CSB*和 WRB*必須有效,而讀數(shù)據(jù)時 CSB*和 RDB*必須有效。 (2)串行 SPI 方式第 46 腳(MD)接高電平,且第 42 腳(SPIS*)接地時按照此方式工作。寫和讀的時序如圖3:圖 3 SPI 方式寫時序?qū)懙臅r候要先給 SDI 發(fā)送一個 “寫”指令(04H) ,然后給 SDI 發(fā)送 8 位寄存器地址,再給 SDI 發(fā)送 8 位數(shù)據(jù)。在這期間,SCS*必須保持在有效(低電平) 。 圖 4 SPI 方式讀時序5寫的時候要先給 SDI 發(fā)送一個 “讀”指令(05H) ,然后給 SDI 發(fā)送 8 位寄存器地址,再從 SDO 接受 8 位數(shù)據(jù)。在這期間,SCS*必須保持在有效(低電平
9、) 。 2.1.42.1.4 驅(qū)動程序驅(qū)動程序(1)芯片復位就是對芯片的第 47 腿(RSTB*)發(fā)送低電平??砂凑找韵马樞颍?void LD_reset() RSTB =1; delay(1); RSTB =0; delay(1); RSTB =1; delay(1)是延遲 1 毫秒的意思,為了更穩(wěn)定地工作。芯片初始化一般在程序的開始進行,如果有時芯片的反應(yīng)不太正常,也可用這個方法恢復芯片的初始狀態(tài)。(2)語音識別語音識別的操作順序是: 通用初始化語音識別用初始化寫入識別列表開始識別, 并準備好中斷響應(yīng)函數(shù),打開中斷允許位。 如果不用中斷方式,也可以通過查詢方式工作。在“開始識別”后,讀取寄
10、存器 B2H 的值,如果為 21H 就表示有識別結(jié)果產(chǎn)生。在此之后讀取候選項等操作與中斷方式相同。(3)寫入識別列表列表的規(guī)則是,每個識別條目對應(yīng)一個特定的編號(1 個字節(jié)) ,不同的識別條目的編號可以相同,而且不用連續(xù)。本芯片最多支持 50 個識別條目,每個識別條目是標準普通話的漢語拼音(小寫) ,每 2 個字(漢語拼音)之間用一個空格間隔。編號可以相同,可以不連續(xù),但是數(shù)值要小于 256(00HFFH) 。編號 字符串 1 bei jing 1 shou du 64 shang hai 6 tian jin 8 chong qing 編號可以相同,可以不連續(xù),但是數(shù)值要小于 256(00H
11、FFH) 。例子中的“北京”和“首都”對應(yīng)同一編號,說這兩個詞會有相同的結(jié)果返回。流程圖如下:圖 5 語音識別流程圖(4)開始識別設(shè)置幾個相關(guān)的寄存器,就可以控制 LD3320 芯片開始語音識別。單片機程序中,一般會用一個全局變量記錄和控制當前狀態(tài)在編程時一定要把對該狀態(tài)的設(shè)置語句放在LD3320 芯片正式開始識別以前。7(5)響應(yīng)中斷 如果麥克風采集到聲音,不管是否識別出正常結(jié)果,都會產(chǎn)生一個中斷信號。而中斷程序要根據(jù)寄存器的值分析結(jié)果。 讀取 BA 寄存器的值,可以知道有幾個候選答案,而 C5 寄存器里的答案是得分最高、最可能正確的答案。 例如發(fā)音為“上海”并被成功識別(無其他候選) ,那
12、么 BA 寄存器里的數(shù)值是 1,而C5 寄存器里的值是對應(yīng)的編碼 3。流程圖如下:圖 6 中斷響應(yīng)流程圖 2.1.52.1.5 播放聲音播放聲音播放聲音的操作順序是: 通用初始化MP3 播放用初始化調(diào)節(jié)播放音量開始播放聲音, 并準備好中斷響應(yīng)函數(shù),打開中斷允許位。 8(1) 通用初始化 和語音識別部分一樣,按指定序列設(shè)置寄存器。 (2) 聲音播放用初始化(3) 調(diào)節(jié)播放音量 需要修改寄存器 8E。 音量分為 16 級,用 4 位二進制表示,范圍是 0-15。設(shè)置音量時,將(15-音量值) 設(shè)給寄存器 8E 的第 2-5 位。 (4) 開始播放聲音 開始播放位置清零(自定義變量 Mp3Pos=0
13、) ; 寄存器 1B 的第 3 位設(shè)為 1(按位或 0 x08) ; 循環(huán)執(zhí)行: while(【播放條件】=true) 順序?qū)?MP3 數(shù)據(jù)放入寄存器 01(每次一個字節(jié)); Mp3Pos 增加 1 【播放條件】為下面條件都成立,有一個不滿足就跳出循環(huán):讀取寄存器 06,第 3 位=0;Mp3Pos MP3 文件的總長度。 修改 BA 、17 等寄存器;開放中斷允許。開始播放的流程圖如下:9圖 7 開始播放流程圖(5)中斷響應(yīng)。 開始播放可以把聲音數(shù)據(jù)的最初部分送入芯片,等到芯片播放這一段后會發(fā)出中斷請求。而中斷函數(shù)里會不斷的送入數(shù)據(jù),直到 FIFO_DATA 裝滿或聲音數(shù)據(jù)結(jié)束。由于 LD3
14、320 芯片只有一只管腳負責中斷請求輸出,所以一般情況下用一個中斷響應(yīng)函數(shù)處理 2 種中斷。中斷處理函數(shù)里,播放聲音部分流程圖如下:10圖 8 播放聲音流程圖113 3 設(shè)計電路設(shè)計電路 3.13.1 仿真電路仿真電路圖 1 原理圖 3.23.2 電路工作原理分析電路工作原理分析 3.2.13.2.1 程序流程程序流程語音識別的操作流程:(1)語音識別用初始化,在此步驟中,對各寄存器進行初始化設(shè)置;(2)寫入識別列表。LD3320 是一個基于詞庫的語音識別芯片, 。應(yīng)將待識別的短語寫入識別列表,每個識別條目對應(yīng)一個特定的字節(jié),不同的識別條目的字節(jié)可以相同,而且不用連續(xù),但是數(shù)值要小于 256;
15、(3)開始識別,并準備好中斷響應(yīng)函數(shù),打開中斷允許位;(4)響應(yīng)中斷。如果麥克風采集到聲音,不管是否識別出正常結(jié)果,都會產(chǎn)生一個中斷信號,而中斷程序要根據(jù)寄存器的值分析結(jié)果。讀取 BA 寄存器的值,可以知道有幾個候選答案,而 C5 寄存器里的答案是得分最高,最可能正確的答案。 如果不用中斷方式,也可以通過查詢方式工作。 開始識別后,讀取寄存器 B2H 的值,如果 21H 就表示有識別結(jié)果產(chǎn)生。在此之后讀取12候選項等操作與中斷方式相同。 LD3320 芯片還具有 MP3 播放的功能。 3.2.23.2.2 原理說明原理說明LD3320 的基本應(yīng)用電路由一個微控制器(MCU)和 LD3320 組
16、成。電路中的主控 MCU 芯片,是為了完成對 LD3320 芯片寄存器的操作。對 LD3320 芯片的各種操作,都必須通過寄存器的操作來完成。其寄存器可以分為,F(xiàn)IFO 數(shù)據(jù)緩存器、語音識別控制寄存器、音量調(diào)節(jié)、模擬電路和其他的輔助寄存器。寄存器讀寫操作有兩種方式,即標準并行方式和串行 SPI 方式。LD3320 寄存器的地址空間為 8位,編號從 00H 到 FFH。 4 4 項目設(shè)計心得項目設(shè)計心得本學期學習 LD3320 的時間很短,芯片設(shè)計掌握的深度不夠,但通過此次課程設(shè)計,卻改變了很多, 首先,對于硬件電路的工作原理有了進一步的學習,同樣就有了進一步的認識;其次,軟件方面,在程序的設(shè)計
17、,程序的調(diào)試方面都學到了很多東西。在大學課堂的學習只是純理論的專業(yè)知識,而我們應(yīng)該把所學的用到現(xiàn)實生活中去,此次的 LD3320 設(shè)計語音控制燈給我奠定了一個實踐基礎(chǔ),我會在以后的學習、生活中磨練自己,使自己適應(yīng)社會激烈的競爭。在這次的單片機課程設(shè)計過程中,無論是在理論學習階段,還是在設(shè)計的選題、資料查詢和撰寫的每一個環(huán)節(jié),我都得到到了許多人的悉心的指導和幫助。學習單片機要有一定的基礎(chǔ):電子技術(shù)方面要有數(shù)字電路和模擬電路等方面的理論基礎(chǔ),特別是數(shù)字電路;編程語言要求匯編語言或 C 語言。要想成為單片機高手,建議初學者首先學習匯編語言,學的差不多的時候,轉(zhuǎn)入 C 語言學習。盡管匯編語言屬于低級語言,編程效率低,但是較 C 語言具有目標代碼簡短,占用內(nèi)存少,執(zhí)行速度快等優(yōu)點,更重要的是能使初學者盡快熟悉單片機的內(nèi)部結(jié)構(gòu),并能對其進行精確的控制。匯編語言在單片機教材
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)編版三年級語文下冊期末達標測試卷(全真演練二)(含答案)
- 2019-2025年消防設(shè)施操作員之消防設(shè)備基礎(chǔ)知識模擬考試試卷B卷含答案
- 2019-2025年軍隊文職人員招聘之軍隊文職管理學全真模擬考試試卷A卷含答案
- 2019-2025年消防設(shè)施操作員之消防設(shè)備基礎(chǔ)知識提升訓練試卷A卷附答案
- 2025年消防設(shè)施操作員之消防設(shè)備高級技能押題練習試卷A卷附答案
- 管理學原理b試題及答案
- 遺產(chǎn)繼承房產(chǎn)分割合同
- 高等教育自學考試《00065國民經(jīng)濟統(tǒng)計概論》模擬試卷二
- 2024年新疆公務(wù)員《行政職業(yè)能力測驗》試題真題及答案
- 裝貨柜安全知識培訓課件
- 北京服裝學院招聘考試題庫2024
- 2024年江蘇省南京市中考數(shù)學試卷真題(含答案解析)
- 物資裝卸培訓課件
- DB5101-T 71-2020 成都市電動汽車充電設(shè)施 安全管理規(guī)范
- 2025年北京電子科技職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 高教版2023年中職教科書《語文》(基礎(chǔ)模塊)下冊教案全冊
- 《社群運營》全套教學課件
- 2024入團知識題庫(含答案)
- 寧氏譜系條目匯總表2016318支系名稱家譜世系字輩-簡明
- GB/T 7129-2001橡膠或塑料軟管容積膨脹的測定
- 第五單元群文閱讀(共28張PPT) 部編版語文八年級下冊
評論
0/150
提交評論