可編輯語音識別芯片LD3320_第1頁
可編輯語音識別芯片LD3320_第2頁
可編輯語音識別芯片LD3320_第3頁
可編輯語音識別芯片LD3320_第4頁
可編輯語音識別芯片LD3320_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Routein fo第 # 頁Routein foRouteLD3320語音識別芯片第 # 頁Routein fo(單芯片/非特定人/動態(tài)編輯識別列表語音識別解決方案)用聲音去溝通VUI (Voice User Interface)ICRoute用聲音去溝通VUI (Voice User In terface)Web :Tel ail:in fo一、.語音識別芯片介紹LD3320是一顆基于非特定人語音識別(SI-ASR: Speaker-IndependentAutomatic Speech Recognition )技術的語音識別/聲控芯片。提供了真正的單 芯片語

2、音識別解決方案。LD3320芯片上集成了高精度的A/D和D/A接口,不再需要外接輔助的Flash和RAM即可以實現語音識別/聲控/人機對話功能。并且,識別的關鍵詞 語列表是可以動態(tài)編輯的?;贚D3320可以在任何的電子產品中,甚至包括最簡單的51作為主控芯片的系統(tǒng)中,輕松實現語音識別/聲控/人機對話功能。為所有的電子產品增 加VUI( Voice User In terface)語音用戶操作界面。主要特色功能:非特定人語音識別技術:不需要用戶進行錄音訓練可動態(tài)編輯的識別關鍵詞語列表:只需要把識別的關鍵詞語以字符串的形式傳 送進芯片,即可以在下次識別中立即生效。比如,用戶在51等MCU勺編程中

3、,簡單地通過設置芯片的寄存器,把諸如“你好”這樣的識別關鍵詞的內容動態(tài) 地傳入芯片中,芯片就可以識別這樣設定的關鍵詞語了。真正單芯片解決方案:不需要任何外接的輔助Flash和RAM真正降低系統(tǒng)成本。內置高精度 A/D和D/A通道::不需要外接 AD芯片,只需要把麥克風接在芯片的 AD引腳上;可以播放聲音文件,并提供550mW的內置放大器。高準確度和實用的語音識別效果支持用戶自由編輯 50條關鍵詞語 在同一時刻,最多在 50條關鍵詞語中進行識 別,終端用戶可以根據場景需要,隨時編輯和更新這50條關鍵詞語的內容。二、語音識別介紹語音識別 ASR技術,是基于關鍵詞語列表識別的技術。只需要設定好要識

4、別的關鍵詞語列表,并把這些關鍵詞語以字符的形式傳送到LD3320內部,就可以對用戶說出的關鍵詞語進行識別。不需要用戶作任何地錄音訓練。語音識別ASR現實意義:ASR 技術最重要的現實意義就在于提供了一種脫離按鍵,鍵盤,鼠標的基 于語音的用戶界面 VUI: Voice User In terface 。使得用戶對于產品的操作更快速,更自然。非特定人語音識別技術ASR是對幾十 G的語音數據經語言學家語音模型分析,科學家建立數學模型,并經過反復訓練提取基元語音的細節(jié)特征,以及 提取各基元間的特征差異??梢缘玫皆诮y(tǒng)計概率最優(yōu)化意義上的各個基元語音 特征。最后才由資深工程師將算法以及語音模型轉化為硬件芯

5、片以應用在嵌入 式系統(tǒng)中。基于領先的語音識別核心引擎,經過在各大主流手機產品中三年來超過一 千萬份的量產檢驗,LD3320提供了可以真正實用的語音識別/聲控功能。ASR技術是基于關鍵詞語列表識別的技術。每次識別的過程,就是把用戶說出的語音內容,通過頻譜轉換為語音特 征,和這個關鍵詞語列表中的條目進行一一匹配,最優(yōu)匹配的一條作為識別結 果。比如在手機的應用中,這個關鍵詞語列表的內容就是電話本中的人名/手機的菜單命令/T卡中的歌曲名字。不論這個列表的條目內容是什么,只需要用戶設置相關的寄存器,就可以 把相應的待識別條目內容以字符形式傳遞給識別引擎。LD3320可以識別列表中的關鍵詞,用戶說的語音可

6、以是這個列表中任意的 關鍵詞語,而且不需要用戶在識別前進行任何訓練。識別引擎不關心關鍵詞語列表中的關鍵詞語的內容,可以是命令,人名, 歌曲名字,操作指令等等任何的漢字字符串。每條關鍵詞語最大可以支持的字數,從算法角度是限制在30字以內。但是從實際情況來看,用戶一口氣說超過8個字以上的條目時,幾乎肯定會出現說錯字/說漏字/說多字/打嗝/停頓等情況,這些情況都會嚴重影響識別并造成識 別錯誤。因而一般來說,如果要獲得理想的識別效果,建議每條關鍵詞語的字 數不要過長,避免影響效果。ASR技術上的局限性在于:ASR不是聽寫系統(tǒng)ASR不能把人的聲音轉換為確定的拼音串ASR不能任意地識別人的說話內容ASR不

7、能識別關鍵詞語列表中的某個關鍵詞語的一部分內容,除非這一部 分內容自身也是一個關鍵詞語ASR不可以識別與關鍵詞語列表中列出的關鍵詞語不相符的情況 比如,前后加了 “嗯”,“阿”之類的語氣詞 比如,只說出了關鍵詞語中的一部分而不是整個關鍵詞語 比如,沒有列在關鍵詞語列表中的詞語三、應用場景由于LD3320可以動態(tài)編輯的識別關鍵詞語列表,因此其可以應用的范圍大大超過了那些不可以改變識別列表的芯片。同時,LD3320是一顆真正的單芯片解決方案,不需要輔助的外圍Flash/RAM/AD,只需要有一顆 51級別的單片機芯片就可以控制 LD3320從而降低了系統(tǒng)的成本。其應用場景主要包括:1. 智能玩具/

8、對話玩具2. 導航儀3. MP3/MP44. 數碼像框5. 機頂盒/彩電遙控器6. 電磁爐/微波爐/洗衣機/智能家電操作7. PMP/游戲機8. 自動售貨機9. 地鐵自動售票機10. 導游機11. 樓宇電視的廣告點播(請參考“ LD3320語音識別芯片應用場景”)四、主要技術參數1. 內置單聲道m(xù)ono 16-bit A/D模數轉換2. 內置雙聲道stereo 16-bit D/A數模轉換3. 內置20mW聲道耳機放大器輸出4. 內置550mW單聲道揚聲器放大器輸出5. 支持并行接口或者 SPI接口6. 內置鎖相電路 PLL,輸入主控時鐘頻率為2MHz - 34MHz7. 工作電壓:(VDD: for internal core) 3.3V8. 48pin 的QFN 7*7標準封裝9. 省電模式耗電:1uALD3320評估板的照片:(其中,控制MCU目前選用的是 STC的51單片機)9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論