智能語音應用開發(fā) 課件 項目2:語音合成:讓虛擬機器人能說話_第1頁
智能語音應用開發(fā) 課件 項目2:語音合成:讓虛擬機器人能說話_第2頁
智能語音應用開發(fā) 課件 項目2:語音合成:讓虛擬機器人能說話_第3頁
智能語音應用開發(fā) 課件 項目2:語音合成:讓虛擬機器人能說話_第4頁
智能語音應用開發(fā) 課件 項目2:語音合成:讓虛擬機器人能說話_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

項目2

語音合成:讓虛擬機器人能說話項目背景隨著科技的高速發(fā)展,人們的生活節(jié)奏也在不斷加快。在緊張的學習和工作的同時,人們一直期待有一個合格的機器人能作為自己的小秘書,由它去朗讀自己收到的信息,講講小說,朗誦詩歌。早期的機器人朗讀是非常生硬的機械音,且朗讀的錯誤率很高,強烈遏制了使用者聽書的欲望。隨著語音合成技術的發(fā)展,機器人的朗讀更加接近真人發(fā)音,感情色彩豐富。本項目將使用目前主流的AI開放平臺,學習對參數(shù)的調(diào)整,為不同AI角色設置較優(yōu)的參數(shù)值。教學目標(1)了解語音合成的概念。(2)了解語音合成的應用。(3)理解語音合成的工作原理。(4)理解語音合成的評價指標。(5)能夠編寫程序,調(diào)用語音合成接口,實現(xiàn)文本轉(zhuǎn)語音。(6)能夠?qū)φZ音合成效果進行評分。項目分析(1)從語音合成的概念、原理、應用、關鍵技術等角度,認識語音合成。(2)學習語音合成的常見評價方式(3)在百度AI開放平臺上,創(chuàng)建語音合成應用。(4)編寫程序,定義相關函數(shù),對文本進行語音合成。(5)運用MOS語音合成評價方式,評價該項目的合成效果。知識準備知識點1:什么是語音合成語音合成是由文字生成聲音的過程知識點2:語音合成的原理及應用1.語音合成的原理2.語音合成技術的應用知識點3:語音合成的關鍵技術1.傳統(tǒng)語音合成技術傳統(tǒng)語音合成技術主要包括波形拼接語音合成技術和參數(shù)語音合成技術。1)波形拼接語音合成技術波形拼接語音合成技術通過前期錄制大量的音頻,盡可能全地覆蓋所有的音節(jié)、音素,基于統(tǒng)計規(guī)則的大語料庫拼接對應的文本音頻,通過對已有庫中的音節(jié)進行拼接,實現(xiàn)語音合成的功能。2)參數(shù)語音合成技術參數(shù)語音合成技術就是將每段音頻的特征提取出來,利用這些特征來理解音頻表達的內(nèi)容。2.端到端語音合成技術端到端語音合成技術是目前比較熱門的技術,通過神經(jīng)網(wǎng)絡學習的方法,將整個過程分為輸入、中間和輸出3部分。知識點4:語音合成的常見評價方式項目實施:

文本在線語音合成應用——小說情感朗讀任務1創(chuàng)建應用步驟1:登錄百度AI開放平臺步驟2:創(chuàng)建語音合成應用單擊“創(chuàng)建應用”按鈕創(chuàng)建語音合成應用,得到APIKey和SecretKey。任務2小說在線合成步驟1:導入庫函數(shù)步驟2:設置語言合成參數(shù)步驟3:獲取訪問令牌步驟4:讀取文本步驟5:語音合成步驟5:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論