開源TTS語音合成和處理工具_第1頁
開源TTS語音合成和處理工具_第2頁
開源TTS語音合成和處理工具_第3頁
開源TTS語音合成和處理工具_第4頁
開源TTS語音合成和處理工具_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、開源TTS/語音合成和處理工具eSpeak eSpeak是一個緊湊的開放源碼軟件的語音合成器為英語和其他語言,為Linux 和 Windows 。eSpeak生產(chǎn)高質(zhì)量的英語演講。它使用了不同的合成方法從其他開源語音合成 引擎,和聲音完全不同。這也許不是作為自然人或“平穩(wěn)”,但我覺得發(fā)音更 清晰,更容易聽很長時間。它可以運行命令行程序發(fā)言的文本文件或從標(biāo)準(zhǔn)輸入。一個共享庫的版本也已 推出。包括不同的聲音,其特點可以改變。能產(chǎn)生語音輸出為WAV文件。SSML (語音合成標(biāo)記語言)的支持(未完成),并使用HTML。該計劃及其數(shù)據(jù),其中包括數(shù)種語言,總計約700千字節(jié)??梢园盐淖?,音素代碼,所以它能

2、夠適應(yīng)作為一個前端另一個語音合成引擎。 潛在的其他語言。一些包含在不同階段所取得的進展。幫助母語為這些或 其他語言的歡迎。開發(fā)工具可用于生產(chǎn)和調(diào)整音素數(shù)據(jù)。寫在C + +Windows版本 目前的Windows SAPI5和命令行版本的eSpeak。SAPI5版本的 可以使用屏幕閱讀器,如完,頜骨,超新星,以及窗的眼睛。它們可以作為一個Windows安裝程序包該eSpeak語音合成器支持幾種語言,但在大多數(shù)情況下,這些都是初稿,并需 要更多的工作來改善。援助的母語是值得歡迎的這些或其他新的語言。請與我 聯(lián)系如果你想幫助。eSpeak沒有文字,語音合成的語言,一些比別人做得更好。南 非荷蘭語,粵

3、語, 克羅地亞語,捷克語,荷蘭語,英語,世界語,芬蘭語,法語,德語,希臘語, 印地語,匈牙利語,冰島語,意大利語,Lojban,馬其頓語,普通話,挪威語, 波蘭語,葡萄牙語,羅馬尼亞語,俄語,塞爾維亞語,斯洛伐克語,西班牙語, 斯瓦希里語,瑞典,越南,威爾士。FreeTTSFreeTTS是完全采用Java開發(fā)的語音合成系統(tǒng),它是卡內(nèi)基梅隆大學(xué)基于 Flite這個小型的語音合成引擎開發(fā)的。FreeTTS是一個語音合成系統(tǒng)寫的JavaTM編程語言完全。它是根據(jù)Flite公司: 一個小運行時語音合成引擎卡內(nèi)基梅隆大學(xué)的發(fā)展。弗萊特來源于節(jié)語音合成系 統(tǒng),從愛丁堡大學(xué)和卡內(nèi)基梅隆大學(xué)的festvox項

4、目。這種FreeTTS版本包括: *核心語音合成引擎*支持的多寡:鄰一 8kHz的雙音子,男,美國英語語音辦公16KHz的雙音子,男,美國英語語音辦公16KHz的有限域,男*美國英語語音的 festvox的進口(美國英語的聲音只)*對進口的festvox (僅限美式英文)*支 持工具中央結(jié)算系統(tǒng)的MBROLA北極的具體支持,支持的聲音聲音(單獨下載): 辦公自動化16KHz的女性,美國英語語音O 2個16KHz的男性聲音*美國英語為 JSAPI 1.0 *廣泛的API文檔部分支持*幾個演示應(yīng)用eSpeak-ChineseeSpeak-Chinese 是一個 TTS 軟件。它是基于 Jonath

5、an Duddington 的 eSpeak 由于中文詞典太大,eSpeak缺省并不帶中文詞典,需另外下載。發(fā)布 eSpeak-Chinese只是為了方便用戶安裝。國語支持的主要貢獻者:Kyle Wang (waxaca at )-創(chuàng)建了最初的字典,規(guī)則和聲音文 件。Silas S. Brown ( HYPERLINK http:/people.pwf.cam.ac.uk/ssb22/ http:/people.pwf.cam.ac.uk/ssb22/)- 改進詞典(加 入 CEDICT 等).粵語支持的主要貢獻者:黃冠能-創(chuàng)建了粵語字典,簡易的規(guī)則和聲音文件。eSpeak-Chinese是e

6、GuideDog項目的重要組成部分。另一個中文TTS(余音)在開 發(fā)中。它在設(shè)計上更簡易但文件較大。由于使用了真人發(fā)聲,它比eSpeak的聲 音更自然。目前它只支持粵語。FliteFlite是一個小型、快速的TTS系統(tǒng),是著名的語音合成系統(tǒng)festival的c版 本??捎糜谇度胧较到y(tǒng)5.OpenVXIOpenVXI提供的是完整的VXML解析服務(wù),同時也提供了有限語言的TTS支持。Voice eXtensible Markup Language (簡稱VXML)是被用來創(chuàng)建語音對話系統(tǒng), 可以調(diào)用語音合成以及語音識別服務(wù),可以用來記錄語音錄入和連接電話系統(tǒng)。 創(chuàng)建VXML語音的主要目的就是用We

7、b開發(fā)的理念來開發(fā)交互式的語音應(yīng)用。 VXML提供了基于Menu和基于Form的兩套框架,整合了語音識別和語音合成 兩個關(guān)鍵服務(wù),使得語音應(yīng)用的開發(fā)變得更為方便和快捷。VXML和普通的標(biāo)記語言一樣,需要有瀏覽器進行解析;還需要提供語音識別和 語音合成服務(wù)的應(yīng)用服務(wù)器;有時也需要有http服務(wù)器提供文檔服務(wù);當(dāng)然, 如果需要與電話系統(tǒng)相連,就必須加上VOIP (網(wǎng)絡(luò)電話)的支持。如下圖所示 的就是VXML的運行環(huán)境: 圖1. VXML運行環(huán)境一個企業(yè)級應(yīng)用的系統(tǒng)框架IVR (interactive voice-response services)也就是自動應(yīng)答服務(wù),是使用 VXML的典型企業(yè)級應(yīng)

8、用。IVR和使用者通過電話,按鍵(DTMF)互動,如語音 訂票,語音查詢,語音投票等。普通的IVR都是支持VXML的解析和提供了 sip 協(xié)議的支持,通過和ASR (語音識別)應(yīng)用服務(wù)器以及TTS(語音合成)應(yīng) 用服務(wù)器的集成,可以實現(xiàn)幾乎所有的VXML封裝的操作。企業(yè)級的VXML應(yīng)用需要如下的體系結(jié)構(gòu),以使用IBM Voice Server (WVS)為 例:圖2. 一個VXML具體應(yīng)用的例子上圖中的IVR事實上就是VXML解析器,通過解析VXML,分發(fā)相應(yīng)的工作給 WVS,實現(xiàn)VXML封裝的語音識別和語音合成的功能。FestivalFestival是Linux下的一個語音合成軟件使用方法:

9、$ festival -tts letter.txt$ festivalfestival (SayText Greetings from )$festival (tts myfile.txt)在線演示: HYPERLINK http:/www.cstr.ed.ac.uk/projects/festival/onlinedemo.html http:/www.cstr.ed.ac.uk/projects/festival/onlinedemo.htmlMBROLAMBROLA是一個TTS引擎,旨在盡可能的提供各種語言的語音合成器,這些語言 在其首頁上都有說明。AstLinuxAstLinux是一

10、個定制的Linux發(fā)行版,主要是圍繞這asterisk這個語音交換 軟件定制的。HTS (HMM-based Speech Synthesis System)HTS (HMM-based Speech Synthesis System)是一個語音合成系統(tǒng) 閱讀HTS所使用的技術(shù)和算法,請看: HYPERLINK http:/hts.sp.nitech.ac.jp/PPublications http:/hts.sp.nitech.ac.jp/PPublicationsFestvoxFestvox是卡內(nèi)基梅隆大學(xué)語音項目組開發(fā)的語音合成系統(tǒng)ll.Speak It閱讀的書頁或選定文本使用微軟語音合

11、成引擎.語音識別系統(tǒng)SimonSimon是一個開源的語音識別系統(tǒng),它不僅可以輸入文字,而且可以代替鍵盤、 鼠標(biāo)操作電腦。Simon基于Qt用C+開發(fā),因為某些支持庫與KDE相同,所 以可完美的集成到KDE4中。除KDE之外,Simon也可在GNOME、fe、及其 他X11環(huán)境下運行。hmonkJ語音合成引擎gnuspeechGnuspeech是一個可擴展的語音合成實現(xiàn)包的基礎(chǔ)上,實時,發(fā)音,語音合成按 規(guī)則。也就是說,它轉(zhuǎn)換成語音的描述文本字符串,由一個發(fā)音辭典,信中對聲 音的規(guī)則,節(jié)奏和語調(diào)模型資助;參數(shù)轉(zhuǎn)換成一個低級別的發(fā)音合成的語音說明, 以及利用這些驅(qū)動發(fā)音模型的制作人聲是正常的聲音輸

12、出的GNU / Linux的設(shè)備 輸出合適的道語音合成引擎EposEpos是一個跟語言本身無關(guān)的規(guī)則驅(qū)動的語音合成系統(tǒng),主要作科研用途 在線演示: HYPERLINK http:/epos.ure.cas.cz/cgi-bin/saye.cgi?lang=czech http:/epos.ure.cas.cz/cgi-bin/saye.cgi?lang=czech語音合成軟件NeXTeNSNeXTeNS是一個荷蘭語的Text-to-Speech的軟件。:;File FontToDi FO Parameters Command Line LogOp een dag kwam de eekhoor

13、n erachter dat het onversti%LH*L 職 LH+LH去 Lwas om niet verder te kunnen tellen dan tot vij f.H*LH 班L%Hij ging naar de school aan de voet van de eik in 1 TOC o 1-5 h z %L H*LH*LH*LH*Lmidden van het bos en vroeg aan de mus die daarH*LH*LH*LH*Londerwij zer was of hij hem tot tien kon leren tellen.H*LH*

14、LIk zal mijn best doenz 7 zei de mus.%LH*L H*L H*LH*L L%Maar wat je vraagt is niet eenvoudig.%LH*LH*L L%Ik kan zelf tot zeventien tellen, maar vraag mij nie%LH*LH*Llang ik daarvoor heb gestuderdr want dat weet ik alH*LH*LH*Lmeet.L%Ik heb er alles voor over, zei de eekhoorn.%LH*LH*L L%De meeste dieren ko

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論