語音識(shí)別論文_第1頁
語音識(shí)別論文_第2頁
語音識(shí)別論文_第3頁
語音識(shí)別論文_第4頁
語音識(shí)別論文_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

語識(shí)文LT

第1頁共22頁

第1頁共22頁

第1頁共22頁

1.3語識(shí)系的構(gòu)一個(gè)完的基于統(tǒng)計(jì)語音識(shí)系統(tǒng)可大致為二個(gè)分:(1)語音信預(yù)處理特征提取;聲學(xué)型與模匹配;1.3.1語音信號(hào)處理與征提選擇識(shí)單元是語音別研究第一步語音識(shí)單元有(句、音節(jié)和素三種,具選擇哪種,由具體研究任決定。單詞()單元廣泛用于中詞匯語音識(shí)系統(tǒng),不適合大詞匯系統(tǒng)原因在于模庫太龐,訓(xùn)練模型務(wù)繁重模型匹配算復(fù)雜,難滿足實(shí)時(shí)性求。音節(jié)單多見于漢語音識(shí)別主要因漢語是音節(jié)結(jié)構(gòu)的言,而英語多音節(jié),并漢語雖有大約個(gè)音節(jié),但不考慮調(diào),約有408個(gè)無調(diào)音節(jié),數(shù)量相對(duì)少。因,對(duì)于中、詞匯量語語第1頁共22頁

音識(shí)別統(tǒng)來說,以節(jié)為識(shí)單元基本是行的。語音識(shí)一個(gè)根本的題是合的選用特征特征參提取的目的是對(duì)語信號(hào)進(jìn)行分處理,掉與語音識(shí)無關(guān)的余信息,獲影響語音別的重要信,同時(shí)語音信號(hào)進(jìn)壓縮。實(shí)際應(yīng)用中語音信號(hào)壓縮率介于10-100之間。線性預(yù)(LP分析技是目前應(yīng)用泛的特參數(shù)提取技,許多成功應(yīng)用系統(tǒng)都用基于LP技術(shù)提取的倒譜數(shù)但線預(yù)測(cè)模型是純數(shù)模型,沒有慮人類覺系統(tǒng)對(duì)語的處理點(diǎn)。Mel數(shù)和基感知線性預(yù)分析提的感知線性測(cè)倒譜在一定度上模擬了耳對(duì)語的處理特點(diǎn)應(yīng)用了耳聽覺感知面的一些究成果。實(shí)證明,用這種技術(shù)語音識(shí)系統(tǒng)的性能一定提高從目前使用情況來,梅爾刻度倒頻譜數(shù)已逐漸取原本常用線性預(yù)測(cè)編導(dǎo)出的頻譜參數(shù),因是它慮了人類發(fā)與接收聲的特性,具更好的棒性(Robustness1聲學(xué)模與模式匹配聲學(xué)模通常是將獲的語音征使用訓(xùn)練法進(jìn)行練后產(chǎn)生。在識(shí)別將輸入的語特征同學(xué)模型(模)進(jìn)行配與比較,到最佳的別結(jié)果。聲學(xué)模是識(shí)別系統(tǒng)底層模,并且是語識(shí)別系中最關(guān)鍵的一部分聲學(xué)模型的的是提一種有效的法計(jì)算音的特征矢序列和每發(fā)音模板之的距離聲學(xué)模型的計(jì)和語發(fā)音特點(diǎn)密相關(guān)。聲模型單元大(字發(fā)模型、半音模型或素模型)對(duì)音訓(xùn)練數(shù)量大小、系識(shí)別率以及靈活性較大的響。必須根不同語言特點(diǎn)、識(shí)別統(tǒng)詞匯的大小決定別單元大小。第2頁共22頁

1.4

語信的取法線性預(yù)系數(shù)LPC線性預(yù)分析從人的聲機(jī)理手通過對(duì)聲道短管級(jí)模型的研究,為系統(tǒng)的傳函數(shù)符全極點(diǎn)數(shù)字波器的式,從而n時(shí)的信號(hào)以用前若干刻的信的線性組合估計(jì)。過使實(shí)際語的采樣值線性預(yù)測(cè)采值之間到均方差最LMS,可得線性預(yù)系數(shù)對(duì)LPC計(jì)算方有自相法(德賓Durbin法協(xié)方差、格型法等計(jì)算的快速效保了這一學(xué)特征的廣使用與LPC這種預(yù)參數(shù)模型類的聲學(xué)征還有線譜LSP、反射數(shù)等等倒譜系CEP利用同處理方法,語音信求離散傅立變換DFT后取對(duì)數(shù),再求反換iDFT就得到倒系數(shù)。對(duì)LPC倒譜(LPCCEP在獲得波器的性預(yù)測(cè)系數(shù),可以一個(gè)遞推公計(jì)算得。實(shí)驗(yàn)表明使用倒譜以提高特征數(shù)的穩(wěn)性。Mel倒譜系數(shù)MFCC和感知性預(yù)測(cè)PLP不同于等通對(duì)人的聲機(jī)理的研而得到聲學(xué)特征,Mel倒譜系MFCC和感知性預(yù)測(cè)PLP是人的覺系統(tǒng)究成果推動(dòng)導(dǎo)出的學(xué)特征。對(duì)的聽覺理的研究發(fā),當(dāng)兩頻率相近的調(diào)同時(shí)發(fā)時(shí),人只能到一個(gè)調(diào)。臨界帶指的就這樣一種令的主觀感發(fā)生突變的寬邊界當(dāng)兩個(gè)音調(diào)頻率差于臨界帶寬,第3頁共22頁

人就會(huì)兩個(gè)音調(diào)聽一個(gè),稱之為屏蔽應(yīng)。Mel刻度是對(duì)一臨界帶寬度量方法之。MFCC的算首先用FFT時(shí)域信轉(zhuǎn)化成頻域后對(duì)其數(shù)能量譜用照Mel刻度分的三角濾波組進(jìn)行積,最后對(duì)個(gè)濾波的輸出構(gòu)成向量進(jìn)行散余弦變換DCT取前N個(gè)系數(shù)。PLP仍用德賓去計(jì)算LPC參數(shù)但計(jì)算自關(guān)參數(shù)時(shí)用也是對(duì)覺激勵(lì)的對(duì)能量譜行的方法1.5語識(shí)技的景應(yīng)在電話通信系統(tǒng)中智能語接口正在把話機(jī)從個(gè)單純的服務(wù)工具成為一個(gè)服的“提者”和生活伙伴”使用電話與信網(wǎng)絡(luò)人們可通過語音命方便地遠(yuǎn)端的數(shù)據(jù)系統(tǒng)中詢與提取有關(guān)的息;隨著計(jì)機(jī)的小化,鍵盤已成為移平臺(tái)的一個(gè)大障礙,象一下如果機(jī)僅僅有一個(gè)手表么大,用鍵盤進(jìn)行號(hào)操作已是不可能的語音識(shí)正逐步成為息技術(shù)人機(jī)接口的鍵技術(shù),音識(shí)別技術(shù)語音合技術(shù)結(jié)合使們能夠掉鍵盤,通語音命令行操作。語技術(shù)的用已經(jīng)成為個(gè)具有爭(zhēng)性的新興技術(shù)產(chǎn)業(yè)語音識(shí)技術(shù)發(fā)展到天,特是中小詞匯非特定語音識(shí)別系統(tǒng)識(shí)別度已經(jīng)大于98%,對(duì)定人語識(shí)別系統(tǒng)的別精度更高。這些技已經(jīng)能夠滿通常應(yīng)的要求。由于大規(guī)模集電路技術(shù)的展,些復(fù)雜語音識(shí)別系也已經(jīng)全可以制成用芯片,大量生。在西方濟(jì)發(fā)達(dá)國(guó)家大量的音識(shí)別產(chǎn)品經(jīng)進(jìn)入場(chǎng)和服務(wù)領(lǐng)。第4頁共22頁

一些用交機(jī)、電話、手機(jī)經(jīng)包含了語識(shí)別撥功能,還有音記事本語音智能玩等產(chǎn)品包括語音識(shí)與語音成功能。人可以通過話網(wǎng)絡(luò)用語識(shí)別口對(duì)話系統(tǒng)查有關(guān)的票、旅游、行信息,且取得很好結(jié)果。查統(tǒng)計(jì)表明達(dá)85%以上的人對(duì)音識(shí)別的信查詢服務(wù)系的性能示滿意。可以預(yù)在近五到十內(nèi),語識(shí)別系統(tǒng)的用將更廣泛。各種各樣的音識(shí)別系統(tǒng)品將出在市場(chǎng)上。們也將整自己的說方式以適各種各樣的別系統(tǒng)在短期內(nèi)還可能造具有和人相擬的語音別系統(tǒng)要建成這一個(gè)系統(tǒng)仍是人類臨的一個(gè)大挑戰(zhàn),我們只一步步朝著進(jìn)語音別系統(tǒng)的方一步步前進(jìn)。至于么時(shí)候可建立一個(gè)像一樣完的語音識(shí)別統(tǒng)則是難預(yù)測(cè)的。第二章

電子信息業(yè)2.1電子信產(chǎn)簡(jiǎn)電子信產(chǎn)業(yè)是信息術(shù)產(chǎn)業(yè)權(quán)威管理部息產(chǎn)業(yè)在統(tǒng)計(jì)和分析通常采用的,電子息產(chǎn)具體細(xì)為投資產(chǎn)品、消費(fèi)產(chǎn)品和元件產(chǎn)品三個(gè)類。出部門隸屬淵的原因電子信息產(chǎn)時(shí)人們分時(shí)也用電子業(yè)一詞替到20092月為,電子信息業(yè)成為中國(guó)民經(jīng)濟(jì)重要支柱產(chǎn)。電子信息業(yè)是研和生產(chǎn)電子備及各種子元件、器、儀器儀表的工業(yè)是軍民合型工業(yè)。廣播電視備、通信導(dǎo)設(shè)備、達(dá)設(shè)備、電計(jì)算機(jī)電子元器件電第5頁共22頁

子儀器表和其他電專用設(shè)等生產(chǎn)行業(yè)成。電信息產(chǎn)業(yè)是電子科學(xué)術(shù)發(fā)展和應(yīng)的基礎(chǔ)發(fā)展起來的電子信產(chǎn)業(yè)的發(fā)展于生產(chǎn)技的提高和加工藝的進(jìn)集成電路差多每三就更新一代大規(guī)模成電路和計(jì)機(jī)的大生產(chǎn)和使用光纖通、數(shù)字化通、衛(wèi)星通技術(shù)的興起使電子業(yè)成為一個(gè)速崛起高技術(shù)產(chǎn)業(yè)電子工業(yè)發(fā)展及其產(chǎn)的廣泛用,對(duì)軍事域產(chǎn)生深刻的影響改進(jìn)了作指揮系統(tǒng)。一次世大戰(zhàn)以來,線電通成為軍事通的基本手,被作軍隊(duì)的“經(jīng)”系。利電子術(shù),過由通、達(dá)、計(jì)機(jī)等電子設(shè)組成的揮自動(dòng)化系,改變了統(tǒng)的通、偵察和情處理手段,大提高軍隊(duì)指在現(xiàn)代戰(zhàn)爭(zhēng)件下的能改進(jìn)了武器備系統(tǒng)。電技術(shù)的展和電子產(chǎn)的應(yīng)用大大提高了代武器的力和命中精;電子件成了現(xiàn)代器裝備重要組成部,電子技是導(dǎo)彈、軍衛(wèi)星及他高技術(shù)武裝備制和控制的核,無論是略武器,是戰(zhàn)術(shù)器其性能低都同電子術(shù)有密關(guān)系。使電子發(fā)展成為獨(dú)的作戰(zhàn)段。電子偵、電子擾、電子摧等形式的子對(duì)抗,電信息產(chǎn)在現(xiàn)代戰(zhàn)爭(zhēng)越來越要。尤其在車語音控系統(tǒng)中尤為要。2.2

國(guó)內(nèi)的子信息的發(fā)中國(guó)的子信息產(chǎn)業(yè)現(xiàn)于20紀(jì)二年代。,中國(guó)民黨政軍政部在南建立“信機(jī)械修造廠”,要生產(chǎn)軍用線電收發(fā)機(jī),以后又建了“央無線電器有限公”,“南京達(dá)研究所等研究生產(chǎn)位。華人民和國(guó)建立后政府十重視電工業(yè)的展。中國(guó)國(guó)決定成第四機(jī)械工部,專中國(guó)國(guó)防工序列。這志著中國(guó)電信息產(chǎn)成了獨(dú)立的業(yè)部門1983,第四機(jī)械業(yè)部改電子工業(yè)部中國(guó)的子工業(yè)經(jīng)過十年的設(shè)和發(fā)展,經(jīng)具有當(dāng)規(guī)模,形了軍民合、專業(yè)門比較齊全新興工業(yè)部。中國(guó)電信息產(chǎn)已具有門類全的軍電子第6頁共22頁

元器件研開發(fā)與配能力,有一定水平系統(tǒng)工科技攻關(guān)能;基本能足戰(zhàn)略武器航天技、飛機(jī)與艦、火炮制和各種電化指揮系的需要;2008年,子信息業(yè)所提供的品都達(dá)了較高技術(shù)水,其中不少到世界進(jìn)水平。2.3發(fā)方中國(guó)國(guó)企業(yè)應(yīng)抓住國(guó)推動(dòng)一代移動(dòng)通系統(tǒng)、字電視和互聯(lián)網(wǎng)建的時(shí)機(jī),依國(guó)內(nèi)市建立自主標(biāo)體系,動(dòng)企業(yè)加大核心元器和軟件、信安全系的開發(fā)力度爭(zhēng)取在鍵技術(shù)和重標(biāo)準(zhǔn)方面現(xiàn)突破。中應(yīng)抓住術(shù)進(jìn)步和國(guó)產(chǎn)業(yè)調(diào)的新機(jī)遇,成一批上億的產(chǎn)業(yè)集。電子息產(chǎn)業(yè)單純規(guī)模擴(kuò)已經(jīng)難以為,如:中國(guó)的彩電行,再擴(kuò)規(guī)模難度已很大,后應(yīng)該轉(zhuǎn)向度與效益重,推動(dòng)產(chǎn)向創(chuàng)新和效益型的變。第三章音識(shí)別在電子信產(chǎn)業(yè)中應(yīng)用3.1語識(shí)所及用域應(yīng)該依中西部資源勢(shì)和信化應(yīng)用狀況以軟件、型元器、電子材等高技術(shù)、污染行為切入點(diǎn)。時(shí)利用邊國(guó)家資源發(fā)展加工易推動(dòng)中的國(guó)家出臺(tái)持政策。立產(chǎn)業(yè)態(tài)參數(shù)數(shù)據(jù),研究產(chǎn)生態(tài)評(píng)估模,開展點(diǎn)產(chǎn)品生態(tài)數(shù)課題究。人們可通過語音命方便地遠(yuǎn)端的數(shù)據(jù)系統(tǒng)中詢與提取第7頁共22頁

有關(guān)的息;隨著計(jì)機(jī)的小化,鍵盤已成為移平臺(tái)的一個(gè)大障礙,象一下如果機(jī)僅僅有一個(gè)手表么大,用鍵盤進(jìn)行號(hào)操作已是不可能的語音識(shí)正逐步成為息技術(shù)人機(jī)接口的鍵技術(shù),音識(shí)別技術(shù)語音合技術(shù)結(jié)合使們能夠掉鍵盤,通語音命令行操作。語技術(shù)的用已經(jīng)成為個(gè)具有爭(zhēng)性的新興技術(shù)產(chǎn)業(yè)語音識(shí)所涉及應(yīng)用域,智玩具,工業(yè)制及醫(yī)領(lǐng)域

家電遙控語音可以控汽車、空調(diào)、扇、簾,工控制及醫(yī)療領(lǐng)域電話通信的音撥號(hào)汽車的語音制。3.2語識(shí)的汽控方從世紀(jì)50年代始對(duì)語識(shí)別的研究始,過幾十年的展已經(jīng)達(dá)一定的高度有的已從實(shí)驗(yàn)室走市場(chǎng),一些玩具、些部門密語音輸入等隨著DSP專用集電路技的發(fā)展,快傅立葉變換及近來嵌入式作系統(tǒng)研究,使得定人識(shí)尤其是計(jì)算小的特人識(shí)別成為能。因,對(duì)特定人音識(shí)別術(shù)在汽車控上的應(yīng)用研究是很有途的。語音識(shí)的方法目前,用的說話人別方法模板匹配法統(tǒng)計(jì)建法、聯(lián)接主義法人工神網(wǎng)絡(luò)實(shí)。慮到數(shù)據(jù)量實(shí)時(shí)性以及識(shí)別率的問,筆者采基于矢量量和隱馬可夫模型(HMM)相結(jié)合的法。說話人別的系統(tǒng)主由語音征矢量提取元(前端處)、訓(xùn)練單元、別單元和后理單元成,其系統(tǒng)成如

每個(gè)司在購(gòu)買車后必須自己的語音入系統(tǒng)也就是訓(xùn)練程,當(dāng)最好是在安、次數(shù)達(dá)一定的數(shù)目從此在后駕駛過程就可以用這個(gè)系統(tǒng)。第8頁共22頁

所謂預(yù)理是指對(duì)語信號(hào)的殊處理:預(yù)加重分幀處理。加重的目的提升高頻部,使信的頻譜變得坦,以于進(jìn)行頻譜析或聲道數(shù)分析用具有6dB/頻程提升高特性預(yù)加重字濾波器實(shí)現(xiàn)。雖然語音號(hào)是非穩(wěn)時(shí)變的,是可以認(rèn)為局部短平穩(wěn)。故語音號(hào)分析常分或分幀處理。3.3

語識(shí)技在車的論說話人別系統(tǒng)設(shè)計(jì)理論根問題是如何語音信中提取表征人的本特征。即音特征量的提取是個(gè)說話識(shí)別系統(tǒng)的礎(chǔ),對(duì)話人識(shí)別的誤拒絕和錯(cuò)誤接受有著極重要的影響同語音別不同,說人識(shí)別用的是語音號(hào)中的話人信息,不考慮音中的字詞思,它調(diào)說話人的性。因,單一的語特征矢很難提高識(shí)率。該統(tǒng)在說話人識(shí)別中用倒譜系數(shù)基因周參數(shù),而在對(duì)控制命令語音識(shí)別中采用倒系數(shù)。其中常用的譜系數(shù)有種,LPC(性預(yù)測(cè)數(shù))和倒譜數(shù)(LPCC),種是基Mel度的MFLL(頻倒譜數(shù))數(shù)Mel頻率譜系數(shù)對(duì)于LPCC參的提取可先采用Durbin遞算法、型算法或者遞推法來求數(shù)然后求LPC參數(shù)設(shè)第l幀語音的LPC數(shù)為則LPCC參數(shù)為1≤p進(jìn)一步研究發(fā)現(xiàn),入一階二階差分倒可以提識(shí)別率。對(duì)于MPCC參的提取若根據(jù)Mel線將語音信頻譜分K個(gè)帶個(gè)頻帶能量為θ(Mk)則MFCC數(shù)為1≤p通過對(duì)LPCC和參數(shù)對(duì)別率影響的驗(yàn)比較,者選取LPCC參數(shù)其一和二階差分譜稀疏為特征參數(shù)第9頁共22頁

基音周估計(jì)的方法多,主有基于求短自相關(guān)數(shù)的算法、基于求時(shí)平均幅度函數(shù)算法、于同態(tài)信號(hào)理和線預(yù)測(cè)編碼算法。筆者介紹基求短時(shí)自相函數(shù)的法。設(shè)Sw(n)是一段加窗語音信號(hào)它的非區(qū)間為0。Sw(n)的自相函數(shù)稱為語信號(hào)的S(n)的時(shí)自關(guān)函數(shù)用表示,即Rw(l)=

可知短自相關(guān)函數(shù)處最,且在基周期的各個(gè)數(shù)倍點(diǎn)有很大的峰,選擇適的窗數(shù)(窗長(zhǎng)為的Hamming窗)與濾波器帶寬為60~900Hz的通濾波)只要找到相關(guān)函數(shù)的一最大值點(diǎn)的位置計(jì)算它零點(diǎn)的距離便能估計(jì)基音周期。3.1練單元訓(xùn)練單的功能是把先收集的語音利用定的算為每一個(gè)待識(shí)別的話人訓(xùn)練出之相匹的參數(shù)。針說話人別在汽車應(yīng)中的不同要求訓(xùn)練單元分為2分:說話人別的訓(xùn)和對(duì)待識(shí)別詞的訓(xùn)。對(duì)于說人識(shí)別部分訓(xùn)練,針對(duì)說話人特征進(jìn)訓(xùn)練,為每個(gè)合法戶建立一套多套HMM模,同時(shí)用基于矢量化(VQ)方法,為個(gè)合法用戶立VQ碼。碼的設(shè)計(jì)采用LBG算法,初始碼本的置采用分裂初始碼。第2部分針控制命中用到的每孤立的條建立多個(gè)練樣本,或?yàn)樵~條樣本估計(jì)出詞條的HMM數(shù)(一套多套)對(duì)一個(gè)HMM過程的整的描包括:模型參數(shù)NM組概率度A,B和π方如下方式完型:λ=(N,M,,或者簡(jiǎn)寫:λ=(π,A,B)。對(duì)于每一個(gè)條V的模型數(shù),V=1~V,以用Baum-Welch估算法。3識(shí)別單元第10頁共22頁

識(shí)別單的功能是利經(jīng)訓(xùn)練經(jīng)獲得的HMM模參數(shù)和測(cè)得的話人的音周期在一的判決件下辨認(rèn)出識(shí)別的話人并估計(jì)待識(shí)別的制命令詞串針對(duì)HMM型參數(shù)常采用判決條件是大后驗(yàn)概率用Viterbi算法現(xiàn)。由于汽的控制命令有限的條和數(shù)字串組合,這些語命令的識(shí)屬于特定人詞匯量連接詞的識(shí)以及與本有關(guān)的說人確認(rèn),論是從目前DSP運(yùn)算速度還存儲(chǔ)空間來,實(shí)時(shí)現(xiàn)這些語音命的識(shí)別都是全可能。識(shí)別系組在此系統(tǒng),對(duì)運(yùn)能力和存儲(chǔ)元要求常高的語音識(shí)別部完全由DSP成。識(shí)別系的功能是完語音的入、A/D轉(zhuǎn)換識(shí)別,統(tǒng)中心部分采TMS320VC5410其原因是它的運(yùn)速度和儲(chǔ)空間都能足要求,同它的一些并運(yùn)算硬結(jié)構(gòu)也非常合語音別的各種算,程序和經(jīng)脫機(jī)訓(xùn)練的HMM參數(shù)表及相的詞典存放程序存器中,據(jù)存儲(chǔ)器存放識(shí)別過程中的間計(jì)算數(shù)據(jù)A/D芯片采用TLC320AD50C,里面含有A/D及低通波器和采樣持電路模擬語音號(hào)的輸入主是通過聲器,保證音門禁安全性,轉(zhuǎn)后的數(shù)字音數(shù)據(jù)以同串行通方式傳送給DSP.3.4

語識(shí)在車控的程現(xiàn)近年來隨著語音識(shí)與確認(rèn)術(shù)的逐漸成,基于音識(shí)別技術(shù)的對(duì)話制系統(tǒng)受到越來越的關(guān)注。現(xiàn)的語音術(shù)雖然在實(shí)室環(huán)境中得取得了較的識(shí)別果,但是一由于環(huán)或者說話人客觀原因得語音信號(hào)差時(shí),會(huì)導(dǎo)致系統(tǒng)出率急下降,從而得語音控系統(tǒng)的性能差甚至能正常工作針對(duì)語識(shí)別汽車控的問題開發(fā)了一套音識(shí)別車控制的系統(tǒng)。本統(tǒng)的用戶主是汽車制中心的用,尤其發(fā)音不夠清準(zhǔn)第11頁共22頁

確,僅用傳的語音識(shí)別很難滿控制系統(tǒng)實(shí)應(yīng)用的要。此,提出了合利用孤立識(shí)別器連接詞識(shí)別及連續(xù)音識(shí)別器構(gòu)一個(gè)基于識(shí)別引擎的別器的法,使得關(guān)詞被正檢出的可能大大增加在允許用戶由使用立或者連續(xù)音交流同時(shí),還最限度地利不同識(shí)別引的優(yōu)點(diǎn)改善了語音制系統(tǒng)性能。另外還分析語音控制系中確認(rèn)、型自適以及對(duì)話控策略等關(guān)技術(shù),并且出了相的解決方案從而給語音控制系的完整結(jié),在語音識(shí)汽車控、電視等設(shè)的實(shí)際制中取得了好的效果語音識(shí)汽車控制系包括軟設(shè)計(jì)和硬件計(jì)兩部。本文主要討論軟設(shè)計(jì)部分,中包括語音識(shí)別模、語音認(rèn)模塊、對(duì)控制及硬指令傳輸模以及模自適應(yīng)模塊整個(gè)系統(tǒng)的程是首先,用戶的音被送入語識(shí)別模進(jìn)行Viterbi碼識(shí)別得到相應(yīng)的選關(guān)鍵;然后,將選關(guān)鍵送入語音確模塊進(jìn)確認(rèn),從中出可能的鍵詞,并給相應(yīng)的認(rèn)分值;再,根據(jù)出的關(guān)鍵詞其對(duì)應(yīng)的認(rèn)分值產(chǎn)生應(yīng)的對(duì)或者控制命對(duì)硬件行控制,同利用已經(jīng)認(rèn)的語音對(duì)別中的音模型進(jìn)行新。。3.5

語音識(shí)在汽車中的體應(yīng)用車載電的發(fā)展從傳的收音功能開始,然沿著CD、VCD/DVD/移動(dòng)TV、GPS載電話開拓出范圍越來廣、越來智能化人性化的車應(yīng)用.司機(jī)不會(huì)為要看這些息而分注意力,而提高駕駛安全性語音技術(shù)在載設(shè)備具有廣泛的用.隨著網(wǎng)絡(luò)時(shí)的到來辦公自動(dòng)化日益普,來越多的息正以文字形式存,但車載環(huán)的限制,用眼睛來讀文字息無論對(duì)機(jī)和乘客都在極大便,時(shí)利用音合成術(shù)改造傳統(tǒng)車音響就可讓車音響不僅聽廣播音樂,還能夠聽用戶主選擇各種文字信.語車電第12頁共22頁

車載電可為司機(jī)在車期間供便捷的溝方式。安全的角度慮,在行車中看信息是常不方的,比如看電號(hào)碼時(shí)間、短信等。采算法語合成術(shù),可實(shí)現(xiàn)載電話息變看為聽大大加了信息獲取的徑,較低了駛的危,給手機(jī)增更多人化功能。系統(tǒng)實(shí)如圖1所。語音車載話在原有車電話的礎(chǔ)上增加PSOLA算法語短信車

來電

文電話

控制

信號(hào)處

本記事信

驅(qū)

語音息GPRS/CDM

PSOLA駕駛員(圖)音合成片,實(shí)現(xiàn)信內(nèi)容的放。車載電通過GSM/CDMA網(wǎng)絡(luò)獲取各類型信息比如來電信、短消等;手機(jī)控模塊將要合成的各型信息來電信、短消息、訊錄信、記事本信等內(nèi)容換成標(biāo)準(zhǔn)的本信息發(fā)送給PSOLA法語合成芯;算法語音合芯片再文本信息轉(zhuǎn)換為語通過車內(nèi)音系統(tǒng)播給用戶聽。在車載話上實(shí)現(xiàn)語合成功,可以選PSOLA法語音芯或者語模塊車載電本身尺寸較,耗也不大,擇語音芯片較合適雖然語音芯在任意本合成上的果比語模塊差但完全可以到實(shí)用求。語音合芯片,現(xiàn)信息內(nèi)容播放。載電話過GSM/CDMA網(wǎng)絡(luò)獲取類型信,比來電信、短消息等手機(jī)控制塊將需要合的各類信息如來電息、短息、通訊錄息、記第13頁共22頁

本信息內(nèi)容轉(zhuǎn)換成準(zhǔn)的文信息并發(fā)送

算法語合成芯;法語音成芯再將文信息轉(zhuǎn)換為音通過內(nèi)音響系統(tǒng)放給用戶聽。要在載電話實(shí)現(xiàn)語音合功能可以選PSOLA法語音芯片或者語音模。車載電話身尺寸小,功耗也大,選語音芯片比合適,然語音片在任意文合成上效果比語音塊差,完全可以達(dá)實(shí)用要。語音車電話通過變?yōu)槁?,高駕駛安全數(shù)。其能包括:1.電號(hào)碼播將手機(jī)到的來電信,包括來電次序、電人、電號(hào)碼、來時(shí)間等信息以清晰流暢的語音現(xiàn)自動(dòng)報(bào),機(jī)使用可以立知道來信息,決定是否接聽2.間及日程醒任何時(shí)候,只需要鍵就以播報(bào)當(dāng)前的時(shí)間,日程提醒播報(bào)出預(yù)約任務(wù)等3.息播報(bào).配合嵌入式語音合軟件,可以將收到各種短播報(bào)來,解決手屏幕小,讀困難的問,方便們獲取信息語音車GPS目前GPS術(shù)已經(jīng)泛應(yīng)用于汽領(lǐng)域。著城市車輛日益增,交通壓力日嚴(yán)重,如何駕駛員便、快捷地取信息變看為聽,低駕駛險(xiǎn),已越來越重要通過PSOLA算語音合技術(shù)也可以GPS信息轉(zhuǎn)變?yōu)槁曇舨シ沤o司機(jī)車輛通車載GPS可實(shí)現(xiàn)身定位再將自身的置和狀(如度、方等信息通過訊模塊功能發(fā)送信息中;同樣,信中心也以向車輛發(fā)送中簡(jiǎn)短信息(導(dǎo)航信、天氣報(bào)、各類定信息)。GPS增強(qiáng)汽車的防盜能和輔助駕功能(航信息但司機(jī)獲取息往往在駕車的過中,一駕車一邊閱信息十不安全,存著交通患,采用語技術(shù)能好解決個(gè)問題。語車載GPS功能以播放航信息,讓司機(jī)知最佳行路線也可以播放況信息讓司提前做準(zhǔn)備,以及堵車、緊事故處等等.另外還播放天氣預(yù)、定制息,各地信中心獲知車到達(dá)當(dāng)后將當(dāng)?shù)氐牡?4頁共22頁

天氣預(yù)、用戶定制內(nèi)容服告訴司機(jī),用戶定的信息容模式可為音壓縮數(shù)據(jù)系統(tǒng)實(shí)示意圖如圖3。統(tǒng)由GPS解析模塊、制模塊、信處理模、PSOLA法語音成模塊成。其工作過程如:載GPS過信提供網(wǎng)絡(luò)如GPRS/CDMA)獲取各型信息如導(dǎo)航信息路況信、天氣預(yù)報(bào)用戶通過信息心定制的個(gè)信息等控制模塊將要合成各類型信息析模塊下到信號(hào)處理塊;信處理模塊將息內(nèi)容換成標(biāo)準(zhǔn)的本信息發(fā)送給PSOLA法語音成模塊PSOLA法語音合成塊再將本信息轉(zhuǎn)換語音通車內(nèi)音響系播放給戶。導(dǎo)航車

路況天氣

控制

信號(hào)處

文本GPS

定制

驅(qū)

語音信息

PSOLA駕駛員(圖)語音車GPS要合成文本比多,而且較隨意,好定制,另每個(gè)用戶需要制的服務(wù)內(nèi)都不一,因此語音成的效要求高一些另外車GPS本身寸較,很容找到法語音塊的空間。功能上慮,用戶希通過GPS實(shí)現(xiàn)與信息中心語音通功能這就需解決語音編碼的問題而PSOLA算法語合成模支持語音編碼功能綜合考慮,議在語音車GPS用PSOLA算法音合成塊。語音

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論