![DSP原理與應(yīng)用論文DSP在語音處理方面的應(yīng)用_第1頁](http://file4.renrendoc.com/view/7c26fbc437e18d38cc14ff273a80f40f/7c26fbc437e18d38cc14ff273a80f40f1.gif)
![DSP原理與應(yīng)用論文DSP在語音處理方面的應(yīng)用_第2頁](http://file4.renrendoc.com/view/7c26fbc437e18d38cc14ff273a80f40f/7c26fbc437e18d38cc14ff273a80f40f2.gif)
![DSP原理與應(yīng)用論文DSP在語音處理方面的應(yīng)用_第3頁](http://file4.renrendoc.com/view/7c26fbc437e18d38cc14ff273a80f40f/7c26fbc437e18d38cc14ff273a80f40f3.gif)
![DSP原理與應(yīng)用論文DSP在語音處理方面的應(yīng)用_第4頁](http://file4.renrendoc.com/view/7c26fbc437e18d38cc14ff273a80f40f/7c26fbc437e18d38cc14ff273a80f40f4.gif)
![DSP原理與應(yīng)用論文DSP在語音處理方面的應(yīng)用_第5頁](http://file4.renrendoc.com/view/7c26fbc437e18d38cc14ff273a80f40f/7c26fbc437e18d38cc14ff273a80f40f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、DSP原理與應(yīng)用論文 題 目: DSP在語音處理方面的應(yīng)用 姓 名: 學(xué) 院:信息與電氣工程學(xué)院 專 業(yè):通信工程 班 級(jí): 學(xué) 號(hào): 指導(dǎo)教師: 摘要語音信號(hào)處理是研究數(shù)字信號(hào)處理技術(shù)和語音信號(hào)進(jìn)行處理的一門學(xué)科,是一門新型的學(xué)科,是在多門學(xué)科基礎(chǔ)上發(fā)展起來的綜合性技術(shù),它涉及到數(shù)字信號(hào)處理、模式識(shí)別、語言學(xué)。語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對語音信號(hào)處理的一門學(xué)科。處理的目的是要得到一些語音參數(shù)以便高效的傳輸或存儲(chǔ);或者是通過處理的某種運(yùn)算以達(dá)到某種用途的要求。語音信號(hào)處理又是一門邊緣學(xué)科。如上所訴,它是“語言語音學(xué)”與“數(shù)字信號(hào)處理”兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。語音信號(hào)處理屬于信息科學(xué)的一
2、個(gè)重要分支,大規(guī)模集成技術(shù)的高度發(fā)展和計(jì)算機(jī)技術(shù)的飛速前進(jìn),推動(dòng)了這一技術(shù)的發(fā)展。在數(shù)字音頻技術(shù)和多媒體技術(shù)迅速發(fā)展的今天,傳統(tǒng)的磁帶語音錄放系統(tǒng)因體積大、使用不便、放音不清晰而受到了巨大挑戰(zhàn)。本文結(jié)合人們對賓館客房中電氣設(shè)備應(yīng)用的需求,提出一種用DSP實(shí)現(xiàn)的說話人識(shí)別系統(tǒng),對客房中基本電氣功能進(jìn)行語音控制,從而將語音識(shí)別技術(shù)應(yīng)用到賓館客房控制中。關(guān) 鍵 詞:DSP;賓館;語音識(shí)別; 特征參數(shù)提取 ;PAGE 1PAGE 6 前言傳統(tǒng)的賓館客房門多采用鑰匙或磁性門卡,這使得人們在外出時(shí)不得不多攜帶一把鑰匙或是一張門卡,這對在外旅行的人造成了不大不小的麻煩;另外從市場的角度來看,存在這樣的需求,
3、當(dāng)我們到一個(gè)陌生的客房時(shí),完全不了解不熟悉它的電器控制開關(guān)的位置、對應(yīng)關(guān)系及特點(diǎn),給我們的旅途帶來諸多的不便。賓館客房的電氣控制系統(tǒng)還有待于作進(jìn)一步的人性化設(shè)計(jì)。 語音識(shí)別是近二十幾年發(fā)展起來的信息學(xué)科,特別是近十年來國內(nèi)外競相研究的熱點(diǎn)。語音識(shí)別具有最自然、最快速、最方便等優(yōu)點(diǎn)。始于二十世紀(jì)六十年代的語音識(shí)別研究,識(shí)別率有了很大的提高,基本可達(dá)實(shí)用水平。但是因?yàn)檎Z音識(shí)別的計(jì)算量非常大,難以實(shí)時(shí)實(shí)現(xiàn),因此一直制約著它的應(yīng)用。隨著DSP和專用集成電路技術(shù)的發(fā)展,始語音識(shí)別尤其是計(jì)算量較小的說話人實(shí)時(shí)實(shí)現(xiàn)成為可能。 賓館客房采用語音電子門禁(語音識(shí)別技術(shù)),合法用戶(經(jīng)過注冊)可通過語音密碼進(jìn)入房
4、間,然后可進(jìn)行口述命令,控制室內(nèi)電器的啟動(dòng)、調(diào)節(jié)和關(guān)閉等,而非法用戶則被語音密碼阻擋,無法進(jìn)入客房。1、DSP發(fā)展歷史及功能1978年,Intel 發(fā)布了一種“模擬信號(hào)處理器”2920處理器。它包含一組帶有一個(gè)內(nèi)部信號(hào)處理器的片上ADC/DAC,但由于它不含硬件乘法器,因此在市場上銷售并不成功. 1979年,AMI 發(fā)布了 S2811處理器,它被設(shè)計(jì)成微處理器的周邊裝置,必須由主處理器初始化后才能工作。 S2811 在市場上也不成功。1979年,貝爾實(shí)驗(yàn)室發(fā)表了第一款單芯片 DSP,即 Mac 4 型微處理器。繼而于1980年的IEEE國際固態(tài)電路會(huì)議上出現(xiàn)了第一批獨(dú)立、完整的DSP,它們是N
5、EC的PD7720處理器和AT&T的DSP1處理器。這兩種處理器都是在公共交換電話網(wǎng)的遠(yuǎn)程通信研究中受到了啟發(fā)而產(chǎn)生的。還有一種早期的DSP,Altamira DX-1,它使用一組帶有延遲轉(zhuǎn)移和轉(zhuǎn)移預(yù)測機(jī)制的四整數(shù)組流水線。事實(shí)證明,1983年德克薩斯儀器公司生產(chǎn)的第一款DSP,TMS32010,是一個(gè)更大的成功,時(shí)至今日德州儀器已成為通用DSP市場的龍頭,并提供有HPI(Host-Post Interface),由外部CPU直接訪問。另一款成功的設(shè)計(jì)是摩托羅拉的56000。通用CPU中有些技術(shù)是受到帶有擴(kuò)展模塊的DSP的影響而出現(xiàn)的,例如Intel的IA-32架構(gòu)指令集中的MMX擴(kuò)展。DSP
6、是一種專用于(通常為實(shí)時(shí)的)數(shù)字信號(hào)處理的微處理器。其具有分開的程序存儲(chǔ)器和數(shù)據(jù)存儲(chǔ)器(哈佛結(jié)構(gòu))。用于單指令流多數(shù)據(jù)流(SIMD)作業(yè)的特殊指令集;可進(jìn)行并行處理,但不支援多任務(wù);用于宿主環(huán)境時(shí)可作為直接內(nèi)存存?。―MA)設(shè)備運(yùn)作;從模擬數(shù)字轉(zhuǎn)換器(ADC)獲得數(shù)據(jù),最終輸出的是由數(shù)字模擬轉(zhuǎn)換器(DAC)轉(zhuǎn)換為模擬信號(hào)的數(shù)據(jù)等特點(diǎn)。大部分DSP使用的是定點(diǎn)算法,這是因?yàn)樵谛盘?hào)處理的一般實(shí)際應(yīng)用中不需要使用浮點(diǎn)運(yùn)算比定點(diǎn)運(yùn)算多提供的那部分額外的精度范圍,而使用定點(diǎn)算法犧牲了不需要的精度,卻大大提高了速度。另一方面,浮點(diǎn)DSP則常用在科學(xué)計(jì)算和某些需要高精度的應(yīng)用中。DSP芯片通常采用專用集成電
7、路設(shè)計(jì),然而亦可使用現(xiàn)場可編程門陣列(FPGA)芯片來實(shí)現(xiàn)DSP的功能,F(xiàn)PGA的I/O帶寬比DSP帶寬大十多倍。2、DSP在語音處理方面的應(yīng)用語音信號(hào)處理的一門比較實(shí)用的電子工程的專業(yè)課程,語音是人類獲取信息的重要來源和利用信息的重要手段,通過語言相互傳遞信息是人類最重要的基本功能之一,語音是人類特有的功能,它是創(chuàng)造和記載幾千年來人類文明史的根本手段,是人類最重要、最有效、最常用和最方便的交換信息的形式。 語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對語音信號(hào)進(jìn)行處理的一門學(xué)科,它是一門新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域剛也涉及面很廣的交叉學(xué)科。3.1 本次DSP在語音方面的客房語音服務(wù)方案 可
8、對客房進(jìn)行的語音服務(wù)方案大致如下: a.運(yùn)用語音識(shí)別技術(shù)對客房內(nèi)的電器進(jìn)行開關(guān)的控制;如控制電視、空調(diào)、床燈及其他的電器時(shí),只 需要呼叫相應(yīng)的電器名字即可以改變它的開關(guān)狀況; b.運(yùn)用語音識(shí)別的語音確認(rèn)的功能,對客房的臨時(shí)主人進(jìn)行身份登記確認(rèn),防止其他外人進(jìn)入客房 和使用控制系統(tǒng); c.語音的實(shí)時(shí)報(bào)時(shí)及趣味語音鬧鐘功能;您只需要開口問時(shí)間幾點(diǎn),系統(tǒng)將準(zhǔn)確地把實(shí)時(shí)的時(shí)間 通過語音方式告知; d.賓館把最重要的服務(wù)信息,通過語音的方式儲(chǔ)存在系統(tǒng)中,供客戶進(jìn)行語音的查詢;儲(chǔ)存的信息內(nèi)容可以隨時(shí)錄入更改,信息播放采用語音喚醒功能。3.2 DSP在語音處理方面的基本原理目前,常用的語音處理方面有模版匹配
9、法、隨機(jī)模型法、人工神經(jīng)網(wǎng)絡(luò)法等。考慮到數(shù)據(jù)量、實(shí)時(shí)性 及識(shí)別率的問題,本文采用基于矢量量化的隱馬爾可夫模型(HMM)相結(jié)合的方法。 說話人識(shí)別系統(tǒng)主要由預(yù)處理、語音特征參數(shù)的提取、訓(xùn)練、識(shí)別和后處理組成語音采集原理是,人耳能聽到的聲音是一種范圍為20Hz20kHz,而一般語音頻率最高為3.4kHz。語音的采集是指語音聲波信號(hào)經(jīng)麥克風(fēng)和高頻放大器轉(zhuǎn)換成有一定幅度的模擬量電信號(hào),然后再轉(zhuǎn)換成數(shù)字量的全過程。3.3 DSP在語音處理的依據(jù)預(yù)處理 預(yù)處理主要是對輸入的模擬語音數(shù)據(jù)作初步處理,使其適于后面的特征提取及識(shí)別。預(yù)處理主要有以下幾步:A/D轉(zhuǎn)換、量化編碼、反混疊處理、預(yù)加重、短時(shí)過零率等。語
10、音特征參數(shù)提取 語音處理系統(tǒng)中的特征檢測即提取語音信號(hào)中表征人的基本特征,此特征應(yīng)能有效區(qū)分不同的說話人,且對同一說話人的變化保持 相對穩(wěn)定。考慮到特征的可量化性、訓(xùn)練樣本的數(shù)量和系統(tǒng)性能的評(píng)價(jià)問題,目前的語音識(shí)別系統(tǒng)主要依靠較低層次的聲學(xué)特征進(jìn)行識(shí)別。說話人特征大體可歸為下述幾類: 譜包絡(luò)參數(shù)語音信息通過濾波器組輸出,以合適的速率對濾波器輸出抽樣,并將它們作為識(shí)別特征?;糨喞?、共振峰頻率帶寬及其軌跡這類特征是基于發(fā)聲器官如聲門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù)。線性預(yù)測系數(shù)使用線性預(yù)測系數(shù)是語音信號(hào)處理中的一次飛躍,以線性預(yù)測導(dǎo)出的各種參數(shù),如線性預(yù)測系數(shù)、自相關(guān)系數(shù)、反射系數(shù)、對數(shù)面積比
11、、線性預(yù)測殘差及其組合等參數(shù),作為識(shí)別特征,可以得到較好的效果。主要原因是線性預(yù)測與聲道參數(shù)模型是相符合的。反映聽覺特性的參數(shù)模擬人耳對聲音頻率感知的特性而提出了多種參數(shù),如倒譜系數(shù)、感知線性預(yù)測等。 本系統(tǒng)在說話人識(shí)別中采用倒譜系數(shù)和基音周期參數(shù),而在控制命令的語音識(shí)別中僅采用倒譜系數(shù),倒譜系數(shù)采用線性預(yù)測倒譜系數(shù)(LPCC)2。對LPCC參數(shù)的提取,可采用協(xié)方差算法來求LPC系數(shù),然后求LPCC參數(shù)??啥x Rn(j)=N-1 n=0s(n)s(n-j) Rn(j-i)= N-1 n=0 s(n-j)s(n-i) 可用c(j,i)來表示Rn(j-i),c(j,i)即為s(n)的協(xié)方差。 c
12、(j,i)=Rn(j-i)= N-1 n=0 s(n- j)s(n-i) c(j,0)= P i=1 i c(j,i)=0 (1jP) 矩陣表示形式如下: c(1,1)c(1,2)c(1,3)c(1,P)c(2,1)c(2,2)c(2,3)c(2,P)c(3,1) c(3,2)c(3,3) c(3,P) c(P,1) c(P,2) c(P,3) c(P,P) 123 P =c(1,0)c(2,0)c(3,0) c(P,0) 求解矩陣方程可以用矩陣分解的Cholesky法進(jìn)行,它可將協(xié)方差矩陣C進(jìn)行LU分解,其中L為三角矩陣,U為上三角陣。協(xié)方差算法圖解基音周期估計(jì)的方法主要有基自相關(guān)函數(shù)的算法
13、、基于求短時(shí)平均幅度差函數(shù)(AMDF)的算法、基于同態(tài)信號(hào)處理和線性預(yù)測編碼的算法。本系統(tǒng)可采用自相關(guān)函數(shù)算法。設(shè)SW(n)是一段加窗語音信號(hào),它的非零區(qū)間為n=0,1,N-1。SW(n)的自相關(guān)函數(shù)稱為語音信號(hào)的短時(shí)自相關(guān)函數(shù),用 RW(l)表示: RW(l)= + n=- S W (n)SW(n+l)= N-l-1 n=0 S W (n)SW(n+l) RW(0)= N-1 n=0 S2 W (n) 短時(shí)自相關(guān)函數(shù)在RW(0)處最大,且在基音周期的各個(gè)整數(shù)倍點(diǎn)上有很大的峰值,選擇合適的窗函數(shù)與濾波器后,只要找到自相關(guān)函數(shù)的第一最大峰值點(diǎn)的位置并計(jì)算它與零點(diǎn)的距離,便能估計(jì)出基音周期。3.4
14、 DSP在語音處理方面的專業(yè)理論依據(jù)采樣定理:在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過程中,當(dāng)采樣頻率fs.max大于信號(hào)中最高頻率fmax的2倍時(shí),則采樣之后的數(shù)字信號(hào)完整的保留了原始信號(hào)中的信號(hào),一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的510倍;采樣定理又稱奈奎斯特定理。 采樣頻率:采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本,是描述聲音文件的音質(zhì)、音調(diào)、衡量聲卡、聲音文件的質(zhì)量標(biāo)準(zhǔn)。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對聲音波形的表示也就越精確,采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特理論,只有采樣頻率高于聲音信號(hào)最高頻率的2倍的時(shí)候,才能把數(shù)字
15、信號(hào)表示的聲音還原成為原來的聲音,這就是說采樣頻率是衡量聲卡采集、記錄和還原聲音文件的質(zhì)量標(biāo)準(zhǔn)。 采樣位數(shù)與采樣頻率:采樣位數(shù)即采樣值或取樣值,用來衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)候使用數(shù)字聲音信號(hào)的二進(jìn)制為數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。 采樣位數(shù)和采樣頻率對于音頻接口來說是最為重要的兩個(gè)基本指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無論采樣頻率如何,理論上來說采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕捉到的信號(hào)越精確。對于采樣率來說你可以想象它類似于一
16、個(gè)照相機(jī)。顯然采樣率越高,計(jì)算機(jī)提取的聲音越多,對于原始的還原也越加精確。 3.5 DSP在語音處理方面的指令部分語法格式讀wav文件:x=wavread(filename)數(shù)組a及b中元素相乘:a.*b創(chuàng)建圖形窗口命令:figure繪圖函數(shù):plot(x)坐標(biāo)軸:axis(xminxmaxyminymax)坐標(biāo)軸注解:xlabel()ylabel()圖例注解:legend()一階高通濾波器:y=filter(1-0.09375,1,x)分幀函數(shù):f=enframe(x,len,inc)x為輸入語音信號(hào),len指定了幀長,inc指定幀移,函數(shù)返回為nXlen的一個(gè)矩陣,每一行都是一幀數(shù)據(jù)。部分
17、濾波程序如下: STM#1881,BRC;1881為采樣數(shù)據(jù)點(diǎn)數(shù),進(jìn)行下面的塊循環(huán) STMRPTBDLOOP1;下一條指令到標(biāo)號(hào)LOOP的前一條指令時(shí)需要重復(fù)的程序塊 STLA,*DATA_P+;更新循環(huán)緩沖區(qū),其中DATA_P為數(shù)據(jù)循環(huán)緩沖區(qū) PRTZA,171;重復(fù)下一條指令17次,先將A清零MAC*DATA_P+0%,*COEF_P+0%,A;計(jì)算濾波結(jié)果8STHA,*OUTBUF_P+;將結(jié)果在OUTBUF的數(shù)據(jù)區(qū)輸出3.6 系統(tǒng)實(shí)現(xiàn) (硬件結(jié)構(gòu)說明)由于賓館客房中的電氣控制命令是有限的詞條和數(shù)字串的組合,對這些語音命令的識(shí)別屬于特定人小詞匯量的識(shí)別,不論是從目前的DSP運(yùn)算還是存儲(chǔ)空
18、間來說,實(shí)時(shí)實(shí)現(xiàn)這些語音命令的識(shí)別都是完全可能的。 我們可以采用采用TMS320VC5402。它是TI公司生產(chǎn)的從屬于TMS320C54x系列的一個(gè)工作靈活、高速、具有較高性價(jià)比、低功耗的16b定點(diǎn)通用DSP芯片。其主要特點(diǎn)為:采用改進(jìn)的哈佛結(jié)構(gòu),一條程序總線(PB),三條數(shù)據(jù)總線(CB,DB,EB)和四條地址總線(PAB,CAB,DAB,EAB),帶有專用硬件邏輯CPU(40b算術(shù)邏輯單元ALU,包括一個(gè)40b桶形移位器和兩個(gè)40b累加器;一個(gè)1717乘法器和一個(gè)40b專用加法器,允許16b帶或不帶符號(hào)的乘法),片內(nèi)存儲(chǔ)器(八個(gè)輔助寄存器及一個(gè)軟件棧),片內(nèi)外專用的指令集,允許使用最先進(jìn)的定點(diǎn)DSPC語言編譯器。A/D芯片采用TLC320AD50C,其中含有A/D、D/A、低通濾波器和采樣保持電路。模擬語音信號(hào)主要通過傳聲器輸入,A/D轉(zhuǎn)換后的數(shù)字語音數(shù)據(jù)以同
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025單位保潔服務(wù)合同范本
- 2025商業(yè)超市供貨合同
- 2《憲法是根本法》(說課稿) -統(tǒng)編版道德與法治六年級(jí)上冊
- 農(nóng)村房屋翻新合同范例
- 養(yǎng)殖場長期租賃合同范例
- 勞務(wù)分包結(jié)算合同范本
- 2024-2025學(xué)年高中地理 第一章 環(huán)境與環(huán)境問題 1.1 人類與環(huán)境的關(guān)系說課稿 中圖版選修6
- 兩月工程合同范本
- 勞務(wù)合同范本劉律師
- 浦東鋼結(jié)構(gòu)吊裝施工方案
- 二零二五年知識(shí)產(chǎn)權(quán)共享及收益分成合作協(xié)議3篇
- 北師大版二年級(jí)數(shù)學(xué)上冊計(jì)算題專項(xiàng)復(fù)習(xí)大全272
- 南通市2025屆高三第一次調(diào)研測試(一模)生物試卷(含答案 )
- 2024年09月2024渤海銀行天津?yàn)I海新區(qū)分行校園招聘筆試歷年參考題庫附帶答案詳解
- 期末考試成績分析報(bào)告課件
- 中小學(xué)校食品安全與膳食經(jīng)費(fèi)管理工作指引
- 常見食物的嘌呤含量表匯總
- 小學(xué)數(shù)學(xué)-三角形面積計(jì)算公式的推導(dǎo)教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- 人教版數(shù)學(xué)八年級(jí)下冊同步練習(xí)(含答案)
- 2023年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招(英語)試題庫含答案解析
- 秦暉社會(huì)主義思想史課件
評(píng)論
0/150
提交評(píng)論