數字信號在語音處理上的應用_第1頁
數字信號在語音處理上的應用_第2頁
數字信號在語音處理上的應用_第3頁
數字信號在語音處理上的應用_第4頁
數字信號在語音處理上的應用_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 一 、研究背景和價值語言是人類交流信息的基本手段,在人們日益擴大的交流中占據著重要地位。在如今高度發(fā)達的信息社會中用數字化的方法進行語音的傳送、儲存識別、合成、增強等是整個數字化通信網中最重要、最基本的組成部分之一隨著信息科學技術的飛速發(fā)展,語音信號處理的研究也日益顯示出它的要性,并取得了重大進展。雖然語音信號處理作為研究用數字信號處理技術和語音學知識對語音信號進行處理的新興的學科,是目前發(fā)展最為迅速的信息科學研究領域的核心技術之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息的形式。同時,語言也是人與機器之間進行通信的重要工具,他是一種理想的人機通信方式,因而可為信息處理

2、系統建立良好的人機交互環(huán)境,進一步推進計算機和其智能機器的應用,提高社會的信息化程度。數字信號外理是許多科學和工程技術領域中不可缺少的一個方面,在通信 、雷達、語音處理、圖象處理、聲學、地震學、地質勘探、氣象學、遙感、生物醫(yī)學工程、核工程、航天工程等領域中都離不開數字信號處理。隨著計算機技術的發(fā)展,數字信號處理技術得到飛速發(fā)展?,F在,已經從最初的只是用數字方法去完成模擬信號處理的基本功能發(fā)展成為一門獨立的學科。數字信號處理在其發(fā)展初期是與模擬信號處理密切相關的。模擬信號處理討論的兩個主要問題是濾波器設計和頻譜分析。模擬信號處理所研究的問題主要局限在這兩個方面,這是與當時信號處理的數學基礎和物理

3、依托有關的。當時能夠完成電信號濾波的主要手段是依靠LC網絡,相應的數學分析工具是傅里葉變換。數字信號處理在其發(fā)展的初期只是試圖用數字方法代替模擬方法去完成上述任務。20世紀60年代形成的一系列數字信號處理的理論和算法,如數字濾波器、快速傅里葉變換等是語音信號數字處理的理論和技術基礎。隨著信息科學技術的發(fā)展,語音信號處理取得了重大的進展。70年代提出了用于語音信號的信息壓縮和特征提取的線性預測技術,成為語音信號處理的有力工具。近年來人工神經網絡的研究取得了迅速發(fā)展語音信號處理的各項課題是促進其發(fā)展的重要動力之一,同時它的許多成果也體現在有關語音信號處理的各項技術中。因此,在60年代和70年代初期

4、,數字信號處理領域中的大量研究工作以及發(fā)表的大量論文和著作都集中于兩個方面。一方面是數字濾波器 (仍限于低通、高通、帶通、帶阻等類型)的設計,即各種FIR、nR數字濾波器設計硬件實現結構以及穩(wěn)定性。有限字長效應等問題;另一方面是FFT的各種算法。二 、研究任務 首先是要對所需處理的語音信號的采集,運用MATLAB對其時域、頻率響應、幅值、相位、頻譜做出分析。然后對獲取到的語音信號進行倒譜處理,接著用濾波器對加信號進行濾波。最后進行數據轉換,使用不同的采樣頻率對信號進行處理得到不同頻率下的時域波形及其頻譜。對比不同采樣率下語音信號的差別。完成各部分任務的程序設計,并做出仿真分析。三、任務實施1、

5、語音信號采集 由于條件限制,本實驗中采集的語音是通過音樂播放器截取的一段語音,文件名為“guxiang1”,然后通過軟件處理轉換成wav格式的語音信號并保存,以作為實驗處理的語音信號,完成后續(xù)實驗分析。 2、工具選擇 在本次仿真使用的工具是MATLAB,MATLAB(矩陣實驗室)是MATrix LABoratory的縮寫,是一款由美國The MathWorks公司出品的商業(yè)數學軟件。MATLAB是一種用于算法開發(fā)、數據可視化、數據分析以及數值計算的高級技術計算語言和交互式環(huán)境。除了矩陣運算、繪制函數/數據圖像等常用功能外,MATLAB還可以用來創(chuàng)建用戶界面及與調用其它語言(包括C,C+和FOR

6、TRAN)編寫的程序。 MATLAB具有很多優(yōu)點,編程環(huán)境比較簡單,容易實現,易于操作,而且處理能力特別強,它的內部包含了許多模塊集合小工具,可以編程,也可以進行建模,完成許多方面的仿真分析。而且編程即支持匯編,也支持C+,有豐富的圖形庫,所以在本實驗中,選取MATLAB作為仿真工具。四、仿真及分析1. 語音信號時域和頻譜時域是描述數學函數或物理信號對時間的關系。例如一個信號的時域波形可以表達信號隨著時間的變化。本文分析的語音信號“guxiang1”的時域圖如圖1所示,還包含該信號的幅值及相位。圖1 語音信號的波形、幅值和相位頻率響應函數頻率響應函數是描述測試系統動態(tài)特性的重要參數,通過頻率響

7、應函數進行頻率分析也是進行數字濾波器設計的重要方法。頻率響應函數是系統輸出與輸入的傅里葉變換之比Hj=Y()X()實驗時用沖激函數作為系統激勵信號,用各種數字濾波器作為測試系統。沖激函數具有無限寬廣的頻譜,用沖激函數做激勵信號相當于對測試系統輸入所有頻率的信號,系統必然有對應的輸出。計算出系統輸出與輸入的傅里葉變換之比,就是系統的頻率響應函數。語音信號“guxiang1”的頻率響應圖如圖2所示。圖2 信號頻率響應圖頻譜任一信號,只要符合一定條件都可以分解為一系列不同頻率的正弦(或余弦)分量的線性疊加;每一個特定頻率的正弦分量都有它相應的幅度和相位。因此對于一個信號,它的各分量的幅度和相位分別是

8、頻率的函數;或者合起來,它的復數幅度是頻率的函數。這種幅度(或相位)關于頻率的函數,就稱為信號的頻譜。當把信號頻譜,即幅度(或相位)關于頻率的變化關系用圖來表示,就形成頻譜圖。從頻譜圖上,我們既可以看到這個周期信號由哪些頻率的諧波分量(正弦分量)組成;也可以看到,對應各個諧波分量的幅度,它們的相對大小就反映了各諧波分量對信號貢獻的大小或所占比重的大小。信號的頻譜是信號的一種新的表示方法,從頻譜可以看到這個周期信號由哪些頻率的諧波分量(正弦分量)組成;也可以看到,對應各個諧波分量的幅度,它們的相對大小就反映了各諧波分量對信號貢獻的大小或所占比重的大小。語音信號“guxiang1”的頻譜如圖3所示

9、。圖3 語音信號的頻譜2. 語音信號倒譜分析語音信號不是加性信號,而是卷積信號。為了能用線性系統對其進行處理,可以先采用卷積同態(tài)系統處理。經過卷積同態(tài)系統后輸出的偽時域序列稱為原序列的“復倒頻譜”。它的定義式可以表示為:xn=IFTlnFTxn倒譜或稱 “倒頻譜”的定義為 :cn=IFTlnFTxn同態(tài)信號處理法就是設法將非線性問題轉化為線性問題來處理的一種方法。按照被處理的信號來分類,大體上可以分為乘積同態(tài)信號處理和卷積同態(tài)信號處理。由于語音信號可以視為聲門激勵信號和聲道響應信號的卷積結果。我們僅討論卷積同態(tài)信號處理系統的問題。同態(tài)信號處理也稱為同態(tài)濾波,實現將卷積關系變換為求和關系的分離處

10、理,即解卷。解卷算法可以分為兩大類:第一類是首先為線性系統V(Z)建立一個模型,然后對模型參數按照某種最佳準則進行估計,這種方法稱為參數解卷方法。采用的模型可以分為全極點模型(AR模型)和零極點模型(ARMA模型),如果采用最小均方誤差準則對AR模型進行估計,就得到線性預測編碼算法(LPC)。第二類算法稱為非模型解卷。同態(tài)信號處理完成解卷任務就是其中最重要的一種。對信號進行分析得出它的倒譜參數的過程稱為同態(tài)處理。對于語音信號進行解卷,可將語音信號的聲門激勵信息及聲道響應信息分離開來,從而求得聲道共振特征和基音周期,用于語音編碼、合成和識別。語音信號“guxiang1”的頻譜如圖4所示,圖中上圖

11、為“guxiang1”的原始信號,下圖為頻譜圖。圖4 語音信號的頻譜圖它和復倒譜的主要區(qū)別是對序列對數幅度譜的傅立葉逆變換,它是復倒譜 中的偶對稱分量。它們都將卷積運算,變?yōu)閭螘r域中的加法運算,使得信號可運用滿足疊加性的線性系統進行處理。復倒一潛涉及復對數運算,而倒譜只進 行實數的對數運算,較復倒譜的運算量大大減少。對語音信號的某一幀同樣可以分析出它的短時倒譜參數,總的說來,無論對于語音通信、語音合成或語音識別,倒譜參數所含的信息比其他參數多,也就是語音質量好,識別正確率高。但其缺點是運算量比其他參數大,盡管如此,倒譜分析方法仍不失為一種有效的語音信號的分析方法。3.語音信號數字濾波數字濾波是

12、數字信號分析中最重要的組成部分之一,與模擬濾波相比,它具有精度和穩(wěn)定性高、系統函數容易改變、靈活性強、便于大規(guī)模集成和可實現多維濾波等優(yōu)點。在信號的過濾、檢測和參數的估計等方面,經典數字濾波器是使用最廣泛的一種線性系統。 數字濾波器是指完成信號濾波處理功能的,用有限精度算法實現的離散時間線性非時變系統,其輸入是一組數字量,其輸出是經過變換的另一組數字量。因此,數字濾波器本身既可以是用數字硬件裝配成的一臺完成給定運算的專用的數字計算機,也可以將所需要的運算編成程序,讓通用計算機來執(zhí)行。從數字濾波器的單位沖擊響應來看,可以分為兩大類:有限沖擊響應(FIR)數字濾波器和無限沖擊響應(IIR

13、)數字濾波器。濾波器按功能上分可以分為低通濾波器(LPF)、高通濾波器(HPF)、帶通濾波器(BPF)、帶阻濾波器(BSF)。在很多實際應用中如語音和音頻信號處理中,數字濾波器來實現選頻功能。因此,指標的形式應為頻域中的幅度和相位響應。在通帶中,通常希望具有線性相位響應。在FIR濾波器中可以得到精確的線性相位。FIR濾波器傳遞函數的極點是固定在原點,是不能動的,它只能靠改變零點位置來改變它的性能,所以要達到高的選擇性,必須用高的階數,對于同樣的濾波器設計指標,FIR濾波器所要求的階數可能比IIR濾波器高5-10倍,結果成本高信號延時也較大,如果按線性相位要求來說,則IIR濾波器就必須加全通網絡

14、進行相位校正,同樣大大增加了濾波器的階數和復雜性。而FIR濾波器卻可以得到嚴格的線性相位。語音信號“guxiang1”的時域及頻譜濾波后的圖形如圖5所示。圖5語音信號的時域及頻譜濾波后波形圖由圖可知,濾波對波形影響不大,但對高頻有較大衰減。在討論由模擬濾波器變換為數字濾波器時,普遍采用的是雙線性變換法,它保留的是從模擬到數字域的系統函數表示。在濾波器的選取時,由于設計方法的側重點不同,作出比較是困難的。如果在IIR 濾波器情況下,最優(yōu)的設計將是橢圓濾波器。我們以雙線性變換法設計數字橢圓濾波器為例,分別給出低通、高通、帶通、帶阻四種情況下濾波前后信號的波形和頻譜進行比較。4. 數據轉換數據轉換是

15、指改變音頻格式中的采樣頻率或量化位數。轉換原理是:先用矩陣插值或抽取技術實現變量變換,如果是抽取數據還需在變換前作濾波處理使之滿足采樣定理;變量變換完成后再用 audiowrite 函數重新定義量化位數和采樣頻率即可實現數據轉換。數據轉換過程中,要注意采樣頻率與原始采樣頻率及插值或抽取系數的關系。語音信號“guxiang1”的不同采樣頻率下的波形圖,圖中上部分為時域及其頻譜圖,中間圖為原采樣率下的波形圖及頻譜圖,下面的圖為新采樣頻率下的新波形圖及頻譜圖。圖6 不同采樣率下的波形圖及頻譜圖由圖可知,在滿足采樣定律條件下,實現數據抽取,在原采樣率下波形變密、頻譜變寬且幅度減半,但在新采樣率下波形和

16、頻譜都很好。 通過試聽輸出文件還可感受處理效果。五、總結語音信號采集與分析是以語音語言學和數字信號處理為基礎而形成的一門涉及面很廣的綜合性學科。語音是一種信號,是一種特殊的向量matlab軟件是進行數字信號分析與處理必不可少的一門工具。利用matlab豐富的應用函數如:audioread,audioplay,audiowrite,fopen,fprintf, fclose等,實現了對wav類型的音頻文件的信號采集和綜合分析,借助matlab 程序設計實現對音頻信號的密碼設置,借matlab 數據接口建立文本文檔,利用相關分析函數對預留語音信號頻譜和試驗者語音信號頻譜進行相關分析從而實現語音識別,為文本文檔加密。從而對整個數字音頻信號的處理方法做了一個全面而系統的實踐。雖然在仿真過程中我遇到了許多困難與挫折,對matlab了解不足致使編寫matlab程序困難等。通過查找資料向師兄請教,不斷和同學討論,以及大量查找文獻資料,不斷調試程序等努力,最終也自己操作運行了一些實例,但是還是知道自己欠缺很多,運行的這些實例沒沒有很強的系統性。通過這些實例的結果驗證了課本上的知識,對這些知識的理解有了更深的理解,加深了印象。不過時間有限,自己本身的能力也有欠缺的地方,不能將所學的知識

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論