語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)_第1頁(yè)
語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)_第2頁(yè)
語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)_第3頁(yè)
語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)_第4頁(yè)
語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)摘要語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)和語(yǔ)音學(xué)知識(shí)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的新興的學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過(guò)語(yǔ)音傳遞信息是人類(lèi)最重要、最有效、最常用和最方便的交換信息形式。Matlab語(yǔ)言是一種數(shù)據(jù)分析和處理功能十分強(qiáng)大的計(jì)算機(jī)應(yīng)用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強(qiáng)大的矩陣運(yùn)算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時(shí)域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號(hào)處理與分析工具箱為語(yǔ)音信號(hào)分析提供了十分豐富的功能函數(shù),利用這些功能函數(shù)可以快捷而又方便地完成語(yǔ)音信號(hào)的處理和分析以及信號(hào)的

2、可視化,使人機(jī)交互更加便捷。信號(hào)處理是Matlab重要應(yīng)用的領(lǐng)域之一。本設(shè)計(jì)針對(duì)現(xiàn)在大部分語(yǔ)音處理軟件內(nèi)容繁多、操作不便等問(wèn)題,采用MATLAB7.0綜合運(yùn)用GUI界面設(shè)計(jì)、各種函數(shù)調(diào)用等來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的變頻、變幅、傅里葉變換及濾波,程序界面簡(jiǎn)練,操作簡(jiǎn)便,具有一定的實(shí)際應(yīng)用意義。最后,本文對(duì)語(yǔ)音信號(hào)處理的進(jìn)一步發(fā)展方向提出了自己的看法。關(guān)鍵字:Matlab;語(yǔ)音信號(hào);傅里葉變換;信號(hào)處理;目 錄1 緒論11.1課題背景及意義11.2國(guó)內(nèi)外研究現(xiàn)狀11. 3本課題的研究?jī)?nèi)容和方法21.3.1 研究?jī)?nèi)容21.3.2 運(yùn)行環(huán)境21.3.3 開(kāi)發(fā)環(huán)境22 語(yǔ)音信號(hào)處理的總體方案32.1 系統(tǒng)基本概述

3、32.2 系統(tǒng)基本要求32.3 系統(tǒng)框架及實(shí)現(xiàn)32.4系統(tǒng)初步流程圖43 語(yǔ)音信號(hào)處理基本知識(shí)63.1語(yǔ)音的錄入與打開(kāi)63.2采樣位數(shù)和采樣頻率63.3時(shí)域信號(hào)的FFT分析63.4數(shù)字濾波器設(shè)計(jì)原理73.5倒譜的概念74 語(yǔ)音信號(hào)處理實(shí)例分析84.1圖形用戶界面設(shè)計(jì)84.2信號(hào)的采集84.3語(yǔ)音信號(hào)的處理設(shè)計(jì)84.3.1 語(yǔ)音信號(hào)的提取84.3.2 語(yǔ)音信號(hào)的調(diào)整104.3.2.1 語(yǔ)音信號(hào)的頻率調(diào)整104.3.2.2語(yǔ)音信號(hào)的振幅調(diào)整114.3.3 語(yǔ)音信號(hào)的傅里葉變換124.3.4 語(yǔ)音信號(hào)的濾波134.3.4.1 語(yǔ)音信號(hào)的低通濾波134.3.4.2 語(yǔ)音信號(hào)的高通濾波154.3.4.3

4、 語(yǔ)音信號(hào)的帶通濾波154.3.4.4 語(yǔ)音信號(hào)的帶阻濾波164.4 語(yǔ)音信號(hào)的輸出175 總結(jié)18參考文獻(xiàn)19致 謝20語(yǔ)音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)1 緒論語(yǔ)音是語(yǔ)言的聲學(xué)表現(xiàn),是人類(lèi)交流信息最自然、最有效、最方便的手段。隨著社會(huì)文化的進(jìn)步和科學(xué)技術(shù)的發(fā)展,人類(lèi)開(kāi)始進(jìn)入了信息化時(shí)代,用現(xiàn)代手段研究語(yǔ)音處理技術(shù),使人們能更加有效地產(chǎn)生、傳輸、存儲(chǔ)、和獲取語(yǔ)音信息,這對(duì)于促進(jìn)社會(huì)的發(fā)展具有十分重要的意義,因此,語(yǔ)音信號(hào)處理正越來(lái)越受到人們的關(guān)注和廣泛的研究。1.1課題背景及意義語(yǔ)音信號(hào)處理是一門(mén)比較實(shí)用的電子工程的專業(yè)課程,語(yǔ)音是人類(lèi)獲取信息的重要來(lái)源和利用信息的重要手段。通過(guò)語(yǔ)言相互傳遞信息是人

5、類(lèi)最重要的基本功能之一。語(yǔ)言是人類(lèi)特有的功能,它是創(chuàng)造和記載幾千年人類(lèi)文明史的根本手段,沒(méi)有語(yǔ)言就沒(méi)有今天的人類(lèi)文明。語(yǔ)音是語(yǔ)言的聲學(xué)表現(xiàn),是相互傳遞信息的最重要的手段,是人類(lèi)最重要、最有效、最常用和最方便的交換信息的形式。語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的一門(mén)學(xué)科,它是一門(mén)新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域和涉及面很廣的交叉學(xué)科。1.2國(guó)內(nèi)外研究現(xiàn)狀20世紀(jì)60年代中期形成的一系列數(shù)字信號(hào)處理的理論和算法,如數(shù)字濾波器、快速傅立葉變換(FFT)等是語(yǔ)音信號(hào)數(shù)字處理的理論和技術(shù)基礎(chǔ)。隨著信息科學(xué)技術(shù)的飛速發(fā)展,語(yǔ)音信號(hào)處理取得了重大的進(jìn)展:進(jìn)入70年代之后,提出了用于

6、語(yǔ)音信號(hào)的信息壓縮和特征提取的線性預(yù)測(cè)技術(shù)(LPC),并已成為語(yǔ)音信號(hào)處理最強(qiáng)有力的工具,廣泛應(yīng)用于語(yǔ)音信號(hào)的分析、合成及各個(gè)應(yīng)用領(lǐng)域,以及用于輸入語(yǔ)音與參考樣本之間時(shí)間匹配的動(dòng)態(tài)規(guī)劃方法;80年代初一種新的基于聚類(lèi)分析的高效數(shù)據(jù)壓縮技術(shù)矢量量化(VQ)應(yīng)用于語(yǔ)音信號(hào)處理中;而用隱馬爾可夫模型(HMM)描述語(yǔ)音信號(hào)過(guò)程的產(chǎn)生是80年代語(yǔ)音信號(hào)處理技術(shù)的重大發(fā)展,目前HMM已構(gòu)成了現(xiàn)代語(yǔ)音識(shí)別研究的重要基石。近年來(lái)人工神經(jīng)網(wǎng)絡(luò)(ANN)的研究取得了迅速發(fā)展,語(yǔ)音信號(hào)處理的各項(xiàng)課題是促進(jìn)其發(fā)展的重要?jiǎng)恿χ?,同時(shí),它的許多成果也體現(xiàn)在有關(guān)語(yǔ)音信號(hào)處理的各項(xiàng)技術(shù)之中。1.3本課題的研究?jī)?nèi)容和方法1.

7、3.1 研究?jī)?nèi)容本論文主要介紹的是的語(yǔ)音信號(hào)的簡(jiǎn)單處理。本論文針對(duì)以上問(wèn)題,運(yùn)用數(shù)字信號(hào)學(xué)基本原理實(shí)現(xiàn)語(yǔ)音信號(hào)的處理,在matlab7.0環(huán)境下綜合運(yùn)用信號(hào)提取,幅頻變換以及傅里葉變換、濾波等技術(shù)來(lái)進(jìn)行語(yǔ)音信號(hào)處理。我所做的工作就是在matlab7.0軟件上編寫(xiě)一個(gè)處理語(yǔ)音信號(hào)的程序,能對(duì)語(yǔ)音信號(hào)進(jìn)行采集,并對(duì)其進(jìn)行各種處理,達(dá)到簡(jiǎn)單的語(yǔ)音信號(hào)處理的目的。1.3.2 運(yùn)行環(huán)境運(yùn)行環(huán)境主要介紹了硬件環(huán)境和軟件環(huán)境。硬件環(huán)境: 處理器:Inter Pentium 166 MX 或更高 內(nèi)存:512MB或更高 硬盤(pán)空間:40GB或更高 顯卡:SVGA顯示適配器軟件環(huán)境:操作系統(tǒng):Window 98/

8、ME/2000/XP1.3.3 開(kāi)發(fā)環(huán)境 開(kāi)發(fā)環(huán)境主要介紹了本系統(tǒng)采用的操作系統(tǒng)、開(kāi)發(fā)語(yǔ)言。(1) 操作系統(tǒng):Windows XP(2) 開(kāi)發(fā)環(huán)境:Matlab 7.02 語(yǔ)音信號(hào)處理的總體方案2.1 系統(tǒng)基本概述圖形用戶界面(Graphical User Interface,簡(jiǎn)稱 GUI,又稱圖形用戶接口)是指采用圖形方式顯示的計(jì)算機(jī)操作用戶界面。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對(duì)于用戶來(lái)說(shuō)在視覺(jué)上更易于接受。GUI的廣泛應(yīng)用是當(dāng)今計(jì)算機(jī)發(fā)展的重大成就之一,他極大地方便了非專業(yè)用戶的使用人們從此不再需要死記硬背大量的命令,取而代之的是可以通過(guò)窗口、菜單、按鍵等方式來(lái)方便地進(jìn)行操作。

9、2.2 系統(tǒng)基本要求本文是用Matlab對(duì)含噪的的語(yǔ)音信號(hào)同時(shí)在時(shí)域和頻域進(jìn)行濾波處理和分析,在MATLAB應(yīng)用軟件下設(shè)計(jì)一個(gè)簡(jiǎn)單易用的圖形用戶界面(GUI),來(lái)解決一般應(yīng)用條件下的各種語(yǔ)音信號(hào)的處理。2.3 系統(tǒng)框架及實(shí)現(xiàn)1) 語(yǔ)音信號(hào)的采集 使用電腦的聲卡設(shè)備采集一段語(yǔ)音信號(hào),并將其保存在電腦中。2) 語(yǔ)音信號(hào)的處理語(yǔ)音信號(hào)的處理主要包括信號(hào)的提取、信號(hào)的調(diào)整、信號(hào)的變換和濾波等。.語(yǔ)音信號(hào)的時(shí)域分析語(yǔ)音信號(hào)是一種非平穩(wěn)的時(shí)變信號(hào),它攜帶著各種信息。在語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別和語(yǔ)音增強(qiáng)等語(yǔ)音處理中無(wú)一例外需要提取語(yǔ)音中包含的各種信息。語(yǔ)音信號(hào)分析的目的就在與方便有效的提取并表示語(yǔ)音信號(hào)

10、所攜帶的信息。語(yǔ)音信號(hào)分析可以分為時(shí)域和變換域等處理方法,其中時(shí)域分析是最簡(jiǎn)單的方法,直接對(duì)語(yǔ)音信號(hào)的時(shí)域波形進(jìn)行分析,提取的特征參數(shù)主要有語(yǔ)音的短時(shí)能量,短時(shí)平均過(guò)零率,短時(shí)自相關(guān)函數(shù)等。 提?。和ㄟ^(guò)圖形用戶界面上的菜單功能按鍵采集電腦設(shè)備上的一段音頻信號(hào),完成音頻信號(hào)的頻率,幅度等信息的提取,并得到該語(yǔ)音信號(hào)的波形圖。 調(diào)整:在設(shè)計(jì)的用戶圖形界面下對(duì)輸入的音頻信號(hào)進(jìn)行各種變化,如變化幅度、改變頻率等操作,以實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的調(diào)整。.語(yǔ)音信號(hào)的頻域分析信號(hào)的傅立葉表示在信號(hào)的分析與處理中起著重要的作用。因?yàn)閷?duì)于線性系統(tǒng)來(lái)說(shuō),可以很方便地確定其對(duì)正弦或復(fù)指數(shù)和的響應(yīng),所以傅立葉分析方法能完善地解

11、決許多信號(hào)分析和處理問(wèn)題。另外,傅立葉表示使信號(hào)的某些特性變得更明顯,因此,它能更深入地說(shuō)明信號(hào)的各項(xiàng)紅物理現(xiàn)象。由于語(yǔ)音信號(hào)是隨著時(shí)間變化的,通常認(rèn)為,語(yǔ)音是一個(gè)受準(zhǔn)周期脈沖或隨機(jī)噪聲源激勵(lì)的線性系統(tǒng)的輸出。輸出頻譜是聲道系統(tǒng)頻率響應(yīng)與激勵(lì)源頻譜的乘積。聲道系統(tǒng)的頻率響應(yīng)及激勵(lì)源都是隨時(shí)間變化的,因此一般標(biāo)準(zhǔn)的傅立葉表示雖然適用于周期及平穩(wěn)隨機(jī)信號(hào)的表示,但不能直接用于語(yǔ)音信號(hào)。由于語(yǔ)音信號(hào)可以認(rèn)為在短時(shí)間內(nèi),近似不變,因而可以采用短時(shí)分析法。 變換:在用戶圖形界面下對(duì)采集的語(yǔ)音信號(hào)進(jìn)行Fourier等變換,并畫(huà)出變換前后的頻譜圖和變換后的倒譜圖。 濾波:濾除語(yǔ)音信號(hào)中的噪音部分,可采用低通

12、濾波、高通濾波、帶通濾波和帯阻濾波,并比較各種濾波后的效果。3)語(yǔ)音信號(hào)的效果顯示 通過(guò)用戶圖形界面的輸出功能,將處理后的信號(hào)的語(yǔ)音進(jìn)行播放,試聽(tīng)處理后的效果。2.4系統(tǒng)初步流程圖圖2.1列出了整個(gè)語(yǔ)音信號(hào)處理系統(tǒng)的工作流程:信號(hào)采集信息提取信號(hào)調(diào)整信號(hào)濾波信號(hào)變換效果顯示圖2.1 語(yǔ)音信號(hào)處理系統(tǒng)的工作流程其中信號(hào)調(diào)整包括信號(hào)的幅度和頻率的任意倍數(shù)變化。如下圖2.2圖2.2 信號(hào)調(diào)整信號(hào)調(diào)整幅度調(diào)整頻率調(diào)整信號(hào)的濾波采用了四種濾波方式,來(lái)觀察各種濾波性能的優(yōu)缺點(diǎn):信號(hào)濾波切比雪夫I型低通濾波橢圓數(shù)字帶通濾波切比雪夫型帶阻濾波切比雪夫型高通濾波圖2.3 語(yǔ)音信號(hào)濾波的方式在以上三圖中,可以看到

13、整個(gè)語(yǔ)音信號(hào)處理系統(tǒng)的流程大概分為三步,首先要讀入待處理的語(yǔ)音信號(hào),然后進(jìn)行語(yǔ)音信號(hào)的處理,包括信息的提取、幅度和頻率的變換以及語(yǔ)音信號(hào)的傅里葉變換、濾波等;濾波又包括低通濾波、高通濾波、帶通濾波和帶阻濾波等方式。最后對(duì)處理過(guò)的語(yǔ)音信號(hào)進(jìn)行處理后的效果顯示。以上是本系統(tǒng)的工作流程,本文將從語(yǔ)音信號(hào)的采集開(kāi)始做詳細(xì)介紹。3 語(yǔ)音信號(hào)處理基本知識(shí)3.1語(yǔ)音的錄入與打開(kāi)在MATLAB中,y,fs,bits=wavread('Blip',N1 N2);用于讀取語(yǔ)音,采樣值放在向量y中,fs表示采樣頻率(Hz),bits表示采樣位數(shù)。N1 N2表示讀取從N1點(diǎn)到N2點(diǎn)的值(若只有一個(gè)N的

14、點(diǎn)則表示讀取前N點(diǎn)的采樣值)。 sound(x,fs,bits); 用于對(duì)聲音的回放。向量y則就代表了一個(gè)信號(hào)(也即一個(gè)復(fù)雜的“函數(shù)表達(dá)式”)也就是說(shuō)可以像處理一個(gè)信號(hào)表達(dá)式一樣處理這個(gè)聲音信號(hào)。3.2采樣位數(shù)和采樣頻率采樣位數(shù)即采樣值或取樣值,用來(lái)衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)所使用數(shù)字聲音信號(hào)的二進(jìn)制位數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。采樣位數(shù)和采樣率對(duì)于音頻接口來(lái)說(shuō)是最為重要的兩個(gè)指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無(wú)論采樣頻率如何,理論上來(lái)說(shuō)采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相

15、當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕捉到的信號(hào)越精確。對(duì)于采樣率來(lái)說(shuō)你可以想象它類(lèi)似于一個(gè)照相機(jī),44.1kHz意味著音頻流進(jìn)入計(jì)算機(jī)時(shí)計(jì)算機(jī)每秒會(huì)對(duì)其拍照達(dá)441000次。顯然采樣率越高,計(jì)算機(jī)攝取的圖片越多,對(duì)于原始音頻的還原也越加精確。3.3時(shí)域信號(hào)的FFT分析FFT即為快速傅氏變換,是離散傅氏變換的快速算法,它是根據(jù)離散傅氏變換的奇、偶、虛、實(shí)等特性,對(duì)離散傅立葉變換的算法進(jìn)行改進(jìn)獲得的。在MATLAB的信號(hào)處理工具箱中函數(shù)FFT和IFFT用于快速傅立葉變換和逆變換。函數(shù)FFT用于序列快速傅立葉變換,其調(diào)用格式為y=fft(x),其中,x是序列,y是序列的FFT,x可以為一向量或

16、矩陣,若x為一向量,y是x的FFT且和x相同長(zhǎng)度;若x為一矩陣,則y是對(duì)矩陣的每一列向量進(jìn)行FFT。如果x長(zhǎng)度是2的冪次方,函數(shù)fft執(zhí)行高速基2FFT算法,否則fft執(zhí)行一種混合基的離散傅立葉變換算法,計(jì)算速度較慢。函數(shù)FFT的另一種調(diào)用格式為y=fft(x,N),式中,x,y意義同前,N為正整數(shù)。函數(shù)執(zhí)行N點(diǎn)的FFT,若x為向量且長(zhǎng)度小于N,則函數(shù)將x補(bǔ)零至長(zhǎng)度N;若向量x的長(zhǎng)度大于N,則函數(shù)截短x使之長(zhǎng)度為N;若x 為矩陣,按相同方法對(duì)x進(jìn)行處理。3.4數(shù)字濾波器設(shè)計(jì)原理數(shù)字濾波器的作用是利用離散時(shí)間系統(tǒng)的特性對(duì)輸入信號(hào)波形(或頻譜)進(jìn)行加工處理,或者說(shuō)利用數(shù)字方法按預(yù)定的要求對(duì)信號(hào)進(jìn)行

17、變換。數(shù)字濾波器可以理解為是一個(gè)計(jì)算程序或算法,將代表輸入信號(hào)的數(shù)字時(shí)間序列轉(zhuǎn)化為代表輸出信號(hào)的數(shù)字時(shí)間序列,并在轉(zhuǎn)化過(guò)程中,使信號(hào)按預(yù)定的形式變化。數(shù)字濾波器有多種分類(lèi),根據(jù)數(shù)字濾波器沖激響應(yīng)的時(shí)域特征,可將數(shù)字濾波器分為兩種,即無(wú)限長(zhǎng)沖激響應(yīng)(IIR)濾波器和有限長(zhǎng)沖激響應(yīng)(FIR)濾波器。從性能上來(lái)說(shuō),IIR濾波器傳輸函數(shù)的極點(diǎn)可位于單位圓內(nèi)的任何地方,因此可用較低的階數(shù)獲得高的選擇性,所用的存貯單元少,所以經(jīng)濟(jì)而效率高。但是這個(gè)高效率是以相位的非線性為代價(jià)的。選擇性越好,則相位非線性越嚴(yán)重。相反,F(xiàn)IR濾波器卻可以得到嚴(yán)格的線性相位,然而由于FIR濾波器傳輸函數(shù)的極點(diǎn)固定在原點(diǎn),所以只

18、能用較高的階數(shù)達(dá)到高的選擇性;對(duì)于同樣的濾波器設(shè)計(jì)指標(biāo),F(xiàn)IR濾波器所要求的階數(shù)可以比IIR濾波器高510倍,結(jié)果,成本較高,信號(hào)延時(shí)也較大;如果按相同的選擇性和相同的線性要求來(lái)說(shuō),則IIR濾波器就必須加全通網(wǎng)絡(luò)進(jìn)行相位較正,同樣要大增加濾波器的節(jié)數(shù)和復(fù)雜性。整體來(lái)看,IIR濾波器達(dá)到同樣效果階數(shù)少,延遲小,但是有穩(wěn)定性問(wèn)題,非線性相位;FIR濾波器沒(méi)有穩(wěn)定性問(wèn)題,線性相位,但階數(shù)多,延遲大。3.5倒譜的概念l 定義:倒譜定義為信號(hào)短時(shí)振幅譜的對(duì)數(shù)傅里葉反變換。l 特點(diǎn):具有可近似地分離并能提取出頻譜包絡(luò)信息和細(xì)微結(jié)構(gòu)信息的特點(diǎn)l 用途: 提取聲道特征信息:提取頻譜包絡(luò)特征,以此作為描述音韻的

19、特征參 數(shù)而應(yīng)用于語(yǔ)音識(shí)別。 提取音源信息:提取基音特征,以此作為描述音韻特征的輔助參數(shù)而應(yīng)用于語(yǔ)音識(shí)別。 求法:A:短時(shí)信號(hào);B:短時(shí)頻譜;C:對(duì)數(shù)頻譜; D:倒譜系數(shù);E:對(duì)數(shù)頻譜包絡(luò); F:基本周期4 語(yǔ)音信號(hào)處理實(shí)例分析4.1圖形用戶界面設(shè)計(jì)在MATLAB主窗口中,選擇File菜單中的New菜單項(xiàng),再選擇其中的GUI命令,就會(huì)顯示圖形用戶界面的設(shè)計(jì)模板。MATLAB為GUI設(shè)計(jì)一共準(zhǔn)備了4種模板,分別是Blank GUI(默認(rèn)) 、GUI with Uicontrols(帶控件對(duì)象的GUI模板) 、GUI with Axes and Menu(帶坐標(biāo)軸與菜單的GUI模板)與Modal

20、Question Dialog(帶模式問(wèn)話對(duì)話框的GUI模板)。設(shè)計(jì)語(yǔ)音信號(hào)處理系統(tǒng)的用戶圖形操作界面(GUI)SoundProcess,其中菜單主要包括File、Process和Output三大主要部分,其中File菜單包括輸入(Input)、保存(Save)和退出(Quit)等功能;Process菜單主要包括提?。‥xtract)、調(diào)整(Extract)、變換(Transform)和濾波(Filter)菜單,其中調(diào)整(Extract)包括幅度調(diào)整(Range)和頻率調(diào)整(Frequency),濾波(Filter)菜單包含低通濾波(LowpassFilter)、高通濾波(HighpassFi

21、lter)、帶通濾波(BandpassFilter)和帯阻濾波(BandstopFilter)等功能菜單。4.2信號(hào)的采集該系統(tǒng)是以一段簡(jiǎn)短的的語(yǔ)音信號(hào)做為分析樣本,通過(guò)計(jì)算機(jī)系統(tǒng)將一段“主人,信息收到了”的語(yǔ)音信號(hào)保存到到計(jì)算機(jī)中,并且保存格式為“*.wav”。4.3語(yǔ)音信號(hào)的處理設(shè)計(jì)4.3.1 語(yǔ)音信號(hào)的提取在Matlab中使用Wavread函數(shù),可得出信號(hào)的采樣頻率為22500,并且聲音是單聲道的。利用Sound函數(shù)可以清晰的聽(tīng)到“主人,信息收到了”的語(yǔ)音。采集數(shù)據(jù)并畫(huà)出波形圖。其中聲音的采樣頻率Fs=22050Hz,y為采樣 數(shù)據(jù),NBITS表示量化階數(shù)。部分程序如下: fn=inpu

22、t(' Enter WAV filename:','s'); %獲取一個(gè)*.wav的文件x,fs,nb=wavread(fn);ms2=floor(fs*0.002);ms10=floor(fs*0.01);ms20=floor(fs*0.02);ms30=floor(fs*0.03);t=(0:length(x)-1)/fs; %計(jì)算樣本時(shí)刻 subplot(2,1,1); %確定顯示位置plot(t,x); %畫(huà)波形圖legend('Waveform');xlabel( 'Time(s)');ylabel('Ampli

23、tude'); 運(yùn)行后彈出語(yǔ)音信號(hào)處理系統(tǒng)的操作界面如圖4.1:圖4.1語(yǔ)音信號(hào)處理系統(tǒng)的操作界面然后點(diǎn)擊File菜單中的子菜單Input,回到Matlab軟件的輸入界面如圖4.2:圖4.2輸入界面輸入要處理的語(yǔ)音信號(hào)的名稱,便可得到語(yǔ)音語(yǔ)音的波形圖如圖4.3: 圖4.3語(yǔ)音語(yǔ)音的波形圖 如圖中提取的語(yǔ)音的波形圖所示,整段音頻數(shù)據(jù)中得聲音高低起伏與錄入的聲音信號(hào)基本一致,并且可以觀察到其中包含部分高頻噪聲。4.3.2 語(yǔ)音信號(hào)的調(diào)整在語(yǔ)音信號(hào)的研究中,經(jīng)常會(huì)對(duì)語(yǔ)音信號(hào)進(jìn)行進(jìn)行多倍頻率以及多倍幅度變換調(diào)整,日常應(yīng)用中,這種變換調(diào)整也經(jīng)常要用到。所以在設(shè)計(jì)中也添加了這種功能,并能夠觀察調(diào)整

24、后的信號(hào)的波形圖得變化, 而且能通過(guò)語(yǔ)音處理界面的輸出功能試聽(tīng)處理后的語(yǔ)音信號(hào)。4.3.2.1 語(yǔ)音信號(hào)的頻率調(diào)整 在設(shè)計(jì)中,可以將語(yǔ)音信號(hào)的采樣頻率提高或降低,來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的調(diào)整,得到理想的語(yǔ)音信號(hào)。例如將采樣頻率提高一倍,即可得到語(yǔ)音信號(hào)頻率為原頻率2倍新的語(yǔ)音信號(hào)。運(yùn)行ProcessàAdjustàFrequency,得到如圖4.4的信號(hào)波形圖,并試聽(tīng)調(diào)整后的效果。圖4.4頻率調(diào)整后波形圖與原語(yǔ)音信號(hào)相比,經(jīng)過(guò)調(diào)整后的信號(hào)周期變?yōu)樵瓉?lái)的1/2,此時(shí)的語(yǔ)速明顯變快,即實(shí)現(xiàn)了信號(hào)的2倍頻功能。4.3.2.2語(yǔ)音信號(hào)的振幅調(diào)整在設(shè)計(jì)中,可以將語(yǔ)音信號(hào)的幅度進(jìn)行提高或降低操

25、作,來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的調(diào)整,得到聲音音量大小不同的語(yǔ)音信號(hào),例如將原語(yǔ)音信號(hào)的幅度提高一倍,得到如下圖4.5的信號(hào)波形圖,可以通過(guò)GUI操作界面的輸出功能試聽(tīng)調(diào)整后的效果。圖4.5 幅度調(diào)整后波形圖 此時(shí)聽(tīng)到的調(diào)整后聲音聲調(diào)變高,但不是很明顯,可以將幅度的變化值設(shè)置的比較大,那樣的話就可以得到效果相當(dāng)明顯的語(yǔ)音信號(hào)了。4.3.3 語(yǔ)音信號(hào)的傅里葉變換倒譜分析是指信號(hào)短時(shí)振幅譜的對(duì)數(shù)進(jìn)行傅里葉反變換。它具有可近似地分離并提取出頻譜包絡(luò)信息和細(xì)微結(jié)構(gòu)信息的特點(diǎn)。 對(duì)語(yǔ)音信號(hào)進(jìn)行頻譜分析,在Matlab中可以利用函數(shù)fft對(duì)信號(hào)行快速傅里葉變換,得到信號(hào)的頻譜圖,并進(jìn)行倒譜分析,得到倒譜圖。 傅里葉變

26、換的部分程序如下:x=y(44101:55050,1); %提取原語(yǔ)音信號(hào)的一部分t=(0:length(x)-1)/fs; %計(jì)算樣本時(shí)刻subplot(3,1,1); %確定顯示位置plot(t,x); %畫(huà)波形圖legend('波形圖');xlabel( 'Time(s)');ylabel('Amplitude');Y=fft(x,hamming(length(x); %做加窗傅里葉變換fm=5000*length(Y)/fs; %限定頻率范圍f=(0:fm)*fs/length(Y); %確定頻率刻度subplot(3,1,2);plot

27、(f,20*log10(abs(Y(1:length(f)+eps);legend('頻譜圖'); %畫(huà)頻譜圖ylabel('幅度(db)');xlabel('頻率(Hz)');c=fft(log(abs(x)+eps); %倒頻譜計(jì)算ms1=fs/1000;ms20=fs/50q=(ms1:ms20)/fs; %確定倒頻刻度subplot(3,1,3);plot(q,abs(c(ms1:ms20); %畫(huà)倒譜圖legend('倒譜圖');xlabel('倒頻(s)');ylabel('倒頻譜幅度(Hz)&

28、#39;);運(yùn)行Processà Transform,對(duì)語(yǔ)音信號(hào)的一部分進(jìn)行傅里葉變換,并進(jìn)行倒譜分析,得到如圖4.6圖4.6 聲音樣本波形圖、頻譜圖和倒譜圖從上面的倒譜圖可以看出當(dāng)讀“主人,信息收到了”時(shí),所對(duì)應(yīng)的頻率大概在200Hz左右。這與人的語(yǔ)音信號(hào)頻率集中在200 Hz到4.5 kHz之間是相一致的。而在未發(fā)聲的時(shí)間段內(nèi),相對(duì)的小高頻部分(200500Hz)應(yīng)該屬于背景噪聲。4.3.4 語(yǔ)音信號(hào)的濾波 從圖4.4中發(fā)現(xiàn),語(yǔ)音信號(hào)中包含背景噪聲,這些噪聲的頻率一般較高。所以可以利用MATLAB軟件中的濾波器進(jìn)行濾波處理,得到較為理想的語(yǔ)音信號(hào)。4.3.4.1 語(yǔ)音信號(hào)的低通濾

29、波 系統(tǒng)中設(shè)計(jì)了一個(gè)截止頻率為200Hz切比雪夫I型低通濾波器,它的幅頻特性如下圖4.7:圖4.7 低通濾波器的幅頻特性低通濾波器性能指標(biāo): wp=0075pi,ws =0125pi,Rp=025;As =50dB;經(jīng)過(guò)低通濾波器處理后,比較處理前后的波形圖的變化,如下圖4.8:圖4.8 低通濾波后波形和頻譜的變化低通濾波后,聲音稍微有些發(fā)悶、低沉,原因是高頻分量被低通濾波器衰減。但是很接近原來(lái)的聲音。4.3.4.2 語(yǔ)音信號(hào)的高通濾波運(yùn)用切比雪夫型數(shù)字高通濾波器,對(duì)語(yǔ)音信號(hào)進(jìn)行濾波處理。高通濾波器性能指標(biāo): wp=0375pi,ws =0425pi,Rp=025;As =50dB;然后將其與

30、原信號(hào)的比較圖如下圖4.9:圖4.9高通濾波后波形和頻譜的變化高通濾波后,此時(shí)只有少許雜音,原因是低頻分量被高通濾波器衰減,而人聲部分正好是低頻部分,所以只剩下雜音,或者發(fā)出高頻雜音但人的耳朵聽(tīng)不到。4.3.4.3 語(yǔ)音信號(hào)的帶通濾波運(yùn)用橢圓數(shù)字帶通濾波器函數(shù),對(duì)語(yǔ)音信號(hào)進(jìn)行濾波處理后其與原信號(hào)的比較圖如下圖4.10:圖4.10帶通濾波后波形和頻譜的變化4.3.4.4 語(yǔ)音信號(hào)的帶阻濾波運(yùn)用切比雪夫型數(shù)字帶阻濾波器,對(duì)語(yǔ)音信號(hào)進(jìn)行濾波處理后其與原信號(hào)的比較圖如下圖3.11:圖4.11帯阻濾波后波形和頻譜的變化從以上各種數(shù)字濾波器經(jīng)過(guò)濾波后得出的語(yǔ)音信號(hào)相比較,低通濾波后,聲音稍微有些發(fā)悶,但是

31、很接近原來(lái)的聲音;高通濾波后聽(tīng)不到人的聲音;帶通濾波后聲音有點(diǎn)像機(jī)器人小叮當(dāng)發(fā)出的聲音。帶阻濾波后,聲音比較接近原來(lái)的聲音。從頻譜圖中我們可以看出聲音的能量主要集中在低頻(0.2pi即22045Hz以內(nèi))部分。4.4 語(yǔ)音信號(hào)的輸出 可以將處理后的語(yǔ)音信號(hào)在Matlab軟件先播放,體驗(yàn)處理后的語(yǔ)音信號(hào)的效果。還可以將處理后的語(yǔ)音信號(hào)保存在電腦上。運(yùn)行FileàSave,保存處理后的語(yǔ)音信號(hào)。如果沒(méi)有語(yǔ)音信號(hào)被處理,則系統(tǒng)會(huì)出現(xiàn)提示如下圖4.12:圖4.12 保存提示界面如果有語(yǔ)音信號(hào)被處理,運(yùn)行FileàSave,系統(tǒng)會(huì)出現(xiàn)提示如下圖4.13:圖4.13 保存界面保存后,整個(gè)操作過(guò)程就完成了。5 總結(jié)本文對(duì)語(yǔ)音信號(hào)處理系統(tǒng)的設(shè)計(jì)作了詳細(xì)的介紹,采用一系列圖像分析和處理技術(shù),實(shí)現(xiàn)了語(yǔ)音信號(hào)的基本處理的功能,經(jīng)過(guò)測(cè)試運(yùn)行,本設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論