




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 基于matlab的語音信號特征提取系統(tǒng)的設(shè)計 董梅廖云霞劉海山吳鵬摘要:語音識別是處理語音信號的重要問題,當(dāng)今社會,人工智能技術(shù)發(fā)展迅速,語音識別技術(shù)已經(jīng)發(fā)展成為行業(yè)領(lǐng)域前列的先進(jìn)技術(shù)。在以后的發(fā)展過程語音識別技術(shù)仍將發(fā)揮重大作用。語音信號是一種冗余度較高的非平穩(wěn)隨機(jī)信號,只有在短時間內(nèi)才認(rèn)為變化時緩慢的,在這個短的時間區(qū)間內(nèi)語音信號特征保持穩(wěn)定。因此,本課題將對語音信號特征利用lpc技術(shù)和mfcc原理進(jìn)行提取,利用matlab gui界面設(shè)計系統(tǒng),使之能在行業(yè)領(lǐng)域發(fā)展,同時驗證理論知識。關(guān)鍵詞:語音信號;語音識別;lpc算法;mfcc算法
2、;matlab gui:tp368.1 :a :1009-3044(2018)20-0271-04design of speech signal feature extraction system based on speech matlabdong mei, liao yun-xia, liu hai-shan, wu peng(college of information science and technology, gansu agricultural university, lanzhou 730070, china)abstract: speech recognition is a
3、n important problem in dealing with speech signal. nowadays, artificial intelligence technology has developed rapidly, and speech recognition technology has developed into the advanced technology in the field of industry. speech recognition technology will still play an important role in the future
4、development process. speech signal is a kind of non-stationary random signal with high redundancy. it is considered that the change is slow in a short period of time, and the feature of speech signal remains stable in this short time range. therefore, this subject will use lpc technology and mfcc pr
5、inciple to extract the feature of speech signal, and use matlab gui interface design system to make it in the industry. development in the field , while validating the theoretical knowledge.key words: speech signal; speech recognition; lpc algorithm; mfcc algorithm; matlab gui1 引言語言是人類信息交流的主要工具,在人類的
6、生活中,語音信號無處不在語音信號特征的提取與保存對人類來說是一個巨大的進(jìn)步。語音信號是一種冗余度較高的非平穩(wěn)隨機(jī)信號,只有在短時間內(nèi)才認(rèn)為變化時緩慢的,在這個短的時間區(qū)間內(nèi)語音信號特征保持穩(wěn)定。1正常情況下,我們?nèi)说亩淇梢越邮艿赖乱纛l頻率范圍最大不超過20khz,最低不低于60hz,一般人正常范圍在300hz4khz2。從本質(zhì)上來說,語音是一種模擬信號,在分析和處理的過程中,我們常常需要把模擬信號轉(zhuǎn)換為數(shù)字信號3。這樣做的好處是因為數(shù)字語音信號的采集和處理方式比模擬信號更加靈活方便。語音信號的短時平穩(wěn)性和間歇性等這些重要特性4,為了更加直觀科學(xué)的認(rèn)識語音信號的波形和頻譜,我們可以對語音信號的
7、特征參數(shù)進(jìn)行客觀分析,同時可以觀察頻譜波形。如果我們需要較為精確的估計語音參數(shù),我們應(yīng)該充分利用線性預(yù)測編碼技術(shù)(lpc)。在語音信號中,預(yù)測系數(shù)是非常重要的信息來源,基于人耳聽覺模型的語音特征參數(shù)是倒譜,在語音系統(tǒng)和說話人識別系統(tǒng)中,基于聽覺特性的美爾倒譜系數(shù)(mfcc)是重要參數(shù)之一,現(xiàn)在被廣泛采用5。信息技術(shù)飛速發(fā)展,語音識別技術(shù)在各個領(lǐng)域滲透于人類社會生活中,而在未來的發(fā)展中,語音識別系統(tǒng)的作用將被更大化地發(fā)揮出來。在建立語音識別系統(tǒng)的過程中,語音信號特征提取將顯得尤為重要6。本文主要介紹如何利用matlab gui界面實(shí)現(xiàn)語音信號特征提取。2 語音信號的典型特征和分析技術(shù)語音信號處理
8、的兩種典型方式是波形顯示和參數(shù)顯示。波形顯示可以直觀的認(rèn)識語音信號;而參數(shù)顯示則可對語音信號進(jìn)行深入分析以及匹配語音識別系統(tǒng)和說話人識別的特征。2.1 lpc算法原理7lpc是線性預(yù)測編碼(linear predictive coding,lpc)的縮寫,是常用的且很重要的一種編碼方法。從原理上來看,通過分析話音波形來產(chǎn)生聲道激勵和轉(zhuǎn)移函數(shù)的參數(shù)是lpc,實(shí)際上是把對聲音波形的編碼轉(zhuǎn)化成了對這些參數(shù)的編碼,從而使聲音的數(shù)據(jù)量大大地減少。使用lpc分析在接收端得到的參數(shù),將話音通過話音合成器重構(gòu)。實(shí)際上,合成器是一個離散的時變線性濾波器,隨著時間逐漸變化,代表著人的話音生成系統(tǒng)模型。時變線性濾波
9、器不僅可以當(dāng)作預(yù)測器使用,也可以當(dāng)作合成器使用。但在分析話音波形時,我們主要還是將它當(dāng)作預(yù)測器使用,而在合成話音的時候,我們就將它當(dāng)作話音生成模型使用。模型的參數(shù)和激勵條件可以隨著話音波形的變化,周期性地適合新的需要。2.2 mfcc算法原理8mfcc(mel倒譜系數(shù))很形象地模擬了人的聽覺特性,是一種符合人類聽覺特性的語音特征參數(shù)。在對語音信號的預(yù)處理之后,我們將提取語音信號的特征參數(shù),一般情況下,我們將語音信號的特征參數(shù)分為兩類:第一類是時域特征參數(shù),通常情況下,一幀語音信號中的各個時域采樣將直接構(gòu)成一個參數(shù)矢量,第二類是變化域特征參數(shù) , 目前,最常用的特征參數(shù)是為頻域。3軟件總體設(shè)計m
10、atlab gui 9是一種圖形用戶界面,它是由各種圖形對象(如圖像窗口、圖軸、菜單、按鈕、文本框)等構(gòu)建的,為人機(jī)交流信息提供工具和方法.它有兩個方便操作的優(yōu)點(diǎn),不僅可以把已有的仿真程序潛入進(jìn)去,而且可以以人機(jī)交互的動態(tài)方式把仿真后的圖形化結(jié)果直觀呈現(xiàn),使用者只需要知道操作的步驟,不需要知道代碼的具體內(nèi)容,就可以非常方便的操作界面了。10在設(shè)計matlab gui界面的時候,我們可以有兩種方法:第一種是通過編寫m文件,直接可以開發(fā)gui;第二種是通過利用matlab 圖形用戶界面開發(fā)環(huán)境guide 來形成相應(yīng)m文件.在guide界面中,分為菜單欄和工具欄、用戶控件集、用戶界面編輯窗口等3個部
11、分,它向用戶提供了一個高度有效的集成開發(fā)環(huán)境。3.1 系統(tǒng)界面的規(guī)劃要使得該系統(tǒng)能實(shí)現(xiàn)對語音信號的波形和典型參數(shù)特征的實(shí)時顯示,我們將以下面圖3的原理框圖為主,設(shè)計規(guī)劃我們的gui界面:系統(tǒng)功能的主要模塊主要有四部分:時域波形、頻譜分析、倒譜分析、功率譜分析等四個模塊。我們將分別以屏幕、文件以及提示等進(jìn)行顯示或保存系統(tǒng)理操作的結(jié)果,同時我們將提供統(tǒng)一的輸入輸出操作接口, 而不同算法計算的結(jié)果可在不同目錄下進(jìn)行保存.該系統(tǒng)的界面模塊將以下圖所示框圖為主來設(shè)計,如圖3:3.2系統(tǒng)的界面設(shè)計各界面的設(shè)計主要采用了靜態(tài)文本框、列表框、可編輯文本框、觸控鈕、面板和坐標(biāo)軸等控件來實(shí)現(xiàn)一些功能。各個控件的功
12、能通過編寫其相應(yīng)的回調(diào)函數(shù)11來實(shí)現(xiàn)。3.2.1系統(tǒng)的開始界面開始界面是軟件開始運(yùn)行時的主要界面,也是進(jìn)入語音信號特征提取系統(tǒng)8的各個子界面的接口,具有提示用戶操作的作用,主要按鈕是進(jìn)入系統(tǒng)。如下圖所示:3.2.2 系統(tǒng)的子界面在系統(tǒng)的子界面中,我們將對語音進(jìn)行信號特征提取,在子界面下,有四個主要按鈕(時域波形、頻譜分析、倒譜分析、功率譜分析);以及四個屬性菜單欄(打開、數(shù)據(jù)分析與處理、結(jié)果圖像保存、幫助)。如下圖所示:3.2.3 語音信號特征提取的具體步驟及分析1)maltab對語音信號的提取當(dāng)我們進(jìn)入到系統(tǒng)界面的時候,我們首先要調(diào)取一段音頻,所以,在調(diào)取音頻之前,我們要將系統(tǒng)界面進(jìn)行初始化
13、,然后點(diǎn)擊菜單欄下的調(diào)取音頻按鈕,調(diào)取一段文件大小小于8k的音頻文件,調(diào)取的音頻文件格式必須為*wav格式的12。我們可以利用wavread函數(shù)對語音信號進(jìn)行采樣,然后直接設(shè)置采樣頻率和采樣點(diǎn)數(shù)。matlab程序源代碼如下所示:filename,pathname= uigetfile('*.wav'); %打開對話框if isequal(filename, 0) % open(file);y, fs=audioread(pathname filename);%x是音頻的數(shù)據(jù)向量,fs是采樣頻率(單位hz),bits是每一個采樣點(diǎn)的數(shù)據(jù)深度(即比特數(shù))endhandles.dat
14、a=y; %x是向量含有的所有數(shù)字的個數(shù),與數(shù)據(jù)的大小有關(guān)handles.sample=fs; %采樣的頻率 一般為8kt=length(handles.data)/fs; %采樣的總時間tt=0:t/length(handles.data):t; %中間計算出來的采樣周期handles.t=tt(1:length(tt)-1); %作為要顯示圖形的橫坐標(biāo)guidata(hobject, handles); %保存更新axes(handles.axes1); %打開的文件顯示在第二個里plot(handles.t,y);ylabel('signal magnitude ');x
15、label('time(s)');title('時域波形');2)語音信號特征波形分析與結(jié)果顯示語音信號特征提取系統(tǒng)在各個子模塊間的內(nèi)容和分析過程有不同,但其主要的設(shè)計思想理念是一樣的。下面將對語音的信號特征逐一展開論述:(1)頻譜分析將時域信號變換至頻域加以分析的方法稱為頻譜分析13。頻譜分析的目的是把復(fù)雜的時間歷程波形,通過傅里葉變換,將其分解為若干單一的諧波分量來進(jìn)行研究,從而獲得信號的頻率結(jié)構(gòu)以及各諧波和相位信息。對于模擬信號來說,進(jìn)行頻譜分析時,首先,我們要對其進(jìn)行抽樣,使其離散化,然后我們可以利用離散傅里葉變換(dft)或者快速傅里葉變換(fft),
16、分析其幅度(abs)和相位(angle)的圖像,而對于數(shù)字信號來說,我們則可直接利用離散傅里葉變換或快速傅里葉變換進(jìn)行分析。其matlab源程序代碼如下:fs=handles.sample;fs=100;n=256; %采樣頻率和數(shù)據(jù)點(diǎn)數(shù)n=0:n-1;t=n/fs; %時間序列x=0.5*sin(2*pi*15*t)+2*sin(2*pi*40*t); %信號y=fft(x,n); %對信號進(jìn)行快速fourier變換mag=abs(y); %求得fourier變換后的振幅f=n*fs/n; %頻率序列plot(f,mag); %繪出隨頻率變化的振幅xlabel('頻率/hz'
17、);ylabel('振幅');title('n=128');grid on;顯示結(jié)果如下:(2) 倒譜分析倒譜參數(shù)是重要的語音特征參數(shù),它是對語音進(jìn)行同態(tài)處理的產(chǎn)物,同態(tài)處理也稱為同態(tài)濾波,實(shí)現(xiàn)將卷積關(guān)系變換為求和關(guān)系的分離處理,即解卷。對于語音信號進(jìn)行解卷,可將語音信號的聲門激勵信息及聲道響應(yīng)信息分離開來,從而求得聲道共振特性和基音周期,用于語音編碼、合成和識別。其matlab源程序代碼如下:c=fft(log(abs(handles.data)+eps); % ×ms1=handles.sample/1000;ms20=handles.sample
18、/50;q=(ms1:ms20)/handles.sample;axes(handles.axes1);plot(q,abs(c(ms1:ms20);xlabel('倒角');ylabel('倒譜幅度');title('倒譜圖');其結(jié)果顯示如下:(3)功率譜分析功率譜是數(shù)字信號處理的主要內(nèi)容之一,主要研究在頻域中,信號的各種特征,這樣做的目的是使被淹沒在噪聲中的有用信號根據(jù)有限數(shù)據(jù)在頻域內(nèi)將其進(jìn)行提取14。離散的非周期序列xn可以用周期性連續(xù)信號x(t)的頻譜表示,它的幅度頻譜的平方xn2所排成的序列,所以被稱之為該周期信號的“功率譜”。其ma
19、tlab源程序代碼如下:fs=handles.sample; %ùn=1024;fs=randn(1,n);pxx=10*log10(abs(fft(fs).2)/n);f=(0:length(pxx)-1)/length(pxx);axes(handles.axes1);plot(f,pxx);xlabel('頻率');ylabel('功率(db)');title('周期圖法n=256')grid on;結(jié)果顯示如下:4 結(jié)語本文較為簡單的闡述了語音信號特征提取的過程以及系統(tǒng)設(shè)計的原理?;趍atlab gui技術(shù),較為直觀地完成了語
20、音信號特征提取系統(tǒng)的界面設(shè)計和算法設(shè)計,通過系統(tǒng)界面,用戶可以直接上傳和試聽在語音庫中的音頻,然后通過調(diào)取,提取參數(shù),顯示其音頻的波形。matlab gui界面簡單直觀,良好的人機(jī)交互功能使操作方便可行。通過該界面可以非常方便地分析語音信號的典型特征,提取語音信號的相關(guān)參數(shù)和信號特征,驗證理論知識。參考文獻(xiàn):1 孫尚宏,白珍.matlab的語音信號頻譜分析j.河套學(xué)院學(xué)報,2016,13(01):72-75.2王光艷,趙曉群,王霞.基于matlab gui的語音信號特征提取系統(tǒng)設(shè)計j.河北工業(yè)大學(xué)學(xué)報,2010,39(04):14-18.3 李靜.基于matlab的語音信號采集和處理系統(tǒng)的設(shè)計j.山西大同大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 代理買社保合同范本
- 亞克力盒制作合同范本
- 勞務(wù)合同范本無固定
- 公寓購買講價合同范本
- 醫(yī)院物業(yè)采購合同范本
- 加梯安裝合同范本
- 公司做假雇傭合同范本
- 公司與政府合同范本
- 企業(yè)合同范本牛廠
- 交定金認(rèn)購合同范本
- 官兵成長規(guī)劃方案
- 2024年湘中幼兒師范高等??茖W(xué)校高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 設(shè)備使用手冊(范例模板)
- 上海房屋修繕工程培訓(xùn)課件
- 醫(yī)院電梯安全操作培訓(xùn)記錄
- 《讀懂財務(wù)報表》課件
- 《瘋狂動物城》全本臺詞中英文對照
- 建筑施工安全管理及揚(yáng)塵治理檢查投標(biāo)方案(技術(shù)方案)
- 六年級毛筆書法教案(下冊)
- 秘魯農(nóng)村公路
- 五年級下冊勞動全冊教案人教版貴州人民出版社
評論
0/150
提交評論