




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基于16位單片機的語音電子門鎖系統(tǒng)摘要:生物識別技術是利用人體生物特征進行身份認證的一種技術,是目前公認的最為方便與安全的識別技術。由于每個人的生物特征具有與其他人不同的唯一和在一定時期內不變的穩(wěn)定性,不易偽造和假冒,所以利用牲識別和技術進行身份認證,安全、準確、可靠。本設計介紹采用聲紋識別技術、在凌陽SPCE061A單片機上實現(xiàn)的一種語音電子門鎖身份認證系統(tǒng)。實驗結果表明,系統(tǒng)性能穩(wěn)定,識別效果好,可以推廣使用。關鍵詞: 聲紋識別 ; 基于周期 ;線性預測 ;模式匹配 ; DTW Abstract:The biological recognition technology is carrie
2、s on the status authentication using the human body biological features one kind of technology, is the present recognition most convenient and the safe recognition technology. Because each person's biological features have with other people different only and withing certain amount of time the i
3、nvariable stability, not easy forge and counterfeit, therefore carries on the status authentication using the domestic animal recognition and the technology, the security, is accurate, is reliable. This design introduction uses the voice print recognition technology, one kind of pronunciation electr
4、onic lock status authentication system which monolithic integrated circuit realizes in Ling Yang on the SPCE061A. The experimental result indicated that the system performance is stable, the recognition effect is good, may promote the use. Key word :voice print recognition based o diction patte
5、rn matching DT目 錄序 言11.1 原理圖的功能說明21.2 總體框圖及其功能分析41.2.1 預處理4特征參數(shù)的選取41.2.4 基音參數(shù)的提取61.3 模式匹配72 SPCE061A特性及功能簡介92.1 SPCE061A的性能92.2 芯片的引腳排列和說明102.3 特性103 硬件系統(tǒng)123.1 說話人識別模塊各組成部分完成的功能13按鍵輸入13語音信號采集143.1.3 FLASH存儲擴展153.1.4 揚聲器輸出173.1.5 控制輸出183.1.6 LCD模組18說話人識別模塊有三種工作模式193.3 試驗結果204 系統(tǒng)軟件設計22軟件介紹22語音識別
6、的主程序22結束語23參考文獻24附錄25序 言生物識別技術是利用人體生物特征進行身份認證的一種技術,是目前公認的最為方便與安全的識別技術。由于每個人的生物特征具有與其他人不同的唯一和在一定時期內不變的穩(wěn)定性,不易偽造和假冒,所以利用牲識別和技術進行身份認證,安全、準確、可靠。在生物識別領域中,聲紋識別,也稱為說話人識別,以其獨特的方便性、經濟性和準確性等優(yōu)勢受到世人矚目,并且益成為人們日常生活和工作中重要且普遍的安全認證方式。聲紋識別是一種根據說話人語音波形中反映說話人生理和行為特征的語音參數(shù),自動識別說明人身份的技術。聲紋識技術可分為兩類,即說話人辨認和說話人確認。前者用以判斷某段語音是若
7、干人中的哪一個所說的,是多選一的問題;而后者用以確認某段語音是若干人中的哪一個所說的,是多選一的問題;而后者用以確認某段語音是否是指定的某個人所說的,是一對一判別的問題。從另一方面,聲紋識別又有與文本有關和與文本無關兩種,根據特定的任務和應用,應用范圍不同。與文本有關的聲紋識別系統(tǒng)要求用戶按照規(guī)定的內容發(fā)音,每個人的聲紋模型逐個被精確地建立,而識別時也必須按規(guī)定的內容發(fā)音,因此可以達到較好的識別效果;而與文本無關的識別系統(tǒng)則不規(guī)定說話人的發(fā)音內容,模型建立相對困難,但用戶使用方便,應用范圍較寬。本文介紹的語音電子門鎖是一種在凌陽16位單片機SPCE061A上實現(xiàn)的與文本有關的說話人確認系統(tǒng)。該
8、系統(tǒng)主要由說話人識別模塊、門鎖控制電機以及門鎖等部分組成。在訓練時,說話人的聲音通過麥克風進入說話人語音信號采集前端電路,由語音信號處理電路對采集的語音信號進行特征化和語音處理,提取說話人的個性特征參數(shù)并進行存儲,形成說話人特征參數(shù)數(shù)據庫。在識別時,將待識別語音與說話人特征參數(shù)數(shù)據庫進行匹配,通過輸出電路控制門鎖電機,最終實現(xiàn)對門鎖的控制。1 總體原理圖及框圖1.1 原理圖的功能說明操作分為兩大部分,首先必須將字句錄入,第二步操作才是識別模式,此外,操作中AP7003-01能夠判斷是否有信號輸入,這一切均按內部程序或是特定編碼選擇所決定。在你需做識別操作時,目標的字句必須已存入內部存12個存貯
9、區(qū),存貯12個不同字句的特征。每個存貯區(qū)可以存放長達1.5秒的字句。你可以用鍵盤來選擇存貯區(qū)或用適當?shù)拿羁刂?,將字句錄入??捎猛獠康柠溈孙L或其它媒體輸入語音或字句內容,經過內部麥克風放大器準確放大之后,語音信號被內容的A/D轉換器數(shù)字化。內部聲效處理器將處理數(shù)字化后的語音及將字句里的特征進行抽樣。當被識別的目標字句,錄入之后,你現(xiàn)在可以開識別操作,進入內部字句識別操作模式,輸入的語音被聲音處理器特征抽樣,同存貯在內部的目標字句的抽樣特征進行比較,必須是剛好同所選擇的識別的目標字匹配。結果才輸入信號至PA口或其它輸出端。 在一定時間內,無操作時,會將電源關閉以節(jié)省損耗,后可用按鍵喚醒。腳位參數(shù)
10、:Pin name Description GNDD 數(shù)字地 LED1 低電平存放LED驅動腳,能設計成語音輸入指示,適合于標準應用 LED2 低電平存放LED驅動腳,在標準應用線路中,設計成語音輸入驗證結果的標志 POB1POB4 輸出口,作為鍵盤掃描用,標準應用 PIT1PIT4 低電平有效輸入口,內部有上拉電阻,能設計成輸入口或鍵盤的輸入標準應用 VDDD 數(shù)字電源VDD CAPV 去藕合電容,必須接電容在此引腳 到地之間,用于內部的電壓基準器 OSCI 頻率振蕩器,控制腳,接一個56K電阻到地 PIM1PIM2 普通輸入腳,能設計成模式控制輸入,用于標準電路 TEST 測試引腳,用于生
11、產測試 POSL 輸出模式選擇,用于輸出A口,若ProtA是高有效,則以POSL接高;若低電平有效則接地 GNDA 模擬地 TREF 語音輸入門檻電壓控制 A2OUT 輸出第二放大器 AIIN 第一(前級)放大器反相輸入 A1OUT 前級放大輸出 MICP 麥克風的正電源供給腳 VDDA 模擬電路正電源 POA1POA12 輸出口 PORES 高電平有效輸入,清除輸出口A狀態(tài),單片語音識別電路HL7003-02 電路圖如圖以11所示。圖11 語音識別的總體電路圖操作方法: 1、通電后,先按鍵,LED1和POA1(LED3)同時亮,此時立刻對著話筒發(fā)話(語音長度不超過1.5秒),POA1滅,LE
12、D1亮,再對著話筒進行“學習”,LED2、POA1同時亮,表示“學習”成功。接著再按鍵,LED1、POA2同時亮,.。依此類推,直至112鍵全部學習完畢。也可以對某一鍵或某幾個鍵進行無序輸入和學習。 2、學習完畢,即可進行語音識別操作,12路輸出可分別控制不同的電器(或動作),12路語音識別可任意操作,即喊一句便控制一種電器的開或關。第11鍵為輸出轉換鍵,每轉換控制一種電器都需按一下該鍵。 3、若需清除“學習”內容,應按清除鍵“C”,再次輸入時,須重新按照第1步方法進行“學習”。 4、PIM1接“1”(高電平),為12鍵模式, PIM1接“0”(低電平),為8鍵模式,應用電路見圖11。POSL
13、接“0”,POA1POA12輸出為低電平,POSL接“1”,POA1POA12輸出為高電平。1.2 總體框圖及其功能分析16位單片機語音電子門鎖的總體框圖如圖12所示:識別結果模式匹配參考模板 訓練 參數(shù)修正去噪端點檢測特征提取語音輸入 輸出 識別預處理 圖12 語音電子門鎖的總體框圖 預處理信號對麥克風輸入的模擬語音信號進行量化和采樣,獲得數(shù)字化的語音信號;再將含噪的語音信號通過去噪處理,得到干凈的語音信號后并通過預加重技術濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,提升語音信號的高頻部分,而且它還可以起到消除直流漂移、抑制隨機噪聲和提升清音部分能量的作用。(2)端點檢測 本系統(tǒng)采用語
14、音信號的短時能量和短時過零率進行端點檢測。語音信號的采樣頻率為8kHz,每幀數(shù)據為20ms,共計160個采樣點。每隔20ms計算一次短時能量和短時過零率。通過對語音信號的短時能量和短時過零率檢測可以剔除掉靜默幀、白噪聲幀和清音幀,最后保留對求取基音、LPCC等特征參數(shù)非常有用的濁音在語音信號預處理后,接著是特征參數(shù)的提取。特征提取的任務就是提取語音信號中表征人的基本特征。特征參數(shù)的選取識別性特征必須能夠有效地區(qū)分不同的說話人,且對同一說話人的變化保持相對穩(wěn)定,同時要求特征參數(shù)計算簡便,最好有高效快速算法,以保證識別的實時性。說話人特征大體可歸為下述幾類: (1)基于發(fā)聲器官如聲門、聲道和鼻腔的
15、生理結構而提取的參數(shù)。如譜包絡、基音、共振峰等。其中基音能夠很好地刻畫說話人的聲帶特征,在很大程度上反映了人的個性特征。 (2)基于聲道特征模型,通過線性預測分析得到的參數(shù)。包括線性預測系數(shù)(LPC)以及由線性預測導出的各種參數(shù),如線性預測倒譜系數(shù)(LPCC)、部分相關系數(shù)、反射系數(shù)、對數(shù)面積比、LSP線譜對、線性預測殘差等。根據前人的工作成果和實際測試比較,LPCC參數(shù)不但能較好地反饋聲道的共振峰特性,具有較好地識別效果,而且可以用比較簡單的運算和較快的速度求得。 (3)基于人耳的聽覺機理,反映聽覺特性,模擬人耳對聲音頻率感知的特征參數(shù)。如美國爾倒譜系數(shù)(MFCC)等。MFCC參數(shù)與基于線性
16、預測的倒譜分析相比,突出的優(yōu)點是不依賴全極點語音產生模型的假定,在與廣西無關的說話人識別系統(tǒng)中MFCC參數(shù)能夠比LPCC參數(shù)更好地提高系統(tǒng)的能。此外,人們還通過對不同特征參數(shù)量的組合來提高實際系統(tǒng)的性能。當各組合參量間相關性不大時,會有較好的效果,因為它們分別反映了語音信號的不同特征。在計算機平臺的仿真實驗中,通過各種參數(shù)的實際比較,采用MFCC參數(shù)比采用LPCC參數(shù)有更好的識別效果。但在SPCE061A平臺上做實時處理時,與LPCC系統(tǒng)相比,MFCC系數(shù)計算有兩個缺點:一是計算時間長;二是精度難以保證。由于MFCC系統(tǒng)的計算需要FFT變換和對數(shù)操作,影響了計算的動態(tài)范圍;要保證系統(tǒng)識別的實時
17、性,就只有犧牲參數(shù)精度。而LPCC參數(shù)的計算有遞推公式,速度和精度都可以保證,識別效果也滿足實際需要。本系統(tǒng)采用了基音周期和線性預測倒譜系數(shù)(LPCC)共同作為說話人識別的特征參數(shù)。 LPCC參數(shù)的提取基于線性預測分析的倒譜參數(shù)LPCC可以通過簡單的遞推公式由線性預測系數(shù)求得。遞推公式如1-1所示: 11 (1)LPC模型階數(shù)p的確定為使模型假定更好地符合語音產生模型,應該使LPC模型的階數(shù)p與共振峰個數(shù)相吻合,其次是考慮聲門脈沖形狀和口唇輻射影響的補償。通常一對極點對應一個共振峰,10kHz采樣的語音信號通常有5個共振峰,取p=10,對于8kHz采樣的語音信號可取p=8。此外為了彌補鼻音中存
18、在的零點以及其他因素引起的偏差,通常在上述階數(shù)的基礎上再增加兩個極點,即分別是p=12和p10。實驗表明,選擇LPC分析階數(shù)p=12,對絕大多數(shù)語音信號的聲道模型可以足夠近似地逼近。P值選得過大雖然可以略微改善逼近效果,但也帶來一些負作用,一方面是加大了計算量,另一方面有可能增添一些不必要的細節(jié)。(2)線性預測系數(shù)的求取 自相關解法主要有杜賓(Durbin)算法、格型(Lattice)算法和舒爾(Schur)算法等幾種遞推算法。其中在杜賓算法是目前最常用的算法,而且在求取LPC系數(shù)時計算量也量小,本系統(tǒng)采用該遞推算法。 基音參數(shù)的提取基音估計的方法很多,主要有基于短時自相關函數(shù)和基
19、于短時平均幅度差函數(shù)(AMDF)等基音估計方法。(1)基于短時自相關函數(shù)的基音估計短時自相關函數(shù)在基音周期的整數(shù)倍位置存在較大的峰值,只要找出第一最大峰值的位.(2)基于短時平均幅度差函數(shù)(AMDF)的基音估計基于短時平均幅度差函數(shù)(AMDF)在基音周期的整數(shù)倍位置存在較大的谷值,找到第一最大谷值的位置就可以估計出基音周期。這種方法的缺點是當語音信號的幅度快速變化時,AMFD函數(shù)的谷值深度會減小,從而影響基音估計的精度。 實際上第一最大峰(谷)值點的位置有時并不能與基音周期吻合,第一最大峰(谷)值點的位置與短時窗的長度有關且會受到共的干擾。一般窗長至少應大于兩個基音周期,才可能獲得較好的估計效
20、果。語音中最長基音周期值約為20ms,本系統(tǒng)在估計基音周期時窗長選擇40ms。為了減小共振峰的影響,首先對語音進行頻率范圍為60,900Hz的帶通濾波。因為最高基音頻率為450Hz,所以將上限頻率設為900Hz可以保留語音的一、二次諧波,下降頻率為60Hz是為了濾除50Hz的電源干擾。以上兩種方法都是對語音信號本身求相應的函數(shù)。本系統(tǒng)采用的基音估計方法是:首先對帶通濾波后的短時語音信號進行線性預測,求取預測殘差;再對殘差信號求自相關函數(shù),找出第一最大峰值點的位置,即得到該段語音的基音估計值。實驗表明,通過殘差求取的基音軌跡比直接通過語音求取的基音軌跡效果更好,如圖13所示。圖13中橫坐標為語音
21、幀數(shù),縱坐標為圖 13 同一段語音的基音軌跡8000/f,其中f為基音頻率。1.3 模式匹配目前針對各種特征參數(shù)提出的模式匹配方法的研究越來越深入。典型的方法有:矢量量化方法、高斯混合模型方法、隱馬爾可夫模型方法、動態(tài)時間規(guī)整(DTW)方法和人工神經網絡方法。這些方法都有各自的優(yōu)點和缺點。其中DTW算法對于較長語音的識別,模板匹配運算量太大,但對短語音(有效語音長度低于3s)的識別既簡單又有效,而且并不比其他方法識別率低,特別適用于短語音、與文本有關的說話人識別系統(tǒng)。本系統(tǒng)采用端點松馳兩點的(DTW)算法,端點松馳引起的計算量增加并不大,還可以放松對端點檢測的精度要求。 圖 14 動態(tài)時間規(guī)整
22、算法動態(tài)時間規(guī)整(DTW)算法基于動態(tài)規(guī)劃的思想,解決了說話人不同時期發(fā)音長短、語速不一樣的匹配問題。DTW算法用于計算兩個長度不同的模板之間的相似程度,用失真距離表示。假設測試模板和參考模板分別用T和R表示,按時間順序含有N幀和M幀的語音參數(shù)(本系統(tǒng)為12維LPCC參數(shù)),失真距離越小,表示T、R越接近。把測試模板的各個幀號n=1N在一個二維直角坐標系中的橫軸上標出,把參考模板的各幀號m=1M在縱軸上標出,如圖14所示。通過這些表示幀號的整數(shù)坐標畫出縱橫線即形成網絡,網格中的每一個交叉點(n,m)表示測試模板中某一幀與參考模式中某一幀的交會點,對應兩個向量的歐氏距離。DTW算法可以歸結為尋找
23、一條通過此網格中若干交叉點的路徑,使得該路徑上節(jié)點的距離和(即失真距離)為最小。對于端點松弛的情況,路徑搜索原理相同,只增加搜索路徑。2 SPCE061A特性及功能簡介SPCE061A是凌陽科技研發(fā)生產的性價比很高的一款十六位單片機,使用它可以非常方便靈活的實現(xiàn)語音的錄放系統(tǒng),該芯片擁有8路10位精度的ADC,其中一路為音頻轉換通道,并且內置有自動增益電路。這為實現(xiàn)語音錄入提供了方便的硬件條件。兩路10精度的DAC,只需要外接功放(SPY0030A)即可完成語音的播放。另外凌陽十六位單片機具有易學易用的效率較高的一套指令系統(tǒng)和集成開發(fā)環(huán)境。在此環(huán)境中,支持標準C語言,可以實現(xiàn)C語言
24、與凌陽匯編語言的互相調用,并且,提供了語音錄放的庫函數(shù),只要了解庫函數(shù)的使用,就會很容易完成語音錄放,這些都為軟件開發(fā)提供了方便。2.1 SPCE061A的性能 SPCE061A 是繼µnSP系列產品SPCE500A等之后凌陽科技推出的又一款16位結構的微控制器。與SPCE500A不同的是,在存儲器資源方面考慮到用戶的較少資源的需求以及便于程序調試等功能,SPCE061A里只內嵌32K字的閃存(FLASH)。較高的處理速度使µnSP能夠非常容易地、快速地處理復雜的數(shù)字信號。因此,與SPCE500A相比, 工作電壓(CPU) VDD為2.43.6V (I/O) VDDH為2.
25、45.5V CPU時鐘:0.32MHz49.152MHz ; 內置2K字SRAM; 內置32K FLASH; 可編程音頻處理; 晶體振蕩器; 系統(tǒng)處于備用狀態(tài)下(時鐘處于停止狀態(tài)),耗電僅為; 2個16位可編程定時器/計數(shù)器(可自動預置初始計數(shù)值); 2個10位DAC(數(shù)-模轉換)輸出通道; 32位通用可編程輸入/輸出端口; 14個中斷源可來自定時器A / B,時基,2個外部時鐘源輸入,鍵喚醒; 具備觸鍵喚醒的功能; 使用凌陽音頻編碼SACM_S240方式(2.4
26、K位/秒),能容納210秒的語音 數(shù)據; 鎖相環(huán)PLL振蕩器提供系統(tǒng)時鐘信號; 32768Hz實時時鐘; 7通道10位電壓模-數(shù)轉換器(ADC)和單通道聲音模-數(shù)轉換器; 聲音模-數(shù)轉換器輸入通道內置麥克風放大器和自動增益控制(AGC)功 能; 具備串行設備接口; 具有低電壓復位(LVR)功能和低電壓監(jiān)測(LVD)功能; 內置在線仿真電路ICE(In- Circuit Emulator)接口; 具有保密能力; 具有WatchDog功能2.2 芯片的引腳排列和說明 &
27、#160; SPCE061A有兩種封裝片,一種為84個引腳,PLCC84封裝形式;它的排列如圖21所示;另一種為80個引腳,LQFP80封裝。它的排列如圖2-2所示。 圖21 SPCE061ALQFP80封裝排列圖 圖22 SPCE061APLCC84封裝排列圖在PLCC84封裝中,有15個空余腳,用戶使用時這15個空余腳懸浮。在LQFP80封裝中有9個空余腳,用戶使用時這9個空余腳接地。此處以LQFP80封裝管腳功能介紹。2.3 特性 SPCE061A系統(tǒng)的特性參數(shù)如表21所示。表21 SPCE061A系統(tǒng)的特性參數(shù)3 硬件系統(tǒng)語音電
28、子門鎖系統(tǒng)的核心是說話人識別模塊。包括按鍵輸入、語音信號采集、語音信號處理、FLASH存儲擴展、揚聲器輸出、控制輸出以及LCD模組等。說話人識別模型的原理框圖如圖31所示。其核心為語音信號處理,本系統(tǒng)選用特別適用于數(shù)字語音識別領域的凌陽16位單片機SPCE061A,并通過SPCE061A實現(xiàn)其他各組成部分的編程控制。圖31 說話人識別模塊框圖SPCE061A是凌陽公司開發(fā)的一種性價比非常高的16位單片機。在2.6V3.6V工作電壓范圍內,工作頻率范圍為0.32MHz49.152Mhz,較高的處理速度使其能夠非常容易、快速地處理復雜的數(shù)字信號;中斷系統(tǒng)支持10個中斷向量以及14個可來自系統(tǒng)時鐘、
29、定時器/計數(shù)器、時間基準發(fā)生器、外部中斷、鍵喚醒、通用異步串行通信及軟件中斷的中斷源,非常適合實時應用領域;內嵌2K字的SRAM和32K字的FLASH,具有32位可編程的多功能I/O端口;包含有7通道10位通用A/D轉換器和內置麥克風放大器與自動增益控制AGC功能的單通道聲音A/D轉換器,以及具有音頻輸出功能的雙通道10位D/A轉換器;SPCE061A采用CMOS制造工藝,同時增加了軟件激發(fā)的弱振方式、空閑方式和掉電方式,系統(tǒng)處于備用狀態(tài)下(時鐘處于停止狀態(tài)),耗電僅為2A3.6V,極大地降低了其功耗;另外,nSPTM的指令系統(tǒng)還提供具有較高運算速度的16位×16位的乘法運算指令和內
30、積運算指令,為其應用增添了DSP功 復雜的數(shù)字信號處理方面既非常便利,又比專的DSP芯片便宜得多。3.1 說話人識別模塊各組成部分完成的功能3按鍵輸入按鍵輸入部分:共有數(shù)字鍵、訓練鍵、刪除鍵、確認鍵和取消鍵等16個且編程靈活。按鍵,用于密碼輸入和工作模式選擇。采用4×4矩陣式鍵盤輸入,只使用具有鍵喚醒功能IOA的低8位,可以合理利用硬件資源,且編程靈活。由于本題設計要求要用戶擴展的鍵盤按鍵有數(shù)字鍵09和功能鍵等共12個,因此鍵盤電路采用獨立式鍵盤將會占用很多的I/O線從而不實用。故采用矩陣式鍵盤電路來擴展帶有16個按鍵的小鍵盤比較合適,根據本題要求只需4×4方式的矩陣即可,
31、故其原理電路圖如32所示: 圖中C1C4為4×4鍵盤的列信號,L1L4為4×4鍵盤的行信號。在本系統(tǒng)中,用IOB4IOB7連接鍵盤的列信號C4C1;用IOB0IOB3連接鍵盤的行信號L4L1。 圖32 4×4鍵盤電路原理圖在本系統(tǒng)中,S1S3、S5S7、S9S11、S13為數(shù)字鍵,如圖33所示,S4、S8、S12、S14S16為功能鍵。圖33 4×4鍵盤功能圖矩陣式鍵盤電路其特點是由按鍵組成一個矩陣,矩陣的行線和列線分別作為兩個傳輸方向相反的I/O接口信號線,如行線作為輸入接口信號線,列線作為輸出接口信號線,或反之。語
32、音信號采集語音信號采集部分:通過SPCE061A內置麥克風放大器與自動增益控制AGC功能的單通道CE061A的內部結構如圖3-4所示,其特點如下:* 16位'nSP TM微控制器;* 工作電壓:VDD為2.63.6V(CPU),VDDH為VDD5.5V(I/O);* CPU時鐘為0.3249.152MHz;* 內置存儲器:SRAM為2KB,內存Flash為32KB;* 可編程音頻處理;* 2個16位可編程定時器/計數(shù)器;* 7通道10位ADC(內置麥克風放大和自動增益控制功能);* 2個10位DAC;* 32路可編程通用輸入輸出端口;* 串行輸入輸出接口;* 低電壓監(jiān)測/低電壓復位功能
33、;* 14個中斷源可來自定時器、外部時鐘輸入、鍵喚醒等;圖 3-4 SPCE061A的結構 FLASH存儲擴展FLASH存儲擴展部分:用于存儲說話人的個性特征參數(shù)參考 。 K9F1208是Samsung公司生產的采用NAND技術的大容量、高可靠Flash存儲器。該器件存儲容量為64M×8位,除此之外還有2048K×8位的空閑存儲區(qū)。K9F1208對528字節(jié)一頁的寫操作所需時間典型值是200s,而對16K字節(jié)一塊的擦除操作典型僅需2ms。8位I/O端口采用地址、數(shù)據和命令復用的方法。這樣既可減少引腳數(shù),還可使接口電路簡潔。表31概要地說明了K9F1208各個引腳
34、的功能。表31 K9F1208各個引腳的功能引 腳功 能I/O0I/O7數(shù)據輸入輸出端,芯片未選中為高阻態(tài)CLE命令鎖存使能ALE地址鎖存使能CE芯片選擇控制RE數(shù)據輸出控制,有效時數(shù)據送到I/O總線上WE寫I/O口控制,命令地址數(shù)據在上升沿鎖存WP寫保護R/B指示器件的狀態(tài),0為忙,1為閑。開漏輸出Vcc電源端Vss地命令鎖存使能(CLE),使輸入的命令發(fā)送到命令寄存器。當變?yōu)楦唠娖綍r,在WE上升沿命令通過I/O口鎖存到命令寄存器。地址鎖存使能(ALE),控制地址輸入到片內的地址寄存器中,地址是在WE的上升沿
35、被鎖存的。片選使能(CE),用于器件的選擇控制。在讀操作、CE變?yōu)楦唠娖綍r,器件返回到備用狀態(tài);然而,當器件在寫操作或擦除操作過程中保持忙狀態(tài)時,CE的變高將被忽略,不會返回到備用狀態(tài)。寫使能(WE),用于控制把命令、地址和數(shù)據在它的上升沿寫入到I/O端口;而在讀操作時必須保持高電平。讀使能(RE),控制把數(shù)據放到I/O總線上,在它的下降沿tREA時間后數(shù)據有效;同時使用內部的列地址自動加1。I/O端口,用于命令、地址和數(shù)據的輸入及讀操作時的數(shù)據輸出。當芯片未選中時,I/O口為高阻態(tài)。寫保護(WP),禁止寫操作和擦除操作。當它有效時,內部的高壓生成器將會復位。準備/忙(R/B),反映當前器件的
36、狀態(tài)。低電平時,表示寫操作或擦除操作以及隨機讀正進行中;當它變?yōu)楦唠娖綍r,表示這些操作已經完成。它采用了開漏輸出結構,在芯片未選中時不會保持高阻態(tài)。 在進行寫操作時先要寫入命令字80H,通知K9F1208要進行寫操作,然后順序寫入目的地址和待寫入的數(shù)據。應該注意的是,地址只需寫入一次,便可以連續(xù)寫入多個字節(jié)數(shù)據。地址指針的調整是由K9F1208內部邏輯控制的,不用外部干預。寫入操作是以頁為單位(1528字節(jié))進行的,即每次連續(xù)寫入能超過528個字節(jié)。這是由于K9F1208的工作方式決定的:寫入的數(shù)據先保存至Flash內部的頁寄存器(528字節(jié))中,然后再寫入存儲單元。數(shù)據寫完之后還要給K9F1
37、208發(fā)出1個寫操作指令10H,通知其將頁寄存器中的數(shù)據寫入存儲單元,隨后就應該對狀態(tài)引腳進行查詢。如果該引腳為低,表明此次寫操作結束。最后的步驟是數(shù)據校驗,如果采用了ECC校驗模式,則此步驟可以省略。 揚聲器輸出揚聲器輸出部分:通過SPCE061A具有音頻輸出功能的雙通道10位D/A轉換器完成用戶訓練、識別等各種操作的語音提示。 圖3-5 語音輸出電路圖輸出的基本原理是將外擴SRAMHM628128A中存儲的語音數(shù)據順序取出,調用 SACMlib庫中的SACM A2000模塊,經SACM A2000壓縮算法解碼后,以8 kHz的速率進行DA轉換,然后通過內部
38、濾波電路濾去噪聲,恢復原始波形,由8050晶體管驅動揚聲器放音。語音輸出電路如圖35所示。 控制輸出控制輸出部分:通過SPCE061A的可編程I/O口控制門鎖控制電機。I/O口的功能: 進行端口地址譯碼設備選擇 向CPU提供I/O設備的狀態(tài)信息和進行命令譯碼 進行定時和相應時序控制 對傳送數(shù)據提供緩沖,以消除計算機與外設在“定時或數(shù)據處理速度上的差異。 提供計算機與外設間有關信息格式的相容性變換。 提供有關電氣的適配 還可以中斷方式實現(xiàn)CPU與外設之間信息的交換 主板接口基礎知識 CPU與外部設備、存儲器的連接和數(shù)據交換都需要通過接口設備來實現(xiàn),前者被稱為I/O接口,而后者則被稱為存儲器接口。
39、存儲器通常在CPU的同步控制下工作,接口電路比較簡單;而I/O設備品種繁多,其相應的接口電路也各不相同,因此,習慣上說到接口只是指I/O接口。 LCD模組 液晶模組的概念:液晶模組簡單點說就是屏+背光燈組件.液晶電視的顯示部件就是液晶模組,其地位相當于CRT中的顯像管。 模組主要分為屏和背光燈組件。兩部分被組裝在一起,但工作的時候是相互獨立的(即電路不相關).液晶顯示的原理是背光燈組件發(fā)出均勻的面光,光通過液晶屏傳到我們的眼睛里。屏的作用就是按像素對這些光進行處理,以顯示圖像.兩個部分都含有大量的部件,這里就不細說了。目前技術最好的是夏普,其次是三星索尼。液晶模組的主要參數(shù),對比度,液晶面板制
40、造時選用的控制IC、濾光片和定向膜等配件,與面板的對比度有關,對一般用戶而言,對比度能夠達到350:1就足夠了,但在專業(yè)領域這樣的對比度平還不能滿足用戶的需求。顯示模塊設計在系統(tǒng)中,利用通用的液晶1602作為顯示模塊實時顯示.液晶1602的技術參數(shù)為:顯示容量:32個字符,每個字符為5×7點陣,分2行,每行16列芯片工作電壓:4.5-5.5V工作電流:2mA(5.0V)模塊最佳工作電壓:5.0V字符尺寸:2.95×4.35(W×H)mm其典型應用接口圖如圖3-6所示。本系統(tǒng)中DB0DB7連接SPCE061A的IOA0IOA7,EP連接IOA8,R/W連接IOA9,
41、RS連接IOA10。 圖36 接口電路圖說話人識別模塊有三種工作模式:訓練模式、認證模式和密碼模式,這三種模式都可通過工作模式按鍵選擇。(1)訓練模式,說話人的聲音通過麥克風進入語音信號采集前端電路。第一次語音輸入時,由16位單片機SPCE061A對采集的語音信號進行處理,提取說話人的個性特征參數(shù),并存儲到外擴的FLASH內,形成說話人特征參數(shù)模板??梢赃M行三次訓練,第二語音輸入時,提取的個數(shù)特征參數(shù)與由第一次語音輸入形成的特征參數(shù)模板進行匹配,在匹配距離小于模板更新閾值時,將說話人特征參數(shù)模板更新為兩次特征參數(shù)的平均值。第三次語音輸入時,提取的個性特征參數(shù)與由第一、二次語音輸入形成的特征參數(shù)
42、模板進行匹配,在匹配距離小于模板更新閾值時,將說話人特征參數(shù)模板更新為三次特征參數(shù)的平均值,形成最后的該說話人的特征參數(shù)模板。 (2)認證模式,同樣通過麥克風錄入說話人的聲音,再由SPCE061A對采集的語音信號進行處理,將提取的說話人特征參數(shù)與存儲在外擴FLASH內的特征參數(shù)模板進行匹配,匹配距離小于認證閾值時,通過認證;然后再判斷匹配距離是否小于認證模式下的模板更新閾值,決定是否對模板進行更新。 (3)密碼工作模式,在說話人感冒或其他使其聲音發(fā)生暫時改變的情況下,可以采用長密碼方式進行認證,以免因為非常原因被拒之門外。另外,每個用戶都有一個短密碼(用戶可自行修改),無論在訓練模式還是認證模
43、式都要輸入此密碼,以形成或,找到與該用戶相對應的特征參數(shù)模板。系統(tǒng)還設置一個具有長密碼的超級管理員用戶,可以通過鍵盤對用戶模板進行添加或刪除3.3 試驗結果對于說話人確認系統(tǒng),表征其性能的最重要的兩個參量是拒識率和誤識率。前者是拒絕真實的說話人而造成的錯誤,后者是接受假冒者而造成的錯誤,二者與匹配閾值的設定相關。匹配閾值的設定與語音鎖系統(tǒng)的應用場合、功能側重有關,對于家庭、賓館等門鎖用戶,要求誤識率盡可能低,甚至為零;若用于公司員工考勤等同類功能,就不能有太高的拒識率。表3-2是對以下每種情況各進行100次實時匹配的結果,其中設定的閾值適合門鎖用戶。 表3-2 100次實時匹配結果
44、 發(fā)音分類次數(shù)同一個人相同發(fā)音同一個人相似發(fā)音同一個人不同發(fā)音不同人相同發(fā)音不同人相似發(fā)音不同人不同發(fā)音拒絕次數(shù)885100100100100接受次數(shù)92150000由以上實驗結果可知,對于同一個人相同發(fā)送的拒識率為8%;對于同一個人相似發(fā)音情況,因為系統(tǒng)是對說話的人進行判別,對于這種情況,無論拒絕或接受都是合理的;對于同一個人不同發(fā)音和不同人發(fā)音的情況,誤識率為零。使用錄音機進行多次實驗,通過認證的次數(shù)為零。對于門鎖用戶,這個結果十分理想的。若用于考勤等同類功能,可通過修改匹配閾值值實現(xiàn)。聲紋識別與其他生物識別技術相比,除具有不會遺失和忘記、不需記憶、使用方便等優(yōu)點外
45、,還具有以下特性:用戶接受程度高,由于不涉及隱私問題,用戶無任何心理障礙;聲音輸入設備造價低廉,而其他生特識別技術的輸入設備通常造價昂貴。與利用虹膜、指紋和人臉等技術的門鎖相比,基于SPCE061A構建的語音電子門鎖系統(tǒng)具有成本低、使用方便、保密性好等優(yōu)點。經大量實驗測試表明,該系統(tǒng)性能穩(wěn)定、識別效果好。下一步將進行小批量的試用,以發(fā)現(xiàn)問題并加以完善。但是,在環(huán)境噪聲或干擾信號高于語音信號時,該系統(tǒng)將無法進行正確的語音識別,在背景噪聲處理及其工程實際上還要進一步改善。4 系統(tǒng)軟件設計系統(tǒng)的工作過程為:訓練模式啟動后,系統(tǒng)播放語音提示,提示用戶語音訓練已啟動,接下來用戶可按照系統(tǒng)提示依次對各條命
46、令進行訓練,在訓練過程中,如訓練成功則有語音提示進行下一條命令進行訓練,若失敗,也會提示用戶繼續(xù)訓練此條語音,全部命令訓練完畢后系統(tǒng)將準備進行語音識別;當向控制器發(fā)出語音命令時,聲波通過Mic輸入,將相應的信號傳遞到SPCE061A處理芯片,經編解碼電路和數(shù)字信號處理后,在芯片中通過相關程序與預先植入的語音庫中的命令進行比較識別,根據識別的結果進行判斷,轉換為能被系統(tǒng)識別的信號,從而對被監(jiān)控系統(tǒng)進行控制。特定發(fā)音人語音識別可以分為基于音素和一般語音特征向量的識別。本設計是基于一般語音特征向量匹配的特定發(fā)音人語音識別系統(tǒng)。訓練若干條命令,識別時,依次發(fā)布這幾條命令,樣序識別出命令后將做相應的應答
47、。 設計使用的開發(fā)環(huán)境是凌陽科技提供的I-tnSPMT IDE162和語音壓縮工具 Compresstool。其中I-tnSPMTIDE集程序的編輯、編譯、鏈接、調試以及仿真等功能為一體,它的軟件仿真功能可以在不連接仿真板的情況下模擬硬件的各項功能來調試程序。軟件設計包括兩個部分:語音資源的準備;語音識別程序設計。 其中語音資源的準備在設計中使用了凌陽 SACMA2000和 SACM-$480兩種格式壓縮的音頻主程序詳見附錄。結束語本系統(tǒng)經過測試在硬件平臺上實現(xiàn)了語音的采集、回放、特征提取、單詞識別等功能。實驗表明這種面向特定說話人、小詞表的語音識別系統(tǒng)具有較高的識別率,與專用的語音處理芯片相
48、比,結構簡單,成本低,達到了預期的目的。利用 SPCE061A的語音處理優(yōu)勢構成的各種嵌入式系統(tǒng)具有廣泛系統(tǒng)硬件設計 本系統(tǒng)采用凌陽科技新近推出的SPCE061A高性能 l6位單片機,工作電壓范圍為2655V,系統(tǒng)工作頻率為037549152MHz。低電壓,較高的系統(tǒng)工作頻率使該單片機能夠較快速地處理數(shù)字信號,片內集成了自動增益控制功能的麥克風輸入方式以及DAC音頻輸出功能,提供豐富的C函數(shù)庫和語音處理函數(shù)庫,因此非常適合數(shù)字聲音和語音識別產品的開發(fā)。為了監(jiān)視語音的訓練和識別過程,該系統(tǒng)具有輸入語音的回放、工作狀態(tài)的語音提示等功能。 參考文獻【1】【2】【3】【4】【
49、5】【6】【7】 【8】羅亞非 等編著,凌陽16位單片機應用基礎北京航空航天大學出版社。附錄#include <reg51.h> /語音識別程序#include <absacc.h>#include <intrins.h>#define uint unsigned int#define uchar unsigned charsbit ISD_SS = P10; /ISD4002片選sbit ISD_SCLK = P11; /ISD4002時鐘sbit ISD_MOSI = P12; /ISD4002數(shù)據輸入sbit ISD_MISO = P13; /ISD4
50、002數(shù)據輸出sbit ISD_INT = P33; /ISD4002溢出或放音結束中斷sbit PR = P14; /PR=1錄音 PR=0放音sbit RUN = P15; /執(zhí)行錄音或放音sbit STOP = P16; /復位sbit LED = P17; /指示燈sbit SDA=P31; /24c02數(shù)據端sbit SCL=P30; /24c02時鐘端sbit error=P24; /閉鎖指示端sbit right=P25; /開鎖指示端 和開鎖輸出#define COM XBYTE 0x7fff /8279命令狀態(tài)地址A11 A14#define DAT XBYTE 0x77fF
51、 /8279數(shù)據地址sbit clflag=ACC7; /記錄狀態(tài)字 最高位bit int0_flag=0; /中斷0標志位uchar nmb_flag; /語音識別編號uchar code table=0x3f,0x06,0x5b,0x4f,0x66,0x6d,0x7d,0x07, /0,1,2,3,4,5,6,70x7f,0x6f,0x77,0x7c,0x39,0x5e,0x79,0x71 /8,9,A,B,C,D,E,F ; /共陽極數(shù)碼管顯示段碼uchar idata diss8; /顯示用數(shù)據暫存器 8位數(shù)據uchar idata mima6; /密碼用數(shù)據暫存器 6位數(shù)據/* 函數(shù)聲明 *void reply(void);/自動回答程序void ISD_PR(void);/手動對ISD錄放音void ISD_WRITE(uchar isdx); /SPI串行發(fā)送一個字節(jié)子程序void ISD_STOP(void);/發(fā)送stop指令程序void ISD_PU(void);/發(fā)送上電指令程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合伙服裝生意合同范本
- 合作餐飲小吃合同范本
- 桉樹買賣合同范本
- 合同性聯(lián)營合同范本
- 共同銷售合作合同范本
- 2025年紫外激光傳輸光纖合作協(xié)議書
- 上海車位過戶合同范本
- 廠家和員工合同范例
- 介紹焊工提成合同范本
- 下發(fā)合同范例通知
- Python爬蟲技術基礎介紹
- 中華民族共同體概論教案第四講-天下秩序與華夏共同體演進
- 《傳媒法律法規(guī)》課件
- 人力資源行業(yè)人力資源管理信息系統(tǒng)實施方案
- 客服服務合同范例
- 歌曲《wake》中英文歌詞對照
- 論語誠信課件教學課件
- 中醫(yī)院中醫(yī)文化傳承制度
- 2024改性瀝青路面施工技術規(guī)范
- GB/T 44399-2024移動式金屬氫化物可逆儲放氫系統(tǒng)
- 急性中毒的診斷與治療新進展課件
評論
0/150
提交評論