




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、讓電腦聽話報(bào)告組別;電腦組小組成員:林育丞 、許耕敏 、施智翔 、吳泰羽指導(dǎo)老師:郭人豪老師 讓電腦聽話報(bào)告組別;電腦組報(bào)告大綱導(dǎo)論研究目的名詞解釋及相關(guān)知識(shí)探討研究過程研究結(jié)論報(bào)告大綱導(dǎo)論導(dǎo)論 語音辨識(shí)的應(yīng)用範(fàn)圍很廣,例如語音輸入與聲紋之身份辨識(shí)即是,語音輸入的最大好處是它非常合乎人的自然行為習(xí)慣,對(duì)於不習(xí)慣使用鍵盤輸入電腦資料的人,特別是中文輸入,有了語音輸入的方法之後,就不必辛苦地學(xué)習(xí)各種中文輸入法來迎合電腦。 導(dǎo)論 語音辨識(shí)的應(yīng)用範(fàn)圍很廣,例如語音輸入與聲紋之身份辨識(shí)即研究目的 研讀相關(guān)資料,使我們能了解電腦如何儲(chǔ)存聲音及辨識(shí)聲音,並透過實(shí)際操作了解語音辨識(shí)的過程。 研究目的 研讀相關(guān)
2、資料,使我們能了解電腦如何儲(chǔ)存聲音及辨識(shí)聲名詞解釋及相關(guān)知識(shí)探討 聲音的本質(zhì)聲音數(shù)位化取樣頻率解析度消除靜音 音框 語音辨識(shí)的原理語音辨識(shí)的方法名詞解釋及相關(guān)知識(shí)探討 聲音的本質(zhì)聲音的本質(zhì)聲音,是泛指任何我們耳朵所能聽見的聲音。 任何聲音都以波的形式表示,而聲音訊號(hào)的波形,可在不同的時(shí)間區(qū)段上找到不同的週期。非固定式訊號(hào)。聲音的本質(zhì)聲音,是泛指任何我們耳朵所能聽見的聲音。 數(shù)位化透過麥克風(fēng)我們把聲音傳到電腦裡面,這中間的過程稱為數(shù)位化。原來連續(xù)的訊號(hào),經(jīng)過數(shù)位化的處理,變成一種不連續(xù)的訊號(hào)。數(shù)位化透過麥克風(fēng)我們把聲音傳到電腦裡面,這中間的過程稱為數(shù)位取樣頻率定義:每分鐘取樣的次數(shù)。取樣的頻率越
3、高,所需的儲(chǔ)存記憶體就越大,這會(huì)導(dǎo)致辨識(shí)的時(shí)間過長(zhǎng),因此本研究中取樣皆以8000HZ(每分鐘8000次)為基準(zhǔn),這樣就不會(huì)花太多時(shí)間在辨識(shí)也不會(huì)讓聲音失真。取樣頻率定義:每分鐘取樣的次數(shù)。取樣失真所得的聲音取樣值便不能代表原來訊號(hào)。取樣頻率需大於兩倍聲音頻率,否則會(huì)造成取樣失真。對(duì)語音訊號(hào)取樣時(shí),語音最高頻率不會(huì)超過4000Hz,所以取樣頻率定在 8000Hz以上,就保證取樣失真不發(fā)生。取樣失真所得的聲音取樣值便不能代表原來訊號(hào)。取樣頻率需大於兩解析度定義:每個(gè)取樣點(diǎn)用多少bit(位元,一個(gè)0或1稱為1個(gè)bit。)來表示聲音。經(jīng)過電腦取樣後,聲音檔案就出現(xiàn)了頻率(HZ)及(BIT)兩個(gè)單位HZ
4、=1分鐘取樣的次數(shù) BIT=每次取樣所用的值大小解析度定義:每個(gè)取樣點(diǎn)用多少bit(位元,一個(gè)0或1稱為1個(gè)消除靜音為何要消除靜音?如何消除靜音? 能量量測(cè)法: 1.找出所有音框能量總和的平均值,設(shè)定為門檻值 2.以門檻值來區(qū)分有聲或無聲區(qū)域 3.刪除無聲區(qū)域 消除靜音為何要消除靜音?音框音框是語音處理的最小單位大小沒有一定標(biāo)準(zhǔn),使用者自訂一個(gè)音框可以計(jì)算出一個(gè)語音特徵值音框音框是語音處理的最小單位為何要取音框(frame)處理語音訊號(hào)這種不固定週期式的訊號(hào)時(shí),最好先將其分段處理,把每一段當(dāng)成一個(gè)固定的訊號(hào),而這一小段部份就被稱為“音框”。為何要取音框(frame)處理語音訊號(hào)這種不固定週期式
5、的訊號(hào)如何取音框如何取音框語音辨識(shí)的原理步驟如下:類比到數(shù)位的轉(zhuǎn)換 聲音樣本與測(cè)試樣本進(jìn)行比對(duì)工作 找出最相似的語音輸出結(jié)果語音辨識(shí)的原理步驟如下:語音辨識(shí)的方法相似度比較法 測(cè)試樣本參照樣本集輸入比對(duì)找出最相似辨識(shí)結(jié)果範(fàn)例:輸入測(cè)試樣本;2參照樣本集:1、2、320比對(duì)後找出最相似結(jié)果:2範(fàn)例:輸入測(cè)試樣本;a參照樣本集:1、2、320比對(duì)後找出最相似結(jié)果:2語音辨識(shí)的方法相似度比較法 測(cè)試樣本參照樣本集輸入找出最相似如何計(jì)算相似度設(shè)待測(cè)音框?yàn)閍1、a2、a3an, (n=音框數(shù))設(shè)參照音框?yàn)閎1、b2、b3bn, (n=音框數(shù))語音相似度=a1與b1的相似度 + a2與b2的相似度 + +
6、an與bn的相似度音框相似度的計(jì)算則需使用到多變數(shù)的高思機(jī)率密度函數(shù),因其中數(shù)學(xué)理論過於深?yuàn)W,超過國(guó)中生所能理解的程度,所以我們僅使用不予以探討 如何計(jì)算相似度設(shè)待測(cè)音框?yàn)閍1、a2、a3an, (n=音研究過程 提出問題提出假設(shè)及驗(yàn)證假設(shè)的方法錄製聲音語音處理去除靜音調(diào)整聲音格式(8000HZ、16bit及單聲道) 訓(xùn)練對(duì)照組,取得聲音特徵值進(jìn)行待測(cè)聲音與對(duì)照組的語音辨識(shí)數(shù)據(jù)分析及驗(yàn)證假設(shè)研究過程 提出問題問題與假設(shè)如何判斷電腦辨別聲音成功?假設(shè)存在有一門檻值來判別是否為辨識(shí)成功是否能正確辨別同性別及不同性別的聲音(以正常語調(diào))?假設(shè)同性別聲音的相似度會(huì)較高是否能正確辨別不同年紀(jì)(不分男女)
7、的聲音?假設(shè)同年齡的相似度會(huì)較高問題與假設(shè)如何判斷電腦辨別聲音成功?錄製聲音名單陳品軒徐靖洋鍾博全馮育瑋王俊立15歲男15歲男15歲男15歲男15歲男董子瑜呂孟錡柳科竹黃冠維吳俊毅15歲男15歲男15歲男15歲男15歲男吳家成歐光哲吳旻軒李采臻王思亭15歲男15歲男15歲男15歲女15歲女李穎俐吳家瑩盧奐蓁伍曼妮黃婉婷15歲女15歲女15歲女15歲女15歲女屈于翔顏大凱郭人豪林勁曄黃俞菁15歲女30歲男30歲男30歲男30歲女朱芳儀王佳慧張雲(yún)雄李龍輝翁秋蘭30歲女30歲女50歲男50歲男40歲女張帶金40歲女錄製聲音名單陳品軒徐靖洋鍾博全馮育瑋王俊立15歲男15歲男1如何判斷電腦辨別聲音成功?
8、假設(shè):訂定辨別的語音(NO)後錄製足夠的聲音樣本進(jìn)行語音處理(靜音及儲(chǔ)存格式)取得判別成功門檻相似度超過門檻值則代表此聲音與對(duì)照聲音同,反之則否如何判斷電腦辨別聲音成功?假設(shè):對(duì)照組聲音名單姓名陳品軒徐靖洋鍾博全李采臻王思亭李穎俐聲音編號(hào)15-1-115-1-215-1-315-2-115-2-215-2-3姓名顏大凱郭人豪林勁曄黃俞菁朱芳儀王佳慧聲音編號(hào)30-1-130-1-230-1-330-2-130-2-230-2-3姓名張雲(yún)雄李龍輝翁秋蘭張帶金聲音編號(hào)50-1-150-1-250-2-150-2-2編碼方法:年齡-性別-編號(hào)對(duì)照組聲音名單姓名陳品軒徐靖洋鍾博全李采臻王思亭李穎俐聲音編
9、語音處理步驟如下:去除靜音調(diào)整聲音格式(8000HZ、16bit及單聲道) 語音處理步驟如下:訓(xùn)練對(duì)照組,取得特徵值1.選擇聲音2.加入聲音3.開始訓(xùn)練4.訓(xùn)練完成, 取得特徵參數(shù)訓(xùn)練對(duì)照組,取得特徵值1.選擇聲音2.加入聲音3.開始訓(xùn)練4對(duì)照組訓(xùn)練結(jié)果對(duì)照組訓(xùn)練完畢後,我們會(huì)取得16組的特徵參數(shù)接下來將16組聲音(NO)與對(duì)照組作語音辨識(shí),使用VB程式計(jì)算其相似度對(duì)照組訓(xùn)練結(jié)果對(duì)照組訓(xùn)練完畢後,我們會(huì)取得16組的特徵參數(shù)語音辨識(shí)1.將對(duì)照組讀入2.開始辨識(shí)語音辨識(shí)1.將對(duì)照組讀入2.開始辨識(shí)如何判斷電腦辨別聲音成功?驗(yàn)證:16組語音與對(duì)照組相似度,如下表如何判斷電腦辨別聲音成功?驗(yàn)證:如何判
10、斷電腦辨別聲音成功?失敗的原因分析聲音大小不一有的聲音唸?zhí)?改善做法利用GoldenWave將音量統(tǒng)一為0db,並且更替唸?zhí)斓穆曇糁匦卤孀R(shí) (db,分貝,為聲音的音量,0db並非無音量,且可使雜音影響最小)如何判斷電腦辨別聲音成功?失敗的原因分析如何判斷電腦辨別聲音成功?重新取得對(duì)照組相似度:門檻值定為836如何判斷電腦辨別聲音成功?重新取得對(duì)照組相似度:門檻值定為8如何判斷電腦辨別聲音成功?以作為待測(cè)聲音取得跟的相似度:很明顯的發(fā)現(xiàn)很多組相似度都超過了門檻值,與假設(shè)不合如何判斷電腦辨別聲音成功?以作為待測(cè)聲音如何判斷電腦辨別聲音成功?檢討失敗原因討論後的結(jié)果是:或許不該用相似度最低值來當(dāng)
11、做辨別成功門檻值,應(yīng)該以相似度平均值的最低值 (平均最低值為1983)來作為辨別門檻會(huì)較為可信 如何判斷電腦辨別聲音成功?檢討失敗原因如何判斷電腦辨別聲音成功?驗(yàn)證:三組相似度平均值的確皆小於1983結(jié)論:電腦可以成功辨別不同聲音如何判斷電腦辨別聲音成功?驗(yàn)證:是否能正確辨別男女的聲音?(黃同性別比對(duì)分?jǐn)?shù),灰異性別比對(duì)分?jǐn)?shù)) 是否能正確辨別男女的聲音?(黃同性別比對(duì)分?jǐn)?shù),灰異性別比是否能正確辨別同性別及不同性別的聲音?分析以上數(shù)據(jù),可以明顯發(fā)現(xiàn),同性別的相似度平均值高於不同性別的相似度平均值高,由此證明電腦能正確辨別同性別及不同性別的聲音(以正常語調(diào))。是否能正確辨別同性別及不同性別的聲音?是否能正確辨別不同年紀(jì)的聲音?根據(jù)下表數(shù)據(jù)可得知:15歲組不合乎假設(shè),同年齡層的相似度為最低。各組分?jǐn)?shù)十分接近因此得知電腦無法正確辨別不同年紀(jì)(不分男女)的聲音。 是否能正確辨別不同年紀(jì)的聲音?根據(jù)下表數(shù)據(jù)可得知:研究結(jié)論1.發(fā)現(xiàn)聲音音量會(huì)影響到相似度辨識(shí)結(jié)果 Example: 30-2-1 原音量太大聲 造成分?jǐn)?shù)都是負(fù)數(shù),因此減低音量 得到分?jǐn)?shù)749為正常2.聲音唸?zhí)祀娔X無法辨識(shí)3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度證件外借風(fēng)險(xiǎn)評(píng)估與管理合同
- 洗衣店裝修簡(jiǎn)易協(xié)議
- 二零二五年度商場(chǎng)家居用品柜臺(tái)租賃管理合同
- 2025年度建筑工程施工環(huán)境保護(hù)責(zé)任協(xié)議書
- 2025年度供應(yīng)鏈物流保密協(xié)議合同
- 文化產(chǎn)業(yè)借款融資居間合同
- 2025年度農(nóng)村土地承包經(jīng)營(yíng)權(quán)流轉(zhuǎn)及農(nóng)業(yè)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整合作合同
- 2025年度企業(yè)兼職市場(chǎng)營(yíng)銷人員勞務(wù)合同模板
- 2025年度房產(chǎn)贈(zèng)與資產(chǎn)重組合同
- 2025年度人工智能系統(tǒng)維護(hù)與數(shù)據(jù)安全合同
- 31863:2015企業(yè)履約能力達(dá)標(biāo)全套管理制度
- 蘇教版數(shù)學(xué)二年級(jí)下冊(cè)《認(rèn)識(shí)時(shí)分》教案(無錫公開課)
- 軌道交通云平臺(tái)業(yè)務(wù)關(guān)鍵技術(shù)發(fā)展趨勢(shì)
- 打造金融級(jí)智能中臺(tái)的數(shù)據(jù)底座
- 工程合同管理教材(共202頁).ppt
- ANKYLOS機(jī)械并發(fā)癥處理方法
- 道路橋梁實(shí)習(xí)日記12篇
- 第十章運(yùn)動(dòng)代償
- 氬弧焊機(jī)保養(yǎng)記錄表
- 明星97iii程序說明書
- 《企業(yè)經(jīng)營(yíng)統(tǒng)計(jì)學(xué)》課程教學(xué)大綱
評(píng)論
0/150
提交評(píng)論