![大學非英語專業(yè)音素教改與自動語音識別技術融合應用可行性_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/7/aa25dec6-0ab0-47e0-b96f-be2124b5e574/aa25dec6-0ab0-47e0-b96f-be2124b5e5741.gif)
![大學非英語專業(yè)音素教改與自動語音識別技術融合應用可行性_第2頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/7/aa25dec6-0ab0-47e0-b96f-be2124b5e574/aa25dec6-0ab0-47e0-b96f-be2124b5e5742.gif)
![大學非英語專業(yè)音素教改與自動語音識別技術融合應用可行性_第3頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/7/aa25dec6-0ab0-47e0-b96f-be2124b5e574/aa25dec6-0ab0-47e0-b96f-be2124b5e5743.gif)
![大學非英語專業(yè)音素教改與自動語音識別技術融合應用可行性_第4頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/7/aa25dec6-0ab0-47e0-b96f-be2124b5e574/aa25dec6-0ab0-47e0-b96f-be2124b5e5744.gif)
![大學非英語專業(yè)音素教改與自動語音識別技術融合應用可行性_第5頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/7/aa25dec6-0ab0-47e0-b96f-be2124b5e574/aa25dec6-0ab0-47e0-b96f-be2124b5e5745.gif)
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 大學非英語專業(yè)音素教改與自動語音識別技術融合應用可行性 【摘要】文中以近些年自動語音識別技術在大學非英語專業(yè)音素教改中的融入為研究基礎,通過分析目前大學非英語專業(yè)因素教改中存在的問題,探討大學非英語專業(yè)因素教改中自動語音識別技術的應用優(yōu)勢并引入案例嘗試分析如何提升自動語音識別技術在大學非英語專業(yè)音素教改中應用的有效性等?!娟P鍵詞】大學非英語專業(yè) 音素教改 自動語音識別技術 融合g64 a 2095-3089(2018)08-0094-02一、大學非英語專業(yè)因素教改中存在的問題目前,絕大多數(shù)高校在非英語專業(yè)英語教學的過程中,并沒有關于朗讀質量
2、的及時有效反饋源,如此也導致學習者發(fā)音中的錯誤無法被及時糾正。大學非英語專業(yè)音素教改的傳統(tǒng)應用手段基本可將文字與語音融合為一體,從語音習得入手,糾正學習者錯誤發(fā)音,規(guī)范學習者音素應用方式等。此種教學方式的確卓有成效,但是按照新時期大學非英語專業(yè)音素教改的要求,顯然是不夠的。語音作為語言習得的重要物質基礎,利于學習者更為便捷的捕捉語言信息并掌握語言技巧?;谡Z言教學中語音教學的重要性作用,在大學非英語專業(yè)的音素教改中,就需要將其視為獨立的部分進行針對性的分析,繼而結合大學非英語專業(yè)語言習得要求、標準等,著手相關方案或者措施的設計。在此過程中,為提升大學非英語專業(yè)學生語言習得的主動性和積極性,建議
3、嘗試在大學非英語專業(yè)音素教改中融合自動語音識別技術,以此來提升語音教改向每個學習者提供及時反饋需求及個體練習等的服務性。二、大學非英語專業(yè)因素教改中自動語音識別技術的應用優(yōu)勢盡管計算機輔助語言學習技術可幫助增加大學非英語專業(yè)音素教改的成效,但是如果計算機輔助語言學習技術選擇及應用不當,或者忽視學生實際學情,依然無法保障大學非英語專業(yè)音素教改成效。但是自動語音識別技術(asr)可以讓計算機通過“聽”不同人連續(xù)的和階段性的說出的語音,在電腦中“寫”出所說內容的方式,與人工判斷比較,自動語音識別技術不僅能完成聲音向文字的轉換,按照使用需求,自動語音識別技術可依照系統(tǒng)用戶情況分為特定和特定人的識別系統(tǒng)
4、,按照系統(tǒng)詞匯量可分為大詞、中詞、小詞的匯量系統(tǒng),按照輸入語音發(fā)音方式可分為自然發(fā)音的口語式和朗讀式兩種,按照輸入語音方言背景可分為方言語音、方言背景普通話、普通話三類識別系統(tǒng),按照輸入語音情感狀態(tài)可分為情感語音識別系統(tǒng)及中性系統(tǒng),借助以上功能優(yōu)勢,自動語音識別技術一方面可清晰的辨識出不同方言影響下非英語專業(yè)習得者發(fā)音的不夠標準化所引發(fā)的問題,幫助語言習得者和教師及時糾正及檢測語言習得給定的音素發(fā)音錯誤。另一方面,自動語音識別技術能便捷使用,具有強大數(shù)據分析能力及計算能力,能對學習者一對一自主分析性功能,在語音識別技術輔助下可實時檢測學習者發(fā)音錯誤并提供糾正意見,能輔助學生及教師獲得反映發(fā)音質
5、量的指標,不依賴固定或者特定地點和時間的跨平臺自動語音識別技術,因此,作為計算機輔助語言學習技術中的佼佼者,則以其可及時、實時總結學生弱點,推薦針對性強化訓練方案等優(yōu)勢勝出。三、大學非英語專業(yè)音素教改中自動語音識別技術的應用思路鑒于國人在英語朗讀和發(fā)音時容易出現(xiàn)的不標準、不規(guī)范錯誤,在大學非英語專業(yè)音素教改中引入自動語音識別技術時,建議按照大學非英語專業(yè)音素教改要求以及音素應用規(guī)則,有選擇的使用自動語音識別技術及載體,進行實驗數(shù)據錄制和分析,系統(tǒng)衡量指標并建設基本音素檢錯系統(tǒng)等。具體設計及應用的思路如下:第一步,實驗數(shù)據的錄制及分析。考慮到大學非英語專業(yè)音素教改中自動語音識別技術的應用方式多樣
6、,自動語音識別技術所依賴的載體也多種多樣,因此,以下以嵌入式設備如智能手機作為自動語音識別技術應用的載體,實驗語音數(shù)據錄入使用自帶麥克風的pda。朗讀文本選擇英語900句作為語料,錄制每人20句,實驗人隨機抽選大學非英語專業(yè)學生45人。年齡集中在20-25歲之間。在明確錄制要求和對象之后,按照英語專家所設定的朗讀數(shù)據語素正確發(fā)音標準及標注,定義音素發(fā)音情況為三類,如漏讀、錯讀、正確。在系統(tǒng)衡量指標并建設基本音素檢錯系統(tǒng)之前,以簡化模型為目標,增讀暫時忽視,標注統(tǒng)計結果如下:專家1音素發(fā)音標注結果中正確17468、錯讀519、漏讀402;專家2音素發(fā)音標注結果中正確17202、錯讀713、漏讀4
7、74。第二步,確定系統(tǒng)衡量指標。按照衡量系統(tǒng)總體性能進行兩大重要指標的界定,即準確率和召回率,以專家1標注結果為標準,計算準確率和召回率分別為59%和69%。公式為:召回率=系統(tǒng)檢測出的錯誤數(shù)量/測試集中的音素數(shù)量?鄢100%針對計算結果進行分析可得,正確發(fā)音在所選語料中占大多數(shù),兩位專家標注的結果類似,漏讀和錯讀的比率類似,這意味著大學非英語專業(yè)學生英語發(fā)音時容易漏讀音素而不是音素發(fā)音錯誤。第三步,建立基本音素檢錯系統(tǒng)。大學非英語專業(yè)音素教改中自動語音識別技術的應用到此階段,需要使用音素發(fā)音自動檢錯技術來輔助大學非英語專業(yè)音素教改的實踐應用。判斷工作流程為,按照音素序列自動切分朗讀句子,所切
8、分的為每個音素對應的語音小片段,之后進行小片段發(fā)音質量的判斷,此處可引入音素發(fā)音質量cop輔助構建系統(tǒng)。在實踐應用中,音素切分網絡可直接使用朗讀文本對應的音素序列作為切分網絡,在聲學模型選擇方面,建議使用目前自動語音識別中慣常使用的hmm模型,發(fā)音數(shù)據則選擇標準英文發(fā)音數(shù)據,升學特征參數(shù)選擇mel頻率倒數(shù)系數(shù)mfcc,音素識別列表方面按照常見的競爭子集。按照以上的操作方式,在部分音素競爭子集的選擇階段,需要依照語音學和聲學經驗,客觀規(guī)律中每個音素模型間的相似度和距離,統(tǒng)計人工標注中容易混淆的音素對。部分音素競爭子集可對應如下:(1)aa,對應ae、ax、eh;(2)ao,對應ax、er、eh;
9、(3)aw,對應ao、oo、uw;(4)ch,對應sh、t;(5)eh,對應ih、ax、el、ey;(6)s,對應z。第四步,使用獨立閾值提升錯讀檢測性能。按照上述三個步驟進行基本英文發(fā)音檢錯系統(tǒng)的描述,之后結果顯示所有音素的判斷閾值均一致。但是在研究結果中也充分體現(xiàn)出不同音素錯讀和正確讀出的cop分布情況大相徑庭。以“ey”和“ax”為例,兩者錯讀和正確讀出的區(qū)分相差度甚至二倍出現(xiàn)?;诖?,進行獨立閾值的優(yōu)化時,可將所有訓練數(shù)據里的cop值以音素為歸類和升序排序依據,歸類所得形成n個棧vi,用vij代表音素i的第i個樣本是否為錯誤發(fā)音,可取值0或者1,之后將最佳獨立閾值訓練過程抽象成數(shù)學問題
10、,即從頂部開始,每個棧全出個ai數(shù)據繼而求出最優(yōu)化ai構成的b維向量。按照以上思路進行計算時,可在初始化階段將樣本個數(shù)設置為0,得到的最多錯誤樣本個數(shù)設定為em,那么可得最佳ain=0。在逐步進行向量計算后,最終得到第i個棧中的第ain個樣本對應cop值為最終訓練所得到與因素對應的檢錯門限。第五步,檢測改進因素對齊網絡實現(xiàn)漏讀。上文分析可得大學非英語專業(yè)學生在朗讀英語時會出現(xiàn)漏讀一個或者多個因素,建議假定發(fā)音人按照句子里的因素排列順序能完整朗讀整個例句,在因素切分之前可檢測出發(fā)音人漏讀音素,放棄音素邊界的劃分,并以此作為提升系統(tǒng)應用性能的切入點。在檢測后可限定因素對齊網絡,比如搭建起識別網絡,網絡主路徑可依照單詞中每個因素的排列順序來依次連接,每個因素均可跳過去,如此一旦出現(xiàn)某個因素漏讀,此識別網絡就可自動識別漏讀,并得強制劃分出可匹配漏讀情況的小段語音數(shù)據。在識別器及自動識別技術應用靈敏度較高的情況下此種設計才能確保有效。但是識別網絡需要被限制,不能所有音素都能輕易被跳過。否則就會失去檢驗和應用的初衷。參考文獻:1劉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 湘教版地理八年級下冊第一節(jié)《四大地理區(qū)域的劃分》聽課評課記錄
- 北京課改版歷史七年級上冊第1課《中國境內的遠古人類》聽課評課記錄
- 小學二年級數(shù)學口算題上冊三
- 聽評課記錄小學五年級英語
- 婚姻財產約定協(xié)議書范本
- 中央空調系統(tǒng)節(jié)能環(huán)保改造協(xié)議書范本
- 2025年度綠植花卉租賃與酒店客房裝飾服務合同
- 2025年度環(huán)保項目銀行擔保合同
- 2025年度教育培訓咨詢合同
- 湘教版數(shù)學八年級上冊3.3《實數(shù)的分類及性質》聽評課記錄1
- 少兒素描課件
- 2025屆河北省衡水市衡水中學高考仿真模擬英語試卷含解析
- 天津市部分區(qū)2023-2024學年高二上學期期末考試 生物 含解析
- 變壓器投標書-技術部分
- 《我國跨境電子商務消費者權益保護問題研究》
- 2024九省聯(lián)考適應性考試【甘肅省】歷史試卷及答案解析
- 四年級語文下冊第六單元【集體備課】(教材解讀+教學設計)
- 小學一年級數(shù)學思維訓練100題(附答案)
- 蘇教版小學信息技術五年級下冊五年級下冊教案全集
- 蘇教版八年級數(shù)學上冊期末試卷及答案【完美版】
- 法院拍賣議價協(xié)議書
評論
0/150
提交評論