信道差異對語音鑒定影響的實驗研究_第1頁
信道差異對語音鑒定影響的實驗研究_第2頁
信道差異對語音鑒定影響的實驗研究_第3頁
信道差異對語音鑒定影響的實驗研究_第4頁
信道差異對語音鑒定影響的實驗研究_第5頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、    信道差異對語音鑒定影響的實驗研究    張犇 李日興 高培喆 李爭琦摘要:在司法語音檢驗過程中,由于檢材與樣本在錄制時,各自所選取的信道不同,促使語音在聽覺上產(chǎn)生差異,由于信道因素可能會導(dǎo)致素材的客觀真實性受損,以至于影響我們的語音司法檢驗。本文重點針對手機內(nèi)部錄音,結(jié)合語音鑒定技術(shù)對其進行具體參數(shù)分析和圖譜比對,最終得出有針對性、實用性強的明確結(jié)論,對語音鑒定工作有較強的指導(dǎo)意義。關(guān)鍵詞:語音;信道;手機錄音;圖譜1.引言隨著科學(xué)技術(shù)的發(fā)展和法制建設(shè)的完善,以諸多現(xiàn)代科學(xué)技術(shù)為基礎(chǔ)的視聽資料被刑事訴訟法規(guī)定為訴訟證據(jù),司法語音檢驗是視聽資料作為

2、證據(jù)進行檢驗的一個重要組成部分。語音檢驗技術(shù)方法日趨成熟的同時,檢驗鑒定人員開始更多地關(guān)注語料的獲取方式,由于硬件條件和采集環(huán)境所限制,在案件語音檢驗鑒定過程中,很難保證檢材和樣本獲取方式和途徑是一致的。其中,由于檢材與樣本在錄制時,信道的差異促使語音在聽覺上發(fā)生畸變。因此,我們在比對過程中就必須考慮這種差異帶來的影響。本文將通過理論分析、實驗比對和數(shù)據(jù)統(tǒng)計分析等方式,對上述影響進行具體研究并得出相關(guān)結(jié)論,以期對司法語音檢驗工作提供有力補充。2.語音信道及其影響語音信道是指語音信號傳輸?shù)耐緩?,它以傳輸語音的媒體和中繼通信設(shè)施為基礎(chǔ),可分為有線信道和無線信道兩類。由于各種實際因素,信道所提供的頻

3、帶總是有限的,信道特性也總是存在著不完善性。因此語音信號通過信道時,往往會或多或少地發(fā)生幅度和相位失真,從而產(chǎn)生波形失真,這就為語音傳輸信道差異分析奠定了基礎(chǔ)。在話音信號通過傳輸通路后,一般會受到如下幾種影響:2.1總衰減總衰減是指話路的輸入信號電平和輸出信號電平之差,它表示信號在整個話路傳輸后的減弱程度,也即總的傳輸損耗。總衰減越大,話路輸出的信號功率就越小,信噪比降低,通話的清晰度就越差。2.2衰減頻率失真衰減頻率失真是指信號通過信道時,不僅幅度被衰減,而且波形也可能發(fā)生畸變。由于話音信號占有一定的頻帶,因此經(jīng)過話路傳輸后,如果在傳輸頻帶內(nèi)各頻率成分的衰減不等,將會使接收到的信號波形失真。

4、這種失真主要來源于傳輸系統(tǒng)的濾波器。2.3噪聲可分為熱噪聲、互調(diào)噪聲、串音和脈沖噪聲等。他們對傳真信號的影響是降低了信噪比s/n,最終使接收到的信號出現(xiàn)差錯或使傳輸速率下降,其中以串音和脈沖噪聲猶為常見。串音是指相鄰信道傳輸信號的相互干擾。脈沖噪聲一般是指持續(xù)時間小于1ms的電平突然變化,它具有突發(fā)性和較大的強度,雖然對話音信號影響不大,但對于頻譜的低頻區(qū)域也會產(chǎn)生一定的干擾。2.4頻率偏差和諧波失真頻率偏差是由于多路載波系統(tǒng)中調(diào)制與解調(diào)過程所用的載波供給系統(tǒng)的頻率不一致造成的。諧波失真是由于話路中存在非線性部件所引起的,系統(tǒng)中某不見因過載而進入非線性工作區(qū)域時,將會使信號產(chǎn)生諧波和各頻率成分

5、的交互調(diào)制,造成附加的噪聲而導(dǎo)致信噪比的降低。3.手機內(nèi)部錄音電話數(shù)字錄音的核心部件為數(shù)字錄音芯片,根據(jù)質(zhì)量優(yōu)劣,其錄音效果也分不同等級,普通的手機錄音芯片一般支持采樣率8000hz,16位量化。通話錄音的基本原理是語音信號經(jīng)過濾波和放大后送入a/d轉(zhuǎn)換器,采樣量化后形成數(shù)字信號,再經(jīng)過錄音軟件壓縮編碼而形成特定的語音文件格式。語音從口中發(fā)出后,經(jīng)過電話信道傳輸,受到電話受話器、編碼器、中轉(zhuǎn)系統(tǒng)、解碼器、和電話揚聲器等信道模塊的干擾,在信號頻率成分、功率分布等方面勢必會受到影響,影響程度可以通過后期的圖譜比對和數(shù)據(jù)分析來加以研究。手機受話器的頻率響應(yīng)性能如圖1所示。4.實驗及其分析4.1實驗條

6、件及方法語料包括國際音標中的5個元音、10個數(shù)字、10個詞語和5個短句。話者根據(jù)語料標準發(fā)音,使用手機手機通話并在接收端開啟內(nèi)部錄音功能,同時使用高質(zhì)量麥克直接拾取語音輸入計算機,之后通過專用數(shù)據(jù)線和提取軟件把手機內(nèi)部錄音輸入計算機,分別形成語音文件。4.2實驗結(jié)果分析4.2.1聽覺分析通過手機信道錄入的語音(下稱x2)與麥克直錄語音(下稱x1)相比較存在明顯的區(qū)別。在音色上,麥克直錄語音聽起來非常接近話者真實發(fā)音,內(nèi)容清晰、干凈,聽不出話語失真。而手機信道錄音存在著信號失真,音色感覺頻率成分有較大缺失;個別音節(jié)發(fā)音不清,有嗡聲存在,在內(nèi)容識別上產(chǎn)生渾濁感;在整體聽覺上聲音較悶,聲音強度有一定

7、增強。4.2.2共振峰圖譜分析檢材x2相對于樣本x1,各共振峰位置和形狀未發(fā)現(xiàn)明顯變化,但中高頻共振峰(f2、f3)相對于低頻共振峰(f1)出現(xiàn)明顯的能量增強現(xiàn)象,高頻共振峰(f4)能量有所衰減或者消失;輔音圖譜中頻區(qū)能量增強,低頻區(qū)(具體為1500hz以下)能量有所減弱。如圖2,圖3所示。4.2.3振幅曲線分析通過觀察比對分析兩組音節(jié)的強度曲線,韻母部分走勢和強度基本不變(考慮兩種錄音方式的輸入輸出電平差異);聲母如果是送氣塞擦音,則強度有明顯提升,如果是爆破音,則強度也有一定提升,但效果不明顯。頻譜和共振峰分析結(jié)論中,x2效果語音中高頻區(qū)域能量得到加強,而絕大部分輔音的主要能量集中區(qū)就處于

8、音節(jié)的中高頻區(qū)域,因此,含有輔音聲母音節(jié)的強度曲線變化會出現(xiàn)上述變化。4.2.4基頻曲線分析通過觀察分析兩組基頻曲線圖發(fā)現(xiàn),部分音節(jié)基頻曲線出現(xiàn)畸變現(xiàn)象,具體為曲線斷裂、起始部位提升、尾部快速提升、部分曲線消失等現(xiàn)象。通過統(tǒng)計觀察,兩個以上元音組合發(fā)音時,發(fā)生上述畸變的現(xiàn)象較普遍;發(fā)送氣擦音s和sh時,經(jīng)常會出現(xiàn)基頻曲線起始端畸變。4.2.5共振峰數(shù)據(jù)分析 選取15個音節(jié)兩種信道下的共振峰一峰、二峰、三峰和基頻數(shù)據(jù),應(yīng)用數(shù)理統(tǒng)計的方法進行分析。表1給出兩組所選音節(jié)的f1、f2、f3的成對t檢驗和相關(guān)回歸分析結(jié)果,表中t值和p值分別表明兩種信道的各音節(jié)前三共振峰差異較顯著;在對應(yīng)共振峰之間做相關(guān)

9、回歸分析,得出相關(guān)系數(shù)處于0.820.98之間。由此。推出回歸方程并得到r2分別為0.95、0.98、0.96,說明利用回歸方程推算出的頻率值有較高的利用價值。4.2.6基頻數(shù)據(jù)分析對基頻曲線發(fā)生畸變的音節(jié),測量其基頻平均值已經(jīng)沒有統(tǒng)計價值,因此在四種調(diào)形音節(jié)中,選擇沒有發(fā)生畸變的音節(jié)測量,然后做成對雙樣本均值t檢驗和相關(guān)回歸分析,以研究其變化情況,結(jié)果見表2。數(shù)據(jù)表明:兩種信道的四類調(diào)形基頻沒有顯著差異,但陰、陽調(diào)形的基頻均差明顯小于另外兩種,說明后者要比前者受信道變化的影響大,這與前面圖譜分析的結(jié)論相符。4.2.7語音自動識別分析把麥克直錄語音文件作為樣本輸入自動識別系統(tǒng),庫容量為1000

10、0人,然后把手機內(nèi)錄語音文件作檢材進行訓(xùn)練比對,輸出的識別分數(shù)為0.057,識別結(jié)果為接受。該系統(tǒng)為中國刑警學(xué)院與清華大學(xué)合作開發(fā)的司法語音識別系統(tǒng),目前,已經(jīng)通過鑒定并進行行業(yè)推廣。5.結(jié)論語音經(jīng)受信道干擾后,在聽覺上產(chǎn)生失真,有頻率成分缺失現(xiàn)象。圖譜比對發(fā)現(xiàn)各共振峰位置和走勢未發(fā)生明顯變化,但中高頻區(qū)峰的能量明顯增強,而低頻峰的能量明顯減弱。數(shù)據(jù)分析的結(jié)果表明:各音節(jié)共振峰受信道影響在數(shù)值上發(fā)生較明顯變化,分析這種變化是由于語音受信道影響后,除頻率分布變化外,常規(guī)測量各共振峰均值的方法會帶來較大誤差所造成的。通過觀察比對兩組音節(jié)的強度曲線,輔音所產(chǎn)生亂紋沖直條的能量也有所增強,尤其是送氣塞擦音;韻母部分走勢和強度基本不變(考慮兩種錄音方式的輸入輸出電平差異);后期通過頻譜曲線走勢變化情況可以印證上述結(jié)論。對四種基音調(diào)形音節(jié)的基頻數(shù)值進行檢驗未發(fā)現(xiàn)顯著變化,但可以得出上、去調(diào)形比陰、陽調(diào)形更易受信道影響。提取基頻曲線時發(fā)現(xiàn),部分音節(jié)的基頻曲線發(fā)生畸變,分析推測此類現(xiàn)象是由于設(shè)備因素造成的特殊現(xiàn)象。自動識別結(jié)果發(fā)現(xiàn)信道差異被系統(tǒng)接受,但被識別的相似度得分普遍較低。參考文獻:1 岳俊發(fā)、王英利(1996)聲紋鑒定。北京:警官教育出版社。2 侯風(fēng)雷、張萬軍、王炳錫(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論