版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
聲紋識別聽聲辨人
北京大學(xué)信息科學(xué)中心視覺與聽覺信息處理國家重點實驗室吳璽宏
2001/08/23近年來,在生物識別技術(shù)領(lǐng)域中,聲紋識別技術(shù)以其獨特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩炞C方式。聲紋識別屬于生物識別技術(shù)的一種,是一項根據(jù)語音波形中反映說話人生理和行為特征的語音參數(shù),自動識別說話人身份的技術(shù)。與語音識別不同的是,聲紋識別利用的是語音信號中的說話人信息,而不考慮語音中的字詞意思,它強(qiáng)調(diào)說話人的個性;而語音識別的目的是識別出語音信號中的言語內(nèi)容,并不考慮說話人是誰,它強(qiáng)調(diào)共性。歷史與現(xiàn)狀對聲紋識別的研究始于20世紀(jì)30年代。早期的工作主要集中在人耳聽辨實驗和探討聽音識別的可能性方面。隨著研究手段和工具的改進(jìn),研究工作逐漸脫離了單純的人耳聽辨。Bell實驗室的L.G.Kesta目視觀察語譜圖進(jìn)行識別,提出了“聲紋(voiceprint)”的概念。之后,電子技術(shù)和計算機(jī)技術(shù)的發(fā)展,使通過機(jī)器自動識別人的聲音成為可能。Bell實驗室的S.Pruzansky提出了基于模式匹配和概率統(tǒng)計方差分析的聲紋識別方法,而引起信號處理領(lǐng)域許多學(xué)者的注意,形成了聲紋識別研究的一個高潮,其間的工作主要集中在各種識別參數(shù)的提取、選擇和實驗上,并將倒譜和線性預(yù)測分析等方法應(yīng)用于聲紋識別。70年代末至今,聲紋識別的研究重點轉(zhuǎn)向?qū)Ω鞣N聲學(xué)參數(shù)的線性或非線性處理以及新的模式匹配方法上,如動態(tài)時間規(guī)整、主成分分析、隱馬爾可夫模型、神經(jīng)網(wǎng)絡(luò)和多特征組合等技術(shù)。如今,聲紋識別技術(shù)已逐漸走入實際應(yīng)用,AT&T應(yīng)用聲紋識別技術(shù)研制出了智慧卡(smartcard),已應(yīng)用于自動提款機(jī)。歐洲電信聯(lián)盟在電信與金融結(jié)合領(lǐng)域應(yīng)用聲紋識別技術(shù),于1998年完成了CAVE(CallerVerificationinBankingandTelecommunication)計劃,并于同年又啟動了PICASSO(PioneeringCallAuthenticationforSecureServiceOperation)計劃,在電信網(wǎng)上完成了聲紋識別。同時,Motorola和Visa等公司成立了V-commerce聯(lián)盟,希望實現(xiàn)電子交易的自助化,其中通過聲音確定人的身份是此項目的重要組成部分。其他的一些商用系統(tǒng)還包括:ITT公司的SpeakerKey、Keyware公司的VoiceGuardian、T-NETIX公司的SpeakEZ等。國內(nèi)開展聲紋識別研究比較早的機(jī)構(gòu)有北京大學(xué)、中科院聲學(xué)所、中科院自動化所、清華大學(xué)等,并先后得到了國家自然科學(xué)基金重大和重點項目、攀登計劃等基金的支持,取得了豐碩的研究成果。說話人識別系統(tǒng)的典型結(jié)構(gòu)圖物理基礎(chǔ)語音是由發(fā)聲器官運動產(chǎn)生的。發(fā)聲器官包括喉、聲道和嘴。氣流通過喉中的聲門,引起聲帶的周期性振動,形成周期性的脈沖串并進(jìn)入聲道,周期性脈沖的周期稱為基音周期。氣流從喉向上經(jīng)過口腔或鼻腔后從嘴或鼻孔向外輻射,其間的傳輸通道稱為聲道。聲道是具有某種諧振特性的腔體,當(dāng)氣流通過時,輸出的氣流頻率特性,即聲門脈沖串的特性,取決于聲道的特性。嘴的作用是完成氣流的向外輻射,嘴張開時的形狀對語音頻譜有影響,但較聲道次之。發(fā)聲的器官和過程確定了語音中特定說話人信息的形式,其中聲道的形狀是最重要的生理因素。另外,發(fā)聲的習(xí)慣,包括發(fā)聲速度、韻律和口音構(gòu)成了語音中特定說話人信息的后天行為因素。語音中的特定說話人信息構(gòu)成了聲紋識別的物理基礎(chǔ)。技術(shù)原理基于不同的應(yīng)用環(huán)境,聲紋識別分為說話人辨識和說話人確認(rèn)。說話人辨識是指識別說話人是否已經(jīng)注冊,是哪一個注冊人;說話人確認(rèn)是指識別說話人的身份與其聲明的是否一致。用戶在使用聲紋識別系統(tǒng)時,需要向系統(tǒng)提供一段語音,根據(jù)發(fā)音材料,可分為文本有關(guān)(text-dependent)和文本無關(guān)(text-independent)兩種。與文本有關(guān)的識別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音,并根據(jù)特定的發(fā)音內(nèi)容建立精確的模型,從而達(dá)到較好的識別效果,但系統(tǒng)需要用戶配合,如果用戶的發(fā)音與規(guī)定的內(nèi)容不符合,則無法正確識別該用戶。而與文本無關(guān)的識別系統(tǒng)則不規(guī)定說話人的發(fā)音內(nèi)容,因而要建立精確的模型較為困難,識別效果較差。另外,與其他生物識別技術(shù)類似,若考慮待識別的說話人是否在注冊的說話人集合內(nèi),則說話人辨識分為開集(open-set)辨識和閉集(close-set)辨識,顯而易見,閉集辨識的結(jié)果要好于開集辨識,但開集辨識與實際情況更為一致。1.用于銀行、證券系統(tǒng)隨著電話銀行、遠(yuǎn)程炒股等業(yè)務(wù)的不斷增加,這些業(yè)務(wù)對用戶所做的身份認(rèn)證只是采用密碼方式,其安全性令人擔(dān)憂。如果采用說話人確認(rèn)技術(shù)并結(jié)合原來的密碼,可安全有效地實現(xiàn)用戶身份的確認(rèn),這對用戶來說并沒有增加任何負(fù)擔(dān)。2.為網(wǎng)絡(luò)安全出力現(xiàn)在人們越來越多地依賴于口令和密碼,隨著不同場合的頻繁應(yīng)用其缺陷越發(fā)明顯。在聲紋識別過程中,每次發(fā)音都由隨機(jī)產(chǎn)生的提示文本來控制,可有效地防止復(fù)制和剽竊,可以說,聲紋識別技術(shù)與其他生物識別技術(shù)相比有著明顯的優(yōu)勢,可以為日益發(fā)展的電子購物、電子商務(wù)、國際貿(mào)易保駕護(hù)航,且操作方便、簡潔,很容易為廣大計算機(jī)使用者接受。3.為破案立功對于各種電話勒索、綁架、電話人身攻擊等案件,聲紋識別技術(shù)可以在一段錄音中查找出嫌疑人,幫助對嫌疑人的查證。在美國,有關(guān)機(jī)構(gòu)還利用這一技術(shù)來判斷監(jiān)外執(zhí)行人員是否在其寓所中。4.在軍隊安全系統(tǒng)中的應(yīng)用聲紋識別技術(shù)可以辨認(rèn)出電話交談過程中是否有關(guān)鍵說話人出現(xiàn),繼而對交談的內(nèi)容進(jìn)行處理。另外,在通過電話發(fā)出軍事指令時,可以對發(fā)出命令的人的身份進(jìn)行確認(rèn)。-)產(chǎn)品:電話網(wǎng)絡(luò)語音身份認(rèn)證(聲紋認(rèn)證)及其通信服務(wù)軟件系統(tǒng)
經(jīng)過多年的艱苦努力,自主研發(fā)了技術(shù)領(lǐng)先的生物特征聲紋識別技術(shù)產(chǎn)品,它在電話、網(wǎng)絡(luò)和桌面電腦上,可以根據(jù)說話聲音自動識別該說話人的身份。由于聲音信號便于遠(yuǎn)程傳輸和獲取,因此語音生物特征認(rèn)證技術(shù)特別適合于基于電信和網(wǎng)絡(luò)的身份識別應(yīng)用。我們的技術(shù)產(chǎn)品能夠適應(yīng)交叉信道驗證,以及不同語音通道環(huán)境,如:固定電話、手機(jī)或免提電話、甚至VoIP軟件網(wǎng)絡(luò)電話;另外,在語音身份注冊和認(rèn)證的過程中,用戶完全可以采用自己熟練的任何方言或腔調(diào)來說話,不必限于標(biāo)準(zhǔn)普通話或粵語;只要說話自然流暢,一切隨心所愿。
連勁公司不僅提供易于集成的生物特征聲紋識別模塊軟件,更重要的是它可以提供從語音和數(shù)據(jù)通信、遠(yuǎn)程身份識別到后臺系統(tǒng)集成的整個軟件系統(tǒng)服務(wù)平臺(實際上是一個快速安裝,即可直接使用的軟件包),其中集成了連勁公司的語音和數(shù)據(jù)交互通信服務(wù)軟件(包括IVR,SMS,WEB,E-MAIL,數(shù)據(jù)庫等)。
該技術(shù)產(chǎn)品在電子金融、證券、社保、電信服務(wù)、監(jiān)獄管理、公安、軍隊及其他民用安全認(rèn)證等行業(yè)和部門有著廣泛的需求。
(二)連勁聲紋識別身份認(rèn)證產(chǎn)品的特點和優(yōu)勢:
--用戶使用簡單靈活和方便自然,無需特別的用戶操作培訓(xùn)。
--在語音身份注冊和認(rèn)證(包括連勁公司創(chuàng)造的防止錄音回放功能)的所有過程中,用戶完全可以采用自己熟練的任何方言或腔調(diào)來說話,不必限于標(biāo)準(zhǔn)普通話或粵語;只要說話自然流暢,一切隨用戶所愿。
--能夠適應(yīng)于不同的語音環(huán)境-無論用戶使用固定電話、手機(jī)或免提電話、甚至VoIP軟件網(wǎng)絡(luò)電話均能高效地進(jìn)行身份識別。
--能夠適應(yīng)交叉信道:用戶在某個語音裝置上完成注冊后,隨后使用其它類型的電話亦能完成準(zhǔn)確的身份識別。
--語音生物特征識別與個人密碼驗證的緊密結(jié)合,可以提供雙重因子安全認(rèn)證,進(jìn)一步加強(qiáng)安全強(qiáng)度和提高用戶信心。
--連勁不僅提供易于集成的識別模塊軟件,更重要的是它可以提供從語音通信、身份識別到后臺集成的整個軟件系統(tǒng)平臺(實際上是一個快速安裝,即可直接使用的軟件包)。
(三)人體生物特征語音聲紋認(rèn)證技術(shù)的特性:
與其他生物特征識別技術(shù)相比,語音生物特征識別除了具有不會遺失和忘記、不需記憶、不易偽造和模仿、使用方便等優(yōu)點外,還具有以下特性:
用戶接受程度高,由于不涉及隱私問題,用戶無任何心理障礙;適應(yīng)人群范圍廣,它與語言無關(guān),與方言腔調(diào)無關(guān)。
利用語音進(jìn)行身份識別可能是最自然和最經(jīng)濟(jì)的方法之一。聲音輸入設(shè)備僅僅依靠電話、手機(jī)或電腦麥克風(fēng),而其他生物識別技術(shù)的輸入設(shè)備往往造價昂貴。
聲音信號便于遠(yuǎn)程傳輸和獲取,在基于電信和網(wǎng)絡(luò)的身份識別應(yīng)用中,如電話銀行、電話炒股、電子購物等,與其他生物識別技術(shù)相比,語音特征識別更為擅長,得天獨厚。
該技術(shù)在金融、證券、社保、公安、軍隊及其他民用安全認(rèn)證等行業(yè)和部門有著廣泛的需求。
(四)電話和網(wǎng)絡(luò)通信時代的身份安全威脅
在電話和網(wǎng)絡(luò)通信時代,完全依靠簡單的密碼保護(hù)或手機(jī)短信號碼,來授權(quán)存取敏感信息或帳號,其實很不安全。目前通過網(wǎng)絡(luò)盜竊金融(銀行,信用卡等)帳號信息的犯罪越來越猖獗,主要的詐騙方式有:仿造金融機(jī)構(gòu)網(wǎng)站,利用電子郵件或短信等誘騙用戶登入該網(wǎng)站,從而竊取密碼和帳號信息;采用木馬病毒式的間諜軟件感染進(jìn)駐用戶個人電腦,記錄并轉(zhuǎn)發(fā)用戶敲擊鍵盤的每一個活動,從而竊取用戶敏感信息和帳號;另外,眾所周知,現(xiàn)在手機(jī)SIM卡可以很容易地被完全克隆。因此,我們的電話網(wǎng)絡(luò)語音身份認(rèn)證
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年滬教版必修3生物上冊階段測試試卷含答案
- 事業(yè)單位臨時工勞動合同范本
- 抗震及安全鑒定檢測工作技術(shù)服務(wù)合同(2篇)
- 房屋合同范本(2篇)
- 打疫苗農(nóng)業(yè)技術(shù)服務(wù)合同(2篇)
- 二零二五版農(nóng)用車綠色出行推廣計劃合同4篇
- 2025年度農(nóng)家樂旅游電子商務(wù)平臺建設(shè)與運營承包合同4篇
- 2025年度新能源電站運營派遣人員勞動合同3篇
- 2025版文化產(chǎn)業(yè)園投資建設(shè)與運營合同4篇
- 2025年度門面房屋租賃合同租賃房屋設(shè)施設(shè)備維護(hù)責(zé)任4篇
- 開展課外讀物負(fù)面清單管理的具體實施舉措方案
- 2025年云南中煙工業(yè)限責(zé)任公司招聘420人高頻重點提升(共500題)附帶答案詳解
- 2025-2030年中國洗衣液市場未來發(fā)展趨勢及前景調(diào)研分析報告
- 2024解析:第三章物態(tài)變化-基礎(chǔ)練(解析版)
- 北京市房屋租賃合同自行成交版北京市房屋租賃合同自行成交版
- 《AM聚丙烯酰胺》課件
- 系統(tǒng)動力學(xué)課件與案例分析
- 《智能網(wǎng)聯(lián)汽車智能傳感器測試與裝調(diào)》電子教案
- 客戶分級管理(標(biāo)準(zhǔn)版)課件
- GB/T 32399-2024信息技術(shù)云計算參考架構(gòu)
- 人教版數(shù)學(xué)七年級下冊數(shù)據(jù)的收集整理與描述小結(jié)
評論
0/150
提交評論