T-CQJR 006-2023 銀行業(yè)便民服務 方言智能服務技術要求_第1頁
T-CQJR 006-2023 銀行業(yè)便民服務 方言智能服務技術要求_第2頁
T-CQJR 006-2023 銀行業(yè)便民服務 方言智能服務技術要求_第3頁
T-CQJR 006-2023 銀行業(yè)便民服務 方言智能服務技術要求_第4頁
T-CQJR 006-2023 銀行業(yè)便民服務 方言智能服務技術要求_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

ICS03.060A11團Bankingconvenienceservice—Intelligentdialectservice—TecrequirementT/CQJR006—2023前言 II III 12規(guī)范性引用文件 13術語、定義和縮略語 14方言智能服務系統(tǒng)通用功能框架 25語音交互界面要求 25.1語音采集 25.2語音播報 35.3輸入輸出 35.4環(huán)境噪聲適應能力 35.5語種適應能力 36數(shù)據(jù)資源要求 36.1音頻數(shù)據(jù) 36.2文本數(shù)據(jù) 37前端處理要求 37.1語音喚醒 47.2聲源定位 47.3聲紋識別 47.4語音增強 47.5格式轉換 57.6重采樣 58語音處理要求 58.1語音處理概述 58.2語音模塊 58.3語義模塊 68.4知識庫模塊 79服務渠道 79.1服務渠道概述 79.2服務渠道功能概述 79.3電話銀行 79.4手機銀行 79.5網點智能機具 89.6普惠金融服務點及離行式便民金融服務終端 8參考文獻 9T/CQJR006—2023本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結構和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內容可能涉及專利。本文件的發(fā)布機構不承擔識別這些專利的責任。本文件由重慶農村商業(yè)銀行股份有限公司提出。本文件由重慶市金融學會歸口。本文件起草單位:重慶農村商業(yè)銀行股份有限公司、浙江網商銀行股份有限公司、重慶富民銀行股份有限公司、馬上消費金融股份有限公司。本文件主要起草人:周期律、田成志、鄭力、王超、游佳川、陸碧波、晏東、王衛(wèi)、楊瑩瑩、高硯、劉志強。T/CQJR006—2023“十四五”規(guī)劃綱要提出要“優(yōu)先發(fā)展農業(yè)農村,全面推進鄉(xiāng)村振興”,大量農村、老年人群不會上網、不會使用智能手機,在出行、就醫(yī)、消費等日常生活中遇到不便,無法充分享受智能化服務帶來的便利,“數(shù)字鴻溝”問題日益凸顯,中國人民銀行《金融科技發(fā)展規(guī)劃(2022-2025年)》明確“公平普惠”的基本原則,提出合理運用金融科技手段“彌合地域間、群體間、機構間的數(shù)字化鴻溝,讓金融科技發(fā)展成果更廣泛、更深入、更公平地惠及廣大人民群眾”,2022年《中國銀保監(jiān)會辦公廳關于銀行業(yè)保險業(yè)數(shù)字化轉型的指導意見》提出“推進個人金融服務數(shù)字化轉型”“加強大字版、語音版、民族語言版、簡潔版等應用軟件功能建設”。通過自然語言交互為社會各群體,尤其是農村地區(qū)和中老年客群,提供無障礙金融服務,是打通普惠金融最后一公里,助力鄉(xiāng)村振興戰(zhàn)略的有效途徑。全國各地方言種類眾多,通常分為十大方言:官話方言、晉方言、吳方言、閩方言、客家方言、粵方言、湘方言、贛方言、徽方言、平話土話。各方言區(qū)內又分布著若干次方言和許多種“土語”。其中使用人數(shù)最多的官話方言可分為東北官話、北京官話、冀魯官話、膠遼官話、中原官話、蘭銀官話、江淮官話、西南官話八種次方言。在復雜的方言區(qū)內,次方言可再分為“方言小片”,明確到某市、某縣、某鎮(zhèn)、某村。在方言使用率高的地區(qū)供給數(shù)字普惠金融服務,需要解決方言識別問題,針對地方方言進行適配,提供特色化方言智能語音服務。本文件在考慮上述情況的基礎上,給出了銀行業(yè)金融機構方言智能服務技術要求。1T/CQJR006—2023銀行業(yè)便民服務方言智能服務技術要求本文件規(guī)定了銀行方言智能服務要求,包括語音交互界面、前端處理、語音處理、服務接口、銀行服務渠道、數(shù)據(jù)資源等內容。本文件適用于銀行方言智能服務相關工作,包括但不限于產品設計、軟件研發(fā)、測試和運行維護、業(yè)務管理、系統(tǒng)管理、客戶服務等。2規(guī)范性引用文件下列文件中的內容通過文中的規(guī)范性引用而構成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T11460信息技術漢字字型要求和檢測方法GB18030信息技術中文編碼字符集GB/T21024—2007中文語音合成系統(tǒng)通用技術規(guī)范GB/T34083—2007中文語音識別互聯(lián)網服務接口規(guī)范GB/T34145—2007中文語音合成互聯(lián)網服務接口規(guī)范SJ/T11380—2008自動聲紋識別(說話人識別)技術規(guī)范ISO21586金融服務參考數(shù)據(jù)銀行產品服務(BPoS)描述規(guī)范(Referencedataforfinancialservices—Specificationforthedescriptionofbankingproductsorservices(BPoS))3術語、定義和縮略語下列術語和定義適用于本文件。3.1方言智能服務intelligentdialectservice基于人工智能方言識別技術,在線上線下各服務渠道(3.4),向客戶(3.3)提供銀行產品服務(3.2)。3.2銀行產品服務bankingproductorserviceBPoS供應商為滿足客戶的金融需求或與金融相關的需求而向客戶(3.3)提供的輸出。[來源:ISO21586:2020,3.3]3.3客戶customer期望獲得,或已經獲得某BPoS(3.2)(即銀行產品或銀行服務)的個人或組織。[來源:ISO21586:2020,3.5]2T/CQJR006—20233.4服務渠道servicechannel提供方言智能服務(3.1)的電子銀行渠道,包括電話銀行、手機銀行、自助機具等。4方言智能服務系統(tǒng)通用功能框架方言智能服務系統(tǒng)(以下簡稱系統(tǒng))包括語音交互界面、前端處理、語音處理、服務接口、銀行服務渠道、銀行金融業(yè)務處理、數(shù)據(jù)資源等功能單元,系統(tǒng)宜在金融機構本地部署,其中:a)語音交互界面提供系統(tǒng)與人直接進行語音交互的人機界面,包括語音信號輸入、輸出以及由前端處理、語音處理支撐的語音能力;b)數(shù)據(jù)資源包括系統(tǒng)處理的音頻數(shù)據(jù)和文本數(shù)據(jù);c)前端處理提供語音喚醒、聲源定位、聲紋識別、語音增強、格式轉換、重采樣等功能;d)語音處理提供語音模塊、語義模塊、知識庫模塊對語音的單獨處理及聯(lián)動調優(yōu);e)服務接口提供外部設備/設施調用系統(tǒng)語音服務的接口;f)銀行金融業(yè)務處理對語音處理結果轉換為對應的應用指令并反饋業(yè)務響應結果;g)銀行服務渠道包括電話銀行、手機銀行、網點智能機具、便民金融服務終端等電子服務渠道。圖1方言智能服務系統(tǒng)通用功能框架5語音交互界面要求5.1語音采集系統(tǒng)應通過傳聲器或者麥克風陣列等具備語音采集能力的拾音設備對語音進行采集;宜根據(jù)不同的拾音距離,提供近場拾音和/或遠場拾音中的一種。并滿足如下要求:3T/CQJR006—2023——通過手機銀行APP、直銷銀行APP等移動金融客戶端應用服務渠道采集語音應征得客戶同意,并且僅在提供服務時進行語音采集;——通過網點智能柜員機、離行式便民金融服務終端等智能機具服務渠道采集語音,系統(tǒng)可盡量復用現(xiàn)有機具和拾音設備,在現(xiàn)有設備不能滿足服務需求時,應新增拾音設備。5.2語音播報系統(tǒng)應通過音頻播放設備對語音進行播報,滿足以下要求——語音播報宜同步提供播報文本顯示,供客戶核對業(yè)務辦理信息;——應支持播放語音所需的性能要求,如音頻格式、帶寬等;——支持語音播放調節(jié)功能,能夠對語音播放速度、音量等進行調節(jié)。5.3輸入輸出系統(tǒng)應支持中文普通話及地方方言輸入輸出。5.4環(huán)境噪聲適應能力系統(tǒng)應在銀行營業(yè)網點、離行式便民金融服務終端等服務渠道正常環(huán)境噪音下能進行語音交互,確保人機交互可用。5.5語種適應能力系統(tǒng)可由低到高提供以下幾個等級普通話/方言適應能力,宜支持c)中適應能力。a)在發(fā)起語音交互時,由客戶選擇接受方言或普通話服務;b)系統(tǒng)自動判斷客戶使用方言/普通話,提供相應語種服務;c)系統(tǒng)自適應提供方言/普通話服務,支持客戶方言/普通話混用。6數(shù)據(jù)資源要求6.1音頻數(shù)據(jù)系統(tǒng)音頻數(shù)據(jù)主要用于語音識別和語音合成,要求如下:——宜采集地方方言音頻數(shù)據(jù),訓練方言識別模型,或者在方言區(qū)、次方言通用模型基礎上,采集地方方言音頻數(shù)據(jù)進行增量訓練;——在銀行金融機構內部場景采集的音頻數(shù)據(jù)宜在行內本地存儲;——語音識別的輸入音頻數(shù)據(jù)格式應符合GB/T34083—2017中表1的要求;——語音合成的輸出音頻數(shù)據(jù)格式應符合GB/T34083—2017中表1的要求。6.2文本數(shù)據(jù)系統(tǒng)的文本數(shù)據(jù)主要用于各功能單元之間的信息傳輸、交換和共享,要求如下:——應與具體操作系統(tǒng)和平臺無關,并且可擴展;——宜是結構化數(shù)據(jù),便于系統(tǒng)處理;——中文編碼字符應符合GB18030的規(guī)定,并依據(jù)GB/T11460進行檢測;——中文語音合成數(shù)據(jù)交換格式應符合GB/T21024—2007中第5章的要求。7前端處理要求4T/CQJR006—20237.1語音喚醒7.1.1命令字喚醒——系統(tǒng)應支持使用預先定義的命令字來對系統(tǒng)進行語音喚醒;——系統(tǒng)宜支持普通話和方言命令字語音喚醒;——不同銀行服務渠道預定義語音喚醒命令字宜保持一致。7.1.2自定義喚醒命令字在手機銀行等客戶自有設備服務渠道,系統(tǒng)宜支持客戶自定義語音喚醒命令字。7.1.3多喚醒命令字系統(tǒng)宜支持使用不同命令字進行語音喚醒;可根據(jù)指定的喚醒命令字進入對應的業(yè)務辦理狀態(tài)或模式。7.1.4多音頻流監(jiān)聽系統(tǒng)在進行語音喚醒時,應支持同時監(jiān)聽多個音頻流。7.2聲源定位系統(tǒng)應支持通過對聲源的平面角、方位角和聲源距離的計算,來對發(fā)聲源進行定位。7.3聲紋識別7.3.1一般要求系統(tǒng)應支持下列聲紋識別功能:——文本相關的聲紋識別;——文本無關的聲紋識別;——指定文本的聲紋識別;——聲紋模型訓練;——聲紋模型自適應;——聲紋確認;——聲紋辨認;——聲紋檢出;——聲紋追蹤;——語言相關的聲紋識別;——語言無關的聲紋識別;上述功能描述和要求應符合SJ/T11380—2008第3章的要求。7.3.2聲紋文本獲取系統(tǒng)應支持獲取指定文本音頻庫或自定義文本音頻庫,用于聲紋模型訓練、聲紋模型自適應、聲紋確認和聲紋辨認。7.3.3聲紋輔助身份認證在滿足法律法規(guī)和監(jiān)管要求的前提下,可通過聲紋識別輔助客戶身份認證。7.4語音增強7.4.1噪聲抑制5T/CQJR006—2023系統(tǒng)應支持對輸入語音中的背景噪聲進行抑制,提高語音的信噪比。7.4.2混響消除系統(tǒng)應支持對輸入語音中的晚期混響進行抑制,提升語音信號的清晰度和可懂度。7.5格式轉換系統(tǒng)應支持將音頻的格式轉換到另外一種格式,以滿足語音處理的要求。7.6重采樣系統(tǒng)應支持改變數(shù)字語音信號的采樣率,以滿足語音處理的要求。8語音處理要求8.1語音處理概述系統(tǒng)宜聯(lián)動語音、語義、知識庫模塊,對語音識別進行聯(lián)動調優(yōu),提升方言識別準確率。8.2語音模塊8.2.1客戶語音識別要求系統(tǒng)宜支持下列客戶語音識別:——使用普通話;——使用地方方言;——普通話和地方方言混用;——使用帶有方言口音的普通話;8.2.2語音識別模型官話方言等與普通話相近的地方方言,宜使用“普通話—方言”混合模型,與普通話差異較大的地方方言宜使用“先分類—后識別”分類識別模型。8.2.3語音識別功能系統(tǒng)應支持下列全部或者大部分語音識別功能:——自定義語法;——個性化識別;——識別結果多候選;——自定義熱詞;——自定義同義詞庫;——自定義錯別字詞庫;——識別結果進階;——語音信息識別;——說話人信息識別。6T/CQJR006—20238.2.4話者分流在理財銷售雙錄等雙人對話或多人會話場景下,系統(tǒng)應支持按說話人將語音信息分流。8.2.5遠近場音頻處理涉及客戶個人信息、金融交易信息的服務場景,應使用近場音頻處理,避免客戶信息泄露;8.2.6語音識別方式系統(tǒng)應支持關鍵字識別、命令字識別及連續(xù)語音識別。8.2.7語音合成類型系統(tǒng)宜支持下列一種或多種類型語音合成:——普通話語音合成;——方言語音合成;——男聲語音合成;——女聲語音合成;——多種音色語音合成;——多種音調語音合成;——多種語速語音合成;——多種語氣語音合成。8.2.8語音合成功能系統(tǒng)應支持下列全部或大部分語音合成功能:——流式語音合成;——多種合成文本編碼;——自定義分詞;——自定義讀音;——合成文本位置信息;——文本分詞和拼音信息;——音頻時間信息。上述功能描述和要求應符合GB/T34145—2017中4.2和4.3的要求。8.3語義模塊8.3.1自定義語義詞典系統(tǒng)能支持自定義語義詞典。8.3.2自定義語義庫系統(tǒng)能支持自定義語義庫。8.3.3語義聯(lián)動調優(yōu)系統(tǒng)宜支持通過模糊識別、語義抽取、語義排序等方式糾正方言語音識別錯誤,理解用戶意——模糊識別,系統(tǒng)應能夠處理錯別字、同義字、多字少字問題?!Z義抽取,系統(tǒng)在交互過程中,應抽取語義要素和用戶的關鍵意圖?!Z義排序,系統(tǒng)能在語義理解結果中給出多個排序后的理解結果,供用戶進行選擇或二次確認。7T/CQJR006—20238.4知識庫模塊8.4.1知識類型應支持以下類型知識:——文庫或/和文檔;——FAQ(常見問題解答);——百科類知識圖譜。8.4.2知識構建方法可支持以下幾個等級知識構建方法,宜采用b)、c)知識構建方法:a)人工知識構建;b)半自動知識構建,在執(zhí)行自動知識抽取后,由人工校對錄入;c)全自動知識構建。8.4.3知識庫聯(lián)動調優(yōu)在方言語音識別效果不佳時,可以通過知識檢索引導客戶,明確客戶意圖。9服務渠道9.1服務渠道概述金融機構應宜以下一個或多個服務渠道提供方言智能服務:——電話銀行;——手機銀行;——網點智能機具;——普惠金融服務點及離行式便民金融服務終端。9.2服務渠道功能概述各服務渠道宜提供以下一項或多項方言智能服務功能:——方言智能導航(IVR),客戶可通過方言語音命令導航至所需服務;——方言智能填單,客戶可通過方言語音輸入文本信息,系統(tǒng)自動識別填寫;——方言對話交互,客戶可使用方言語音與系統(tǒng)進行自然語言交互,支持單輪問答、多輪對話;——方言智能控制,客戶可使用方言控制交互UI界面、物聯(lián)網設備等;——方言播報,可使用方言播報業(yè)務辦理信息、人機交互信息。9.3電話銀行電話銀行渠道方言服務宜滿足如下要求:——宜同時提供方言智能語音服務及按鍵式服務供客戶選擇;——宜提供方言智能導航、方言智能填單、方言對話交互功能;——客戶可通過方言語音命令切換到人工服務;——宜在客戶使用方言智能填單輸入身份證號、銀行卡號、交易金額等信息后,語音播報填單信息,由客戶確認;——不應使用語音輸入交易密碼等敏感信息。9.4手機銀行手機銀行等移動金融客戶端應用渠

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論