




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
ICS:33.160CCS:M61Technicalrequirementsforgradingthequalityof3-DimensionaldigitalhumanIT/UWA019-2023 12規(guī)范性引用文件 13術(shù)語和定義 13.13D數(shù)字人(3-Dimensionaldigitalhuman) 13.2擬真度(fidelity) 13.3精細(xì)度(detail) 13.4唇動效果(lipsync) 13.5自然度(naturalness) 13.6幀率(framerate) 23.7分辨率(resolution) 24縮略語 25分級參數(shù) 25.1人物效果 35.2識別和感知 45.3交互和決策 463D真人形象數(shù)字人分級 56.13D真人形象數(shù)字人分級原則 56.23D真人形象數(shù)字人細(xì)分指標(biāo)分級標(biāo)準(zhǔn) 56.33D真人形象數(shù)字人總體分級標(biāo)準(zhǔn) 7 83D真人形象數(shù)字人分級參數(shù)計算方法建議 8T/UWA019-2023本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》給出的規(guī)則起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別這些專利的責(zé)任。本文件由世界超高清視頻產(chǎn)業(yè)聯(lián)盟提出并歸口。本文件主要起草單位:中國移動通信集團(tuán)有限公司、咪咕文化科技有限公司、北京清博智能科技有限公司、深圳思謀信息科技有限公司、中國電子技術(shù)標(biāo)準(zhǔn)化研究院、中國信息通信研究院、北京百度網(wǎng)訊科技有限公司、上海數(shù)字電視國家工程研究中心有限公司、OPPO廣東移動通信有限公司、深圳市洲明科技股份有限公司、京東方科技集團(tuán)股份有限公司、聚好看科技股份有限公司、中興通訊股份有限公司、中央廣播電視總臺、凌云光技術(shù)股份有限公司、華為技術(shù)有限公司、深圳市騰訊計算機(jī)系統(tǒng)有限公司、深圳市奧拓電子股份有限公司、北京三星通信技術(shù)研究有限公司、山東浪潮超高清智能科技有限公本文件主要起草人:李琳、單華琦、畢蕾、高山、王雷、朱泓、李錦枝、向安玲、李亭竹、張亞男、趙軼、劉志杰、李婧欣、耿一丹、傅蓉蓉、劉毓偉、許聞苑、查麗、殷惠清、史夢蕾、來航曼、康峰、白瑩杰、譚勝淋、陳于思、楊智遠(yuǎn)、朱家林、李秋婷、黃成、王子建、譚陽、范曉軒、李丹、熊偉、曾義、陳曦、胡穎、吳未、孫信中、王立眾、吳越、王培元、王宗增。1T/UWA019-2023本文件規(guī)定了3D真人形象數(shù)字人視覺和交互效果的分級方法。本文件適用于對3D真人形象數(shù)字人應(yīng)用效果作出分級,用于為供需雙方根據(jù)場景需求選擇數(shù)字人產(chǎn)品提供參考。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T21023-2007中文語音識別系統(tǒng)通用技術(shù)規(guī)范GB/T36464.4-2018信息技術(shù)智能語音交互系統(tǒng)第4部分:移動終端GY/T307-2017超高清晰度電視系統(tǒng)節(jié)目制作和交換參數(shù)值T/UWA012.6-2022“百城千屏”超高清視音頻傳播系統(tǒng)網(wǎng)絡(luò)傳輸技術(shù)要求3術(shù)語和定義下列術(shù)語以及定義適用于本文件。3.13D數(shù)字人(3-Dimensionaldigitalhuman)利用3D技術(shù)在數(shù)字世界創(chuàng)建的具有人類外貌、語音、動作和交互能力的數(shù)字人物。注1:3D數(shù)字人可以通過語音、姿態(tài)、面部表情等多種方式與用戶進(jìn)行交互,具有智能問答、情感識別、語音合成等功能,能夠模擬真實人類的行為和反應(yīng)。注2:3D數(shù)字人可以在虛擬現(xiàn)實、增強(qiáng)現(xiàn)實、視頻游戲、娛樂和教育等領(lǐng)域中應(yīng)用。注3:基于數(shù)字技術(shù),在數(shù)字世界具備擬人化外形的三維立體的數(shù)字人。注4:3D數(shù)字人的應(yīng)用領(lǐng)域越來越廣泛,可以用于虛擬演員、虛擬營銷、虛擬導(dǎo)游、虛擬醫(yī)生、虛擬教師等多個領(lǐng)域。3.2擬真度(fidelity)用于評價虛擬世界中的計算機(jī)圖像、3D模型、動畫或游戲的真實感和逼真程度的度量指標(biāo)。它反映了數(shù)字世界與現(xiàn)實世界之間的相似程度。3.3精細(xì)度(detail)指的是圖像、模型或場景中細(xì)節(jié)的數(shù)量和質(zhì)量。在計算機(jī)圖形學(xué)和計算機(jī)視覺領(lǐng)域,精細(xì)度是衡量渲染質(zhì)量和模型準(zhǔn)確性的重要指標(biāo)之一。3.4唇動效果(lipsync)是指在動畫和特效制作中,通過模擬和表現(xiàn)人物的嘴唇運動和發(fā)音過程,使其與配音內(nèi)容同步,增強(qiáng)人物形象的真實感和表達(dá)能力。3.5自然度(naturalness)2T/UWA019-2023自然度是指一個言語或行為的表現(xiàn)是否符合自然、真實、真誠的程度。在人工智能領(lǐng)域,自然度可以用來評估機(jī)器人或語音助手的交流能力和人機(jī)交互的質(zhì)量。一個具有高自然度的智能機(jī)器人能夠以流暢、自然的方式與用戶交流,使用適當(dāng)?shù)恼Z言和表情回答問題,給予用戶滿意的體驗。自然度不僅僅涉及語言和語音的準(zhǔn)確性,還包括機(jī)器人的情感表達(dá)能力、語調(diào)和語速的調(diào)節(jié)、上下文的理解和適當(dāng)?shù)幕貞?yīng)等方面。3.6幀率(framerate)是指在一秒鐘內(nèi)顯示的圖像幀數(shù),是衡量圖像流暢度和流暢度的重要指標(biāo)。3.7分辨率(resolution)分辨率是指圖像或視頻中可顯示的細(xì)節(jié)數(shù)量,通常以像素為單位表示。3.8面部動畫參數(shù)(FAP)是指控制面部的關(guān)鍵特征點,這些特征點用于生成動畫視位和面部表情,以及頭部和眼睛的運動。這些特征點是MPEG-4定義的面部定義參數(shù)的一部分1。FAP表示特征點相對于中性面部位置的66個位 移和旋轉(zhuǎn),其定義為嘴巴閉合、眼瞼與虹膜相切、視線和頭部方向正前方、牙齒接觸、舌頭接觸牙齒。這些FAP被設(shè)計為與人類面部肌肉運動密切相關(guān)。3.9身體動畫參數(shù)(BAP)是指控制身體關(guān)節(jié)的關(guān)鍵特征點。這些特征點是MPEG-4定義的面部定義參數(shù)的一部分1。MPEG-4定義了168個身體動畫參數(shù),描述幾乎所有可能的身體姿勢,其中12個參數(shù)描述了每個手臂的運動,而29個參數(shù)描述了每個手的運動。4縮略語下列縮略語適用于本文件。3D三維(3-Dimensional)FAP面部動畫參數(shù)FaceAnimationParameterBAP身體動畫參數(shù)BodyAnimationParameterFPS畫面每秒傳輸幀數(shù)FramePerSecond5分級參數(shù)隨著計算機(jī)圖形和動畫技術(shù)的發(fā)展,3D數(shù)字人類已經(jīng)廣泛應(yīng)用于電影、游戲和虛擬現(xiàn)實等行業(yè)。然而,數(shù)字人類的呈現(xiàn)和交互質(zhì)量存在較大差異,目前缺乏普遍的評估標(biāo)準(zhǔn)來評估其體驗效果。因此,有必要開發(fā)綜合評估數(shù)字人類效果的方法,以確保其高質(zhì)量和可用性,在促進(jìn)數(shù)字人類產(chǎn)業(yè)發(fā)展的同時,增強(qiáng)各種應(yīng)用中的用戶體驗。3T/UWA019-2023圖1數(shù)字人基于用戶體驗質(zhì)量的三個維度基于用戶體驗,可以分為三個維度的指標(biāo)參數(shù)。角色效果:用戶能察覺的數(shù)字人形特征,目前主要包括視覺和聽覺方面;識別感知:數(shù)字人形識別和察覺用戶和外部環(huán)境輸入信息的能力,例如語音轉(zhuǎn)文字準(zhǔn)確率、人臉識別率、情緒識別準(zhǔn)確率等;互動決策:數(shù)字人形與用戶“自主”互動的能力,例如對話交互完成率、表情反饋正確率、肢體反饋正確率等指標(biāo)。5.1人物效果1.面部擬真度用來表征3D真人形象數(shù)字人面部擬人化的程度。指3D數(shù)字人或虛擬角色面部表情、結(jié)構(gòu)、動作等人形特征與真實人類相似的程度。范圍是1-100%,數(shù)值越大相似程度越高。2.視覺精細(xì)度用來表征3D真人形象數(shù)字人形象的精細(xì)程度。包括3D真人形象數(shù)字人模型的毛發(fā)、牙齒、皮膚等細(xì)節(jié)呈現(xiàn)程度。范圍是1-100%,數(shù)值越大,視覺內(nèi)容越豐富,精細(xì)度越高。3.面目動態(tài)效果用來表征3D真人形象數(shù)字人可呈現(xiàn)的表情豐富度,用面部動畫參數(shù)個數(shù)量化,個數(shù)越多,可以表達(dá)的表情越豐富,數(shù)值為是0~66個。4.唇動效果用來表征3D數(shù)字人說話時嘴唇動態(tài)效果。著重分析嘴唇運動和發(fā)音過程,使其與配音內(nèi)容同步,增強(qiáng)人物形象的真實感和表達(dá)能力。范圍是1-100%,數(shù)值越大,唇動效果越好。5.文字轉(zhuǎn)語音準(zhǔn)確率用來表征3D真人形象數(shù)字人語音合成并播放時的準(zhǔn)確率。范圍是1-100%,數(shù)值越大,準(zhǔn)確度越高。計算方法如公式(1)所示:文字轉(zhuǎn)語音準(zhǔn)確率=符合EQ\*jc3\*hps14\o\al(\s\up5(條件的測定值),總測定值個數(shù))個數(shù)×100%………………(1)4T/UWA019-20236.語音自然度用來表征3D數(shù)字人語音合成或真人發(fā)音的感知自然度。參考GB/T36464.4-2018《信息技術(shù)智能語音交互系統(tǒng)第4部分:移動終端》的5.2.3章節(jié)內(nèi)容進(jìn)行評測,評測方法是主觀評測,取值是1~5,其中5是最優(yōu)。7.肢體動作效果用來表征3D真數(shù)字人動作豐富度,用身體動畫參數(shù)個數(shù)來度量,個數(shù)越多則動作豐富度越高。取值范圍為0~168。8.組合肢體動作自然度用來表征3D數(shù)字人組合肢體動作的自然流暢度。范圍是1-100%,數(shù)值越大,唇動效果越好。9.幀率用來表征3D真人形象數(shù)字呈現(xiàn)圖像的流暢度。以每秒幀數(shù)(FPS)為單位來表示。10.分辨率用來表征3D真人形象數(shù)字呈現(xiàn)圖像的細(xì)節(jié)梳理。以像素為單位表示,圖像寬度和高度的像素點個數(shù)。5.2識別和感知1.語音識別準(zhǔn)確性指3D數(shù)字人對用戶進(jìn)行語音識別的性能表現(xiàn)。其性能表現(xiàn)依據(jù)系統(tǒng)中語音識別用途的不同,分別按照GB/T21023-2007中的5.2.1、5.2.2、5.2.3進(jìn)行評估。2.人臉識別率指3D數(shù)字人對用戶進(jìn)行語音識別的性能表現(xiàn)。用3D數(shù)字人在進(jìn)行人臉識別的過程中正確識別人臉的概率表示,范圍為0-100%。3.情緒識別準(zhǔn)確率用來表征3D數(shù)字人對用戶在積極、消極、中立三類情緒識別的準(zhǔn)確率,計算方法為正確識別用戶對話情緒樣本數(shù)占總樣本數(shù)的概率,范圍為0-100%。5.3交互和決策1.對話交互完成率用來表征3D數(shù)字人和用戶對話的能力。計算方法為3D真人形象數(shù)字人在與用戶進(jìn)行對話交互時能夠正確理解用戶意圖并能給出相應(yīng)回答的比率,范圍0-100%。2.表情反饋正確率用來表征3D數(shù)字人和用戶表情交互過程中能正確理解用戶表情并反饋正確表情的能力。計算方法為3D真人形象數(shù)字人在與用戶進(jìn)行表情交互時能夠正確理解用戶表情并反饋正確表情的比率,范圍0-100%。3.動作反饋正確率5T/UWA019-2023用來表征3D數(shù)字人和用戶表情交互過程中能正確理解用戶動作并反饋正確肢體動作的能力。計算方法為用戶對3D真人形象數(shù)字人肢體交互時數(shù)字人能夠正確理解用戶動作并反饋合適動作的比率,范圍0-100%。4.對話、表情、肢體行動的一致性用于考核數(shù)字人固定時長(單位:s)視頻中音、容、行三項的匹配度,若出現(xiàn)音頻提前、表情多余、缺失,肢體動作延遲、肢體動作錯位等均視為不匹配。在標(biāo)準(zhǔn)評測時間內(nèi),EN代表出現(xiàn)音頻提前、表情多余、缺失,肢體動作延遲、肢體動作錯位等錯誤數(shù)所占時長,T代表總時長,F(xiàn)代表總分值100。計算方法如公式(2)所示:S=F××100%………………(2)5.平均卡頓時長用來考核3D數(shù)字人和用戶交互的流暢程度,與數(shù)字人交互過程中,發(fā)生卡頓的平均時長,包括視頻畫面卡頓、語音動作不匹配的感知卡頓、語音卡頓等認(rèn)為不流暢。計算方法為在標(biāo)準(zhǔn)評測時間內(nèi),獲取單次卡頓時長(記為ti,即本次開始出現(xiàn)卡頓到本次卡頓結(jié)束的時間差)和卡頓次數(shù)。計算方法如公式(3)所示,單位為秒/次:平均卡均卡頓=Σ(ti)卡頓總次數(shù)………………(3)63D數(shù)字人分級6.13D數(shù)字人分級原則隨著數(shù)字人技術(shù)的不斷發(fā)展,越來越多的應(yīng)用場景需要數(shù)字人具備高度的真實感和交互性。因此,對3D數(shù)字人視覺與交互效果的評估成為了數(shù)字人技術(shù)發(fā)展的重要一環(huán)。通過建立統(tǒng)一的評估標(biāo)準(zhǔn)和方法,可以規(guī)范數(shù)字人行業(yè),提高數(shù)字人質(zhì)量,推動數(shù)字人技術(shù)在虛擬現(xiàn)實、游戲、教育、醫(yī)療、娛樂等領(lǐng)域的廣泛應(yīng)用。本章基于前面3D數(shù)字人指標(biāo)的詳細(xì)說明,以及附錄提供的計算方法建議,對3D數(shù)字人進(jìn)行分級。在從總分級之前,先完成3D數(shù)字人細(xì)分指標(biāo)人物效果、識別感知、交互決策三個維度的分級,這三個維度分別涵蓋了數(shù)字人的不同方面,可以提供更詳細(xì)和具體的評估結(jié)果。通過將數(shù)字人分成這三個維度并進(jìn)行分級,可以更準(zhǔn)確地評估數(shù)字人在不同方面的表現(xiàn)和能力,幫助用戶選擇適合自己需求的數(shù)字人,并提供有針對性的反饋和建議,提高用戶體驗。6.23D數(shù)字人細(xì)分指標(biāo)分級標(biāo)準(zhǔn)1.3D數(shù)字人人物效果分級要求人物效果主要評估的是數(shù)字人的外觀和表現(xiàn)。這包括外貌、語音、動作等方面,以及與真實人物的相似度和真實感。人物效果的好壞會影響用戶對數(shù)字人的接受程度。主要是應(yīng)用在影視制作、廣告宣傳、數(shù)字人播報等非交互場景數(shù)字人的評級。分級具體要求見表1:表1數(shù)字人人物效果分級要求一級指標(biāo)二級指標(biāo)分級(范圍)6T/UWA019-2023人物效果面部擬真度0-39%40%-59%60%-79%80%-89%90%-100%視覺精細(xì)度0-39%40%-59%60%-79%80%-89%90%-100%基礎(chǔ)表情數(shù)量0-2930-3940-4950-6566唇動效果0-56-89-11文字轉(zhuǎn)語音準(zhǔn)確率0-39%40%-59%60%-79%80%-98%99%-100%語音自然度12345基礎(chǔ)肢體動作數(shù)量0-7576-115116-155156-195肢體動作自然度0-39%40%-59%60%-79%80%-89%90%-100%幀率(FPS)0-2425-3940-4950-119分辨率不足1920*1080/2048*1080,1920*1080/2048*4K8K2.3D真人形象數(shù)字人識別感知分級要求識別感知是指數(shù)字人對周圍環(huán)境和用戶的感知能力。它包括語音識別、圖像識別、情感識別等技術(shù),在與用戶交互的過程中,能夠準(zhǔn)確地理解用戶的需求和指令。主要是應(yīng)用在基于環(huán)境識別感知場景的數(shù)字人、如智能輸入助手、智能家居等。分級具體要求見表2:表2數(shù)字人識別感知分級要求一級指標(biāo)二級指標(biāo)分級識別和感知人臉識別誤識率0-39%40%-59%60%-79%80%-98%99%-100%語音轉(zhuǎn)文字準(zhǔn)確率0-39%40%-59%60%-79%80%-98%99%-100%情緒識別準(zhǔn)確率0-39%40%-59%60%-79%80%-98%99%-100%3.3D真人形象數(shù)字人交互決策分級要求交互決策是指數(shù)字人在特定情境下根據(jù)用戶需求做出的反應(yīng)和決策能力。這包括從用戶提供的信息中進(jìn)行分析和推理,做出適當(dāng)?shù)幕貞?yīng)或提供合適的建議等,主要用戶智能客服、數(shù)字員工等場景。分級具體要求見表3:表3數(shù)字人交互決策分級要求一級指標(biāo)二級指標(biāo)分級交互和決策對話交互完成率0-39%40%-59%60%-79%80%-98%99%-100%7T/UWA019-2023表情反饋正確率0-39%40%-59%60%-79%80%-98%99%-100%肢體反饋正確率0-39%40%-59%60%-79%80%-98%99%-100%對話、表情、肢體反饋的一致性0-39%40%-59%60%-79%80%-89%90%-100%平均卡頓時長(秒)7-104-62-30-16.33D數(shù)字人總體分級標(biāo)準(zhǔn)數(shù)字人系統(tǒng)按照其應(yīng)用場景和具體需求,其包含的評測指標(biāo)也會有差異。具體指標(biāo)的要求如下。表4數(shù)字人分級標(biāo)準(zhǔn)一級指標(biāo)二級指標(biāo)總體分級人物效果面部擬真度●●●●●視覺精細(xì)度●●●●●基礎(chǔ)表情數(shù)量●●●●●唇動效果●●●●●文字轉(zhuǎn)語音準(zhǔn)確率●●●●●語音自然度●●●●●基礎(chǔ)肢體動作數(shù)量●●●●●肢體動作自然度●●●●●幀率●●●●●分辨率●●●●●識別和感知人臉識別誤識率○○○●●語音轉(zhuǎn)文字準(zhǔn)確率○○○●●情緒識別準(zhǔn)確率○○○●●交互和決策對話交互完成率○○○●●表情反饋正確率○○○●●動作反饋正確率○○○●●對話、表情、動作反饋的一致性○○○●●平均卡頓時長○○○●●8T/UWA019-2023附錄A(資料性附錄)3D數(shù)字人分級參數(shù)計算方法建議數(shù)字人分級指標(biāo)計算方法建議見下表:附表A.1數(shù)字人分級技術(shù)要求一級指標(biāo)二級指標(biāo)細(xì)分指標(biāo)測算方式和參數(shù)說明(做到附錄)人物效果形象效果面部擬真度抽取N張數(shù)字人圖片①使用經(jīng)過LFW2人臉數(shù)據(jù)訓(xùn)練的StyleGan3生成對抗網(wǎng)絡(luò)中的判別器對數(shù)字人人臉進(jìn)行評分使用1000張示例作為分箱標(biāo)準(zhǔn),對最終圖片的人臉擬真度進(jìn)行分箱②給k(k>=10)位有專業(yè)背景知識的測試人員進(jìn)行分箱判斷③主客觀一致性比率=算法與測試人員N*100%視覺精細(xì)度抽取N張數(shù)字人圖片①通過圖像清晰度算法計算數(shù)字人的不同位置圖片的精細(xì)程度,對不同位置的銳度根據(jù)視覺的重要程度進(jìn)行加權(quán)計算作為最終的視覺精細(xì)度,對最終加權(quán)的精細(xì)度得分進(jìn)行分箱得出分值②給k(k>=10)位有專業(yè)背景知識的測試人員進(jìn)行分箱判斷③主客觀一致性比率=算法與測試人員N*100%表情效果面部動態(tài)豐富度參考MPEG-4FacialAnimation:TheStandard,ImplementationandApplications.Wiley.pp.17–55.ISBN978-0-470-84465-6.唇動效果對數(shù)字人說話的視頻片段進(jìn)行評測,用打點計數(shù)的方式來統(tǒng)計,N初始值為0,唇動效果不好的字則N=N+1,根據(jù)統(tǒng)計結(jié)果計算準(zhǔn)確率=(總字?jǐn)?shù)-N)/總字?jǐn)?shù)*100%23/NVlabs/stylegan9T/UWA019-2023語音效果文字轉(zhuǎn)語音準(zhǔn)確率對采用語音合成技術(shù)的數(shù)字人視頻片段進(jìn)行評測,點計數(shù)的方式來統(tǒng)計,N初始值為0,發(fā)音不準(zhǔn)確、發(fā)音錯誤的字記為N=N+1,準(zhǔn)確率=(總字?jǐn)?shù)-N)/總字?jǐn)?shù)*100%語音自然度參考GB/T36464.4-2018《信息技術(shù)智能語音交互系統(tǒng)第4部分:移動終端》動作效果肢體動作豐富度參考MPEG-4FacialAnimation:TheStandard,ImplementationandApplications.Wiley.pp.17–55.ISBN978-0-470-84465-6.肢體動作自然度抽取N張數(shù)字人圖片Human3.6M4動作庫,對3D動態(tài)數(shù)字人進(jìn)行識別,跟蹤其動作,并觀察穿模的數(shù)量點對識別后的動作骨骼進(jìn)行計算并分析各數(shù)字人活動的自由度數(shù)量使用1000張示例作為分箱標(biāo)準(zhǔn),對自由度數(shù)量進(jìn)行分箱得出分值②給k(k>=10)位有專業(yè)背景知識的測試人員進(jìn)行分箱判斷③主客觀一致性比率=算法與測試人員N*100%呈現(xiàn)效果幀率GY/T307-2017超高清晰度電視系統(tǒng)節(jié)目制作和交換參數(shù)值中的3.超高清晰度電視節(jié)目制作基本參數(shù)T/UWA012.6-2022“百城千屏”超高清視音頻傳播系統(tǒng)節(jié)目播出技術(shù)要求中的6.超高清播出節(jié)目視頻信號技術(shù)要求分辨率識別和感知人臉識別人臉識別率基于基準(zhǔn)的LFW2人臉數(shù)據(jù)集供數(shù)字人識別,判斷其識別的準(zhǔn)確率使用1000張示例作為分箱標(biāo)準(zhǔn),對識別百分?jǐn)?shù)進(jìn)行分箱語音識別語音識別準(zhǔn)確性參考GB/T21023-2007《中文語音識別系統(tǒng)通用技術(shù)規(guī)范》參考ISO9241-154:2013:Ergonomicsofhuman-systeminteraction—Part154:Interactivevoiceresponse(IVR)applications情緒識別情緒識別準(zhǔn)確率①基于多語言情感分析算法和UniversalDependencyTreebanks數(shù)據(jù)庫5,通過語音4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合資企業(yè)合同范本
- saas代理合同范本
- 南山鋁業(yè)合同范本
- 專業(yè)閥體采購合同范本
- 單位購柴油合同范例
- 和孩子簽合同范本
- 包裝禮盒合同范本
- 合同范例法院起訴
- 農(nóng)村木炭出售合同范本
- 變更購房合同范本
- 小學(xué)道德與法治-《改革創(chuàng)新謀發(fā)展》教學(xué)課件設(shè)計
- 2022年電鍍園區(qū)規(guī)范管理方案1122
- 氣管鏡進(jìn)修個人總結(jié)
- 酸堿平衡和酸堿平衡紊亂課件
- 有限空間作業(yè)專項施工方案
- 電力安全生產(chǎn)“十項嚴(yán)禁”【系列漫畫】
- 升壓站設(shè)備安裝調(diào)試工程施工質(zhì)量驗收及評定范圍劃分表
- Unit 2 My family Part A Let's talk(教學(xué)設(shè)計)人教PEP版英語三年級下冊
- 輔酶Q10-課件-課件
- 道德與法治賽課一等獎:《有多少浪費可以避免(第一課時)》教學(xué)課件(四下)
- 好習(xí)慣成就好人生
評論
0/150
提交評論