知識圖譜與大模型融合實踐研究報告_第1頁
知識圖譜與大模型融合實踐研究報告_第2頁
知識圖譜與大模型融合實踐研究報告_第3頁
知識圖譜與大模型融合實踐研究報告_第4頁
知識圖譜與大模型融合實踐研究報告_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

前言為推進知識圖譜與大模型在企業(yè)級的落地應(yīng)用,分析知識圖譜與大模型融合技術(shù)路徑,研究報告從知識圖譜與大模型落地面臨的瓶頸出發(fā),分析了知識圖譜與大模型的主要特征、知識圖譜與大模型擅長的主要場景和核心基礎(chǔ)能力,對比了知識圖譜與大模型的優(yōu)劣勢,進而從技術(shù)演化層面、技術(shù)互補層面、知識庫建設(shè)層面探討了知識圖譜與大模型融合的可行性及收益。同時,研究報告分析了知識圖譜與大模型融合的技術(shù)路徑及其關(guān)鍵技術(shù),研究了知識圖譜與大模型融合系統(tǒng)評測體系,對比了實際融合系統(tǒng)與大模型的性能測試結(jié)果。最終,通過梳理已有11個領(lǐng)域的實踐案例,給出了技術(shù)挑戰(zhàn)與發(fā)展展望。轉(zhuǎn)載、摘編或利用其它方式使用本報告文字或者觀點的,應(yīng)注明來源為“中國電子技術(shù)標準化研究院”或?qū)?yīng)案例提供單位,且不得對本報告進行有悖原意的刪減與修改。由于知識圖譜與大模型技術(shù)發(fā)展迅速,研究報告編制時間和作者學(xué)識限制,恐有紕漏或不嚴謹之處,敬請諒解和批評指正。研究報告編寫組中國電子技術(shù)標準化研究院郭楠、韓麗、李瑞琪、李湘、胡成林、陳艷利中國電信股份有限公司研究院石曉東、趙龍剛、孫佩霞南京柯基數(shù)據(jù)科技有限公司楊成彪、吳剛、魏愛梅北京海致科技集團有限公司瞿珂、李思宇、胡嘉彥中譯語通科技股份有限公司陳自巖、彭旋沈陽東軟智能醫(yī)療科技研究院有限公司程萬軍北京文因互聯(lián)科技有限公司張屹、李亞軍中電科大數(shù)據(jù)研究院有限公司曹揚、孔德智、熊子奇、尹楊、閆盈盈北京京航計算通訊研究所馬靜、郝創(chuàng)博、白洋、張彤中科知道(北京)科技有限公司吳章生、李海英、王海波北京中企智造科技有限公司蔡志偉、張燕浪潮軟件科技有限公司張峰、王珂琛杭州海康威視數(shù)字技術(shù)股份有限公司姜偉浩、趙宏、吳炎、吳鵬亮廣州柏視醫(yī)療科技有限公司劉濤、顏子夜豪爾賽科技集團股份有限公司張豐、劉姝、戴聰棋電科云(北京)科技有限公司方正、王尚帥云從科技集團股份有限公司李軍參編單位及人員網(wǎng)智天元科技集團股份有限公司賈承斌廈門淵亭信息科技有限公司洪萬福、潘璐陽、朱成忠國際商業(yè)機器(中國)有限公司(IBM)初德高青島海爾科技有限公司王先慶、鄂磊、鞠劍偉浪潮電子信息產(chǎn)業(yè)股份有限公司李仁剛、賈麒、范寶余北京三快在線科技有限公司黃坤、劉瑾、李軒深圳市矽赫科技有限公司洪鵬輝、洪寶璇、林疊守同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司萬敏鋒、相生昌、周永中國電力科學(xué)研究院有限公司徐建南、徐會芳、張英強浙江創(chuàng)鄰科技有限公司周研、馬超湖北汽車工業(yè)學(xué)院龔家元泰瑞數(shù)創(chuàng)科技(北京)股份有限公司劉俊偉、羅伊莎國電南瑞科技股份有限公司張萬才

石超

施雨南京航空航天大學(xué)周福輝、袁璐、宋熙富泰華工業(yè)(深圳)有限公司史喆、張學(xué)琴中國南方電網(wǎng)超高壓輸電公司李強各章節(jié)編輯:第一章 中國電信股份有限公司研究院

石曉東第二章 網(wǎng)智天元科技集團股份有限公司

賈承斌第三章南京柯基數(shù)據(jù)科技有限公司

楊成彪第四章廈門淵亭信息科技有限公司潘璐陽第五章中國電子技術(shù)標準化研究院李瑞琪第六章青島海爾科技有限公司王先慶參編單位及人員第一章

背景知識圖譜KnowledgeGraph-KG國家標準及研究報告學(xué)者/機構(gòu)以結(jié)構(gòu)化形式描述的知識元素及其聯(lián)系的集合。[1]知識圖譜以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其關(guān)系,將互聯(lián)網(wǎng)的信息表達成更接近人類認知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。[2]知識圖譜本質(zhì)上是一種叫作語義網(wǎng)絡(luò)的知識庫,即一個具有有向圖結(jié)構(gòu)的知識庫。[3]維基百科:對事實和數(shù)字的組合,谷歌將其用于為搜索提供了上下文意義。谷歌于2012年推出,使用維基百科、維基數(shù)據(jù)和其他來源的數(shù)據(jù)。百科百度百科:在圖書情報界稱為知識域可視化或知識領(lǐng)域映射地圖,是顯示知識發(fā)展進程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系。圖結(jié)構(gòu)化形式可呈現(xiàn)為有向圖結(jié)構(gòu)化的形式谷歌:知識圖譜是一個知識庫,其使用語義檢索從多種來源收集信息,以提高Google搜索的質(zhì)量。[6]GB/T

42131-2022《信息技術(shù)

人工智能

知識圖譜技術(shù)框架》中國中文信息學(xué)會語言與知識計算專委會,《知識圖譜發(fā)展報告(2018)》[3]漆桂林,高桓,吳天星.知識圖譜研究進展[J].情報工程,2017,3(1):004-025王昊奮,漆桂林,陳華鈞.《知識圖譜:方法,實踐與應(yīng)用》[J].自動化博覽,2020(1).DOI:CNKI:SUN:ZDBN.0.2020-01-014.L.EhrlingerandW.W¨o?,“Towardsadefinitionofknowledgegraphs,”SEMANTiCS(Posters,Demos,SuCCESS),vol.48,pp.1–4,

2016.https://blog.google/products/search/introducing-knowledge-graph-things-not/Farber:知識圖譜是一種資源描述框架(RDF)圖,可用于描述任何基于圖的知識庫。[5]知識圖譜旨在建模、識別、發(fā)現(xiàn)和推斷事物、概念之間的復(fù)雜關(guān)系,是事物關(guān)系的可計算模型。[4]高效的檢索能力可將概念、實體及其關(guān)系結(jié)構(gòu)化組織起來,具有高效檢索能力智能化推理能力可從已有知識中挖掘和推理多維的隱含知識附1:海外學(xué)者在知識圖譜領(lǐng)域相關(guān)研究1.知識圖譜的定義與發(fā)展歷程——知識圖譜的定義知識圖譜與傳統(tǒng)知識庫相比具有的三大特征1955加菲爾德提出引文索引的思想1965普萊斯引文網(wǎng)絡(luò)分析1968Quillian語義網(wǎng)絡(luò)提出最早的表達人類知識Feigenbaum知識工程提出專家系統(tǒng)開始廣泛研究與應(yīng)用19771984Douglas

Lenat建立Cyc知識庫TimBerners

Lee提出語義網(wǎng)概念,是后續(xù)知識圖譜的基礎(chǔ)19982002首屆國際語義網(wǎng)大會(ISWC)召開,該會議延續(xù)至今,在國際上具有很高的學(xué)術(shù)影響力2004W3C將RDF和OWL納入標準,并在后續(xù)不斷更新,包括RDFS、SPAQL等逐漸填充進入,形成豐富的語義網(wǎng)技術(shù)棧TimBernersLee提出linked

Open

Data20062007Dbpedia知識庫建立2011Schem建立Google正式提出知識圖譜(KnowledgeGraph,

KG)概念同年,Wikidata項目啟動2012OpenKG組織成立20152013首個KG嵌入方法TransE提出,推動了后續(xù)包括圖神經(jīng)網(wǎng)絡(luò)等KG推理方法飛速發(fā)展2016首屆CCKS大會召開2018事理圖譜概念提出,強調(diào)了KG對事件的順承、因果等復(fù)雜認知能力的建模RichPedia作為多模態(tài)KG發(fā)布代表KG進入新時代2020首個知識圖譜國標發(fā)布20221.知識圖譜的定義與發(fā)展歷程——知識圖譜發(fā)展歷程具有涌現(xiàn)能力在特定任務(wù)上,隨著模型規(guī)模提升模型性能突然出現(xiàn)顯著提升大模型與傳統(tǒng)模型相比具有三大特征[2]參數(shù)規(guī)模龐大參數(shù)規(guī)模不少于十億(1B),嚴格意義上需超過一百億(10B)[2]權(quán)威論文中大模型的定義具有通用性能夠僅通過提示、微調(diào)適應(yīng)廣泛的下游任務(wù)2.大模型的定義與發(fā)展歷程——大模型的定義大模型通常是指參數(shù)規(guī)模在一百億(10B)以上,使用大規(guī)模的訓(xùn)練數(shù)據(jù),具有良好的涌現(xiàn)能力,并在各種任務(wù)上達到較高性能水平的模型。[2]狹義上:廣義上:大模型是指參數(shù)數(shù)量大、結(jié)構(gòu)復(fù)雜的深度學(xué)習(xí)模型,具備涌現(xiàn)能力、通用能力,并能夠處理復(fù)雜的下游任務(wù),如自然語言處理、圖像識別等。AlexNet為代表的新一代模型在規(guī)模和性能上超越傳統(tǒng)方法2012年自然語言處理模型Word2Vec誕生2013年Google提出Transformer架構(gòu),奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)2017年OpenAI發(fā)布GPT-1(Decoder)Google發(fā)布BERT(Encoder)預(yù)訓(xùn)練大模型成為自然語言處理領(lǐng)域的主流2018年RLHF算法被提出2022年3月2023年5月2023年7月OpenAI公司推出GPT-2,模型參數(shù)規(guī)模15億,Decoder技術(shù)路線優(yōu)勢顯現(xiàn)2019年OpenAI公司推出GPT-3,模型參數(shù)規(guī)模1750億,在零樣本學(xué)習(xí)任務(wù)上實現(xiàn)了巨大性能提升2020年微軟發(fā)布BEiT-3模型,標志多模態(tài)大模型時代到來2022年8月搭載GPT3.5的ChatGPT正式發(fā)布2022年11月GPT4正式發(fā)布,包含1.8

萬億參數(shù),采用混合專家模型百度發(fā)布“文心一言”,國內(nèi)大模型研發(fā)熱潮涌現(xiàn)2023年3月國家人工智能標準化總體組下設(shè)立大模型標準化專題組,啟動標準編制工作《生成式人工智能服務(wù)管理暫行辦法》公布CNN為代表的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型占主導(dǎo)地位2005年中國發(fā)布的10億以上參數(shù)大模型超過79個,“百模大戰(zhàn)”態(tài)勢初步形成2.大模型的定義與發(fā)展歷程——大模型的發(fā)展歷程6.知識完備性不足企業(yè)級知識圖譜構(gòu)建中通常面臨領(lǐng)域邊界限制、企業(yè)內(nèi)數(shù)據(jù)規(guī)模有限、數(shù)據(jù)中知識稀疏等問題,導(dǎo)致其知識完備性不足本體構(gòu)建難度大本體構(gòu)建對領(lǐng)域?qū)I(yè)知識和構(gòu)建經(jīng)驗要求高,實體與關(guān)系的標識和對齊、本體擴展和更新、本體評估和質(zhì)控、不同本體融合等方面仍面臨技術(shù)挑戰(zhàn)知識通用性不足企業(yè)級知識圖譜平臺及其知識內(nèi)容具有較強的行業(yè)屬性和領(lǐng)域?qū)I(yè)性,通用性和遷移泛化能力尚有不足,跨行業(yè)、跨領(lǐng)域規(guī)模化應(yīng)用有待提升3.語義理解和自然語言處理難度大知識圖譜在面對自然語言中的語義歧義、上下文理解、語言常識推理等問題時,仍缺乏有效的解決辦法2.知識抽取質(zhì)量,難以保證知識抽取規(guī)則的構(gòu)建仍主要依賴人工,主觀性強,導(dǎo)致可移植性差和誤差傳播,使得知識抽取質(zhì)量難以保證1.語料數(shù)據(jù)標注效率低、主觀性強語料數(shù)據(jù)標注仍大量依靠人工,存在標注效率低、主觀性強等問題3.知識圖譜落地面臨的瓶頸大模型的開放性導(dǎo)致其存在信息泄露、數(shù)據(jù)攻擊的風(fēng)險,影響輸出結(jié)果的魯棒性和安全性大模型的輸出結(jié)果是根據(jù)概率推理而生成,具有隨機性和不穩(wěn)定性,導(dǎo)致其正確性的驗證難度大,難以保證結(jié)果的準確可信面向特定領(lǐng)域、多應(yīng)用場景的高質(zhì)量中文語料規(guī)模和質(zhì)量不足訓(xùn)練大模型的成本高大模型的訓(xùn)練和優(yōu)化需要大量的算力資源和海量的數(shù)據(jù)資源,涉及高性能硬件設(shè)備、強大的分布式計算能力、數(shù)據(jù)治理與融合等,投入成本巨大訓(xùn)練數(shù)據(jù)的規(guī)模和質(zhì)量不足5.輸出的安全性不足訓(xùn)練過程的可控性差大模型的黑盒問題使得其推理過程很難得到合理的解釋和有效的控制,增加了大模型優(yōu)化的難度,并限制了其在部分領(lǐng)域的應(yīng)用輸出的可信度不足知識更新的實時性不足大模型訓(xùn)練新數(shù)據(jù)、獲取新知識的周期較長,且成本較高,導(dǎo)致其數(shù)據(jù)更新的滯后和知識時效性的不足領(lǐng)域知識的覆蓋率不足GPT等大模型對各領(lǐng)域?qū)I(yè)知識的覆蓋仍不足,對專業(yè)問題的回答尚無法令人滿意8.社會和倫理問題隱現(xiàn)大模型的輸出可能存在與社會和倫理要求相悖的內(nèi)容,如:生成內(nèi)容消極、負面,具有破壞性等4.大模型落地面臨的瓶頸附1:知識圖譜領(lǐng)域國內(nèi)外學(xué)者及相關(guān)研究知識圖譜國內(nèi)外研究學(xué)者:Gerhard

Weikum,德國薩爾布呂肯Max-Planck信息學(xué)研究所Tom

M.

Mitchell,卡內(nèi)基梅隆大學(xué)計算機科學(xué)學(xué)院最高級別E.Fredkin

講席教授Ian

Horrocks,英國牛津大學(xué)計算機專業(yè)教授唐杰,清華大學(xué)教授李涓子,清華大學(xué)教授漆桂林,東南大學(xué)教授陳華鈞

,浙江大學(xué)教授王昊奮,同濟大學(xué)教授劉嶠

,電子科技大學(xué)教授GerhardWeikum研究知識獲取表示、分布式信息系統(tǒng)、數(shù)據(jù)庫性能優(yōu)化與自主計;算、信息檢索與信息提取等;Tom

M.

Mitchell

的研究涵蓋知識表示、知識庫構(gòu)建、機器學(xué)習(xí)、人工智能,機器人和認知神經(jīng)科學(xué)等;Ian

Horrocks

的研究涵蓋述述邏輯、語義網(wǎng)絡(luò)、知識表達、知識庫、網(wǎng)絡(luò)本體語言等方向;唐杰研發(fā)出研究者社會網(wǎng)絡(luò)ArnetMiner

系統(tǒng),唐杰的高引用論文是

2008

年在

KDD

會議上發(fā)表的“ArnetMiner:extractionandminingofacademicsocialnetworks”對其負責(zé)的知識工程實驗室

ArnetMiner

系統(tǒng)關(guān)鍵問題進行討論,

整合來自在線

Web

數(shù)據(jù)庫的出版物并?

出一個概率框架來處理名稱歧義問題;第二章場景名稱場景描述大模型知識圖譜智能對話內(nèi)容生成內(nèi)容加工作品創(chuàng)作機器翻譯意圖識別智能檢索智能推薦輔助決策知識管理代表對此場景有較好的支撐能力。1.知識圖譜與大模型的對比——典型應(yīng)用場景層面知識圖譜與大模型分別擁有相對擅長的應(yīng)用場景。應(yīng)用場景大模型的基礎(chǔ)能力知識圖譜的基礎(chǔ)能力智能對話語義理解、指令遵循、思維鏈、基礎(chǔ)常識支持上下文理解、情感分析、推理規(guī)劃語義理解、知識融合、知識查詢、知識推理內(nèi)容生成語義理解、指令遵循、思維鏈、基礎(chǔ)常識支持上下文理解、情感分析、數(shù)據(jù)可視化語義理解、知識融合、知識查詢知識推理、知識可視化內(nèi)容加工語義理解、指令遵循、思維鏈、基礎(chǔ)常識支持上下文理解、語義分割-作品創(chuàng)作語義理解、指令遵循、思維鏈基礎(chǔ)常識支持、上下文理解、情感分析-機器翻譯 語義理解、指令遵循 -意圖識別智能檢索智能推薦語義理解、上下文理解支持、情感分析 -語義理解、指令遵循、基礎(chǔ)常識 語義理解、知識查詢、知識推理上下文理解、情感分析語義理解、推理規(guī)劃 語義理解、知識查詢、知識查詢輔助決策語義理解、指令遵循基礎(chǔ)常識、上下文理解語義理解、知識融合、知識查詢知識推理、知識溯源知識管理-知識融合、知識存儲、知識補全、知識查詢知識推理、知識溯源、知識共享與交換、知識更新與維護1.知識圖譜與大模型的對比——核心基礎(chǔ)能力層面知識圖譜與大模型通過自身的核心基礎(chǔ)能力支撐了對應(yīng)的應(yīng)用場景,難以簡單替代。大模型的優(yōu)勢通用性:模型具有指令遵循能力,能處理多種任務(wù),并支持多語言、多模態(tài)、多領(lǐng)域的應(yīng)用。可生成性:模型能生成各種形式和風(fēng)格的文本,也能生成多模態(tài)的內(nèi)容,如圖像、音頻等。創(chuàng)作能力:能生成新穎、連貫和通順的文本,也能生成多模態(tài)作品,如圖片、歌曲等。常識能力:基于海量通用訓(xùn)練數(shù)據(jù)中的知識,具有常識理解能力。語義理解能力:能根據(jù)文本、多模態(tài)數(shù)據(jù)中出現(xiàn)的內(nèi)容,理解其含義和關(guān)系。大模型的不足可解釋性:模型的決策過程是黑箱的,難以解釋??尚刨囆裕耗P偷妮敵隹赡艽嬖阱e誤或有偏見的信息。可溯源性:模型的輸出是基于訓(xùn)練的數(shù)據(jù),而不是特定的數(shù)據(jù)點或知識點,較難追溯其輸出的來源??尚r炐裕耗P偷妮敵龊屯评斫Y(jié)果有賴于通過人工或者其他系統(tǒng)進行校驗??稍u價性:模型的性能和輸出可通過一些標準任務(wù)進行評價,尚不成熟。常識能力:無法處理超出訓(xùn)練語料范圍的常識問題。領(lǐng)域能力:缺乏豐富全面的領(lǐng)域知識,領(lǐng)域服務(wù)能力一般。語義理解能力:可能出現(xiàn)理解錯誤或歧義等問題。知識圖譜的不足通用性:知識圖譜通常面向特定領(lǐng)域,在通用性上可能較弱??缮尚裕褐R圖譜主要用于查詢和分析,而非生成新的內(nèi)容。學(xué)習(xí)能力:缺乏自主學(xué)習(xí)能力。創(chuàng)作能力:缺乏自主創(chuàng)作能力。常識能力:局限于知識圖譜中的信息,常識能力較弱。語義理解能力:語義理解能力主要局限于知識圖譜中的知識內(nèi)容,理解能力較弱。知識圖譜的優(yōu)勢可解釋性:知識圖譜可基于基于明確的語義結(jié)構(gòu)進行查詢和分析,具有較好的可解釋性。可信賴性:知識圖譜通常是由專家創(chuàng)建和維護,因此其可信賴性較高。學(xué)習(xí)能力:基于大量語料的訓(xùn)練,能對新輸入產(chǎn)生合理的響應(yīng),也能從多模態(tài)數(shù)據(jù)中進行學(xué)習(xí)。

可溯源性:知識圖譜中的每個實體和關(guān)系都可以追溯到其來源??尚r炐裕褐R圖譜中的信息可以通過專家進行校驗??稍u價性:知識圖譜的質(zhì)量可通過查詢的準確性和完整性來評價。領(lǐng)域能力:具有較強的領(lǐng)域知識支持,支撐了其領(lǐng)域服務(wù)能力。推理能力:可根據(jù)圖譜中的精確知識內(nèi)容和關(guān)聯(lián)結(jié)構(gòu),進行高可信度的推理。1.知識圖譜與大模型的對比——技術(shù)特性層面過去在技術(shù)發(fā)展中交替演進由知識工程而提出的語義網(wǎng)絡(luò)網(wǎng)絡(luò)式表達人類知識構(gòu)造,以此為基礎(chǔ)構(gòu)建專家系統(tǒng)以解決實際問題知識高度依賴人工定義,難以進行擴展由Google提出的知識圖譜系統(tǒng)表達常識知識,補充現(xiàn)有深度學(xué)習(xí)模型缺乏的認知能力,推理更精準通過圖拓撲建立的隱式的復(fù)雜語義以模擬人類認知,但表征能力不足多模態(tài)知識圖譜利用多模態(tài)信息補充符號語義表達的不足,強化知識的表征能力,支撐多模態(tài)理解、推理和元認知等能力。知識異構(gòu)模態(tài)語義對齊難,在不同模態(tài)間映射關(guān)系多樣AlexNet代表的深度學(xué)習(xí)出現(xiàn)由硬件發(fā)展推動而產(chǎn)生的新一代AI方法,模型規(guī)模和性能超越傳統(tǒng)方法需要大量標注數(shù)據(jù)支持,完全沒有知識建模的能力Transformer架構(gòu)推動大模型發(fā)展BERT,Vision

Transfomer等依靠預(yù)訓(xùn)練模型,以參數(shù)化形式建模知識,進一步發(fā)展為以GPT系列為代表的大模型技術(shù)需要大量數(shù)據(jù)、大量算力支持,存在幻覺、高層認知能力等缺點多模態(tài)大模型利用豐富的多模態(tài)數(shù)據(jù),強化相互之間語義對齊約束,提升高級認知能力,異構(gòu)模態(tài)之間的數(shù)據(jù)對齊難,模態(tài)間映射關(guān)系復(fù)雜未來面臨共同的挑戰(zhàn)與目標相互支持大模型和知識圖譜是相互依賴的知識處理與應(yīng)用技術(shù),知識圖譜發(fā)展激發(fā)了深度學(xué)習(xí)的需求和發(fā)展,深度學(xué)習(xí)和大模型也成為知識圖譜構(gòu)建的基礎(chǔ)能力,并共同面對未來多模態(tài)知識相關(guān)的挑戰(zhàn)。2.知識圖譜與大模型融合的可行性——技術(shù)演化層面融合方向互補大模型擅長處理自然語言和模糊知識,而知識圖譜擅長表示結(jié)構(gòu)化知識并進行推理。相互結(jié)合,可以充分發(fā)揮它們的優(yōu)勢,解決更復(fù)雜的問題?;哟竽P涂梢杂糜趶奈谋局刑崛≈R、從而擴展和豐富知識圖譜的內(nèi)容。知識圖譜可以為大模型提供結(jié)構(gòu)化知識進行語義補充和生成引導(dǎo)。增強知識圖譜和大模型融合可以相互增強各自的能力。知識圖譜可以提高大模型的語義理解和準確性,而大模型可以為知識圖譜提供更豐富的語言知識和生成能力。知識圖譜大模型,彌補通用大模型語料知識圖譜能夠為通用大模型的工業(yè)化應(yīng)用里專業(yè)領(lǐng)域知識的不足。,可對大模型的生成能力進行各方面的評估,降低事實性錯誤的發(fā)生概率。,適度控制內(nèi)容生成,,也可以增加知識大模型可以利用語義理解和生成等能力抽取知識,抽取出隱含的、復(fù)雜的、多模態(tài)的知識,降低圖譜構(gòu)建成本。大模型可以利用其語義理解和指令遵循等能力的全面性和覆蓋度,,生成更加合理、連貫、有創(chuàng)新性的內(nèi)容,例如文本、圖像、音頻等。2.知識圖譜與大模型融合的可行性——技術(shù)互補層面大模型知識圖譜動態(tài)、概率知識庫靜態(tài)知識庫參數(shù)化知識庫,通過網(wǎng)絡(luò)參數(shù)存儲知識,不易理解形式化知識庫,通過三元組存儲知識,結(jié)構(gòu)清晰,查詢簡單,易于理解隱式知識庫,隱式的存儲知識,決策的過程難歸因、解釋、溯源顯性知識庫,顯式地存儲知識,有助于歸因溯源,提高模型行為的可解釋性更新難度大,忘記特定的知識更加困難便于更新、修改、遷移知識知識的通用性更強,適合于高通用知識密度,高專業(yè)知識密度(專業(yè)語料少)的應(yīng)用場景知識的領(lǐng)域性更強,適合于高專業(yè)知識密度,低通用知識密度場景具有上下文感知能力、深層語義表示能力和少樣本學(xué)習(xí)能力圖結(jié)構(gòu)表達能力強。多模態(tài)內(nèi)容采用模型參數(shù)存儲,有語義對齊和不可解釋性。多模態(tài)知識按照知識表示形式存儲。知識圖譜可以通過prompt,來執(zhí)行相應(yīng)信息提取以及思維鏈的推理任務(wù),形式化成不同形式的知識,例如三元組,多元組或者事件鏈條??梢岳胮rompt,參與到大模型的訓(xùn)練前的數(shù)據(jù)構(gòu)造,訓(xùn)練中的任務(wù),以及訓(xùn)練后推理結(jié)果的約束生成,提升大模型的性能。大模型2.知識圖譜與大模型融合的可行性——知識庫建設(shè)層面3.知識圖譜與大模型融合的現(xiàn)有研究工作0

1 知識圖譜賦能大模型通過將知識圖譜作為訓(xùn)練目標、模型輸入、專門知識融合模塊,

增強大模型預(yù)訓(xùn)練效果;

通過動態(tài)知識融合、檢索增強的知識融合方法,

增強大模型推理能力;通過基于知識圖譜的探針、分析技術(shù),

增強大模型可解釋性。0

2 大模型賦能知識圖譜通過將大模型作為編碼器或者通過大模型的生成能力,

增強知識圖譜表征;

將大模型作為解碼器、生成器,

作用于知識補全;

利用大模型的生成能力,增強圖譜構(gòu)建,

對圖譜交互、圖譜問答等任務(wù)提供支持和提升0

3 大模型和知識圖譜協(xié)同將大模型與知識圖譜進行統(tǒng)一表征,增強結(jié)果準確性;將大模型和知識圖譜結(jié)合,運用于推理過程,彌合文本和結(jié)構(gòu)信息之間的差距并提升推理可解釋性。知識圖譜+大模型降低算力:可減少大模型對無結(jié)構(gòu)化文本的依賴,從而降低大模型的預(yù)訓(xùn)練或推理所需的算力和時間。提高知識可信度:依托知識圖譜中經(jīng)質(zhì)量評估的知識,可幫助大模型提高信息的質(zhì)量和可信度,并保障知識的正確性和時效性。增強通用性、領(lǐng)域能力、認知能力:可幫助大模型獲得跨領(lǐng)域和跨語言的知識,并更好地適應(yīng)不同的領(lǐng)域任務(wù)和場景。降低構(gòu)建成本:依托知識圖譜中的結(jié)構(gòu)化知識,可減少大模型對標注數(shù)據(jù)或?qū)<抑R的需求,從而降低大模型的構(gòu)建成本和難度。提高可生成性:可幫助大模型可生成更貼近實際、更具有解釋性的內(nèi)容。提高創(chuàng)作能力:通過知識圖譜的知識增強,可幫助大模型創(chuàng)作內(nèi)容更具邏輯、一致性和創(chuàng)新性等。增強理解能力:大模型的語義理解能力可幫助知識圖譜更好地理解和分類非結(jié)構(gòu)化信息。降低構(gòu)建成本:大模型的上下文理解能力、基礎(chǔ)常識支持能力等可幫助知識圖譜提升非結(jié)構(gòu)化數(shù)據(jù)的知識獲取、知識建模、知識融合等能力,降低其構(gòu)建和維護成本。豐富輸出形式:大模型的生成能力可幫助知識圖譜獲得多元化的知識輸出和服務(wù)形式,增強知識圖譜系統(tǒng)的服務(wù)效果,并提升人機交互水平。提高知識完備性:大模型中涵蓋的知識及其對新數(shù)據(jù)的理解能力,可幫助知識圖譜進行知識補全和知識校驗,提高知識的完備性。提高可解釋性:知識圖譜的顯性知識與大模型的隱性知識相結(jié)合,可提高知識應(yīng)用的可解釋性。實現(xiàn)交叉驗證:知識圖譜的輸出與大模型的輸出相結(jié)合,可為知識應(yīng)用提供交叉驗證/比對的手段,提高服務(wù)的可信賴性。優(yōu)化知識存儲:知識圖譜的結(jié)構(gòu)化信息存儲和大模型的非結(jié)構(gòu)化信息處理相結(jié)合,可優(yōu)化知識存儲和檢索效率。提高決策能力:知識圖譜推理結(jié)果與大模型推理結(jié)果的結(jié)合,可進一步豐富輔助決策的知識背景,并提供更精確的決策建議。增強隱私保護:知識圖譜中數(shù)據(jù)加密和保護能力與大模型數(shù)據(jù)調(diào)用能力相結(jié)合,可降低大模型對個人隱私數(shù)據(jù)的依賴,有利于保障隱私安全。確保知識產(chǎn)權(quán)保護:知識管理機制與本地化部署方式相結(jié)合,可更好地保護知識產(chǎn)權(quán),防止知識的濫用或盜用。增強倫理邊界:通過優(yōu)化知識圖譜中的知識結(jié)構(gòu)及大模型訓(xùn)練樣本結(jié)構(gòu),構(gòu)建約束規(guī)則類知識并降低數(shù)據(jù)偏見,強化輸出邊界。4.知識圖譜與大模型融合的收益2023第三章大模型1大模型2大模型3結(jié)構(gòu)化數(shù)據(jù)/半結(jié)構(gòu)化數(shù)據(jù)/非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)大模型集合知識圖譜集合①知識圖譜賦能大模型:以知識圖譜為工具提升大模型的能力②大模型賦能知識圖譜:以大模型為工具提升知識圖譜的能力③知識圖譜與大模型協(xié)同利用知識圖譜與大模型各自的優(yōu)勢相互賦能(1+1),并結(jié)合上層應(yīng)用集成,實現(xiàn)兩者技術(shù)的互補。利用知識圖譜間的互聯(lián)互通及大模型間的集成調(diào)度(N+N),實現(xiàn)融合后系統(tǒng)能力的持續(xù)增強。1.知識圖譜與大模型融合的總體技術(shù)路線2.大模型賦能知識圖譜的技術(shù)路徑利用大模型在語義理解、內(nèi)容生成等方面的技術(shù)優(yōu)勢,實現(xiàn)大模型對知識圖譜構(gòu)建至應(yīng)用全生命周期各環(huán)節(jié)的增強,提升效率和質(zhì)量。1)用大模型增強數(shù)據(jù)標注利用大模型對原始數(shù)據(jù)進行實體、關(guān)系、事件等標注。2)用大模型增強知識抽取利用大模型進行實體抽取、關(guān)系抽取、事件抽取、因果關(guān)系抽取等,例如:DeepKE-LLM。3)用大模型增強知識建模利用大模型進行實體類型提取、關(guān)系類型提取、事件類型提取、知識體系提取等。4)用大模型增強知識圖譜嵌入與表示學(xué)習(xí)利用大模型作為知識圖譜嵌入的文本和圖結(jié)構(gòu)編碼器,解決結(jié)構(gòu)連通性有限的問題,提升知識抽取的能力。5)用大模型增強知識圖譜補全利用大模型作為編碼器或生成器來補全知識圖譜數(shù)據(jù),提升知識補全的能力。6)用大模型增強知識圖譜構(gòu)建利用大模型開展實體發(fā)現(xiàn)、共指解析和關(guān)系提取,構(gòu)建特定領(lǐng)域內(nèi)的知識圖譜結(jié)構(gòu)。采用知識蒸餾等技術(shù)實現(xiàn)端到端的圖譜構(gòu)建。參考文獻2023

Yunjie

Ji,

etc.《Exploring

ChatGPT’s

Ability

to

Rank

Content:

APreliminaryStudyonConsistencywithHumanPreferences》2021

Shirui

Pan,

etc.《Unifying

Large

Language

Models

andKnowledge

Graphs:ARoadmap》2023

XiangWei,

etc.《Zero-Shot

Information

Extraction

viaChattingwith

ChatGPT》2.大模型賦能知識圖譜的技術(shù)路徑——關(guān)鍵技術(shù)示例7)用大模型增強知識融合利用大模型進行術(shù)語定義補全、術(shù)語對齊和標準化、實體標準化對齊、同義詞提取與融合等8)用大模型增強知識推理利用大模型進行關(guān)系推理、事件推理等9)用大模型增強知識圖譜可視化利用大模型進行多種形式的知識可視化10)用大模型增強知識圖譜文本生成利用大模型自然語言理解方面的優(yōu)勢能夠提升從知識圖譜中生成文本的質(zhì)量,提高語言的準確性和在現(xiàn)實場景中的可用性。11)用大模型增強知識圖譜問答利用大模型抽取自然語言問題中的實體、關(guān)系,進入結(jié)構(gòu)化的知識圖譜尋找問題答案,再通過大模型組合答案并結(jié)合大模型自身的知識廣度將更充實的答案以自然語言的方式輸出,增強知識圖譜問答的廣度、自然性和準確性。用大模型增強知識圖譜多模態(tài)知識對齊利用大模型的通用性和對多類型數(shù)據(jù)統(tǒng)一處理的能力,能夠增強多模態(tài)知識對齊,賦能多模態(tài)知識圖譜的構(gòu)建、表示、推理和應(yīng)用的全流程。2.大模型賦能知識圖譜的技術(shù)路徑——關(guān)鍵技術(shù)示例參考文獻

2021

Shirui

Pan,

etc.《Unifying

Large

Language

Models

and

Knowledge

Graphs:

A

Roadmap》3.知識圖譜賦能大模型的技術(shù)路徑——應(yīng)用場景實現(xiàn)示例:基于大模型增強的知識抽取Gitee地址:/openkg/deepke/tree/main/example/llm3.知識圖譜賦能大模型的技術(shù)路徑1)利用知識圖譜增強大模型預(yù)訓(xùn)練使用圖結(jié)構(gòu)將知識圖譜信息注入到大模型的輸入中,增強大模型預(yù)訓(xùn)練能力;通過附加的融合模塊將知識圖譜注入到大模型,在預(yù)訓(xùn)練模型中,可以設(shè)計額外的輔助任務(wù),然后通過輔助任務(wù)對預(yù)訓(xùn)練模型加約束來增強大模型預(yù)訓(xùn)練能力;知識圖譜的鏈式關(guān)系輸入到大模型中,作為大模型的預(yù)訓(xùn)練語料。2)利用知識圖譜增強大模型的監(jiān)督微調(diào)/對齊微調(diào)通過指令微調(diào)訓(xùn)練和基于知識圖譜反饋的強化學(xué)習(xí);通過文本-知識對齊將知識圖譜信息注入到大模型的訓(xùn)練目標中,增強大模型預(yù)訓(xùn)練能力。3.知識圖譜賦能大模型的技術(shù)路徑——關(guān)鍵技術(shù)示例3)用知識圖譜增強大模型的常識和領(lǐng)域知識推理能力把知識圖譜當(dāng)作一個準確的知識庫,作為一個外部檢索的知識源,提升常識和領(lǐng)域知識方面的推理能力;利用知識圖譜的多跳路徑作為大模型的輸入,提升模型專業(yè)性、可信性、真實性與可解釋性;使用知識模型根據(jù)問題生成知識陳述4)用知識圖譜增強大模型推理的可解釋性通過動態(tài)知識圖譜融合增強大模型的推理能力,從知識圖譜中較容易地獲得一系列規(guī)則,既從數(shù)據(jù)中總結(jié)得出的特征子圖,作為COT、TOT的指令。通過檢索增強知識融合增強大模型的推理能力,知識圖譜是典型的圖結(jié)構(gòu),有大量的路徑。借助這種鏈式關(guān)系可提升大模型推理的可解釋性。利用大語言模型對基于知識圖譜生成的問題進行預(yù)測,驗證大模型的可解釋性。3.知識圖譜賦能大模型的技術(shù)路徑——關(guān)鍵技術(shù)示例3.知識圖譜賦能大模型的技術(shù)路徑——關(guān)鍵技術(shù)示例5)利用知識圖譜增強大模型生成結(jié)果的評估與驗證把知識圖譜當(dāng)作一個準確的知識庫,作為一個外部檢索的知識源,解決事實性準確的問題,并進行事實準確性評估6)用知識圖譜增強大模型的對話等應(yīng)用能力在智能對話等任務(wù)中,通過引入知識圖譜中的知識對大模型的輸出進行約束,提升對話內(nèi)容的有效性和實時性。7)利用知識圖譜增強大模型的語義理解能力基于知識圖譜,對大模型在輸入文本的語義識別過程中進行實體別稱補全、實體上下位推理等,提升大模型語義識別的準確性和完整性。8)利用知識圖譜增強大模型的知識溯源能力基于知識圖譜,記錄大模型獲取知識點和關(guān)鍵數(shù)據(jù)的來源信息及轉(zhuǎn)化路徑,并在內(nèi)容生成或推理時進行完整呈現(xiàn),便于使用者評估可信度。9)利用知識圖譜增強大模型的知識管理和更新能力基于知識圖譜,對大模型輸出中所依賴的動態(tài)數(shù)據(jù)、隱私數(shù)據(jù)、事實性知識進行統(tǒng)一的管理,并依托知識圖譜的知識編輯能力,保障圖譜內(nèi)知識的實時性和正確性。10)利用知識圖譜增強大模型的知識存儲和共享能力基于知識圖譜,獲取和存儲大模型中的隱性知識,并通過知識圖譜文件或知識圖譜間知識共享協(xié)議實現(xiàn)知識的交換與流通,提升大模型的知識共享能力。文本提取文本分段文本轉(zhuǎn)向量全文索引向量索引用戶問題文本轉(zhuǎn)向量關(guān)鍵詞提取向量檢索全文檢索文本段落綜合排序候選段落結(jié)果封裝離線在線大模型調(diào)用LLM

api提示組裝Prompt知識圖譜分類、實體識別、翻譯意圖識別123實體別稱補全實體上下位推理行業(yè)背景知識補全知識修正知識溯源3.知識圖譜賦能大模型的技術(shù)路徑——應(yīng)用場景實現(xiàn)示例:基于知識圖譜增強大模型的文檔問答1.離線部分,對文檔進行預(yù)處理,構(gòu)建段落級索引,包括全文索引和向量索引2.

在線部分,使用知識圖譜增強大

模型的問答效果:在意圖識別階段,用知識圖譜進行實體別稱補全和上下位推理;在Prompt組裝階段,從知識圖譜中查詢背景知識放入上下文;在結(jié)果封裝階段,用知識圖譜進行知識修正和知識溯源分別發(fā)揮知識圖譜與大模型兩者的技術(shù)優(yōu)勢,通過統(tǒng)一知識表征、動態(tài)協(xié)同知識推理等技術(shù)手段,實現(xiàn)企業(yè)級認知決策智能水平的升級發(fā)展。3.知識圖譜與大模型協(xié)同應(yīng)用的技術(shù)路徑3.知識圖譜與大模型協(xié)同應(yīng)用的技術(shù)路徑1)知識圖譜與大模型統(tǒng)一表征技術(shù)通過對大模型與知識圖譜進行知識統(tǒng)一表征,增強結(jié)果的準確性。2)知識圖譜與大模型統(tǒng)一構(gòu)建技術(shù)通過融合知識圖譜的訓(xùn)練目標和大模型的訓(xùn)練目標,構(gòu)建統(tǒng)一模型,使得統(tǒng)一模型同時具備大模型的通用知識、語言理解、知識涌現(xiàn)能力和知識圖譜的顯性知識、限定域知識、可靠性、可解釋性能力。3)知識圖譜與大模型串行推理技術(shù)通過知識圖譜與大模型的串行應(yīng)用,原始信息首先經(jīng)過知識圖譜進行結(jié)構(gòu)化抽取關(guān)聯(lián)信息,將檢索結(jié)果輸入大模型進行預(yù)測推理,從而提高知識推理預(yù)測的準確性。4)知識圖譜與大模型并行推理技術(shù)大模型與知識圖譜并行召回答案,動態(tài)協(xié)同進行知識推理,完成答案融合,即能提高推理結(jié)果的準確性,又能拓展推理的知識邊界。參考文獻

2021

Shirui

Pan,

etc.《Unifying

Large

Language

Models

and

KnowledgeGraphs:

ARoadmap》5)6)7)3.知識圖譜與大模型協(xié)同應(yīng)用的技術(shù)路徑——關(guān)鍵技術(shù)示例知識圖譜與大模型交互接口標準化規(guī)定和明確知識圖譜與大模型之間交互接口的標準格式,提升不同廠商間產(chǎn)品集成的便捷性。知識圖譜與大模型間任務(wù)編排與調(diào)度技術(shù)知識圖譜與大模型協(xié)同的過程中,需要基于企業(yè)內(nèi)業(yè)務(wù)流進行任務(wù)的編排和調(diào)度,以保證協(xié)同過程的流暢性和可操作性。知識圖譜與大模型協(xié)同中隱私保護技術(shù)知識圖譜與大模型協(xié)同過程中,知識圖譜內(nèi)容仍將被用于大模型的輸入或輸出中,如何保護知識圖譜中的隱私數(shù)據(jù)不泄漏是系統(tǒng)建設(shè)的重要環(huán)節(jié)。1. 在為用戶推薦美食信息的同時,以“知識圖譜+大模型”的應(yīng)用范式智能生成更加觸動人心的文案來觸達用戶。3.知識圖譜與大模型協(xié)同應(yīng)用的技術(shù)路徑——應(yīng)用場景實現(xiàn)示例:基于大模型和知識圖譜融合的文案生成>>>第四章參考:IEEE

P2807.1《知識圖譜技術(shù)要求與測試評估規(guī)范》知識圖譜系統(tǒng)測評體系知識圖譜構(gòu)建知識圖譜應(yīng)用知識建模知識抽取知識融合知識表示知識存儲知識檢索智能問答智能推薦智能檢索輔助決策知識管理1.知識圖譜和大模型系統(tǒng)的測評體系概述大模型系統(tǒng)測評體系大模型開發(fā)大模型應(yīng)用數(shù)據(jù)構(gòu)建模型訓(xùn)練模型部署模型管理大模型能力大模型安全語義理解內(nèi)容生成基礎(chǔ)常識智能對話智能檢索內(nèi)容生成智能推薦情感分析可解釋性可信耐性可溯源性可評價性可校驗性上下文理解推理規(guī)劃內(nèi)容加工輔助決策作品創(chuàng)作機器翻譯1.知識圖譜和大模型的測評體系概述大模型賦能/增強知識圖譜系統(tǒng)測評體系知識圖譜構(gòu)建知識圖譜應(yīng)用融合成本計算資源響應(yīng)速度融合增益存儲資源知識規(guī)模知識復(fù)雜度推理能力知識完備度同知識圖譜系統(tǒng)測評構(gòu)建成本理解能力2.知識圖譜與大模型融合系統(tǒng)測評體系知識圖譜賦能/增強大模型系統(tǒng)測評體系大模型開發(fā)大模型應(yīng)用大模型能力大模型安全融合成本計算資源響應(yīng)速度存儲資源融合增益訓(xùn)練數(shù)據(jù)知識可信度知識準確度知識實時性知識運維能力常識能力可解釋性認知能力同大模型系統(tǒng)測評2.知識圖譜與大模型融合系統(tǒng)測評體系數(shù)據(jù)集名稱規(guī)模子任務(wù)描述entity-medical-200200條實體識別基于疾病診療指南標注的實體識別數(shù)據(jù),包含7類實體relation-medical-200200條關(guān)系抽取基于疾病診療指南標注的關(guān)系抽取數(shù)據(jù),包含5種關(guān)系任務(wù)類型:知識抽取數(shù)據(jù)集測評結(jié)果0.730.860.510.770.470.380.520.440.70.60.50.40.30.20.100.8

0.65 10.9實體識別關(guān)系抽取CasRel傳統(tǒng)方法 ChatGPT KG+ChatGPT ChatGLM-6B KG+ChatGLM-6B0.88bert+bilstm+crf結(jié)果樣例KG+ChatGPT顯著提升了關(guān)系抽取的召回率3.知識圖譜與大模型融合系統(tǒng)測評結(jié)果數(shù)據(jù)集名稱規(guī)模子任務(wù)描述醫(yī)藥百科圖譜200W三元組柯基數(shù)據(jù)基于開源數(shù)據(jù)構(gòu)建的醫(yī)藥領(lǐng)域的全科知識圖譜醫(yī)藥常識問題集100條常識問答醫(yī)學(xué)專家人工編輯的常識問題糖尿病問題集100條糖尿病問答醫(yī)學(xué)專家人工編輯的糖尿病領(lǐng)域的診療問題肺癌問題集100條肺癌問答醫(yī)學(xué)專家人工編輯的肺癌領(lǐng)域的診療問題任務(wù)類型:智能問答數(shù)據(jù)集測評結(jié)果(注:每個問題的答案由醫(yī)學(xué)專家打分,0-3分)2521681412612132191679378189116116218135121220166177300250200150100500常識問答糖尿病問答肺癌問答總得分ChatGPTKG+ChatGPTChatGLM-6BKG+ChatGLM-6B文心一言KG+文心一言3.知識圖譜與大模型融合系統(tǒng)測評結(jié)果任務(wù)類型:智能問答結(jié)果樣例肺癌小細胞肺癌肺腺癌鱗狀上皮癌大細胞癌80%至85%占比非小細胞肺癌屬于屬于屬于屬于屬于3.知識圖譜與大模型融合系統(tǒng)測評結(jié)果數(shù)據(jù)集名稱規(guī)模子任務(wù)描述event-100100條文本分類-單層級警情數(shù)據(jù),單層分類的數(shù)據(jù)case-1k1000條文本分類-多層級案件數(shù)據(jù),有父子三層級分類的數(shù)據(jù)子任務(wù)準確率LLMKG+LLM文本分類-單層級67%93%文本分類-多層級31%56%任務(wù)類型:文本分類數(shù)據(jù)集測評結(jié)果結(jié)果樣例3.知識圖譜與大模型融合系統(tǒng)測評結(jié)果第五章知識圖譜與大模型融合實踐案例ZHISHITUPUYUDAMO

XING解決方案:面向生產(chǎn)一線運維人員,基于意圖理解和網(wǎng)絡(luò)大模型技術(shù),打造具有豐富運維知識的運維助手面向運維專家,利用運維助手進行交互問答,提供查詢故障現(xiàn)象,故障原因,故障解決方案,解決效果等,隨時在線的運維客服助手行業(yè)需求:1、網(wǎng)絡(luò)運維工作壓力大,人員不足,亟需智能化運維工具提高效率;2、運維人員人工判障效率低,客戶體驗和滿意度難以得到保障,亟需通過智能化手段壓降運維時長;3、海量的運維知識檢索利用難度大,需智能助手幫助運維人員準確快速找到匹配解決方案,提升效率。關(guān)鍵技術(shù):1、基于網(wǎng)絡(luò)大模型和運維知識圖譜技術(shù)打造智能運維助手;2、基于意圖理解和運維知識圖譜打造運維智能問答機器人提升效果:1.電信行業(yè)實踐案例:網(wǎng)絡(luò)運維數(shù)字員工2.電力行業(yè)實踐案例:電力智能客服行業(yè)需求1、傳統(tǒng)智能客服機器人機械化、條目式的知識檢索與問答服務(wù)存在用戶訴求識別率低、泛化性差等問題,無法滿足當(dāng)前電力客服深度智慧化的需求2、為解決話務(wù)量大且座席業(yè)務(wù)繁重問題,亟需開展智能客服的適應(yīng)性升級改造,建立智能服務(wù)一體化運營管理體系,分流緩解話務(wù)高峰,降低客服業(yè)務(wù)運營培訓(xùn)成本,提升電力客服業(yè)務(wù)服務(wù)水平關(guān)鍵技術(shù):1、電力客服領(lǐng)域語言大模型微調(diào)優(yōu)化技術(shù)2、基于領(lǐng)域知識圖譜的大模型知識增強技術(shù)解決方案:利用客服知識圖譜、知識庫等語料資源以及LLM大語言模型,構(gòu)建深度智慧、安全可信的電力客服大模型,滿足精準的用戶訴求分析、多樣化的問答任務(wù)響應(yīng)、實時高效的多輪對話等需求,實現(xiàn)客服問題生成式應(yīng)答和多樣化業(yè)務(wù)的靈活響應(yīng)。提升效果:提升客服多輪對話內(nèi)容生成準確率、用戶訴求智能客服應(yīng)答率等性能。1、行業(yè)數(shù)據(jù)量龐大且多樣化,數(shù)據(jù)呈分散態(tài)勢,難以高效整合和分析;2、行業(yè)特點較強,數(shù)據(jù)包含較多專業(yè)術(shù)語及領(lǐng)域知識,傳統(tǒng)NLP技術(shù)難以準確理解分析;3、文本數(shù)據(jù)存在復(fù)雜的結(jié)構(gòu)和語法,對處理系統(tǒng)要求較高。信通小數(shù)應(yīng)用基于電力領(lǐng)域特性和通用語料訓(xùn)練而成的面向電力行業(yè)的智能交互應(yīng)用,為電力行業(yè)安監(jiān)、營銷、基建等八大領(lǐng)域提供文本處理、信息提取和智能決策等多種需求的產(chǎn)品。1、自然語言處理;2、領(lǐng)域智能交互;3、語義及情感分析。1、在視頻會議的轉(zhuǎn)錄及提綱環(huán)節(jié)減輕記錄員相關(guān)工作量約90%;2、在綜合辦公的公文寫作及大綱編制環(huán)節(jié),提升工作人員60%工作效率;3、應(yīng)急處理縮短45%處理時間。2.電力行業(yè)實踐案例:信通小數(shù)應(yīng)用01020304行業(yè)需求基于數(shù)據(jù)資產(chǎn)的血緣鏈路、下游應(yīng)用級別等維度,構(gòu)建特殊數(shù)據(jù)資產(chǎn)識別規(guī)則在特殊數(shù)據(jù)資產(chǎn)狀態(tài)出現(xiàn)異常(變化)時,基于不同的異常(變化)情況,對相對應(yīng)的管理節(jié)點(人員)進行預(yù)警解決方案基于知識圖譜,構(gòu)建數(shù)據(jù)資產(chǎn)的全鏈路血緣,將應(yīng)用級別、資產(chǎn)狀態(tài)等信息作為屬性存儲,為特殊數(shù)據(jù)資產(chǎn)識別提供底層支撐基于大模型,從圖結(jié)構(gòu)信息和節(jié)點屬性中提取必要特征,智能的為用戶進行特殊數(shù)據(jù)資產(chǎn)的推薦及相關(guān)異常預(yù)警提升效果已部署于華東某國網(wǎng),基于大模型和知識圖譜的特殊數(shù)據(jù)資產(chǎn)識別及管理系統(tǒng),基于用戶不同業(yè)務(wù)場景,推薦不同類別的特殊數(shù)據(jù)資產(chǎn)(如核心數(shù)據(jù)資產(chǎn)、邊緣數(shù)據(jù)資產(chǎn)、冗余數(shù)據(jù)資產(chǎn)等),幫助用戶對數(shù)據(jù)資產(chǎn)進行管理。且在特殊數(shù)據(jù)資產(chǎn)發(fā)生變化時,對受影響的部門或責(zé)任人進行自動預(yù)警關(guān)鍵技術(shù)主動元數(shù)據(jù)、元數(shù)據(jù)血緣、特征子圖、預(yù)訓(xùn)練模型2.電力行業(yè)實踐案例:基于大模型和知識圖譜的特殊數(shù)據(jù)資產(chǎn)識別及管理行業(yè)需求:1.

營銷領(lǐng)域知識圖譜構(gòu)建費時費力。2.知識圖譜的現(xiàn)有展現(xiàn)形式難以快速獲取復(fù)雜知識和實體關(guān)系。關(guān)鍵技術(shù):1.利用大模型進行實體、屬性、關(guān)系等知識圖譜要素提取,輔助知識圖譜內(nèi)容生成。2.

訓(xùn)練大模型符合知識圖譜內(nèi)容結(jié)構(gòu)的指令模版。3.利用大模型檢索知識圖譜進行內(nèi)容分析。4.

調(diào)用外部接口進行進一步的業(yè)務(wù)分析。5.利用大模型整合內(nèi)容生成最終的回答。解決方案:將銀行的營銷業(yè)務(wù)知識圖譜與大模型相結(jié)合,利用大模型實現(xiàn)知識圖譜數(shù)據(jù)的快速提取和分析。采用便捷的自然語言交互方式,降低傳統(tǒng)圖譜分析的復(fù)雜性,提升分析效率。提升效果:實現(xiàn)了基于營銷知識圖譜的分析問答,助力營銷業(yè)務(wù)高效推進。3.金融行業(yè)實踐案例:銀行智能營銷助手3.金融行業(yè)實踐案例:基于大模型的智能圖分析平臺反欺詐場景應(yīng)用行業(yè)需求:根據(jù)監(jiān)管可疑特征構(gòu)建單規(guī)則、復(fù)雜規(guī)則;規(guī)則指標維度較少;預(yù)警量大、準確率低;基于涉案名單作為樣本構(gòu)建機器學(xué)習(xí)模型,提升了召回率、準確率,但可解釋性低。解決方案:1)基于知識圖譜,建立以圖算法和機器學(xué)習(xí)為核心的團伙反欺詐模型,能夠挖掘客戶關(guān)系網(wǎng)絡(luò)和賬戶間的隱藏資金鏈,并提升對可疑團伙的識別能力,無論是靜態(tài)的還是動態(tài)的關(guān)系;2)基于大模型,從圖結(jié)構(gòu)信息、節(jié)點屬性和模型特征中提取關(guān)鍵信息,生成智能風(fēng)險報告,并通過基于特征的聯(lián)動圖譜可視化展示,使得風(fēng)險分析更加智能化和直觀化。提升效果:在銀行內(nèi)反欺詐平臺進行了業(yè)務(wù)可行性評估,智能解讀欺詐團伙的行為特征所生成的風(fēng)險報告,以及提供團伙關(guān)系和模型特征的圖譜可視化展示,能夠提升反欺詐作業(yè)人員的研判效率。關(guān)鍵技術(shù):圖算法、機器學(xué)習(xí)、圖結(jié)構(gòu)信息抽取、預(yù)訓(xùn)練模型4.醫(yī)藥行業(yè)實踐案例:Clinical

lnsight臨床試驗情報平臺行業(yè)需求:1、加速藥物上市前的臨床試驗設(shè)計和臨床試驗招募,以及上市后的產(chǎn)品上市教育、藥品渠道銷售、患者全流程管理和數(shù)字化診療等多種場景;2、整合多源異構(gòu)信息為醫(yī)藥場景提供高效、客觀、科學(xué)的循證支持,實現(xiàn)降本增效。關(guān)鍵技術(shù):1、醫(yī)藥會議摘要的智能問答;2、臨床知識報告生成。解決方案:利用知識圖譜及LLM大語言模型進行數(shù)據(jù)的關(guān)聯(lián)分析及內(nèi)容生成,為企業(yè)提供藥物試驗的潛在競爭情報,并關(guān)聯(lián)臨床試驗結(jié)果,為試驗設(shè)計提供循證參考。提升效果:1、臨床試驗的入排標準設(shè)計和試驗中心篩選環(huán)節(jié)周期縮短60%;2、實現(xiàn)遵循醫(yī)學(xué)規(guī)范,實現(xiàn)醫(yī)學(xué)知識的復(fù)用,進一步提高數(shù)據(jù)的價值和應(yīng)用。提升醫(yī)學(xué)部/市場部的效率達到50%1、知識分散,沒有有效整合,耗費人工去找尋答案;2、醫(yī)學(xué)問詢郵件沒辦法保證立即回復(fù),無法快速地幫助醫(yī)生/患者等解決問題;3、整合所有資料的知識點,有局限性,還是會出現(xiàn)無回答的情況。1、基于知識圖譜的知識增強能力;2、文檔解析、問答和自動報告的流程自動化。全球化醫(yī)學(xué)Chatbot平臺是一個為醫(yī)藥企業(yè)打造的面向外部醫(yī)生、護士、藥劑師等醫(yī)學(xué)專業(yè)人士,基于知識圖譜和LLM大語言模型能力可循證的疾病用藥的應(yīng)用產(chǎn)品。4.醫(yī)藥行業(yè)實踐案例:醫(yī)學(xué)學(xué)術(shù)營銷平臺行業(yè)需求:

購車是許多人生活中的重大決策之一,人們希望能夠獲取針對個人需求的準確且全面的汽車推薦信息,包括車型、價格、性能等方面的細節(jié)。

提供購車過程中的相關(guān)指導(dǎo)和建議,以便做出明智的選擇。解決方案:通過智能問答系統(tǒng),結(jié)合知識圖譜與自然語言處理技術(shù),為用戶提供車型、參數(shù)、技術(shù)規(guī)格、價格、預(yù)算、性能和購車推薦和指導(dǎo)。提升效果:提供個性化的購車推薦和指導(dǎo),使用戶更容易找到適合自己需求的汽車。通過價格預(yù)測模型,為用戶提供參考的價格范圍,幫助他們在合理的預(yù)算范圍內(nèi)做出選擇。減少用戶的購車時間和不必要的試錯,提高購車效率和滿意度。構(gòu)建良好的用戶體驗,提高用戶留存和口碑,為汽車銷售商帶來更多潛在客戶。關(guān)鍵技術(shù):自然語言處理(NLP),智能問答。推薦方案一推薦方案二5.汽車行業(yè)實踐案例:購車攻略平臺1234用戶輸入問題:北京地區(qū)今年第一季度大眾新能源車的銷量Prompt問題:北京地區(qū)今年第一季度大眾新能源車的銷量數(shù)據(jù)表:汽車月度銷量表列名:月份,城市,品牌,型號,動力燃料,銷量Prompt問題:北京地區(qū)今年第一季度大眾新能源車的銷量數(shù)據(jù)表:汽車月度銷量表列名:月份,城市,品牌,型號,動力燃料,銷量名詞解釋:新能源車的動力燃料包括有純電力,插電混動和燃料電池Prompt問題:北京地區(qū)今年第一季度大眾新能源車的銷量數(shù)據(jù)表:汽車月度銷量表列名:月份,城市,品牌,型號,動力燃料,銷量名詞解釋:新能源車的動力燃料包括有純電力,插電混動和燃料電池examples:“廣州市去年6月比亞迪新能源車的銷量”

=>“SELECTSUM(sale_amount)FROMcar_monthly_salesWHEREcity='廣州'ANDbrand

=

'比亞迪'

ANDmonth=202206ANDmotor_fuel

in

('純電力',

'插電混動','燃料電池')"NaturalLanguageto

SQLSQLSELECTSUM(sale_amount)FROMcar_monthly_salesWHEREcity='北京'ANDbrand='比亞迪'ANDmonth>='202301'andmonth

<='202303'

ANDmotor_fuel

in

('純電力',

'插電混動',

'燃料電池')"結(jié)果是否合理輸入結(jié)果Reask

Promptgenerator數(shù)據(jù)表結(jié)構(gòu)提取信息增強FewshotExamplesLLMYESDBMS查詢結(jié)果Guardrails基于bert微調(diào)的NLP模型用來提取用戶提問中涉及的數(shù)據(jù)表和數(shù)據(jù)列從車輛信息知識圖譜中提取補充信息使用向量相似度檢索算法搜索案例使用基于規(guī)則的欄柵系統(tǒng)來識別結(jié)果的合理性以及是否會暴漏數(shù)據(jù)隱私NO5.汽車行業(yè)實踐案例:購車攻略平臺行業(yè)需求:1)

進一步提升智能家居用戶的交互體驗,包括交互過程中的連續(xù)對話、語義理解、生成人性化回復(fù);2)

解決研發(fā)人員面對的家電知識零散、知識庫建設(shè)效率等現(xiàn)實問題,實現(xiàn)降本增效。解決方案:1)

利用大模型進行知識泛化,解決知識有限、獲取難、知識庫構(gòu)建效率低等問題;2)基于泛化后的語料,實現(xiàn)“任意說”(指令換說法,仍然聽得懂);3)

利用大模型的理解與生成能力,實現(xiàn)上下文理解、連續(xù)對話、擬人化回復(fù)。關(guān)鍵技術(shù):智能家居知識圖譜、智能家居行業(yè)大模型、安全計算、場景生成等。提升效果:1)

智能家居知識圖譜的量級從千萬提升到億級,形成高效知識管理平臺;2)

用戶交互體驗大幅提升,從以往控制指令說法受限、回復(fù)不精準,進化為連續(xù)交互、隨意交互和引導(dǎo)交互。6.智能家居行業(yè)實踐案例:智能家居知識泛化及交互提升01020304行業(yè)需求1、智能生成內(nèi)容:輔助編者和教師用戶內(nèi)容生成;2、高效內(nèi)容處理:通過智能系統(tǒng)輔助翻譯、轉(zhuǎn)錄、匯集、潤飾、評估等內(nèi)容處理工作,大幅提升編輯們的工作效率;3、智能推薦:用人工智能進行信息推薦,擴大其數(shù)字營銷能力。關(guān)鍵技術(shù):1、大綱和內(nèi)容的自動生成;2、精準用戶畫像自動分析與推薦。解決方案:基于領(lǐng)域知識等構(gòu)建跨領(lǐng)域知識圖譜,用大模型技術(shù)實現(xiàn)知識自動抽?。辉谏墒酱竽P吞嵘R圖譜的知識創(chuàng)作能力;提升效果:通過基于智能AI系統(tǒng)的數(shù)字教材編創(chuàng)系統(tǒng),為編者、編輯、教員、學(xué)生提升智能知識服務(wù)7.教育出版行業(yè)實踐案例:數(shù)字教材智能編創(chuàng)與應(yīng)用系統(tǒng)0

10

30

20

4行業(yè)需求:在數(shù)字孿生城市行業(yè)非結(jié)構(gòu)化數(shù)據(jù)急劇增多的情況下,構(gòu)建知識圖譜需要依賴人工或者半自動方式進行知識抽取和建模,信息利用效率低,數(shù)據(jù)分析能力不強?,F(xiàn)有數(shù)字孿生城市知識圖譜大部分是針對特定領(lǐng)域或任務(wù)定制,擴展性差。解決方案:基于矢量數(shù)據(jù)、影像數(shù)據(jù)、模型數(shù)據(jù)、IOT數(shù)據(jù)、專題數(shù)據(jù)等構(gòu)建數(shù)字孿生城市知識圖譜,結(jié)合大模型預(yù)訓(xùn)練提升知識圖譜的知識抽取和圖譜構(gòu)建能力,并將知識圖譜作為大模型輸入,提升大模型專業(yè)性和可信性,從而利用知識圖譜+大模型提升城市運營以及各領(lǐng)域的指揮決策能力以及準確度。提升效果:數(shù)字孿生城市服務(wù)平臺性能優(yōu)化,數(shù)字孿生城市各領(lǐng)域的信息獲取以及利用效率增大,數(shù)據(jù)分析能力有了很大的提升。關(guān)鍵技術(shù):知識注入輔助模型預(yù)訓(xùn)練、基于大模型的知識抽取能力8.智慧城市實踐案例:數(shù)字孿生城市服務(wù)平臺行業(yè)需求:社交領(lǐng)域的智能交互機器人難點在于對社交機器人進行成長式的個性化訓(xùn)練,來生成語義連貫自然、富帶感情觀點、千人千面的多模態(tài)內(nèi)容?;緦傩晕宕笕烁耜P(guān)系圖譜人物標簽體系角色內(nèi)在特征塑造深度強化學(xué)習(xí)適應(yīng)策略激勵智能感知閱讀交流協(xié)作對抗機器人A機器人B知識和數(shù)據(jù)雙驅(qū)動預(yù)訓(xùn)練社交數(shù)據(jù)個性化生成適配多語傳播智能網(wǎng)評話題感知生成式對話大模型+

人物知識庫在指令和上下文中嵌入個性化解決方案:大模型以百萬級人物知識庫和社交媒體信息作為個性化指令數(shù)據(jù)進行精調(diào),具備千人千面的角色學(xué)習(xí)能力。采用內(nèi)在特征塑造和強化學(xué)習(xí)對抗反饋的方式不斷加強與人類性格、價值的對齊。9.社交領(lǐng)域?qū)嵺`案例:成長式個性化社交機器人提升效果:采用內(nèi)在特征塑造和深度強化學(xué)習(xí)的方式訓(xùn)練社交機器人,能夠生成語義連貫自然、富帶感情觀點、千人千面的多模態(tài)內(nèi)容。以Reddit為媒體平臺,實現(xiàn)認知輿論戰(zhàn)的貼文生產(chǎn)系統(tǒng),根據(jù)熱點、關(guān)鍵詞進行流暢的本地化的貼文批量生成,擬人通順度≥80%,連續(xù)生成1200條的可用度≥80%,重復(fù)率≤20%,具備根據(jù)不斷變化的熱點進行準實時的模型訓(xùn)練更新。關(guān)鍵技術(shù):個性化訓(xùn)練、指令精調(diào)、強化學(xué)習(xí)9.社交領(lǐng)域?qū)嵺`案例:成長式個性化社交機器人行業(yè)需求:1、搜索是信息時代的通用性剛需,可以提升用戶日常行為的效率;2、提高短文本查詢Query和長文本Item的語義表達能力與理解能力,給用戶提供更好的搜索體驗。解決方案:利用知識圖譜及LLM大語言模型,識別用戶查詢意圖、生成語義向量,并進行向量檢索,同時基于知識圖譜進行關(guān)聯(lián)分析,得到關(guān)聯(lián)推薦結(jié)果。關(guān)鍵技術(shù):1、面向指標數(shù)據(jù)、文獻數(shù)據(jù)的查詢意圖精準識別;2、面向指標數(shù)據(jù)、文獻數(shù)據(jù)的語義向量檢索提升效果:1、基于大模型的搜索系統(tǒng)的準確率,相比原系統(tǒng)同比提升13%,且大幅降低了人工維護成本;2、大模型賦予搜索更強的自我學(xué)習(xí)能力,能夠持續(xù)優(yōu)化輸出結(jié)果,更好貼合用戶使用習(xí)慣,更具個性化。10.科學(xué)文獻行業(yè)實踐案例:基于大數(shù)據(jù)的智能檢索01#ONE02#TOW03#THREE04

#FOUR基于大模型和知識圖譜的知識平臺是智慧水利的智能支撐,通過構(gòu)建水利領(lǐng)域大模型,融合知識圖譜技術(shù),面向水務(wù)領(lǐng)域知識,形成以知識引擎為核心的事理推演,支撐服務(wù)及應(yīng)用場景包括:場景一:政務(wù)(水務(wù)方向)智能問答11.水務(wù)行業(yè)實踐案例:基于大模型和知識圖譜的智慧水利知識平臺關(guān)鍵技術(shù)大模型語義相似度計算、信息抽取、預(yù)訓(xùn)練模型語義相似度計算技術(shù)。行業(yè)需求各種關(guān)于水務(wù)相關(guān)的在線咨詢需要人工解答,

查找答案時費力,

人工客服容易面臨相同問題回答不一致或者回答不及時的問題。,解決方案:基于應(yīng)急預(yù)案、政策等構(gòu)建水務(wù)知識圖譜,并構(gòu)建基于大模型的智能問答系統(tǒng),從而利用預(yù)訓(xùn)練模型語義計算技術(shù)智能識別用戶的意圖,給出針對性的解決思路或答案,并實現(xiàn)從水務(wù)知識圖譜中快速檢索出準確的答案,提升客服服務(wù)效率。提升效果:基于智能AI機器人(硬件)和大屏的水務(wù)方向政務(wù)智能問答系統(tǒng),在線回答時效性提升60%回答準確率顯著提高,且已支持多層問答,語音輸入,并基于在線文字及語音理解的生成式多模態(tài)圖表技術(shù),實現(xiàn)了機器人和大屏的在線聯(lián)動,數(shù)字化大屏展示等效果。11.水務(wù)行業(yè)實踐案例:基于大模型和知識圖譜的智慧水利知識平臺水務(wù)相關(guān)政策公文面臨素材搜尋難、政策發(fā)布難、政策宣傳難、政策申報難、政策統(tǒng)計繁等問題?;贜LP、知識圖譜、大模型技術(shù),構(gòu)建融合政策、法規(guī)、公文、解讀、機構(gòu)、主題等要素構(gòu)建全域政策關(guān)系網(wǎng)絡(luò)知識圖譜,

將經(jīng)驗/知識轉(zhuǎn)換為規(guī)則政策。政策公文語義搜索、文檔解析信息抽取、政策文本關(guān)聯(lián)技術(shù)水務(wù)政策知識平臺(知文智用)智能提供政策語義搜索、公文標引、智能審核等應(yīng)用,實現(xiàn)公文輔助寫作,公文寫作聯(lián)想,相關(guān)插件可集成WPS等辦公軟件,支持公文初稿擬制、河長制日報周報、預(yù)警事件處置報告、應(yīng)急預(yù)案等多種文體的自動生成。場景二:水務(wù)政策公文服務(wù)11.水務(wù)行業(yè)實踐案例:基于大模型和知識圖譜的智慧水利知識平臺11.水務(wù)行業(yè)實踐案例:基于大模型和知識圖譜的智慧水利知識平臺場景三:基于大模型的數(shù)字孿生水利防洪推演預(yù)測系統(tǒng)行業(yè)需求:山洪流域防洪需要:精準的預(yù)報預(yù)測分析、預(yù)警消息及時觸發(fā)并發(fā)布、水利應(yīng)用場景仿真推演、應(yīng)急預(yù)案快速形成并擇優(yōu)。關(guān)鍵技術(shù):水利數(shù)據(jù)演算分析技術(shù)、基于仿真引擎及可視化模型雙向渲染技術(shù)、數(shù)字孿生提升效果:結(jié)合大模型技術(shù)驅(qū)動水利防洪,實現(xiàn)山洪“四預(yù)”解決方案:利用大模型技術(shù)驅(qū)動水利行業(yè)專項業(yè)務(wù)更精準的預(yù)報預(yù)測分析,結(jié)合數(shù)字孿生場景實現(xiàn)水利工程實體及單元部件預(yù)警消息的空間關(guān)聯(lián)綁定及消息查看,結(jié)合大模型技術(shù)實現(xiàn)基于仿真引擎及可視化模型雙向渲染驅(qū)動下的數(shù)字孿生水利應(yīng)用場景仿真推演,基于場景預(yù)演結(jié)果,實現(xiàn)以知識平臺驅(qū)動下的調(diào)度方案推送,輔助最優(yōu)預(yù)案決策。精準超前預(yù)報快速直達預(yù)警前瞻科學(xué)預(yù)演細化實化預(yù)案第六章基于知識圖譜與大模型的融合,實現(xiàn)知識圖譜的自動構(gòu)建、架構(gòu)動態(tài)拓展與自動運維。通過知識圖譜與大模型的融合,降低對算力、存儲等資源的需求,優(yōu)化運行效率。利用知識圖譜與大模型的融合,提升知識更新效率。通過知識圖譜與大模型的融合,實現(xiàn)行業(yè)大模型的高效構(gòu)建?;谥R圖譜的結(jié)構(gòu)化知識與邏輯推理能力,增強大模型的可解釋性與推理能力?;谥R圖譜增強的大模型,優(yōu)化解決不確定性問題,提升決策的準確性和效率。0102知識圖譜與大模型的應(yīng)用和安全保障知識圖譜與大模型的增強和效能提升利用知識圖譜與大模型的融合,實現(xiàn)對復(fù)雜業(yè)務(wù)場景的深度理解和精準響應(yīng)。通過大模型與知識圖譜的構(gòu)建及融合,實現(xiàn)更廣泛的多模態(tài)應(yīng)用。利用知識圖譜增強的大模型,實現(xiàn)內(nèi)容的自動化審查機制。通過知識圖譜與大模型的融合應(yīng)用,實現(xiàn)面向特定領(lǐng)域的安全保障機制。技術(shù)挑戰(zhàn)發(fā)展展望建議圍繞大模型,加大建設(shè)投入與政策保障,納入國家新型基礎(chǔ)設(shè)施;建議針對大模型,建立國家級的研發(fā)中心/基地,提供公開的計算資源、研發(fā)資源等,推動中小企業(yè)開展研發(fā)工作;建議圍繞知識圖譜和大模型融合的數(shù)據(jù)安全、隱私保護、知識產(chǎn)權(quán)保護、倫理等,完善相關(guān)法規(guī);建議從政策層面,針對國產(chǎn)大模型,開展研發(fā)與推廣應(yīng)用的支持。建議針對產(chǎn)業(yè)需求,開展知識增強大模型的建設(shè),以促進大模型的產(chǎn)業(yè)應(yīng)用;建議圍繞大模型與知識圖譜融合應(yīng)用,開展行業(yè)數(shù)據(jù)庫的打造;建議根據(jù)產(chǎn)業(yè)需求,開展開源訓(xùn)練數(shù)據(jù)集和知識圖譜的建設(shè)。建議圍繞互操作、數(shù)據(jù)傳輸與共享、計算資源等技術(shù)領(lǐng)域,開展通用標準制訂工作;建議針對行業(yè)應(yīng)用需求,開展行業(yè)標準規(guī)范的制訂工作。2知識圖譜產(chǎn)業(yè)推進方陣簡介1知識圖譜標準化工作組簡介全國信標委人工智能分委會知識圖譜工作組及I

E

E

E

知識圖譜標準化工作組,

由中國電子技術(shù)標準化研究院牽頭,

聯(lián)合知識圖譜相關(guān)企事業(yè)單位、

研究院所、

高校、

機構(gòu),

旨在運用標準化的理念、

方法和技術(shù)梳理分析知識圖譜領(lǐng)域核心標準化需求,

共同推動知識圖譜關(guān)鍵標準的研制等工作,

支撐知識圖譜技術(shù)的高質(zhì)量推廣與應(yīng)用。

工作組現(xiàn)有清華大學(xué)、

阿里巴巴、聯(lián)想、

華為、

百度、

騰訊、

東軟、

螞蟻科技、

依圖等

7

0

余家知識圖譜領(lǐng)域相關(guān)單位共同參與標準編制工作。

目前,

已發(fā)布G

B

/

T

4

2

1

3

1

-

2

0

2

2

人工智能

知識圖譜技術(shù)框架》

等國家標準、I

E

E

E

標準3

項,

在研標準1

0

項。知識圖譜產(chǎn)業(yè)推進方陣旨在培育和壯大知識圖譜領(lǐng)域供應(yīng)商、集成商、服務(wù)商與用戶企業(yè),

以標準化為紐帶,共同促進知識要素在各行業(yè)領(lǐng)域的挖掘、

富集、

流動和應(yīng)用,

推動構(gòu)建跨行業(yè)、

跨領(lǐng)域的知識挖掘與應(yīng)用服務(wù)新型基礎(chǔ)設(shè)施。方陣成員包括理事長單位、

成員單位,

并設(shè)置輪值主席、

專家委員會、

秘書處及必要的工作組。

方陣將通過供需對接、

診斷評估、

測試認證、

標準宣貫、

教育培訓(xùn)、

知識交換協(xié)議開發(fā)等手段服務(wù)產(chǎn)業(yè),

不定期開展技術(shù)沙龍、案例征集、成果發(fā)布、專題競賽、產(chǎn)業(yè)峰會等活動,

推動知識圖譜的技術(shù)創(chuàng)新和產(chǎn)業(yè)深化應(yīng)用。請有意向的單位填寫《

方陣成員單位申請表》

提交至l

i

r

q

@

c

e

s

i

.

c

n

,

經(jīng)秘書處形式審核及理事長會議審議通過后,

將頒發(fā)成員單位證書。申請表下載鏈接如下:h

t

t

p

s

:

/

/

w

w

w

.

j

i

a

n

g

u

o

y

u

n

.

c

o

m

/

p

/

D

X

W

f

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論