版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
人工智能技術基礎知識圖譜第七章
知識圖譜(KnowledgeGraph)的概念最早由谷歌公司于2012年5月17日正式提出,旨在提高搜索引擎的能力,改善用戶的搜索質量。2013年以后知識圖譜開始在學術界和產業(yè)界普及,已被廣泛應用于智能搜索、智能問答、個性化推薦、情報分析、反欺詐等領域。
知識圖譜是一種用圖模型來描述知識和世界萬物之間關聯關系的技術方法,可以對現實世界的事物及其相互關系進行形式化地描述,能夠挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。
知識圖譜分為通用知識圖譜和領域知識圖譜。通用知識圖譜強調的是廣度,數據多來自互聯網,而領域知識圖譜應用于垂直領域,為基礎數據服務。7知識圖譜簡介目錄Contents知識圖譜的起源知識圖譜的架構知識抽取7.17.27.37.47.57.6知識融合知識加工本章小結1.理解知識圖譜的起源和定義,了解知識圖譜的歷史背景和發(fā)展歷程,掌握知識圖譜的基本定義和概念,掌握知識圖譜的邏輯架構和技術架構;2.掌握知識抽取的基本原理和常見技術,了解數據源分類,學習使用不同的方法從數據源中提取知識,了解知識抽取中的難點和挑戰(zhàn);3.學習知識融合基本技術流程、典型的知識融合工具以及實體連接的基本方法。理解知識加工的過程,掌握實體構建的方法,學會如何進行知識推理,了解質量評估和知識更新的方式;4.能夠應用知識圖譜的基本架構和設計原則,使用常見的技術和方法進行知識抽取、融合和加工;5.通過學習能夠設計和實現一個簡單的知識圖譜應用。7知識圖譜學習目標01知識圖譜的起源7.1知識圖譜的起源7.1.1知識工程和專家系統知識工程(KnowledgeEngineering)是研究人類智能和高級知識的發(fā)生機制和規(guī)律,用于構造專家系統的理論。專家系統是指利用某種方法將專業(yè)領域的專家知識收集下來,并存儲在程序中,然后利用程序模擬人類的思維(推理+搜索)過程,去解決某些專業(yè)領域的問題。2012年谷歌提出知識圖譜1977年,在第五屆國際人工智能會議上美國計算機科學家費根鮑姆首次提出知識工程20世紀80年代許多專家系統得到應用7.1知識圖譜的起源7.1.2語義網絡、語義網、鏈接數據和知識圖譜語義網絡(SemanticNetwork)是由Quillian于20世紀60年代提出的知識表達方法,用相互連接的節(jié)點和邊來表示知識。優(yōu)點:語義網絡表達形式簡單直白,容易理解和展示,相關概念容易聚類。缺點:語義網絡的節(jié)點和邊值完全由用戶定義,沒有統一標準,導致難以進行多源數據融合,無法區(qū)分概念節(jié)點和對象節(jié)點,無法對節(jié)點和邊的標簽進行定義。is-a關系,比如:貓是一種哺乳動物;part-of關系,比如:脊椎是哺乳動物的一部分。7.1知識圖譜的起源7.1.2語義網絡、語義網、鏈接數據和知識圖譜語義網(SemanticWeb)和鏈接數據是萬維網之父TimBernersLee分別在1998年和2006提出的。鏈接數據起初是用于定義如何利用語義網技術在網上發(fā)布數據,強調在不同的數據集間創(chuàng)建鏈接。語義網和鏈接數據傾向描述萬維網中資源、數據之間的關系。語義網是為了使得網絡上的數據變得機器可讀而提出的一個通用框架。知識圖譜的早期理念源于TimBerners-Lee關于語義網的設想,旨在采用圖結構(GraphStructure)來建模和記錄世界萬物之間的關聯關系和知識,以便有效地實現更加精準的對象級搜索。7.1知識圖譜的起源7.1.3知識圖譜的定義知識圖譜是把所有不同種類的信息連接在一起,而得到的一個關系網絡。知識圖譜的作用是對于大量無序雜亂的信息,識別出其中的實體及實體屬性等,形成一個關系圖。知識圖譜是結構化的語義知識庫,用于迅速描述物理世界中的概念及其相互關系。知識圖譜通過對錯綜復雜的文檔的數據進行有效地加工、處理、整合,使其轉化為簡單、清晰的“實體、關系、屬性”的三元組,最后聚合大量知識,實現知識的快速響應和推理。圖譜應用包括原圖應用、知識檢索、算法支撐、知識自動化等。圖7-2對知識圖譜的初步理解7.1知識圖譜的起源7.1.3知識圖譜的定義知識圖譜通過三元組“實體、關系、屬性”集合的形式來描述事物之間的關系。實體:又稱本體,指客觀存在并可以相互區(qū)別的事物,可以是具體的人、事、物,也可以是抽象的概念或聯系,實體是知識圖譜中最基本的元素。關系:在知識圖譜中,邊表示知識圖譜中的關系,用來表示不同實體間的某種聯系。屬性:知識圖譜中的實體和關系都可以有各自的屬性。圖7-3知識圖譜的概念02知識圖譜的架構7.2
知識圖譜的架構7.2.1邏輯架構知識圖譜的架構包括自身的邏輯結構以及構建知識圖譜所采用的技術(體系)架構。知識圖譜在邏輯結構上可分為數據與模式兩個層次;數據層:底層存儲數據三元組的邏輯層次,通常通過本體庫來管理數據層,模式層:知識圖譜的核心,通常采用本體庫來管理知識圖譜的模式層。本體庫:相當于對象中“類”的概念。7.2
知識圖譜的架構7.2.1邏輯架構數據層:主要是由一系列的事實組成,而知識將以事實為單位進?存儲;模式層:存儲經過提煉的知識,通常通過本體庫來管理這一層;本體庫:儲存著知識圖譜的類,數據層則存儲真實的數據。模式層:實體#關系#實體,實體#屬性#性值。數據層:吳京#妻子#謝楠,吳京#導演#戰(zhàn)狼Ⅱ。實例7.2
知識圖譜的架構7.2.2技術架構知識圖譜的技術架構是指其構建模式的結構,同時也是知識圖譜更新的過程。圖7-5知識圖譜的技術架構7.2
知識圖譜的架構7.2.2技術架構知識圖譜構建從最原始的數據,采用一系列自動或半自動的技術手段,從原始數據庫和第三方數據庫中提取知識事實,并將其存入知識庫的數據層和模式層,具體過程可以分為下面4個階段。01020304知識加工知識融合知識抽取數據源(數據獲取)03知識抽取7.3
知識抽取
知識抽?。↘nowledgeExtraction)是指自動地從文本中發(fā)現和抽取相關信息,并將多個文本碎片中的信息進行合并,將非結構化數據轉換為結構化數據。知識抽取任務主要包括以下3個關鍵子任務。
實體抽?。簭奈谋局袡z測出命名實體,再將它分類到預定義的類別中,比如這個實體是屬于人物類、組織類、地點類等等。關系抽取:從文本中識別抽取到實體與實體之間的關系。事件抽取:從文本中識別關于事件的信息,并以結構化的形式呈現,比如可以從一條新聞報道中識別到這件事情發(fā)生的時間、地點、人物等信息。7.3
知識抽取知識抽取面向不同類型的數據源,涉及的關鍵技術和需要解決的技術難點有所不同。知識抽取主要包含序列標注任務和結構化知識生成任務兩種。表7-1知識抽取的數據源數據源定義舉例結構化數據是指由二維表結構來邏輯表達和實現的數據。嚴格地遵循數據格式與長度規(guī)范,主要通過關系型數據庫進行存儲和管理。半結構化數據是結構化數據的一種形式,雖不符合關系型數據庫或其他數據表的形式關聯起來的數據模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層。常見的有百科類數據、網頁數據、JSON、XML等。非結構化數據是數據結構不規(guī)則或不完整,沒有預定義的數據模型,不方便使用數據庫二維邏輯表來表現的數據。包括所有格式的辦公文檔、文本、圖片、HTML、各類報表、圖像和音頻/視頻信息等。IDNamePhoneAddress1張一3337899湖北省武漢市2王二3337499廣東省深圳市福田區(qū)3李三3339003廣東省深圳市南山區(qū)7.3
知識抽取7.3.1非結構化數據的知識抽取1.實體抽取1)定義實體抽取:又名實體識別,從文本中檢測出命名實體,并將其分類到預定義的類別中,實體抽取實例:一段新聞報道中的句子“北京時間9月22日,中超聯賽第26輪,上海申花主場2:0力克滄州雄獅”。圖7-7實體抽取舉例7.3
知識抽取7.3.1非結構化數據的知識抽取1.實體抽取2)方法從文本中進行實體抽取,首先需要從文本中識別和定位實體,再將識別的實體分類到預定義的類別中。圖7-8實體抽取方法7.3
知識抽取7.3.1非結構化數據的知識抽取2.關系抽取1)定義關系抽?。≧elationExtraction,RE)面向非結構化文本數據。關系抽取是自動識別實體之間具有的某種語義關系,從文本中抽取實體及實體之間的關系。2)方法關系抽取一般是在識別出文本的實體后,再抽取實體之間可能存在的關系。圖7-12關系抽取方法7.3
知識抽取7.3.1非結構化數據的知識抽取3.事件抽取1)定義事件是指發(fā)生的事情,通常具有時間、地點、參與者等屬性。事件的發(fā)生可能是因為一個動作的產生或者系統狀態(tài)的改變。事件抽取是指從文本中抽取用戶感興趣的事件信息,并以結構化的形式呈現。圖7-15“出生”事件的基本組成要素7.3
知識抽取7.3.1非結構化數據的知識抽取3.事件抽取2)方法抽取的方法主要有基于規(guī)則的方法、基于監(jiān)督學習的方法和基于弱監(jiān)督學習的方法,任務包含的子任務有5類,分別為識別觸發(fā)詞以及事件類型、抽取事件元素及判斷其角色、事件描述(詞組或句子)、事件屬性標注以及事件共指消歧。圖7-16事件抽取方法7.3
知識抽取7.3.1非結構化數據的知識抽取3.事件抽取事件觸發(fā)詞識別是一項非常具有挑戰(zhàn)性的任務,因為一個詞在不同的上下文可以觸發(fā)不同的事件,例如觸發(fā)詞release。圖7-17事件觸發(fā)詞識別7.3
知識抽取7.3.2結構化數據的知識抽取結構化數據指類似關系庫中表格形式的數據,它們各項之間往往存在明確的關系名稱和對應關系。因此可以簡單的將其轉化為RDF或其他形式的知識庫內容。2012年發(fā)布了兩個RDB2RDF映射方法:直接映射(DirectMapping,DM)和R2RML。序號映射前的關系數據庫參數映射后的知識庫參數1表(Table)類(Class)2列(Column)RDF屬性(Property)3行(Row)資源/實體(Resource/Instance),創(chuàng)建IRI4單元(Cell)屬性值(PropertyValue)表7-5關系數據映射為知識庫規(guī)則7.3
知識抽取7.3.3半結構化數據的知識抽取半結構化數據是指類似百科、商品列表等本身存在一定結構但需要進一步提取整理的數據。1.百科類數據知識抽取以百度百科為代表的百科類數據是典型的半結構化數據。已經構建的知識圖譜有DBpedia、Yago、Zhishi.me、XLore和CN-DBpedia等。DBpedia是較早發(fā)布、具有代表性的知識圖譜,以此為例介紹構建方法。圖7-20百度百科詞條頁面結構7.3
知識抽取7.3.3半結構化數據的知識抽取2.Web網頁數據抽取網頁數據進行抽取可以使用包裝器實現。包裝器是一個能夠將數據從HTML網頁中抽取出來,并且將它們還原為結構化數據的軟件程序?;诎b器抽取網頁信息的流程,輸入為網頁數據,通過包裝器進行抽取,輸出結構化數據。包裝器的生成方法有3大類:手工方法、包裝器歸納方法和自動抽取方法。7.3
知識抽取7.3.3半結構化數據的知識抽取3.自動抽取方法在自動抽取方法中,相似的網頁首先通過聚類被分成若干組,通過挖掘同一組中相似網頁的重復模式可以生成適用于該組網頁的包裝器。應用包裝器進行數據抽取時,首先將需要抽取的頁面劃分到先前生成的網頁組,然后應用該組對應的包裝器進行數據抽取。圖7-25自動抽取流程04知識融合7.4
知識融合圖7-26實例層異構舉例7.4
知識融合知識融合包含兩部分內容,分別為實體鏈接和知識合并。知識融合通過這兩個過程可以清除知識抽取得到的結構化數據中可能存在的大量冗余和錯誤信息,整合相關數據,解決數據之間扁平化的關系,缺乏層次性和邏輯性的問題,從而提高知識的質量。圖7-27知識融合舉例7.4
知識融合7.4.1知識融合的基本技術流程知識融合一般分為兩步:本體對齊和實體匹配。圖7-28知識融合的基本技術流程7.4
知識融合7.4.2典型知識融合工具1.本體匹配(本體對齊)工具-Falcon-AOFalcon-AO:是一個基于Java的自動本體匹配系統,已經成為RDF(S)和OWL所表達的Web本體相匹配的一種實用和流行的選擇。7.4
知識融合7.4.2典型知識融合工具2.實體匹配工具-DedupeDedupe用于模糊匹配,記錄去重和實體鏈接的Python庫。①指定謂詞集合&相似度函數②訓練Blocking③訓練邏輯回歸(LR)模型7.4
知識融合7.4.2典型知識融合工具(3)實體匹配工具-LimesLimes是一個基于度量空間的實體匹配發(fā)現框架,適合大規(guī)模數據鏈接,編程語言是Java。圖7-33Limes整體框架7.4
知識融合7.4.2典型知識融合工具(4)實體匹配工具-SilkSilk用于集成異構數據源的開源框架。圖7-34
Silk整體框架7.4
知識融合7.4.3實體鏈接實體鏈接(EntityLinking)是指對于從文本中抽取得到的實體對象,將其鏈接到知識庫中對應的正確實體對象的操作。
實體指稱項:在具體上下文中出現的待消歧實體名,是實體消歧任務的基本單位。實體消歧:判斷知識庫中的同名實體是否代表不同的含義,可以理解為解決實體概念的一詞多義現象。屬性對齊:把同一個屬性的不同描述方式進行融合。共指消解:知識庫中是否存在其它命名實體和當前實體表示相同的含義。7.4
知識融合7.4.3實體鏈接實體鏈接(EntityLinking)基本思想是首先根據給定的實體指稱項,從知識庫中選出一組候選實體對象,然后通過相似度計算將指稱項鏈接到正確的實體對象?;玖鞒贪▽嶓w指稱識別、候選實體生成和候選實體消歧3個步驟。7.4
知識融合7.4.3實體鏈接中國證券網訊(記者王雪青)中國證券記者今日獲悉,萬達集團的文明產業(yè)版圖將再添世界級新軍——傳奇影業(yè),具體收購情況或于下周二正式發(fā)布。實體鏈接實例7.4
知識融合7.4.3實體鏈接無鏈接提及預測候選實體消歧候選實體生成實體指稱識別7.4
知識融合7.4.3實體鏈接詞語消歧:指代、重名等現象,不利于機器準確理解文本的語義。知識圖譜融合:知識圖譜的融合,可以粗暴地理解為批量地向已有知識庫添加三元組信息,使用實體鏈接技術可以實現添加操作的自動化。知識圖譜構建:知識圖譜的構建過程,就是將一個個三元組添加到已有知識庫的。實體鏈接應用7.4
知識融合7.4.4知識合并常見的知識合并需求有兩個方面:一是合并外部知識庫,二是合并關系數據庫。合并外部知識庫將外部知識庫融合到本地知識庫需要處理兩個層面的問題:數據層的融合和模式層的融合。數據層的融合:包括實體的指稱、屬性、關系以及所屬類別等,主要問題是如何避免實例以及關系的沖突問題,造成不必要的冗余。模式層的融合:主要是將得到的本體融入已有的本體庫中。合并關系數據庫在知識圖譜構建過程中,一個重要的高質量知識來源是企業(yè)或機構自己的關系數據庫。為了將這些結構化的歷史數據融入到知識圖譜中,可以采用資源描述框架(RDF)作為數據模型。業(yè)界和學術界將這一數據轉換過程形象地稱為RDB2RDF,其實質就是將關系數據庫的數據換成RDF的三元組數據。05知識加工7.5知識加工7.5.1
實體構建通過信息抽取,可以從原始語料中提取出實體、關系與屬性等知識要素,再經過知識融合,可以消除實體指稱項與實體對象之間的歧義,得到一系列基本的事實表達。事實本身并不等于知識,要想最終獲得結構化、網絡化的知識體系,還需要經歷知識加工的過程。知識加工主要包括3方面內容:實體構建、知識推理和質量評估。7.5知識加工7.5.1
實體構建構建實體可以采用人工編輯的方式手動構建,如借助實體編輯軟件。人工方式的工作量巨大,一般以數據驅動的方式構建本體,包含3個階段:實體并列關系相似度計算、實體上下位關系抽取和實體的生成。圖7-40本體構建實例7.5知識加工7.5.2知識推理知識推理是指從知識庫中已有的實體關系數據出發(fā)進行計算機推理,建立實體間的新關聯,從而拓展和豐富知識網絡。假設,A的孩子是Z,B的孩子是Z,那么A、B的關系很有可能是配偶關系。例如康熙是雍正的父親,雍正是乾隆的父親,對于康熙和乾隆這兩個實體,通過知識推理可以獲得他們之間是祖孫關系。知識推理的對象也并不局限于實體間的關系,也可以是實體的屬性值、本體的概念層次關系等。
推理屬性值:已知某實體的生日屬性,可以通過推理得到該實體的年齡屬性。
推理概念:已知(老虎,科,貓科)和(貓科,目,食肉目)可以推出(老虎#目:食肉目)7.5知識加工7.5.2知識推理(1)基于邏輯的推理方法基于邏輯的推理主要包括一階邏輯謂詞、描述邏輯以及基于規(guī)則的推理。一階謂詞邏輯建立在命題的基礎上,在一階謂詞邏輯中,命題被分解為個體(Individuals)和謂詞(Predication)兩部分。個體是指可以獨立存在的客體,可以是一個具體的事物,也可以是一個抽象的概念。謂詞是用來刻畫個體性質及事物關系的詞。比如(A,friend,B)就是表達個體A和B關系的謂詞。描述邏輯(DescriptionLogic)是一種基于對象知識表示的形式化工具,是一階謂詞邏輯的子集,它是實體語言推理的重要設計基礎?;谝?guī)則的推理可以利用專門的規(guī)則語言,如SWRL(SemanticWebRuleLanguage)。7.5知識加工7.5.2知識推理(2)基于圖的推理方法主要基于神經網絡模型或PathRanking算法。PathRanking算法的基本思想是將知識圖譜視為圖(以實體為節(jié)點,以關系或屬性為邊),從源節(jié)點開始,在圖上執(zhí)行隨機游走。如果能夠通過一個路徑到達目標節(jié)點,則推測源節(jié)點和目標節(jié)點可能存在關系。7.5知識加工7.5.2知識推理7.5知識加工7.5.3質量評估質量評估也是知識圖譜構建技術的重要組成部分。質量評估意義在于可以對知識的可信度進行量化,通過舍棄置信度較低的知識保障知識庫的質量。7.5知識加工7.5.4知識更新知識圖譜的內容更新有兩種方式,一種是全面更新,另一種是增量更新。全面更新是指以更新后的全部數據為輸入,從零開始構建知識圖譜。這種方法比較簡單,但資源消耗大,而且需要耗費大量人力資源進行系統維護。增量更新是指以當前新增數據為輸入,向現有知識圖譜中添加新增知識。這種方式資源消耗小,但目前仍需要大量人工干預(定義規(guī)則等),因此實施起來十分困難。知識的更新主要包括概念層的更新和數據層的更新兩個方面。概念層的更新是指新增數據后獲得了新的概念,需要自動將新的概念添加到知識庫的概念層中。數據層的更新主要是新增或更新實體、關系、屬性值,對數據層進行更新需要考慮數據源的可靠性和數據的一致性(是否存在矛盾或冗雜等問題),選取可靠數據源,并選擇在各數據源中出現頻率高的事實和屬性加入知識庫。06小結7.6小結
本章簡述了知識圖譜的起源,介紹了知識圖譜的架構,并詳細介紹了知識圖譜的構建過程,包括知識的抽取、知識的融合和知識的加工。首先確定知識表示模型,然后根據數據來源選擇不同的知識獲取手段把知識導入模型中,構建知識圖譜;接著綜合利用知識推理、知識融合、知識挖掘等技術對構建的知識圖譜進行質量提升,最后根據場景需求設計不同的知識訪問方法,如語義搜索、問答交互等。幫助讀者了解知識建模、關系抽取、圖存儲、關系推理、實體融合相關內容。感謝您的觀看!人工智能技術基礎圖神經網絡第8章圖結構普遍存在于人類社會生活中,如人與人之間的社交網絡、地鐵線路及高鐵線路、互聯網中網頁間的互相鏈接、論文的引用等等,都可以用圖結構來描述。圖神經網絡(GraphNeuralNetwork,GNN)自提出以來,除了在計算機視覺、自然語言處理等領域應用之外,還在物理、生物、化學、社會科學等跨學科的網絡分析、推薦系統、生物化學、交通預測等諸多領域應用。8圖神經網絡簡介社交網絡化學分子網絡本章在介紹圖論基礎與圖譜理論的基礎上,給出圖神經網絡的基本原理和圖神經網絡的分類。進而給出幾種典型的圖卷積神經網絡、圖循環(huán)神經網絡、圖注意力網絡、圖生成網絡以及圖時空網絡等模型。8圖神經網絡簡介論文引用網絡1.學習圖論基礎與圖譜理論的基本原理,理解掌握分析、構建圖神經網絡得到基本工具;2.學習圖神經網絡的基本原理,掌握圖神經網絡的消息傳遞、更新與聚合等基本操作,了解圖神經網絡的應用場景,包括圖分類、節(jié)點分類、關系預測以及去噪重建;3.學習圖神經網絡的分類,了解圖卷積神經網絡、圖注意力網絡、圖生成網絡以及時空圖神經網絡的基本概念;4.深入學習圖卷積神經網絡、圖注意力網絡、圖生成網絡以及時空圖神經網絡,掌握相關圖神經網絡的原理以及應用。8圖神經網絡學習目標目錄Contents8.1圖論基礎與圖譜理論圖神經網絡基本原理圖神經網絡分類卷積圖神經網絡8.28.38.48.5圖注意力網絡圖生成網絡圖時空網絡本章小結8.68.78.801圖論與圖譜理論8.1圖論基礎與圖譜理論8.1.1圖論基礎——圖的定義與表示
8.1圖論基礎與圖譜理論8.1.1圖論基礎——無向圖與有向圖圖最基本的性質之一是它是有向的還是無向的,如圖8-1所示。在一個有向圖中,每條邊都有一個方向或兩個方向。這意味著該邊沿著一個特定的方向連接兩個節(jié)點,其中一個節(jié)點是源節(jié)點,另一個節(jié)點是目的地節(jié)點。相比之下,無向圖有無向邊,其中的邊沒有方向。圖8-1無向圖與有向圖(a)無向圖(b)有向圖8.1圖論基礎與圖譜理論8.1.1圖論基礎——權值圖圖的另一個重要性質是這些邊是有權重還是無權重的。在一個權值圖中,如圖8-2所示,每條邊都有一個與之相關聯的權重或代價。這些權重可以代表各種因素,如距離、旅行時間或成本。例如,在一個交通網絡中,邊的權重可能代表不同城市之間的距離或在它們之間旅行所花費的時間。相比之下,無權圖沒有與其邊相關聯的權重。這些類型的圖通常用于節(jié)點之間的關系是二進制的情況,而邊只是表示它們之間是否存在連接。圖8-2權值圖8.1圖論基礎與圖譜理論8.1.1圖論基礎——鄰接矩陣與關聯矩陣鄰接矩陣在n個頂點的圖需要有一個n×n大小的矩陣A。在一個無權圖中,矩陣坐標中每個位置的值為1,代表兩個點是相連的,0表示兩點是不相連的;在一個有權圖中,矩陣坐標中每個位置值代表該兩點之間的權重,0表示該兩點不相連。對于無向圖,鄰接矩陣是對稱的,而對于有向圖,矩陣不一定是對稱的。圖8-3顯示了與該無向圖關聯的鄰接矩陣。圖8-3鄰接矩陣8.1圖論基礎與圖譜理論8.1.1圖論基礎——鄰域與度矩陣
8.1圖論基礎與圖譜理論8.1.2譜圖理論——拉普拉斯矩陣及性質
8.1圖論基礎與圖譜理論8.1.2譜圖理論——拉普拉斯矩陣及性質
8.1圖論基礎與圖譜理論8.1.2譜圖理論——譜分解
8.1圖論基礎與圖譜理論8.1.2譜圖理論——譜分解
8.1圖論基礎與圖譜理論8.1.2譜圖理論——譜分解
8.1圖論基礎與圖譜理論8.1.2譜圖理論——譜分解
02圖神經網絡基本原理8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——消息傳遞
圖8-4各個節(jié)點的鄰域(a)(b)(c)(d)(e)8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——消息傳遞
圖8-4各個節(jié)點的鄰域(a)(b)(c)(d)(e)8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——聚合
圖8-5節(jié)點2的聚合操作8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——更新
8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——更新
8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——更新
8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——更新
8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——更新
8.2圖神經網絡基本原理8.2.1圖神經網絡基本操作——更新(a)(b)8.2圖神經網絡基本原理8.2.2多層GNN
圖8-7多層GNN(a)(b)(c)8.2圖神經網絡基本原理8.2.3GNN應用場景
圖8-8GNN分類8.2圖神經網絡基本原理8.2.3GNN應用場景
圖8-9GNN自編碼器8.2圖神經網絡基本原理8.2.3GNN應用場景
圖8-10GNN節(jié)點分類8.2圖神經網絡基本原理8.2.3GNN應用場景
8-11GNN鏈接預測03圖神經網絡分類8.3圖神經網絡分類卷積圖神經網絡
8.3圖神經網絡分類圖注意力網絡圖注意力網絡可以簡單理解為借助注意力模塊取代一般卷積圖神經網絡中的卷積激活器。在不同的方法中,可以結合門控信息來提升注意力機制感受域的權重參數,達到更好的推理和應用性能。圖卷積神經網絡實現了對圖結構數據的節(jié)點分類,而注意力機制目前在NLP領域有非常好的效果和表現。對于圖注意力機制(GraphAttention,GAT)而言,鄰域節(jié)點的特征做累加求和的過程與卷積圖神經網絡完全不同,通過全局注意力機制替代卷積分層傳遞的固化操作,可以有效地選擇在圖結構中更為重要的節(jié)點或子圖、模型、路徑分配更大的注意力權重。8.3圖神經網絡分類圖生成網絡圖生成網絡的目標是基于一組可觀察圖來生成圖。其中的很多方法都是特定領域的。例如,在分子圖生成方面,一些研究將分子圖的表征建模為字符串。在NLP中,生成語義圖或知識圖通常需要一個給定的句子。近年來,研究人員又提出了一些通用方法,主要有兩個方向:一是將生成過程看成節(jié)點或邊的形成,另一些則使用生成對抗訓練。該領域的方法主要使用卷積圖神經網絡作為構造塊。8.3圖神經網絡分類時空圖神經網絡
04卷積圖神經網絡8.4卷積圖神經網絡8.4.1基于圖譜理論的ConvGNN
8.4卷積圖神經網絡8.4.1基于圖譜理論的ConvGNN
8.4卷積圖神經網絡8.4.1基于圖譜理論的ConvGNN
8.4卷積圖神經網絡8.4.1基于圖譜理論的ConvGNN8.4卷積圖神經網絡8.4.2基于空間的ConvGNN圖像可以被認為是一種特殊形式的圖,每個像素代表一個節(jié)點。每個像素都直接連接到其附近的像素,如圖8-14(a)圖所示。類似地,基于空間的圖卷積將中心節(jié)點的表示與其鄰域的表示進行卷積,得到中心節(jié)點的更新表示,如圖8-14(b)圖所示。圖8-142D卷積與圖卷積(a)(b)8.4卷積圖神經網絡8.4.2基于空間的ConvGNN
8.4卷積圖神經網絡8.4.2基于空間的ConvGNNHamilton等人于2017年引入了GraphSAGE,作為用于在大型圖(具有超過100000個節(jié)點)上進行歸納表示學習的框架。其目標是為下游任務生成節(jié)點編碼,例如節(jié)點分類。此外,它還解決了GCN和GAT面臨的兩個問題——在大型圖上進行擴展和高效地推廣到未見數據。在GraphSAGE方法中,每個GNN層都根據它們的鄰居計算節(jié)點編碼。這意味著計算一個只需要這個節(jié)點的直接鄰居(1跳)。如果GNN有兩個GNN層,需要這些鄰居和它們自己的鄰居(2個跳),以此類推(如圖8-15所示)。網絡的其余部分與計算這些單個節(jié)點編碼無關。圖8-15以節(jié)點0為目標節(jié)點和1跳和2跳鄰居的圖8.4卷積圖神經網絡8.4.2基于空間的ConvGNN從圖8-16可以看出,需要聚合2跳鄰居,以計算1跳鄰居的。然后對這些編碼進行聚合,以獲得節(jié)點0的編碼。上述方法存在兩個問題,一是計算圖相對跳數呈指數級增長,二是具有高度連接性的節(jié)點會創(chuàng)建出巨大的計算圖。因此在GraphSAGE中,作者提出了一種稱為鄰居采樣的技術。鄰居采樣沒有在計算圖中添加每個鄰居,而是采樣一個預定義的數量。圖8-16節(jié)點0的計算圖圖8-17一個具有鄰居采樣的計算圖來保持兩個1跳鄰居和兩個2跳鄰居8.4卷積圖神經網絡8.4.2基于空間的ConvGNN
05圖注意力網絡8.5圖注意力網絡與GCN平等對待節(jié)點的所有鄰居相比,注意力機制可以為每個鄰居分配不同的注意力得分,從而識別出更重要的鄰居。將注意力機制納入圖譜神經網絡的傳播步驟是很直觀的。圖注意力網絡也可以看作是圖卷積網絡家族中的一種方法。GAT背后的主要思想是,一些節(jié)點比其它節(jié)點更重要。但是圖卷積層已經做過歸一化操作,鄰居很少的節(jié)點比其他節(jié)點更重要。這種方法是有局限的,因為它只考慮了節(jié)點的度。另一方面,圖注意力層的目標是產生考慮節(jié)點特征重要性的加權因子,如圖8-18所示。圖8-18注意力系數計算8.5圖注意力網絡
8.5圖注意力網絡
8.5圖注意力網絡
8.5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年春八年級歷史下冊 第11課 城鄉(xiāng)人民生存狀態(tài)的滄桑巨變說課稿1(pdf) 川教版
- Unit 2 Understanding each other Project 說課稿-2023-2024學年高中英語牛津譯林版(2020)選擇性必修第四冊
- Unit 6 Meet my family Part B Let's talk Let's learn大單元整體說課稿表格式-2024-2025學年人教PEP版英語四年級上冊
- 2024年秋七年級生物上冊 3.5.2 綠色植物的呼吸作用說課稿 (新版)新人教版001
- 葡萄園立柱施工方案
- 2023三年級數學下冊 三 美麗的街景-兩位數乘兩位數信息窗1 美麗的街燈第2課時說課稿 青島版六三制
- 預制水泥臨時圍墻施工方案
- 臨時合同范例復制
- 西安電動推拉雨棚施工方案
- 2024秋一年級語文上冊 漢語拼音 11 ie üe er說課稿 新人教版
- 2024美團簡化版商家合作合同標準文本一
- 2025年貴州黔源電力股份有限公司招聘筆試參考題庫含答案解析
- 《休閑食品加工技術》 課件 1 休閑食品生產與職業(yè)生活
- 春季開學安全第一課
- 2025年新生兒黃疸診斷與治療研究進展
- 廣東大灣區(qū)2024-2025學年度高一上學期期末統一測試英語試題(無答案)
- 2025年四川中煙工業(yè)限責任公司招聘110人高頻重點提升(共500題)附帶答案詳解
- 課題申報書:數智賦能高職院校思想政治理論課“金課”實踐路徑研究
- 公司安全生產事故隱患內部報告獎勵工作制度
- H3CNE認證考試題庫官網2022版
- 感統訓練培訓手冊(適合3-13歲兒童)
評論
0/150
提交評論