




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用 12ContentRDF 簡介簡介URILinked DataLinked Data的應(yīng)用的應(yīng)用 3ContentRDF 簡介簡介URILinked DataLinked Data的應(yīng)用的應(yīng)用 RDF的概念的概念RDF(Resource Description Framework)即即資源描述資源描述框架框架,它專門用于表達關(guān)于,它專門用于表達關(guān)于Web資資源的元數(shù)據(jù)。所謂元數(shù)據(jù),就是源的元數(shù)據(jù)。所謂元數(shù)據(jù),就是“描述數(shù)據(jù)的描述數(shù)據(jù)的數(shù)據(jù)數(shù)據(jù)”或者或者“描述信息的信息描述信息的信息”。比如書的內(nèi)容。比如書的內(nèi)容是書的數(shù)據(jù),而作者的名字、出版社的地址是書的數(shù)據(jù),
2、而作者的名字、出版社的地址或版權(quán)信息是書的元數(shù)據(jù)?;虬鏅?quán)信息是書的元數(shù)據(jù)。4 簡單而言,一個簡單而言,一個RDF文件包含多個資源文件包含多個資源描述,而一個資源描述是由多個語句構(gòu)成,描述,而一個資源描述是由多個語句構(gòu)成,一個語句是由資源、屬性類型、屬性值構(gòu)成一個語句是由資源、屬性類型、屬性值構(gòu)成的三元體,表示資源具有的一個屬性。資源的三元體,表示資源具有的一個屬性。資源描述中的語句可以對應(yīng)于自然語言的語句,描述中的語句可以對應(yīng)于自然語言的語句,資源對應(yīng)于自然語言中的主語,屬性類型對資源對應(yīng)于自然語言中的主語,屬性類型對應(yīng)于謂語,屬性值對應(yīng)于賓語。應(yīng)于謂語,屬性值對應(yīng)于賓語。5 由于使用的是結(jié)構(gòu)
3、化的由于使用的是結(jié)構(gòu)化的XML數(shù)據(jù)數(shù)據(jù),搜搜索引擎可以理解元數(shù)據(jù)的精確含義,使索引擎可以理解元數(shù)據(jù)的精確含義,使得搜索變得更為智能和準(zhǔn)確,完全可以得搜索變得更為智能和準(zhǔn)確,完全可以避免當(dāng)前搜索引擎經(jīng)常返回?zé)o關(guān)數(shù)據(jù)的避免當(dāng)前搜索引擎經(jīng)常返回?zé)o關(guān)數(shù)據(jù)的情況。當(dāng)然前提情況。當(dāng)然前提RDF和標(biāo)準(zhǔn)化的和標(biāo)準(zhǔn)化的RDF詞詞匯表在匯表在Web上廣泛使用,而且搜索引擎上廣泛使用,而且搜索引擎需要能夠理解使用的詞匯表。需要能夠理解使用的詞匯表。6 RDF的作用(的作用(1) RDF的作用(的作用(2) RDF解決的是如何采用解決的是如何采用XML標(biāo)準(zhǔn)語法無標(biāo)準(zhǔn)語法無二義性地描述資源對象的問題,使得所描述二義性地
4、描述資源對象的問題,使得所描述的資源的元數(shù)據(jù)信息成為機器可理解的信息。的資源的元數(shù)據(jù)信息成為機器可理解的信息。如果把如果把XML看作為一種標(biāo)準(zhǔn)化的元數(shù)據(jù)語法看作為一種標(biāo)準(zhǔn)化的元數(shù)據(jù)語法規(guī)范的話,那么規(guī)范的話,那么RDF就可以看作為一種標(biāo)準(zhǔn)就可以看作為一種標(biāo)準(zhǔn)化的元數(shù)據(jù)語義描述規(guī)范?;脑獢?shù)據(jù)語義描述規(guī)范。7 ContentRDF簡介簡介URILinked DataLinked Data的應(yīng)用的應(yīng)用8 為什么引入為什么引入URI? 采用采用URL( Uniform Resource Location )可以用一種統(tǒng)一的格式來描述各種信息資源可以用一種統(tǒng)一的格式來描述各種信息資源,包括文件、服務(wù)器
5、的地址和目錄等。目前最包括文件、服務(wù)器的地址和目錄等。目前最大的缺點是當(dāng)信息資源的存放地點發(fā)生變化大的缺點是當(dāng)信息資源的存放地點發(fā)生變化時,必須對時,必須對URL作相應(yīng)的改變。因此人們正作相應(yīng)的改變。因此人們正在研究新的信息資源表示方法在研究新的信息資源表示方法(URI)。9 URI簡介簡介 Web上可用的每種資源上可用的每種資源 HTML文檔、文檔、圖像、視頻片段、程序等圖像、視頻片段、程序等 由一個通用資源由一個通用資源標(biāo)志符(標(biāo)志符(Uniform Resource Identifier, 簡稱簡稱“URI”)進行定位。)進行定位。 簡單地說,簡單地說,URI是以某是以某種統(tǒng)一的(標(biāo)準(zhǔn)化
6、的)方式種統(tǒng)一的(標(biāo)準(zhǔn)化的)方式標(biāo)識資源標(biāo)識資源的簡單的簡單字符串。字符串。10 ContentRDF簡介簡介URILinked DataLinked Data的應(yīng)用的應(yīng)用11 引言引言 關(guān)聯(lián)數(shù)據(jù)關(guān)聯(lián)數(shù)據(jù)( linked data)這個概念來自這個概念來自W3C, Tim Berners- Lee于于2006年首次提出年首次提出關(guān)聯(lián)數(shù)據(jù)的思想及四個基本原則。關(guān)聯(lián)數(shù)據(jù)關(guān)聯(lián)數(shù)據(jù)的思想及四個基本原則。關(guān)聯(lián)數(shù)據(jù)通過網(wǎng)絡(luò)把以前沒有關(guān)聯(lián)的相關(guān)數(shù)據(jù)連接起通過網(wǎng)絡(luò)把以前沒有關(guān)聯(lián)的相關(guān)數(shù)據(jù)連接起來來, 已經(jīng)成為推動已經(jīng)成為推動語義語義Web發(fā)展的重要力量發(fā)展的重要力量之一之一, 并得到了政府、企業(yè)、研究機構(gòu)、圖
7、書并得到了政府、企業(yè)、研究機構(gòu)、圖書館等各方面的廣泛關(guān)注。館等各方面的廣泛關(guān)注。12 什么是關(guān)聯(lián)數(shù)據(jù)?什么是關(guān)聯(lián)數(shù)據(jù)? 維基百科中的定義維基百科中的定義: 關(guān)聯(lián)數(shù)據(jù)是一種推薦的關(guān)聯(lián)數(shù)據(jù)是一種推薦的最佳實踐,用來在最佳實踐,用來在語義網(wǎng)語義網(wǎng)中使用中使用URI和和RDF發(fā)布、分享、連接各類數(shù)據(jù)、信息和知識。發(fā)布、分享、連接各類數(shù)據(jù)、信息和知識。 (“A term used to describe a recommended best practice for exposing ,sharing ,and connecting pieces of data ,information ,and kn
8、owledage on the Semantic Web using URI and RDF.”)13 通俗的說,關(guān)聯(lián)數(shù)據(jù)是數(shù)據(jù)的一種發(fā)布通俗的說,關(guān)聯(lián)數(shù)據(jù)是數(shù)據(jù)的一種發(fā)布方式,以方式,以 URI 的方式鏈接到一個數(shù)據(jù)對象,的方式鏈接到一個數(shù)據(jù)對象,而不是一個文檔;并且這個數(shù)據(jù)對象基本上而不是一個文檔;并且這個數(shù)據(jù)對象基本上是由是由 RDF 來描述的(這樣才能保證數(shù)據(jù)具有來描述的(這樣才能保證數(shù)據(jù)具有語義),而且語義),而且RDF文件中應(yīng)該包含更多的文件中應(yīng)該包含更多的URI所標(biāo)識的其它資源。所標(biāo)識的其它資源。14為什么叫關(guān)聯(lián)數(shù)據(jù)?為什么叫關(guān)聯(lián)數(shù)據(jù)? vURI 所表示的是數(shù)據(jù),而不是文檔;所表
9、示的是數(shù)據(jù),而不是文檔;vURI 的數(shù)據(jù)資源以的數(shù)據(jù)資源以 RDF 形式表達,其中有形式表達,其中有指向更多數(shù)據(jù)的指向更多數(shù)據(jù)的 URI,也就是鏈接;,也就是鏈接;vRDF 所表達的鏈接其實是有語義的,不僅所表達的鏈接其實是有語義的,不僅僅是一個僅是一個 link 而已,而是表明了當(dāng)前資源而已,而是表明了當(dāng)前資源與被鏈接資源的關(guān)系。與被鏈接資源的關(guān)系。15創(chuàng)建關(guān)聯(lián)數(shù)據(jù),應(yīng)遵循如下四個原則創(chuàng)建關(guān)聯(lián)數(shù)據(jù),應(yīng)遵循如下四個原則:1、使用、使用URI(統(tǒng)一資源標(biāo)識符統(tǒng)一資源標(biāo)識符)作為對象的名稱作為對象的名稱;2、通過使用、通過使用HTTP URI, 人們可以定位到具體人們可以定位到具體 的對象的對象;
10、3、通過查詢對象的、通過查詢對象的URI, 可以提供有意義的信可以提供有意義的信息息( 采用采用RDF、SPARQL標(biāo)準(zhǔn)標(biāo)準(zhǔn));4、提供相關(guān)的、提供相關(guān)的URI鏈接鏈接, 以便可以發(fā)現(xiàn)更多的以便可以發(fā)現(xiàn)更多的對象。對象。16 ContentRDF簡介簡介URILinked DataLinked Data 的應(yīng)用的應(yīng)用17 Linked Data 應(yīng)用于語義網(wǎng)應(yīng)用于語義網(wǎng) 語義網(wǎng)就是能夠根據(jù)語義進行判斷的語義網(wǎng)就是能夠根據(jù)語義進行判斷的網(wǎng)絡(luò)。簡單地說,語義網(wǎng)是一種能理解人網(wǎng)絡(luò)。簡單地說,語義網(wǎng)是一種能理解人類語言的智能網(wǎng)絡(luò),它不但能夠理解人類類語言的智能網(wǎng)絡(luò),它不但能夠理解人類的語言,而且還可以
11、使人與電腦之間的交的語言,而且還可以使人與電腦之間的交流變得像人與人之間交流一樣輕松。流變得像人與人之間交流一樣輕松。18未來的語義網(wǎng)未來的語義網(wǎng) 語義網(wǎng)將使人類從搜索相關(guān)網(wǎng)頁的繁重勞動中解放出來。因為網(wǎng)中的計算機能利用自己的智能軟件,在搜索數(shù)以萬計的網(wǎng)頁時,通過“智能代理”從中篩選出相關(guān)的有用信息。而不像現(xiàn)在的萬維網(wǎng),只給你羅列出數(shù)以萬計的無用搜索結(jié)果。 在瀏覽新聞時,語義網(wǎng)將給每一篇新聞報道貼上標(biāo)簽,分門別類的詳細描述哪句是作者、哪句是導(dǎo)語、哪句是標(biāo)題。這樣,如果你在搜索引擎里輸入“老舍的作品”,你就可以輕松找到老舍的作品,而不是關(guān)于他的文章。19 語義網(wǎng)的體系結(jié)構(gòu)語義網(wǎng)的體系結(jié)構(gòu) 第一層
12、第一層: Unicode + URI( 國際碼國際碼+ 統(tǒng)一資統(tǒng)一資源標(biāo)識源標(biāo)識)它是整個體系結(jié)構(gòu)的基礎(chǔ)。其中它是整個體系結(jié)構(gòu)的基礎(chǔ)。其中Unicode 是一個字符集是一個字符集, 負責(zé)處理資源的編負責(zé)處理資源的編碼。碼。 URI 負責(zé)資源的標(biāo)識負責(zé)資源的標(biāo)識, 它使信息、情它使信息、情報精確檢索成為可能。報精確檢索成為可能。 第二層第二層: XML + NS ( Namespace ) + XMLSchema ( 可擴展標(biāo)記語言可擴展標(biāo)記語言+ 名域名域+ 可可擴展標(biāo)記語言大綱擴展標(biāo)記語言大綱)它負責(zé)從語法上表示數(shù)它負責(zé)從語法上表示數(shù)據(jù)的內(nèi)容和結(jié)構(gòu)。據(jù)的內(nèi)容和結(jié)構(gòu)。第三層第三層: RDF+
13、RDF Schema( 資源描述框資源描述框 架架+資源描述框架大綱資源描述框架大綱)它負責(zé)提供語義模型它負責(zé)提供語義模型來描述來描述We b 上的信息內(nèi)容和結(jié)構(gòu)上的信息內(nèi)容和結(jié)構(gòu)第四層第四層: Ontology vocabulary( 本體詞匯集本體詞匯集)它用于描述各類資源及資源之間的關(guān)系,實它用于描述各類資源及資源之間的關(guān)系,實現(xiàn)對詞匯表的擴展?,F(xiàn)對詞匯表的擴展。第五至七層:第五至七層:Logic、Proof、Trust。Logic負負責(zé)提供公理和推理規(guī)則,而責(zé)提供公理和推理規(guī)則,而Logic一旦建立,一旦建立,便可以通過邏輯推理對資源、資源之間的關(guān)系便可以通過邏輯推理對資源、資源之間的
14、關(guān)系以及推理結(jié)果進行驗證,證明其有效性。通過以及推理結(jié)果進行驗證,證明其有效性。通過Proof交換以及數(shù)字簽名,建立一定的信任關(guān)交換以及數(shù)字簽名,建立一定的信任關(guān)系,從而證明語義網(wǎng)輸出的可靠性以及其是否系,從而證明語義網(wǎng)輸出的可靠性以及其是否符合用戶的要求。符合用戶的要求。20 基于基于RDF句子的語義網(wǎng)文檔搜索句子的語義網(wǎng)文檔搜索 在文檔模型上在文檔模型上, 采用的是基于采用的是基于RDF 句子句子的向量空間模型的向量空間模型, 并引入并引入URI 資源的權(quán)威描述資源的權(quán)威描述的概念。整個語義網(wǎng)文檔的索引過程如下圖的概念。整個語義網(wǎng)文檔的索引過程如下圖所示所示 。21 22 結(jié)果的呈現(xiàn)如下圖所示結(jié)果的呈現(xiàn)如下圖所示 匹配證據(jù)的顯示匹配
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年七月衛(wèi)星遙感數(shù)據(jù)質(zhì)押融資法律文本
- 2025年石英玻璃纖維套管項目合作計劃書
- 班主任工作計劃打造令人欽佩的班級
- 激發(fā)學(xué)生學(xué)習(xí)興趣的班級活動計劃
- 優(yōu)化課堂學(xué)習(xí)環(huán)境的措施計劃
- 班級年度志愿者服務(wù)計劃
- 自我成長的年度計劃
- 教師職業(yè)發(fā)展路徑規(guī)劃計劃
- 2025-2030中國防滑鏈行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 2025-2030中國閥門執(zhí)行器行業(yè)市場發(fā)展分析及投資前景研究報告
- 2024高考復(fù)習(xí)必背英語詞匯3500單詞
- 3課 《赤壁賦》公開課一等獎創(chuàng)新教學(xué)設(shè)計【中職專用】高一語文高教版2023-2024-基礎(chǔ)模塊下冊
- 第5章 層次分析法課件
- 情感糾紛案件調(diào)解協(xié)議書
- 咯血護理疑難病例討論
- 《車間主任培訓(xùn)》課件
- 感染性休克急救流程及應(yīng)急預(yù)案
- 《保障農(nóng)民工工資支付條例》宣傳冊
- 加強疾病預(yù)防控制體系信息化建設(shè)的實施方案
- 幼兒園優(yōu)質(zhì)公開課:小班語言《小兔乖乖》課件
- 醫(yī)療安全(不良)事件匯總登記表(科室)
評論
0/150
提交評論