語義維基的定義_第1頁
語義維基的定義_第2頁
語義維基的定義_第3頁
語義維基的定義_第4頁
語義維基的定義_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語義維基的定義語義維基是一種根據(jù)知識模型組織頁面的維基。語義維基系統(tǒng)就是將傳統(tǒng)的維基系統(tǒng)和語義網(wǎng)技術(shù)結(jié)合起來,這樣使得一方面維基系統(tǒng)可以利用語義網(wǎng)技術(shù)提供比目前的維基系統(tǒng)更好的用戶界面、更先進的檢索和導(dǎo)航工具,另一方面語義網(wǎng)也以借助維基的方便、簡單性和共享性使得非技術(shù)的普通用戶也能夠參與到語義網(wǎng)建設(shè)中。(本部分摘自語義維基概述作者余勝愛)語義維基的層次整個語義維基系統(tǒng)分為三層:數(shù)據(jù)存儲層、程序接口層、用戶界面層。語義維基的分類第一類是強調(diào)語義網(wǎng)應(yīng)用,將語義維基作為組織語義數(shù)據(jù)的工具,比較適合領(lǐng)域?qū)<沂褂?,但非技術(shù)用戶只能敬而遠之;另一類是強調(diào)“用戶友好”,將語義作為維基的數(shù)據(jù)組織工具,針對普通

2、用戶,但只能應(yīng)用語義網(wǎng)的部分特性。用維基組織語義數(shù)據(jù)(Wikis for Semantic Data)當(dāng)前的很多項目都是基于第一類,它們將詞條作為概念(Concept),超鏈接作為對象或數(shù)據(jù)屬性(Property),這種模型被稱之為“維基本體(Wikitology)”。這類維基系統(tǒng)作為充分支持本體信息編輯的協(xié)作編輯工具,能幫助領(lǐng)域?qū)<液捅倔w工作者在一個系統(tǒng)里合作,同時維基頁面里的文字內(nèi)容既可以供人閱讀同時也是正式的本體。即使這種維基不能編輯復(fù)雜的schema信息,它仍可能用來開發(fā)和存檔本體詞匯。這類語義維基的主要代表是Semantic MediaWiki(簡稱SMW)。它是在MediaWiki

3、(WikiPedia使用的維基引擎)的基礎(chǔ)上引入語義標(biāo)注,即在原有的維基標(biāo)記語言(WikiML)基礎(chǔ)上增加了新語法,建立標(biāo)注屬性、類型、值的關(guān)系的語法基礎(chǔ)。SMW在每個頁面下面增加了一個factbox,里面顯示與當(dāng)前維基詞條相關(guān)的語義數(shù)據(jù),同時還可將該語義數(shù)據(jù)輸出為OWLRDF格式。同時SMW還提供一個瀏覽語義數(shù)據(jù)的界面你可以從輸入一個詞條名稱開始,瀏覽所有語義相關(guān)的數(shù)據(jù)還可以通過點擊按鈕轉(zhuǎn)到對應(yīng)的維基頁面。通過點擊按鈕查找所有具有相同屬性值(property value)的語義數(shù)據(jù)。這類語義維基成了本體的動態(tài)和不斷修正的工具,并使得維基內(nèi)容從文本描述到正式概念的提升。這類語義維基并不適合普通

4、用戶,用戶需要學(xué)習(xí)WikiML及本體建模相關(guān)知識。語義作為維基的數(shù)據(jù)組織工具(Semantic Data for Wikis)目前有些應(yīng)用只是引入語義工具來支持現(xiàn)有的維基,比如,通過語義搜索功能簡化信息搜索。在這種情況下,語義數(shù)據(jù)主要目標(biāo)是保持簡單易用的原則,因此不會引入太多新的界面或功能,也不能進行大規(guī)模的推理。IkeWiki是這類語義維基的典型代表,支持從非正式文本到采用OWL正式本體的不同層次的形式化表達,并且具有豐富的界面交互。它基于JAVA技術(shù),采用著名的Jena語義平臺。IkeWiki與SMW最大的不同之處在于IkeWiki要求預(yù)先加載本體到系統(tǒng)中,也就意味著如果本體中沒有OWL元

5、素屬性,就無法在IkeWiki系統(tǒng)中進行謂詞標(biāo)注。另外一個不同在于IkeWiki將語義數(shù)據(jù)與維基頁面內(nèi)容分開存儲。當(dāng)呈現(xiàn)(rendering)一個頁面時,呈現(xiàn)通道(rendering pipeline)將分別存儲的文章內(nèi)容和元數(shù)據(jù)組合成帶有語義標(biāo)注的頁面文本。(本部分摘自語義維基概述作者余勝愛根據(jù)側(cè)重的使用目的分類:語義Wiki的特征可被劃分為五種類型的活動:創(chuàng)建,導(dǎo)航,檢索,重用和社會協(xié)作。除了OntoWiki,它們都缺乏必要的社會協(xié)作手段。比較完善的語義Wiki引擎依次如下:OntoWiki、COW、Semantic MediaWiki、Makna、IkeWiki等。語義維基除了具有傳統(tǒng)維

6、基的基本特點之外,還需要著重解決三個問題:如何對維基內(nèi)容進行標(biāo)注? 如何對內(nèi)容進行形式化地描述? 如何對內(nèi)容進行導(dǎo)航?PlatypusWiki、Semantic MediaWiki、SemperWiki、IkeWiki和WikSAR。這些系統(tǒng)都具備如下的特征:(1) 對鏈接進行標(biāo)注。幾乎所有的語義維基系統(tǒng)都能夠通過給鏈接賦予一定的類型而對鏈接進行標(biāo)注。這是因為,由用戶所創(chuàng)建的鏈接幾乎本身就帶有一定的含義,而不僅僅是用于簡單的鏈接導(dǎo)航。不同的系統(tǒng)采用不同的方法進行鏈接標(biāo)注。一些語義維基系統(tǒng)把標(biāo)注作為維基語法的一部分,如SemanticMediaWiki,而另外一些維基系統(tǒng)提供了一個獨立的編輯器來

7、用于標(biāo)注,如IkeWiki。(2) 上下文敏感的表達方式。許多語義維基系統(tǒng)可以根據(jù)語義標(biāo)注來改變內(nèi)容的表達方式。這包括:將語義相關(guān)的頁面顯示在一個獨立的鏈接框中、顯示來源于底層知識庫的信息(如將屬于同一層次結(jié)構(gòu)下的內(nèi)容以圖形樹的形式顯示在對話框中) ,甚至可以根據(jù)上下文環(huán)境使得同一個頁面的內(nèi)容以不同的方式顯示(如以多媒體方式顯示或以文本方式顯示)。(3) 增強的導(dǎo)航功能。對鏈接進行標(biāo)注可以為導(dǎo)航提供更多的信息。傳統(tǒng)的維基系統(tǒng)只是沿著鏈接方向?qū)Ш?而語義維基系統(tǒng)則提供了描述鏈接關(guān)系的額外的信息,這些信息可以被用于提供更復(fù)雜的導(dǎo)航。(4) 語義檢索。大多數(shù)的語義維基系統(tǒng)能夠基于底層知識庫進行語義檢

8、索。通常采用SPARQL(一種用于RDF上的語言)查詢語言來表達語義查詢。通過使用語義檢索,用戶可以在語義維基系統(tǒng)中進行諸如“檢索由莫扎特所譜寫的所有作品”等的查詢。(5) 支持推理功能。推理意味著使用預(yù)先定義的規(guī)則從知識庫中存儲的事實信息中獲得額外的、潛在的知識。例如,從“曹雪芹創(chuàng)作了紅樓夢”的事實信息中,具有推理功能的語義維基系統(tǒng)就可以推斷“曹雪芹是一個作家”。盡管推理是一項重要的特征,但目前只有一小部分維基系統(tǒng)支持這一功能。(本部分摘自語義維基技術(shù)及應(yīng)用作者龔立群)各類semantic wiki簡介IkeWikiIkeWiki(ike表示knowledeg,Wiki表示fast)也來源于

9、夏威夷語,可以被翻譯為“快速的知識”。IkeWiki系統(tǒng)是奧地利薩爾茨堡研究中心的Sebastian Schaffert等人所研發(fā)的語義Wiki原型系統(tǒng)IkeWiki( 或 或), IkeWiki主要的特征是使用語義術(shù)語對現(xiàn)有的數(shù)據(jù)進行語義標(biāo)注來增加系統(tǒng)的檢索和導(dǎo)航功能、基于現(xiàn)有的本體創(chuàng)建實例數(shù)據(jù),也可以做為創(chuàng)建和編輯本體的工具。在進行設(shè)計時,IkeWiki遵從了如下的設(shè)計原則:(1)提供容易使用并具有交互功能的界面;(2)與Wikipedia/MediaWiki相兼容;(3)與語義網(wǎng)標(biāo)準相兼容;(4)語義描述可以直接使用;(5)支持不同層次人員的工作。IkeWiki是采用Java實現(xiàn)的,運行

10、于Tomcat服務(wù)器,并使用JenaRDF知識庫來存儲元數(shù)據(jù),系統(tǒng)使用了AJAX來實現(xiàn)系統(tǒng)與用戶之間的交互。KaukoluKaukolu() 是建立在JSPWiki() 和Sesame()的基礎(chǔ)之上的,它提供了EDF的輸入和輸出功能,提出了本地名字空間解決方案。Makna() 是基于JSPWiki和Jena2.0創(chuàng)建的,通過引用本體原語來標(biāo)注Wiki的內(nèi)容,同時保證語義模型的一致性,提供了基于內(nèi)容和結(jié)構(gòu)的查詢功能和導(dǎo)航功能,能輸出RDF或N3作為語義輸出。Onto WikiOntoWiki是為支持敏捷分布式知識工程的工具( 或) 。 Ontowiki的架構(gòu)Platypus WikiPlatyp

11、us Wiki()第一個語義Wiki系統(tǒng),由Stefano Emilio Campanini等人開發(fā)。Platypus系統(tǒng)使用戶能夠為Wiki頁面增加元數(shù)據(jù),并用RDF屬性來描述鏈接含義、提供導(dǎo)航層次。從Wiki的角度來看,Platypus中的每個頁面都被分在某一個主題組下面,第一層目錄代表一個相關(guān)頁面集;從語義網(wǎng)的角度來看,每個頁面都可以是一個類、屬性或個體,第一層目錄是一個本體的命名空間或一個知識庫。Platypus用JAVA實現(xiàn),使用了Sevlet和JSP技術(shù),并使用了Jakarta Lucene作為搜索引擎來實現(xiàn)全文或元數(shù)據(jù)檢索。Platypus使用Jena來管理RDF模型,并具有有限

12、的推理能力。Platypus Wiki可以用來作為個人知識管理系統(tǒng),也可作為社區(qū)實踐,該網(wǎng)站中提供了很多關(guān)于wiki的新聞。Semantic MediaWikiSemantic MediaWiki(系統(tǒng)包括五個組件:用戶界面、解析器、頁面服務(wù)器、分析器和內(nèi)容存儲器。用戶界面向用戶顯示W(wǎng)iki頁面,并從頁面服務(wù)器請求一個或多個頁面(如頁面內(nèi)容、一個導(dǎo)航菜單、一組相關(guān)的項目和一個日歷),頁面服務(wù)器則從內(nèi)容存儲器中檢索到用戶所請求的頁面。頁面服務(wù)充當(dāng)了內(nèi)容存儲器和其他組件間的中介,封裝了Wiki的業(yè)務(wù)邏輯。當(dāng)用戶使用基于文本的Wiki語法編輯或創(chuàng)建一個Wiki頁面后,解析器將頁面轉(zhuǎn)換成WIF(Wik

13、i Interchange Format)格式,然后頁面服務(wù)器將頁面存儲在存儲器中。內(nèi)容存儲器中存儲了RDF數(shù)據(jù)和二進制數(shù)據(jù),并能夠支持版本和訪問控制。分析器從結(jié)構(gòu)層和語義層分析和整合數(shù)據(jù)。Semantic MediaWiki采用PHP實現(xiàn),使用的是MySQL數(shù)據(jù)庫。SemperWiki(http:/semperW/)系統(tǒng)最初是作為一個桌面應(yīng)用系統(tǒng)由愛爾蘭國立大學(xué)的Eyal Oren等人開發(fā),后來他們將其移植到了Web上。SemperWikiSemperWiki系統(tǒng)最初是作為一個桌面應(yīng)用系統(tǒng)由愛爾蘭國立大學(xué)的Eyal Oren等人開發(fā),后來他們將其移植到了Web上。SemperW

14、iki系統(tǒng)包含的組件有:一個用戶界面、一個解析器、一個數(shù)據(jù)分析器和一個數(shù)據(jù)存儲器。用戶可以通過用戶界面瀏覽、編輯和查詢頁面。用戶界面應(yīng)該能夠使用戶導(dǎo)航相關(guān)項目,并能夠隨著用戶的不同而進行調(diào)整,以滿足用戶個性化需求。當(dāng)用戶對一個Wiki頁面進行編輯時,用戶界面就會通知解析器,解析器對頁面上的文本進行分析,并抽取出描述和鏈接。所有的數(shù)據(jù)(文本和描述)都被存儲在知識庫中,從知識庫中所存儲的數(shù)據(jù)中,數(shù)據(jù)分析器計算出與當(dāng)前頁面相關(guān)的頁面集,并通過用戶界面顯示給用戶。SemperWiki用面向?qū)ο蟮哪_本語言Ruby實現(xiàn),并使用了GTK圖形工具包。WikiSARWikiSAR(Semantic Author

15、ing and Retrieval within a Wiki)是由德國萊比錫大學(xué)的David Aumueller等人所開發(fā)的語義Wiki系統(tǒng),該系統(tǒng)界面包括一個Wiki頁面和一個可選的交互可視化圖形界面。Wiki頁面被分為三個組成部分:文本輸入(編輯)框、文本顯示區(qū)和包含有上下文鏈接的工具條。WikiSAR具有如下幾個特征:簡單易行的創(chuàng)建和語義編輯、基于上下文的導(dǎo)航、語義檢索和與本體整合。WikiSAR系統(tǒng)用Perl語言實現(xiàn),并將每個Wiki頁面作為純文本文件存儲在WEB服務(wù)器中。WikiSAR原型系統(tǒng)使用Unix的“grep”來抽取RDF三元組,使用支持RDQL和SPARQL查詢語言的查詢

16、引擎RAP(RDF API for PHP)進行查詢,并可以將查詢嵌人到Wiki頁面或模板中。SweetWikiSweetWiki基于CORESE語義搜索引擎來提供查詢和推理,此外還提供安全管理和本體編輯工具。(摘自基于單元的語義wiki語義維基技術(shù)及應(yīng)用等)語義Wiki中存在的問題雖然語義Wiki已經(jīng)得到了一定的發(fā)展,但是目前它仍處于研發(fā)階段,依然存在許多沒有解決的問題,現(xiàn)有語義Wiki主要存在以下問題:1、 互操作性問題。(備注:互操作性是指不同的計算機系統(tǒng)、網(wǎng)絡(luò)、操作系統(tǒng)和應(yīng)用程序一起工作并共享信息的能力。)盡管語義web標(biāo)準的一個主要議題之一就是解決互操作性問題,但是幾乎所有的語義Wi

17、ki都不支持本體(RDF)數(shù)據(jù)的導(dǎo)入。一些Wiki允許使用本體(如OWL或RDF語言),但是集成到Wiki概念,本體是不可修正的。例如,本體的加載通常是不展示在Wiki中,它們一般被加載到另一個獨立的知識庫中。同時,本體被認為是保持不變的,并且它們不能被Wiki的用戶進行編輯。此外,Tolksdorf和simperl認為,在傳統(tǒng)的Wiki中存在一個重要限制(這在我們看來,同樣存在于語義Wiki)就是設(shè)計決策時考慮一個Wiki將作為一個封閉的系統(tǒng),沒有與其他Wiki或其他服務(wù)互動的可能。他們提出的解決方法就是引入分布式和開放性作為未來的Wiki系統(tǒng)整體設(shè)計的理念,并提供一個實現(xiàn)這一目標(biāo)的研究和發(fā)

18、展藍圖,但沒有給出具體的實現(xiàn)方法。2、標(biāo)注復(fù)雜性問題。在現(xiàn)有的語義Wiki當(dāng)中,主要是用RDF來進行標(biāo)注:RDF支持描述現(xiàn)有的供人閱讀的特征的語義信息。因為Wiki的基本單元是頁和頁之間的鏈接,將一個Wiki映射為RDF,可以通過如下的方法來實現(xiàn),將頁看作是RDF的資源,Wiki頁之間的鏈接是RDF資源之間的關(guān)系。這種典型方法的實現(xiàn)可以使用戶將RDF三元組融入到Wiki頁中,但是只能設(shè)置每個頁之間URI為三元組的主體。由此得出結(jié)論,當(dāng)使用RDFs時,Wiki頁必須既支持典型Wiki:page又必須支持典型資源的描述。但是這樣會有兩大障礙:首先,從一個知識工程師的角度觀點出發(fā),實體的客觀存在既可

19、能是一個文本(一個Wiki頁面)又可能是頁面中一個實例(例如一個具體的人),這不是我們想要的。其次,當(dāng)這種方法非常方便地產(chǎn)生RDF數(shù)據(jù),即淺層次的本體,它有一些類和許多關(guān)系,我們認為隨著本體和結(jié)構(gòu)越來越細致的時候,它就會迅速達到一個極限。3、本體的存儲和管理問題。首先由于標(biāo)注復(fù)雜性帶來的本體的不斷膨脹,本體規(guī)模越來越大,越來越繁雜,這將會給本體的存儲和管理帶來困難。4、數(shù)據(jù)模型問題。幾乎(但不是全部)現(xiàn)有的語義Wiki都假定概念C的網(wǎng)頁就是一個主體或者客體,每個Wiki網(wǎng)頁上只有一個概念,這樣的簡化使得它非常容易表達一個概念的語義陳述。但如果你只能是指“網(wǎng)頁的概念”,你怎么去指一個特定的網(wǎng)頁片

20、段呢?而且一個網(wǎng)頁一般情況下均會包含多個概念。5、名字空間問題。幾乎所有的語義Wiki都只是解決了本地的內(nèi)部名字空間問題,而且通常都是通過文本全文檢索來解決的,但要達到互操作性,就要解決外部的名字空間問題。6、本體的編輯問題?,F(xiàn)在的語義Wiki大多把本體當(dāng)成是一個靜態(tài)知識庫來處理,本體通常情況下是預(yù)先定義好的,不能更改,也不能恢復(fù)。7、本體的靈活導(dǎo)入和導(dǎo)出問題。目前語義Wiki大多數(shù)都不支持本體的自由靈活地輸入和輸出。由于一般的語義Wiki都把本體視為靜態(tài)的知識庫,如一些語義Wiki將語義辭典WordNet引入其中作為其參照知識庫,一般都是一次性引入,期間不會對WordNet做修改,否則會對其知識庫產(chǎn)生致命的影響。8、平滑的遷移:現(xiàn)有的語義Wiki允許添加語義特征到現(xiàn)有內(nèi)容(例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論