本體概念、描述語言和方法論方面的綜述_第1頁
本體概念、描述語言和方法論方面的綜述_第2頁
本體概念、描述語言和方法論方面的綜述_第3頁
本體概念、描述語言和方法論方面的綜述_第4頁
本體概念、描述語言和方法論方面的綜述_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、本體概念、描述語言和方法論方面的綜述。一、本體的概念Ontology的概念最初起源于哲學領域,可以追溯到公元前古希臘哲學家亞里士多德(384-322b.c.)。它在哲學中的定義為“對世界上客觀存在物的系統(tǒng)地描述,即存在論”是客觀存在的一個系統(tǒng)的解釋或說明,關心的是客觀現(xiàn)實的抽象本質1。在人工智能界,最早給出Ontology定義的是Neches等人,他們將Ontology定義為“給出構成相關領域詞匯的基本術語和關系,以及利用這些術語和關系構成的規(guī)定這些詞匯外延的規(guī)則的定義”1。Neches認為:“本體定義了組成主題領域的詞匯表的基本術語及其關系,以及結合這些術語和關系來定義詞匯表外延的規(guī)則?!?

2、“Anontologydefinesthebasictermsandrelationscomprisingthevocabularyofatopicarea,aswellastherulesforcombiningtermsandrelationstodefineextensionstothevocabulary.”)6。后來在信息系統(tǒng)、知識系統(tǒng)等領域,越來越多的人研究Ontology,并給出了許多不同的定義。其中最著名并被引用得最為廣泛的定義是由Gruber提出的,“本體是概念化的明確的規(guī)范說明”,原文參見:Anontologyisanexplicitspecificationofaconc

3、eptualization.Thetermisborrowedfromphilosophy,whereanOntologyisasystematicaccountofExistence.ForAIsystems,whatexistsisthatwhichcanberepresented.Whentheknowledgeofadomainisrepresentedinadeclarativeformalism,thesetofobjectsthatcanberepresentediscalledtheuniverseofdiscourse.Thissetofobjects,andthedescr

4、ibablerelationshipsamongthem,arereflectedintherepresentationalvocabularywithwhichaknowledge-basedprogramrepresentsknowledge.Thus,inthecontextofAI,wecandescribetheontologyofaprogrambydefiningasetofrepresentationalterms.Insuchanontology,definitionsassociatethenamesofentitiesintheuniverseofdiscourse(e.

5、g.,classes,relations,functions,orotherobjects)withhuman-readabletextdescribingwhatthenamesmean,andformalaxiomsthatconstraintheinterpretationandwell-formeduseoftheseterms.Formally,anontologyisthestatementofalogicaltheory.2,3。和這個定義類似的有N.GuarinoandP.Giaretta(1995)“本體是概念化的明確的部分的說明/一種邏輯語言的模型”“anontologyi

6、sanexplicit,partialaccountofaconceptualization/theintendedmodelsofalogicallanguage.”)。W.N.Bors對該定義也進行了引申“本體是共享的概念模型的形式化的規(guī)范說明”(“Anontologyisaformalspecificationofasharedconceptualization”)11Fensel對這個定義進行分析后認為Ontology的概念包括四個主要方面4:概念化(conceptualization):客觀世界的現(xiàn)象的抽象模型;明確(explicit):概念及它們之間聯(lián)系都被精確定義;形式化(for

7、mal):精確的數(shù)學描述;共享(share):本體中反映的知識是其使用者共同認可的。原文:“anabstractmodelofaphenomenontermedconceptualization,aprecisemathematicaldescriptionhintsthewordformal,theprecisionofconceptsandtheirrelationshipsclearlydefinedareexpressedbythetermexplicitandtheexistenceofanagreementbetweenontologyusersishintedbytheterms

8、hared.”Swartout將本體定義為:“本體是一個為描述某個領域而按繼承關系組織起來作為一個知識庫的骨架的一系列術語”。(“Anontologyisahierarchicallystructuredsetoftermsfordescribingadomainthatcanbeusedasaskeletalfoundationforaknowledgebase.”)5。他的定義強調了本體中術語(terms)的重要性。Fensel定義“本體是對一個特定領域中重要概念的共享的形式化的描述”(“Anontologyisacommon,sharedandformaldescriptionofimp

9、ortantconceptsinanspecificdomain.”)7。NoyF.N.認為“本體是對某個領域中的概念的形式化的明確的表示,每個概念的特性描述了概念的各個方面及其約束的特征和屬性?!?“Anontologyisaformalexplicitrepresentationofconceptsinadomain,propertiesofeachconceptdescribescharacteristicsandattributesoftheconceptknownasslotsandconstrainsontheseslots.”)8。Fonseca定義“本體是以某一觀點用詳細明確的

10、詞匯表描述實體、概念、特性和相關功能的理論”。“Anontologyisatheorywhichusesaspecificvocabularytodescribeentities,classes,propertiesandrelatedfunctionwithcertainpointofview.”)9。Starla認為“本體必需包括所使用術語的規(guī)范說明、決定這些術語含義的協(xié)議、以及術語之間的聯(lián)系,來表達概念”。“Anontologynecessarilyincludesaspecificationofthetermsused(terminology)andagreementsthatallo

11、wtodeterminetheirmeaning,alongwiththepossibleinter-relationshipsbetweentheseterms,standingforconcepts.”)10。M.UscholdandM.Gruninger認為“(“Ontologyisanexplicitaccountorrepresentationof(somepartof)aconceptualisation.”)12。他還推薦了一個來自SRKB(SharedRe-usableKnowledgeBases)電子郵件列表的定義“本體是關于共享的概念模型的協(xié)議。共享的概念模型包括進行領域知

12、識建模的概念框架、互操作的agent之間進行交流的內容明確協(xié)議、以及表達特定領域理論的協(xié)定。在知識共享的上下文環(huán)境中,本體特指表達性詞匯表的定義的形式。一個非常簡單的例子就是分類的層次結構,指明了類和它們之間的包含關系。關系數(shù)據(jù)庫模式的作用也和本體一樣,它指定了某些共享數(shù)據(jù)庫之間可以存在的關系以及必須保持的完整性約束”(“Ontologiesareagreementsaboutsharedconceptualization.Sharedconceptualizationsincludeconceptualframeworksformodelingdomainknowledge;content-

13、specificprotocolsforcommunicationamonginter-operatingagents;andagreementsabouttherepresentationofparticulardomaintheories.Intheknowledgesharingcontext,ontologiesarespecifiedintheformofdefinitionsofrepresentationalvocabulary.Averysimplecasewouldbeatypehierarchy,specifyingclassesandtheirsubsumptionrel

14、ationships.Relationaldatabaseshemataalsoserveasontologiesbyspecifyingtherelationsthatcanexistinsomeshareddatabaseandtheintegrityconstraintsthatmustholdforthem.”)。以下是個人的看法:盡管定義有很多不同的方式,但是從內涵上來看,不同研究者對于本體的認識是統(tǒng)一的,都把本體當作是領域(可以是特定領域的,也可以是更廣的范圍)內部不同主體(人、機器、軟件系統(tǒng)等)之間進行交流(對話、互操作、共享等)的一種語義基礎,即由本體提供一種明確定義的共識。進

15、一步,本體提供的這種共識更主要的是為機器服務,機器并不能像人類一樣理解自然語言中表達的語義,目前的計算機也只能把文本看成字符串進行處理。因此,在計算機領域討論本體,就要討論本體究竟是如何表達共識的?也就是概念的形式化問題。這就涉及到本體的描述語言、本體的建設方法等具體研究內容。二、本體的描述語言本體語言使得用戶為領域模型編寫清晰的、形式化的概念描述,因此它應該滿足以下要求18:良好定義的語法(awell-definedsyntax)良好定義的語義(awell-definedsemantics)有效的推理支持(efficientreasoningsupport)充分的表達能力(sufficien

16、texpressivepower)表達的方便性(convenienceofexpression)大量的研究工作者活躍在該領域,因此誕生了許多種本體描述語言,有RDF和RDF-S、OIL、DAML、OWL(注:DAML+OIL不再單獨列出,認為它是一個過渡,直接介紹OWL)、KIF、SHOE、XOL、OCML、Ontolingua、CycL、Loom。我們簡單把它們歸類如下:和Web相關的有:RDF和RDF-S、OIL、DAML、OWL、SHOE、XOL。其中RDF和RDF-S、OIL、DAML、OWL、XOL之間有著密切的聯(lián)系,是W3C的本體語言棧中的不同層次,也都是基于XML的。而SHOE是

17、基于HTML的,在HTML的一個擴展。和具體系統(tǒng)相關的(基本只在相關項目中使用的)有:Ontolingua、CycL、Loom。KIF已經(jīng)是美國國家標準,但是它并沒有被廣泛應用于互聯(lián)網(wǎng),作為一種交換格式更多的應用于企業(yè)級。下面我們逐一進行介紹。RDF、RDF-S22,23ResourceDescriptionFramework,資源描述框架,是W3C在XML的基礎上推薦的一種標準,用于表示任何的資源信息。RDF提出了一個簡單的模型用來表示任意類型的數(shù)據(jù)。這個數(shù)據(jù)類型由節(jié)點和節(jié)點之間帶有標記的連接弧所組成。節(jié)點用來表示W(wǎng)eb上的資源,弧用來表示這些資源的屬性。因此,這個數(shù)據(jù)模型可以方便的描述對象

18、(或者資源)以及它們之間關系。RDF的數(shù)據(jù)模型實質上是一種二元關系的表達,由于任何復雜的關系都可以分解為多個簡單的二元關系,因此RDF的數(shù)據(jù)模型可以作為其他任何復雜關系模型的基礎模型。W3C推薦以RDF標準來解決XML的語義局限。RDF和XML是互為補充的。首先,RDF希望以一種標準化,互操作的方式來規(guī)范XML的語義。XML文檔可以通過簡單的方式實現(xiàn)對RDF的引用。其次,由于RDF是以一種建模的方式來描述數(shù)據(jù)語義的,這使得RDF可以不受具體語法表示的限制。但是RDF仍然需要一種合適的語法格式來實現(xiàn)RDF在Web上的應用。將RDF序列化為XML表示可以使RDF獲得更好的應用可處理特性,并使得RD

19、F數(shù)據(jù)可以像XML數(shù)據(jù)一樣的容易使用、傳輸和存儲。因此,RDF是定制XML的良伴,而不只是對某個特定類型數(shù)據(jù)的規(guī)范表示,XML和RDF的結合,不僅可以實現(xiàn)數(shù)據(jù)基于語義的描述,也充分發(fā)揮了XML與RDF的各自優(yōu)點,便于Web數(shù)據(jù)的檢索和相關知識的發(fā)現(xiàn)。與XML中的標記(tags)類似,RDF中的屬性(properties)集也是沒有任何限制的。也就是說存在同義詞現(xiàn)象和一詞多意現(xiàn)象。RDF的模型不具備解決這兩個問題的能力,而RDFSchema雖然可以為RDF資源的的屬性和類型提供詞匯表,但是基于RDF的數(shù)據(jù)語義描述仍然可能存在語義沖突。為了消解語義沖突,我們在描述數(shù)據(jù)語義的時候可以通過引用Onto

20、logy的相關技術,對語義描述結果作進一步的約束。幸運的是,RDF(Schema)在提供了簡單的機器可理解語義模型的同時,為領域化的Ontology語言(OIL,OWL)提供了建?;A,并使得基于RDF的應用可以方便地與這些Ontology語言所生成的Ontology進行合并。RDF的這一特性使得基于RDF的語義描述結果具備了可以和更多的領域知識進行交互的能力,也使基于XML和RDF的Web數(shù)據(jù)描述具備了良好的生命力。OIL20OntologyInferenceLayer/OntologyInterchangeLanguage。OIL是-種針對本體的基于互聯(lián)網(wǎng)的表現(xiàn)和推理層。它是由theEur

21、opeanUnion1STprogrammeforInformationSocietyTechnologiesundertheOn-To-Knowledgeproject(IST-1999-1013)andIBROW(IST-1999-19005)資助的,也得到了更廣泛的研究者的參與。它的語言集如下圖所示。HeavyOIL(possibl已future已tensions)InstanceOIL(StandardOIL+instances)RDFSStandardOIL1CoreOIL(StandardOILcPDFS)%reificationOIL綜合了三個不同團體的工作,提供一種通用的語義互

22、聯(lián)網(wǎng)的標記語言。這三方面的工作分別是:T基于框架的系統(tǒng)基于框架的語言在AI中有很長的歷史,它們的中心建模元語是類(稱作框架)和屬性(稱為槽)。描述邏輯描述邏輯通過概念(對應于類或者框架)和角色(對應于槽)描述知識。DL的一個重要特征是它們具有良好理解理論性質,并且在DL中任何表達的含義都可以通過數(shù)學的精確的方式描述。OIL從DL中繼承了形式化語義和有效的推理支持。T互聯(lián)網(wǎng)標準這里指的是XML和RDF。OIL標記語言的語法源自W3C的這些標準。OIL的使用比較廣泛,支持OIL的工具也很多,最著名的有OILEd,是一個基于OIL的本體編輯器。其他一些工具,比如OntoEdit、theFaCT(Fa

23、stClassificationofTerminologies)System等也都支持OIL。DAML21DARPAAgentMarkupLanguage該項目正式開始于2000年8月,由美國政府支持,目標是開發(fā)一種語言和一組工具,為語義互聯(lián)網(wǎng)提供支持。MarkGreaves是該項目的領導者。DAML形成于DAML-ONT(種本體語言)和DAML-Logic(種表達公理和規(guī)則的語言)。DAML提出的原因和OIL類似,一批支持語義互聯(lián)網(wǎng)的研究者發(fā)現(xiàn)XML、RDF作為模式語言其表達能力很有限,希望開發(fā)一種有更強的表達能力的模式語言。盡管DAML并不是W3C的標準,但是參與的開發(fā)者中有很多來自W3C

24、的工作者,包括TimBerners-Lee。DAML擴展了RDF,增加了更多的更復雜的類、屬性等定義。它一度很流行,成為網(wǎng)上很多本體的描述語言,直到DAML的研究者和OIL的研究者開始合作,推出了DAML+OIL語言,成為W3C研究語言互聯(lián)網(wǎng)的本體語言的起點。OWL18,19OWL全稱WebOntologyLanguage,是W3C推薦的語義互聯(lián)網(wǎng)中本體描述語言的標準。它是從歐美一些研究機構的一種結合性的描述語言DAML+OIL發(fā)展起來的,其中DAML來自美國的提案DAML-ONT,OIL來自歐洲的一種本體描述語言(二者在上文都有介紹)。在W3C提出的本體語言棧中,OWL處于最上層,見下圖。I

25、TheOntologyLanguageStackOWLF1|DAML卡bAAAUOIL:D/AML-Ont|OILFPICSXOLiTop忙帖I5A/ULJRDFHTMLXML*NameSpace屮卜XMLSchemaUnfcode|URI針對不同的需求OWL有三個子語言,描述列表如下:子語言描述例子OWLLite用于提供給那些只需要一個分類層次和簡單的屬性約束的用戶。支持基數(shù)(cardinality),只允許基數(shù)為0或1oOWLDL支持那些需要在推理系統(tǒng)上進行最大程度表達的用戶,這里的推理系統(tǒng)能夠保證計算完全性(computationalcompleteness,即所有地結論都能夠保證被計算

26、出來)和可決定性(decidability,即所有的計算都在有限的時間內完成)。它包括了OWL語言的所有約束,但是可以被僅僅置于特定的約束下。當一個類可以是多個類的一個子類時,它被約束不能是另外一個類的實例。OWLFull支持那些需要在沒有計算保證的語法自由的RDF上進行最大程度表達的用戶。它允許在一個Ontology在預定義的(RDF、OWL)詞匯表上增加詞匯,從而任何推理軟件均不能支持OWLFULL的所有featureo一個類可以被同時表達為許多個體的一個集合以及這個集合中的一個個體。這三種子語言之間的關系是:每個合法的OWLLite都是一個合法的OWLDL;每個合法的OWLDL都是一個合

27、法的OWLFull;每個有效的OWLLite結論都是一個有效的OWLDL結論;每個有效的OWLDL結論都是一個有效的OWLFull結論。用戶在選擇使用哪種語言時的主要考慮是:選擇OWLLite還是OWLDL主要取決于用戶需要整個語言在多大程度上給出了約束的可表達性;選擇OWLDL還是OWLFull主要取決于用戶在多大程度上需要RDF的元模型機制(如定義類型的類型以及為類型賦予屬性);在使用OWLFull而不是OWLDL時,推理的支持不可預測,因為目前還沒有完全的OWLFull的實現(xiàn)。這三種子語言與RDF的關系是:OWLFull可以看成是RDF的擴展;OWLLite和OWLFull可以看成是一個

28、約束化的RDF的擴展;所有的OWL文檔(Lite,DL,F(xiàn)ull)都是一個RDF文檔;所有的RDF文檔都是一個OWLFull文檔;只有一些RDF文檔是一個合法的OWLLite和OWLDL文檔。OWL的語言規(guī)范這里不再介紹。KIF24KnowledgeInterchangeFormat(KIF)是一種為了在不同的計算機系統(tǒng)(這里的不同是指由不同的程序員在不同的時間使用不同的語言開發(fā)等)之間交換知識而設計的語言。它的主要目的不是和人交互,也不是在一個計算機系統(tǒng)內部作為知識的表現(xiàn)方式,只有在不同的計算機系統(tǒng)之間需要交換知識的時候,它們把各自的內部表現(xiàn)方式轉換成KIF,交互后再轉換成各自的方式。它是由

29、斯坦福大學的TheLogicGroup提出并實現(xiàn)的,是一種美國標準(ANSI)。在KIF的設計中,以下特征是其本質特性:有公開的語義。它不再需要專門的解釋器。在邏輯上是全面的??梢詫θ我獾倪壿嬚Z句進行表達。提供對元知識的表現(xiàn)。除了這幾個本質特征以外,KIF還盡量的最大化實現(xiàn)能力和可讀性。SHOE25全稱:SimpleHTMLOntologyExtensions,簡單HTML的本體擴展。這是一種與XML一致的互聯(lián)網(wǎng)知識表達語言,使得網(wǎng)頁編輯者可以對他們的互聯(lián)網(wǎng)文檔進行標注。由馬里蘭大學計算機系提出的,但是目前他們有關本體的研究項目已經(jīng)使用OWL和DAML+OIL作為互聯(lián)網(wǎng)本體的描述語言,SHOE

30、已經(jīng)停止研究了。SHOE是HTML的一個超集,它擴展了一些標記,使得在HTML中可以增加任意的語義數(shù)據(jù)。它的標記有兩類,一類用于創(chuàng)建本體,一類用于注解文檔。XOL26OntologyExchangeLanguage,本體交換語言。源于SRIInternationalsArtificialIntelligenceCenter(AIC)的BioinformaticsResearchGroup。XOL設計之初是為生物信息學領域本體的交換,但是它可以應用于各種領域。它是一種簡單通用的定義本體的方法?;赬ML和RDFSchema有兩種變體。其目的是在不同的數(shù)據(jù)庫、本體開發(fā)工具、或者其他應用程序之間交換

31、本體。OCML27,28OperationalConceptualModellingLanguage,是由英國的KnowledgeMediaInstitute實驗室開發(fā)的。OCML建模語言通過幾種具體的構件(Functionalterms、ControltermsLogicalexpressions)來支持知識模型的建模架構。該語言使得對函數(shù)、關系、類、實例和規(guī)則的形式化操作成為可能。它還包括定義本體及問題解決方法的機制。KMI的WebOnto編輯器是基于OCML的。Ontolingua1一種基于KIF(knowledgeinterchangeformat)的提供統(tǒng)一的規(guī)范格式來構建Ontol

32、ogy的語言。其特點是:為構造和維護Ontology提供了統(tǒng)一的、計算機可讀的方式;由其構造的Ontology可以方便地轉換到各種知識表示和推理系統(tǒng)(Prolog、CORBA的IDL、CLIPS、LOOM、Epikit、Algernon和KIF),從而將Ontology的維護與使用它的目標系統(tǒng)隔開;主要用于Ontology服務器。CycL1Cyc系統(tǒng)的描述語言,一種體系龐大而非常靈活的知識描述語言。其特點是:在一階謂詞演算的基礎上擴充了等價推理、缺省推理等功能;具備一些二階謂詞演算的能力;其語言環(huán)境中配有功能很強的可進行推理的推理機。Loom1Ontosaurus的描述語言,一種基于一階謂詞邏

33、輯的高級編程語言,屬于描述邏輯體系。其特點是:提供表達能力強、聲明性的規(guī)范說明語言;提供強大的演繹推理能力;提供多種編程風格和知識庫服務。該語言后來發(fā)展成為PowerLoom語言。PowerLoom是KIF的變體,它是基于邏輯的,具備很強表達能力的描述語言,采用前后鏈規(guī)則(backwardandforwardchainer)作為推理機制。以下是個人的一些看法:在選擇本體描述語言時,我們的基本認識是向標準看齊,并且我們項目的應用領域也是基于Web的個股信息服務,因此,OWL很自然的成為首選。三、本體建設的方法論MikeUshold&MichealGruninger的SkeletalMethodo

34、logy(骨架法)12他們提出的建設本體的方法包括如下步驟:識別目的和范圍(IdentifyPurposeandScope)這個階段需要弄清楚為什么要建立本體?建好后的用途有哪些?使用該本體的用戶范圍是什么?等。+建設本體(BuildingtheOntology)-本體捕獲(ontologycapture)本體捕獲包括:(1)相關領域中關鍵概念和關系的識別;(2)這些概念和關系的精確無二義的文本定義的產(chǎn)生;(3)表達這些概念和關系的術語的識別;(4)在以上三點上達成一致。這一過程再細分為以下步驟:1Scoping:通過頭腦風暴法(Brainstorming)產(chǎn)生所有潛在相關的術語和短語。進行分

35、組(Grouping):對應于自然產(chǎn)生的子組,將這些術語松散地組成工作區(qū)(Structurethetermslooselyintoworkareascorrespondingtonaturallyarisingsub-groups)。2ProduceDefinitions決定下一步做什么?決定元本體(DeterminingMeta-Ontology):先不急于提交任何的元本體,而是仔細考慮概念和它們的內部關系,盡量考慮各種可能性。工作區(qū)(WorkAreas):依次考慮每個工作區(qū)。首選那種和其他工作區(qū)有最多的語義重疊的先作。術語(Terms):采用了middle-out的方法。首先定義每個工作區(qū)

36、中最基本的術語,再定義更抽象或者更具體的。達成一致處理二義性的術語(HandlingAmbiguousTerms):選定一個合適的術語來表達這種概念,避免使用二義性的術語。指導方針(Guidelines):產(chǎn)生一個自然語言文本的定義;確保一致性;指出關系;避免環(huán)狀定義的術語;提供必要的補充信息使術語的定義更有效;在合適的地方給出例子。造詞(Wording):權衡技術準確性和清晰。3Review4Meta-Ontology:設計一個元本體。-本體編碼(ontologycoding)該階段是利用某種形式化語言顯式地表現(xiàn)上個階段的概念化成果。涉及到:(1)作為meta-ontology的基本術語的確

37、定;(2)選擇一種表現(xiàn)語言(能夠支持meta-ontology);(3)編碼。-集成現(xiàn)有本體(integratingexistingontologies)在達成一致方面有很多工作需要完成。+評價(Evaluation)并沒有提出自己的評價方法。引用了GomezPerez關于evaluation的定義,需要參見更多的文章。+文檔化(Documentation)目前很多知識庫和本體缺少文檔也是一種知識共享的障礙,這些文檔應該包括本體中定義的主要概念、meta-ontology等。某些編輯器可以自動生成這些文檔。+每階段的指導方針(Guidelinesforeachphase)把設計本體的初始的指導

38、方針總結為以下設計標準(重點在于共享和重用):清楚(Clarity)、一致(Coherence)可擴展性(Extensibility)最小本體的承諾(Minimalontologicalcommitment)、最小的編碼偏差(Minimalencodingbias)。MichealGruninger&Mark.SFox的企業(yè)建模法(TOVE)TOVEOntologyProject是多倫多大學EnterpriseIntegrationLaboratory的一個項目,它的目標是建立一套為商業(yè)和公共企業(yè)建模的集成本體,并且已經(jīng)建成了相關本體。作為該項目的一部分,他們設計了一套創(chuàng)建和評價本體的方法“E

39、nterpriseModellingMethodology”。該方法包括如下幾個步驟13:ProcedureforOntologyDesignandEvaluation1激發(fā)場景(MotivatingScenario)應用領域的某些場景激發(fā)了本體的建設,因此,給出一個場景有助于理解建設本體的動機。2非形式化的能力問題(InformalCompetencyQuestions)提出一個本體應該能夠回答的各種問題,作為需求。通過指明能力問題和場景之間的關系,可以對新擴展的本體進行一定的非形式化的判斷。也是一種初始的評價,來判斷是否需要擴展本體,或者現(xiàn)有本體是不是已經(jīng)可以涵蓋所提出的非形式化問題。3一

40、階邏輯表達的術語規(guī)格說明(Specificationinfirst-OrderLogic-Terminology)識別領域中的對象,并用一階邏輯等方式表達出本體中的術語。4形式化的能力問題(FormalCompetencyQuestions)用形式化的術語把非形式化的能力問題定義出來。5一階邏輯表達的公理規(guī)格說明(Specificationinfirst-OrderLogic-Axioms)本體中的公理指定了術語的定義以及約束。采用本體中的謂詞將公理定義為一階邏輯的句子。這只是本體的規(guī)格說明,并不是本體的實現(xiàn)。6完備性定理(CompletenessTheorems)當能力問題都被形式化的表述之

41、后,必須定義在什么條件下這些問題的解決方案是完備的。在12中去掉了一階邏輯作為描述語言的限制,把該方法表達成:1動機的確定(Captureofmotivatingscenarios)2非形式化能力問題的形式化(Formulationofinformalcompetencyquestions)3采用一種形式化語言編寫該本體術語的規(guī)格說明書(Specificationoftheterminologyoftheontologywithinaformallanguagesuchasfirst-orderlogic)4使用該本體的術語把非形式化的能力問題形式化(Formulationofformalco

42、mpetencyquestionsusingtheterminologyoftheontology)5采用形式化語言編寫關于該本體中術語的公理和定義的規(guī)格說明書(Specificationofaxiomsanddefinitionsforthetermsintheontologywithintheformallanguage)6(Justificationoftheaxiomsanddefinitionsbyprovingcharacterisationtheorems)MarianoFernandez&GOMEZ-PEREZ等的“METHONTOLOGY”14在介紹METHONTOLOGY之

43、前,本文簡單介紹了一下本體的開發(fā)過程和生命周期。作者總結本體的開發(fā)過程包括如下活動:計劃(plan)、詳細說明(specify)、獲取知識(capturingknowledge)概念化(conceptualize)形式化(formalize)集成(integrate)、實現(xiàn)(implement)評價(evaluate)文檔化(documentation)、維護(maintain)。本體的生命周期依次分為以下狀態(tài):詳細說明(specification)、概念化(conceptualization)、形式化(formalization)、集成(integration)、實現(xiàn)(implementat

44、ion、和維護(maintenance)o下圖表現(xiàn)了這些活動和狀態(tài)之間的關系。作者稱METHONTOLOGY方法是結合了骨架法和GOMEZ-PEREZ方法(也是本文作者之一,該方法參照下圖右邊所示,只是METHONTOLOGY的前身,不再論述)后,提出的一種更為通用的本體建設方法。1Identifypurpoaeandscope1.AcquireknowledgeBuildingtheBuildarequjremetitspecifitation二IOjrologycaptuj.DociimetiiationafterachphasehG&tuz-PejtizcolkusRelationshi

45、pbetvveefipliasesoftwom規(guī)格說明書(Specification)該階段要產(chǎn)生一份以自然語言編寫的非形式化的、半形式化的、或者形式化的本體規(guī)格說明書。至少包括以下信息:本體的目的(預期的用途、場景和最終用戶等)、實現(xiàn)本體的形式化程度、范圍(包括要表達的術語集、它們的特性和粒度)。雖然無法確保規(guī)格說明書的完整性,但是必須保證一個好的本體規(guī)格說明書應該滿足以下性質:9簡潔(每個術語都是相關的,沒有無關或者重復的術語)9部分完整性(術語的覆蓋范圍、每個術語的問題和粒度)9一致性(每個術語及含義都在領域內有意義)2知識獲?。↘nowledgeAcquisition)知識的來源很多,

46、可以是:專家、書籍、手冊、數(shù)字、表格、甚至是其他的本體。從這些數(shù)據(jù)源獲得知識的關聯(lián)技術包括:頭腦風暴法、訪談、文本的形式化或非形式化的分析和一些知識獲取工具。3概念化(Conceptualization)該活動將領域知識組織成概念模型,用規(guī)格說明書中識別的領域詞匯表描述問題和解決方案。生成的概念模型允許最終用戶(a)確定一個本體是否有用,并且對于某個給定應用不需要查看源代碼就是可用的(b)比較數(shù)個本體的范圍、完整性、可重用性、共享性。4集成(Integration)重用別的本體中已經(jīng)建好的定義時,可以:a)查看元本體,選擇適合自己概念模型的。b)選擇和自己概念模型中的語義和實現(xiàn)一致的術語定義。

47、5實現(xiàn)(Implementation)用任何一種形式化的語言編碼實現(xiàn)本體。需要一套開發(fā)環(huán)境的支持,至少包括:詞法和語法分析器、翻譯器、編輯器、瀏覽器、搜索器、評價器、自動維護工具。6評價(Evaluation)評價是指在本體生命周期的每個階段和階段之間,利用某種參考框架對本體、軟件環(huán)境、文檔進行技術判斷。評價包括正確性(verification)和有效性(validation)。7文檔化(Documentation)在本體建設的全過程中每個階段都應該有對應的文檔。AlexanderMaedche等的CyclicAcquisitionProcess15OSeectrraJSourcesRelat

48、ionLearningsemhstnjcturedinfermaton,a.g.domain-speorficdidnnariEisooOooDom-ainOntologyDomainFocusingConceptLearningMaedche有一系列關于從文本中抽取領域本體的文章,提出了這種本體獲取的方法論,它是一種環(huán)狀的結構。1環(huán)形的起點是一個通用的核心本體的選擇。任何大型的通用本體(像Cyc、Dahlgren的本體)、詞匯-語義網(wǎng)(像WordNet,GermaNet)、或者領域相關的本體(像TOVE)都可以作為這個過程的開始。選定基礎本體后,用戶必須確定用于抽取領域相關實體的文本。2從選

49、擇的文本中獲取領域相關的概念,并建立概念之間的分類關系。3除去領域無關的概念,只留下和領域相關的。這時,建立起了目標本體的概念結構。4從基礎本體中會繼承一些關系,其他的關系需要通過學習的方法從文本中抽取。5對得到的領域相關的本體進行評價,還可以進一步的重復上述過程。IDEF-5方法16IDEF的概念是在70年代提出的結構化分析方法的基礎上發(fā)展起來的。在1981年美國空軍公布的ICAM:integratedcomputeraidedmanufacturing工程中首次用了名為“IDEF”的方法。IDEF是ICAMDEFinitionmethod的縮寫,到目前為止它已經(jīng)發(fā)展成了一個系列。本體描述獲

50、取方法IDEF5(OntologyDescriptionCaptureMethod)提供了兩種語言形式,即圖表語言和細化說明語言來獲取某個領域的本體論。這兩種語言是互為補充的,IDEF5的圖表語言在表達能力的某些方面是很有限的,但是它的這種繪圖式方式又使得它很直觀,容易被理解;而IDEF5的細化說明語言是一種具有很強的表達能力的文本語言,它可以把隱藏在圖表語言內的深層次的信息描述清楚,從而可以彌補圖表語言的不足。另一方面,IDEF家族中的方法都是互相補充的,而在一個概念模型的描述中會遇到很多的相繼發(fā)生的事件,即一個過程。那么對這些過程的描述也需要有一個很好的支持語言,IDEF3(Process

51、FlowandObjectStateDescriptionCaptureMethod)正是一種為獲取對過程的準確描述所用的方法。它提供過程流圖和對象狀態(tài)轉移網(wǎng)圖(OSTN)這兩種圖表來獲取,管理和顯示過程。IDEF-5提出的本體建設方法包括以下五個活動:1組織和范圍(OrganizingandScoping)確定本體建設項目的目標、觀點和語境,并為組員分配角色。2數(shù)據(jù)收集(DataCollection)收集本體建設需要的原始數(shù)據(jù)。3數(shù)據(jù)分析(DataAnalysis)分析數(shù)據(jù),為抽取本體作準備。4初始化的本體建立(InitialOntologyDevelopment)從收集的數(shù)據(jù)當中建立一個初

52、步的本體。5本體的精煉與確認(OntologyRefinementandValidation)完成本體建設過程。以下是個人的看法:從本體的概念和作用我們可以看出,本體建設應該是工程化生產(chǎn)。工程思想的核心有兩點:標準化的表達方式和規(guī)范化的工作步驟。軟件工程就使得軟件生產(chǎn)從程序員的個人勞動提高成為有組織的、可控制的工程,從而大幅度的從根本上提高了軟件開發(fā)的效率和質量。相比于一般的軟件,本體更強調共享、重用,它本身的出現(xiàn)就是為了給不同系統(tǒng)之間提供一種統(tǒng)一的語言,因此它的工程性更為明顯。目前本體工程這個思路雖然已經(jīng)被大家所接受,但是并沒有出現(xiàn)成熟的方法論作為支持。上述的各種方法論也是誕生在具體的本體建

53、設項目之中,在相應的項目中得到實踐。這些方法之間并沒有太大的差別,并且都和軟件工程中常見的開發(fā)過程相類似。我們可以綜合一下這幾種方法,從而制定自己的一套方法論。參考文獻Ontology研究綜述,鄧志鴻、唐世渭等,北京大學學報(自然科學版),第38卷,第5期,2002年9月Cf.T.R.Gruber.Atranslationapproachtoportableontologies.KnowledgeAcquisition,5(2):199-220,1993.ThomasR.Gruber.TowardPrinciplesfortheDesignofOntologiesUsedforKnowledg

54、eSharing,Revision:August23,1993.FenselD.Ontologies:SilverBulletforKnowledgeManagementandElectronicCommerce.Springer.2001.R.P.B.Swartout,K.Knight,T.Russ,TowardDistributedUseofLarge-ScaleOntologies,OntologicalEngineeri1n3g8,-148,1997R.F.Neches,R.;Finin,T.;Gruber,T.;Patil,R.;Senator,T.;Swartout,W.R.,En

55、ablingTechnologyforKnowledgeSharing.,AIMagazine36-56,1991.FenselD.,2000.Thesemanticwebanditslanguages.IEEEComputerSociety15,6(November/December),67-73.NoyF.N.,McGuinnessD.L.,2001.OntologyDevelopment101:AGuidetoCreatingYourFirstOntology.StanfordKnowledgeSystemsLaboratoryTechnicalReportKSL-01-05andStanfordMedicalInformaticsTechnicalReportSMI-2001-0880,March.Fonseca,F.EgenhoferM.,Agouris,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論