自動問答系統(tǒng)中課程知識本體的構(gòu)建與實現(xiàn)_第1頁
自動問答系統(tǒng)中課程知識本體的構(gòu)建與實現(xiàn)_第2頁
自動問答系統(tǒng)中課程知識本體的構(gòu)建與實現(xiàn)_第3頁
自動問答系統(tǒng)中課程知識本體的構(gòu)建與實現(xiàn)_第4頁
自動問答系統(tǒng)中課程知識本體的構(gòu)建與實現(xiàn)_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、自動問答系統(tǒng)中課程知識本體的構(gòu)建與實現(xiàn)1 引言問答系統(tǒng)(QuestionAnsweringSystem,QAS是一種新的信息檢索技術(shù)。它應(yīng)用自然語言理解技術(shù),通過對用戶問題的理解,將答案直接返回給用戶。由于現(xiàn)有的許多自動問答系統(tǒng)都是基于知識庫的,知識庫是自然語言處理的基礎(chǔ)資源,知識庫中知識的豐富程度、知識表示形式以及知識的組織方式直接關(guān)系到基于知識庫的自然語言處理應(yīng)用的性能。因此如何設(shè)計知識庫對提高自動問答的性能和效率具有非常重要的意義。為此本文提出,以數(shù)據(jù)結(jié)構(gòu)課程為例,采用本體技術(shù)構(gòu)建課程本體,首先對數(shù)據(jù)結(jié)構(gòu)課程知識進(jìn)行了核心詞匯分析,提出若干類和屬性,然后借助本體知識庫良好的分類特性、概念

2、的形式化描述來對數(shù)據(jù)結(jié)構(gòu)課程進(jìn)行知識表示、知識存儲,建立數(shù)據(jù)結(jié)構(gòu)課程本體庫,從本體庫出發(fā)建立常見問題庫和課程文檔庫。以此建立的常見問題庫和課程文檔庫為后續(xù)課程自動問答系統(tǒng)的自動問答提高了效率。2 本體技術(shù)本體論(Ontology)來自哲學(xué)領(lǐng)域,比較流行的定義是Gruber在1993年提出的本體的概念,他認(rèn)為本體是有關(guān)概念模型的明確的規(guī)范說明。本體的目標(biāo)是捕獲相關(guān)的領(lǐng)域知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯之間相互關(guān)系的明確定義。本體的研究包括概念和概念分類、本體上的代數(shù)。近年來,隨著信息科學(xué)的飛速發(fā)展,本體論逐漸用于知

3、識工程和信息科學(xué)等領(lǐng)域之中。隨著Web的發(fā)展,出現(xiàn)了許多本體描述語言,如早期基于一階邏輯的EJF,基于框架和一階邏輯的OCML基于描述邏輯的LOO矯。隨著進(jìn)一步的發(fā)展,又出現(xiàn)了RDF(S)、OIL+DAMLOW管。而其中,OW星建立在XML/RD喏已有標(biāo)準(zhǔn)基礎(chǔ)上,通過添加大量的基于描述邏輯的語義原語來描述和構(gòu)建各種本體。本文中主要使用RDF(s)和OWL本體構(gòu)建工具有很多,目前使用最為廣泛是Protege本體構(gòu)建工具,是使用java開發(fā)的、可擴(kuò)展的、免費的、開源的本體工具。本文采用了Prot6g40.2版本作為本體的構(gòu)建工具,構(gòu)建數(shù)據(jù)結(jié)構(gòu)課程本體。Prot6g64.0.2本體構(gòu)建工具有很多優(yōu)點

4、:使用簡單方便、文件的輸出格式可以定制、用戶接口可以定制、模塊劃分清晰、后臺支持?jǐn)?shù)據(jù)庫存儲。3 課程本體的構(gòu)建課程本體的構(gòu)建是一個嚴(yán)謹(jǐn)?shù)倪^程,本文在參考相關(guān)本體構(gòu)建方法的基礎(chǔ)上,在領(lǐng)域?qū)<业膸椭?,采用以下的步驟來開發(fā)課程本體,盡可能保證本體的正確性和一致性:( 1)明確領(lǐng)域范圍:主要考慮該課程領(lǐng)域本體要包含的內(nèi)容、用途和使用者。(2)考慮可重用性:考慮是否已有相關(guān)的課程本體,可否對其進(jìn)行擴(kuò)展或精煉。( 3)列舉核心概念、基本概念:以某種方式表示課程領(lǐng)域中的概念。( 4)定義概念及概念間的層次和結(jié)構(gòu)。( 5)定義概念的屬性:提供相關(guān)的屬性來詳細(xì)描述概念的方方面面。( 6)基于課程本體構(gòu)建該課程

5、的常見問題庫和知識庫。3.1 課程的概念本體要進(jìn)行課程本體的構(gòu)建,首先要確定該課程中的關(guān)鍵知識點,課程知識點由課程的核心概念和基本概念構(gòu)成。準(zhǔn)確定義領(lǐng)域內(nèi)核心的概念,以確定合理、完整的概念體系,構(gòu)建課程本體。需要抽象概念、屬性,及概念之間的關(guān)系進(jìn)行描述和定義。概念本體(CO-ConceptOntology)是用來描述某個知識領(lǐng)域內(nèi)的一些核心概念和基本概念的本體,這些概念是被該領(lǐng)域內(nèi)人們所共同認(rèn)可的,本文將其表示為一個單獨的本體,定義如下:CO:=(Onm,Ch,Cj,Sx)其中OnmM某個領(lǐng)域白課程名;Ch為該課程領(lǐng)域核心概念集合;Cj為該課程領(lǐng)域基本概念集合;Sx為該課程領(lǐng)域各概念的屬性集合

6、;本文領(lǐng)域概念的提取是由多位領(lǐng)域?qū)<壹熬W(wǎng)絡(luò)搜集獲得,下面給出一個實例片段:CO:=(Onm,Ch,Cj,Sx);Onm=數(shù)據(jù)結(jié)構(gòu)”;Ch=(數(shù)據(jù)結(jié)構(gòu)、線性表、樹、圖);Cj=(棧、隊列、特殊線性表、串、多維數(shù)組、廣義表、二叉樹、查找、排序);Sx=(Sx1數(shù)據(jù)結(jié)構(gòu):定義,發(fā)展歷史,訪問接口,分類;Sx2線性表:定義,邏輯結(jié)構(gòu),存儲結(jié)構(gòu),應(yīng)用;Sx3樹:定義,遍歷,轉(zhuǎn)換;Sx4圖:定義,邏輯結(jié)構(gòu),存儲結(jié)構(gòu),最短路徑,遍歷,關(guān)鍵路徑,應(yīng)用)3.2 領(lǐng)域概念層次關(guān)系提取根據(jù)上一節(jié)提取到的課程概念,確定課程概念間的相互關(guān)系,并且用精確的術(shù)語來表達(dá)這些概念以及概念之間的關(guān)系,本文在建立數(shù)據(jù)結(jié)構(gòu)課程本體時

7、主要考慮了基本概念之間的關(guān)系如表1-1所示,包括概念間的同義關(guān)系、蘊含關(guān)系、上下位關(guān)系、層次關(guān)系和縮寫關(guān)系。同義詞關(guān)系表示兩個概念(類)之間的語義相等或非常相近,往往可以相互替換,如“線性表”別名“表”或“Linearlist”等。蘊含關(guān)系表示兩個概念(類)是繼承關(guān)系。如線性表和特殊線性表具有繼承關(guān)系。上下位關(guān)系表示下位詞是上位詞的特例,如特殊線性表是棧和隊列的上位詞。在問答中有時候通過該概念的上下位概念也能提取到潛在的有用信息。3.3數(shù)據(jù)結(jié)構(gòu)課程本體模型3.4常見問題庫和文檔庫的構(gòu)建課程FAQ庫是課程自動問答系統(tǒng)的核心,存儲的是針對某一最重要的問題集合。包括學(xué)生在學(xué)習(xí)過程中經(jīng)常提問的問題及各

8、類考試中頻繁出現(xiàn)的題目等等,課程FAQ車把這些問題存儲到數(shù)據(jù)庫中,并配有準(zhǔn)確的答案,為了使系統(tǒng)充分理解用戶的提問意圖,以便在自動答疑時把FAQ庫中相關(guān)的問題集找出來,結(jié)合前面的分析,本文以課程知識本體為基礎(chǔ),應(yīng)用短文本分類技術(shù)對所有問題分類,構(gòu)建了數(shù)據(jù)結(jié)構(gòu)課程FAQ庫。自動問答系統(tǒng)中對于用戶提出的常見問題,首先用戶輸入查詢問題,系統(tǒng)先在課程FAQ庫中找到相同或相似的問題,返回相應(yīng)的答案,對于一些問題是FAC庫模式難以回答的,比如:用戶提出一些敘述形式的問題或者與應(yīng)用相關(guān)的算法實現(xiàn)等問題。對于這些類型的問題,本文基于課程知識本體設(shè)計了課程文檔庫來解答。課程文檔庫按章對數(shù)據(jù)結(jié)構(gòu)課程的內(nèi)容以樹形結(jié)構(gòu)組織,課程文檔庫中存儲的是該門課程知識的集合,是完整的關(guān)于課程知識的體系結(jié)構(gòu),具有良好的結(jié)構(gòu)性,便于查找。在查找時可以將父結(jié)點、兄弟節(jié)點和子結(jié)點的相關(guān)信息返回。提高了查詢結(jié)果的準(zhǔn)確性。4小結(jié)本文通過對自動問答系統(tǒng)的相關(guān)研究進(jìn)行剖析,結(jié)合本體技術(shù)的核心內(nèi)容和特征,對如何使用本體來構(gòu)建課程知識本體庫進(jìn)行了論述。以數(shù)據(jù)結(jié)構(gòu)課

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論