基于主動(dòng)學(xué)習(xí)的傳統(tǒng)中醫(yī)癥狀本體構(gòu)建方法研究綜述_第1頁(yè)
基于主動(dòng)學(xué)習(xí)的傳統(tǒng)中醫(yī)癥狀本體構(gòu)建方法研究綜述_第2頁(yè)
基于主動(dòng)學(xué)習(xí)的傳統(tǒng)中醫(yī)癥狀本體構(gòu)建方法研究綜述_第3頁(yè)
基于主動(dòng)學(xué)習(xí)的傳統(tǒng)中醫(yī)癥狀本體構(gòu)建方法研究綜述_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于主動(dòng)學(xué)習(xí)的傳統(tǒng)中醫(yī)癥狀本體構(gòu)建方法研究綜述領(lǐng)域本體的構(gòu)建方法是當(dāng)前本體研究的熱點(diǎn)問題之一。已被廣泛應(yīng)用于知識(shí)工程、自然語(yǔ)言處理、系統(tǒng)建模、信息處理、信息檢索和語(yǔ)義Web、軟件復(fù)用等領(lǐng)域之中o但是,目前的領(lǐng)域本體的創(chuàng)建還缺乏系統(tǒng)的、針對(duì)所有領(lǐng)域的、工程化的方法。本文介紹一種基于主動(dòng)學(xué)習(xí)的傳統(tǒng)中醫(yī)癥狀本體的文本知識(shí)自動(dòng)獲取方法的設(shè)計(jì)和實(shí)現(xiàn)。通過引入領(lǐng)域本體,實(shí)現(xiàn)半結(jié)構(gòu)化文本知識(shí)的完全自動(dòng)獲取。該方法具有較好的通用性,把人們從繁重的手工勞動(dòng)中解放由來,并能極大地提高中醫(yī)知識(shí)獲取的效率和應(yīng)用價(jià)值?!娟P(guān)鍵詞】領(lǐng)域本體中醫(yī)癥狀名語(yǔ)義標(biāo)注主動(dòng)學(xué)習(xí)本體(Ontology)是近年來計(jì)算機(jī)及相關(guān)領(lǐng)域普遍關(guān)注的

2、一個(gè)研究熱點(diǎn),本體可以促進(jìn)各種領(lǐng)域之間的交流,這種交流實(shí)現(xiàn)了給定領(lǐng)域中不同知識(shí)的重用和共享。作為一種能在語(yǔ)義和知識(shí)層次上描述信息系統(tǒng)的概念模型建模工具,已被廣泛應(yīng)用于知識(shí)工程、系統(tǒng)建模、信息處理、數(shù)字圖書館、自然語(yǔ)言理解、語(yǔ)義Web等領(lǐng)域之中?!皞鹘y(tǒng)中醫(yī)”領(lǐng)域知識(shí)主要來源于古中醫(yī)文獻(xiàn)、臨床記錄、老中醫(yī)經(jīng)驗(yàn)手稿等。這些知識(shí)的主要載體常常是非結(jié)構(gòu)或半結(jié)構(gòu)的數(shù)據(jù)。中醫(yī)診斷是通過對(duì)癥狀的總體觀察和分析得到結(jié)果。由此可知中醫(yī)古籍文獻(xiàn)中癥狀名識(shí)別問題十分重要。如何讓計(jì)算機(jī)對(duì)自由文本中癥狀名自動(dòng)分析獲取知識(shí),進(jìn)行病癥診斷是知識(shí)工程領(lǐng)域需要解決的難題。知識(shí)服務(wù)離不開大型知識(shí)庫(kù)的支持。僅僅依靠繁重的手工勞動(dòng)來建

3、設(shè)大型知識(shí)庫(kù),必將嚴(yán)重影響知識(shí)服務(wù)的能力和質(zhì)量。因此,目前當(dāng)務(wù)之急是尋求一種通用的自動(dòng)的文本知識(shí)獲取方法。傳統(tǒng)的文本知識(shí)獲取方法主要有兩種:一種是采用通用的算法處理自然語(yǔ)言文本,從文本中抽取概念以及概念之間的關(guān)系。這種方法知識(shí)獲取量大,但所獲取的知識(shí)類型較單一,知識(shí)的表示形式也相對(duì)簡(jiǎn)單。另一種方法是通過與知識(shí)工程師進(jìn)行交互,使用一些知識(shí)獲取平臺(tái)或管理環(huán)境,實(shí)現(xiàn)知識(shí)的獲取。這種方法不僅手工工作量大,而且通用性也較差。鑒于現(xiàn)有文本知識(shí)獲取方法的缺陷,本文提由一種從古籍文本的表征及內(nèi)容特征生發(fā),抽取實(shí)義詞,為實(shí)現(xiàn)中醫(yī)文獻(xiàn)標(biāo)引和檢索從單漢字層次向詞、概念層次的過渡。基于主動(dòng)學(xué)習(xí)的方法進(jìn)行文本標(biāo)注,再進(jìn)

4、行自動(dòng)領(lǐng)域本體構(gòu)建。本文第1、2章介紹本體以及領(lǐng)域本體發(fā)展;第3章介紹傳統(tǒng)中醫(yī)癥狀本體的研究背景與意義;第4章介紹基于主動(dòng)學(xué)習(xí)的傳統(tǒng)中醫(yī)癥狀本體構(gòu)建方法可行性分析及結(jié)果和性能評(píng)價(jià);第5章總結(jié)全文。1研究的范疇和發(fā)展現(xiàn)狀1.1 本體的概述本體最早是一個(gè)源于哲學(xué)的概念,是一種對(duì)“存在”的系統(tǒng)化解釋,用于描述事務(wù)的本質(zhì)。后來知識(shí)工程學(xué)者借用了這個(gè)概念,在開發(fā)知識(shí)系統(tǒng)時(shí)用于領(lǐng)域知識(shí)的獲取。近年來,本體的概念被越來越多的應(yīng)用于計(jì)算機(jī)知識(shí)工程領(lǐng)域,用于對(duì)客觀世界的存在進(jìn)行系統(tǒng)化描述,方便知識(shí)的重用和交互。本體是用于描述一個(gè)領(lǐng)域的術(shù)語(yǔ)集合,其組織結(jié)構(gòu)是層次結(jié)構(gòu)化的,可以作為一個(gè)知識(shí)庫(kù)的骨架和基礎(chǔ)。1.2 本

5、體的分類目前關(guān)于本體的研究非常廣泛,尤其是在國(guó)外,許多研究組織和機(jī)構(gòu)都研究建立了各種各具特色的本體。針對(duì)目前由現(xiàn)的各種各樣的本體,也由現(xiàn)了不同的分類方法,最為廣泛的分類方法是根據(jù)本體應(yīng)用主題,將這些為數(shù)眾多的本體劃分為五種類型:領(lǐng)域本體、通用或常識(shí)本體、知識(shí)本體、語(yǔ)言學(xué)本體和任務(wù)本體。領(lǐng)域本體主要有以下作用:可以明確專業(yè)術(shù)語(yǔ)、關(guān)系及其領(lǐng)域公理,使其形式化;在人與人之間、人與機(jī)器之間達(dá)到共享;實(shí)現(xiàn)一定程度的領(lǐng)域知識(shí)復(fù)用。止匕外,Guarin也提由以詳細(xì)程度和領(lǐng)域依賴度兩個(gè)方面對(duì)本體進(jìn)行劃分。其中,根據(jù)本體對(duì)領(lǐng)域的依賴程度由高到低可分為四個(gè)類別:頂級(jí)本體(top-levelOntologies)、

6、領(lǐng)域本體(domainOntologies)>任務(wù)本體(taskOntologies)和應(yīng)用本體(applicationOntologies)。1.3 本體的應(yīng)用領(lǐng)域目前,本體已經(jīng)被廣泛應(yīng)用于知識(shí)工程、自然語(yǔ)言處理、數(shù)字圖書館、信息檢索和Web異構(gòu)信息的處理、軟件復(fù)用、面向?qū)ο蠹夹g(shù)和語(yǔ)義Web等領(lǐng)域。典型的應(yīng)用有:(1)基于語(yǔ)義的信息檢索,特別是網(wǎng)絡(luò)搜索引擎和數(shù)字化圖書館。(2)基于本體的數(shù)據(jù)集成、機(jī)器學(xué)習(xí)等。(3)領(lǐng)域本體的應(yīng)用。(4)語(yǔ)義Web服務(wù)。(5)在線元數(shù)據(jù)管理和自動(dòng)信息發(fā)布。1.4 本體研究的現(xiàn)狀對(duì)本體的研究和應(yīng)用近年來發(fā)展很快。在1998年6月,第一屆“信息系統(tǒng)中的形式化

7、本體論國(guó)際會(huì)議”的召開標(biāo)志著這一領(lǐng)域在逐漸走向成熟。從國(guó)外的研究情況來看,20世紀(jì)80年代末至90年代初,哲學(xué)領(lǐng)域的概念“Ontology”被AI領(lǐng)域所借鑒,本體的建模方法也初步確立,本體論把知識(shí)工程中的知識(shí)向更深入的方向推進(jìn)。近年來,國(guó)外對(duì)本體建模作了大量研究并將其運(yùn)用于知識(shí)工程領(lǐng)域。主要代表為:1.5 萬(wàn)維網(wǎng)聯(lián)盟W3C(WorldWideWebConsortium)的研究;1.6 德國(guó)卡爾斯魯厄大學(xué)的RudiStuder,AlexanderMaeche和以他們?yōu)槭椎腁IFB研究所從事的創(chuàng)建基于本體的知識(shí)門戶和語(yǔ)義門戶研究;1.7 美國(guó)斯坦福大學(xué)的知識(shí)系統(tǒng)實(shí)驗(yàn)室(KSD對(duì)本體建模工具和本體應(yīng)用層面的研究。與國(guó)外相比,國(guó)內(nèi)無論是在理論研究、實(shí)證研究還是在技術(shù)手段的實(shí)現(xiàn)和應(yīng)用方面都相對(duì)落后,與國(guó)外高水平的研究相比存在很大差距。國(guó)內(nèi)對(duì)于本體的研究大約始于20世紀(jì)90年代初。目前,國(guó)內(nèi)進(jìn)行本體研究的主

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論