中醫(yī)藥學(xué)語言系統(tǒng)PowePointPresentation_第1頁
中醫(yī)藥學(xué)語言系統(tǒng)PowePointPresentation_第2頁
中醫(yī)藥學(xué)語言系統(tǒng)PowePointPresentation_第3頁
中醫(yī)藥學(xué)語言系統(tǒng)PowePointPresentation_第4頁
中醫(yī)藥學(xué)語言系統(tǒng)PowePointPresentation_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

中醫(yī)藥學(xué)語言系統(tǒng)PowePointPresentation當(dāng)前第1頁\共有57頁\編于星期六\20點(diǎn)當(dāng)前第2頁\共有57頁\編于星期六\20點(diǎn)2.背景:統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)2.1.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)研制的目的和意義2.2.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段2.3.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的組成2.4.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展策略與開發(fā)原則2.5.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用當(dāng)前第3頁\共有57頁\編于星期六\20點(diǎn)2.1.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)研制的目的和意義美國國立醫(yī)學(xué)圖書館自1986年開始研制統(tǒng)一的醫(yī)學(xué)語言系統(tǒng),其目的在于克服計(jì)算機(jī)生物醫(yī)學(xué)信息檢索中相同的概念具有不同的表達(dá)方式、有用的信息分散在不同的數(shù)據(jù)庫系統(tǒng)中所造成的查詢困難。統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)是計(jì)算機(jī)化的情報(bào)檢索語言集成系統(tǒng),它不僅是語言翻譯、自然語言處理及語言規(guī)范化的工具,而且是實(shí)現(xiàn)跨數(shù)據(jù)庫檢索的詞匯轉(zhuǎn)換系統(tǒng),它可以幫助用戶在聯(lián)接情報(bào)源,包括數(shù)字化的病案記錄、書目數(shù)據(jù)庫、事實(shí)數(shù)據(jù)庫以及專家系統(tǒng)的過程中,對其中的電子式生物醫(yī)學(xué)情報(bào)作統(tǒng)一的檢索。

當(dāng)前第4頁\共有57頁\編于星期六\20點(diǎn)2.2.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段1986~1988年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的初始階段1989~1991年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段

1992年至今統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用階段當(dāng)前第5頁\共有57頁\編于星期六\20點(diǎn)1986~1988年為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的初始階段,其研究和開發(fā)的重點(diǎn)是調(diào)查用戶需求、開發(fā)研究工具、確定統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的性能及其實(shí)施方案、界定系統(tǒng)組成等。在此階段主要界定了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的三個(gè)組成部分即超級敘詞表、語義網(wǎng)絡(luò)、情報(bào)源圖譜,并且進(jìn)行了包括MeSH(MedicalSubjectHeadings)、SNOMED(SystematizedNomenclatureofMedicine)、CMIT(CurrentMedicalInformationandTerminology)和PDQ(Physicians'DataQuery)詞表在內(nèi)的聯(lián)接試驗(yàn)。當(dāng)前第6頁\共有57頁\編于星期六\20點(diǎn)1989~1991年為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段其開發(fā)的重點(diǎn)是迅速研制和發(fā)行三個(gè)統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)產(chǎn)品的試驗(yàn)版,同時(shí)繼續(xù)開展用戶調(diào)查和統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)功能開發(fā)。1990年秋,美國國立醫(yī)學(xué)圖書館發(fā)行了超級敘詞表和語義網(wǎng)絡(luò)第一版的CD-ROM;一年后,發(fā)行了試驗(yàn)版的情報(bào)源圖譜和更新版的超級敘詞表和語義網(wǎng)絡(luò),同時(shí)獲得了大量的反饋信息,促進(jìn)了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的研究與開發(fā)。當(dāng)前第7頁\共有57頁\編于星期六\20點(diǎn)1992年至今為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用階段其研究的重點(diǎn)是圍繞統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)所進(jìn)行應(yīng)用開發(fā),不斷擴(kuò)展和修訂統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的三個(gè)組成部分,發(fā)行修訂統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)三個(gè)組成部分的年度版,建立健全產(chǎn)品體系。

1996年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)新增了一個(gè)組成部分,即“專家詞典”(SpecialistLexicon)。當(dāng)前第8頁\共有57頁\編于星期六\20點(diǎn)在此階段,許多研究機(jī)構(gòu)利用統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)進(jìn)行了基于Internet的應(yīng)用開發(fā),如決策支持系統(tǒng)(DXplain)、文獻(xiàn)檢索系統(tǒng)(WebMedline)、臨床Web搜索系統(tǒng)(Clinweb)、醫(yī)學(xué)世界檢索(medicalworldsearch)以及集成化的

Medweave等。除了以CD-ROM方式發(fā)行其產(chǎn)品外,1995年美國國立醫(yī)學(xué)圖書館在Internet上建立了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)知識源服務(wù)器,通過Internet,加強(qiáng)國際交流與合作。從此,統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)由試驗(yàn)階段進(jìn)入到產(chǎn)品發(fā)行、維護(hù)和應(yīng)用的階段。當(dāng)前第9頁\共有57頁\編于星期六\20點(diǎn)2.3.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的組成

超級敘詞表(Metathesaurus)語義網(wǎng)絡(luò)(SemanticNetwork)專家詞典(SpecialistLexicon)

情報(bào)源圖譜(InformationSourcesMap,ISM)多元系統(tǒng)(MetamorphoSys)

當(dāng)前第10頁\共有57頁\編于星期六\20點(diǎn)超級敘詞表超級敘詞表可視為一個(gè)概念名詞的知識庫,是由生物醫(yī)學(xué)領(lǐng)域中許多不同索引典或分類表中所抽取出來的詞目所組成。

超級敘詞表是生物醫(yī)學(xué)概念、術(shù)語、詞匯及其等級范疇的廣泛集成。1997年第8版的超級敘詞表收錄了來源于30多種生物醫(yī)學(xué)詞表和分類表的、能表達(dá)33萬多個(gè)概念的739439個(gè)詞匯;到目前超級敘詞表收錄了100多萬個(gè)生物醫(yī)學(xué)概念、共500多萬個(gè)詞。這些概念和詞來自100多個(gè)生物醫(yī)學(xué)受控詞表、術(shù)語表、分類表、專家系統(tǒng)中的詞匯、詞典及工具性詞表等,如醫(yī)學(xué)主題詞詞表(MedicalSubjectHeadings,MeSH)及其葡萄牙語、西班牙語、法語、德語、俄語等各種譯本、醫(yī)學(xué)系統(tǒng)術(shù)語表(SystematizedNomenclatureofMedicine,SNOMED)、國際疾病分類修訂第10版(InternationalClassificationofDiseases,10thRevision,ICD-10)及其他各版、LOINC(LogicalObservationIdentifiersNamesandCodes)、臨床藥物標(biāo)準(zhǔn)術(shù)語(RxNorm)等。當(dāng)前第11頁\共有57頁\編于星期六\20點(diǎn)超級敘詞表是依據(jù)概念(concept)或涵義(meaning)組織起來的,其根本目的是將相同概念的交替名稱和不同形式聯(lián)系在一起,并識別不同概念之間的聯(lián)系。因此,可以說概念是超級敘詞表組織系統(tǒng)的中心。對于同一概念的不同術(shù)語以及不同的變異形式,超級敘詞表采用三級結(jié)構(gòu)模式,即概念(I級)→術(shù)語(II級)→詞串(III級),將一個(gè)概念的多種不同術(shù)語連同多個(gè)變異詞串有序地組織在一起。對于不同的概念,超級敘詞表采用多種“關(guān)系”概念如相關(guān)概念、組配概念、共現(xiàn)概念等來描述不同概念之間的關(guān)系。當(dāng)前第12頁\共有57頁\編于星期六\20點(diǎn)語義網(wǎng)絡(luò)語義網(wǎng)絡(luò)是為建立概念、術(shù)語間錯(cuò)綜復(fù)雜的關(guān)系而設(shè)計(jì)的,它為超級敘詞表中所有概念提供了語義類型、語義關(guān)系和語義結(jié)構(gòu)。語義網(wǎng)絡(luò)包括了135種語義類型和54種語義關(guān)系。語義網(wǎng)絡(luò)是通過135種語義類型,為出現(xiàn)在超級敘詞表中的所有概念提供一種目錄組織結(jié)構(gòu)。語義類型之間的54種連接關(guān)系為這種組織結(jié)構(gòu)提供構(gòu)架,并代表生物醫(yī)學(xué)領(lǐng)域中的重要相互關(guān)系。當(dāng)前第13頁\共有57頁\編于星期六\20點(diǎn)語義網(wǎng)絡(luò)為超級敘詞表提供了指定給每一個(gè)概念至少一種語義類型的信息,同時(shí)語義類型也指定給情報(bào)源圖譜中特定的數(shù)據(jù)庫,以表達(dá)情報(bào)資源之間的內(nèi)在聯(lián)系。也就是說,語義網(wǎng)絡(luò)是試圖建立一種語義類型及其相互關(guān)系的權(quán)威規(guī)則,用以標(biāo)引每一個(gè)超級敘詞概念,或表達(dá)概念之間可能存在的相互關(guān)系。語義網(wǎng)絡(luò)的這種權(quán)威規(guī)則,既在文字上,也從等級關(guān)系或非等級關(guān)系上界定語義類型及其相互間可能存在的關(guān)系與內(nèi)在涵義。當(dāng)前第14頁\共有57頁\編于星期六\20點(diǎn)語義類型是通過計(jì)算機(jī)程序指定的或在人工復(fù)審過程中增加的,它既是超級敘詞表與語義網(wǎng)絡(luò)之間的連接,也是超級敘詞表與情報(bào)源圖譜的連接之一。目前語義類型主要分為生物體、解剖結(jié)構(gòu)、生物功能、化學(xué)、事件、客觀物體、概念和觀念等。各類范疇深度不一。在實(shí)際應(yīng)用中,語義類型不斷完善和擴(kuò)展。UI:

T048STY:

MentalorBehavioralDysfunction(心理或行為功能失調(diào))Definition:Aclinicallysignificantdysfunctionwhosemajormanifestationisbehavioralorpsychological.Thesedysfunctionsmayhaveidentifiedorpresumedbiologicaletiologiesormanifestations.表現(xiàn)為行為性或精神性的具有臨床意義的功能失調(diào),這些功能失調(diào)可能曾被認(rèn)為或被假定為生物學(xué)病因或生物學(xué)表現(xiàn)。Examples:MemoryDisorders(記憶混亂);Agoraphobia(廣場恐怖癥);Hallucinations(幻覺);CyclothymicDisorder(循環(huán)情感性精神障礙)當(dāng)前第15頁\共有57頁\編于星期六\20點(diǎn)當(dāng)前第16頁\共有57頁\編于星期六\20點(diǎn)當(dāng)前第17頁\共有57頁\編于星期六\20點(diǎn)語義類型是語義網(wǎng)絡(luò)的節(jié)點(diǎn),節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系即為語義關(guān)系。最基本的語義關(guān)系是“isa”關(guān)系,通過它建立了節(jié)點(diǎn)與節(jié)點(diǎn)之間的一種等級關(guān)系,這種等級關(guān)系的最大特性是它的繼承性,即下一級節(jié)點(diǎn)對上一級節(jié)點(diǎn)的繼承關(guān)系。除了‘isa”關(guān)系外,還有

53種語義關(guān)系,它們均是非等級關(guān)系,這些關(guān)系可以出現(xiàn)在任何一級節(jié)點(diǎn)上,表示一種可能、允許的關(guān)系。等級關(guān)系鏈isa相關(guān)關(guān)系鏈

associated_with物理上相關(guān)(physicallyrelatedto)功能上相關(guān)(functionallyrelatedto)概念上相關(guān)(conceptuallyrelatedto)空間上相關(guān)(Spatiallyrelatedto)時(shí)間上相關(guān)(temporallyrelatedto)當(dāng)前第18頁\共有57頁\編于星期六\20點(diǎn)H.等級關(guān)系鏈isa

R.相關(guān)關(guān)系鏈

(1)物理上相關(guān)

1.…的部分

2.由…組成

3.包含

4.與…相連

5.分開

(2.)空間上相關(guān)

1.位于…

2.與…相鄰

3.包圍,周圍

4.穿過

(3)功能上相關(guān)

1.影響

1.1管理

1.2治療1.3干擾

1.4并發(fā)

1.5與…相互作用

1.6預(yù)防

2.帶來、造成

2.1產(chǎn)生

2.2引起

3.執(zhí)行

3.1實(shí)施

3.2展示

3.3練習(xí)

4.發(fā)生于…情況下

4.1.…的進(jìn)程

5.使用

6.現(xiàn)象表達(dá)

7.證實(shí)

8.…的結(jié)果、效果(4)時(shí)間上相關(guān)

1.與…同時(shí)發(fā)生

2.先于…發(fā)生

(5)概念上相關(guān)

1.…的評價(jià)

2.…的程度、等級

3.分析

3.1分析評估…的影響

4.…的測量值

5.測量

6.診斷

7.…的特性

8.…衍生的

9.…的發(fā)育階段

10.…的方法

11.…的概念部分

12.…之中的焦點(diǎn)問題當(dāng)前第19頁\共有57頁\編于星期六\20點(diǎn)語義類型和語義關(guān)系構(gòu)成網(wǎng)狀的語義結(jié)構(gòu),它起著統(tǒng)領(lǐng)超級敘詞表概念的作用。因?yàn)槌墧⒃~表的概念來自許多不同的詞表,它們有各自的結(jié)構(gòu)體系,語義網(wǎng)絡(luò)將全部概念劃分成許多組,每一組共享幾種特定的語義類型,語義類型又共享幾種語義關(guān)系,這樣概念不僅高度結(jié)構(gòu)化而且廣泛聯(lián)系。當(dāng)前第20頁\共有57頁\編于星期六\20點(diǎn)語義關(guān)系的等級繼承規(guī)則和繼承阻斷

在語義類型等級結(jié)構(gòu)的高層節(jié)點(diǎn)之間的語義關(guān)系,在任何可能的情況下都是固定的,正如語義關(guān)系“影響”鏈接的這些高層語義類型節(jié)點(diǎn)。而且高層語義類型之間的語義關(guān)系,一般地可通過等級結(jié)構(gòu)(isa鏈)繼承給這些節(jié)點(diǎn)的所有子類。在有些情況下,如果按照語義類型的等級結(jié)構(gòu)及鏈的繼承規(guī)則,會使語義類型與語義關(guān)系的連接產(chǎn)生歧義。例如,語義關(guān)系“…的進(jìn)程”存在于語義類型“生物體功能”和“生物體”之間,“生物體功能”有一個(gè)子類是“心理功能”,而植物也是一種“生物體”,按照繼承規(guī)則,心理過程也是一種“植物的活動、功能或狀態(tài)”,顯然,植物不可能有“心理過程”。不能繼承的鏈稱為阻斷。當(dāng)前第21頁\共有57頁\編于星期六\20點(diǎn)語義網(wǎng)絡(luò)使概念之間語義關(guān)系的準(zhǔn)確細(xì)致表達(dá)MeSH樹狀范圍表所表達(dá)的MeSH上位詞與下位詞之間的關(guān)系,只是簡單的較泛指與較專指關(guān)系。例如,MeSH“羊水”(Amnioticfluid)是MeSH“胚胎”(Embryo)的一個(gè)下位詞:在UMLS語義網(wǎng)絡(luò)中,Embryo標(biāo)引的語義類型是“胚胎結(jié)構(gòu)”(Embryonicstructure),Amnioticfluid標(biāo)引的語義類型是“機(jī)體物質(zhì)”(BodySubstance),語義關(guān)系標(biāo)引的是“周圍”(Surround)。所以“羊水”與“胚胎”之間的關(guān)系就被確切地表達(dá)為“胚胎結(jié)構(gòu)周圍的機(jī)體物質(zhì)”。

當(dāng)前第22頁\共有57頁\編于星期六\20點(diǎn)專家詞典專家詞典是一個(gè)包含眾多生物醫(yī)學(xué)詞匯的英語詞典。它是在美國國立醫(yī)學(xué)圖書館自然語言處理專家系統(tǒng)項(xiàng)目基礎(chǔ)上開發(fā)出來的。專家詞典約有183000條詞匯記錄,共292000多個(gè)詞。每條詞匯記錄均記錄了它的句法、詞法和字法信息。詞條由詞或詞組組成。所有詞條均共享它們的基本形式和拼寫變異。詞的基本形式包括詞的不變形式、名詞的單數(shù)形式、動詞的原形以及形容詞和副詞的原級形式。詞匯信息包括句法分類、詞形變異以及詞的補(bǔ)充成份。詞形變異有名詞的單復(fù)形式、動詞的規(guī)則與不規(guī)則變化形式、形容詞和副詞的原級、比較級、最高級形式等。專家詞典能識別11種句法分類和引語部分:動詞、名詞、形容詞、副詞、助詞、語氣詞、代詞、介詞、連詞、補(bǔ)語、定語。當(dāng)前第23頁\共有57頁\編于星期六\20點(diǎn)專家詞典包括一組詞典程序,它們可以確定英語詞匯的范圍以及識別生物醫(yī)學(xué)術(shù)語和文本詞的詞形變異。還包括三個(gè)索引:①超級敘詞表中所有詞串的單個(gè)詞索引;②標(biāo)準(zhǔn)詞索引;③標(biāo)準(zhǔn)詞串索引。專家詞典包括四個(gè)詞匯數(shù)據(jù)庫:①已知詞源變異文檔,如“aphasic

[?’feizik]n.adj.

患失語癥者失語癥的

”與“aphasia

[?’feizi?]n.失語癥”;②密切相關(guān)詞文檔。密切相關(guān)詞是意義相同但句法分類不同的詞,如肝細(xì)胞“hepatocellular”與“l(fā)ivercells”;③拼寫變異文檔,如“foetal[‘fi:tl]”與“fetal”;④意義相近但構(gòu)詞形式不同的詞文檔,如“heart”與“cardi(o)”。當(dāng)前第24頁\共有57頁\編于星期六\20點(diǎn)情報(bào)源圖譜情報(bào)源圖譜是一個(gè)關(guān)于生物醫(yī)學(xué)機(jī)讀情報(bào)資源的數(shù)據(jù)庫,其目的是利用超級敘詞表和語義網(wǎng)絡(luò)實(shí)現(xiàn)以下功能:測度情報(bào)源與特定提問的相關(guān)性,以便選取最合適的情報(bào)源;為用戶提供特定情報(bào)源的范圍、功能和檢索條件等人工可讀的信息;自動連接相關(guān)情報(bào)源;在一個(gè)或多個(gè)情報(bào)源中自動檢索并自動組織檢索的結(jié)果。在情報(bào)源圖譜中,從4個(gè)方面對情報(bào)源進(jìn)行標(biāo)引:①超級敘詞表中的MeSH詞表;②超級敘詞表中的主題詞和副主題詞組配;③統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)語義網(wǎng)絡(luò)的語義類型;④統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)語義網(wǎng)絡(luò)的語義關(guān)系。當(dāng)前第25頁\共有57頁\編于星期六\20點(diǎn)多元系統(tǒng)(MetamorphoSys)多元系統(tǒng)是統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)新建立的一個(gè)可以為用戶提供個(gè)性化服務(wù)的系統(tǒng)。它包含統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的所有版本??梢园惭b一個(gè)或多個(gè)統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的知識資源。如果用戶選擇統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的超級敘詞表,用戶可以指定一個(gè)用戶化的超級敘詞表的子集。系統(tǒng)可以排除不必要的或者是本地用戶不許可的詞匯,還可以從大量的數(shù)據(jù)中進(jìn)行選擇和過濾。當(dāng)前第26頁\共有57頁\編于星期六\20點(diǎn)2.4.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展策略與開發(fā)原則多學(xué)科、多研究小組協(xié)同開發(fā)原則集中開發(fā)與分散開發(fā)相結(jié)合的原則資金保障原則當(dāng)前第27頁\共有57頁\編于星期六\20點(diǎn)2.5.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用電子數(shù)據(jù)處理系統(tǒng)管理信息系統(tǒng)決策支持系統(tǒng)當(dāng)前第28頁\共有57頁\編于星期六\20點(diǎn)統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)可將分散的情報(bào)源集成為統(tǒng)一的機(jī)讀生物醫(yī)學(xué)信息資源,大大提高了信息檢索系統(tǒng)的效率。目前已被廣泛應(yīng)用于信息系統(tǒng)的智能化檢索、自然語言系統(tǒng)研究、專業(yè)詞表的編制、自動標(biāo)引、醫(yī)學(xué)專業(yè)搜索引擎的開發(fā)、醫(yī)學(xué)圖像的描述及獲取、課程分析等方面。統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)在電子數(shù)據(jù)處理系統(tǒng)的應(yīng)用主要表現(xiàn)在電子病案系統(tǒng)。荷蘭Erasmus大學(xué)(Rotterdam)ErikMvanMulligen計(jì)劃開發(fā)一個(gè)通過統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)獲取CPR(TheCenterForPublicResources)數(shù)據(jù)的系統(tǒng)。美國護(hù)理學(xué)會(TheAmericanNursesAssociation,ANA)開發(fā)了一個(gè)基于統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的CPR數(shù)據(jù)系統(tǒng)。當(dāng)前第29頁\共有57頁\編于星期六\20點(diǎn)統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)在決策系統(tǒng)中的應(yīng)用主要表現(xiàn)在醫(yī)學(xué)專業(yè)搜索引擎的開發(fā)。美國國立醫(yī)學(xué)圖書館利用統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)開發(fā)了兩個(gè)網(wǎng)上Medline文獻(xiàn)數(shù)據(jù)庫智能檢索軟件PubMed與IGM(InternetGratefulMed)。統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)目前支持的醫(yī)學(xué)搜索引擎包括醫(yī)學(xué)世界搜索(MedialWorldsearch,mwsearch,提供網(wǎng)上臨床醫(yī)學(xué)信息指引);國際臨床網(wǎng)(CliniWebInternational,/cliniweb,是Internet上醫(yī)學(xué)網(wǎng)站全文搜索引擎)與MedWeaver(提供醫(yī)學(xué)鑒別診斷、醫(yī)學(xué)文獻(xiàn)及其相關(guān)醫(yī)學(xué)網(wǎng)站指引)。當(dāng)前第30頁\共有57頁\編于星期六\20點(diǎn)UMLS地址:

當(dāng)前第31頁\共有57頁\編于星期六\20點(diǎn)當(dāng)前第32頁\共有57頁\編于星期六\20點(diǎn)當(dāng)前第33頁\共有57頁\編于星期六\20點(diǎn)當(dāng)前第34頁\共有57頁\編于星期六\20點(diǎn)當(dāng)前第35頁\共有57頁\編于星期六\20點(diǎn)3.中醫(yī)藥學(xué)語言系統(tǒng)簡介

3.1. 背景3.2. 設(shè)計(jì)思想及原則3.3. 組成

當(dāng)前第36頁\共有57頁\編于星期六\20點(diǎn)語言系統(tǒng)的建立是自然語言處理的基礎(chǔ)研究,國外從20世紀(jì)90年代起進(jìn)入高峰研究期,并取得了重大的進(jìn)展。美國國家圖書館建立的語言支持系統(tǒng),為醫(yī)學(xué)信息數(shù)字化及其利用創(chuàng)造了條件。中醫(yī)藥學(xué)的發(fā)展同樣需要語言系統(tǒng)的支持,因此建立中醫(yī)藥語言系統(tǒng)是中醫(yī)藥信息學(xué)需要研究的主要問題之一。3.1.中醫(yī)藥語言系統(tǒng)背景當(dāng)前第37頁\共有57頁\編于星期六\20點(diǎn)中醫(yī)藥語言現(xiàn)狀(現(xiàn)代文獻(xiàn)收詞已超過60萬條)多樣性(同名異物)(異物同名)無標(biāo)準(zhǔn)化(缺少國標(biāo))無統(tǒng)一機(jī)讀詞庫缺少系統(tǒng)結(jié)構(gòu)中醫(yī)藥學(xué)科歷經(jīng)千年,產(chǎn)生了大量的概念與術(shù)語,多種語義詞匯差異,阻礙了中醫(yī)藥數(shù)字化的發(fā)展。當(dāng)前第38頁\共有57頁\編于星期六\20點(diǎn)數(shù)據(jù)DATA知識KNOWLEDGE挖掘MINING百科全書及中英詞典等術(shù)語、名詞。中醫(yī)藥學(xué)科收詞:中醫(yī)藥學(xué)教材、辭典、專家詞典。臨床病例與臨床用語收詞。相關(guān)學(xué)科:名詞委與醫(yī)學(xué)、生物、化學(xué)等相關(guān)收詞。古文獻(xiàn)收詞:中醫(yī)藥學(xué)科古文獻(xiàn)中收詞。中醫(yī)藥及中醫(yī)藥相關(guān)的可控詞表。國家標(biāo)準(zhǔn)中的中醫(yī)與中藥相關(guān)名詞與術(shù)語。國際醫(yī)學(xué)相關(guān)標(biāo)準(zhǔn)及國際專業(yè)與中醫(yī)藥相關(guān)的可控詞表。痛苦:太多同物異名、同名異物,無法作出正確判斷!為什么要建立TCMLS?國際醫(yī)學(xué)詞典等。當(dāng)前第39頁\共有57頁\編于星期六\20點(diǎn)3.2設(shè)計(jì)思想中醫(yī)藥學(xué)語言系統(tǒng)是依照中醫(yī)藥語言特點(diǎn)及學(xué)科體系、按照本體論原理設(shè)計(jì)而研制的語言系統(tǒng),其目的是為中醫(yī)藥學(xué)科的數(shù)字化與標(biāo)準(zhǔn)化提供必要的工具,解決相同的概念具有不同的表達(dá)方式,同樣的表達(dá)形式表示不同的概念;同時(shí)利用本系統(tǒng),進(jìn)一步提示中醫(yī)藥學(xué)概念間的相互關(guān)聯(lián)。中醫(yī)藥學(xué)一體化語言系統(tǒng)是個(gè)繁雜龐大的系統(tǒng),其基本設(shè)計(jì)思路是借鑒美國統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的原理與構(gòu)架,將中醫(yī)藥學(xué)概念中隱含的各種語義關(guān)系全部提取出來,形成關(guān)系表,并以此為中心,建立學(xué)科術(shù)語概念與概念、概念與名詞、概念與含義、名詞與名詞之間的內(nèi)在聯(lián)系,形成一個(gè)網(wǎng)狀的信息表示結(jié)構(gòu)。當(dāng)前第40頁\共有57頁\編于星期六\20點(diǎn)方法:從四方面入手研究

中醫(yī)藥一體化語言中醫(yī)藥一體化語言系統(tǒng)系統(tǒng)中醫(yī)藥為核心以中醫(yī)藥為核心,其他學(xué)科疊加:中醫(yī)藥信息化過程中使用與利用的所有相關(guān)的學(xué)科與概念、術(shù)語中醫(yī)藥語言結(jié)構(gòu)體系一體化:建立、融入中醫(yī)藥術(shù)語表達(dá)方式一體化:詞條屬性中醫(yī)藥概念定義與釋義形式一體化:回答是什么、關(guān)聯(lián)關(guān)系是什么、學(xué)科中的位置是什么相同概念詞一體化:無論文字、圖表、正名與異名、正確與誤用海量語言術(shù)語集成為基礎(chǔ):制定收詞范圍、順序規(guī)范化網(wǎng)狀結(jié)構(gòu)解釋概念的語義歸類與關(guān)聯(lián):多水平控制:詞匯、形態(tài)、語義、語用;本體論與詮釋論相結(jié)合設(shè)計(jì)分層結(jié)構(gòu)與網(wǎng)狀立體結(jié)構(gòu);符合語言體系,限定與約定復(fù)雜度;采用歸納定性,將同類事物合并;參照UMLS的整體結(jié)構(gòu),保持兼容性與包容性;系統(tǒng)保持靈活性與可擴(kuò)展性;Protégé程序當(dāng)前第41頁\共有57頁\編于星期六\20點(diǎn)3.2設(shè)計(jì)原則系統(tǒng)設(shè)計(jì)以中醫(yī)藥學(xué)科為核心,保持中醫(yī)藥學(xué)科的特性系統(tǒng)設(shè)計(jì)體現(xiàn)學(xué)科相關(guān)性與包容性系統(tǒng)設(shè)計(jì)符合語言體系系統(tǒng)設(shè)計(jì)采用語義歸納方法,將同類事物合并定性系統(tǒng)設(shè)計(jì)參照統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的結(jié)構(gòu),保持系統(tǒng)的兼容性系統(tǒng)保持靈活性與可擴(kuò)展性當(dāng)前第42頁\共有57頁\編于星期六\20點(diǎn)研究內(nèi)容:設(shè)計(jì)詞條屬性結(jié)構(gòu)總體系統(tǒng)設(shè)計(jì)概念詞屬性定義四種可控詞表的結(jié)構(gòu)比較中醫(yī)藥概念的語義類型設(shè)計(jì)(127種)建立中醫(yī)藥一級分類體系(16)中醫(yī)藥語義的關(guān)聯(lián)關(guān)系(58種)事件與物質(zhì)二大類的結(jié)構(gòu)展開以中醫(yī)五、六版教材的學(xué)科分類為依據(jù)立體表達(dá)關(guān)系等級關(guān)系相關(guān)關(guān)系(時(shí)間、空間、概念、功能、物理)完成概念詞屬性設(shè)計(jì)語料庫(收詞40萬)語義關(guān)聯(lián)關(guān)系(127萬)中醫(yī)學(xué)科結(jié)構(gòu)標(biāo)準(zhǔn)詞典教材臨床術(shù)語其他定義實(shí)現(xiàn)語義表達(dá)當(dāng)前第43頁\共有57頁\編于星期六\20點(diǎn)語言集成與規(guī)范建立數(shù)據(jù)庫基礎(chǔ)語言平臺共享平臺檢索查詢應(yīng)用工具數(shù)據(jù)挖掘與知識再現(xiàn)支撐條件數(shù)據(jù)分發(fā)(十三家)Templates數(shù)據(jù)加工DATADATADATA合并整理學(xué)科分類語義提取數(shù)據(jù)查詢LogTCMLS平臺選取數(shù)據(jù)....標(biāo)準(zhǔn)、教材、辭典、工具書、臨床術(shù)語…設(shè)計(jì)結(jié)構(gòu)TCMLS的建立流程圖當(dāng)前第44頁\共有57頁\編于星期六\20點(diǎn)中醫(yī)藥一體化語言系統(tǒng)一級學(xué)科分類(16)1.中醫(yī)基礎(chǔ)理論(包括中醫(yī)生理、心理)BasicmaterialinhumanbodyinChinesemedicine2.中醫(yī)學(xué)說與相關(guān)學(xué)科(包括中醫(yī)各家學(xué)說、中醫(yī)流派、學(xué)術(shù)思想、學(xué)術(shù)觀點(diǎn))RelatedcourseinChinesemedicine3.病因病機(jī)與診斷EtiologicalfactorsandpathogenesisandDiagnosis4.疾?。òㄗC候、癥狀)Chinesemedicinedisease5.治則治法Curativeprinciplesandtherapeuticmethods6.中藥學(xué)(包括藥劑學(xué)、調(diào)劑學(xué)、制劑學(xué)、制藥工藝、工程。注:此類下只包括單味藥)Chineseherbs7.方劑學(xué)(包括中成藥)Prescriptions8.中藥化學(xué)TCDchemical9.藥用動植物學(xué)(包括礦物藥、海洋藥、真菌藥等)Medicinalanimalsandplants10.預(yù)防與養(yǎng)生學(xué)(只包括古代氣功部分,不要現(xiàn)代氣功部分)Chinesemedicineprevention11.針灸學(xué)(包括腧穴學(xué)、經(jīng)絡(luò)學(xué))AcupunctureandMoxibustion12.人文科學(xué)Humanities13.醫(yī)學(xué)信息學(xué)與文獻(xiàn)學(xué)MedicalInformaticsandLiteratures14.自然科學(xué)、物理科學(xué)PhysicalSciencesandPhysics15.衛(wèi)生醫(yī)療機(jī)構(gòu)管理OrganizationandAdministration16.地理學(xué)Geography當(dāng)前第45頁\共有57頁\編于星期六\20點(diǎn)3.3.組成基礎(chǔ)詞庫系統(tǒng)語義系統(tǒng)當(dāng)前第46頁\共有57頁\編于星期六\20點(diǎn)基礎(chǔ)詞庫系統(tǒng)這個(gè)系統(tǒng)是整個(gè)中醫(yī)藥學(xué)語言系統(tǒng)的核心及最基本的素材,是在對現(xiàn)存各種主題詞表、分類表、數(shù)據(jù)庫、工具書中有關(guān)詞匯進(jìn)行分析、選擇和組織的基礎(chǔ)上產(chǎn)生的一個(gè)大型詞庫。本系統(tǒng)基礎(chǔ)詞庫涵蓋可控詞表與中醫(yī)藥學(xué)科系統(tǒng)及與中醫(yī)藥學(xué)科相關(guān)聯(lián)的生物、植物、化工等自然與人文科學(xué)專業(yè)詞匯?;A(chǔ)詞庫建立在全面、廣泛、準(zhǔn)確、嚴(yán)謹(jǐn)?shù)幕A(chǔ)上,最終形成超級基礎(chǔ)詞庫。詞條屬性符合中醫(yī)藥學(xué)科自然語言與可控詞的雙重屬性。用準(zhǔn)確、完整的方式揭示與表達(dá)中醫(yī)藥學(xué)科及相關(guān)術(shù)語。這個(gè)系統(tǒng)可以相當(dāng)于統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的超級敘詞表和專家詞典。當(dāng)前第47頁\共有57頁\編于星期六\20點(diǎn)其中超級敘詞表部分的收詞范圍是中醫(yī)藥及相關(guān)的可控詞表:包括“中國中醫(yī)藥學(xué)主題詞表”、“醫(yī)學(xué)主題詞表(MeSH詞表)”、“《中國圖書館圖書分類法·醫(yī)學(xué)專業(yè)分類表》(第四版)”、“中醫(yī)藥學(xué)主題詞表”等。詞典部分的收詞范圍包括:中醫(yī)藥學(xué)教材、辭典、標(biāo)準(zhǔn)、專家詞典;相關(guān)學(xué)科(包括醫(yī)學(xué)、生物、化學(xué)等)收詞;中醫(yī)藥學(xué)古代文獻(xiàn)收詞;臨床病例與臨床用語收詞;國家標(biāo)準(zhǔn)中的中醫(yī)與中藥相關(guān)名詞與術(shù)語;百科全書及中英詞典中的相關(guān)術(shù)語、名詞;國際醫(yī)學(xué)相關(guān)標(biāo)準(zhǔn)及國際專業(yè)可控詞表中相關(guān)詞語;國際醫(yī)學(xué)詞典等。當(dāng)前第48頁\共有57頁\編于星期六\20點(diǎn)詞語屬性:概念為詞條基本單位,形成概念(正名)、字符串(術(shù)語詞)二級結(jié)構(gòu),分成兩個(gè)不同的域值。不同術(shù)語表達(dá)同一概念的詞語要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論