醫(yī)學信息檢索概論課件_第1頁
醫(yī)學信息檢索概論課件_第2頁
醫(yī)學信息檢索概論課件_第3頁
醫(yī)學信息檢索概論課件_第4頁
醫(yī)學信息檢索概論課件_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學信息檢索概論軍事醫(yī)學科學院醫(yī)學信息檢索教研室劉傳和2010/9醫(yī)學信息檢索概論軍事醫(yī)學科學院醫(yī)學信息檢索教研室1主要內(nèi)容信息檢索的定義與類型信息、知識、情報、文獻及其關(guān)系信息檢索工具信息檢索語言信息檢索途徑計算機信息檢索檢索結(jié)果的鑒別與整理檢索效果的評價因特網(wǎng)信息資源評價主要內(nèi)容信息檢索的定義與類型2什么是信息檢索廣義:包括信息的存貯和查找兩個方面。狹義:查找信息。即根據(jù)特定的信息需求,從大量的信息中迅速、準確而且無重大遺漏地查找所需信息的過程。什么是信息檢索廣義:包括信息的存貯和查找兩個方面。3信息檢索的種類

按檢索手段劃分:手工檢索;計算機檢索按檢索對象劃分:文獻、事實與數(shù)值檢索按檢索途徑劃分:題名、著者、主題、分類、關(guān)鍵詞檢索等。按檢索結(jié)果的詳細程度劃分:題錄、文摘、全文檢索。

信息檢索的種類按檢索手段劃分:手工檢索;計算機檢索4

第一節(jié)

信息、知識、情報與文獻第一節(jié)

信息、知識、情5信息的定義廣義:客觀世界一切事物(物質(zhì)的和精神的)的運動狀態(tài)和運動方式,包括事物內(nèi)部結(jié)構(gòu)的狀態(tài)和方式以及外部聯(lián)系的狀態(tài)和方式。狹義:人們通過感覺器官和大腦對客觀事物運動狀態(tài)和運動方式的認識或反映。

這種信息可以通過語言、文字、圖像、聲音等思想交流工具在人與人之間傳遞。信息的定義廣義:客觀世界一切事物(物質(zhì)的和精神的)的運動狀6信息的類型

按信息傳遞的途徑不同:

網(wǎng)絡(luò)信息:是對電子計算機網(wǎng)絡(luò)上存在的信息的總稱;

廣播電視信息:通過廣播和電視發(fā)布的信息;

口頭信息:人際間直接用語言傳遞的信息;

文獻:文獻是記錄著知識的一切載體。

信息的類型按信息傳遞的途徑不同:7知識的定義人類通過社會實踐(包括工作、學習、生活和娛樂等活動)獲得和在社會實踐中運用的,關(guān)于客觀事物及其運動、變化、發(fā)展規(guī)律的,經(jīng)過社會實踐驗證為正確的認識和經(jīng)驗。知識的定義人類通過社會實踐(包括工作、學習、生活和娛樂等活8知識的分類顯性知識:以語言、文字、聲音、圖像、圖表、數(shù)學公式等規(guī)范化和系統(tǒng)化的符號存儲在書本、檔案、文件等紙質(zhì)載體以及磁盤、光盤、數(shù)據(jù)庫等新型載體中的知識,是編碼化知識。隱性知識:難以用語言、文字、聲音、圖像、圖表、數(shù)學公式等規(guī)范化和系統(tǒng)化的符號表達的知識。它主要是以個人經(jīng)驗、技能、判斷力、思維能力、價值觀以及組織的技術(shù)訣竅、組織文化等形式存在。知識的分類顯性知識:以語言、文字、聲音、圖像、圖表、數(shù)學公9顯性知識與隱性知識的關(guān)系就人類知識的總體而言,隱性知識是顯性知識之源。如果把顯性知識比作海洋,那么隱性知識就是成千上萬條河流的無數(shù)源頭。就個體知識而言,隱性知識和顯性知識是相輔相成的。從知識的總量來看,如果把全部知識比作一座漂浮在海面上的冰山,那么,顯性知識僅僅是露出海面的“冰山的尖端”,隱性知識是淹沒在海水中的巨大山體。顯性知識與隱性知識的關(guān)系就人類知識的總體而言,隱性知識是顯性10情報的定義與特性情報是指傳遞著的有特定效用的信息或知識。情報的特性

①知識信息性:情報的本質(zhì)是知識或信息

②傳遞性:信息或知識要變成情報,必須經(jīng)過傳遞

③效用性:只有那些能滿足特定需求的傳遞著的信息或知識才可稱之為情報。情報的效用性表現(xiàn)為啟迪思想、開闊眼界、增進知識、改變?nèi)藗兊闹R結(jié)構(gòu)、提高人們的認識能力、幫助人們?nèi)フJ識和改造世界。情報的定義與特性情報是指傳遞著的有特定效用的信息或知識。11文獻的定義及構(gòu)成要素文獻是記錄著知識的一切載體。文獻4要素:①所記錄的知識;②記錄知識的符號;③用于記錄知識的載體;④記錄的方式或手段。文獻的定義及構(gòu)成要素文獻是記錄著知識的一切載體。12文獻的類型

按載體劃分:紙型文獻;機讀型文獻;縮微型文獻;視聽型文獻。按出版形式劃分:圖書;期刊;特種文獻。按加工程度劃分:零次文獻;一、二、三次文獻。文獻的類型按載體劃分:紙型文獻;機讀型文獻;縮微型文獻;13信息、知識、情報與文獻的關(guān)系

信息知識情報文獻信息、知識、情報與文獻的關(guān)系信息知識情文獻14第二節(jié)

信息檢索工具

第二節(jié)

信息檢索工具15信息檢索工具的定義與職能

定義:用來報道、存貯和查找信息的工具?;韭毮埽?/p>

一是把相關(guān)信息的特征著錄(記錄)下來,形成一條條信息線索,并將這些信息線索系統(tǒng)地組織與排列;二是提供一定的檢索手段,使人們能按一定的檢索方法和途徑查找到所需的信息。信息檢索工具的定義與職能定義:用來報道、存貯和查找信息的工16信息檢索工具的種類按形式劃分:卡片式、書本式、機讀式、網(wǎng)絡(luò)檢索工具。按檢索結(jié)果的詳細程度劃分:題錄型、索引型、文摘型、全文型。

信息檢索工具的種類按形式劃分:卡片式、書本式、機讀式、網(wǎng)絡(luò)檢17第三節(jié)

信息檢索語言

第三節(jié)

信息檢索語言18信息檢索語言的概念與作用根據(jù)信息檢索的需要而創(chuàng)造的專門供信息標引和信息檢索使用的一種人工語言。信息檢索語言是信息標引者和檢索者信息交流與溝通的橋梁??梢允闺s亂無章的信息有序化,使相同學科門類或主題內(nèi)容、同一著者或出處的信息聚集在一起,內(nèi)容相關(guān)的信息聯(lián)系起來,并使全部信息按其不同的特征排列成為適于檢索的系統(tǒng)。

信息檢索語言的概念與作用根據(jù)信息檢索的需要而創(chuàng)造的專門供信息19信息檢索語言的類型

外表特征檢索語言:題(篇)名、作者姓名、信息出處、順序號等作為信息標引和檢索的依據(jù)而設(shè)計的檢索語言。

內(nèi)容特征檢索語言:分類語言(分類法)、主題語言(主題詞表)兩大類。

信息檢索語言的類型外表特征檢索語言:題(篇)名、作者姓名、20分類法將信息根據(jù)其所屬的學科內(nèi)容分門別類地系統(tǒng)化組織起來。體系分類法(列舉式分類法)和組配分類法(分面分類法)兩種。其中,應用最多的是體系分類法?!吨袊鴪D書館圖書分類法》《中國圖書資料分類法》《杜威十進分類法》《國際十進分類法》《冒號分類法》分類法將信息根據(jù)其所屬的學科內(nèi)容分門別類地系統(tǒng)化組織起來。21中國圖書館圖書分類法R類示例R1預防醫(yī)學、衛(wèi)生學2中國醫(yī)學3基礎(chǔ)醫(yī)學R61外科手術(shù)學4臨床醫(yī)學62整形外科學R651頭部及神經(jīng)外科學5內(nèi)科學63外科感染653頸部外科學6外科學64創(chuàng)傷外科學654心臟血管和淋巴系外科學71婦產(chǎn)科學65外科學各論655胸部外科學72兒科學68骨科學656腹部外科學R658.1斷肢斷指再植手術(shù)73腫瘤學69泌尿科學658四肢外科學658.2上肢R醫(yī)藥衛(wèi)生74神經(jīng)病學與精神病學659其他外科學658.3下肢75皮膚病學與性病學76耳鼻咽喉科學77眼科學R91藥物基礎(chǔ)科學78口腔科學92藥典、藥方集(處方集)、藥物鑒定79外國民族醫(yī)學93生藥學R961藥物的性質(zhì)和作用8特種醫(yī)學94藥劑學962化學藥理學9藥學95藥事組織963生化藥理學96藥理學

964精神藥理學R965.1藥物篩選和實驗模型97藥品965實驗藥理學

965.2藥理的實驗方法與技術(shù)99毒物學966分子藥理學965.3藥物的安全試驗967免疫藥理學968遺傳藥理學969臨床藥理學中國圖書館圖書分類法R類示例22主題語言以語言文字為基礎(chǔ),借助于自然語言的形式,用于標引和檢索信息主題內(nèi)容的詞語標識系統(tǒng)。敘詞語言、關(guān)鍵詞語言和標題詞語言三種。其中,應用最多的是敘詞語言和關(guān)鍵詞語言。《MeSH表》《中國中醫(yī)藥學主題詞表》《漢語主題詞表》主題語言以語言文字為基礎(chǔ),借助于自然語言的形式,用于標引和檢23MeSH(MedicalSubjectHeadings)美國國立醫(yī)學圖書館編制,世界上最具代表性和使用最廣泛的一種主題詞(敘詞)表。專門用于醫(yī)學信息的標引和檢索。中文譯本:《醫(yī)學主題詞表》MeSH(MedicalSubjectHeadings24MeSH表的結(jié)構(gòu)

字順表、樹狀結(jié)構(gòu)表(范疇表)、副主題詞表。字順表:是MeSH的核心,將主題詞(2.4萬)、非主題詞(入口詞/款目詞9.7萬)、副主題詞(83個)全部按字母順序排列,附以注釋和參照。MeSH表的結(jié)構(gòu)字順表、樹狀結(jié)構(gòu)表(范疇表)、副主題詞表。25樹狀結(jié)構(gòu)表(TreeStructures)

是一種分類表,將字順表中的主題詞和類目詞按照每個詞的詞義范疇及學科屬性,分別歸入16個大類。每個大類又根據(jù)從總到分、從一般到具體的原則分為若干一級類、二級類……,最多分至九級。樹狀結(jié)構(gòu)表(TreeStructures)是一種分類表,26樹狀結(jié)構(gòu)表大類

1.Anatomy[A]2.Organisms[B]3.Diseases[C]4.ChemicalsandDrugs[D]5.Analytical,DiagnosticandTherapeuticTechniquesandEquipment[E]6.PsychiatryandPsychology[F]7.BiologicalSciences[G]8.NaturalSciences[H]9.Anthropology,Education,SociologyandSocialPhenomena[I]10.Technology,Industry,Agriculture[J]11.Humanities[K]12.InformationScience[L]13.NamedGroups[M]14.HealthCare[N]15.PublicationCharacteristics[V]16.Geographicals[Z]樹狀結(jié)構(gòu)表大類1.Anatomy[A]27樹狀結(jié)構(gòu)表舉例DigestiveSystemDiseasesLiverDiseasesHepatitis

Hepatitis,Chronic

Hepatitis,AutoimmuneHepatitisB,ChronicHepatitisC,ChronicHepatitis,Chronic,Drug-InducedHepatitisD,Chronic樹狀結(jié)構(gòu)表舉例DigestiveSystemDiseas28副主題詞表作用:與主題詞合用,限定主題的不同研究方面,使檢索更具專指性。共有83個副主題詞。包括疾病的病因、診斷、治療、預后、遺傳學、免疫學、流行病學等;藥物的副作用、毒性、化學與生物合成、藥理學、藥代動力學、拮抗劑和抑制劑等;人體各器官和部位的生理學、細胞學、異常等。副主題詞表作用:與主題詞合用,限定主題的不同研究方面,使檢29關(guān)鍵詞語言

關(guān)鍵詞是指出現(xiàn)在信息的題名、文摘或全文中具有檢索意義,并能表達信息實質(zhì)內(nèi)容的名詞和術(shù)語。為適應計算機自動編制索引的需要而產(chǎn)生的一種檢索語言。一篇文獻的篇名:“癌基因在肝癌中表達的研究進展”,其中“癌基因”、“肝癌”、“表達”具檢索意義,是關(guān)鍵詞。關(guān)鍵詞語言關(guān)鍵詞是指出現(xiàn)在信息的題名、文摘或全文中具有檢索30第四節(jié)

信息檢索途徑

第四節(jié)

信息檢索途徑31信息檢索途徑的類型檢索途徑與檢索語言是信息檢索中密不可分的兩個方面。檢索語言是信息的標引者和檢索者都必須遵守的規(guī)則。兩大類:①從信息的外表特征進行檢索;②從信息的內(nèi)容特征進行檢索。信息檢索途徑的類型檢索途徑與檢索語言是信息檢索中密不可分的兩32外表特征檢索途徑題名途徑:通過書名、刊名、篇名查找信息的途徑著者途徑:通過文獻的責任者檢索的途徑。序號途徑:通過文獻的順序編號檢索信息的途徑。專利號、技術(shù)標準號化學文摘號、科技報告號

外表特征檢索途徑題名途徑:通過書名、刊名、篇名查找信息的途33內(nèi)容特征檢索途徑

分類途徑主題詞途徑關(guān)鍵詞途徑其他途徑:分子式索引、屬類索引生物系統(tǒng)索引

內(nèi)容特征檢索途徑分類途徑34第五節(jié)

計算機信息檢索

第五節(jié)

計算機信息檢索35計算機信息檢索的含義與方式含義:利用電子計算機對數(shù)據(jù)高速處理的能力來存貯數(shù)據(jù),建立數(shù)據(jù)庫,并從中查找所需數(shù)據(jù)的過程。方式:光盤檢索(單機和局域網(wǎng))因特網(wǎng)檢索:檢索因特網(wǎng)上的數(shù)據(jù)庫計算機信息檢索的含義與方式含義:利用電子計算機對數(shù)據(jù)高速處理36數(shù)據(jù)庫的定義及結(jié)構(gòu)定義:至少由一個文檔構(gòu)成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。結(jié)構(gòu):文檔:記錄的集合

記錄:數(shù)據(jù)庫的基本單元

字段:組成記錄的數(shù)據(jù)項數(shù)據(jù)庫的定義及結(jié)構(gòu)定義:至少由一個文檔構(gòu)成,并能滿足某一特定37數(shù)據(jù)庫的類型

書目數(shù)據(jù)庫:又稱題錄文摘數(shù)據(jù)庫,存貯文獻的題錄、文摘全文數(shù)據(jù)庫:存貯和查找原始文獻的全文數(shù)值型數(shù)據(jù)庫:包括各種統(tǒng)計數(shù)據(jù)、實驗數(shù)據(jù)、科學測量數(shù)據(jù)等事實型數(shù)據(jù)庫:知識、經(jīng)驗、規(guī)則等事實的集合數(shù)據(jù)庫的類型書目數(shù)據(jù)庫:又稱題錄文摘數(shù)據(jù)庫,存貯文獻的題錄38檢索運算符及其種類指計算機檢索系統(tǒng)規(guī)定的供編制檢索式和進行組配檢索使用的詞或符號。種類:邏輯運算符、優(yōu)先運算符、位置運算符、截詞符、限定符、時間范圍運算符檢索運算符及其種類指計算機檢索系統(tǒng)規(guī)定的供編制檢索式和進行組39邏輯運算符及其作用OR或+:擴大檢索范圍,提高查全率AND或*:縮小檢索范圍,提高查準率NOT或-:也用于縮小檢索范圍邏輯運算符及其作用OR或+:擴大檢索范圍,提高查全率40運算次序及優(yōu)先運算符

一個檢索式中若含有兩個或兩個以上的邏輯運算符,計算機則按照NOT>AND>OR的次序運算,即先算NOT,再算AND,最后算OR。如果要改變這種次序,一般是用圓括號把需要最先運算的部分括起來,如:ANOT(BAND(CORD))?!埃ǎ狈Q為優(yōu)先運算符。一個檢索式中有多重圓括號時,優(yōu)先順序由內(nèi)而外進行。運算次序及優(yōu)先運算符一個檢索式中若含有兩個或兩個以上的邏輯41位置運算符

又稱鄰近運算符,用于表達檢索詞之間的鄰近關(guān)系,縮小檢索范圍,提高查準率。許多檢索系統(tǒng)采用的位置運算符不同,使用時應分別對待。MEDLINE數(shù)據(jù)庫中的位置運算符有“NEAR”和“WITH”。如“ANEARB”表示A和B在同一句子中出現(xiàn);“AWITHB”,表示A和B在同一字段中出現(xiàn)。位置運算符又稱鄰近運算符,用于表達檢索詞之間的鄰近關(guān)系,縮42截詞符

截詞是指檢索時把檢索詞截斷,只取其中一部分進行檢索。截詞檢索是一種擴大檢索范圍的措施,可解決檢索詞的單復數(shù)、英美單詞不同拼法和詞干相同而詞尾不同等問題。截詞方式包括右截斷、左截斷和中間截斷。常用的截詞符有“*”、“?”、“#”和“$”。各種檢索系統(tǒng)的截詞符有所不同。截詞符截詞是指檢索時把檢索詞截斷,只取其中一部分進行檢索。43限定符

用于字段檢索(將檢索限定在某個字段中進行)和短語檢索。字段檢索常用的限定符是in和=。如dementiainTI;LA=English短語檢索常用的限定符有雙引號或圓括號。如“genetherapy”;(livercacinoma)限定符用于字段檢索(將檢索限定在某個字段中進行)和短語檢索44時間范圍運算符

用于限定信息發(fā)表的時間范圍。常用的有:=、>、<、≥、≤如,PY=2001;PY>2001

時間范圍運算符用于限定信息發(fā)表的時間范圍。45檢索步驟明確檢索需求及檢索目標

制定檢索策略

選擇數(shù)據(jù)庫

分析課題,確定檢索詞,編制檢索式

進行初步檢索,修改檢索策略

輸出和分析檢索結(jié)果

檢索步驟明確檢索需求及檢索目標46制定檢索策略

制定檢索策略就是對檢索的全面策劃,主要指數(shù)據(jù)庫的選擇和檢索式的編制。檢索式,又稱檢索表達式或檢索提問式,是檢索人員用檢索詞和檢索運算符編制而成的供計算機進行檢索運算的式子。選擇數(shù)據(jù)庫取決于現(xiàn)有的數(shù)據(jù)庫資源,編制檢索式則反映檢索目標。在實際操作過程中,檢索策略往往側(cè)重檢索式的制定。制定檢索策略制定檢索策略就是對檢索的全面策劃,主要指數(shù)據(jù)庫47第六節(jié)

檢索結(jié)果的鑒別與整理

第六節(jié)

檢索結(jié)果的鑒別與整理48檢索結(jié)果的鑒別對檢索結(jié)果進行質(zhì)量鑒別,去粗求精,去偽存真,進而進行充分利用。鑒別信息的質(zhì)量主要從信息的可靠性、先進性和適用性3個方面進行判斷。檢索結(jié)果的鑒別對檢索結(jié)果進行質(zhì)量鑒別,去粗求精,去偽存真,49檢索結(jié)果的整理檢索結(jié)果的整理就是用科學的方法將收集到的雜亂無序的信息進行加工處理,使之有序化,以便存貯和及時提供使用。它包括手工整理和計算機管理兩種類型。檢索結(jié)果的整理檢索結(jié)果的整理就是用科學的方法將收集到的雜亂50第七節(jié)

檢索效果的評價

第七節(jié)

檢索效果的評價51評價標準

對信息檢索的效果評價主要從質(zhì)量、費用和時間三方面來衡量。質(zhì)量標準主要通過查全率與查準率進行評價。費用標準即檢索費用,是指用戶為檢索課題所投入的費用。時間標準是指花費時間,包括檢索準備時間、檢索過程時間、獲取文獻時間等。查全率和查準率是判定檢索效果的主要標準。評價標準對信息檢索的效果評價主要從質(zhì)量、費用和時間三方面來52查全率(Recall)

又稱召回率,是指檢索出的相關(guān)文獻量占檢索系統(tǒng)中所有相關(guān)文獻總量的百分比,用來反映檢索的全面性,或反映系統(tǒng)文獻庫中實有的相關(guān)文獻量在多大程度上被檢索出來。公式表示如下:R=a/(a+c)ⅹ100%

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論