計算機信息檢索講座課件_第1頁
計算機信息檢索講座課件_第2頁
計算機信息檢索講座課件_第3頁
計算機信息檢索講座課件_第4頁
計算機信息檢索講座課件_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、計算機信息檢索與利用葉青醫(yī)學信息檢索與利用教研室2013.11.8主要內(nèi)容一. 計算機信息檢索基礎 二. 廣西醫(yī)科大學圖書館的數(shù)字資源介紹二. Pubmed簡介四. 國際聯(lián)機檢索系統(tǒng)Dialog簡介一. 計算機信息檢索基礎 計算機信息檢索計算機信息檢索指利用計算機及相關軟件和通信設施,對本地計算機、遠程服務器及網(wǎng)上信息進行檢索的過程或活動。 隨著信息技術(shù)的快速發(fā)展及對各種文獻信息的數(shù)字化處理,計算機文獻信息檢索已經(jīng)成為文獻信息檢索的主要手段。 計算機檢索的一般程序 (1)分析檢索課題,明確檢索要求 (2)選擇適當檢索系統(tǒng)(數(shù)據(jù)庫) (3)確定檢索途徑及檢索詞 (4)構(gòu)建檢索提問式 (5)上機檢

2、索并調(diào)整檢索策略 (6)輸出檢索結(jié)果2.1 分析檢索課題,明確檢索要求主題分析主題概念分析是課題檢索的重點和難點)明確檢索需求及檢索目標(1)檢索信息的學科范圍(2)檢索信息的類型(3)檢索的目的2.2 選擇檢索系統(tǒng)(數(shù)據(jù)庫等)(1)根據(jù)檢索目的確定所需數(shù)據(jù)庫的類型(2)根據(jù)信息需求的內(nèi)容、專業(yè)范圍選擇數(shù)據(jù)庫(3)根據(jù)記錄來源選擇數(shù)據(jù)庫(4)根據(jù)熟悉程度選擇數(shù)據(jù)庫2.3 確定檢索途徑、制訂檢索式確定檢索途徑制訂檢索式(確定檢索詞、編制檢索式 ) 應首先從相應的主題詞表中選擇所需的檢索詞,以便獲得最佳檢索效果 沒有確切表達課題內(nèi)容的主題詞時,可采用自由詞檢索。 以課題核心概念為主,排除無關概念,

3、把重復概念進行歸并,簡化檢索式,提高檢索效果。 3計算機檢索基本技術(shù) 31 布爾邏輯檢索技術(shù) 布爾檢索技術(shù)是指利用布爾運算符連接各個檢索詞,然后由計算機進行相應邏輯運算,以檢索出所需信息的方法。常用算符及含義: AND (*)表示由該符號連接的檢索式的運算結(jié)果為邏輯”與”。 OR (+)表示由該符號連接的檢索式的運算結(jié)果為邏輯”或”。 NOT (-)表示由該符號連接的檢索式的運算結(jié)果為邏輯”非”。布爾邏輯檢索技術(shù)AND (*) 連接不相容的主題概念(或不同字段) 檢索結(jié)果同時出現(xiàn)連接的詞 限定 縮小范圍 提高準確率OR (+) 連接同義詞 同族詞 相關詞 檢索結(jié)果至少含有其中一詞或同時有 擴大

4、檢索范圍 提高查全NOT (-) 縮小檢索范圍,起到減少文獻輸出量布爾邏輯檢索技術(shù) 優(yōu)先處理算符“( )”邏輯算符OR和AND的使用方法,如果歸納成一個模式,比如有 A、B、C、D四個檢索詞(其中A和B,C和D分別為同義概念),檢索提問式為: (A OR B)AND (C OR D) 即,同一組檢索提問既含有OR算符,又含有AND算符,此時須使用優(yōu)先處理算符 “( )”,將OR算符前后的詞放入括號中,計算機將優(yōu)先運算括號內(nèi)的算符。邏輯運算符的應用例:為檢索課題”固氮和固炭的生化機理或基因機制”編制檢索策略.固氮* 固炭* ( 生化+ 生物化學 + 基因)33位置檢索 位置檢索可要求檢索詞以用戶

5、所規(guī)定的相對位置出現(xiàn)。比如:以詞組形式表達的概念;彼此相鄰的兩個或兩個以上的詞;被禁用詞或特殊符號分隔的詞以及化學分子式等。位置算符是調(diào)整檢索策略的一種重要手段。 位置算符與AND 常用的位置算符及含義: (W)算符(WITH) 表示兩個檢索詞緊密相連,詞序不能顛倒, 中間不得插入其他詞、字母或代碼,但允許有空格或標點符號,也可用()表示。 例:COMMUNICATION(W)SATELLITE 位置檢索COMMUNICATION AND SATELLITE 結(jié)果:communication satellite ,satellite communication ,communication d

6、evices for satellite ;communication links without satellite (n W)算符(n WORD) 表示兩個檢索詞中間可插入n個詞,但它們之間的順序不可顛倒。位置檢索技術(shù) (N)算符(NEAR) 表示兩個檢索詞必須相連,不得插入其他詞,但詞序可以顛倒。 (n N)算符(n NEAR) 表示兩個檢索詞中間可以插入n個詞,且詞序可以顛倒。 位置檢索技術(shù)如:internet(N)accessing命中記錄中出現(xiàn)的匹配詞可能有:internet accessing, accessing internet。如:internet(1N)accessing

7、命中記錄中除上例的外,還會可能有:accessing internet, accessing the internet, internet /intranet accessing等。位置檢索 (S)算符(SUBFIELD) 表示兩個檢索詞必須出現(xiàn)在同一個子句子中,但兩詞的詞序和插入的詞數(shù)不限。句子位置算符 (F)算符(FIELD)表示兩個檢索詞必須同時出現(xiàn)在同一個字段內(nèi),但兩詞的詞序和中間插入的詞數(shù)不限。字段位置算符 例:air(w)pollution (F)control位置檢索 (C)算符(CITATION)表示兩個檢索詞必須出現(xiàn)在同一記錄中,但兩詞的詞序和所在的字段不限。 (L)算符(L

8、INK)表示兩個檢索詞之間存在從屬關系或限制關系,如果其中一個為一級主題詞,另一個就為二級主題詞。 3加權(quán)檢索 加權(quán)檢索是在檢索提問式中,根據(jù)每個提問詞在檢索要求中的重要程度,分別給予一定的加權(quán)數(shù)值加以區(qū)別,我們稱這個數(shù)值為權(quán)數(shù)。同時再給出檢索命中的閾值。當檢索結(jié)果達到所設定的閾值時,系統(tǒng)將顯示為命中記錄。 采用加權(quán)檢索的目的在于提高檢索結(jié)果的準確程度。 34限制檢索技術(shù) 所謂限制檢索是通過限制檢索范圍,達到優(yōu)化檢索結(jié)果的方法。 具體形式主要有: (1)字段限制檢索 (2)使用符號限制 (3)進行范圍限制 (4)采用限制指令 限制檢索技術(shù) 輔助字段限制輔助字段運算符的用法是在需要指定字段的檢索

9、詞(有時檢索詞須放在雙引號內(nèi))之前加上段碼和前綴運算符“=”。例如檢索策略AU=“Robert, S.”的含義是在作者字段中查找含有“Robert, S.”的所有記錄。 下面是其他常用的輔助字段限制及其實例: 指定著者單位字段 CS=SHANGHAI UNIVERSITY 指定刊物名稱字段 JN=APPLIED MATHEMATICS 指定語言字段 LA=ENGLISH 指定文獻類型字段 DT=JOURNAL4.檢索式的調(diào)整 檢索表達式輸入檢索系統(tǒng)后,輸出的檢索結(jié)果有時不一定能滿足課題的要求,或者檢出的篇數(shù)過多,而且不相關文獻所占比例很大,或者檢出的文獻數(shù)量太少,有時甚至為零,這時就需要調(diào)整檢

10、索策略。4.1 檢索結(jié)果過多 調(diào)整檢索策略之前,首先要分析造成結(jié)果不理想的原因。對于輸出篇數(shù)過多的情況,應分析是否可能是如下原因造成: a .選用了多義性的檢索詞; b .截詞截得過短; c. 輸入的檢索詞太少; d. 應該使用“與(AND)”的使用了“或(OR)”; e.優(yōu)先運算符“()”使用錯誤。4.2 檢索結(jié)果過少 對于輸出篇數(shù)過少的情況,應分析是否方式如下原因造成: a. 檢索詞拼寫錯誤; b. 遺漏重要的同義詞或隱含概念; c. 檢索詞過于冷僻具體; d. 沒有使用截詞算符; e. 位置算符和字段算符使用的過多; f. 使用過多的“AND”算符。擴大檢索范圍的方法針對上述原因,如果是

11、屬于需要擴大檢索范圍,提高檢索結(jié)果查全率的,調(diào)整策略的方法有: a. 減少“與(AND)”算符,增加同義詞或同族相關詞用邏輯或(OR)將它們連接起來; b. 在詞干相同的單詞后使用截詞符(?或*); c. 去除已有的字段限制、位置算符限制(或者改用限制程度較小的位置算符)。4.3 檢索策略的選擇推薦的檢索策略 檢索前研究你的主題. 變化你所知道的檢索策略. 除非找到目標或?qū)W到新東西,否則不要局限在一種檢索方法中。不推薦的檢索策略瀏覽主題目錄 在大型數(shù)據(jù)庫中使用簡單關鍵字跟隨鏈接去那些大眾口味或商業(yè)利益所推崇的網(wǎng)站4.4檢索式的構(gòu)造方法聚類組合法在課題分析,構(gòu)造檢索提問式時,可以采用“聚類組合法

12、”。實施如下七項操作:切分:對課題語句進行切分,以詞為單位劃分句子或詞組; 刪除:對不宜做檢索詞的詞進行刪除;替換:用更具體、明確的詞替換掉某些表達欠佳詞; 聚類:將彼此“非常相關的詞”歸于一組補充:對縮略詞組進行還原作為補充; 增加:通過邏輯“與”或“非”增加限義詞來避免由于檢索詞一詞多義造成的誤檢問題;組合:最后組合成合乎需要的檢索式.刪除 排除檢索意義不大而且比較泛指的概念 如: 展望、發(fā)展趨勢、現(xiàn)狀、近況、生產(chǎn)工藝、應用、利用、作用、方法、影響、制備、結(jié)果刪除過分具體的限定詞:干洗劑的近況 、生產(chǎn)工藝 配方極其應用 刪除存在蘊含關系的可合并詞例:內(nèi)彈道高溫高壓高密度氣體狀態(tài)方程 排除重

13、復無關的概念項目“河豚毒素的液相色譜分析”從項目名稱上看,其主要概念為“河豚毒素”、“液相色譜”和“分析”,但由于液相色譜本身就是一種分析方法,它隱含了“分析”這一概念主要概念: 河豚毒素、液相色譜檢索式:河豚毒素 and 液相色譜檢索詞之間存在部分與整體關系例:檢索“歐洲能源”方面的文獻 按照“歐洲”;同時包括許多國家。英國 法 德意 5.提高查全率的主要方法(1) 準確把握檢索對象及目的,選擇合適的數(shù)據(jù)庫。(2) 降低檢索詞或分類號的專指度。(3) 更多地采用學科分類途徑來擴大檢索范圍。(4) 減少邏輯“與”及邏輯“非”的使用。(5) 增加邏輯“或”及截詞檢索技術(shù)的使用。(6) 采用“全文

14、檢索”。(7) 不限定檢索對象的文獻類型、時間段、文種等。 6.提高查準率的主要方法(1) 準確把握檢索對象及目的,選擇合適的數(shù)據(jù)庫。(2) 提高檢索詞或分類號的專指度。(3) 更多地采用專用名詞及特性檢索的途徑。(4) 選擇邏輯“與”及邏輯“非”的使用。(5) 減少或不采用邏輯“或”及截詞檢索技術(shù)的使用。(6) 限定檢索詞出現(xiàn)的字段及在段落、文句中的位置。(7) 不選“全文檢索”.(8) 限定檢索對象的文獻類型、時間段、文種及其它特征。二.廣西醫(yī)科大學圖書館信息資源紙質(zhì)圖書120多萬冊(圖書32萬余種)電子圖書近120萬冊 中、外文期刊4000多種(現(xiàn)刊1729種)數(shù)據(jù)庫29個圖書館中文數(shù)據(jù)

15、庫1.中國生物醫(yī)學文獻數(shù)據(jù)庫(CBM)2.維普中文科技期刊數(shù)據(jù)庫 (VIP)3. CNKI數(shù)據(jù)庫4.萬方數(shù)據(jù)庫圖書館外文數(shù)據(jù)庫Web of Science MICROMEDEX數(shù)據(jù)庫(綜述型事實數(shù)據(jù)庫) 循證醫(yī)學評價數(shù)據(jù)庫(EBMR) PML數(shù)據(jù)庫 Springer Link Ovid EBSCO MD Consult 數(shù)據(jù)庫 Biosos Preview數(shù)據(jù)庫 康健臨床決策循證數(shù)據(jù)庫 圖書館電子圖書庫1.書生之家 2.中國數(shù)字圖書館3.匯雅電子圖書 多媒體資源1.起點考試網(wǎng) 2.外研社外語資源庫 3.金圖高校英語資源數(shù)據(jù)庫 4.愛迪科森網(wǎng)上報告廳 5.職業(yè)全能培訓庫 6.計算機技能自助式網(wǎng)絡視頻庫7.新東方英語四六級網(wǎng)考平臺三.Pubmed簡介網(wǎng)址:/pubmed美國國立醫(yī)學圖書館向因特網(wǎng)用戶提供免費MEDLINE檢索收錄70余個國家5000多種生物醫(yī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論