計算機(jī)檢索策略_第1頁
計算機(jī)檢索策略_第2頁
計算機(jī)檢索策略_第3頁
計算機(jī)檢索策略_第4頁
計算機(jī)檢索策略_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 計算機(jī)檢索策略計算機(jī)檢索策略 一、計算機(jī)檢索概述一、計算機(jī)檢索概述 1. 1. 計算機(jī)檢索定義計算機(jī)檢索定義 2. 2. 計算機(jī)檢索系統(tǒng)的構(gòu)成計算機(jī)檢索系統(tǒng)的構(gòu)成 3. 3. 計算機(jī)信息檢索的分類計算機(jī)信息檢索的分類1.1.計算機(jī)檢索定義計算機(jī)檢索定義 (1)計算機(jī)檢索定義計算機(jī)檢索定義 計算機(jī)信息檢索就是在計算機(jī)和人的共同作計算機(jī)信息檢索就是在計算機(jī)和人的共同作用下,按照一定的方法組織和存儲信息,并通過用下,按照一定的方法組織和存儲信息,并通過人人- -機(jī)對話從計算機(jī)存儲的大量數(shù)據(jù)中自動輸出用機(jī)對話從計算機(jī)存儲的大量數(shù)據(jù)中自動輸出用戶所需的那部分信息的過程。戶所需的那部分信息的過程。 (2

2、)(2)計算機(jī)信息檢索過程計算機(jī)信息檢索過程 信息存儲過程信息存儲過程 信息檢索過程信息檢索過程(3)(3)計算機(jī)信息檢索的本質(zhì)計算機(jī)信息檢索的本質(zhì) 是信息用戶的提問標(biāo)識和信息集合數(shù)據(jù)庫特是信息用戶的提問標(biāo)識和信息集合數(shù)據(jù)庫特征標(biāo)識匹配的過程。征標(biāo)識匹配的過程。 檢索提問字符串檢索提問字符串 匹配匹配 數(shù)據(jù)庫中特征標(biāo)識字符串?dāng)?shù)據(jù)庫中特征標(biāo)識字符串(4)(4)計算機(jī)檢索的特點計算機(jī)檢索的特點 檢索速度快;檢索功能強(qiáng);檢索速度快;檢索功能強(qiáng); 檢索途徑多;檢索范圍廣;檢索途徑多;檢索范圍廣; 資源能共享;能直接輸出。資源能共享;能直接輸出。 2. 2. 計算機(jī)檢索系統(tǒng)的構(gòu)成計算機(jī)檢索系統(tǒng)的構(gòu)成 (

3、1)(1)計算機(jī)計算機(jī) (2)(2)通信網(wǎng)絡(luò)通信網(wǎng)絡(luò) (3)(3)數(shù)據(jù)庫數(shù)據(jù)庫 數(shù)據(jù)庫就是在計算機(jī)存儲設(shè)備上按一定數(shù)據(jù)庫就是在計算機(jī)存儲設(shè)備上按一定方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。是檢索方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。是檢索系統(tǒng)的信息源,也是用戶檢索的對象。系統(tǒng)的信息源,也是用戶檢索的對象。 數(shù)據(jù)庫的基本類型數(shù)據(jù)庫的基本類型書目數(shù)據(jù)庫書目數(shù)據(jù)庫:是機(jī)讀的目錄、索引和文摘檢索工具檢索是機(jī)讀的目錄、索引和文摘檢索工具檢索結(jié)果是文獻(xiàn)的線索而非原文。如許多圖書館提供的基于網(wǎng)結(jié)果是文獻(xiàn)的線索而非原文。如許多圖書館提供的基于網(wǎng)絡(luò)的聯(lián)機(jī)公共檢索目錄絡(luò)的聯(lián)機(jī)公共檢索目錄OPACOPAC系統(tǒng)。系統(tǒng)。全文數(shù)據(jù)庫全文數(shù)

4、據(jù)庫 :是存儲文獻(xiàn)全文或其中主要部分的數(shù)據(jù)是存儲文獻(xiàn)全文或其中主要部分的數(shù)據(jù)庫,有的是印刷版的電子(網(wǎng)絡(luò))版,有的則是純電子出庫,有的是印刷版的電子(網(wǎng)絡(luò))版,有的則是純電子出版物。版物。 例如:例如:中國期刊網(wǎng)中國期刊網(wǎng)、ElsevierElsevier數(shù)據(jù)庫數(shù)據(jù)庫等等。等等。事實數(shù)據(jù)庫:事實數(shù)據(jù)庫:指包含大量數(shù)據(jù)、事實,直接提供原始資指包含大量數(shù)據(jù)、事實,直接提供原始資料的數(shù)據(jù)庫。又可分為數(shù)值數(shù)據(jù)庫、指南數(shù)據(jù)庫、術(shù)語數(shù)料的數(shù)據(jù)庫。又可分為數(shù)值數(shù)據(jù)庫、指南數(shù)據(jù)庫、術(shù)語數(shù)據(jù)庫等。例如美國醫(yī)生數(shù)據(jù)咨詢庫據(jù)庫等。例如美國醫(yī)生數(shù)據(jù)咨詢庫PDQPDQ(Physician Data Physician

5、Data QueryQuery)。)。多媒體數(shù)據(jù)庫:多媒體數(shù)據(jù)庫:是存儲聲音、圖象和文字等多種信息是存儲聲音、圖象和文字等多種信息的數(shù)據(jù)庫。如各種多媒體學(xué)習(xí)學(xué)習(xí)資料。的數(shù)據(jù)庫。如各種多媒體學(xué)習(xí)學(xué)習(xí)資料。 如如知識世知識世界界。數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫結(jié)構(gòu)( (以書目數(shù)據(jù)庫為例以書目數(shù)據(jù)庫為例) )$ 由文檔記錄字段組成由文檔記錄字段組成$文檔(文檔(filefile):):$ 數(shù)據(jù)庫中一部分記錄的有序集合數(shù)據(jù)庫中一部分記錄的有序集合$記錄(記錄(recordrecord):):$ 數(shù)據(jù)庫的信息單元,每條記錄描述了一數(shù)據(jù)庫的信息單元,每條記錄描述了一 個原始信息的外部特征和內(nèi)部特征。個原始信息的外部特征

6、和內(nèi)部特征。$字段(字段(fieldfield):):$ 比記錄更小的單位,是組成記錄的數(shù)據(jù)比記錄更小的單位,是組成記錄的數(shù)據(jù)項目項目3.3.計算機(jī)信息檢索的分類計算機(jī)信息檢索的分類根據(jù)檢索方式分:根據(jù)檢索方式分: (1)(1)脫機(jī)檢索脫機(jī)檢索(1954-1964)(1954-1964) (2) (2)聯(lián)機(jī)檢索聯(lián)機(jī)檢索(1965-1972)(1965-1972) (3) (3)國際聯(lián)機(jī)檢索國際聯(lián)機(jī)檢索(1972-1994)(1972-1994) (4) (4)光盤檢索光盤檢索 (5)(5)網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索(1995-(1995-今今) ) 世界上最著名的國際聯(lián)機(jī)檢索系統(tǒng)世界上最著名的國際聯(lián)機(jī)檢

7、索系統(tǒng)DIALOG:有900多個數(shù)據(jù)庫,其中廣泛使用的有600多個,內(nèi)容涉及多個學(xué)科領(lǐng)域,文獻(xiàn)存儲量超過3億篇。OCLC:聯(lián)機(jī)計算機(jī)圖書館中心,是世界上最大的為讀者提供文獻(xiàn)信息機(jī)構(gòu)。有60個數(shù)據(jù)庫,提供會議錄、工業(yè)通告、圖書評論等信息。CNKI:中國知識基礎(chǔ)設(shè)施工程 二、計算機(jī)檢索技術(shù)二、計算機(jī)檢索技術(shù) 1.1.布爾邏輯檢索功能布爾邏輯檢索功能 2.2.位置檢索功能位置檢索功能 3.3.截詞檢索功能截詞檢索功能 4.4.字段限定檢索功能字段限定檢索功能 1. 1.布爾邏輯檢索功能布爾邏輯檢索功能 所謂布爾邏輯檢索,指用布爾邏輯算符來組所謂布爾邏輯檢索,指用布爾邏輯算符來組配檢索詞以確定文獻(xiàn)的命

8、中與否。布爾邏輯式的配檢索詞以確定文獻(xiàn)的命中與否。布爾邏輯式的原理與檢索方法取自于布爾代數(shù)與集合運算。其原理與檢索方法取自于布爾代數(shù)與集合運算。其算符的相互匹配方式基本有算符的相互匹配方式基本有4 4種。種。 邏輯與(邏輯乘)邏輯與(邏輯乘) 邏輯或邏輯或 邏輯非邏輯非 邏輯異或邏輯異或 A AND B A B(1)(1)邏輯與邏輯與( (邏輯乘邏輯乘) ) 運算符號運算符號“and“and“或或”* *”作為連接詞,是一作為連接詞,是一種用于交叉概念或限定關(guān)系的組配,它可以縮小種用于交叉概念或限定關(guān)系的組配,它可以縮小檢索范圍,有利于提高檢索的專指性。檢索范圍,有利于提高檢索的專指性。 上圖

9、檢出上圖檢出同時含有同時含有“A”A”和和“B”B”文獻(xiàn)。文獻(xiàn)。 例:例:“有關(guān)計算機(jī)在圖書館工作中應(yīng)用有關(guān)計算機(jī)在圖書館工作中應(yīng)用”的文的文獻(xiàn)獻(xiàn) 檢索式檢索式= =計算機(jī)計算機(jī)* *圖書館圖書館例: 腸炎與腸病毒關(guān)系的文獻(xiàn)。腸炎與腸病毒關(guān)系的文獻(xiàn)。 檢索式檢索式= = 腸炎腸炎 * * 腸病毒腸病毒 生物學(xué)中的計算機(jī)圖象處理。生物學(xué)中的計算機(jī)圖象處理。 檢索式檢索式= = 生物學(xué)生物學(xué) * * 計算機(jī)計算機(jī) * * 圖象處理圖象處理(2)(2)邏輯或邏輯或 運算符號運算符號“or”or”或或”+”+”作為連接詞,是一種作為連接詞,是一種用于具有并列概念關(guān)系的組配。這種組配可以擴(kuò)用于具有并列概

10、念關(guān)系的組配。這種組配可以擴(kuò)大檢索范圍,提高查全率。檢索出既含有大檢索范圍,提高查全率。檢索出既含有“A”A”又又有有“B”B” 例:例:查查“計算機(jī)或機(jī)器人計算機(jī)或機(jī)器人”方面的文獻(xiàn)方面的文獻(xiàn) 。 檢索式檢索式= =計算機(jī)計算機(jī) + + 機(jī)器人機(jī)器人 A B檢索式檢索式= =流行性感冒流行性感冒+ +咳嗽咳嗽查查“流行性感冒或者咳嗽流行性感冒或者咳嗽”方面的文獻(xiàn)方面的文獻(xiàn) 再如要查有關(guān)計算機(jī)方面的文獻(xiàn),為了擴(kuò)大檢再如要查有關(guān)計算機(jī)方面的文獻(xiàn),為了擴(kuò)大檢索面可以用檢索式:索面可以用檢索式:“微機(jī)微機(jī) + + 電腦電腦 + PC+ PC機(jī)機(jī)”、 “微機(jī)微機(jī) or or 電腦電腦 or PCor

11、PC機(jī)機(jī)”(3)(3)邏輯邏輯“非非” 用運算符號用運算符號“NOT”NOT”或或“”連接兩檢索詞,連接兩檢索詞,用于具有排除概念關(guān)系的組配。用于具有排除概念關(guān)系的組配。例:查例:查“玉米但不是甜玉米玉米但不是甜玉米”方面的文獻(xiàn)。方面的文獻(xiàn)。 檢索式檢索式= =玉米玉米甜玉米甜玉米 查找有關(guān)查找有關(guān)“關(guān)節(jié)炎關(guān)節(jié)炎”但不包括但不包括“類風(fēng)濕性關(guān)節(jié)類風(fēng)濕性關(guān)節(jié)炎炎”的文獻(xiàn)。的文獻(xiàn)。 檢索式檢索式= =關(guān)節(jié)炎關(guān)節(jié)炎類風(fēng)濕性關(guān)節(jié)炎類風(fēng)濕性關(guān)節(jié)炎 A B(4 4)“異或異或”關(guān)系關(guān)系 具有排除概念關(guān)系的組配,排除了具有排除概念關(guān)系的組配,排除了 A AND BA AND B的那部分,與的那部分,與A -

12、 B A - B 是有區(qū)別的是有區(qū)別的 。 (A OR B (A OR B )NOT NOT (A AND B A AND B )例例 A A= =水上運輸工具,水上運輸工具,B B= =陸上運輸工具陸上運輸工具 即即“水陸兩棲運輸工具水陸兩棲運輸工具”不能被命中。不能被命中。 A B運算順序運算順序 優(yōu)先級運算即檢索式中先后順序 ( ) NOT AND OR 如果一個提問式中含有多個邏輯算符,則它們的執(zhí)行順如果一個提問式中含有多個邏輯算符,則它們的執(zhí)行順序?qū)⑹切驅(qū)⑹荖OTNOT,ANDAND,OROR,需先執(zhí)行的部分可用括號標(biāo)出,需先執(zhí)行的部分可用括號標(biāo)出 如:如:A+BA+B* *C C

13、運算順序為運算順序為B B* *C C然后在然后在+A+A (A+B) (A+B)* *C C 運算順序為運算順序為A+BA+B然后再是然后再是* *C C例如:例例1 1:查找關(guān)于微波和毫米波雷達(dá)的信息:查找關(guān)于微波和毫米波雷達(dá)的信息 ( (微波微波+ +毫米波毫米波) )* *雷達(dá)雷達(dá)例例2 2: ( (心臟瓣膜病心臟瓣膜病 OR OR 心力衰竭心力衰竭) AND ) AND 手術(shù)并發(fā)癥手術(shù)并發(fā)癥布爾邏輯檢索特點:布爾邏輯檢索特點: 布爾邏輯檢索是把任何檢索課題加工成可以進(jìn)布爾邏輯檢索是把任何檢索課題加工成可以進(jìn)行邏輯運算的表達(dá)式,行邏輯運算的表達(dá)式, 這是計算機(jī)檢索的一種被這是計算機(jī)檢索

14、的一種被廣泛采用的匹配方式。布爾邏輯運算的優(yōu)點是簡單廣泛采用的匹配方式。布爾邏輯運算的優(yōu)點是簡單明確、易于理解、符合人們的思維習(xí)慣。明確、易于理解、符合人們的思維習(xí)慣。2.2.位置檢索功能位置檢索功能 位置檢索又稱鄰近檢索,是表示所連接的位置檢索又稱鄰近檢索,是表示所連接的各個檢索詞之間的位置關(guān)系的一種檢索技巧。各個檢索詞之間的位置關(guān)系的一種檢索技巧。位置檢索多用于西文的全文檢索。位置算符位置檢索多用于西文的全文檢索。位置算符一般只使用兩個:一般只使用兩個: with with 用用(W)(W)或或()()表示、表示、 nearnear用用(N)(N)表示表示 (W)(W)詞序不能顛倒,中間除

15、符號不能插詞詞序不能顛倒,中間除符號不能插詞 (nW(nW) )詞序不能顛倒,中間可插詞序不能顛倒,中間可插(0-N)(0-N)個詞個詞 (N)(N)詞序可顛倒,中間不能插詞詞序可顛倒,中間不能插詞 (nN(nN) )詞序可顛倒,中間可插詞序可顛倒,中間可插(0-N)(0-N)個詞個詞例1:CDCD(W W)ROMROM將命中將命中CDCDROMROM或或CDCDROM;ROM;如:如:high(W)classhigh(W)class命中的記錄中出現(xiàn)的匹配詞可能命中的記錄中出現(xiàn)的匹配詞可能有:有:high class high class 或或high-classhigh-class。例2:檢

16、索檢索“材料磨損材料磨損“(wear of materialswear of materials )方面的文獻(xiàn)。方面的文獻(xiàn)。檢索式:檢索式: wearwear(1W1W)materialsmaterials例3:cross(N)sectioncross(N)section(部分交叉部分交叉) 可以檢索出可以檢索出crosscrosssectionsection和和section cross(section cross(交交叉部分)叉部分)3.3.截詞檢索功能截詞檢索功能 所謂截詞,就是指在檢索詞的適當(dāng)位置截斷。所謂截詞,就是指在檢索詞的適當(dāng)位置截斷。用用“?、?、* *”表示表示 。 前截斷前

17、截斷(后方一致檢索)?(后方一致檢索)?ChemistryChemistry chemistrychemistry、biochemistrybiochemistry、 electrochemistry electrochemistry physicochemistryphysicochemistry 中間截斷中間截斷( (中間屏蔽中間屏蔽) ) “t“t?thth” ” ,“tooth”tooth”和和“teeth”teeth” 后截斷后截斷(前方一致檢索)(前方一致檢索) computcomput? ? 可查出可查出 compute compute , computer computer ,

18、 computingcomputing,computationcomputation,computerisationcomputerisation 4. 4. 字段限定檢索功能字段限定檢索功能 將檢索詞限定在某一字段中,檢索時,將檢索詞限定在某一字段中,檢索時,計算機(jī)只對限定字段進(jìn)行運算,以提高檢索計算機(jī)只對限定字段進(jìn)行運算,以提高檢索效果。效果。 關(guān)鍵詞:醫(yī)藥限定在關(guān)鍵詞:醫(yī)藥限定在健康報健康報(機(jī)構(gòu)報(機(jī)構(gòu)報刊名)關(guān)鍵詞醫(yī)藥刊名)關(guān)鍵詞醫(yī)藥andand機(jī)構(gòu)機(jī)構(gòu)健康報健康報作者常亞平作者常亞平andand機(jī)構(gòu)機(jī)構(gòu)武漢科技學(xué)院學(xué)報武漢科技學(xué)院學(xué)報 常有的字段:常有的字段: 篇(題)名字段篇(題

19、)名字段 TI=Title TI=Title 文摘字段文摘字段 AB=AbstractAB=Abstract 主題詞字段主題詞字段 DE=DescriptorDE=Descriptor 關(guān)鍵詞字段關(guān)鍵詞字段 ID=IdentifiedID=Identified 著者字段著者字段 AU=AuthorAU=Author 著者機(jī)構(gòu)字段著者機(jī)構(gòu)字段 CS=Corporate SourceCS=Corporate Source 刊名字段刊名字段 JN=Journal JN=Journal 出版年字段出版年字段 PY=publication YearPY=publication Year 文獻(xiàn)類型字段文獻(xiàn)

20、類型字段 DT=Document TypeDT=Document Type 語種字段語種字段 LA=LanguageLA=Language 分類號字段分類號字段 CC=Classification CC=Classification 計算機(jī)檢索技術(shù)綜合練習(xí)計算機(jī)檢索技術(shù)綜合練習(xí) (smoking+tobacco)*heart(w)disease三、計算機(jī)信息檢索步驟三、計算機(jī)信息檢索步驟 1.1.分析課題分析課題 2.2.制定檢索策略制定檢索策略 3.3.選擇檢索詞須注意的問題選擇檢索詞須注意的問題 4.4.檢索舉例檢索舉例 5.5.檢索技巧檢索技巧 1. 1.分析課題分析課題 對用戶提出的檢

21、索課題進(jìn)行全面的分析研究,對用戶提出的檢索課題進(jìn)行全面的分析研究,為選擇檢索詞,編寫檢索式作好準(zhǔn)備,然后根據(jù)為選擇檢索詞,編寫檢索式作好準(zhǔn)備,然后根據(jù)檢索課題的要求選擇合適的數(shù)據(jù)庫和檢索系統(tǒng),檢索課題的要求選擇合適的數(shù)據(jù)庫和檢索系統(tǒng),開始檢索后,要根據(jù)檢索的具體情況及時調(diào)整檢開始檢索后,要根據(jù)檢索的具體情況及時調(diào)整檢索策略,使檢索結(jié)果符合用戶的要求索策略,使檢索結(jié)果符合用戶的要求 。 2.2.制定檢索策略制定檢索策略 (1)(1)列出待檢課題的學(xué)科范圍、主題范圍等。列出待檢課題的學(xué)科范圍、主題范圍等。 (2 2)確定檢索詞和詞的截斷部位,調(diào)整詞之間的)確定檢索詞和詞的截斷部位,調(diào)整詞之間的位置

22、關(guān)系及組配關(guān)系。位置關(guān)系及組配關(guān)系。 (3 3)選擇相關(guān)數(shù)據(jù)庫,確定檢索途徑。)選擇相關(guān)數(shù)據(jù)庫,確定檢索途徑。 (4 4)擬定檢索式。)擬定檢索式。 (5 5)實檢與反饋調(diào)節(jié))實檢與反饋調(diào)節(jié) 。 3.3.選擇檢索須注意的問題選擇檢索須注意的問題(1)(1)該詞的廣義詞、狹義詞、相關(guān)詞及多義詞等該詞的廣義詞、狹義詞、相關(guān)詞及多義詞等(2)(2)該詞的最佳截斷部位該詞的最佳截斷部位(3)(3)對于泛指的主題概念詞,應(yīng)選用其包容特性的具體內(nèi)容來對于泛指的主題概念詞,應(yīng)選用其包容特性的具體內(nèi)容來表達(dá):表達(dá): 例:水果貯藏方面的文獻(xiàn)例:水果貯藏方面的文獻(xiàn) (apple or pear or apple or pear or )and storageand storage (4)(4)當(dāng)課題面窄,提問專指度高,而數(shù)據(jù)庫中對文獻(xiàn)的標(biāo)引深當(dāng)課題面窄,提問專指度高,而數(shù)據(jù)庫中對文獻(xiàn)的標(biāo)引深度可能不足時,對檢索詞可進(jìn)行粗化,取其上位檢索詞度可能不足時,對檢索詞可進(jìn)行粗化,取其上位檢索詞 例:例: 玉米同功酶方面的文獻(xiàn):玉米同功酶方面的文獻(xiàn): isozymesisozymes ( (同功酶同功酶) enzymes() enzymes(生化酶生化酶)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論