《信息資源檢索(第二版)》教學(xué)課件-第四章計(jì)算機(jī)信息檢索技術(shù)_第1頁
《信息資源檢索(第二版)》教學(xué)課件-第四章計(jì)算機(jī)信息檢索技術(shù)_第2頁
《信息資源檢索(第二版)》教學(xué)課件-第四章計(jì)算機(jī)信息檢索技術(shù)_第3頁
《信息資源檢索(第二版)》教學(xué)課件-第四章計(jì)算機(jī)信息檢索技術(shù)_第4頁
《信息資源檢索(第二版)》教學(xué)課件-第四章計(jì)算機(jī)信息檢索技術(shù)_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第章計(jì)算機(jī)信息檢索技術(shù)第章計(jì)算機(jī)信息檢索技術(shù)目 錄.計(jì)算機(jī)信息檢索概述 .檢索原理 .檢索服務(wù)模式 .檢索特點(diǎn) .計(jì)算機(jī)檢索系統(tǒng)構(gòu)成 .計(jì)算機(jī) .通信網(wǎng)絡(luò) .檢索終端 .數(shù)據(jù)庫 .計(jì)算機(jī)信息檢索技術(shù).布爾邏輯檢索技術(shù).截詞檢索技術(shù).限制檢索技術(shù).位置檢索技術(shù).加權(quán)檢索技術(shù)目 錄.計(jì)算機(jī)信息檢索概述 .計(jì)算機(jī)信息檢索 思考:購買商品的各索引系統(tǒng) 前提:買什么東西?哪個(gè)廠家生產(chǎn)?該產(chǎn)品叫什么?是否有批準(zhǔn)文號(法定)?使用該產(chǎn)品的市場反饋如何?產(chǎn)品的發(fā)明人或生產(chǎn)者是誰? 該廠家的地理位置在哪里?是否含有特殊的有效成分? 模型化的具體對應(yīng)與索引:買什么東西-分類索引該產(chǎn)品叫什么-主題索引或輪排索引 哪

2、個(gè)廠家生產(chǎn)-單位索引或團(tuán)體索引是該廠家的哪地方的分廠生產(chǎn)-地理索引 思考:購買商品的各索引系統(tǒng) 前提:買什么東西?哪個(gè)廠.計(jì)算機(jī)信息檢索概述計(jì)算機(jī)信息檢索就是用戶利用計(jì)算機(jī)設(shè)備和通信網(wǎng)絡(luò),與計(jì)算機(jī)信息檢索系統(tǒng)相連接,運(yùn)用系統(tǒng)特定的指令和檢索方法,組織檢索策略,從儲(chǔ)存了大量記錄的數(shù)據(jù)庫中檢索出所需信息的過程。.計(jì)算機(jī)信息檢索概述計(jì)算機(jī)信息檢索就是用戶利用計(jì)算機(jī)設(shè).檢索原理計(jì)算機(jī)信息檢索原理與手工檢索的原理相同,都是將檢索需求與檢索對象進(jìn)行匹配的過程。然而,在手工檢索時(shí),各種匹配過程只在自己的頭腦當(dāng)中,無須事先進(jìn)行明確的表達(dá),人們在檢索時(shí)可以進(jìn)行人為的判斷和修正,即邊檢邊選,對檢出結(jié)果的內(nèi)容也可以

3、進(jìn)行思考和判斷,必要時(shí)再進(jìn)行二次或多次檢索。.檢索原理計(jì)算機(jī)信息檢索原理與手工檢索的原理相同,在利用計(jì)算機(jī)檢索系統(tǒng)進(jìn)行檢索時(shí),計(jì)算機(jī)對結(jié)果不具有任何判斷力,僅僅是機(jī)械地執(zhí)行檢索策略,其執(zhí)行過程是指令的機(jī)械匹配,只要是符合條件的文獻(xiàn)均作為命中文獻(xiàn)予以選出。同時(shí),與手工檢索相比,計(jì)算機(jī)檢索時(shí)人們無法直接看到數(shù)據(jù)庫中的內(nèi)容,因而利用計(jì)算機(jī)系統(tǒng)進(jìn)行檢索時(shí),對需求的表達(dá)就成了重要的環(huán)節(jié)。在利用計(jì)算機(jī)檢索系統(tǒng)進(jìn)行檢索時(shí),計(jì)算機(jī)對結(jié)果不具有任何判斷力.檢索服務(wù)模式計(jì)算機(jī)信息檢索發(fā)展至今已有幾十年的歷史,其檢索服務(wù)模式也主要經(jīng)歷了以下幾個(gè)階段。.脫機(jī)檢索階段這一階段的計(jì)算機(jī)檢索是以批處理方式進(jìn)行的脫機(jī)檢索,即

4、檢索只能在檢索系統(tǒng)所在地進(jìn)行,由檢索人員定期將用戶課題匯總,批量輸入計(jì)算機(jī),用戶不能參與檢索過程,不能實(shí)時(shí)瀏覽檢索結(jié)果,修改檢索方案,即不能人機(jī)對話。.檢索服務(wù)模式計(jì)算機(jī)信息檢索發(fā)展至今已有幾十年的歷.聯(lián)機(jī)檢索階段所謂人機(jī)對話就是用戶在終端直接輸入檢索提問,計(jì)算機(jī)在聯(lián)機(jī)數(shù)據(jù)庫檢索并立即顯示檢索結(jié)果,用戶如對結(jié)果不滿意,可隨即修改檢索提問重新檢索。.聯(lián)機(jī)檢索階段所謂人機(jī)對話就是用戶在終端直接輸入檢索提問,.光盤檢索階段1983年出現(xiàn)了一種新的內(nèi)存,即光盤。光盤檢索具有如下優(yōu)點(diǎn):存儲(chǔ)量大而體積微小、要求設(shè)備簡單,可隨地安裝、使用方便,易于操作、檢索費(fèi)用低(不需要昂貴的聯(lián)機(jī)檢索通信費(fèi)用)、可隨時(shí)修改

5、檢索策略,具有很高的查全率和查準(zhǔn)率等。因?yàn)檫@些優(yōu)點(diǎn),光盤檢索至今仍被世界各地廣泛應(yīng)用。.光盤檢索階段1983年出現(xiàn)了一種新的內(nèi)存,即.網(wǎng)絡(luò)化檢索階段20世紀(jì)90年代,隨著衛(wèi)星通信、公共數(shù)據(jù)通信、光纜通信技術(shù)以及信息高速公路事業(yè)在全世界的迅猛發(fā)展,計(jì)算機(jī)情報(bào)檢索步入全球大聯(lián)網(wǎng)時(shí)期。網(wǎng)上資源具有信息的時(shí)效性、內(nèi)容的廣泛性、訪問的快速性、搜索的網(wǎng)絡(luò)性和資源的動(dòng)態(tài)性五大特點(diǎn),那么要及時(shí)、準(zhǔn)確、有效地獲取與自身需求相關(guān)的實(shí)用信息,對所有網(wǎng)絡(luò)用戶都非常具有挑戰(zhàn)性。.網(wǎng)絡(luò)化檢索階段20世紀(jì)90年代,隨著衛(wèi)星通信、公共數(shù)據(jù)通.檢索特點(diǎn)()速度快、效率高。()檢索途徑多。()靈活方便。()更新快。()直接輸出檢

6、索結(jié)果。.檢索特點(diǎn)()速度快、效率高。 .計(jì)算機(jī)檢索系統(tǒng)構(gòu)成計(jì)算機(jī)信息檢索系統(tǒng)主要由計(jì)算機(jī)、通信網(wǎng)絡(luò)、檢索終端以及數(shù)據(jù)庫組成。.計(jì)算機(jī).硬件計(jì)算機(jī)是檢索系統(tǒng)的核心部分,它統(tǒng)籌管理整個(gè)系統(tǒng)的運(yùn)行,其容量、運(yùn)算速度決定整個(gè)檢索系統(tǒng)的能力。計(jì)算機(jī)由硬件和軟件組成。 .計(jì)算機(jī)檢索系統(tǒng)構(gòu)成計(jì)算機(jī)信息檢索系統(tǒng)主要由計(jì)算機(jī)、.數(shù)據(jù)庫的類型數(shù)據(jù)庫的類型歸納起來主要有以下幾種:()書目型數(shù)據(jù)庫 :是機(jī)讀的目錄、索引和文摘檢索工具,檢索結(jié)果是文獻(xiàn)的線索而非原文。圖書館的書目數(shù)據(jù)庫就是這種類型。()數(shù)值型數(shù)據(jù)庫:提供以數(shù)值為主的情報(bào)信息。如化學(xué)物質(zhì)毒性數(shù)據(jù)庫、機(jī)信息檢索中最基本的也是最常用的技術(shù)。.數(shù)據(jù)庫的類型數(shù)據(jù)

7、庫的類型歸納起來主要有以下幾種: 布爾邏輯檢索運(yùn)用布爾邏輯算符(Boolean operators)對檢索詞進(jìn)行邏輯組配,表達(dá)兩個(gè)概念之間的邏輯關(guān)系。布爾邏輯算符主要有: AND OR NOT 在中文數(shù)據(jù)庫里,布爾邏輯運(yùn)算符有時(shí)用AND、OR、NOT表示,有時(shí)用 “*”、 “”及“” 。 布爾邏輯檢索1.邏輯與(邏輯乘) 表示概念的相交、限定,縮小檢索范圍,提高檢準(zhǔn)率。 用運(yùn)算符號:AND 或 * 連接檢索詞 A AND B A B1.邏輯與(邏輯乘) 例:邏輯與(AND或*)計(jì)算機(jī)在圖書館的應(yīng)用計(jì)算機(jī)圖書館計(jì)算機(jī) AND 圖書館例:邏輯與(AND或*)計(jì)算機(jī)在圖書館的應(yīng)用計(jì)算機(jī)圖書館計(jì)算人類

8、活動(dòng)對群落多樣性的影響 檢索概念: 人類活動(dòng) 群落多樣性 影響 檢索式 人類活動(dòng) AND 群落多樣性 人類活動(dòng) AND 群落多樣性 AND 影響人類活動(dòng)對群落多樣性的影響人類活動(dòng) AND 群落多樣性 AND 影響人類活動(dòng) AND 群落多2.邏輯或表示概念的平行、并列,用于擴(kuò)大檢索范圍,提高查全率用運(yùn)算符“OR” 或 “+”連接兩檢索詞 A OR B A B2.邏輯或表示概念的平行、并列,用于擴(kuò)大檢索范圍,提高查全率例:邏輯或(OR 或 + ) 乙肝病毒的研究 檢索詞: 乙肝 乙型肝炎 HBV Hepatitis B virus 檢索式: 乙肝 OR 乙型肝炎 OR HBV Hepatitis

9、B virus OR HBV 例:邏輯或(OR 或 + ) 乙肝病毒的研究 Hepatitis B virusHepatitis B Hepatitis B virus OR HBVHepatitis B virus OR HBV3.邏輯非去掉一個(gè)主題中某一部分的主題,用于縮小檢索范圍,提高查準(zhǔn)率;用運(yùn)算符號“NOT”或“-”連接兩檢索詞 例1 查“玉米但不是甜玉米”方面的文獻(xiàn)。 檢索式=玉米-甜玉米 例2 查“國外有關(guān)數(shù)字圖書館方面”的文獻(xiàn) 檢索式=數(shù)字圖書館-國內(nèi) A NOT B A B3.邏輯非 .運(yùn)算優(yōu)先級當(dāng)在一個(gè)檢索式中,同時(shí)出現(xiàn)不同的布爾邏輯算符時(shí),它的運(yùn)算級別是不同的。布爾邏輯算

10、符的運(yùn)算次序通常是:在有括號的情況下,括號內(nèi)的邏輯運(yùn)算先執(zhí)行;有多層括號時(shí),先執(zhí)行最內(nèi)層的括號。邏輯“與”、“或”、“非”的運(yùn)算次序是:先執(zhí)行邏輯“非”操作,再執(zhí)行邏輯“與”,最后執(zhí)行邏輯“或”。.運(yùn)算優(yōu)先級當(dāng)在一個(gè)檢索式中,同時(shí)出現(xiàn)不同的布爾邏輯算符時(shí)檢索執(zhí)行的優(yōu)先順序括號中的檢索詞 高 W,N,或L, F, NOT AND OR 低檢索執(zhí)行的優(yōu)先順序括號中的檢索詞 截詞檢索在實(shí)際檢索中,常遇到詞干相同、詞義相近的檢索詞,或同一詞的單、復(fù)數(shù)形式,動(dòng)、名詞形式,英美拼法等。所謂截詞檢索,是指在檢索標(biāo)識中保留相同的部分,用相應(yīng)的截詞符代替可變化部分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分標(biāo)識的記錄全部

11、檢索出來。常用“?”、“*”符號表示。用截詞符號“?”、“*”或“$”加在檢索詞的前后或中間,以檢索一組概念相關(guān)或同一詞根的詞。這種檢索方式可以擴(kuò)大檢索范圍,提高查全率。截詞運(yùn)算符號通常有兩個(gè):“?、*” 。其在不同系統(tǒng)中表示的含義不同。 截詞檢索在實(shí)際檢索中,常遇到詞干相同、詞義相近的檢索詞,按截?cái)嗟奈恢梅郑?后截?cái)?前截?cái)?中間截?cái)?按截詞的字符數(shù)量分: 有限截詞 無限截詞信息資源檢索(第二版)教學(xué)課件第四章計(jì)算機(jī)信息檢索技術(shù)后截?cái)嘣跈z索詞后(右方)截?cái)嘤邢藁驘o限的字母。 如:librar* library、librarian、libraries 主要用于詞的單復(fù)數(shù)檢索、詞根檢索(soci

12、o*)、年代檢索(199*)后截?cái)嘣跈z索詞后(右方)截?cái)嘤邢藁驘o限的字母?!癲igital librar*”“digital lib前截?cái)鄬⒔卦~符號放在檢索字符串的左方,以表示其左邊不管截去有限或無限個(gè)字符,只要數(shù)據(jù)庫中具有與截詞符后面部分字符相同的檢索詞的文獻(xiàn),即為命中文獻(xiàn)。這種方式也稱為后方一致。 如:*chemistry microchemistry、macrochemistry 目前使用較少前截?cái)鄬⒔卦~符號放在檢索字符串的左方,以表示其左邊不管截去有中間截?cái)嘤址Q作“通用字符法”或“內(nèi)嵌字符截?cái)唷?。在檢索詞中間加一個(gè)或幾個(gè)?號,主要解決一些英美拼寫不同,單復(fù)數(shù)形式的不同的詞的輸入,可簡化

13、輸入。如:輸入wom?n可檢出woman,women 輸入defen?e可檢出 defence、defense中間截?cái)嘤址Q作“通用字符法”或“內(nèi)嵌字符截?cái)唷?。在檢索詞中間.限制檢索在檢索系統(tǒng)中,為了提高檢索的查準(zhǔn)率,縮小檢索的范圍,通常有一些限制的手段和方法,使用這些方法進(jìn)行檢索通常稱為限制檢索。常用的限制符號有:“”、“”等。限制檢索的方式有多種,例如進(jìn)行字段限定檢索、使用范圍限制符、采用限制檢索命令等。.限制檢索在檢索系統(tǒng)中,為了提高檢索的查準(zhǔn)率,縮小數(shù)據(jù)庫中常用檢索字段列表西文數(shù)據(jù)庫常用字段中文數(shù)據(jù)庫常用字段字段名稱字段代碼AbstractsAB文摘AuthorAU作者Corporate

14、 Source、Organization、CompanyCS機(jī)構(gòu)名稱Descriptor、SubjectDE敘詞/主題詞Document TypeDT文獻(xiàn)類型Full-textFT全文ISSNISSN國際標(biāo)準(zhǔn)連續(xù)出版物號Journal Name、Publication TitleJN期刊名稱Keyword、TopicKW關(guān)鍵詞LanguageLA語言Publication YearPY出版年TitleTI題名數(shù)據(jù)庫中常用檢索字段列表西文數(shù)據(jù)庫常用字段中文數(shù)據(jù)庫常用字段例如,computer and network/TI ,DE 表示將檢索式限定在篇名字段(TI )和敘詞字段(DE )中;在多數(shù)

15、檢索系統(tǒng)中,如果用戶不對檢索式注明字段限定范圍,系統(tǒng)會(huì)默認(rèn)在四個(gè)基本字段中檢索。例要查找著者Smith D.發(fā)表的文獻(xiàn),檢索式可表示為AU=Smith, D.。信息資源檢索(第二版)教學(xué)課件第四章計(jì)算機(jī)信息檢索技術(shù).同字段檢索算符()算符:()算符是“(字段)”的縮寫,表示在算符兩側(cè)的檢索詞須同時(shí)出現(xiàn)在數(shù)據(jù)庫記錄的同一字段中,詞序可變。()算符:()算符是“(連接)”的縮寫,表示()兩側(cè)的檢索詞之間有一定的從屬關(guān)系。.同字段檢索算符()算符:()算符是“(字段關(guān)系算符在數(shù)據(jù)庫的輔助索引中,有些是數(shù)值型字段,這時(shí)可用范圍檢索的關(guān)系算符來執(zhí)行,包括:包含范圍(數(shù)字由低到高數(shù)字)如 出版年P(guān)Y=1990:1999大于,如公司銷售額SA500m小于,如研究生申請接受率PC= 大于等于,如公司財(cái)產(chǎn)TA=500000000=小于等于,如公司雇員數(shù)EM=90000關(guān)系算符在數(shù)據(jù)庫的輔助索引中,有些是數(shù)值型字段,這時(shí)可用范圍.加權(quán)檢索技術(shù)加權(quán)檢索是某些檢索系統(tǒng)中提供的一種定量檢索技術(shù)。加權(quán)檢索同布爾檢索、截詞檢索等一樣,也是文獻(xiàn)檢索的一個(gè)基本檢索手段,但與它們不同的是,加權(quán)檢索的側(cè)重點(diǎn)不在于判定檢索詞或字符串是不是在數(shù)據(jù)庫中存在、與別的檢索詞或字符串是什么關(guān)系,而是在于判定檢索詞或字符串在滿足檢索邏輯后對文獻(xiàn)命中與否的影響程度。/Detail.aspx

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論