《信息資源檢索(第二版)》第2章 信息檢索基本理論_第1頁(yè)
《信息資源檢索(第二版)》第2章 信息檢索基本理論_第2頁(yè)
《信息資源檢索(第二版)》第2章 信息檢索基本理論_第3頁(yè)
《信息資源檢索(第二版)》第2章 信息檢索基本理論_第4頁(yè)
《信息資源檢索(第二版)》第2章 信息檢索基本理論_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章

信息檢索基本理論目錄2.1信息檢索基本原理

2.1.1信息檢索的含義與原理

2.1.2信息檢索的發(fā)展歷史

2.1.3信息檢索的類型

2.1.4信息檢索工具

2.2信息檢索方法、途徑與步驟

2.2.1信息檢索方法

2.2.2信息檢索途徑

2.2.3信息檢索步驟2.3信息檢索效果的評(píng)價(jià)2.3.1信息檢索效果的評(píng)價(jià)

2.3.2提高信息檢索效果的方法課前思考

某海軍陸戰(zhàn)隊(duì)在原始森林進(jìn)行為時(shí)一個(gè)月左右的生存實(shí)驗(yàn),具體要求如下:第一,每個(gè)隊(duì)員除了身上穿的衣服外,隨身只能帶三件物品,每件物品不能超過(guò)二公斤;第二,隊(duì)員都是由飛機(jī)空降到半徑為1000公里原始森林的中心地帶,要求在一個(gè)月時(shí)間內(nèi)從森林里走出來(lái)。問(wèn)題:隊(duì)員帶哪三件物品合適?理想的答案:鋼刀、火石、指南針人類要在世界上生存與發(fā)展要獲取物質(zhì)、能量、信息三大要素。上面例子中的指南針就是我們獲取信息的一種工具,有了它,陸戰(zhàn)隊(duì)員們就可以用它獲取走出原始森林的方向,沒(méi)有它,可能一輩子都走不出原始森林。指南針指引的方向就是一種信息,即方向信息和方位信息。

2.1信息檢索基本原理

2.1.1信息檢索的含義與原理1950年莫爾斯在論文《把信息檢索看作是時(shí)間性的通訊》中首次提出信息檢索(一詞。他指出:“信息檢索是一種時(shí)間性的通訊形式”,“在時(shí)間上從一個(gè)時(shí)刻通往一個(gè)較晚的時(shí)刻,而在空間上可能還在同一地點(diǎn)”,并強(qiáng)調(diào)“信息接受者是最活躍的一方”。信息檢索是從任何集合中識(shí)別和獲取信息的過(guò)程及其所采取的一系列方法和策略。從信息檢索的全過(guò)程來(lái)看,信息檢索具有廣義和狹義兩重含義。廣義信息檢索包括兩個(gè)過(guò)程,一是信息資源的存儲(chǔ),就是對(duì)有關(guān)信息進(jìn)行選擇,并對(duì)信息特征進(jìn)行著錄、標(biāo)引和組織,建立信息數(shù)據(jù)庫(kù)的過(guò)程;二是信息的檢索,就是根據(jù)信息檢索提問(wèn)制定檢索策略,利用信息數(shù)據(jù)庫(kù)查找所需信息內(nèi)容的過(guò)程。狹義的信息檢索僅指后一部分。信息檢索的本質(zhì)是一個(gè)信息匹配的過(guò)程,即用戶的信息需求和特定信息集合的比較、選擇的過(guò)程。也就是說(shuō),信息檢索是用戶根據(jù)自己的信息需求提出的主題概念或提問(wèn)表達(dá)式與一定的信息系統(tǒng)的信息語(yǔ)言相適應(yīng)的過(guò)程,如果兩者相匹配,所需信息就被檢中,否則檢索失敗。信息檢索的基本原理信息集合I匹配與選擇特征化表示特征化表示需求集合D個(gè)人問(wèn)題

與知識(shí)信息檢索的作用(1)能夠高效、全面地掌握有效信息。(2)能夠提高科研效率。(3)能夠提高信息素質(zhì)。

2.1.2信息檢索的發(fā)展歷史

信息檢索起源19世紀(jì)前期。(1)手工檢索系統(tǒng)(1876—1954年)(2)脫機(jī)批處理檢索(1954—1965年)(3)聯(lián)機(jī)檢索與光盤(pán)檢索(1965—1991年)(4)網(wǎng)絡(luò)化聯(lián)機(jī)檢索(1991年至今)2.1.3信息檢索的類型(1)按檢索對(duì)象區(qū)分(按信息檢索結(jié)果的內(nèi)容劃分)按信息檢索結(jié)果的內(nèi)容劃分,信息檢索可分為文獻(xiàn)信息檢索、數(shù)據(jù)檢索及事實(shí)檢索。文獻(xiàn)信息檢索是以獲得各種類型文獻(xiàn)信息為目的的、包括文獻(xiàn)信息線索檢索和文獻(xiàn)信息全文檢索。數(shù)據(jù)檢索是指從各種數(shù)值數(shù)據(jù)庫(kù)和統(tǒng)計(jì)數(shù)據(jù)庫(kù)儲(chǔ)存的數(shù)據(jù)中查找用戶所需的數(shù)據(jù)信息。事實(shí)檢索是以事實(shí)作為檢索對(duì)象,針對(duì)特定的事件或事實(shí)的檢索。信息源用戶用戶接口創(chuàng)建數(shù)據(jù)庫(kù)提問(wèn)處理/檢索匹配詞匯管理工具DBDBDB標(biāo)引處理信息選擇與采集數(shù)據(jù)庫(kù)生成數(shù)據(jù)庫(kù)查詢(2)按信息檢索的方式劃分

按照檢索的操作方式,信息檢索分為手工檢索和計(jì)算機(jī)檢索。1)手工檢索:手工檢索以手工操作的方式,利用檢索工具書(shū)進(jìn)行信息檢索。2)機(jī)器檢索:機(jī)器檢索以機(jī)械、機(jī)電或電子化的方式,利用檢索系統(tǒng)進(jìn)行信息檢索。計(jì)算機(jī)信息檢索原理

示意圖手工檢索與計(jì)算機(jī)化檢索的對(duì)比

手工檢索

計(jì)算機(jī)化檢索

信息集合

文字型檢索工具

機(jī)讀數(shù)據(jù)庫(kù)

需求集合

文字型檢索課題

形式化表示的

提問(wèn)式

匹配選擇

眼看、手翻、腦子

判斷

計(jì)算機(jī)程序(3)按檢索性質(zhì)劃分按照檢索的性質(zhì),信息檢索分為全文檢索、超文本檢索和超媒體檢索。全文檢索是將存儲(chǔ)于數(shù)據(jù)庫(kù)中的本書(shū)、整篇文章中的任意內(nèi)容信息查找出來(lái)的檢索。超文本檢索是對(duì)每個(gè)節(jié)點(diǎn)中所存信息及信息鏈構(gòu)成的網(wǎng)絡(luò)中信息的檢索。超媒體檢索是對(duì)存儲(chǔ)的文本、圖像、聲音等多種媒體信息的檢索。2.1.4信息檢索工具信息檢索必須借助于一定的檢索工具。檢索工具是指用以報(bào)道、存儲(chǔ)和查找文獻(xiàn)信息線索的工具。信息檢索工具的古代形態(tài)可以上溯到我國(guó)漢代劉向編撰的《七略》?,F(xiàn)代意義的檢索工具則是伴隨世界信息的增加和科學(xué)技術(shù)的發(fā)展從19世紀(jì)逐步興起的,以期刊式文摘和索引為主,包括各種工具書(shū)和計(jì)算機(jī)檢索系統(tǒng)。檢索工具具有廣義和狹義之分。廣義的檢索工具是指用來(lái)報(bào)道、存儲(chǔ)和查詢文獻(xiàn)信息的一切工具與設(shè)備,可分為手工檢索工具、機(jī)械檢索工具和計(jì)算機(jī)檢索工具。狹義的檢索工具則主要指手工檢索工具,也稱印刷型檢索工具或書(shū)本式檢索工具。(1)手工檢索工具手工檢索工具是手工檢索信息資料的憑借工具和入門(mén)依據(jù),一般分為以下幾大類。1)目錄2)題錄3)索引4)文摘5)信息資料指南目錄:是以一件或一種完整的出版物(如一本書(shū)、一種期刊等)作為著錄基本單位的檢索工具。一般目錄主要揭示、報(bào)道這些單位出版物的外表特征。題錄:是以單篇或單份文獻(xiàn)為著錄的基本單位的檢索工具,題錄也主要揭示、報(bào)道文獻(xiàn)的外表特征,但其著錄格式與目錄有所不同。【論文題名】網(wǎng)絡(luò)環(huán)境下信息檢索與報(bào)道服務(wù)淺析

【英文題名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者單位】湖南化工職業(yè)技術(shù)學(xué)院,圖書(shū)館,湖南,株洲,412004

【刊名】株洲師范高等??茖W(xué)校學(xué)報(bào)

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【關(guān)鍵詞】圖書(shū)館;網(wǎng)絡(luò)環(huán)境;信息搜集;信息檢索;信息報(bào)道

索引:是根據(jù)一定的需要,把特定范圍內(nèi)的某些重要文獻(xiàn)中的有關(guān)款目或知識(shí)單元(如書(shū)名、刊名、人名、地名、語(yǔ)詞等),按照一定的方法編排,并指明出處,為用戶提供文獻(xiàn)線索的一種檢索工具。

文摘:是在題錄的基礎(chǔ)上,在每條著錄款目后邊再加上文獻(xiàn)內(nèi)容的摘要?!菊撐念}名】網(wǎng)絡(luò)環(huán)境下信息檢索與報(bào)道服務(wù)淺析

【英文題名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者單位】湖南化工職業(yè)技術(shù)學(xué)院,圖書(shū)館,湖南,株洲,412004

【刊名】株洲師范高等??茖W(xué)校學(xué)報(bào)

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【關(guān)鍵詞】圖書(shū)館;網(wǎng)絡(luò)環(huán)境;信息搜集;信息檢索;信息報(bào)道

【摘要】網(wǎng)絡(luò)環(huán)境下的信息服務(wù)已對(duì)圖書(shū)館的機(jī)構(gòu)組織、人員素質(zhì)、服務(wù)水平和社會(huì)地位產(chǎn)了巨大影響.掌握網(wǎng)絡(luò)環(huán)境下的信息服務(wù)特點(diǎn)和方法,盡快適應(yīng)網(wǎng)絡(luò)環(huán)境已成為圖書(shū)館提高信息服務(wù)質(zhì)量的重要課題.

2.2信息檢索方法、途徑與步驟2.2.1信息檢索方法(1)直接查找法直接查找法指檢索者不依靠任何檢索工具或檢索系統(tǒng),從本專業(yè)最新核心期刊或其他文獻(xiàn)中直接閱讀原文或?yàn)g覽最新目次而獲取文獻(xiàn)的方法。這是一種最常見(jiàn)的信息資源的獲取方式。(2)順查法順查法指利用檢索工具或檢索系統(tǒng),按照時(shí)間順序由遠(yuǎn)及近地查找。一般需了解檢索問(wèn)題的背景和發(fā)生簡(jiǎn)況,從而選擇比較適宜的檢索工具及檢索系統(tǒng),從問(wèn)題產(chǎn)生的時(shí)間開(kāi)始查起,直到最新的文獻(xiàn)信息,這種方法具有查全率較高的優(yōu)點(diǎn)。(3)逆查法逆查法就是利用檢索工具或檢索系統(tǒng)由近及遠(yuǎn)逆時(shí)間查找。逆查法的重點(diǎn)是放在近期信息資源上,以基本滿足用戶自己的信息需求為原則。使用這種方法可以最快地獲得新資料、新信息,這種方法投入勞動(dòng)比較小,省時(shí)省力,檢索效率較高,但查全率較順查法低。(4)抽查法抽查法指在利用檢索工具或檢索系統(tǒng)查找文獻(xiàn)時(shí),抽取其中某段時(shí)間查找。抽查法重點(diǎn)關(guān)注有關(guān)課題的文獻(xiàn)信息最可能出現(xiàn)或最多出現(xiàn)的時(shí)間段。該方法的優(yōu)點(diǎn)是能收集相對(duì)集中、具有代表性、且能反映該課題發(fā)展水平的文獻(xiàn)信息,有事半功倍的效果,具有檢索效率高、檢索效果好的優(yōu)點(diǎn)。(5)追溯法追溯法指從已有的文獻(xiàn)后所列的參考文獻(xiàn)入手,逐一追查原文,從這些新查到的原文后面所附的參考文獻(xiàn)逐一追查、不斷擴(kuò)檢的檢索方法。其優(yōu)點(diǎn)是在沒(méi)有檢索工具或檢索工具不齊全的情況下,借助此種方法,也可以查到一批有關(guān)的文獻(xiàn)。C文獻(xiàn)(先發(fā)表)NEW文獻(xiàn)(最近發(fā)表)參考文獻(xiàn):BDB文獻(xiàn)(在A后發(fā)表)參考文獻(xiàn):ACA文獻(xiàn)(先發(fā)表)D文獻(xiàn)(在A后發(fā)表)參考文獻(xiàn):AG追查出的文獻(xiàn)越來(lái)越新2.2.2信息檢索途徑信息檢索途徑也叫信息檢索入口或檢索點(diǎn)。用戶在檢索信息資源時(shí),選擇正確的信息檢索途徑能夠快捷、準(zhǔn)確、全面以及花費(fèi)較低成本查找到文獻(xiàn)。一般來(lái)說(shuō),檢索信息資源時(shí),可采取以下的檢索途徑。(1)分類途徑:是按文獻(xiàn)所屬學(xué)科類別進(jìn)行檢索的途徑,以文獻(xiàn)所屬學(xué)科專業(yè)的分類號(hào)為特征標(biāo)識(shí)的檢索方法。(2)主題途徑:是一種通過(guò)文獻(xiàn)的內(nèi)容主題進(jìn)行檢索的途徑。一般來(lái)說(shuō)如果知道所檢文獻(xiàn)的主題概念選用主題途徑為好。(3)著者途徑:指通過(guò)已知的文獻(xiàn)著者的名稱來(lái)查找文獻(xiàn)信息的途徑。著者包括個(gè)人著者和團(tuán)體著者。檢索知名的學(xué)者時(shí),著者途徑具有較強(qiáng)的實(shí)用性。(4)題名途徑:指通過(guò)文獻(xiàn)的題名來(lái)查找文獻(xiàn)的途徑。(5)機(jī)構(gòu)途徑:指通過(guò)機(jī)構(gòu)名稱獲取相關(guān)信息、了解該機(jī)構(gòu)情況的途徑。(6)代碼途徑:是通過(guò)信息的某種代碼來(lái)檢索信息的途徑。(7)其他途徑:有些檢索工具還附有一些特殊索引,可以通過(guò)特殊途徑查找所需文獻(xiàn)。2.2.3信息檢索步驟信息檢索步驟是為達(dá)到檢索目的而采取的具體操作方法的總稱,一般可分為檢索課題分析、制定檢索策略、檢索策略的實(shí)施與調(diào)整和檢索結(jié)果的篩選、整理和原始信息的獲取等部分。2.3信息檢索效果的評(píng)價(jià)2.3.1信息檢索效果的評(píng)價(jià)信息檢索效果評(píng)價(jià)是通過(guò)評(píng)價(jià)相關(guān)信息檢索過(guò)程的各種指標(biāo)來(lái)衡量的。在網(wǎng)絡(luò)環(huán)境下信息檢索效果的評(píng)價(jià)指標(biāo)主要有六個(gè):收錄范圍、查全率、查準(zhǔn)率、響應(yīng)時(shí)間、用戶負(fù)擔(dān)和輸出形式。收錄范圍是信息檢索系統(tǒng)(信息存儲(chǔ))所能提供的文獻(xiàn)信息的數(shù)量和范圍。查準(zhǔn)率和查全率是指信息檢索系統(tǒng)的效率。響應(yīng)時(shí)間是指從提交檢索課題到查出文獻(xiàn)所需的時(shí)間。用戶負(fù)擔(dān)是用戶在檢索過(guò)程中所耗費(fèi)的物力財(cái)力乃至精力的總和。輸出形式則指檢索系統(tǒng)所提供的檢索結(jié)果和形式(可能是文獻(xiàn)號(hào)、題錄、文摘或全文等)。上述六種指標(biāo)又以查全率和查準(zhǔn)率兩項(xiàng)指標(biāo)最為重要。

查全率與查準(zhǔn)率

查全率與查準(zhǔn)率.查全率

指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)中存在的合乎該需要的所有文獻(xiàn)的比例。用字母R表示。R=4.2.2查準(zhǔn)率(precisionratio)

指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢出文獻(xiàn)全部數(shù)量的比例。用字母P表示。P=

相關(guān)情況檢出情況相關(guān)文獻(xiàn)非相關(guān)文獻(xiàn)總計(jì)被檢出文獻(xiàn)a(命中的)b(誤檢的)a+b未被檢出文獻(xiàn)c(漏檢的)d(應(yīng)拒的)c+d總計(jì)a+cb+da+b+c+d以上兩個(gè)公式中字母所表示的含義見(jiàn)下表查全率和查準(zhǔn)率之間的關(guān)系

一系列的試驗(yàn)結(jié)果表明,查全率和查準(zhǔn)率之間存在互逆關(guān)系。因此,如果對(duì)檢索系統(tǒng)要求較高的查全率,則查準(zhǔn)率必然下降,反之亦然。查全率與查準(zhǔn)率是評(píng)價(jià)檢索效果的兩項(xiàng)重要指標(biāo)。查全率和查準(zhǔn)率與信息資源的存儲(chǔ)與檢索兩個(gè)方面是直

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論