信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第1頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第2頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第3頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第4頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

信息檢索主講人:孫祥經(jīng)濟(jì)信息管理教研室Page

2第六章信息檢索信息檢索的基本概念與原理信息檢索的發(fā)展歷程信息檢索的技術(shù)與方法信息檢索的步驟與策略網(wǎng)絡(luò)信息檢索Page

3內(nèi)容提要本章介紹了信息檢索的基本概念和原理,并以信息技術(shù)發(fā)展為主線,梳理了信息檢索的發(fā)展歷程及階段,討論了信息檢索的步驟和策略的制定,以及信息檢索語言和信息檢索效率評價(jià),同時(shí)介紹了網(wǎng)絡(luò)信息檢索的特點(diǎn)及網(wǎng)絡(luò)檢索工具。第六章信息檢索Page

4學(xué)習(xí)重點(diǎn)

掌握信息檢索的基本概念和原理,掌握信息檢索的步驟和策略,熟悉信息檢索的發(fā)展歷程和網(wǎng)絡(luò)信息檢索的特點(diǎn)。第六章信息檢索56.1信息檢索的基本概念和原理6.1.1信息檢索的含義

為什么要學(xué)習(xí)信息檢索,掌握信息檢索工具的使用?

可以充分發(fā)揮人類知識寶庫的作用,有利于開發(fā)智力資源;

協(xié)助有關(guān)人員選擇正確的科技策略,提高效率、減少人力或投資方面的浪費(fèi);

可以節(jié)省科技人員的寶貴時(shí)間;

促進(jìn)專業(yè)學(xué)習(xí)。信息檢索的基本概念和原理6信息檢索的概念(廣義)將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要檢出所需信息的過程。(狹義,單從信息用戶的角度)從已存儲的信息資源中找出與用戶提問相關(guān)的文獻(xiàn)、知識、事實(shí)、數(shù)據(jù)的邏輯運(yùn)算和技術(shù)操作過程。信息檢索的基本概念和原理7信息檢索的本質(zhì)

匹配,將用戶提問與信息集合中的數(shù)據(jù)進(jìn)行比較和選擇的結(jié)果。信息檢索的基本概念和原理

提問(檢索)語言

文獻(xiàn)標(biāo)識語言匹配8信息檢索的基本特征有確定的目標(biāo);有一個(gè)可能的信息解的集合;有一定的線索可依;搜索的過程是針對一定的目標(biāo)、遵循一定的線索、不斷縮小搜索范圍的求解過程。信息檢索的基本概念和原理9信息檢索的兩個(gè)子系統(tǒng)信息檢索的基本概念和原理106.1.2信息檢索的分類

按照內(nèi)容劃分文獻(xiàn)檢索(DocumentRetrieval)數(shù)據(jù)檢索(DataRetrieval)事實(shí)檢索(FactRetrieval)信息檢索的基本概念和原理11文獻(xiàn)檢索文獻(xiàn)檢索是以文獻(xiàn)為檢索對象的一種檢索,凡是查找某一主題、某一學(xué)科、某一著者的有關(guān)文獻(xiàn)均屬于文獻(xiàn)檢索的范疇。文獻(xiàn)檢索是相關(guān)性檢索,即檢索系統(tǒng)不直接解答用戶所提出的技術(shù)問題本身,只提供與之相關(guān)的文獻(xiàn)供用戶參考。如:查找經(jīng)濟(jì)信息處理流程方面的相關(guān)論文.信息檢索的基本概念和原理12注意:

信息檢索(InformationRetrieval)與文獻(xiàn)檢索(DocumentRetrieval)是兩個(gè)不同的概念,文獻(xiàn)檢索是信息檢索的一種最基本的、最主要的形式。信息檢索的基本概念和原理13數(shù)據(jù)檢索(DataRetrieval):是以數(shù)據(jù)為檢索對象,從已收藏?cái)?shù)據(jù)資料中查找出特定數(shù)據(jù)的過程。數(shù)據(jù)檢索是一種確定性檢索,系統(tǒng)要直接回答用戶提出的問題,即直接提供用戶所需要的確切的數(shù)據(jù)。如:某種材料的電阻;某變壓器的參數(shù);化學(xué)分子式、數(shù)據(jù)圖表等。信息檢索的基本概念和原理14事實(shí)檢索(FactRetrieval)事實(shí)檢索即通過對信息集合中已有的基本事實(shí)或數(shù)據(jù)進(jìn)行處理(邏輯推理),然后得出新的(即未直接存入信息集合中的)事實(shí)的過程。如:某產(chǎn)品是哪個(gè)廠家生產(chǎn),第一顆人造衛(wèi)星是什么時(shí)候升空的,按高考分?jǐn)?shù)劃分,每個(gè)段的新生有多少人?信息檢索的基本概念和原理15數(shù)據(jù)和事實(shí)檢索是要檢索出包含在文獻(xiàn)中的具體情報(bào);文獻(xiàn)檢索則是要檢索出包含所需情報(bào)的文獻(xiàn)。信息檢索的基本概念和原理16按照信息的組織方式劃分全文檢索多媒體檢索超媒體檢索依信息存儲與檢索方式劃分手工檢索計(jì)算機(jī)檢索信息檢索的基本概念和原理17信息檢索的特性信息檢索的相關(guān)性

相關(guān)性表明用戶是否認(rèn)為一文獻(xiàn)與一提問吻合。信息檢索的不確定性

標(biāo)引的不確定性是指不同標(biāo)引員在給同一篇信息對象進(jìn)行標(biāo)引時(shí)會(huì)選用不同的標(biāo)引詞,即標(biāo)引詞選用的不一致性。檢索詞選用的不確定性是指候選檢索詞集不止一個(gè),檢索過程具有試探性。信息檢索的邏輯性

檢索語言、檢索策略(處理信息檢索提問的邏輯與查找步驟的科學(xué)安排)信息檢索的基本概念和原理186.1.3信息檢索的基本原理

對信息資源集合與信息需求集合的匹配和選擇。一方面是用戶的信息需求,一方面是組織有序的文獻(xiàn)信息集合,檢索就是從用戶特定的信息需求出發(fā),對特定的信息集合采用一定的方法、技術(shù)手段,根據(jù)一定的線索與規(guī)則從中找出相關(guān)的信息。匹配有其匹配標(biāo)準(zhǔn),這里涉及到兩者一致性、相關(guān)度等問題,按一定的標(biāo)準(zhǔn)篩選出符合要求的信息。信息檢索的基本概念和原理196.1.4信息檢索的模型布爾邏輯檢索模型向量空間檢索模型概率檢索模型

模糊檢索模型信息檢索的基本概念和原理20信息檢索的模型信息檢索的模型,就是運(yùn)用數(shù)學(xué)的語言和工具,對信息檢索系統(tǒng)中的信息及其處理過程加以翻譯和抽象,表述為某種數(shù)學(xué)公式,再經(jīng)過演繹、推斷、解釋和實(shí)際檢驗(yàn),反過來指導(dǎo)信息檢索實(shí)踐。信息檢索的基本概念和原理21信息檢索模型的組成(1)用戶的需求表示:用戶查詢的獲取與表示。(2)文檔的表示:文檔內(nèi)容的識別與表示。(3)匹配機(jī)制:用戶需求表示與文檔表示之間的查詢機(jī)制,以及它們之間相關(guān)性排序的準(zhǔn)則和函數(shù)表示。(4)反饋修正:對檢索結(jié)果進(jìn)行優(yōu)化。信息檢索的基本概念和原理22布爾檢索(精確匹配檢索)假設(shè)檢索到的集合中,所有文檔關(guān)于相關(guān)性都是等價(jià)的,也假設(shè)了相關(guān)性是二元的。對于檢索評價(jià)有2種輸出結(jié)果:TRUEandFALSE查詢項(xiàng)被描述為布爾邏輯操作符

AND,OR,NOT例一個(gè)文檔當(dāng)且僅當(dāng)它能夠滿足布爾查詢式時(shí),才將其檢索出來信息檢索的基本概念和原理23小例子簡單查詢項(xiàng)為“林肯”,會(huì)返回大量包含林肯汽車和林肯總統(tǒng)的文檔。不管“林肯”這個(gè)詞出現(xiàn)多少次,也不管上下文,所有這些文檔根據(jù)布爾檢索模型的排序性質(zhì)都是等價(jià)的。查詢項(xiàng)“總統(tǒng)AND林肯”,會(huì)返回一組同時(shí)包含這兩個(gè)查詢詞的文檔查詢項(xiàng)“總統(tǒng)AND林肯ANDNot(汽車OR轎車)”,會(huì)去除包含“汽車OR轎車”的文檔信息檢索的基本概念和原理24優(yōu)點(diǎn)簡單、易于理解;能處理結(jié)構(gòu)化查詢,易于表示同義關(guān)系和詞組;速度快。缺點(diǎn)嚴(yán)格,使用的限制性強(qiáng);結(jié)果不易控制;難以進(jìn)行定量比較;無法滿足特殊查詢。信息檢索的基本概念和原理25向量空間模型相比于布爾模型要求的準(zhǔn)確匹配,Salton在60年代末提出的向量空間模型采用了“部分匹配”的檢索策略(即:出現(xiàn)部分索引詞也可以出現(xiàn)在檢索結(jié)果中);這個(gè)模型對于查詢與文檔的相關(guān)度有較強(qiáng)的可計(jì)算性和可操作性,并且被廣泛應(yīng)用于文本檢索、自動(dòng)文摘、關(guān)鍵詞自動(dòng)提取、文本分類等方面。信息檢索的基本概念和原理26優(yōu)點(diǎn)使得對查詢向量中關(guān)鍵詞權(quán)重的賦值成為可能;可根據(jù)相似度大小對查詢結(jié)果進(jìn)行排序并控制輸出數(shù)量;相比布爾模型要求的準(zhǔn)確匹配,VSM模型采用“部分匹配”檢索策略。實(shí)驗(yàn)表明:向量空間模型比布爾模型檢索效果更好。信息檢索的基本概念和原理27缺點(diǎn)在模型中,特征項(xiàng)被假設(shè)為相互獨(dú)立,而實(shí)際上一個(gè)文檔中的特征項(xiàng)之間可能存著一定的聯(lián)系;不能像布爾模型一樣支持布爾結(jié)構(gòu)化查詢;基于向量空間模型的檢索系統(tǒng)較基于布爾模型的檢索系統(tǒng)而言,要復(fù)雜得多,在大型商業(yè)檢索系統(tǒng)中使用較少。信息檢索的基本概念和原理28概率模型概率排序原則-Robertson(1977)如果一個(gè)參考檢索排序系統(tǒng)對每個(gè)查詢的反饋都是數(shù)據(jù)集中所有文檔根據(jù)和用戶查詢的相關(guān)性概率值降序排序的結(jié)果并且其中的概率值都被盡可能精確地估計(jì)出來那么該系統(tǒng)對于用戶的整體效果就是基于這些數(shù)據(jù)能夠獲得的最好結(jié)果給定一個(gè)新的文檔,搜索引擎的任務(wù)是判定這個(gè)文檔是否屬于相關(guān)文檔集合或者非相關(guān)集合。也就是說,系統(tǒng)應(yīng)該判斷文檔是相關(guān)的還是非相關(guān)的,如果相關(guān)就返回文檔。信息檢索的基本概念和原理29優(yōu)點(diǎn)文檔可以按照他們相關(guān)概率遞減的順序來排序。缺點(diǎn)開始時(shí)需要猜想把文檔分為相關(guān)和不相關(guān)的兩個(gè)集合,一般來說很難實(shí)際上這種模型沒有考慮索引術(shù)語在文檔中的頻率(因?yàn)樗械臋?quán)重都是二值的)假設(shè)索引詞獨(dú)立信息檢索的基本概念和原理306.2信息檢索的發(fā)展歷程手工信息檢索階段機(jī)械信息檢索階段計(jì)算機(jī)信息檢索階段網(wǎng)絡(luò)信息檢索階段信息檢索的發(fā)展歷程316.2.1手工信息檢索階段信息檢索起源于參考咨詢工作,參考咨詢工作產(chǎn)生的標(biāo)志是1876年召開的美國圖書館協(xié)會(huì)第一屆大會(huì)。1883年,波士頓公共圖書館首次設(shè)置了專職參考館員和參考閱覽室;20世紀(jì)初,多數(shù)圖書館成立了參考咨詢部門,主要利用圖書館的書目工具來幫助讀者查找圖書、期刊或現(xiàn)成答案。逐漸發(fā)展到從多種文獻(xiàn)源中查找、分析、評價(jià)和重新組織信息;“索引”突破了以前的狹隘范疇,成為獨(dú)立的檢索工具;信息檢索的發(fā)展歷程3240年代進(jìn)一步包括回答事實(shí)性咨詢,編制書目、文摘,進(jìn)行專題文獻(xiàn)檢索,提供文獻(xiàn)代譯等。“信息檢索”從此成為一項(xiàng)獨(dú)立的用戶服務(wù)工作,并逐漸從單純的經(jīng)驗(yàn)工作向?qū)I(yè)化方向發(fā)展。信息檢索的發(fā)展歷程336.2.2機(jī)械信息檢索階段機(jī)械信息檢索兩種基本類型機(jī)電信息檢索系統(tǒng)光電信息檢索系統(tǒng)

機(jī)械信息檢索并沒有發(fā)展信息檢索語言,只是采用單一的方法對固定的存貯形式進(jìn)行檢索,而且過分依賴于設(shè)備,檢索復(fù)雜,成本較高,檢索效率和質(zhì)量都不理想。信息檢索的發(fā)展歷程346.2.3計(jì)算機(jī)信息檢索階段1971年以前建立的信息檢索系統(tǒng),是傳統(tǒng)的批處理檢索方式。1971年以后,產(chǎn)生并發(fā)展的聯(lián)機(jī)信息檢索系統(tǒng),如OCLC、Dialog在線數(shù)據(jù)庫聯(lián)機(jī)檢索系統(tǒng)。信息檢索的發(fā)展歷程356.2.4網(wǎng)絡(luò)信息檢索階段20世紀(jì)90年代以來,產(chǎn)生并發(fā)展的網(wǎng)絡(luò)信息檢索階段。信息檢索的發(fā)展歷程366.3信息檢索的技術(shù)與方法信息檢索技術(shù)兩個(gè)發(fā)展方向:傳統(tǒng)信息檢索向全文文本、多媒體、多載體等新型信息檢索的發(fā)展,在深度上提高管理和組織信息的能力;信息資源的網(wǎng)絡(luò)化和分布化,面向互聯(lián)網(wǎng)中海量的信息資源,在廣度上提高管理和組織的能力。信息檢索的技術(shù)與方法376.3信息檢索的技術(shù)與方法從檢索手段看,信息檢索分為:手工信息檢索機(jī)械信息檢索計(jì)算機(jī)信息檢索網(wǎng)絡(luò)信息檢索信息檢索的技術(shù)與方法386.3.1手工信息檢索的技術(shù)與方法手工信息檢索工具主要是各種類型的工具書。工具書是根據(jù)一定的需要,比較完備地匯集某一方面的資料,并按特定的方法加以編排,專供讀者查考檢索有關(guān)知識、資料、事實(shí)的書籍。據(jù)工具書的體例和功能,可分為檢索型工具書、參考性工具書、詞語性工具書、表譜性工具書、圖錄性工具書和邊緣性工具書6種類型。信息檢索的技術(shù)與方法39手工信息檢索工具目錄:它是圖書、期刊等單位出版物外表特征的揭示和報(bào)道,它以一個(gè)完整的出版或收藏單位為著錄的基本單位,多按類或題名編排,強(qiáng)調(diào)有具體的收藏單位。是以某一“種”文獻(xiàn)為一個(gè)記錄款目。包括:國家書目、出版社目錄、館藏目錄、專題目錄、聯(lián)合目錄等。信息檢索的技術(shù)與方法40索引:是對一組文獻(xiàn)集合有系統(tǒng)的指引。一般只起指引特定信息內(nèi)容及其存儲地址的作用。是檢索工具的輔助工具。它對文獻(xiàn)的外表特征和內(nèi)容特征用各種檢索標(biāo)識符(字母、數(shù)字、漢字等)進(jìn)行描述,并將它們按一定的規(guī)則及排列方式組織起來,然后用文摘號來注明它在文獻(xiàn)信息集合中的位。信息檢索的技術(shù)與方法41文摘它也是以“篇”為著錄單元,但卻是在對文獻(xiàn)外部特征進(jìn)行著錄的基礎(chǔ)上,還將文獻(xiàn)的內(nèi)容加以濃縮,以最精煉最概括的文字報(bào)道文獻(xiàn)的主題、方法和結(jié)論,并將這些外部特征和內(nèi)容摘要的記錄按一定順序排列起來所形成的一種文獻(xiàn)檢索工具。它是檢索工具的主體,二次文獻(xiàn)的核心。信息檢索的技術(shù)與方法42文摘按其目的和用途可分為:●指示性文摘這是旨在把原文的主題范圍、目的和方法概括的指示給讀者的一種文摘,幫助讀者判斷原文是否與自己相關(guān)以及是否需要閱讀原文。字?jǐn)?shù)一般限制在幾十個(gè)字(中文50~100個(gè)字,外文30~50個(gè)詞),也有人將其稱為簡介或簡介性文摘。閱讀指示性文摘不能代表原文。信息檢索的技術(shù)與方法43報(bào)道性文摘

又稱敘述性文摘,它是用來概括原文的內(nèi)容要點(diǎn),向讀者提供原文中的定量信息和定性信息的一種文摘,基本能反映原文的技術(shù)內(nèi)容,一般數(shù)字為200~300字(西文250個(gè)實(shí)詞)。評論性文摘評論性文摘插入有文摘員個(gè)人的看法或分析,評論性文摘的價(jià)值如何,主要取決于文摘員的專業(yè)水平。信息檢索的技術(shù)與方法44年鑒

年鑒是以全面、系統(tǒng)、準(zhǔn)確地記述上年度事物運(yùn)動(dòng)、發(fā)展?fàn)顩r為主要內(nèi)容的資料性工具書。匯輯一年內(nèi)的重要時(shí)事、文獻(xiàn)和統(tǒng)計(jì)資料,按年度連續(xù)出版的工具書。它具有資料權(quán)威、反應(yīng)及時(shí)、連續(xù)出版、功能齊全的特點(diǎn)。屬信息密集型工具書。信息檢索的技術(shù)與方法45手冊手冊是匯集某一學(xué)科或某一主題等需要經(jīng)常查考的資料,供讀者隨時(shí)翻檢的工具書。手冊的類型:數(shù)據(jù)性手冊條目性手冊圖表性手冊綜合性手冊信息檢索的技術(shù)與方法46百科全書

百科全書是概要記述人類一切知識門類或某一知識門類的工具書。

信息檢索的技術(shù)與方法47手工信息檢索工具的排檢技術(shù)字順排檢技術(shù):將檢索工具的內(nèi)容按字、詞的一定順序或規(guī)律,有系統(tǒng)地組織排列起來的技術(shù)。分類排檢技術(shù):將信息素材按學(xué)科或事物性質(zhì)系統(tǒng)地加以排列。主題排檢技術(shù):以規(guī)范化的自然語言為標(biāo)識符號來標(biāo)引信息內(nèi)容的排檢技術(shù)。時(shí)序排檢技術(shù):按時(shí)間的順序組合信息素材的技術(shù),多用于編制年表、年譜等檢索工具。如:《國內(nèi)外大事記》地序排檢技術(shù):按一定時(shí)期的行政區(qū)域來排列信息素材的技術(shù)。如:《中國名勝詞典》

信息檢索的技術(shù)與方法48手工信息檢索方法順查法:時(shí)間上,由遠(yuǎn)至近,查全率高,費(fèi)時(shí)費(fèi)力。倒查法:時(shí)間上,由近至遠(yuǎn),查準(zhǔn)率高,漏檢率高。抽查法:集中于學(xué)科的興旺階段,檢索效率高。追溯法:

A.一次文獻(xiàn)參考文獻(xiàn)一次信息參考文獻(xiàn)……由近至遠(yuǎn)

B.一次文獻(xiàn)引用該一次信息的文獻(xiàn)新的一次文獻(xiàn)……實(shí)際是由“遠(yuǎn)近”越查文獻(xiàn)越新,擴(kuò)大信息源,效率低,檢全率低,漏檢率高。信息檢索的技術(shù)與方法49循環(huán)法:先利用檢索工具查出一批有用文獻(xiàn),然后再利用這些文獻(xiàn)末尾所附參考文獻(xiàn)的線索進(jìn)行追溯查找。信息檢索的技術(shù)與方法506.3.2機(jī)械信息檢索的技術(shù)與方法機(jī)電信息檢索系統(tǒng)繼手檢穿孔卡片之后,出現(xiàn)了機(jī)檢穿孔卡片和選卡機(jī)。這就形成了機(jī)電信息檢索系統(tǒng)。光電信息檢索系統(tǒng)主要是以縮微膠卷(片)檢索方式出現(xiàn)的??s微膠卷(片)的檢索方式大致可以分為兩種類型:①尋址檢索方式②編碼檢索方式信息檢索的技術(shù)與方法516.3.3計(jì)算機(jī)信息檢索的技術(shù)與方法聯(lián)機(jī)信息檢索信息用戶利用終端設(shè)備,通過通訊網(wǎng)絡(luò)與世界各地的信息檢索系統(tǒng)聯(lián)機(jī),進(jìn)行人機(jī)對話,從檢索系統(tǒng)的數(shù)據(jù)庫中查找出用戶所需信息的全過程。優(yōu)點(diǎn):①檢索速度快;②檢索范圍廣而全面;③檢索途徑多、質(zhì)量高;④檢索內(nèi)容新、實(shí)時(shí)性強(qiáng);⑤檢索輔助功能完善、使用方便,檢索結(jié)果輸出方式靈活、實(shí)用。缺陷:①主機(jī)負(fù)擔(dān)重,一旦出現(xiàn)故障,則整個(gè)網(wǎng)絡(luò)都將癱瘓;②信息組織方式以線性為主,不夠靈活;③聯(lián)機(jī)檢索不像Internet是面向最終用戶的,操作也沒有后者方便。信息檢索的技術(shù)與方法52聯(lián)機(jī)信息檢索系統(tǒng)的結(jié)構(gòu)

由檢索服務(wù)機(jī)構(gòu)(聯(lián)機(jī)存取中心)、國際通訊網(wǎng)絡(luò)及終端三部分構(gòu)成。

終端設(shè)備用于輸入檢索程序、顯示檢索過程、控制打印檢索結(jié)果。

通訊網(wǎng)絡(luò)用于實(shí)現(xiàn)遠(yuǎn)程人機(jī)對話。

檢索服務(wù)機(jī)構(gòu)(聯(lián)機(jī)存取中心)是存儲和檢索信息的核心。由中央計(jì)算機(jī)、數(shù)據(jù)庫檢索與管理軟件、聯(lián)機(jī)數(shù)據(jù)庫以及相應(yīng)的檢索服務(wù)體制組成。信息檢索的技術(shù)與方法53聯(lián)機(jī)信息檢索的技術(shù)原理一個(gè)典型的計(jì)算機(jī)信息系統(tǒng),能完成數(shù)據(jù)收集、分析、加工處理、存儲、傳遞通信和檢索信息的全過程。聯(lián)機(jī)信息檢索的服務(wù)方式定題信息提供(SDI)專題回溯檢索(RS)聯(lián)機(jī)訂購原文電子郵件信息檢索的技術(shù)與方法54我國聯(lián)機(jī)存取服務(wù)始于1974年,比較有影響的聯(lián)機(jī)存取系統(tǒng)有:

(1)萬方數(shù)據(jù)資源系統(tǒng)

/(2)CNKI數(shù)據(jù)資源系統(tǒng)

(3)維普數(shù)據(jù)資訊系統(tǒng)

/信息檢索的技術(shù)與方法55光盤信息檢索光盤信息檢索的特點(diǎn):光盤存貯容量大、耐用。檢索成本低。一次購買可多次使用,節(jié)省了電訊費(fèi)和聯(lián)機(jī)系統(tǒng)使用費(fèi)。操作簡單,檢索效果好。用戶按提示或幫助功能使用檢索系統(tǒng)。運(yùn)行速度快。單機(jī)檢索,不受線路影響。安全性能高。只讀光盤,一般局域網(wǎng)用戶使用。信息檢索的技術(shù)與方法56光盤信息檢索的缺陷:如果光盤數(shù)據(jù)庫量不夠多,則信息資源就顯得有限,購買大量光盤數(shù)據(jù)庫,又要受到經(jīng)費(fèi)限制更新周期長。一般的光盤數(shù)據(jù)庫更新要1個(gè)月或更長,而網(wǎng)絡(luò)數(shù)據(jù)庫的更新周期一般是1周或更短。檢索時(shí)需不斷換盤。一個(gè)大型數(shù)據(jù)庫,一般都是幾張光盤,特別是全文數(shù)據(jù)庫,如中國學(xué)術(shù)期刊全文光盤數(shù)據(jù)庫,每年都有一百多張光盤,檢索時(shí)需要不斷更換光盤。信息檢索的技術(shù)與方法57光盤信息檢索方法光盤檢索系統(tǒng)的功能和指令與聯(lián)機(jī)檢索沒有很大區(qū)別,但更方便。功能鍵:Help(幫助)、Index(索引)、History(查閱歷史)、Display(顯示)、Print(打印)、SelectDatabase(選擇數(shù)據(jù)庫)、FormatWindow(格式窗)、Quit(退出)等。檢索信息時(shí)可用單元詞、多元詞(短語)、數(shù)字及布爾運(yùn)算符和位置運(yùn)算符把幾個(gè)檢索術(shù)語組配成一個(gè)提問邏輯式。用戶可以在任何時(shí)刻回顧其查找的歷史,重新使用或修改以前的任何提問。屏幕幫助是光盤數(shù)據(jù)庫最常用也是重要的功能之一。信息檢索的技術(shù)與方法586.3.4網(wǎng)絡(luò)信息檢索的技術(shù)與方法網(wǎng)絡(luò)信息檢索模式

廣義:從根本上解決有效利用網(wǎng)絡(luò)信息資源問題的關(guān)鍵。如何對網(wǎng)絡(luò)上的海量多態(tài)信息進(jìn)行組織,如何對這些信息建立索引,如何對索引及時(shí)更新;如何設(shè)計(jì)檢索算法以使檢索提問在檢全、檢準(zhǔn)、響應(yīng)時(shí)間、檢索結(jié)果控制與顯示方面表現(xiàn)良好;如何為用戶設(shè)計(jì)一個(gè)簡單易用的友好界面。信息檢索的技術(shù)與方法59網(wǎng)絡(luò)信息檢索模式狹義:在現(xiàn)實(shí)世界中有效利用網(wǎng)絡(luò)資源的核心只是以網(wǎng)絡(luò)(如互聯(lián)網(wǎng))為媒介,利用網(wǎng)上已提供的一些信息檢索工具,探索如何使用這些工具及如何綜合各工具,使它們揚(yáng)長避短,最后能實(shí)現(xiàn)對信息提問的檢索查詢的一種方法與技術(shù)。信息檢索的技術(shù)與方法606.4信息檢索的步驟與策略6.4.1信息檢索的步驟(1)分析檢索課題,明確信息需求明確信息檢索課題所涉及的領(lǐng)域和范圍;明確所需信息的內(nèi)容及其內(nèi)容特征;明確所需信息的類型,包括文獻(xiàn)媒體、出版類型、所需文獻(xiàn)量、年代范圍、涉及的語種、有關(guān)著者及機(jī)構(gòu)等;明確信息檢索課題對查新、查準(zhǔn)和查全的指標(biāo)要求。信息檢索的步驟與策略61(2)選擇檢索工具,了解檢索系統(tǒng)信息檢索工具是人們?yōu)榱顺浞帧?zhǔn)確、有效地利用已有的信息資源而加工編制的用來報(bào)道、揭示、存貯和查找信息資源的卡片、表冊、計(jì)算機(jī)信息系統(tǒng)和特定出版物。(3)確定檢索途經(jīng),選定檢索方法每一種信息檢索方法都有自己的特點(diǎn),在實(shí)踐中可以根據(jù)信息檢索要求選擇使用或配合使用,以快速、準(zhǔn)確地完成信息檢索任務(wù),實(shí)現(xiàn)預(yù)期的目標(biāo)。信息檢索的步驟與策略62(4)掌握獲取原始信息的線索在獲取信息線索時(shí)要仔細(xì)閱讀,判斷所檢出的信息是否符合檢索的要求,不僅看篇名,還要閱讀整個(gè)著錄格式,進(jìn)行綜合分析。(5)獲取原始信息判斷文獻(xiàn)的出版類型。整理文獻(xiàn)出處。根據(jù)出版類型在圖書館或信息機(jī)構(gòu)查找館藏目錄或聯(lián)合目錄確定館藏。盡可能多渠道、多方式地獲取原始信息。

信息檢索的步驟與策略636.4.2信息檢索策略

檢索策略是科學(xué)地運(yùn)用檢索詞和邏輯運(yùn)算符正確地構(gòu)造邏輯提問式的原則和方法。其核心內(nèi)容在于檢索策略的構(gòu)造與檢索的步驟。

常用信息檢索策略包括:分塊概念組配檢索策略、逐步組配檢索策略、對偶組配檢索策略、增長組配檢索策略等。

信息檢索的步驟與策略646.4.3信息檢索語言

信息檢索語言就是信息組織和信息檢索時(shí)所使用的語言(包括自然語言)。

信息檢索語言是文獻(xiàn)信息標(biāo)引的規(guī)則和標(biāo)準(zhǔn),標(biāo)引人員可用它來標(biāo)引文獻(xiàn)以便將文獻(xiàn)整理、加工、存儲于檢索系統(tǒng)中,同時(shí),檢索人員可用它來表達(dá)檢索課題信息的內(nèi)容,以便把特定文獻(xiàn)從檢索系統(tǒng)中檢索出來。因此,檢索語言就是一種把文獻(xiàn)的存儲與檢索聯(lián)系起來,把標(biāo)引人員和檢索人員溝通起來的約定人工語言。

信息檢索的步驟與策略65信息檢索語言主要功能:對文獻(xiàn)的信息內(nèi)容及其外表特征加以規(guī)范化的標(biāo)引。對內(nèi)容相同及相關(guān)的文獻(xiàn)信息加以集中或揭示其相關(guān)性可使文獻(xiàn)信息的存儲集中化、系統(tǒng)化、組織化,便于檢索者按一定的排列次序進(jìn)行有序化檢索。便于將標(biāo)引用語和檢索用語進(jìn)行相符性比較。信息檢索的步驟與策略66信息檢索語言的作用信息檢索的步驟與策略67信息檢索語言的分類信息檢索的步驟與策略686.4.4信息檢索效率的評價(jià)

檢索效率是指全、準(zhǔn)、快、便、省(檢全率、檢準(zhǔn)率、檢索速度、檢索方便性、檢索成本與效益),最主要的是全和準(zhǔn)。在評價(jià)信息檢索效率過程中,主要通過檢全率、檢準(zhǔn)率、漏檢率和誤檢率四個(gè)評價(jià)指標(biāo)進(jìn)行評價(jià),其中重點(diǎn)是檢全率和檢準(zhǔn)率。

信息檢索的步驟與策略69檢全率=檢出的相關(guān)文獻(xiàn)量/系統(tǒng)中的相關(guān)文獻(xiàn)總量檢準(zhǔn)率=檢出的相關(guān)文獻(xiàn)量/檢出的文獻(xiàn)總量漏檢率=未檢出的相關(guān)文獻(xiàn)量/系統(tǒng)中的相關(guān)文獻(xiàn)總量誤檢率=檢出的非相關(guān)文獻(xiàn)量/檢出的文獻(xiàn)總量

信息檢索的步驟與策略70信息檢索的步驟與策略檢全率與檢準(zhǔn)率的互逆相互曲線716.5網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索6.5.1網(wǎng)絡(luò)信息檢索特點(diǎn)信息豐富,檢索空間拓寬信息資源的異構(gòu)式分布檢索趨于簡單方便,適合非專業(yè)用戶網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索726.5.2網(wǎng)絡(luò)信息檢索工具非WEB檢索工具FTP類的檢索工具.如Archie(文檔查詢服務(wù))Telnet類的檢索工具.Gopher(菜單式檢索服務(wù))WEB檢索工具

關(guān)鍵詞檢索工具

目錄型檢索工具

混合型檢索工具網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索736.5.3搜索引擎及其應(yīng)用搜索引擎

是提供給用戶進(jìn)行關(guān)鍵詞、詞組或自然語言檢索的工具,簡言之,就是一種在互聯(lián)網(wǎng)上查找信息的工具?;竟ぷ髟?/p>

用戶提出檢索要求,搜索引擎代替用戶在數(shù)據(jù)庫中進(jìn)行檢索,并將檢索結(jié)果反饋給用戶。檢索的結(jié)果

WWW上的主頁、新聞組中的文章、軟件的存放地址及其作者、企業(yè)網(wǎng)站、個(gè)人主頁等。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索74搜索引擎的分類綜合型獨(dú)立搜索引擎

用戶可以利用此類工具檢索幾乎所有方面的網(wǎng)絡(luò)資源。垂直型獨(dú)立搜索引擎(專業(yè)、專用搜索引擎)

專門收錄某一方面、某一行業(yè)或某一主題的信息,單一垂直搜索引擎、綜合型搜索引擎垂直化、門戶網(wǎng)站引擎垂直化網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索75元搜索引擎

元搜索引擎又稱集合型搜索引擎,將多個(gè)單一搜索引擎集成在一起,提供統(tǒng)一的檢索界面,將用戶的檢索提問同時(shí)提交給多個(gè)獨(dú)立的搜索引擎,同時(shí)檢索多個(gè)數(shù)據(jù)庫;并根據(jù)多個(gè)獨(dú)立搜索引擎的檢索結(jié)果進(jìn)行二次加工,如對檢索結(jié)果去重、排序等,輸出給用戶。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索76移動(dòng)搜索引擎移動(dòng)搜索是基于移動(dòng)網(wǎng)絡(luò)的搜索技術(shù)的總稱,用戶可以通過SMS(短信息)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論