信息檢索基本原理.ppt_第1頁
信息檢索基本原理.ppt_第2頁
信息檢索基本原理.ppt_第3頁
信息檢索基本原理.ppt_第4頁
信息檢索基本原理.ppt_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第2章 信息檢索基本原理,2.1 信息檢索的含義和類型,2.1.1 信息檢索的概念 廣義的信息檢索:是指將信息按一定方式組 織和存儲起來,并根據(jù)信息用戶的需要找出 有關(guān)信息的過程。(對信息工作者而言的) 廣義的信息檢索包含“信息存儲與檢索”這兩 方面的內(nèi)容,這是兩個相反的而又相互依存 的過程。,狹義的信息檢索:是指廣義的信息檢索的后半 個過程,即從信息集合中找出所需要信息的過 程,相當于人們所說的信息查詢。(對用戶而 言的),生活百科國內(nèi)天氣預(yù)報,生活百科國外天氣預(yù)報,生活百科機票查詢,生活百科火車票查詢,生活百科國內(nèi)各地郵政編碼查詢,生活百科研究所招生網(wǎng),生活百科大學(xué)四、六級,生活百科中國留

2、學(xué)網(wǎng),作為檢索對象和目的的信息,其出現(xiàn)形式 是不同的,有的以記錄著信息或知識的文獻表 現(xiàn)出來,有的以含著情報或知識的數(shù)據(jù)或事實 表現(xiàn)出來,于是根據(jù)檢索對象的不同,信息檢 索又可區(qū)分為不同的類型。,2.1.2 信息檢索的基本類型 按照信息檢索的對象劃分:文獻檢索、數(shù)據(jù)檢索、事實檢索、全文檢索、圖像檢索和超文本檢索。 按照檢索工具劃分:直接檢索和間接檢索。 按照信息檢索手段劃分:手工信息檢索和計 算機信息檢索。,按照信息檢索對象劃分,文獻檢索:是以文獻為檢索對象,從已存儲的文獻庫中查找出特定文獻的過程。 例如:“關(guān)于自動控制系統(tǒng)有些什么參考文獻”這就需要我們根據(jù)課題要求,按照一定的檢索標志(如主題

3、詞、分類號等),從所收藏的文獻中查出所需要的文獻。,數(shù)據(jù)檢索:是以數(shù)據(jù)為檢索對象,從已收藏數(shù)據(jù)資料中查找出特定數(shù)據(jù)的過程。 例如:查喜馬拉雅山有多高,杭州六和塔建于何年等。 事實檢索:即通過對存儲的文獻中已有的基本事實,或?qū)?shù)據(jù)進行處理(邏輯推理)后得出新的(即未直接存入或所藏文獻中沒有的)事實過程。 例如:本學(xué)年成績優(yōu)秀的學(xué)生有多少,某同類產(chǎn)品中,哪種品牌的銷量最大。,文獻、數(shù)據(jù)、事實檢索區(qū)別: 數(shù)據(jù)和事實檢索是要檢索出包含在文獻中的具體情報; 文獻檢索則是要檢索出包含所需情報的文獻。 文獻檢索是最典型和最重要也是最常利用的檢索信息。,全文檢索:是計算機程序通過掃描文章中的每 一個詞,對全文

4、內(nèi)容進行字符串的匹配的檢索。 圖像檢索:是以圖形、圖像或圖文信息為檢索 對象的檢索。 超文本檢索:是以超文本信息作為檢索對象的 信息檢索。,超文本普遍以電子文檔方式存在,其中的文字包含有可以鏈接到其他字段或者文檔的超文本鏈接,允許從當前閱讀位置直接切換到超文本鏈接所指向的文字。我們?nèi)粘g覽的網(wǎng)頁都屬于超文本。,按照檢索工具劃分,直接檢索:就是利用一次文獻信息進行檢索。 間接檢索:就是利用各種檢索工具獲取文獻信 息線索,再根據(jù)線索去查找原始文獻信息的方 法。 在一般的信息檢索書中,如果沒有特殊的說 明,文獻檢索指的就是間接檢索。,按照信息檢索手段劃分,手工信息檢索:即用人工來處理和查找所需 信息

5、的檢索方式。 計算機檢索:利用計算機和一定的通信設(shè)備所查找所需信息的檢索方式。,手工檢索的基本原理: 文獻信息,搜集,加工,檢索系統(tǒng),比較,用戶檢索課題,雙方一致,將相應(yīng)的文獻信息按要求從檢索系統(tǒng)中拿出,與手工信息檢索相比,計算機信息檢索的特點: 1.檢索速度快。 2.檢索途徑多。 3.數(shù)據(jù)庫更新速度快。,2.2 信息檢索系統(tǒng),檢索系統(tǒng)是根據(jù)特定需要利用一定的檢索設(shè)備,從整理加工并存儲在某種載體上的文獻集合中檢索出所需情報的系統(tǒng)。 它根據(jù)檢索設(shè)備和載體的不同,可以分為手工檢索系統(tǒng)和機器檢索系統(tǒng)。,手工檢索系統(tǒng):由手工檢索設(shè)備(如書本式目錄、文摘、索引、卡片柜等)、檢索語言、文獻庫等構(gòu)成。 特點

6、:使用方便、成本低廉,但檢索效率和響應(yīng)時間均較差。,閱覽室借書卡片柜,里邊按編號放置卡片,方便借閱,機器檢索系統(tǒng)分為機械檢索系統(tǒng)和計算機檢索系統(tǒng)。 機械檢索系統(tǒng):主要由穿孔卡片、選卡機、機械探針、編碼規(guī)則、文獻庫等構(gòu)成。 計算機檢索系統(tǒng):主要由計算機檢索設(shè)備(聯(lián)機檢索設(shè)備、光盤檢索設(shè)備、微機檢索設(shè)備和縮微品機檢索設(shè)備等)、檢索語言、文獻庫等構(gòu)成。 特點:檢索效率高,響應(yīng)速度快等特點,但是成本和檢索費用較高。,什么是穿孔卡片? 一種由薄紙板制成,用孔洞位置或其組合表示信息,通過穿孔或軋口方式記錄和存儲信息的方形卡片。是手工檢索和機械化檢索系統(tǒng)的重要工具。,1)穿孔卡片 2)穿孔紙帶,在上世紀70

7、年代磁盤獲得廣泛應(yīng)用之前,穿孔卡片是數(shù)據(jù)和程序的最主要的信息載體。在那個時代,電腦既沒有配置顯示器,也沒有打印機,更沒有今天廣泛使用的硬盤、軟盤和U盤。大學(xué)里的學(xué)生去上電腦課時,都要帶著從書店里買來的空白卡片,進入電腦機房后,第一步要做的事情是利用打孔機在卡片機上鑿出一些小孔(這個過程就是編程)。由于每張卡片只能容納程序的一小段,需要把一大疊卡片一張一張地順序插入卡片閱讀機中,才能將程序全部輸入到計算機中,運算結(jié)果也通過紙帶穿孔機輸出的紙帶展現(xiàn)出來。,當以Apple II(1977)和IBM PC(1981)為代表的第四代計算機中,紙帶設(shè)備的位置完全由鍵盤、打印機和CRT顯示器的新式設(shè)備所代之,而數(shù)據(jù)存儲設(shè)備則使用了速度更快、容量更大的磁帶或磁盤。大學(xué)生再去上電腦

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論