信息管理原理與方法(第二版)第3章_第1頁
信息管理原理與方法(第二版)第3章_第2頁
信息管理原理與方法(第二版)第3章_第3頁
信息管理原理與方法(第二版)第3章_第4頁
信息管理原理與方法(第二版)第3章_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第3章 信息存儲與信息檢索3.1 3.1 信息存儲信息存儲3.1.1 3.1.1 信息存儲的作用和原則信息存儲的作用和原則3.1.2 3.1.2 信息存儲技術(shù)信息存儲技術(shù)3.1.3 3.1.3 信息存儲體系信息存儲體系3.2 3.2 信息檢索信息檢索3.2.1 3.2.1 信息檢索的作用和原則信息檢索的作用和原則3.2.2 3.2.2 信息檢索的過程信息檢索的過程3.2.3 3.2.3 信息檢索的類型信息檢索的類型3.2.4 3.2.4 信息檢索的效率信息檢索的效率3.2.5 3.2.5 信息檢索系統(tǒng)信息檢索系統(tǒng)3.2.6 3.2.6 網(wǎng)絡(luò)信息檢索網(wǎng)絡(luò)信息檢索 學(xué)習(xí)目標 (1)理解信息存儲、信

2、息檢索的作用和原則;了解信息存儲的 技術(shù)和存儲體系;(2)了解信息檢索的過程、類型和系統(tǒng);理解信息檢索的效率;(3)掌握網(wǎng)絡(luò)信息檢索的特點和原理;掌握網(wǎng)絡(luò)信息檢索的方 法和技巧。信息存儲信息存儲是指通過多種形式記錄和排序信息的過程。是指通過多種形式記錄和排序信息的過程。3.1.1 3.1.1 信息存儲的作用和原則信息存儲的作用和原則l信息存儲的作用:(1)方便檢索; (2)利于共享(3)延長壽命; (4)方便管理 l信息存儲的基本原則:(1)統(tǒng)一性原則; (2)便利性原則(3)有序性原則; (4)先進性原則 3.1 信息存儲3.1.2 3.1.2 信息存儲技術(shù)信息存儲技術(shù)1. 1. 信息的印刷

3、存儲信息的印刷存儲l造紙和印刷術(shù)造紙和印刷術(shù)的發(fā)明,對信息的存儲與交流帶來了深刻的影響。 l紙質(zhì)文獻紙質(zhì)文獻對信息的揭示和組織的四個基本要素:信息內(nèi)容、載體材料、記錄符號和記錄方式。l按照文獻編纂方法和出版特點劃分,可將紙質(zhì)文獻分為圖書、期刊、報紙、會議文獻、科技報告、標準文獻、專利文獻、學(xué)位論文、產(chǎn)品說明書等。 3.1 信息存儲2. 2. 信息的磁存儲信息的磁存儲l在現(xiàn)代信息存儲技術(shù)中,磁存儲是信息存儲的主要手段。磁存儲信息系統(tǒng),尤其是硬磁盤存儲系統(tǒng),是當(dāng)今各類計算機系統(tǒng)的最主要存儲設(shè)備。l磁存儲的特點:磁存儲的特點: (1 1)長久保存、重復(fù)使用和重新記錄;)長久保存、重復(fù)使用和重新記錄;

4、 (2 2)多路存儲;)多路存儲; (3 3)存儲頻帶寬廣。)存儲頻帶寬廣。l幾種主要磁存儲介質(zhì):幾種主要磁存儲介質(zhì): (1 1)計算機磁帶)計算機磁帶 (2 2)硬盤)硬盤 (3 3)軟盤)軟盤 (4 4)移動存儲磁盤)移動存儲磁盤IBM System Storage TS3100 磁帶庫磁帶庫軟盤軟盤 移動硬盤(移動硬盤(U盤、盤、MP3)臺式機硬盤臺式機硬盤 3.1 信息存儲3. 3. 信息的縮微存儲信息的縮微存儲l信息的縮微存儲是用縮微攝影機將文件資料縮小拍攝 在感光膠片上,經(jīng)加工處理后作為信息載體保存起來。l縮微存儲技術(shù)的特點: (1)縮微品的信息存儲容量大,密度高; (2)存儲介質(zhì)

5、占用空間小,可節(jié)省大量空間; (3)縮微品忠于原件,不易出差錯; (4)保存時間長; (5)便于計算機檢索。 l主要成就: (1)計算機輸出縮微膠片(COM) 技術(shù) (2)計算機輸入縮微膠片(CIM) 技術(shù) (3)計算機輔助縮微品檢索系統(tǒng) (4)視頻縮微系統(tǒng) 縮微膠片閱讀器縮微膠片閱讀器縮微膠片縮微膠片縮微膠片掃描儀縮微膠片掃描儀3.1 信息存儲4. 4. 信息的光存儲信息的光存儲l光存儲以激光為光源,以薄膜作為信息存儲材料。 l特點:特點: (1)數(shù)據(jù)存儲密度高、容量大、盤片可更換、攜帶方便 (2)存儲壽命長、功能多樣化 (3)生產(chǎn)成本低廉、數(shù)據(jù)復(fù)制工藝簡單、效率高。 3.1 信息存儲3.1

6、.3 3.1.3 信息存儲體系信息存儲體系l計算機信息存儲體系是利用計算機對一定范圍內(nèi)的信息集合進行選擇、記錄和存儲,以便用戶采用科學(xué)手段與技術(shù)獲取必要和充分信息資源的信息系統(tǒng)。l從整體上看,計算機信息存儲系統(tǒng)包括硬件、軟件和數(shù)據(jù)庫。 1. 1. 硬件設(shè)備硬件設(shè)備l這是計算機信息存儲體系用于處理數(shù)據(jù)的各種硬設(shè)備的總稱。包括:外部設(shè)備;中央處理機;主存儲器;外部存儲器等3.1 信息存儲2. 2. 軟件設(shè)備軟件設(shè)備l軟件設(shè)備是計算機信息存儲體系中各類程序和各種文件數(shù)據(jù)的總稱,分為系統(tǒng)軟件和應(yīng)用軟件。 系統(tǒng)軟件系統(tǒng)軟件是關(guān)于組織控制計算機硬件資源協(xié)調(diào)工作的操作程序。應(yīng)用軟件應(yīng)用軟件通常包括自動標引軟

7、件、詞表管理軟件、各種匹配程序及數(shù)據(jù)庫管理程序等。 數(shù)據(jù)庫管理程序數(shù)據(jù)庫管理程序是計算機信息存儲體系最基本、最重要的組成部分。3.1 信息存儲3. 3. 數(shù)據(jù)庫數(shù)據(jù)庫l數(shù)據(jù)庫是計算機信息存儲體系的基礎(chǔ),也是用戶進行計算機信息存儲與檢索的對象。l數(shù)據(jù)庫的類型數(shù)據(jù)庫的類型:從數(shù)據(jù)的存儲方式劃分,可以分為層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫。從數(shù)據(jù)存儲的介質(zhì)劃分,可以分為磁帶數(shù)據(jù)庫、磁盤數(shù)據(jù)庫和光盤數(shù)據(jù)庫。 從數(shù)據(jù)類型劃分,有文獻數(shù)據(jù)庫、數(shù)據(jù)型數(shù)據(jù)庫、事實型數(shù)據(jù)庫、多媒體數(shù)據(jù)庫和超媒體數(shù)據(jù)庫。3.1 信息存儲4. 4. 數(shù)據(jù)倉庫數(shù)據(jù)倉庫l數(shù)據(jù)倉庫數(shù)據(jù)倉庫(DW)是一個面向主題的、集成的、相對穩(wěn)定的、反

8、映歷史變化的數(shù)據(jù)集合,用于支持管理決策,容量一般大于100GB。l數(shù)據(jù)倉庫的特征:數(shù)據(jù)倉庫的特征: (1) 面向主題 (2)集成的 (3)相對穩(wěn)定 (4)反映歷史變化 l數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)( (四個層次四個層次) ) : (1)數(shù)據(jù)源(基礎(chǔ)和源泉) (2)數(shù)據(jù)的存儲與管理(核心) (3)OLAP(在線分析技術(shù))服務(wù)器(分析) (4)前端工具(應(yīng)用開發(fā))3.1 信息存儲數(shù)據(jù)庫與數(shù)據(jù)倉庫的比較數(shù)據(jù)庫與數(shù)據(jù)倉庫的比較表表比較特征比較特征數(shù)據(jù)庫數(shù)據(jù)庫數(shù)據(jù)倉庫數(shù)據(jù)倉庫設(shè)計目標設(shè)計目標面向事務(wù)設(shè)計,為捕獲面向事務(wù)設(shè)計,為捕獲數(shù)據(jù)而設(shè)計數(shù)據(jù)而設(shè)計面向主題設(shè)計,為分析數(shù)面向主題設(shè)計,為分

9、析數(shù)據(jù)而設(shè)計據(jù)而設(shè)計存儲對象存儲對象在線交易數(shù)據(jù)在線交易數(shù)據(jù)歷史數(shù)據(jù)歷史數(shù)據(jù)數(shù)據(jù)處理類型數(shù)據(jù)處理類型事務(wù)型數(shù)據(jù)事務(wù)型數(shù)據(jù)決策支持型數(shù)據(jù)決策支持型數(shù)據(jù)數(shù)據(jù)操作特點數(shù)據(jù)操作特點經(jīng)常進行記錄修改和刪經(jīng)常進行記錄修改和刪除等操作除等操作記錄的修改和刪除操作很記錄的修改和刪除操作很少少,通常,通常只需要定期的加只需要定期的加載和刷新載和刷新冗余設(shè)計特點冗余設(shè)計特點盡量避免冗余盡量避免冗余有意引入冗余有意引入冗余3.2.1 信息檢索的作用和原則l信息檢索信息檢索是指從以任何方式組成的信息集合中,查找特定用戶在特定時間和條件下所需信息的過程。l信息檢索的作用:信息檢索的作用: (1)有利于充分利用信息資源,

10、避免重復(fù)勞動。 (2)有利于縮短獲取信息的時間,提高工作效率。 (3)有利于決策者進行決策。 l信息檢索的基本原則:信息檢索的基本原則: (1)目的性。信息檢索一定要以所要達到的目的為原則,不能盲目行事。 (2)時間性。信息檢索要有一個時間概念。 (3)全面性。信息檢索應(yīng)盡量全面系統(tǒng)地提供用戶所需要的一切信息。 (4)準確性。信息檢索的結(jié)果應(yīng)該盡可能做到準確無誤。 (5)規(guī)范性。信息檢索應(yīng)該遵循信息檢索規(guī)律,按檢索規(guī)則辦事。 3.2 信息檢索3.2.2 信息檢索的過程(1 1)信息標引和存儲過程)信息標引和存儲過程 信息標引和存儲是對大量無序的信息資源進行標引處理,使之有 序化,并按科學(xué)的方法

11、存儲,形成檢索工具或檢索文檔,即組織檢索 系統(tǒng)的過程。(2 2)信息的需求分析和檢索過程)信息的需求分析和檢索過程 信息的需求分析和檢索是分析用戶的信息需求,利用已組織好的 檢索系統(tǒng),按照系統(tǒng)提供的方法與途徑檢索有關(guān)信息,即檢索系統(tǒng)的 應(yīng)用過程。3.2 信息檢索l信息檢索信息檢索與與信息存儲信息存儲的關(guān)系的關(guān)系:信息檢索是通過信息存取系統(tǒng)(即檢索工具)來實現(xiàn)的。3.2 信息檢索信息信息用戶用戶信息檢索信息檢索信息存儲信息存儲轉(zhuǎn)換成轉(zhuǎn)換成系統(tǒng)標識系統(tǒng)標識轉(zhuǎn)換成轉(zhuǎn)換成檢索標識檢索標識主題主題分析分析信信息息資資源源形形式式概概念念系系統(tǒng)統(tǒng)標標識識語語言言形形式式概概念念課題課題分析分析檢檢索索提提

12、問問答答復(fù)復(fù)信息集合信息集合檢索檢索系統(tǒng)系統(tǒng)圖圖3.3 信息存儲與信息檢索關(guān)系圖信息存儲與信息檢索關(guān)系圖3.2.3 3.2.3 信息檢索的類型信息檢索的類型(1 1)書目信息檢索)書目信息檢索 從存儲有標題項、作者項、出版項或文摘項的檢索系統(tǒng)中獲取有關(guān)信從存儲有標題項、作者項、出版項或文摘項的檢索系統(tǒng)中獲取有關(guān)信 息線索。息線索。 (2 2)全文信息檢索)全文信息檢索 從存儲整篇論文、專利說明書或整本著作的檢索系統(tǒng)中獲取全文信息。從存儲整篇論文、專利說明書或整本著作的檢索系統(tǒng)中獲取全文信息。(3 3)數(shù)據(jù)信息檢索)數(shù)據(jù)信息檢索 從存儲有大量數(shù)據(jù)、圖表的檢索系統(tǒng)中獲取數(shù)值性信息從存儲有大量數(shù)據(jù)、

13、圖表的檢索系統(tǒng)中獲取數(shù)值性信息 。(4 4)事實信息檢索)事實信息檢索 從存儲有大量事實信息和數(shù)據(jù)信息的檢索系統(tǒng)中獲取某一事項的具體從存儲有大量事實信息和數(shù)據(jù)信息的檢索系統(tǒng)中獲取某一事項的具體 答案答案 。3.2 信息檢索3.2.4 3.2.4 信息檢索的效率信息檢索的效率l信息檢索效率是研究信息檢索原理的核心,是評價一個檢索系統(tǒng)性能優(yōu)劣的標準,它始終貫穿于信息存儲和檢索的全過程。主要有以下衡量指標: 1. 查全率(R)= 2. 查準率(P)= 3. 漏檢率(O)= 4. 誤檢率(N)=3.2 信息檢索mw1%100 xw%100mwxw1w: : 檢索出的相關(guān)信息量檢索出的相關(guān)信息量x: :

14、 信息庫信息庫中存儲的相關(guān)信息量中存儲的相關(guān)信息量m: : 檢出檢出信息總量信息總量3.2.5 3.2.5 信息檢索系統(tǒng)信息檢索系統(tǒng)l信息檢索系統(tǒng)信息檢索系統(tǒng)是擁有一定的存儲、檢索技術(shù)裝備,存儲經(jīng)過加工的各類信息,并能為信息用戶檢索所需信息的服務(wù)系統(tǒng)。 l檢索系統(tǒng)的構(gòu)成檢索系統(tǒng)的構(gòu)成:信息數(shù)據(jù)庫存儲、檢索信息的裝備存儲、檢索信息的方法系統(tǒng)工作人員信息用戶3.2 信息檢索l信息檢索系統(tǒng)按使用的技術(shù)手段可分為:手工檢索系統(tǒng)u又稱傳統(tǒng)檢索系統(tǒng),是用人工查找信息的檢索系統(tǒng)。其主要類型有各種書本式或卡片式的目錄、題錄、文摘和各種參考工具書等。 計算機檢索系統(tǒng)計算機檢索系統(tǒng)u又稱現(xiàn)代化檢索系統(tǒng),是用計算機

15、及其網(wǎng)絡(luò)技術(shù)、遠程通訊技術(shù)、光盤技術(shù)等構(gòu)成的存儲和檢索信息的檢索系統(tǒng)。u計算機檢索系統(tǒng),按使用的設(shè)備和采用的通訊手段,可分為:聯(lián)機檢索系統(tǒng)聯(lián)機檢索系統(tǒng)光盤檢索系統(tǒng)光盤檢索系統(tǒng)網(wǎng)絡(luò)檢索系統(tǒng)網(wǎng)絡(luò)檢索系統(tǒng)3.2 信息檢索3.2.6 3.2.6 網(wǎng)絡(luò)網(wǎng)絡(luò)信息檢索信息檢索1. 1. 網(wǎng)絡(luò)信息檢索的特點網(wǎng)絡(luò)信息檢索的特點 (1 1)網(wǎng)絡(luò)信息檢索的范圍不斷拓寬。)網(wǎng)絡(luò)信息檢索的范圍不斷拓寬。 (2 2)信息檢索手段更加容易。)信息檢索手段更加容易。 (3 3) 信息檢索的途徑更加靈活。信息檢索的途徑更加靈活。2. 2. 網(wǎng)絡(luò)信息檢索的原理網(wǎng)絡(luò)信息檢索的原理 網(wǎng)絡(luò)信息的檢索主要是通過網(wǎng)絡(luò)信息的檢索主要是通過搜

16、索引擎搜索引擎在在Internet上查找信息,檢索上查找信息,檢索原理是使用原理是使用Robot(一種搜索程序,名字叫網(wǎng)絡(luò)蜘蛛,類似的軟件還有(一種搜索程序,名字叫網(wǎng)絡(luò)蜘蛛,類似的軟件還有Spider,Crawler,Wander 等)來遍歷因特網(wǎng),將等)來遍歷因特網(wǎng),將WWW上分布的信息上分布的信息下載到本地文檔庫,然后對文檔內(nèi)容進行分析并建立索引,對于用戶提下載到本地文檔庫,然后對文檔內(nèi)容進行分析并建立索引,對于用戶提出的查詢提問,搜索引擎通過查找索引找出匹配的文檔或鏈接,再返回出的查詢提問,搜索引擎通過查找索引找出匹配的文檔或鏈接,再返回給用戶。給用戶。3.2 信息檢索l目前搜索引擎搜索

17、引擎主要通過兩種技術(shù)實現(xiàn)信息檢索: (1 1)使用網(wǎng)站分類技術(shù))使用網(wǎng)站分類技術(shù)把網(wǎng)站進行樹狀歸類,對每個網(wǎng)站都有簡略的描述。 (2 2)使用全文檢索技術(shù))使用全文檢索技術(shù)全文處理的對象是文本,通過網(wǎng)頁抓取程序?qū)Υ罅烤W(wǎng)頁數(shù)據(jù)建立由字(詞)組成的倒排索引,以便用戶用關(guān)鍵詞對文檔進行查詢,系統(tǒng)則返回含該關(guān)鍵詞的網(wǎng)頁。 3.2 信息檢索3. 3. 網(wǎng)絡(luò)信息檢索的方法網(wǎng)絡(luò)信息檢索的方法 (1 1)直接訪問信息源)直接訪問信息源直接通過直接通過IP IP 地址、域名打開網(wǎng)站或網(wǎng)頁。地址、域名打開網(wǎng)站或網(wǎng)頁。 (2 2)借助網(wǎng)絡(luò)檢索工具查找信息)借助網(wǎng)絡(luò)檢索工具查找信息網(wǎng)絡(luò)檢索工具網(wǎng)絡(luò)檢索工具是經(jīng)專業(yè)人員

18、對網(wǎng)絡(luò)信息資源的采集、組織、評價、過濾、控是經(jīng)專業(yè)人員對網(wǎng)絡(luò)信息資源的采集、組織、評價、過濾、控制、檢索等手段的全面把握而開發(fā)出的可供瀏覽和檢索的網(wǎng)站資源主題指南。制、檢索等手段的全面把握而開發(fā)出的可供瀏覽和檢索的網(wǎng)站資源主題指南。 (3 3)利用搜索引擎進行信息檢索)利用搜索引擎進行信息檢索搜索引擎搜索引擎是能進行關(guān)鍵詞、詞組或自然語言檢索的工具。用戶提出檢索要求,是能進行關(guān)鍵詞、詞組或自然語言檢索的工具。用戶提出檢索要求,搜索引擎代替用戶在數(shù)據(jù)庫中進行檢索,并將檢索結(jié)果提供給用戶。搜索引擎代替用戶在數(shù)據(jù)庫中進行檢索,并將檢索結(jié)果提供給用戶。 (4 4)利用大型專業(yè)數(shù)據(jù)庫搜索)利用大型專業(yè)數(shù)據(jù)庫搜索 (5 5)通過新聞組搜索)通過新聞組搜索新聞組新聞組(英文名(英文名Usenet 或或News Group),簡單地說就是一個基于網(wǎng)絡(luò)的計),簡單地說就是一個基于網(wǎng)絡(luò)的計算機組合,這些計算機被稱為新聞服務(wù)器,不同的用戶通過一些軟件可連接算機組合,這些計算機被稱為新聞服務(wù)器,不同的用戶通過一些軟件可連接到新聞服務(wù)器上,閱讀其他人的消息并可以參與討論。到新聞服務(wù)器上,閱讀其他人的消息并可以參與討論。3.2 信息檢索4. 4. 網(wǎng)絡(luò)信息檢索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論