第二章-信息檢索概述課件_第1頁(yè)
第二章-信息檢索概述課件_第2頁(yè)
第二章-信息檢索概述課件_第3頁(yè)
第二章-信息檢索概述課件_第4頁(yè)
第二章-信息檢索概述課件_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章

信息檢索概述第二章

信息檢索概述1一信息與信息源

1、信息信息的含義:信息原指消息的傳遞,現(xiàn)指應(yīng)用文字、數(shù)據(jù)或信號(hào)等形式通過(guò)一定的傳遞和處理,來(lái)表現(xiàn)各種相互聯(lián)系的客觀事物在運(yùn)動(dòng)中所具有的特征性內(nèi)容的總稱。信息不是指事物本身,而是事物存在的方式和運(yùn)動(dòng)狀態(tài)的表現(xiàn)形式,是客觀事物經(jīng)過(guò)感知或認(rèn)識(shí)后的再現(xiàn)。一信息與信息源1、信息2信息的特征客觀性:信息不是虛無(wú)飄渺的事物,它的存在可以被人們感知、獲取、傳遞和利用依附性:信息必須依附于一定的載體(如聲波、紙張、化學(xué)材料、磁性材料等)才能流通和傳遞??蓚鬟f性:不同載體的信息可以通過(guò)計(jì)算機(jī)、人際交流、文獻(xiàn)交流或大眾傳媒等手段傳遞給信息用戶,最大化的利用信息可塑性:信息在流通和使用過(guò)程中,人們借助于先進(jìn)的技術(shù),可以對(duì)其進(jìn)行綜合、分析及加工處理時(shí)效性:由于事物是在不斷變化著的,因此表征事物存在方式和運(yùn)動(dòng)狀態(tài)的信息也必然會(huì)隨之改變共享性:信息可以多次傳播,不失其內(nèi)容,與實(shí)物交易不同。第二章-信息檢索概述課件3信息知識(shí)情報(bào)與文獻(xiàn)知識(shí):人類在改造世界的過(guò)程中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。信息被人類所感知并被提煉加工即成為知識(shí)。知識(shí)是信息升華的結(jié)果,是一種濃縮的系統(tǒng)化的信息。信息是知識(shí)的基礎(chǔ),知識(shí)是信息的核心。信息知識(shí)情報(bào)與文獻(xiàn)4情報(bào):是人們?cè)谝欢〞r(shí)間內(nèi)為一定目的而傳遞的有使用價(jià)值的知識(shí)或信息,它有明確的接受對(duì)象,屬于人工知識(shí)或信息的范疇,它來(lái)源于信息與知識(shí),是激活了的知識(shí)、動(dòng)態(tài)的信息。文獻(xiàn):是記錄知識(shí)或信息的一切載體。即用文字、圖形、符號(hào)、聲頻、視頻等技術(shù)手段記錄人類知識(shí)的一種載體。實(shí)際上文獻(xiàn)是由知識(shí)內(nèi)容、信息符號(hào)和載體材料三個(gè)不可分割的基本要素構(gòu)成。知識(shí)是文獻(xiàn)的實(shí)質(zhì)內(nèi)容,符號(hào)、文字、聲音是人體感覺(jué)信息的媒介,載體是文獻(xiàn)的外在形式。

情報(bào):是人們?cè)谝欢〞r(shí)間內(nèi)為一定目的而傳遞的有使用價(jià)值的知識(shí)或5它們之間的邏輯關(guān)系和范疇關(guān)系

它們之間的邏輯關(guān)系和范疇關(guān)系6思考題偶爾從別人那里聽到一個(gè)未經(jīng)證實(shí)的事,是不是信息?為什么?農(nóng)諺是直接關(guān)系農(nóng)業(yè)的耕種、收獲和其他農(nóng)事的諺語(yǔ),它們是長(zhǎng)期以來(lái)勞動(dòng)人民農(nóng)業(yè)生產(chǎn)知識(shí)、經(jīng)驗(yàn)的總結(jié)。下面看幾條有關(guān)氣象的農(nóng)諺: 朝霞不出門,晚霞走千里/蜘蛛結(jié)網(wǎng),雨必晴;螞蟻搬家,雨必下/天上鉤鉤云,地下雨淋淋/天上鯉魚斑,明天曬谷不用翻/云往東,刮陣風(fēng);云往西,披蓑衣指出每一條諺語(yǔ)中,哪些是信息,哪些是知識(shí)?從中可以得到什么啟示?思考題偶爾從別人那里聽到一個(gè)未經(jīng)證實(shí)的事,是不是信息?為什么72、信息源文獻(xiàn)信息源(具體內(nèi)容見第三章) 有信息價(jià)值,被人為記錄和保存,能夠被傳播,接收端可以反復(fù)重現(xiàn)其內(nèi)容非文獻(xiàn)信息源 有信息價(jià)值但不具有或并不明顯具有其他要素特征。強(qiáng)調(diào)是通過(guò)人的感官獲取的實(shí)時(shí)信息,或者說(shuō)第一手的知識(shí)信息。2、信息源文獻(xiàn)信息源(具體內(nèi)容見第三章)8非文獻(xiàn)信息源可分為實(shí)物信息、口頭信息和實(shí)情信息實(shí)物信息就是現(xiàn)實(shí)存在的物化了的各種物質(zhì)形態(tài)的信息。包括實(shí)物、樣品或展覽會(huì)的展品??陬^信息是指存在于人腦記憶中,通過(guò)交談、談?wù)摗?bào)告等方式交流傳播的信息非文獻(xiàn)信息源可分為實(shí)物信息、口頭信息和實(shí)情信息9實(shí)情信息是現(xiàn)實(shí)存在的自然現(xiàn)象和社會(huì)現(xiàn)象的信息。它的表現(xiàn)形式不是實(shí)物,而是自然現(xiàn)象或者社會(huì)現(xiàn)象的狀態(tài)及其發(fā)展過(guò)程。自然現(xiàn)象(氣候、水文、物理、化學(xué)、生物等的演進(jìn)和反應(yīng)的狀態(tài)和過(guò)程)社會(huì)現(xiàn)象(政治法律事務(wù)、軍事行動(dòng)、企業(yè)、商業(yè)和事業(yè)機(jī)構(gòu)運(yùn)行狀態(tài)、工程現(xiàn)象、演出現(xiàn)場(chǎng)、經(jīng)濟(jì)交易的實(shí)時(shí)交互過(guò)程、人機(jī)運(yùn)動(dòng)過(guò)程等)實(shí)情信息是現(xiàn)實(shí)存在的自然現(xiàn)象和社會(huì)現(xiàn)象的信息。它的表現(xiàn)形式不10思考題以下詞條可代表不同類型的信息源,請(qǐng)按文獻(xiàn)信息源和非文獻(xiàn)信息源為他們分類汽車、敦煌石窟、四庫(kù)全書、一年內(nèi)的天氣變化數(shù)據(jù)、上市公司年報(bào)、經(jīng)濟(jì)新聞、地震儀測(cè)得的數(shù)據(jù)、圖書縮微膠片、甲骨文、古時(shí)候的陶片、記錄片、古籍我國(guó)氣象專家根據(jù)多種信息,預(yù)測(cè)出2008年可能出現(xiàn)像1998年那樣的大洪水,結(jié)果該年自6月中旬以來(lái),浙江、福建、江西、湖南、廣東、廣西等地部分地區(qū)遭受強(qiáng)暴雨襲擊,造成嚴(yán)重洪澇、山體滑坡和泥石流災(zāi)害,預(yù)言變成現(xiàn)實(shí)。請(qǐng)問(wèn)專家預(yù)測(cè)可能會(huì)用到哪些信息?分別屬于什么信息類型?

思考題以下詞條可代表不同類型的信息源,請(qǐng)按文獻(xiàn)信息源和非文獻(xiàn)11“信息分析與預(yù)測(cè)”是競(jìng)爭(zhēng)情報(bào)領(lǐng)域一項(xiàng)很重要的手段。例如:通過(guò)檢索競(jìng)爭(zhēng)對(duì)手在某一技術(shù)領(lǐng)域的專利申請(qǐng),并對(duì)其信息內(nèi)容進(jìn)行深入分析,便可以判斷出競(jìng)爭(zhēng)對(duì)手的R&D(研究與發(fā)展)方向、經(jīng)營(yíng)策略、產(chǎn)品和技術(shù)優(yōu)勢(shì)。請(qǐng)問(wèn)專利屬于什么類型的信息源?為什么可以通過(guò)搜集和分析所掌握的信息預(yù)測(cè)出競(jìng)爭(zhēng)對(duì)手的發(fā)展?fàn)顟B(tài)和趨勢(shì)?“信息分析與預(yù)測(cè)”是競(jìng)爭(zhēng)情報(bào)領(lǐng)域一項(xiàng)很重要的手段。例如:通過(guò)12案例分析: 為了在極短的時(shí)間內(nèi)盡快開發(fā)出一系列馳騁全球的名牌摩托車產(chǎn)品,1968年日本集中了全國(guó)各摩托車修理廠200名具有豐富專業(yè)知識(shí)和研究能力的工程技術(shù)人員和情報(bào)人員,分成12個(gè)小組,用了一年的時(shí)間,走遍世界上所有重要的摩托車生產(chǎn)廠家,對(duì)世界摩托車工業(yè)進(jìn)行了有史以來(lái)最廣泛的全球性調(diào)查。在訂貨、幫助建廠的幌子下,他們搜集了大量的信息,并帶回170多部樣機(jī)。他們每種樣機(jī)購(gòu)回兩部,一部解剖,一部做運(yùn)行試驗(yàn),并結(jié)合搜集到的信息,對(duì)全部廠家各種型號(hào)的摩托車及其零部件的質(zhì)量、優(yōu)缺點(diǎn)等進(jìn)行比較、分析和綜合,博采眾家之長(zhǎng),最后設(shè)計(jì)出一種輕便耐用、性能優(yōu)良、價(jià)格便宜的摩托車,并迅速占領(lǐng)國(guó)內(nèi)市場(chǎng)。

案例分析:13

1)通過(guò)以上案例你得到什么啟示? 2)例子中日本從世界各地帶回來(lái)的摩托車是否屬于信息?如果不是請(qǐng)說(shuō)明理由,如果是請(qǐng)說(shuō)明屬于什么類型的信息? 3)如果你是試驗(yàn)小組成員,除了摩托車你還會(huì)搜集哪些信息?為什么?1)通過(guò)以上案例你得到什么啟示?143、信息社會(huì)的基本內(nèi)容:3I、3C、3A、3R

3I:Information(信息)、Intelligence(智能)、Integration(集成、綜合)3C:Computer(計(jì)算機(jī))、Communication(通訊)、Control(控制)3A:FactoryAutomation(工廠自動(dòng)化)、OfficeAutomation(辦公自動(dòng)化)HomeAutomation(家庭自動(dòng)化)3R:MaterialRevolution(材料革命)、EnergyRevolution(能源革命)、InformationRevolution(信息革命)

3、信息社會(huì)的基本內(nèi)容:3I、3C、3A、3R

3I:In15二、信息檢索的基本內(nèi)容1、概念:1)信息檢索(informationretrieval)是指將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用戶的需要找出有關(guān)信息的過(guò)程。所以,它的全稱又叫信息存儲(chǔ)與檢索(informationstorageandretrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過(guò)程的后一步,即從信息集合中找出所需要信息的過(guò)程。相當(dāng)于我們所說(shuō)的信息查詢(informationsearch)。二、信息檢索的基本內(nèi)容1、概念:162)檢索語(yǔ)言:檢索語(yǔ)言是把信息的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人員與用戶聯(lián)系起來(lái),以便取得共同的理解、實(shí)現(xiàn)交流的語(yǔ)言。有人工語(yǔ)言(主題語(yǔ)言和分類語(yǔ)言)、自然語(yǔ)言之分。(第三章詳細(xì)介紹)

3)檢索方法:常用法、追溯法和循環(huán)法

(第四章詳細(xì)介紹)2)檢索語(yǔ)言:檢索語(yǔ)言是把信息的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人17檢索詞、檢索式、檢索策略(第四章詳細(xì)介紹)

檢索詞是用戶或檢索人員給出的字、詞、字符或短語(yǔ),用于查找含有它(它們)的記錄。

檢索式也稱檢索提問(wèn)式,是要求系統(tǒng)執(zhí)行的檢索語(yǔ)句。簡(jiǎn)單的檢索式由一個(gè)檢索詞和一個(gè)字段名構(gòu)成,復(fù)雜的檢索式由多個(gè)檢索詞和字段名通過(guò)關(guān)系算符連接而成。如:要利用英文搜索引擎查找網(wǎng)絡(luò)信息檢索方面的資料,檢索式為(WebORInternetORWWW)AND(Search*ORRetrieval*)。

檢索詞、檢索式、檢索策略(第四章詳細(xì)介紹)

檢18檢索策略:

所謂檢索策略,就是在分析課題內(nèi)容具有哪些概念單元的基礎(chǔ)上,確定檢索系統(tǒng)、學(xué)科領(lǐng)域、檢索文檔、檢索途徑和檢索詞,并科學(xué)安排各檢索詞之間的位置關(guān)系和邏輯關(guān)系以及查找步驟等。也就是為滿足信息需求所制定的一系列檢索方案。

檢索策略:

所謂檢索策略,就是在分析課題內(nèi)容195)檢中結(jié)果、查全率、查準(zhǔn)率(第四章詳細(xì)介紹)

檢中結(jié)果又稱檢索結(jié)果集,是數(shù)據(jù)庫(kù)中滿足(檢索式(即符合檢索條件)的那些記錄的集合

查全率:是指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)中存在的合乎該需要的所有文獻(xiàn)的比例

查準(zhǔn)率:是指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢出文獻(xiàn)全部數(shù)量的比例

5)檢中結(jié)果、查全率、查準(zhǔn)率(第四章詳細(xì)介紹)

檢中結(jié)果又稱202、信息檢索的類型:

(1)根據(jù)檢索手段的不同,分為手工檢索、計(jì)算機(jī)檢索(光盤檢索、聯(lián)機(jī)檢索和網(wǎng)絡(luò)檢索)

(2)根據(jù)檢索對(duì)象、

形式的不同,分為文獻(xiàn)型信息檢索、數(shù)據(jù)型信息檢索、事實(shí)型信息檢索。

2、信息檢索的類型:

(1)根據(jù)檢索手段的不同,分為手工檢索21

文獻(xiàn)型信息檢索(DocumentRetrieval):以文獻(xiàn)(包括題錄、文摘)為檢索對(duì)象的檢索。凡是查找某一主題、時(shí)代、地區(qū)、著者、文種的有關(guān)文獻(xiàn),以及回答這些文獻(xiàn)的出處和收藏處所等,都屬于文獻(xiàn)型信息檢索的范疇。完成文獻(xiàn)型信息檢索主要借助于各種書目型數(shù)據(jù)庫(kù)。

文獻(xiàn)型信息檢索(DocumentRetrie22數(shù)據(jù)型信息檢索(DataRetrieval):以數(shù)值或數(shù)據(jù)為對(duì)象的一種檢索,包括文獻(xiàn)中的某一數(shù)據(jù)、公式、圖表,以及某一物質(zhì)的化學(xué)分子式等,數(shù)據(jù)檢索分為數(shù)值型與非數(shù)值型。完成數(shù)據(jù)型信息檢索主要借助于各種數(shù)值數(shù)據(jù)庫(kù)和統(tǒng)計(jì)數(shù)據(jù)庫(kù)。

數(shù)據(jù)型信息檢索(DataRetrieval):以數(shù)值或數(shù)據(jù)23事實(shí)型信息檢索(FactRetrieval):以某一客觀事實(shí)為檢索對(duì)象,查找某一事物發(fā)生的時(shí)間、地點(diǎn)及過(guò)程的檢索,其檢索結(jié)果主要是客觀事實(shí)或?yàn)檎f(shuō)明事實(shí)而提供的相關(guān)資料。如:2001年7月通過(guò)的奧運(yùn)會(huì)主辦城市的結(jié)果與過(guò)程。完成事實(shí)型信息檢索主要借助于各種指南數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)。

事實(shí)型信息檢索(FactRetrieval):以某一客觀事24

3、信息檢索的發(fā)展歷程

3.1基本方向:手工檢索向計(jì)算機(jī)檢索(如穿孔、縮微、自動(dòng)化)發(fā)展,但是手工檢索與計(jì)算機(jī)檢索將長(zhǎng)期并存。因?yàn)橛?jì)算機(jī)檢索有其缺陷:(1)硬件條件不足:沒(méi)有計(jì)算機(jī),不能上網(wǎng),(2)數(shù)據(jù)庫(kù)不完善,(3)網(wǎng)絡(luò)慢或網(wǎng)絡(luò)故障等等。

3、信息檢索的發(fā)展歷程

3.1基本方向:手工檢索向計(jì)算機(jī)25

3.2計(jì)算機(jī)信息檢索的的產(chǎn)生和發(fā)展,分為五個(gè)階段:

(1)脫機(jī)批處理檢索:1954一64。定期由專職檢索人員把許多用戶課題匯總,批量處理提問(wèn)要求,并把結(jié)果提供給用戶。直接在計(jì)算機(jī)旁檢索,不需要遠(yuǎn)程終端設(shè)備及通信網(wǎng)絡(luò)。用戶在計(jì)算機(jī)處理成批檢索課題之后才知道檢索結(jié)果,不能直接、及時(shí)修改檢索策略,查全率和查準(zhǔn)率受到一定限制。

3.2計(jì)算機(jī)信息檢索的的產(chǎn)生和發(fā)展,分為五個(gè)階段:

(26(2)聯(lián)機(jī)情報(bào)檢索:20世紀(jì)70年代投入商業(yè)運(yùn)營(yíng)。用戶在計(jì)算機(jī)檢索系統(tǒng)的終端上,通過(guò)通信網(wǎng)絡(luò),使用特定的指令和算符,以人機(jī)對(duì)話方式,查詢遠(yuǎn)程計(jì)算機(jī)檢索系統(tǒng)核心的數(shù)據(jù)庫(kù),從中獲取所需信息的計(jì)算機(jī)檢索系統(tǒng)。

第二章-信息檢索概述課件27聯(lián)機(jī)檢索系統(tǒng)由三個(gè)部分組成:主機(jī)系統(tǒng)、通訊系統(tǒng)和終端設(shè)備

主機(jī)系統(tǒng)是聯(lián)機(jī)檢索系統(tǒng)的核心,它具備處理速度快、多道程序和分時(shí)功能,內(nèi)存容量大,多樣化的輸入輸出設(shè)備。

通訊系統(tǒng)是指終端設(shè)備與主機(jī)系統(tǒng)進(jìn)行通信的設(shè)備。通信線路分為兩種:專用的直達(dá)線路;通過(guò)撥號(hào)選擇對(duì)方的交換線路。前者是特定通信線路,后者使用電話網(wǎng)和用戶電報(bào)網(wǎng),聯(lián)機(jī)系統(tǒng)使用的通信線路就屬于后一種。

終端系統(tǒng)是人與系統(tǒng)的接口設(shè)備。它能將字符、聲音以及人類的信息表現(xiàn)形式轉(zhuǎn)換成系統(tǒng)的機(jī)器代碼。反之,將系統(tǒng)的結(jié)果還原成字符、聲音等形式,傳送給終端用戶。聯(lián)機(jī)檢索系統(tǒng)由三個(gè)部分組成:主機(jī)系統(tǒng)、通訊系統(tǒng)和終端設(shè)備

28

(3)國(guó)際聯(lián)機(jī)檢索:70年代中后期國(guó)際聯(lián)機(jī)檢索是指用戶利用終端設(shè)備,通過(guò)通信網(wǎng)與地球上任何地方的大型計(jì)算機(jī)信息檢索系統(tǒng)的主機(jī)進(jìn)行直接人機(jī)對(duì)話式的計(jì)算機(jī)檢索。

第二章-信息檢索概述課件29國(guó)際聯(lián)機(jī)檢索系統(tǒng)一般由通信網(wǎng)絡(luò)、國(guó)際聯(lián)機(jī)檢索中心、用戶終端等三部分組成。國(guó)際聯(lián)機(jī)檢索系統(tǒng)的服務(wù)方式有:回溯檢索、定題服務(wù)、聯(lián)機(jī)訂購(gòu)原文、電子郵件服務(wù)以及光盤服務(wù)五種方式。

國(guó)際聯(lián)機(jī)檢索系統(tǒng)一般由通信網(wǎng)絡(luò)、國(guó)際聯(lián)機(jī)檢索中心、用戶終端等30幾種主要的國(guó)際聯(lián)機(jī)檢索系統(tǒng)Dialog國(guó)際聯(lián)機(jī)檢索系統(tǒng)ESA/IRS國(guó)際聯(lián)機(jī)檢索系統(tǒng)ORBIT國(guó)際聯(lián)機(jī)檢索系統(tǒng)STN國(guó)際聯(lián)機(jī)檢索系統(tǒng)OCLC國(guó)際聯(lián)機(jī)檢索系統(tǒng)

這是目前世界著名的五大聯(lián)機(jī)檢索系統(tǒng)幾種主要的國(guó)際聯(lián)機(jī)檢索系統(tǒng)Dialog國(guó)際聯(lián)機(jī)檢索系統(tǒng)31

目前世界上最大的國(guó)際聯(lián)機(jī)檢索信息系統(tǒng)??偛吭O(shè)在美國(guó)舊金山附近的帕洛阿爾托市。此系統(tǒng)現(xiàn)有近600個(gè)數(shù)據(jù)庫(kù),信息總量超過(guò)5億條,其中包括50多種語(yǔ)言、6萬(wàn)多種期刊,數(shù)據(jù)庫(kù)內(nèi)容涉及綜合性學(xué)科、自然科學(xué)、應(yīng)用科學(xué)和社會(huì)科學(xué)等,文獻(xiàn)類型有圖書、報(bào)紙、期刊、學(xué)位論文、會(huì)議錄研究報(bào)告、政府文件、專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、年鑒、市場(chǎng)行情和廠商名錄等。DIALOG

目前世界上最大的國(guó)際聯(lián)機(jī)檢索信息系統(tǒng)。32ORBIT

ORBIT的全稱為onlineretrievalofbibliographicinformationtimeshared即文獻(xiàn)目錄信息分時(shí)聯(lián)機(jī)檢索。是第二大國(guó)際聯(lián)機(jī)檢索系統(tǒng),擁有200多個(gè)數(shù)據(jù)庫(kù)。以化工、石油、生物、化學(xué)、環(huán)境科學(xué)、醫(yī)學(xué)、運(yùn)動(dòng)科學(xué)和安全科學(xué)等深入文獻(xiàn)比較齊全而著稱。其特色數(shù)據(jù)庫(kù)有SAE(汽車、飛機(jī)等交通工具)TULSA(石油、天然氣開采與勘探)等30多個(gè)數(shù)據(jù)庫(kù),為該系統(tǒng)獨(dú)有。ORBITORBIT的全稱為onli33ESA/IRS是歐洲最大的聯(lián)機(jī)檢索中心。也是世界上大型的國(guó)際聯(lián)機(jī)檢索系統(tǒng)之一,僅次于美國(guó)的DIALOG和ORBIT聯(lián)機(jī)檢索系統(tǒng)。涉及的專業(yè)范圍有:科技、農(nóng)業(yè)、衛(wèi)生、管理、社會(huì)科學(xué)和宇航工程及技術(shù)等方面。有120多個(gè)數(shù)據(jù)庫(kù),其中,酸雨(ACIDRAIN)、鑄造(BIIPAM-CTIF)、原材料價(jià)格(PRICEDATA)、衛(wèi)星遙感圖象(LEDA)、宇航及高技術(shù)軟件(SPACESOFT)等為特色數(shù)據(jù)庫(kù)。ESA/IRS是歐洲最大的聯(lián)機(jī)檢索中34STN

STN(TheScientificandTechnicalInformationNetworkInternational)是國(guó)際科學(xué)技術(shù)信息網(wǎng)絡(luò)系統(tǒng)的簡(jiǎn)稱。是由德國(guó)卡爾斯魯厄能源、物理、數(shù)學(xué)專業(yè)信息中心(FIT)、美國(guó)化學(xué)文摘社(CAS)和日本國(guó)際化學(xué)信息協(xié)會(huì)(JAICI)三家合作經(jīng)營(yíng)的國(guó)際聯(lián)機(jī)檢索系統(tǒng)。涉及的專業(yè)范圍:化學(xué)、化工、生物、醫(yī)學(xué)、數(shù)學(xué)、物理、能源、冶金、建筑等方面。其特色數(shù)據(jù)庫(kù)有:CAS化學(xué)物質(zhì)結(jié)構(gòu)圖形數(shù)據(jù)庫(kù)(REGISTRY)、德國(guó)專利數(shù)據(jù)庫(kù)(PATDPA)、碳13核磁共振和紅外光譜數(shù)值圖形數(shù)據(jù)庫(kù)(C13-NMR/IR)。STNSTN(TheScienti35STN的特點(diǎn)合作建網(wǎng),分布式管理多文檔檢索,方便實(shí)用字段限定檢索時(shí),只使用后綴碼,無(wú)前綴碼擁有世界上第一批聯(lián)機(jī)圖象數(shù)據(jù)庫(kù)STN的特點(diǎn)合作建網(wǎng),分布式管理36OCLC

OCLC(OnlineComputerLibraryCenter)即聯(lián)機(jī)計(jì)算機(jī)圖書館中心。是世界上最大的文獻(xiàn)信息服務(wù)機(jī)構(gòu)之一??偛吭O(shè)在美國(guó)俄亥俄州,1971年建成聯(lián)機(jī)系統(tǒng),擁有370多種語(yǔ)言、3400多萬(wàn)條聯(lián)合書目記錄數(shù)據(jù)庫(kù),OCLC的“第一檢索系統(tǒng)”(FirstSearch)提供聯(lián)機(jī)信息檢索系統(tǒng)目前有70多個(gè)數(shù)據(jù)庫(kù),涉及13個(gè)主題領(lǐng)域。不僅有書目信息而且絕大部分可以直接獲取全文。OCLCOCLC(Online37(4)光盤檢索:80年代初期,其全稱為高密度光盤(CompactDisk),主要是利用激光、計(jì)算機(jī)及光電集成等技術(shù)實(shí)現(xiàn)信息存儲(chǔ)的數(shù)字化。以光盤為介質(zhì)的光盤數(shù)據(jù)庫(kù)檢索系統(tǒng)由于信息存儲(chǔ)量大,簡(jiǎn)單易用而取勝。

(4)光盤檢索:80年代初期,其全稱為高密度光盤(Compa38

(5)網(wǎng)絡(luò)信息檢索:

網(wǎng)絡(luò)信息檢索是通過(guò)標(biāo)準(zhǔn)通信方式將世界各地的計(jì)算機(jī)網(wǎng)絡(luò)連接起來(lái),形成一個(gè)基于客戶機(jī)-服務(wù)器模式的網(wǎng)絡(luò)分布數(shù)據(jù)庫(kù)結(jié)構(gòu)。它在全球范圍內(nèi)把科技信息、商貿(mào)信息、經(jīng)濟(jì)信息、時(shí)事新聞以及日常生活信息通過(guò)互聯(lián)網(wǎng)絡(luò)合在一起,向億萬(wàn)聯(lián)網(wǎng)用戶提供廣泛的信息檢索與服務(wù)。它是信息化社會(huì)應(yīng)用最廣泛、最活躍的領(lǐng)域。

(5)網(wǎng)絡(luò)信息檢索:

網(wǎng)絡(luò)信息檢索是通過(guò)標(biāo)39網(wǎng)絡(luò)信息檢索服務(wù)的特點(diǎn):

1)信息檢索服務(wù)的開放性。網(wǎng)絡(luò)信息系統(tǒng)中包含信息資源、信息設(shè)備、信息通道、信息檢索軟件及信息終端等子系統(tǒng),各個(gè)子系統(tǒng)都是開放的,其信息資源面向所有用戶。

2)超文本的多鏈接性。以超文本技術(shù)為基礎(chǔ)鏈結(jié)構(gòu)將不同地方的相關(guān)信息有機(jī)聯(lián)系起來(lái),使用戶可通過(guò)點(diǎn)擊文本或圖表中的超文本鏈接點(diǎn)訪問(wèn)另一個(gè)相關(guān)的文檔。

3)操作的簡(jiǎn)易性。采用客戶機(jī)/服務(wù)器結(jié)構(gòu),通過(guò)交互式的圖形界面,為用戶提供友好的信息查詢要求,系統(tǒng)就會(huì)自動(dòng)向適當(dāng)?shù)姆?wù)器提出請(qǐng)求。正是這一特點(diǎn),使Internet能廣泛深入學(xué)校、家庭、辦公室乃至每一個(gè)人。

網(wǎng)絡(luò)信息檢索服務(wù)的特點(diǎn):

1)信息檢索服務(wù)的開放性。40

4、網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)

智能化

可視化

簡(jiǎn)單化

多樣化

個(gè)性化

商業(yè)化

4、網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)

智能化

可視化

簡(jiǎn)單化

多樣41(1)智能化

智能化是網(wǎng)絡(luò)信息檢索未來(lái)主要的發(fā)展方向。智能檢索是基于自然語(yǔ)言的檢索形式,機(jī)器根據(jù)用戶所提供的以自然語(yǔ)言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索。

目前已有一些搜索引擎支持智能檢索,但其智能化程度不高。而近年來(lái)internet上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理、知識(shí)共享智能體等,都將提高網(wǎng)絡(luò)信息檢索的智能化程度。(1)智能化

智能化是網(wǎng)絡(luò)信息檢索未來(lái)主要的發(fā)展方向。智能檢42(2)可視化

可視化的優(yōu)點(diǎn)在于圖象的表達(dá)方式生動(dòng)、形象、準(zhǔn)確、效果更高,能從多角度揭示,而純文字的表達(dá)方式是模糊、一維的。

信息檢索中的可視化是將數(shù)據(jù)庫(kù)中不可見的語(yǔ)義關(guān)系用圖象形式可視化顯示并表達(dá)用戶檢索過(guò)程。在可視化空間展示的信息可以看見它們是二維的或三維的。(信息檢索中,實(shí)現(xiàn)語(yǔ)義控制是人們的理想,而現(xiàn)實(shí)的信息檢索是基于“字符串”的檢索、匹配與表達(dá))

(2)可視化

可視化的優(yōu)點(diǎn)在于圖象的表達(dá)方式生動(dòng)、形象、準(zhǔn)確43(3)簡(jiǎn)單化

未來(lái)家用電腦將朝著智能化、網(wǎng)絡(luò)化、人性化和綠色環(huán)保的方向發(fā)展;操作系統(tǒng)的用戶友好性將不斷增加,如微軟和蘋果公司都在致力于操作系統(tǒng)網(wǎng)絡(luò)化研究,以便使其中的任意應(yīng)用程序都能“連接”進(jìn)行“網(wǎng)絡(luò)檢索”,并與網(wǎng)絡(luò)“交互”;各搜索引擎檢索界面更加“傻瓜化”,使用戶學(xué)習(xí)和進(jìn)行網(wǎng)絡(luò)信息檢索更加容易;網(wǎng)上自動(dòng)標(biāo)引、自動(dòng)文摘、自動(dòng)跟蹤、自動(dòng)漫游、機(jī)器翻譯、多媒體技術(shù)、動(dòng)態(tài)鏈技術(shù)、數(shù)據(jù)挖掘和信息推拉等技術(shù)逐步發(fā)展、完善,會(huì)越來(lái)越方便用戶及時(shí)準(zhǔn)確的檢索信息。這些硬件與軟件技術(shù)的發(fā)展都有利于網(wǎng)絡(luò)信息檢索的簡(jiǎn)單化。

(3)簡(jiǎn)單化

未來(lái)家用電腦將朝著智能化、網(wǎng)絡(luò)化、人性化和綠色44

(4)多樣化

多樣化首先表現(xiàn)在可以檢索的信息形態(tài)多樣化,如文本、聲音、圖象、動(dòng)畫。

多樣化的第二個(gè)表現(xiàn)是檢索工具向多國(guó)化、多語(yǔ)種化方向發(fā)展。AltaVista不僅提供了包括中文在內(nèi)的25種語(yǔ)言檢索系統(tǒng),還提供仂種拉丁語(yǔ)系的語(yǔ)言與英語(yǔ)互譯的功能。Google,Yahoo!,HotBot,Lycos《Excite和WebCrawler都在世界各地設(shè)立了分支機(jī)構(gòu),使檢索服務(wù)本地化;并增加服務(wù)器,分流用戶,提高上網(wǎng)查詢速度。

多樣化的第三個(gè)表現(xiàn)是網(wǎng)上檢索工具的的服務(wù)多元化,為用戶提供全方位的服務(wù)。(不是單純的檢索工具)

(4)多樣化

多樣化首先表現(xiàn)在可以檢索的信息形態(tài)多樣化,如45(5)個(gè)性化

個(gè)性化指各網(wǎng)站貫徹以用戶為中心的理念,注重內(nèi)容的特色化和注重個(gè)性化的服務(wù)。

(5)個(gè)性化

個(gè)性化指各網(wǎng)站貫徹以用戶為中心的理念,注重內(nèi)容46(6)商業(yè)化

網(wǎng)絡(luò)檢索系統(tǒng)不再僅僅是一種檢索工具,而且成為一項(xiàng)產(chǎn)業(yè),它的商業(yè)利益成為推動(dòng)系統(tǒng)完善和擴(kuò)展的主要?jiǎng)恿?,網(wǎng)絡(luò)信息的檢索與利用由公共性轉(zhuǎn)向商業(yè)化Infoseek是第一個(gè)對(duì)網(wǎng)絡(luò)信息檢索收費(fèi)的檢索工具,但由于它在收費(fèi)的同時(shí)未能為用戶提供特殊的高質(zhì)量信息服務(wù),不久便自生自滅了。

(6)商業(yè)化

網(wǎng)絡(luò)檢索系統(tǒng)不再僅僅是一種檢索工具,而且成為一47網(wǎng)絡(luò)信息檢索的的商業(yè)化還體現(xiàn)在聯(lián)機(jī)和光盤檢索逐漸進(jìn)入網(wǎng)絡(luò)環(huán)境。由于目前的網(wǎng)絡(luò)信息檢索檢準(zhǔn)率低,聯(lián)網(wǎng)的收費(fèi)聯(lián)機(jī)和光盤檢索依舊受到青睞,如世界著名的DIALOG、OCLC、EBSCO、Silverplatter,國(guó)內(nèi)的萬(wàn)方數(shù)據(jù)資源系統(tǒng)、中國(guó)學(xué)術(shù)期刊光盤、重慶維普公司系列光盤都紛紛在網(wǎng)上設(shè)立自己的網(wǎng)絡(luò)檢索入口。網(wǎng)絡(luò)信息檢索的的商業(yè)化還體現(xiàn)在聯(lián)機(jī)和光盤檢索逐漸進(jìn)入網(wǎng)絡(luò)環(huán)境48思考題信息和情報(bào)兩個(gè)概念的共性及特性。什么是文獻(xiàn)?在圖書館的電子資源中有哪些數(shù)據(jù)庫(kù)屬于文獻(xiàn)型數(shù)據(jù)庫(kù)(書目題錄文摘型數(shù)據(jù)庫(kù)),哪些數(shù)據(jù)庫(kù)屬于事實(shí)型數(shù)據(jù)庫(kù)(全文型數(shù)據(jù)庫(kù))。世界著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)有哪些?思考題信息和情報(bào)兩個(gè)概念的共性及特性。49第二章

信息檢索概述第二章

信息檢索概述50一信息與信息源

1、信息信息的含義:信息原指消息的傳遞,現(xiàn)指應(yīng)用文字、數(shù)據(jù)或信號(hào)等形式通過(guò)一定的傳遞和處理,來(lái)表現(xiàn)各種相互聯(lián)系的客觀事物在運(yùn)動(dòng)中所具有的特征性內(nèi)容的總稱。信息不是指事物本身,而是事物存在的方式和運(yùn)動(dòng)狀態(tài)的表現(xiàn)形式,是客觀事物經(jīng)過(guò)感知或認(rèn)識(shí)后的再現(xiàn)。一信息與信息源1、信息51信息的特征客觀性:信息不是虛無(wú)飄渺的事物,它的存在可以被人們感知、獲取、傳遞和利用依附性:信息必須依附于一定的載體(如聲波、紙張、化學(xué)材料、磁性材料等)才能流通和傳遞??蓚鬟f性:不同載體的信息可以通過(guò)計(jì)算機(jī)、人際交流、文獻(xiàn)交流或大眾傳媒等手段傳遞給信息用戶,最大化的利用信息可塑性:信息在流通和使用過(guò)程中,人們借助于先進(jìn)的技術(shù),可以對(duì)其進(jìn)行綜合、分析及加工處理時(shí)效性:由于事物是在不斷變化著的,因此表征事物存在方式和運(yùn)動(dòng)狀態(tài)的信息也必然會(huì)隨之改變共享性:信息可以多次傳播,不失其內(nèi)容,與實(shí)物交易不同。第二章-信息檢索概述課件52信息知識(shí)情報(bào)與文獻(xiàn)知識(shí):人類在改造世界的過(guò)程中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。信息被人類所感知并被提煉加工即成為知識(shí)。知識(shí)是信息升華的結(jié)果,是一種濃縮的系統(tǒng)化的信息。信息是知識(shí)的基礎(chǔ),知識(shí)是信息的核心。信息知識(shí)情報(bào)與文獻(xiàn)53情報(bào):是人們?cè)谝欢〞r(shí)間內(nèi)為一定目的而傳遞的有使用價(jià)值的知識(shí)或信息,它有明確的接受對(duì)象,屬于人工知識(shí)或信息的范疇,它來(lái)源于信息與知識(shí),是激活了的知識(shí)、動(dòng)態(tài)的信息。文獻(xiàn):是記錄知識(shí)或信息的一切載體。即用文字、圖形、符號(hào)、聲頻、視頻等技術(shù)手段記錄人類知識(shí)的一種載體。實(shí)際上文獻(xiàn)是由知識(shí)內(nèi)容、信息符號(hào)和載體材料三個(gè)不可分割的基本要素構(gòu)成。知識(shí)是文獻(xiàn)的實(shí)質(zhì)內(nèi)容,符號(hào)、文字、聲音是人體感覺(jué)信息的媒介,載體是文獻(xiàn)的外在形式。

情報(bào):是人們?cè)谝欢〞r(shí)間內(nèi)為一定目的而傳遞的有使用價(jià)值的知識(shí)或54它們之間的邏輯關(guān)系和范疇關(guān)系

它們之間的邏輯關(guān)系和范疇關(guān)系55思考題偶爾從別人那里聽到一個(gè)未經(jīng)證實(shí)的事,是不是信息?為什么?農(nóng)諺是直接關(guān)系農(nóng)業(yè)的耕種、收獲和其他農(nóng)事的諺語(yǔ),它們是長(zhǎng)期以來(lái)勞動(dòng)人民農(nóng)業(yè)生產(chǎn)知識(shí)、經(jīng)驗(yàn)的總結(jié)。下面看幾條有關(guān)氣象的農(nóng)諺: 朝霞不出門,晚霞走千里/蜘蛛結(jié)網(wǎng),雨必晴;螞蟻搬家,雨必下/天上鉤鉤云,地下雨淋淋/天上鯉魚斑,明天曬谷不用翻/云往東,刮陣風(fēng);云往西,披蓑衣指出每一條諺語(yǔ)中,哪些是信息,哪些是知識(shí)?從中可以得到什么啟示?思考題偶爾從別人那里聽到一個(gè)未經(jīng)證實(shí)的事,是不是信息?為什么562、信息源文獻(xiàn)信息源(具體內(nèi)容見第三章) 有信息價(jià)值,被人為記錄和保存,能夠被傳播,接收端可以反復(fù)重現(xiàn)其內(nèi)容非文獻(xiàn)信息源 有信息價(jià)值但不具有或并不明顯具有其他要素特征。強(qiáng)調(diào)是通過(guò)人的感官獲取的實(shí)時(shí)信息,或者說(shuō)第一手的知識(shí)信息。2、信息源文獻(xiàn)信息源(具體內(nèi)容見第三章)57非文獻(xiàn)信息源可分為實(shí)物信息、口頭信息和實(shí)情信息實(shí)物信息就是現(xiàn)實(shí)存在的物化了的各種物質(zhì)形態(tài)的信息。包括實(shí)物、樣品或展覽會(huì)的展品??陬^信息是指存在于人腦記憶中,通過(guò)交談、談?wù)?、?bào)告等方式交流傳播的信息非文獻(xiàn)信息源可分為實(shí)物信息、口頭信息和實(shí)情信息58實(shí)情信息是現(xiàn)實(shí)存在的自然現(xiàn)象和社會(huì)現(xiàn)象的信息。它的表現(xiàn)形式不是實(shí)物,而是自然現(xiàn)象或者社會(huì)現(xiàn)象的狀態(tài)及其發(fā)展過(guò)程。自然現(xiàn)象(氣候、水文、物理、化學(xué)、生物等的演進(jìn)和反應(yīng)的狀態(tài)和過(guò)程)社會(huì)現(xiàn)象(政治法律事務(wù)、軍事行動(dòng)、企業(yè)、商業(yè)和事業(yè)機(jī)構(gòu)運(yùn)行狀態(tài)、工程現(xiàn)象、演出現(xiàn)場(chǎng)、經(jīng)濟(jì)交易的實(shí)時(shí)交互過(guò)程、人機(jī)運(yùn)動(dòng)過(guò)程等)實(shí)情信息是現(xiàn)實(shí)存在的自然現(xiàn)象和社會(huì)現(xiàn)象的信息。它的表現(xiàn)形式不59思考題以下詞條可代表不同類型的信息源,請(qǐng)按文獻(xiàn)信息源和非文獻(xiàn)信息源為他們分類汽車、敦煌石窟、四庫(kù)全書、一年內(nèi)的天氣變化數(shù)據(jù)、上市公司年報(bào)、經(jīng)濟(jì)新聞、地震儀測(cè)得的數(shù)據(jù)、圖書縮微膠片、甲骨文、古時(shí)候的陶片、記錄片、古籍我國(guó)氣象專家根據(jù)多種信息,預(yù)測(cè)出2008年可能出現(xiàn)像1998年那樣的大洪水,結(jié)果該年自6月中旬以來(lái),浙江、福建、江西、湖南、廣東、廣西等地部分地區(qū)遭受強(qiáng)暴雨襲擊,造成嚴(yán)重洪澇、山體滑坡和泥石流災(zāi)害,預(yù)言變成現(xiàn)實(shí)。請(qǐng)問(wèn)專家預(yù)測(cè)可能會(huì)用到哪些信息?分別屬于什么信息類型?

思考題以下詞條可代表不同類型的信息源,請(qǐng)按文獻(xiàn)信息源和非文獻(xiàn)60“信息分析與預(yù)測(cè)”是競(jìng)爭(zhēng)情報(bào)領(lǐng)域一項(xiàng)很重要的手段。例如:通過(guò)檢索競(jìng)爭(zhēng)對(duì)手在某一技術(shù)領(lǐng)域的專利申請(qǐng),并對(duì)其信息內(nèi)容進(jìn)行深入分析,便可以判斷出競(jìng)爭(zhēng)對(duì)手的R&D(研究與發(fā)展)方向、經(jīng)營(yíng)策略、產(chǎn)品和技術(shù)優(yōu)勢(shì)。請(qǐng)問(wèn)專利屬于什么類型的信息源?為什么可以通過(guò)搜集和分析所掌握的信息預(yù)測(cè)出競(jìng)爭(zhēng)對(duì)手的發(fā)展?fàn)顟B(tài)和趨勢(shì)?“信息分析與預(yù)測(cè)”是競(jìng)爭(zhēng)情報(bào)領(lǐng)域一項(xiàng)很重要的手段。例如:通過(guò)61案例分析: 為了在極短的時(shí)間內(nèi)盡快開發(fā)出一系列馳騁全球的名牌摩托車產(chǎn)品,1968年日本集中了全國(guó)各摩托車修理廠200名具有豐富專業(yè)知識(shí)和研究能力的工程技術(shù)人員和情報(bào)人員,分成12個(gè)小組,用了一年的時(shí)間,走遍世界上所有重要的摩托車生產(chǎn)廠家,對(duì)世界摩托車工業(yè)進(jìn)行了有史以來(lái)最廣泛的全球性調(diào)查。在訂貨、幫助建廠的幌子下,他們搜集了大量的信息,并帶回170多部樣機(jī)。他們每種樣機(jī)購(gòu)回兩部,一部解剖,一部做運(yùn)行試驗(yàn),并結(jié)合搜集到的信息,對(duì)全部廠家各種型號(hào)的摩托車及其零部件的質(zhì)量、優(yōu)缺點(diǎn)等進(jìn)行比較、分析和綜合,博采眾家之長(zhǎng),最后設(shè)計(jì)出一種輕便耐用、性能優(yōu)良、價(jià)格便宜的摩托車,并迅速占領(lǐng)國(guó)內(nèi)市場(chǎng)。

案例分析:62

1)通過(guò)以上案例你得到什么啟示? 2)例子中日本從世界各地帶回來(lái)的摩托車是否屬于信息?如果不是請(qǐng)說(shuō)明理由,如果是請(qǐng)說(shuō)明屬于什么類型的信息? 3)如果你是試驗(yàn)小組成員,除了摩托車你還會(huì)搜集哪些信息?為什么?1)通過(guò)以上案例你得到什么啟示?633、信息社會(huì)的基本內(nèi)容:3I、3C、3A、3R

3I:Information(信息)、Intelligence(智能)、Integration(集成、綜合)3C:Computer(計(jì)算機(jī))、Communication(通訊)、Control(控制)3A:FactoryAutomation(工廠自動(dòng)化)、OfficeAutomation(辦公自動(dòng)化)HomeAutomation(家庭自動(dòng)化)3R:MaterialRevolution(材料革命)、EnergyRevolution(能源革命)、InformationRevolution(信息革命)

3、信息社會(huì)的基本內(nèi)容:3I、3C、3A、3R

3I:In64二、信息檢索的基本內(nèi)容1、概念:1)信息檢索(informationretrieval)是指將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用戶的需要找出有關(guān)信息的過(guò)程。所以,它的全稱又叫信息存儲(chǔ)與檢索(informationstorageandretrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過(guò)程的后一步,即從信息集合中找出所需要信息的過(guò)程。相當(dāng)于我們所說(shuō)的信息查詢(informationsearch)。二、信息檢索的基本內(nèi)容1、概念:652)檢索語(yǔ)言:檢索語(yǔ)言是把信息的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人員與用戶聯(lián)系起來(lái),以便取得共同的理解、實(shí)現(xiàn)交流的語(yǔ)言。有人工語(yǔ)言(主題語(yǔ)言和分類語(yǔ)言)、自然語(yǔ)言之分。(第三章詳細(xì)介紹)

3)檢索方法:常用法、追溯法和循環(huán)法

(第四章詳細(xì)介紹)2)檢索語(yǔ)言:檢索語(yǔ)言是把信息的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人66檢索詞、檢索式、檢索策略(第四章詳細(xì)介紹)

檢索詞是用戶或檢索人員給出的字、詞、字符或短語(yǔ),用于查找含有它(它們)的記錄。

檢索式也稱檢索提問(wèn)式,是要求系統(tǒng)執(zhí)行的檢索語(yǔ)句。簡(jiǎn)單的檢索式由一個(gè)檢索詞和一個(gè)字段名構(gòu)成,復(fù)雜的檢索式由多個(gè)檢索詞和字段名通過(guò)關(guān)系算符連接而成。如:要利用英文搜索引擎查找網(wǎng)絡(luò)信息檢索方面的資料,檢索式為(WebORInternetORWWW)AND(Search*ORRetrieval*)。

檢索詞、檢索式、檢索策略(第四章詳細(xì)介紹)

檢67檢索策略:

所謂檢索策略,就是在分析課題內(nèi)容具有哪些概念單元的基礎(chǔ)上,確定檢索系統(tǒng)、學(xué)科領(lǐng)域、檢索文檔、檢索途徑和檢索詞,并科學(xué)安排各檢索詞之間的位置關(guān)系和邏輯關(guān)系以及查找步驟等。也就是為滿足信息需求所制定的一系列檢索方案。

檢索策略:

所謂檢索策略,就是在分析課題內(nèi)容685)檢中結(jié)果、查全率、查準(zhǔn)率(第四章詳細(xì)介紹)

檢中結(jié)果又稱檢索結(jié)果集,是數(shù)據(jù)庫(kù)中滿足(檢索式(即符合檢索條件)的那些記錄的集合

查全率:是指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)中存在的合乎該需要的所有文獻(xiàn)的比例

查準(zhǔn)率:是指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢出文獻(xiàn)全部數(shù)量的比例

5)檢中結(jié)果、查全率、查準(zhǔn)率(第四章詳細(xì)介紹)

檢中結(jié)果又稱692、信息檢索的類型:

(1)根據(jù)檢索手段的不同,分為手工檢索、計(jì)算機(jī)檢索(光盤檢索、聯(lián)機(jī)檢索和網(wǎng)絡(luò)檢索)

(2)根據(jù)檢索對(duì)象、

形式的不同,分為文獻(xiàn)型信息檢索、數(shù)據(jù)型信息檢索、事實(shí)型信息檢索。

2、信息檢索的類型:

(1)根據(jù)檢索手段的不同,分為手工檢索70

文獻(xiàn)型信息檢索(DocumentRetrieval):以文獻(xiàn)(包括題錄、文摘)為檢索對(duì)象的檢索。凡是查找某一主題、時(shí)代、地區(qū)、著者、文種的有關(guān)文獻(xiàn),以及回答這些文獻(xiàn)的出處和收藏處所等,都屬于文獻(xiàn)型信息檢索的范疇。完成文獻(xiàn)型信息檢索主要借助于各種書目型數(shù)據(jù)庫(kù)。

文獻(xiàn)型信息檢索(DocumentRetrie71數(shù)據(jù)型信息檢索(DataRetrieval):以數(shù)值或數(shù)據(jù)為對(duì)象的一種檢索,包括文獻(xiàn)中的某一數(shù)據(jù)、公式、圖表,以及某一物質(zhì)的化學(xué)分子式等,數(shù)據(jù)檢索分為數(shù)值型與非數(shù)值型。完成數(shù)據(jù)型信息檢索主要借助于各種數(shù)值數(shù)據(jù)庫(kù)和統(tǒng)計(jì)數(shù)據(jù)庫(kù)。

數(shù)據(jù)型信息檢索(DataRetrieval):以數(shù)值或數(shù)據(jù)72事實(shí)型信息檢索(FactRetrieval):以某一客觀事實(shí)為檢索對(duì)象,查找某一事物發(fā)生的時(shí)間、地點(diǎn)及過(guò)程的檢索,其檢索結(jié)果主要是客觀事實(shí)或?yàn)檎f(shuō)明事實(shí)而提供的相關(guān)資料。如:2001年7月通過(guò)的奧運(yùn)會(huì)主辦城市的結(jié)果與過(guò)程。完成事實(shí)型信息檢索主要借助于各種指南數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)。

事實(shí)型信息檢索(FactRetrieval):以某一客觀事73

3、信息檢索的發(fā)展歷程

3.1基本方向:手工檢索向計(jì)算機(jī)檢索(如穿孔、縮微、自動(dòng)化)發(fā)展,但是手工檢索與計(jì)算機(jī)檢索將長(zhǎng)期并存。因?yàn)橛?jì)算機(jī)檢索有其缺陷:(1)硬件條件不足:沒(méi)有計(jì)算機(jī),不能上網(wǎng),(2)數(shù)據(jù)庫(kù)不完善,(3)網(wǎng)絡(luò)慢或網(wǎng)絡(luò)故障等等。

3、信息檢索的發(fā)展歷程

3.1基本方向:手工檢索向計(jì)算機(jī)74

3.2計(jì)算機(jī)信息檢索的的產(chǎn)生和發(fā)展,分為五個(gè)階段:

(1)脫機(jī)批處理檢索:1954一64。定期由專職檢索人員把許多用戶課題匯總,批量處理提問(wèn)要求,并把結(jié)果提供給用戶。直接在計(jì)算機(jī)旁檢索,不需要遠(yuǎn)程終端設(shè)備及通信網(wǎng)絡(luò)。用戶在計(jì)算機(jī)處理成批檢索課題之后才知道檢索結(jié)果,不能直接、及時(shí)修改檢索策略,查全率和查準(zhǔn)率受到一定限制。

3.2計(jì)算機(jī)信息檢索的的產(chǎn)生和發(fā)展,分為五個(gè)階段:

(75(2)聯(lián)機(jī)情報(bào)檢索:20世紀(jì)70年代投入商業(yè)運(yùn)營(yíng)。用戶在計(jì)算機(jī)檢索系統(tǒng)的終端上,通過(guò)通信網(wǎng)絡(luò),使用特定的指令和算符,以人機(jī)對(duì)話方式,查詢遠(yuǎn)程計(jì)算機(jī)檢索系統(tǒng)核心的數(shù)據(jù)庫(kù),從中獲取所需信息的計(jì)算機(jī)檢索系統(tǒng)。

第二章-信息檢索概述課件76聯(lián)機(jī)檢索系統(tǒng)由三個(gè)部分組成:主機(jī)系統(tǒng)、通訊系統(tǒng)和終端設(shè)備

主機(jī)系統(tǒng)是聯(lián)機(jī)檢索系統(tǒng)的核心,它具備處理速度快、多道程序和分時(shí)功能,內(nèi)存容量大,多樣化的輸入輸出設(shè)備。

通訊系統(tǒng)是指終端設(shè)備與主機(jī)系統(tǒng)進(jìn)行通信的設(shè)備。通信線路分為兩種:專用的直達(dá)線路;通過(guò)撥號(hào)選擇對(duì)方的交換線路。前者是特定通信線路,后者使用電話網(wǎng)和用戶電報(bào)網(wǎng),聯(lián)機(jī)系統(tǒng)使用的通信線路就屬于后一種。

終端系統(tǒng)是人與系統(tǒng)的接口設(shè)備。它能將字符、聲音以及人類的信息表現(xiàn)形式轉(zhuǎn)換成系統(tǒng)的機(jī)器代碼。反之,將系統(tǒng)的結(jié)果還原成字符、聲音等形式,傳送給終端用戶。聯(lián)機(jī)檢索系統(tǒng)由三個(gè)部分組成:主機(jī)系統(tǒng)、通訊系統(tǒng)和終端設(shè)備

77

(3)國(guó)際聯(lián)機(jī)檢索:70年代中后期國(guó)際聯(lián)機(jī)檢索是指用戶利用終端設(shè)備,通過(guò)通信網(wǎng)與地球上任何地方的大型計(jì)算機(jī)信息檢索系統(tǒng)的主機(jī)進(jìn)行直接人機(jī)對(duì)話式的計(jì)算機(jī)檢索。

第二章-信息檢索概述課件78國(guó)際聯(lián)機(jī)檢索系統(tǒng)一般由通信網(wǎng)絡(luò)、國(guó)際聯(lián)機(jī)檢索中心、用戶終端等三部分組成。國(guó)際聯(lián)機(jī)檢索系統(tǒng)的服務(wù)方式有:回溯檢索、定題服務(wù)、聯(lián)機(jī)訂購(gòu)原文、電子郵件服務(wù)以及光盤服務(wù)五種方式。

國(guó)際聯(lián)機(jī)檢索系統(tǒng)一般由通信網(wǎng)絡(luò)、國(guó)際聯(lián)機(jī)檢索中心、用戶終端等79幾種主要的國(guó)際聯(lián)機(jī)檢索系統(tǒng)Dialog國(guó)際聯(lián)機(jī)檢索系統(tǒng)ESA/IRS國(guó)際聯(lián)機(jī)檢索系統(tǒng)ORBIT國(guó)際聯(lián)機(jī)檢索系統(tǒng)STN國(guó)際聯(lián)機(jī)檢索系統(tǒng)OCLC國(guó)際聯(lián)機(jī)檢索系統(tǒng)

這是目前世界著名的五大聯(lián)機(jī)檢索系統(tǒng)幾種主要的國(guó)際聯(lián)機(jī)檢索系統(tǒng)Dialog國(guó)際聯(lián)機(jī)檢索系統(tǒng)80

目前世界上最大的國(guó)際聯(lián)機(jī)檢索信息系統(tǒng)??偛吭O(shè)在美國(guó)舊金山附近的帕洛阿爾托市。此系統(tǒng)現(xiàn)有近600個(gè)數(shù)據(jù)庫(kù),信息總量超過(guò)5億條,其中包括50多種語(yǔ)言、6萬(wàn)多種期刊,數(shù)據(jù)庫(kù)內(nèi)容涉及綜合性學(xué)科、自然科學(xué)、應(yīng)用科學(xué)和社會(huì)科學(xué)等,文獻(xiàn)類型有圖書、報(bào)紙、期刊、學(xué)位論文、會(huì)議錄研究報(bào)告、政府文件、專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、年鑒、市場(chǎng)行情和廠商名錄等。DIALOG

目前世界上最大的國(guó)際聯(lián)機(jī)檢索信息系統(tǒng)。81ORBIT

ORBIT的全稱為onlineretrievalofbibliographicinformationtimeshared即文獻(xiàn)目錄信息分時(shí)聯(lián)機(jī)檢索。是第二大國(guó)際聯(lián)機(jī)檢索系統(tǒng),擁有200多個(gè)數(shù)據(jù)庫(kù)。以化工、石油、生物、化學(xué)、環(huán)境科學(xué)、醫(yī)學(xué)、運(yùn)動(dòng)科學(xué)和安全科學(xué)等深入文獻(xiàn)比較齊全而著稱。其特色數(shù)據(jù)庫(kù)有SAE(汽車、飛機(jī)等交通工具)TULSA(石油、天然氣開采與勘探)等30多個(gè)數(shù)據(jù)庫(kù),為該系統(tǒng)獨(dú)有。ORBITORBIT的全稱為onli82ESA/IRS是歐洲最大的聯(lián)機(jī)檢索中心。也是世界上大型的國(guó)際聯(lián)機(jī)檢索系統(tǒng)之一,僅次于美國(guó)的DIALOG和ORBIT聯(lián)機(jī)檢索系統(tǒng)。涉及的專業(yè)范圍有:科技、農(nóng)業(yè)、衛(wèi)生、管理、社會(huì)科學(xué)和宇航工程及技術(shù)等方面。有120多個(gè)數(shù)據(jù)庫(kù),其中,酸雨(ACIDRAIN)、鑄造(BIIPAM-CTIF)、原材料價(jià)格(PRICEDATA)、衛(wèi)星遙感圖象(LEDA)、宇航及高技術(shù)軟件(SPACESOFT)等為特色數(shù)據(jù)庫(kù)。ESA/IRS是歐洲最大的聯(lián)機(jī)檢索中83STN

STN(TheScientificandTechnicalInformationNetworkInternational)是國(guó)際科學(xué)技術(shù)信息網(wǎng)絡(luò)系統(tǒng)的簡(jiǎn)稱。是由德國(guó)卡爾斯魯厄能源、物理、數(shù)學(xué)專業(yè)信息中心(FIT)、美國(guó)化學(xué)文摘社(CAS)和日本國(guó)際化學(xué)信息協(xié)會(huì)(JAICI)三家合作經(jīng)營(yíng)的國(guó)際聯(lián)機(jī)檢索系統(tǒng)。涉及的專業(yè)范圍:化學(xué)、化工、生物、醫(yī)學(xué)、數(shù)學(xué)、物理、能源、冶金、建筑等方面。其特色數(shù)據(jù)庫(kù)有:CAS化學(xué)物質(zhì)結(jié)構(gòu)圖形數(shù)據(jù)庫(kù)(REGISTRY)、德國(guó)專利數(shù)據(jù)庫(kù)(PATDPA)、碳13核磁共振和紅外光譜數(shù)值圖形數(shù)據(jù)庫(kù)(C13-NMR/IR)。STNSTN(TheScienti84STN的特點(diǎn)合作建網(wǎng),分布式管理多文檔檢索,方便實(shí)用字段限定檢索時(shí),只使用后綴碼,無(wú)前綴碼擁有世界上第一批聯(lián)機(jī)圖象數(shù)據(jù)庫(kù)STN的特點(diǎn)合作建網(wǎng),分布式管理85OCLC

OCLC(OnlineComputerLibraryCenter)即聯(lián)機(jī)計(jì)算機(jī)圖書館中心。是世界上最大的文獻(xiàn)信息服務(wù)機(jī)構(gòu)之一??偛吭O(shè)在美國(guó)俄亥俄州,1971年建成聯(lián)機(jī)系統(tǒng),擁有370多種語(yǔ)言、3400多萬(wàn)條聯(lián)合書目記錄數(shù)據(jù)庫(kù),OCLC的“第一檢索系統(tǒng)”(FirstSearch)提供聯(lián)機(jī)信息檢索系統(tǒng)目前有70多個(gè)數(shù)據(jù)庫(kù),涉及13個(gè)主題領(lǐng)域。不僅有書目信息而且絕大部分可以直接獲取全文。OCLCOCLC(Online86(4)光盤檢索:80年代初期,其全稱為高密度光盤(CompactDisk),主要是利用激光、計(jì)算機(jī)及光電集成等技術(shù)實(shí)現(xiàn)信息存儲(chǔ)的數(shù)字化。以光盤為介質(zhì)的光盤數(shù)據(jù)庫(kù)檢索系統(tǒng)由于信息存儲(chǔ)量大,簡(jiǎn)單易用而取勝。

(4)光盤檢索:80年代初期,其全稱為高密度光盤(Compa87

(5)網(wǎng)絡(luò)信息檢索:

網(wǎng)絡(luò)信息檢索是通過(guò)標(biāo)準(zhǔn)通信方式將世界各地的計(jì)算機(jī)網(wǎng)絡(luò)連接起來(lái),形成一個(gè)基于客戶機(jī)-服務(wù)器模式的網(wǎng)絡(luò)分布數(shù)據(jù)庫(kù)結(jié)構(gòu)。它在全球范圍內(nèi)把科技信息、商貿(mào)信息、經(jīng)濟(jì)信息、時(shí)事新聞以及日常生活信息通過(guò)互聯(lián)網(wǎng)絡(luò)合在一起,向億萬(wàn)聯(lián)網(wǎng)用戶提供廣泛的信息檢索與服務(wù)。它是信息化社會(huì)應(yīng)用最廣泛、最活躍的領(lǐng)域。

(5)網(wǎng)絡(luò)信息檢索:

網(wǎng)絡(luò)信息檢索是通過(guò)標(biāo)88網(wǎng)絡(luò)信息檢索服務(wù)的特點(diǎn):

1)信息檢索服務(wù)的開放性。網(wǎng)絡(luò)信息系統(tǒng)中包含信息資源、信息設(shè)備、信息通道、信息檢索軟件及信息終端等子系統(tǒng),各個(gè)子系統(tǒng)都是開放的,其信息資源面向所有用戶。

2)超文本的多鏈接性。以超文本技術(shù)為

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論