信息檢索概述_第1頁(yè)
信息檢索概述_第2頁(yè)
信息檢索概述_第3頁(yè)
信息檢索概述_第4頁(yè)
信息檢索概述_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信息檢索概述第一頁(yè),共五十二頁(yè),2022年,8月28日一、介紹幾個(gè)與信息相關(guān)的概念

1知識(shí)經(jīng)濟(jì):“知識(shí)經(jīng)濟(jì)”是指建立在知識(shí)信息的生產(chǎn)、分配、使用之上的經(jīng)濟(jì)?!爸R(shí)經(jīng)濟(jì)”是和農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)相對(duì)應(yīng)的一個(gè)概念,它指的是當(dāng)今世界一種新類(lèi)型的,富有生命力的經(jīng)濟(jì)。

第二頁(yè),共五十二頁(yè),2022年,8月28日2信息高速公路(InformationHighway)

是美國(guó)國(guó)家信息基礎(chǔ)設(shè)施(NationalInformationInfrastructure,簡(jiǎn)稱NII)的代稱。它實(shí)際上是一條很寬的信息通道,可供人們大量地,并行地,高速地傳輸信息。具體地說(shuō),它是一個(gè)巨型的交互式多媒體高速計(jì)算機(jī)通信網(wǎng)絡(luò)系統(tǒng),將原來(lái)分散的電話,計(jì)算機(jī),電視,廣播,傳真,數(shù)據(jù)庫(kù)等傳輸系統(tǒng)集成為一體,形成以現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)通信技術(shù)為基礎(chǔ),以光導(dǎo)纖維通信和衛(wèi)星通信為骨干,以數(shù)據(jù)庫(kù)為信息源,跨越全國(guó)乃至世界的雙向大容量,高速度的電子數(shù)據(jù)(數(shù)字化數(shù)據(jù)-DigitalData)傳輸系統(tǒng)。由于這種交互式電腦網(wǎng)絡(luò)如同交通基礎(chǔ)設(shè)施的高速公路網(wǎng),所以被人們形象的稱為“信息高速公路”。

第三頁(yè),共五十二頁(yè),2022年,8月28日目前有:

(1)美國(guó)信息高速公路計(jì)劃(NII)最早是1979年由戈?duì)柼岢觯?992年克林頓競(jìng)選美國(guó)總統(tǒng)時(shí)正式提出這個(gè)構(gòu)想。后來(lái)成為克林頓上臺(tái)后大力推崇的重振美國(guó)經(jīng)濟(jì)計(jì)劃的重要組成部分。它的提出不僅在美國(guó)社會(huì)產(chǎn)生了強(qiáng)烈的反響,而且也在全球范圍內(nèi)引起巨大的震動(dòng)。

(2)全球信息高速公路計(jì)劃(GII)是美國(guó)政府NII計(jì)劃的擴(kuò)大與延伸。目的是把各國(guó)光纖和衛(wèi)星通訊網(wǎng)連接在一起,發(fā)展擴(kuò)大到全世界范圍的“全球信息高速公路”計(jì)劃。

第四頁(yè),共五十二頁(yè),2022年,8月28日(3)法國(guó)的“電子信息高速公路”:以多媒體取代家用電腦的龐大工程,將把電話同通信網(wǎng)絡(luò)相連接,最終形成一個(gè)光纖電視網(wǎng),從而實(shí)現(xiàn)法國(guó)境內(nèi)文字、聲音和圖象的快速傳遞(4)韓國(guó)也準(zhǔn)備用21年的時(shí)間,投資550億美元,建立本國(guó)的超高速信息通信網(wǎng)。

(5)新加坡的智能島——東南亞信息中心(6)日本的曼佗羅計(jì)劃(1992/5)與NII相抗衡的全面戰(zhàn)略計(jì)劃(7)中國(guó)信息高速公路計(jì)劃(信息準(zhǔn)高速國(guó)道或信息中速國(guó)道):“三金”工程,即“金橋”,“金關(guān)”,“金卡”工程。(十二金工程)

第五頁(yè),共五十二頁(yè),2022年,8月28日三金工程是中國(guó)“信息高速公路)的起步工程金橋工程是一項(xiàng)規(guī)模巨大的系統(tǒng)工程,是以電子郵件(E-MAIL)和電子數(shù)據(jù)交換(EDI)作為信息交換平臺(tái),主要目標(biāo)是建立一個(gè)覆蓋全國(guó)與國(guó)務(wù)院各部委使用網(wǎng)相聯(lián),并與各省、直轄市、自治區(qū)中心城市、大中型企業(yè)連接的國(guó)家公用信息通訊網(wǎng)。金卡工程也稱電子貨幣工程。我國(guó)始與1993年,上海等12個(gè)城市為首批試點(diǎn)城市。武漢市列為第二批試點(diǎn)城市,1997年啟動(dòng)后,得到中國(guó)人民銀行總行批準(zhǔn)。金關(guān)工程是我國(guó)實(shí)現(xiàn)對(duì)外貿(mào)易無(wú)紙化的信息網(wǎng)絡(luò)工程。第六頁(yè),共五十二頁(yè),2022年,8月28日3、InternetInternet又稱因特網(wǎng)或“互聯(lián)網(wǎng)”,他是從英文InterconnectedNetworks這兩個(gè)詞中,各取前半部合成的。其中文意思是指跨國(guó)的網(wǎng)絡(luò),是一群橫跨世界的各種相互連接的計(jì)算機(jī)網(wǎng)絡(luò)的統(tǒng)稱,這些網(wǎng)絡(luò)集合采用一種共同的標(biāo)準(zhǔn)通信協(xié)議來(lái)溝通,以進(jìn)行信息資源的交換和共享。Internet是由美國(guó)ARPANET發(fā)展起來(lái)的一個(gè)國(guó)際性的計(jì)算機(jī)互聯(lián)網(wǎng)絡(luò),它的特點(diǎn)是(1)異種計(jì)算機(jī)互聯(lián)(2)互聯(lián)網(wǎng)絡(luò)部分遭到破壞時(shí),其他部分仍可以繼續(xù)應(yīng)用。Internet可以總結(jié)為:是遵從TCP/IP協(xié)議,遍布全世界的大大小小的計(jì)算機(jī)網(wǎng)絡(luò)連接起來(lái)構(gòu)成的全球性計(jì)算機(jī)網(wǎng)絡(luò)的總稱,是目前全球最大的計(jì)算機(jī)網(wǎng)絡(luò),也是全球最大的信息資源網(wǎng)。是“信息高速公路”的典范。Internet網(wǎng)的主要功能就是進(jìn)行科技信息的傳遞。第七頁(yè),共五十二頁(yè),2022年,8月28日特點(diǎn):

信息廣泛、傳播速度快、方便實(shí)用應(yīng)用:

信息查詢、收發(fā)E-MAIL、傳送文件、WWW應(yīng)用、Gopher-信息檢索Telnet-遠(yuǎn)程登錄、BBS公告牌服務(wù)

第八頁(yè),共五十二頁(yè),2022年,8月28日Gopher是美國(guó)明尼蘇達(dá)大學(xué)研制的菜單式信息查詢軟件。WALS(廣域服務(wù)器)是供用戶查詢分布在Internet網(wǎng)上各類(lèi)數(shù)據(jù)庫(kù)的一個(gè)通用接口軟件,實(shí)現(xiàn)遠(yuǎn)程查詢。WWW是一個(gè)超文本式信息查詢工具,它可以把Internet網(wǎng)上不同地點(diǎn)的相關(guān)數(shù)據(jù)信息有機(jī)的組織在一起。用戶只要提供查詢要求就可以了。第九頁(yè),共五十二頁(yè),2022年,8月28日四大骨干網(wǎng)目前我國(guó)已建成Chinanet、CERnet、CSTnet與ChinaGBN四大骨干網(wǎng)。各部門(mén)與單位紛紛建立了與四大骨干網(wǎng)互聯(lián)的內(nèi)部網(wǎng)或局域網(wǎng)。

第十頁(yè),共五十二頁(yè),2022年,8月28日

Chinanet(中國(guó)公用計(jì)算機(jī)互聯(lián)網(wǎng))是中國(guó)第一個(gè)商業(yè)化全國(guó)性計(jì)算機(jī)網(wǎng)絡(luò),該網(wǎng)由信息產(chǎn)業(yè)部(原郵電部)管理CERnet(中國(guó)教育與科研計(jì)算機(jī)網(wǎng)絡(luò))由教育部主持,網(wǎng)控中心設(shè)在清華大學(xué),網(wǎng)絡(luò)分為全國(guó)主干網(wǎng)、地區(qū)網(wǎng)與校園網(wǎng)三層結(jié)構(gòu)。主干網(wǎng)連著八大區(qū)、十個(gè)節(jié)點(diǎn),所有主干網(wǎng)節(jié)點(diǎn)采用11條DDN專線連接。是目前中國(guó)與Internet連接最大的學(xué)術(shù)網(wǎng)。第十一頁(yè),共五十二頁(yè),2022年,8月28日CSTnet(中國(guó)科技網(wǎng))由中國(guó)科學(xué)院主管,以中國(guó)科學(xué)院的中國(guó)國(guó)家計(jì)算機(jī)和網(wǎng)絡(luò)設(shè)施NCFC與全國(guó)性網(wǎng)絡(luò)CASnet為基礎(chǔ),連接中國(guó)科學(xué)院以外的國(guó)內(nèi)科技單位而構(gòu)成的網(wǎng)絡(luò)。ChinaGBN(中國(guó)金橋網(wǎng))即國(guó)家經(jīng)濟(jì)信息通訊網(wǎng),是一個(gè)商業(yè)化信息網(wǎng)絡(luò),由中國(guó)電子工業(yè)總公司(原電子工業(yè)部)主管。

第十二頁(yè),共五十二頁(yè),2022年,8月28日4、信息社會(huì)的基本內(nèi)容:3I、3C、3A、3R

3I:Information(信息)、Intelligence(智能)、Integration(集成、綜合)3C:Computer(計(jì)算機(jī))、Communication(通訊)、Control(控制)3A:FactoryAutomation(工廠自動(dòng)化)、OfficeAutomation(辦公自動(dòng)化)HomeAutomation(家庭自動(dòng)化)3R:MaterialRevolution(材料革命)、EnergyRevolution(能源革命)、InformationRevolution(信息革命)

第十三頁(yè),共五十二頁(yè),2022年,8月28日5、信息、知識(shí)、情報(bào)、文獻(xiàn)的基本含義

信息:在中國(guó)歷史文獻(xiàn)中最早見(jiàn)于唐詩(shī),拉丁詞源是Information。每個(gè)人每天都在不斷地通過(guò)感覺(jué)器官?gòu)耐饨缃邮苄畔ⅰ?shū)刊報(bào)紙、電視、收音機(jī)、交談中不斷獲得信息。

信息的準(zhǔn)確概念,尚未定論,眾說(shuō)紛紜。

信息存在于人類(lèi)社會(huì)以及人的思維活動(dòng),也存在于自然界。

第十四頁(yè),共五十二頁(yè),2022年,8月28日信息的特點(diǎn):

(1)時(shí)效性:重要特點(diǎn)。如果信息傳遞很慢,那么有用的信息也會(huì)失去應(yīng)有的價(jià)值。如新聞、預(yù)告。

(2)可擴(kuò)散性:在時(shí)間或空間上從一點(diǎn)轉(zhuǎn)移到另一點(diǎn)?!耙粋魇畟靼佟?。

(3)可擴(kuò)充性:人們對(duì)世界認(rèn)識(shí)是無(wú)無(wú)限的,因此信息資源的擴(kuò)充與累積也是無(wú)限的。

(4)共享性:信息可以多次傳播,不失其內(nèi)容,與實(shí)物交易不同。第十五頁(yè),共五十二頁(yè),2022年,8月28日

知識(shí):知識(shí)是人類(lèi)認(rèn)識(shí)的成果和結(jié)晶,是人類(lèi)在認(rèn)識(shí)和改造世界和社會(huì)實(shí)踐中獲得的對(duì)事物本質(zhì)的認(rèn)識(shí)。知識(shí)僅存在于人類(lèi)社會(huì)。

個(gè)人知識(shí):存在于大腦、筆記或書(shū)信中,只能為個(gè)人所用。

社會(huì)知識(shí):存在于文獻(xiàn)中或人類(lèi)的傳說(shuō)中。

知識(shí)的屬性:意識(shí)性、實(shí)踐性、規(guī)律性、繼承性,滲透性。

第十六頁(yè),共五十二頁(yè),2022年,8月28日情報(bào):是一種人工信息,信息與知識(shí)都是它的來(lái)源。激活了的,活化了的知識(shí)。

情報(bào)與信息在英文中同為Information,但信息的外延比情報(bào)廣,信息是包含情報(bào)的。情報(bào)就是人們?cè)谝欢〞r(shí)間內(nèi)為一定目的而傳遞的有使用價(jià)值的知識(shí)或信息,它有明確的接收對(duì)象。

情報(bào)的屬性:知識(shí)與信息性、動(dòng)態(tài)性、效用性、社會(huì)性、語(yǔ)言性、可塑性、時(shí)間性。第十七頁(yè),共五十二頁(yè),2022年,8月28日文獻(xiàn):記錄有知識(shí)的一切載體。即用文字、圖形、符號(hào)、聲頻、視頻等技術(shù)手段記錄人類(lèi)知識(shí)的一種載體。屬性:知識(shí)性、記錄性、物質(zhì)性。

文獻(xiàn)的范圍很廣。古代:甲骨文、碑刻、竹簡(jiǎn)、帛書(shū)是文獻(xiàn)。

現(xiàn)代:圖書(shū)、報(bào)紙、期刊

現(xiàn)今:機(jī)讀資料、縮微制品、電子出版物。

文獻(xiàn)的功能1)存貯知識(shí)的功能;

2)傳遞和交流信息的功能;

3)保存知識(shí)的功能。

第十八頁(yè),共五十二頁(yè),2022年,8月28日二、信息檢索的基本內(nèi)容1、概念:1)信息檢索(informationretrieval)是指將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用戶的需要找出有關(guān)信息的過(guò)程。所以,它的全稱又叫信息存儲(chǔ)與檢索(informationstorageandretrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過(guò)程的后一步,即從信息集合中找出所需要信息的過(guò)程。相當(dāng)于我們所說(shuō)的信息查詢(informationsearch)。第十九頁(yè),共五十二頁(yè),2022年,8月28日2)檢索語(yǔ)言:檢索語(yǔ)言是把信息的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人員與用戶聯(lián)系起來(lái),以便取得共同的理解、實(shí)現(xiàn)交流的語(yǔ)言。有人工語(yǔ)言(主題語(yǔ)言和分類(lèi)語(yǔ)言)、自然語(yǔ)言之分。(第三章詳細(xì)介紹)

3)檢索方法:常用法、追溯法和循環(huán)法

(第四章詳細(xì)介紹)第二十頁(yè),共五十二頁(yè),2022年,8月28日檢索詞、檢索式、檢索策略(第四章詳細(xì)介紹)

檢索詞是用戶或檢索人員給出的字、詞、字符或短語(yǔ),用于查找含有它(它們)的記錄。

檢索式也稱檢索提問(wèn)式,是要求系統(tǒng)執(zhí)行的檢索語(yǔ)句。簡(jiǎn)單的檢索式由一個(gè)檢索詞和一個(gè)字段名構(gòu)成,復(fù)雜的檢索式由多個(gè)檢索詞和字段名通過(guò)關(guān)系算符連接而成。如:要利用英文搜索引擎查找網(wǎng)絡(luò)信息檢索方面的資料,檢索式為(WebORInternetORWWW)AND(Search*ORRetrieval*)。

第二十一頁(yè),共五十二頁(yè),2022年,8月28日檢索策略:

所謂檢索策略,就是在分析課題內(nèi)容具有哪些概念單元的基礎(chǔ)上,確定檢索系統(tǒng)、學(xué)科領(lǐng)域、檢索文檔、檢索途徑和檢索詞,并科學(xué)安排各檢索詞之間的位置關(guān)系和邏輯關(guān)系以及查找步驟等。也就是為滿足信息需求所制定的一系列檢索方案。

第二十二頁(yè),共五十二頁(yè),2022年,8月28日5)檢中結(jié)果、查全率、查準(zhǔn)率(第四章詳細(xì)介紹)

檢中結(jié)果又稱檢索結(jié)果集,是數(shù)據(jù)庫(kù)中滿足(檢索式(即符合檢索條件)的那些記錄的集合

查全率:是指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)中存在的合乎該需要的所有文獻(xiàn)的比例

查準(zhǔn)率:是指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢出文獻(xiàn)全部數(shù)量的比例

第二十三頁(yè),共五十二頁(yè),2022年,8月28日2、信息檢索的類(lèi)型:

(1)根據(jù)檢索手段的不同,分為手工檢索、計(jì)算機(jī)檢索(光盤(pán)檢索、聯(lián)機(jī)檢索和網(wǎng)絡(luò)檢索)

(2)根據(jù)檢索對(duì)象、

形式的不同,分為文獻(xiàn)型信息檢索、數(shù)據(jù)型信息檢索、事實(shí)型信息檢索。

第二十四頁(yè),共五十二頁(yè),2022年,8月28日

文獻(xiàn)型信息檢索(DocumentRetrieval):以文獻(xiàn)(包括題錄、文摘)為檢索對(duì)象的檢索。凡是查找某一主題、時(shí)代、地區(qū)、著者、文種的有關(guān)文獻(xiàn),以及回答這些文獻(xiàn)的出處和收藏處所等,都屬于文獻(xiàn)型信息檢索的范疇。完成文獻(xiàn)型信息檢索主要借助于各種書(shū)目型數(shù)據(jù)庫(kù)。

第二十五頁(yè),共五十二頁(yè),2022年,8月28日數(shù)據(jù)型信息檢索(DataRetrieval):以數(shù)值或數(shù)據(jù)為對(duì)象的一種檢索,包括文獻(xiàn)中的某一數(shù)據(jù)、公式、圖表,以及某一物質(zhì)的化學(xué)分子式等,數(shù)據(jù)檢索分為數(shù)值型與非數(shù)值型。完成數(shù)據(jù)型信息檢索主要借助于各種數(shù)值數(shù)據(jù)庫(kù)和統(tǒng)計(jì)數(shù)據(jù)庫(kù)。

第二十六頁(yè),共五十二頁(yè),2022年,8月28日事實(shí)型信息檢索(FactRetrieval):以某一客觀事實(shí)為檢索對(duì)象,查找某一事物發(fā)生的時(shí)間、地點(diǎn)及過(guò)程的檢索,其檢索結(jié)果主要是客觀事實(shí)或?yàn)檎f(shuō)明事實(shí)而提供的相關(guān)資料。如:2001年7月通過(guò)的奧運(yùn)會(huì)主辦城市的結(jié)果與過(guò)程。完成事實(shí)型信息檢索主要借助于各種指南數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)。

第二十七頁(yè),共五十二頁(yè),2022年,8月28日

3、信息檢索的發(fā)展歷程

3.1基本方向:手工檢索向計(jì)算機(jī)檢索(如穿孔、縮微、自動(dòng)化)發(fā)展,但是手工檢索與計(jì)算機(jī)檢索將長(zhǎng)期并存。因?yàn)橛?jì)算機(jī)檢索有其缺陷:(1)硬件條件不足:沒(méi)有計(jì)算機(jī),不能上網(wǎng),(2)數(shù)據(jù)庫(kù)不完善,(3)網(wǎng)絡(luò)慢或網(wǎng)絡(luò)故障等等。

第二十八頁(yè),共五十二頁(yè),2022年,8月28日

3.2計(jì)算機(jī)信息檢索的的產(chǎn)生和發(fā)展,分為五個(gè)階段:

(1)脫機(jī)批處理檢索:1954一64。定期由專職檢索人員把許多用戶課題匯總,批量處理提問(wèn)要求,并把結(jié)果提供給用戶。直接在計(jì)算機(jī)旁檢索,不需要遠(yuǎn)程終端設(shè)備及通信網(wǎng)絡(luò)。用戶在計(jì)算機(jī)處理成批檢索課題之后才知道檢索結(jié)果,不能直接、及時(shí)修改檢索策略,查全率和查準(zhǔn)率受到一定限制。

第二十九頁(yè),共五十二頁(yè),2022年,8月28日(2)聯(lián)機(jī)情報(bào)檢索:20世紀(jì)70年代投入商業(yè)運(yùn)營(yíng)。用戶在計(jì)算機(jī)檢索系統(tǒng)的終端上,通過(guò)通信網(wǎng)絡(luò),使用特定的指令和算符,以人機(jī)對(duì)話方式,查詢遠(yuǎn)程計(jì)算機(jī)檢索系統(tǒng)核心的數(shù)據(jù)庫(kù),從中獲取所需信息的計(jì)算機(jī)檢索系統(tǒng)。

第三十頁(yè),共五十二頁(yè),2022年,8月28日聯(lián)機(jī)檢索系統(tǒng)由三個(gè)部分組成:主機(jī)系統(tǒng)、通訊系統(tǒng)和終端設(shè)備

主機(jī)系統(tǒng)是聯(lián)機(jī)檢索系統(tǒng)的核心,它具備處理速度快、多道程序和分時(shí)功能,內(nèi)存容量大,多樣化的輸入輸出設(shè)備。

通訊系統(tǒng)是指終端設(shè)備與主機(jī)系統(tǒng)進(jìn)行通信的設(shè)備。通信線路分為兩種:專用的直達(dá)線路;通過(guò)撥號(hào)選擇對(duì)方的交換線路。前者是特定通信線路,后者使用電話網(wǎng)和用戶電報(bào)網(wǎng),聯(lián)機(jī)系統(tǒng)使用的通信線路就屬于后一種。

終端系統(tǒng)是人與系統(tǒng)的接口設(shè)備。它能將字符、聲音以及人類(lèi)的信息表現(xiàn)形式轉(zhuǎn)換成系統(tǒng)的機(jī)器代碼。反之,將系統(tǒng)的結(jié)果還原成字符、聲音等形式,傳送給終端用戶。第三十一頁(yè),共五十二頁(yè),2022年,8月28日

(3)國(guó)際聯(lián)機(jī)檢索:70年代中后期國(guó)際聯(lián)機(jī)檢索是指用戶利用終端設(shè)備,通過(guò)通信網(wǎng)與地球上任何地方的大型計(jì)算機(jī)信息檢索系統(tǒng)的主機(jī)進(jìn)行直接人機(jī)對(duì)話式的計(jì)算機(jī)檢索。

第三十二頁(yè),共五十二頁(yè),2022年,8月28日國(guó)際聯(lián)機(jī)檢索系統(tǒng)一般由通信網(wǎng)絡(luò)、國(guó)際聯(lián)機(jī)檢索中心、用戶終端等三部分組成。國(guó)際聯(lián)機(jī)檢索系統(tǒng)的服務(wù)方式有:回溯檢索、定題服務(wù)、聯(lián)機(jī)訂購(gòu)原文、電子郵件服務(wù)以及光盤(pán)服務(wù)五種方式。

第三十三頁(yè),共五十二頁(yè),2022年,8月28日幾種主要的國(guó)際聯(lián)機(jī)檢索系統(tǒng)Dialog國(guó)際聯(lián)機(jī)檢索系統(tǒng)ESA/IRS國(guó)際聯(lián)機(jī)檢索系統(tǒng)ORBIT國(guó)際聯(lián)機(jī)檢索系統(tǒng)STN國(guó)際聯(lián)機(jī)檢索系統(tǒng)OCLC國(guó)際聯(lián)機(jī)檢索系統(tǒng)

這是目前世界著名的五大聯(lián)機(jī)檢索系統(tǒng)第三十四頁(yè),共五十二頁(yè),2022年,8月28日

目前世界上最大的國(guó)際聯(lián)機(jī)檢索信息系統(tǒng)??偛吭O(shè)在美國(guó)舊金山附近的帕洛阿爾托市。此系統(tǒng)現(xiàn)有近600個(gè)數(shù)據(jù)庫(kù),信息總量超過(guò)5億條,其中包括50多種語(yǔ)言、6萬(wàn)多種期刊,數(shù)據(jù)庫(kù)內(nèi)容涉及綜合性學(xué)科、自然科學(xué)、應(yīng)用科學(xué)和社會(huì)科學(xué)等,文獻(xiàn)類(lèi)型有圖書(shū)、報(bào)紙、期刊、學(xué)位論文、會(huì)議錄研究報(bào)告、政府文件、專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、年鑒、市場(chǎng)行情和廠商名錄等。DIALOG第三十五頁(yè),共五十二頁(yè),2022年,8月28日ORBIT

ORBIT的全稱為onlineretrievalofbibliographicinformationtimeshared即文獻(xiàn)目錄信息分時(shí)聯(lián)機(jī)檢索。是第二大國(guó)際聯(lián)機(jī)檢索系統(tǒng),擁有200多個(gè)數(shù)據(jù)庫(kù)。以化工、石油、生物、化學(xué)、環(huán)境科學(xué)、醫(yī)學(xué)、運(yùn)動(dòng)科學(xué)和安全科學(xué)等深入文獻(xiàn)比較齊全而著稱。其特色數(shù)據(jù)庫(kù)有SAE(汽車(chē)、飛機(jī)等交通工具)TULSA(石油、天然氣開(kāi)采與勘探)等30多個(gè)數(shù)據(jù)庫(kù),為該系統(tǒng)獨(dú)有。第三十六頁(yè),共五十二頁(yè),2022年,8月28日ESA/IRS是歐洲最大的聯(lián)機(jī)檢索中心。也是世界上大型的國(guó)際聯(lián)機(jī)檢索系統(tǒng)之一,僅次于美國(guó)的DIALOG和ORBIT聯(lián)機(jī)檢索系統(tǒng)。涉及的專業(yè)范圍有:科技、農(nóng)業(yè)、衛(wèi)生、管理、社會(huì)科學(xué)和宇航工程及技術(shù)等方面。有120多個(gè)數(shù)據(jù)庫(kù),其中,酸雨(ACIDRAIN)、鑄造(BIIPAM-CTIF)、原材料價(jià)格(PRICEDATA)、衛(wèi)星遙感圖象(LEDA)、宇航及高技術(shù)軟件(SPACESOFT)等為特色數(shù)據(jù)庫(kù)。第三十七頁(yè),共五十二頁(yè),2022年,8月28日STN

STN(TheScientificandTechnicalInformationNetworkInternational)是國(guó)際科學(xué)技術(shù)信息網(wǎng)絡(luò)系統(tǒng)的簡(jiǎn)稱。是由德國(guó)卡爾斯魯厄能源、物理、數(shù)學(xué)專業(yè)信息中心(FIT)、美國(guó)化學(xué)文摘社(CAS)和日本國(guó)際化學(xué)信息協(xié)會(huì)(JAICI)三家合作經(jīng)營(yíng)的國(guó)際聯(lián)機(jī)檢索系統(tǒng)。涉及的專業(yè)范圍:化學(xué)、化工、生物、醫(yī)學(xué)、數(shù)學(xué)、物理、能源、冶金、建筑等方面。其特色數(shù)據(jù)庫(kù)有:CAS化學(xué)物質(zhì)結(jié)構(gòu)圖形數(shù)據(jù)庫(kù)(REGISTRY)、德國(guó)專利數(shù)據(jù)庫(kù)(PATDPA)、碳13核磁共振和紅外光譜數(shù)值圖形數(shù)據(jù)庫(kù)(C13-NMR/IR)。第三十八頁(yè),共五十二頁(yè),2022年,8月28日STN的特點(diǎn)合作建網(wǎng),分布式管理多文檔檢索,方便實(shí)用字段限定檢索時(shí),只使用后綴碼,無(wú)前綴碼擁有世界上第一批聯(lián)機(jī)圖象數(shù)據(jù)庫(kù)第三十九頁(yè),共五十二頁(yè),2022年,8月28日OCLC

OCLC(OnlineComputerLibraryCenter)即聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心。是世界上最大的文獻(xiàn)信息服務(wù)機(jī)構(gòu)之一。總部設(shè)在美國(guó)俄亥俄州,1971年建成聯(lián)機(jī)系統(tǒng),擁有370多種語(yǔ)言、3400多萬(wàn)條聯(lián)合書(shū)目記錄數(shù)據(jù)庫(kù),OCLC的“第一檢索系統(tǒng)”(FirstSearch)提供聯(lián)機(jī)信息檢索系統(tǒng)目前有70多個(gè)數(shù)據(jù)庫(kù),涉及13個(gè)主題領(lǐng)域。不僅有書(shū)目信息而且絕大部分可以直接獲取全文。第四十頁(yè),共五十二頁(yè),2022年,8月28日(4)光盤(pán)檢索:80年代初期,其全稱為高密度光盤(pán)(CompactDisk),主要是利用激光、計(jì)算機(jī)及光電集成等技術(shù)實(shí)現(xiàn)信息存儲(chǔ)的數(shù)字化。以光盤(pán)為介質(zhì)的光盤(pán)數(shù)據(jù)庫(kù)檢索系統(tǒng)由于信息存儲(chǔ)量大,簡(jiǎn)單易用而取勝。

第四十一頁(yè),共五十二頁(yè),2022年,8月28日

(5)網(wǎng)絡(luò)信息檢索:

網(wǎng)絡(luò)信息檢索是通過(guò)標(biāo)準(zhǔn)通信方式將世界各地的計(jì)算機(jī)網(wǎng)絡(luò)連接起來(lái),形成一個(gè)基于客戶機(jī)-服務(wù)器模式的網(wǎng)絡(luò)分布數(shù)據(jù)庫(kù)結(jié)構(gòu)。它在全球范圍內(nèi)把科技信息、商貿(mào)信息、經(jīng)濟(jì)信息、時(shí)事新聞以及日常生活信息通過(guò)互聯(lián)網(wǎng)絡(luò)合在一起,向億萬(wàn)聯(lián)網(wǎng)用戶提供廣泛的信息檢索與服務(wù)。它是信息化社會(huì)應(yīng)用最廣泛、最活躍的領(lǐng)域。

第四十二頁(yè),共五十二頁(yè),2022年,8月28日網(wǎng)絡(luò)信息檢索服務(wù)的特點(diǎn):

1)信息檢索服務(wù)的開(kāi)放性。網(wǎng)絡(luò)信息系統(tǒng)中包含信息資源、信息設(shè)備、信息通道、信息檢索軟件及信息終端等子系統(tǒng),各個(gè)子系統(tǒng)都是開(kāi)放的,其信息資源面向所有用戶。

2)超文本的多鏈接性。以超文本技術(shù)為基礎(chǔ)鏈結(jié)構(gòu)將不同地方的相關(guān)信息有機(jī)聯(lián)系起來(lái),使用戶可通過(guò)點(diǎn)擊文本或圖表中的超文本鏈接點(diǎn)訪問(wèn)另一個(gè)相關(guān)的文檔。

3)操作的簡(jiǎn)易性。采用客戶機(jī)/服務(wù)器結(jié)構(gòu),通過(guò)交互式的圖形界面,為用戶提供友好的信息查詢要求,系統(tǒng)就會(huì)自動(dòng)向適當(dāng)?shù)姆?wù)器提出請(qǐng)求。正是這一特點(diǎn),使Internet能廣泛深入學(xué)校、家庭、辦公室乃至每一個(gè)人。

第四十三頁(yè),共五十二頁(yè),2022年,8月28日

4、網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)

智能化

可視化

簡(jiǎn)單化

多樣化

個(gè)性化

商業(yè)化

第四十四頁(yè),共五十二頁(yè),2022年,8月28日(1)智能化

智能化是網(wǎng)絡(luò)信息檢索未來(lái)主要的發(fā)展方向。智能檢索是基于自然語(yǔ)言的檢索形式,機(jī)器根據(jù)用戶所提供的以自然語(yǔ)言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索。

目前已有一些搜索引擎支持智能檢索,但其智能化程度不高。而近年來(lái)internet上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理、知識(shí)共享智能體等,都將提高網(wǎng)絡(luò)信息檢索的智能化程度。第四十五頁(yè),共五十二頁(yè),2022年,8月28日(2)可視化

可視化的優(yōu)點(diǎn)在于圖象的表達(dá)方式生動(dòng)、形象、準(zhǔn)確、效果更高,能從多角度揭示,而純文字的表達(dá)方式是模糊、一維的。

信息檢索中的可視化是將數(shù)據(jù)庫(kù)中不可見(jiàn)的語(yǔ)義關(guān)系用圖象形式可視化顯示并表達(dá)用戶檢索過(guò)程。在可視化空間展示的信息可以看見(jiàn)它們是二維的或三維的。(信息檢索中,實(shí)現(xiàn)語(yǔ)義控制是人們的理想,而現(xiàn)實(shí)的信息檢索是基于“字符串”的檢索、匹配與表達(dá))

第四十六頁(yè),共五十二頁(yè),2022年,8月28日(3)簡(jiǎn)單化

未來(lái)家用電腦將朝著智能化、網(wǎng)絡(luò)化、人性化和綠色環(huán)保的方向發(fā)展;操作系統(tǒng)的用戶友好性將不斷增加,如微軟和蘋(píng)果公司都在致力于操作系統(tǒng)網(wǎng)絡(luò)化研究,以便使其中的任意應(yīng)用程序都能“連接”進(jìn)行“網(wǎng)絡(luò)檢索”,并與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論