信息存儲與檢索-張帆主編_第1頁
信息存儲與檢索-張帆主編_第2頁
信息存儲與檢索-張帆主編_第3頁
信息存儲與檢索-張帆主編_第4頁
信息存儲與檢索-張帆主編_第5頁
已閱讀5頁,還剩271頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信息存儲與檢索主編:張帆教授高等教育出版社

基礎(chǔ)理論部分

第1章信息資源概論第2章信息存儲與檢索基礎(chǔ)第3章信息存取技術(shù)與信息檢索方法

第4章計算機信息存取系統(tǒng)應(yīng)用部分第5章聯(lián)機存取系統(tǒng)第6章Internet存取系統(tǒng)第7章文本信息存取第8章多媒體信息存取系統(tǒng)

第9章事實和數(shù)據(jù)信息存取第10章國外著名信息存取系統(tǒng)第11章中國著名信息存取系統(tǒng)第1章信息資源概論信息資源

電子信息資源

紙質(zhì)文獻資源

1.1信息資源1.1.1信息資源的基本概念

信息的涵義:信息是生物以及具有自動控制系統(tǒng)的機器通過感覺器官或者細胞組織,或者具有類似功能的設(shè)備部件與外界進行交流的一切內(nèi)容。

資源的涵義:資源是一切可被人類開發(fā)和利用的客觀存在。

信息資源的涵義:信息資源是經(jīng)過人類主觀或客觀處理了的,并且能夠被傳播或傳輸?shù)奈淖?、聲音、圖像、數(shù)據(jù)。

1.1.2信息資源的基本特征

共享性

時效性

智能性

無限性與有限性并存

增值性

1.1.3信息資源的類型

紙質(zhì)文獻型信息資源

電子型信息資源(包括電子出版物和網(wǎng)絡(luò)信息資源)下一節(jié)

1.2.1電子信息資源的含義、特點及不足:

含義:電子信息資源書是以數(shù)字化形式(即二進制代碼0、1),把文字、圖像、聲音動畫等多種形式的信息存儲在光、磁等非印刷型介質(zhì)上,以光信號、電信號的形式傳輸,并通過相應(yīng)的計算機和其他外部設(shè)備再現(xiàn)出來的信息資源。1.2電子信息資源

特點

存儲形式多樣化:文本、超文本、多媒體、超媒體等

資源數(shù)字化:以二進制代碼形式存在

可交流程度高:信息交流范圍擴大、信息交流能動性增強、信息交流對象增多

方便利用:易獲取、易檢索、易保存

內(nèi)容豐富:集圖、文、聲像、動畫于一體

載體容量大:存儲載體信息密度高、容量大

電子信息資源的不足:

對閱讀設(shè)備的依賴性

閱讀舒適度差

需具備計算機基礎(chǔ)知識1.2.2電子信息資源的類型

按網(wǎng)絡(luò)傳輸協(xié)議的不同分:

Web信息資源:通過HTTP在網(wǎng)上傳輸。

Telnet信息資源:基于網(wǎng)絡(luò)通訊協(xié)議。

FTP信息資源:通過FTP協(xié)議可完成完整的文件拷貝。

用戶服務(wù)組信息資源:由一組對某一特定主題有共同興趣的網(wǎng)絡(luò)用戶組成的電子論壇。

Gopher信息資源:Gopher是一種基于菜單的網(wǎng)絡(luò)服務(wù),允許用戶以一種簡單的、一致的方式快速找到并訪問所需的網(wǎng)絡(luò)資源。

按存取方式不同分:

郵件型信息資源

電話型信息資源

揭示版型信息資源

廣播型信息資源

圖書館型信息資源

書目型信息資源

交互型信息資源

按信息傳播于交流過程分:

穩(wěn)定的電子信息資源

不穩(wěn)定的電子信息資源

按目前常用的網(wǎng)絡(luò)搜索引擎分(以yahoo為例),如圖:

可分為藝術(shù)與人文、商業(yè)與經(jīng)濟、教育、娛樂、

政府、新聞與媒體等14類。

請點擊

yahoo分類的不足:知識體系不完整、等級關(guān)系不清;知識體系不嚴(yán)密;無類目標(biāo)記號;層次設(shè)置深淺不等。

按正式出版物類型的不同分:

電子圖書

電子期刊

電子報紙

下一節(jié)1.3紙質(zhì)文獻資源

1.3.1紙質(zhì)文獻資源的性質(zhì)、特點及來源:

性質(zhì):

紙質(zhì)文獻是知識的存在形式

傳遞信息知識

紙質(zhì)文獻資源可以多次重復(fù)使用

紙質(zhì)文獻所載的是相對固化的信息

特點:

攜帶、書寫、保存方便

直觀性

以紙質(zhì)為載體的藝術(shù)作品的不可替代性

紙質(zhì)文獻作為收藏怕的不可替代性

來源

個人

出版社

教育科研機構(gòu)

公司企業(yè)

學(xué)術(shù)團體

政府部門及各類社會組織

文獻信息部門

1.3.2紙質(zhì)文獻資源的類型與情報價值

按文獻編撰方法和出版特點分:

圖書及其情報價值

期刊及其情報價值

報紙及其情報價值

會議文獻及其情報價值

科技報告及其情報價值

標(biāo)準(zhǔn)文獻及其情報價值

專利文獻及其情報價值

學(xué)位論文及其情報價值

產(chǎn)品說明書及其情報價值

按文獻加工深度分:

一次文獻及其情報價值:作者最初發(fā)表的原始文獻,如專著、論文、譯文等。

二次文獻及其情報價值:對一次文獻加工整理后的產(chǎn)物,如書目、文摘、索引等。

三次文獻及其情報價值:在一、二次文獻基礎(chǔ)上加工出來的文獻,如綜述、述評等。

零次文獻及其情報價值:尚未系統(tǒng)整理的零散資料,如草稿、記錄、談話等。本章結(jié)束第2章信息存儲與檢索基礎(chǔ)

信息存儲與檢索原理

信息存取發(fā)展與類型

索引的結(jié)構(gòu)與類型

2.1信息存儲與檢索原理2.1.1社會發(fā)展與信息需求

從學(xué)術(shù)研究到社會生活全方位信息需求

從文字資料到聲音與活動畫面的信息需求

從完備信息趨向?qū)磿r信息的需求

從注重信息載體物理性質(zhì)到注重信息本身

從館藏需求到國際互聯(lián)網(wǎng)絡(luò)共享

從傳統(tǒng)的手工信息檢索到Internet引擎查檢2.1.2信息存儲與檢索原理

信息存儲與檢索(InformationStorageandRetrieval)是信息檢索的全稱形式或廣義的信息檢索,它既包括采用多種形式記錄信息、排序信息的信息存儲過程,也包括通過一定的設(shè)備、采用一定的手段與技巧從信息系統(tǒng)中快速、準(zhǔn)確地搜尋所需信息的方法與過程。信息存儲與檢索的基本原理就是,查詢語言(檢索提問)和系統(tǒng)標(biāo)識語言所進行的“相符性比較”與“匹配運算”。信息存儲與檢索走過了文獻檢索、情報檢索的過程,正向知識檢索的領(lǐng)域邁進。信息檢索通常包括4種類型,一是關(guān)于文獻的檢索;二是關(guān)于某事實或事項的知識檢索;三是關(guān)于數(shù)值或數(shù)據(jù)的情報檢索;四是關(guān)于圖象信息的信息檢索。信息存儲與信息檢索關(guān)系圖

系統(tǒng)標(biāo)識語言形式概念檢索提問M形式概念信息資源M信息集合MABCD…M檢索系統(tǒng)答復(fù)M

信息存儲

信息檢索主題分析轉(zhuǎn)換成索引標(biāo)識轉(zhuǎn)換成系統(tǒng)標(biāo)識課題分析2.1.3信息檢索相關(guān)學(xué)科作為一門學(xué)科的信息檢索

現(xiàn)代信息檢索是以計算機科學(xué)與技術(shù)、網(wǎng)絡(luò)技術(shù)、光盤技術(shù)、通信技術(shù)等現(xiàn)代信息技術(shù)在信息存儲與檢索中的應(yīng)用為基礎(chǔ),全面探討適應(yīng)現(xiàn)代信息處理的信息描述、信息存儲、信息檢索和信息提供之理論、技術(shù)與方法的應(yīng)用性學(xué)科。信息檢索的相關(guān)學(xué)科

信息檢索是一門交叉學(xué)科,其相關(guān)學(xué)科涉及到信息管理科學(xué)、計算機科學(xué)、數(shù)學(xué)、系統(tǒng)論和語言學(xué)等多個學(xué)科領(lǐng)域。2.1.4信息檢索研究信息檢索是一門發(fā)展中的學(xué)科,目前國內(nèi)外正從不同的角度展開全面的研究:信息檢索理論與技術(shù)研究信息存取系統(tǒng)研究數(shù)據(jù)庫標(biāo)準(zhǔn)與建設(shè)研究信息存取的語言處理現(xiàn)代信息檢索工具比較研究檢索策略研究2.2信息存取發(fā)展與類型

信息檢索存取發(fā)展

早期書目檢索工具的編制

科技檢索刊物體系的形成

計算機檢索的發(fā)展

計算機信息檢索的4個發(fā)展階段:單機批處理時期聯(lián)機檢索試用階段聯(lián)機服務(wù)市場化與光盤檢索的興起全球信息檢索多媒體聯(lián)網(wǎng)時期

我國計算機信息檢索的發(fā)展過程:

引進開發(fā)國外磁帶、開展定題服務(wù)(SDI)

開發(fā)國際聯(lián)機檢索終端

自建數(shù)據(jù)庫

微型計算機和國際聯(lián)機網(wǎng)信息存取的發(fā)展2.2.2信息存儲與檢索類型

廣義的信息檢索包括信息存儲與查檢兩個部分。狹義的信息檢索有許多類型,從不同角度可劃分為:按檢索活動的執(zhí)行主體劃分

手工檢索(ManualRetrieval)計算機檢索(ComputerRetrieval)按查詢信息的特征劃分

書目檢索(BibliographicRetrieval)數(shù)據(jù)檢索(DataRetrieval)事實檢索(FactRetrieval)全文檢索(FullTextRetrieval)

圖象檢索(ImageRetrieval)

多媒體信息檢索(MultimediaDataRetrieval)

2.2.2信息存儲與檢索類型按檢索系統(tǒng)的工作方式劃分

脫機檢索(Off-lineRetrieval)聯(lián)機檢索(On-lineRetrieval)光盤檢索(CD-ROMRetrieval)國際互聯(lián)網(wǎng)絡(luò)檢索(InternetRetrieval)按檢索策略劃分

布爾邏輯檢索(LogicalRetrieval)截詞檢索(TruncationRetrieval)位置邏輯檢索(ProximateOperatorRetrieval)限定檢索(RangeRetrieval)加權(quán)檢索(WeightingRetrieval)2.2.2信息存儲與檢索類型按系統(tǒng)載體劃分

印刷型文本系統(tǒng)檢索(PrintedTextRetrieval)縮微磁帶檢索(MicrofilmRetrieval)光盤系統(tǒng)檢索(CD-ROMRetrieval)計算機存取系統(tǒng)查詢(Computer-basedRetrieval)

按檢索工具類型劃分

目錄與題錄檢索(CatalogandTitleSearching)文摘檢索(AbstractSearching)索引檢索(IndexSearching)字典型檢索(DictionarySearching)交互式檢索(AlternatelySearching)2.3索引的結(jié)構(gòu)與類型索引(Index)就是將信息集合中具有檢索意義的事物名稱及特征(如篇名、人名、書名、刊名、網(wǎng)頁、網(wǎng)站、地名、分類號、主題詞、分子式、專利號、報告號、名詞術(shù)語等)抽取出來,著明其地址,按照字順或邏輯分類等次序組織款目,從而為用戶提供查詢線索的檢索工具。索引的款目結(jié)構(gòu):

索引標(biāo)題詞索引標(biāo)題詞亦稱標(biāo)目、索引鍵、索引標(biāo)題等。它一般處于索引款目最醒目的位置,是索引款目的核心,它決定著一條索引款目在整個索引中的排列位置,是索引款目的檢索入口。索引標(biāo)題詞可以為單一標(biāo)題詞,也可以為帶有副標(biāo)題的多級標(biāo)題詞。2.3.1索引的款目結(jié)構(gòu)說明語

也稱為上下文或修飾語,通常位于索引標(biāo)題詞的右邊或下面,用來說明、解釋、限定索引標(biāo)題詞含義的輔助項目。

地址參考項地址參考項位于索引標(biāo)題詞和說明語之后,索引地址所指明的是索引標(biāo)題詞所在的頁碼或在檢索系統(tǒng)中的文獻順序號、分類號或文獻號等,即索引標(biāo)題詞的出處。索引參考項有時用于引導(dǎo)用戶使用正式索引標(biāo)題詞。

例1:①Methane,②useinmethanolmanufacture,③3241①甲烷,

②用于甲烷制備,③3241說明:①索引標(biāo)題詞,②說明語,③文獻號(地址參考項)2.3.2主要索引類型索引系統(tǒng)從形式上講是成千上萬件索引款目的集合,從內(nèi)容上看是信息單元的指南。索引系統(tǒng)的排序是按照索引標(biāo)題的順序組織而成,不同性質(zhì)的索引標(biāo)題詞構(gòu)成了不同類型的索引。依據(jù)索引標(biāo)題詞的性質(zhì)劃分:有揭示信息資源內(nèi)容特征的主題索引、分類索引、關(guān)鍵詞索引、分子式索引、結(jié)構(gòu)式索引;有揭示信息資源形式特征的題名索引、人名索引、物名索引、代碼索引、引文索引。依據(jù)索引標(biāo)題詞的排序方式劃分:有按照標(biāo)題詞字順組織的主題索引、題名索引、人名索引、關(guān)鍵詞索引、語詞索引等;有按照文獻代碼組織的報告號索引、合同號索引、標(biāo)準(zhǔn)號索引等;有按其它排序方式組織的網(wǎng)絡(luò)信息自動索引、重量索引、速度索引、專用索引等。按照檢索方式劃分:有先組式索引和后組式索引。按照索引所包括的對象劃分:有綜合索引和專門索引。2.3.2主要索引類型以下簡述幾種常用索引的特點:題名索引(TitleIndex)

題名索引,是將信息資源的題名特征(書名、刊名、篇名)選作為索引標(biāo)題詞所編制的索引系統(tǒng)。題名索引常采用字順排序法組織款目。例如:未來的地球人①/王佃亮②31③解構(gòu)愛因斯坦①/一茗②32③

一流大學(xué)校長必須是教育家等6則①/睦依凡②36③宇宙是什么顏色等6則①/本刊資料室②

42③說明:①索引標(biāo)題詞(題名)②文獻作者③地址參照項(所在頁碼或文獻號)2.3.2主要索引類型人名索引(PeopleNameIndex)

人名索引,是以文獻上署名的著者、譯者、編撰者、注釋者以及文獻中所論述的人物名稱作為索引標(biāo)題詞所編制的一種索引。此類索引一般按照人物名稱的字順組織。英、德、法、西班牙等語種的著者索引姓在前、名在后,與其在文獻中出現(xiàn)的姓名形式不同,用戶檢索時應(yīng)注意掌握其排列規(guī)則。

例一:Sadykov,A.A.①ChemicalStudyofPersica②91:135089k③

例二:Harris,A.E.①001536③

例三:伽利略①(Galilei,Galilei)②B503.922③

例四:梁啟超①(1873-1929)②B259.1③說明①索引標(biāo)題詞②說明語(原文名,生卒年)③地址參照項(文摘號、分類號)2.3.2主要索引類型文獻序號索引(DocumentNumberIndex)

文獻序號索引,是根據(jù)信息資源的外表特征文獻序號所編制的索引。在一些特定類型的文獻資源中,每一份文獻都有一個特定的專門排序號。如科技報告號、合同號、技術(shù)標(biāo)準(zhǔn)的標(biāo)準(zhǔn)號、專利說明書的專利號,圖書的國際標(biāo)準(zhǔn)書號(ISBN)等;例一:合同/基金號索引(CONTRACT/GRANTNUMBERINDE)MIPR-FY7616-02-00394①ColdRegionsResearchandEngineering.Hanover.NH②AD-A121330/5③933④MIPR-82-504①VavalResearchLab.Washington,DC②AD-A121087/1③714④說明:①合同基金號②執(zhí)行機構(gòu)③報告號④索引地址號2.3.2主要索引類型引文索引(CitationIndex)

引文索引是從被引論文檢索引用論文的索引工具。即以某較早公發(fā)發(fā)表的論文為起點,逐一查詢那些引用過該論文的文獻,隨后還可以利用檢索到的引用文獻為被引文獻進行循環(huán)檢索,逐步擴大檢索范圍,以了解和掌握一大批具有相關(guān)關(guān)系的科學(xué)文獻。引文索引的組織方式是,按照被引論文的作者排列,在被引論文之下,在按年代列舉引用過該文獻的全部論文。分類索引(ClassificationIndex)

分類索引是以文獻內(nèi)容的學(xué)科范圍的分類標(biāo)識(又稱分類號)為依據(jù)編制而成的引文系統(tǒng)。本索引可提供按學(xué)科專業(yè)系統(tǒng)檢索文獻的途徑。分類索引的編制原理是概念的劃分與概括。在概念劃分與概括的原理基礎(chǔ)上建立起來的等級體系分類系統(tǒng)是一種先組式的索引語言。2.3.2主要索引類型主題索引(SubjectIndex)主題索引,是將表征文獻主題內(nèi)容的主題詞作為索引標(biāo)題詞,其后注明地址(或頁碼)編制而成的索引系統(tǒng)。此處所指的主題詞是經(jīng)過規(guī)范,有詞表控制的標(biāo)題詞(Subjectheading)以及詞組和短語。這是一種先組式的索引語言。例1Sword,①Manufacture,reviewon.②6385.4246.5367③(赤刀)(制照)(有關(guān)評論)Parallel-accesscomputer,①inself-organizing②1234.6533.4211③(并行存取計算機)(自組織系統(tǒng)中的)例2例3反義詞,①漢語——現(xiàn)代②H136.2③說明:①索引標(biāo)題詞②說明語(修飾語)③地址參照2.3.2主要索引類型關(guān)鍵詞索引(KeywordIndex)又稱鍵詞索引,屬于廣義的主題索引。這是從文獻題名、文摘、原文或網(wǎng)站、網(wǎng)頁、網(wǎng)址甚至網(wǎng)頁正文中抽取對于表述信息資源的主題內(nèi)容具有關(guān)鍵意義的名詞或名詞性詞組,作為索引標(biāo)題詞,其后標(biāo)明出處所組成的索引。關(guān)鍵詞是信息資源的責(zé)任者(包括著者、編者、譯者、專利權(quán)擁有者等)所直接使用的詞語,是一種未經(jīng)規(guī)范的自然語言。關(guān)鍵詞索引的類型:

題內(nèi)關(guān)鍵詞索引(KeywordinContextIndex)題外關(guān)鍵詞索引(KeywordoutofContextIndex)雙重關(guān)鍵詞索引(Double–KWICIndex)輪排關(guān)鍵詞索引(PermutedKeywordIndex)單純關(guān)鍵詞索引(KeywordIndex)掛接主題詞索引(ArticulatedSubjectIndex)2.3.2主要索引類型組配索引(CoordinateIndex)組配索引是根據(jù)敘詞(Descriptor)及單元詞(Uniterm)的后組式原理建立起來的索引系統(tǒng)。其基本原理是任何一個復(fù)雜的概念都可以劃分出若干個單義概念,而若干個單義概念又可構(gòu)成一個復(fù)雜概念。組配索引的基本特點是,在建立索引系統(tǒng)時,首先有將文獻的主題分解成一些單獨的概念單元進行分別記錄與標(biāo)識,而在檢索時,根據(jù)檢索課題的需要,將若干有關(guān)概念單元綜合組配成各種檢索提問實施檢索。例如“化學(xué)纖維工業(yè)”這個復(fù)雜概念可以分解為“化學(xué)”、“纖維”“工業(yè)”三個概念單元,其三者的邏輯關(guān)系如下圖:化學(xué)纖維工業(yè)ABCabacbcabc2.3.2主要索引類型PRECIS索引(PreservedContextIndex)又稱保留上下文關(guān)系索引系統(tǒng)、保留正文索引系統(tǒng)、保留愿意索引、上下文前后關(guān)聯(lián)索引。PRECIS為了明確無誤地描述文獻主題,力求每條索引款目都按照“上下文從屬”的原則排定詞語的次序。其索引的方式為:導(dǎo)詞(LEAD)限定詞(QUALIFIER)展示詞(DISPLAY)地址(ADDRESS)2.3.2主要索引類型網(wǎng)絡(luò)信息自動索引(Websourceauto-Index)

目前,Internet上的搜索索引(又稱搜索引擎searchengine)就是一種網(wǎng)絡(luò)資源自動索引的檢索工具。其特點是使用自動索引軟件來發(fā)現(xiàn)、收集和標(biāo)引網(wǎng)頁建立查詢數(shù)據(jù)庫,并以Web形式給用戶提供檢索界面,供用戶輸入檢索關(guān)鍵詞、詞組或短語等檢索項,代替用戶在數(shù)據(jù)庫中查找與提問相匹配的記錄,并按相關(guān)度排序輸出檢索結(jié)果。目前,比較有影響的中英文搜索引擎有AltaVista、Excite、Lycos、Hotbot、Sohu、Yahoo、etang、

Sina等。第3章信息存取技術(shù)與信息檢索方法

信息存取技術(shù)的進步信息檢索方法與策略

信息存儲與檢索相關(guān)學(xué)科及發(fā)展

3.1信息存取技術(shù)的進步光盤存儲與檢索技術(shù)聯(lián)機存取技術(shù)全文存取技術(shù)多媒體存取技術(shù)超文本與超媒體存取技術(shù)網(wǎng)絡(luò)存取技術(shù)視頻存取技術(shù)智能檢索技術(shù)3.2信息檢索方法與策略

提問檢索式構(gòu)造

檢索詞、提問檢索式與關(guān)系算符

檢索式構(gòu)造規(guī)則

布爾邏輯算符

邏輯“與”—AND或*

主要用于交叉概念或限定關(guān)系概念之間的組配。

邏輯“或”—OR或+

主要用于并列關(guān)系的概念組配。

邏輯“非”—NOT或-

主要用于排斥與選擇關(guān)系的組配。布爾邏輯算符執(zhí)行的優(yōu)先順序為NOT、AND、OR。

3.2.1檢索提問式構(gòu)造

位置邏輯算符

(W)或()—

With

(wn)(N)—Near

(nN)(F)—Field(S)—Subfield(L)—Link(C)—Citation(X)和(nX)

在位置算符的前面加上NOT即可構(gòu)成位置算符的邏輯(非)3.2.1檢索提問式構(gòu)造

檢索字段限定符

基本索引字段的限定檢索。為了指定在基本索引的哪個或哪幾個字段中檢索,可在檢索詞或檢索式后面加上一斜杠“/”,再加上所需限定字段標(biāo)識。一般將加有“/”線的字段標(biāo)識稱為后綴代碼(簡稱后綴)。

表3.1常見后綴代碼及其限定查找的字段范圍

后綴代碼限定查找的字段范圍

/TI題名

/AB文摘

/DE敘詞

/ID自由標(biāo)引詞

/NT注釋

/SH類目標(biāo)題3.2.1檢索提問式構(gòu)造輔助索引字段的限定檢索。為了指定在輔助索引字段中進行限定檢索,可在該檢索項(詞)的前面加上字段標(biāo)識與一個等到號“=”,通常將這種字段標(biāo)識符稱為前綴代碼(簡稱前綴)。表3.2常見前綴代碼及其所限定的字段名稱

AU=author(著者)CS=corporatesource(著者所屬機構(gòu))DT=DocumentType(文獻類型)JN=JournalName(期刊名稱)CO=Company(公司)CC=ClassificationCode(分類號)SO=Sourcepublication(來源出版物)LA=Language(語種)PY=Publicationyear(出版年份)UD=Update(更新日期)SP=Conferencesponsor(主持單位)3.2.1檢索提問式構(gòu)造

截詞檢索算符所謂截詞檢索算符,是指在檢索詞的某個局部截斷,利用檢索詞的詞干或不完整的詞形加上截詞符號所進行的檢索。

后截詞—前方一致檢索

前截詞—后方一致檢索

中截斷—前后方一致檢索

前后截斷—中間一致檢索

有限截詞

無限截詞3.2.1檢索提問式構(gòu)造檢索提問式的構(gòu)造句子切分詞匯剔除概念替換概念限定與補充組合式檢索式3.2.2信息檢索一般方法

工具法又稱一般查找法,即利用各類檢索系統(tǒng)(工具),包括書本式與電子文本方式,直接檢索信息的方法。工具法又分為3種情況:

順查法

逆查法

抽查法

追溯法

這是一種傳統(tǒng)的文獻檢索方法,即利用文獻后面所附參考文獻,逐一追查被引用文獻,然后,再從被引用文獻所附參考文獻目錄逐一擴大檢索范圍的方法。

綜合法

亦稱循環(huán)法或分段法,它指分期分段交替使用上述各種檢索方法以達到優(yōu)勢互補,獲得理想結(jié)果的一種檢索方法。3.2.3計算機檢索常用法

計算機檢索方法:

菜單檢索(EasyMenusearch)

指令檢索(CommandSearch)

瀏覽式檢索(BrowsingSearch)

提問—問答式檢索(Quiz&AnswerSearch)

根據(jù)存取系統(tǒng)的性能與支持的檢索功能,可將提問—問答式檢索區(qū)分為以下方式:

基本檢索(BasicSearchorSimpleSearchorQuickSearch)

二次檢索(SecondSearch)

詞組檢索(WordCombinationSearch)

索引詞典檢索(CatalogSearch)

高級檢索(AdvancedSearch)

綜合檢索(SynthesisSearch)3.2.4信息檢索步驟分析檢索課題,明確檢索需求。

檢索目的與意圖。

學(xué)科范圍與主題概念。

文獻性質(zhì)、類型與數(shù)量。制定檢索策略。選擇檢索系統(tǒng)與數(shù)據(jù)庫。確定檢索詞和檢索途徑,編制邏輯檢索式。檢索策略的調(diào)整.3.3

信息存儲與檢索相關(guān)學(xué)科及發(fā)展作為一門學(xué)科的信息存儲與檢索信息存儲與檢索相關(guān)學(xué)科信息管理科學(xué)計算機科學(xué)數(shù)學(xué)系統(tǒng)論語言學(xué)3.3

信息存儲與檢索相關(guān)學(xué)科及發(fā)展信息存取的發(fā)展早期書目檢索工具的編制科技檢索刊物體系的形成計算機檢索的發(fā)展

第4章計算機存取系統(tǒng)信息存取系統(tǒng)基本結(jié)構(gòu)計算機存取系統(tǒng)工作流程與功能計算機信息存取系統(tǒng)類型計算機存取系統(tǒng)檢索機制與系統(tǒng)評價4.1信息存取系統(tǒng)基本結(jié)構(gòu)計算機存取系統(tǒng)是利用計算機對一定范圍內(nèi)的信息集合進行選擇、記錄、存儲與排序,以便用戶采用科學(xué)手段與技術(shù)從中獲取必要和充分信息資源的計算機信息系統(tǒng)。計算機存取系統(tǒng)包括硬件、軟件和數(shù)據(jù)庫三部分內(nèi)容。計算機存取系統(tǒng)硬件設(shè)備主機外部設(shè)備中央處理器(運算器、控制器)內(nèi)部存儲器ROM(只讀存儲器)RAM(隨機存儲器)外部存儲器(軟盤、硬盤、光盤等)輸入設(shè)備(鼠標(biāo)、鍵盤等輸出設(shè)備(顯示器、打印機等通信設(shè)備

4.1.1計算機存取系統(tǒng)硬件組成計算機存取系統(tǒng)軟件系統(tǒng)軟件應(yīng)用軟件控制程序處理程序自動標(biāo)引軟件詞表管理各種匹配程序數(shù)據(jù)庫管理其他監(jiān)控程序診斷程序調(diào)試程序漢字處理報表生成服務(wù)程序其他其他4.1.2計算機存取軟件系統(tǒng)4.1.3機讀數(shù)據(jù)庫類型以數(shù)據(jù)的存取方式劃分為關(guān)系數(shù)據(jù)庫、層次數(shù)據(jù)庫、網(wǎng)絡(luò)型數(shù)據(jù)庫p94。以數(shù)據(jù)存儲介質(zhì)劃分為磁帶數(shù)據(jù)庫、磁盤數(shù)據(jù)庫、光盤數(shù)據(jù)庫。以數(shù)據(jù)類型劃分為文獻數(shù)據(jù)庫、數(shù)據(jù)型數(shù)據(jù)庫、事實型數(shù)據(jù)庫、多媒體數(shù)據(jù)庫和超媒體數(shù)據(jù)庫p95。信息源4.2計算機存取系統(tǒng)工作流程與功能

信息存取系統(tǒng)的功能與6個子系統(tǒng)相對應(yīng)可以總括為6個方面即輸入功能、處理功能、存儲功能、傳輸功能、輸出和控制功能。輸入子系統(tǒng)處理子系統(tǒng)存儲子系統(tǒng)傳輸子系統(tǒng)輸出子系統(tǒng)控制子系統(tǒng)

計算機存取系統(tǒng)結(jié)構(gòu)用戶4.3存取計算機信息系統(tǒng)類型

4.3.1按信息特征劃分的系統(tǒng)類型

文獻存取系統(tǒng)(DocumentAccessSystem)

事實型存取系統(tǒng)(FactAccessSystem)

數(shù)值型存取系統(tǒng)(NumericalAccessSystem)

圖像存取系統(tǒng)(ImageAccessSystem)

下一節(jié)

文獻存取系統(tǒng)文獻存取系統(tǒng)包括書目(目錄、題錄、文摘)、全文和超文本三種類型的存取系統(tǒng)。此類系統(tǒng)是以文獻的內(nèi)容特征與外在特征為存取點,將文獻標(biāo)題、作者、分類號、主題詞或關(guān)鍵詞、文獻出處或者文獻全文經(jīng)過數(shù)字化處理后存儲在計算機磁帶、磁盤、或光盤上,并組成一定結(jié)構(gòu)的數(shù)據(jù)庫。文獻存取系統(tǒng)的主要特點是對書目數(shù)據(jù)庫和全文數(shù)據(jù)庫進行管理和維護,提供查詢文獻線索或全文的檢索途徑。目前,文獻存取系統(tǒng)多以書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫、索引數(shù)據(jù)庫和圖書館館藏目錄數(shù)據(jù)庫、聯(lián)機數(shù)據(jù)庫、光盤數(shù)據(jù)庫或配有相應(yīng)檢索軟件的專門數(shù)據(jù)庫的形式存在。

返回事實型存取系統(tǒng)

事實型存取系統(tǒng)是一種直接面對各類事實和事項提問的信息存取系統(tǒng)。也有人稱之為事實或事項存取系統(tǒng)。事實存取系統(tǒng)多用于人事檔案管理、科研項目管理、企業(yè)決策、城建管理系統(tǒng)等。從本質(zhì)上看,各類電子文本式的年鑒、手冊及百科全書等也屬于事實型存取系統(tǒng)。

返回數(shù)值型存取系統(tǒng)

支持此類存取系統(tǒng)的數(shù)據(jù)庫是數(shù)值型數(shù)據(jù)庫如:人口數(shù)據(jù)庫、商品價格數(shù)據(jù)庫、氣象數(shù)據(jù)庫、化學(xué)分子結(jié)構(gòu)等數(shù)據(jù)庫等。例:ESA/IRS系統(tǒng)中,PRICEDATA數(shù)據(jù)庫就是典型的數(shù)值型存取系統(tǒng)庫。該系統(tǒng)收錄了自1972年以來世界上的60多種主要商品的價格行情,以及十幾種貨幣的匯兌等數(shù)據(jù)。

返回圖像存取系統(tǒng)

圖像存取系統(tǒng)是一種存取圖像、圖形及其說明文字等信息的計算機系統(tǒng),這類系統(tǒng)為用戶提供各種圖像或圖形信息存取功能?,F(xiàn)今,已經(jīng)出現(xiàn)了以顏色、形狀和紋理結(jié)構(gòu)等特征為存取內(nèi)容的圖像存取系統(tǒng)。隨著多媒體技術(shù)的發(fā)展,圖像信息加工、處理和檢索標(biāo)準(zhǔn)的出臺,圖像搜索引擎功能也日趨完善。

返回單機存取系統(tǒng)(Off-LineAccessSystem)聯(lián)機存取系統(tǒng)(On-lineAccessSystem)光盤存取系統(tǒng)(CD-DiscAccessSystemp104)Internet網(wǎng)絡(luò)信息存取系統(tǒng)(InternetResourceAccessSystemp106)4.3.2按工作方式和存取介質(zhì)劃分

的系統(tǒng)類型4.3.3按檢索詞的性質(zhì)劃分的系統(tǒng)類型規(guī)范詞存取系統(tǒng)

以受控詞(敘詞、標(biāo)題詞、單元詞)為存取標(biāo)識所建立的信息存取系統(tǒng)。非控詞存取系統(tǒng)p107

非控詞即指自然語言。其缺點是檢準(zhǔn)率較低。4.3.4按文檔組織方式劃分的系統(tǒng)類型

順排文檔存取系統(tǒng)(SequentialFile)即指文檔的全部紀(jì)錄按照存取號從小到大依次存取信息的系統(tǒng)。

倒排文檔存取系統(tǒng)(InvertedFile)

將文檔紀(jì)錄中的可檢字段及其屬性值(如題名、著者、敘詞、自由詞等)抽取出來,按照字段屬性的某種順序進行排序與存儲,使其成為可以用作索引的文檔。4.3.5按照信息存取方式劃分的系統(tǒng)類型文件存取系統(tǒng)p108數(shù)據(jù)庫存取系統(tǒng)主題樹存取系統(tǒng)p110超媒體存取系統(tǒng)數(shù)字圖書館和虛擬圖書館存取系統(tǒng)p1104.4計算機存取系統(tǒng)檢索機制與

系統(tǒng)評價4.4.1計算機存取系統(tǒng)檢索機制

單一整詞檢索機制

截詞檢索機制

詞組(多元詞)檢索機制

布爾邏輯檢索機制

相鄰度檢索機制

加權(quán)運算機制

自由文本檢索機制

瀏覽檢索機制4.4.2計算機信息存取系統(tǒng)評價計算機信息存取系統(tǒng)評價

系統(tǒng)研制目標(biāo)性指標(biāo)

數(shù)據(jù)范圍、更新頻率與數(shù)據(jù)來源指標(biāo)

系統(tǒng)的技術(shù)水平和運行質(zhì)量指標(biāo)

數(shù)據(jù)組織形式與用戶界面指標(biāo)

檢索方式和檢索策略指標(biāo)

檢索效果與輔助索引指標(biāo)

系統(tǒng)響應(yīng)速度及費用指標(biāo)

輸出格式

計算機信息存取系統(tǒng)評價項目一覽表

評價項目

評價內(nèi)容研制目標(biāo)適用對象、針對性、檢全率、測試效果、軟硬件配置數(shù)據(jù)來源與更新學(xué)科范圍、全面性、準(zhǔn)確性、更新頻率、數(shù)據(jù)來源、數(shù)據(jù)量等。技術(shù)水平與運行質(zhì)量可靠性、兼容性、可擴展性、技術(shù)先進性、運行質(zhì)量、維護能力等。數(shù)據(jù)組織形式與用戶界面數(shù)據(jù)格式、可檢字段、顯示字段、可檢程度、檢索靈活性、用戶界面、易用性、易學(xué)性。檢索方式與檢索策略檢索方式靈活性、多樣性、易用性、規(guī)范性、檢索策略保存方便性。檢索效果與輔助索引查全率、查準(zhǔn)率、查新率、檢索途徑、存取點、專業(yè)性檢索點、限定檢索設(shè)置等。響應(yīng)速度與費用響應(yīng)時間、網(wǎng)絡(luò)傳輸速度、開發(fā)費用、運行費用、管理費用、維護費用、系統(tǒng)效益等。輸出格式輸出格式、輸出字段的設(shè)置、檢索結(jié)果處理、查看輸出效果的許可權(quán)。第五章聯(lián)機存取系統(tǒng)聯(lián)機存取系統(tǒng)聯(lián)機存取國內(nèi)外概況DIALOG和OCLCFirstSearch簡介聯(lián)機存取系統(tǒng)檢索Internet環(huán)境下聯(lián)機存取系統(tǒng)檢索5.1聯(lián)機存取系統(tǒng)概述

聯(lián)機存取是在脫機批處理基礎(chǔ)上發(fā)展起來的一種信息存取技術(shù),用戶使用終端設(shè)備運用一些規(guī)定的指令輸入檢索詞和檢索策略,通過通信網(wǎng)絡(luò)與相聯(lián)系的信息存取系統(tǒng)聯(lián)機,進行人機對話,同時通過檢索軟件的運行從信息存取系統(tǒng)預(yù)先存儲文獻的數(shù)據(jù)庫中查找所需信息的過程。世界著名的聯(lián)機存取系統(tǒng),除早期發(fā)展起來的DIALOG、STN等外,還出現(xiàn)了一批后起之秀如FirstSearch、萬方數(shù)據(jù)資源系統(tǒng)等。聯(lián)機存取系統(tǒng)現(xiàn)已形成一定規(guī)劃的產(chǎn)業(yè)和一種十分可靠的計算機存取方式,并且隨著網(wǎng)絡(luò)的普及,不再限于其發(fā)展初期的形式,提供基于Internet的聯(lián)機存取和光盤存取服務(wù)。5.1.1聯(lián)機存取原理

聯(lián)機存取中心聯(lián)機存取中心是聯(lián)機存取系統(tǒng)的核心部分,由中央計算機、數(shù)據(jù)庫、數(shù)據(jù)庫檢索和管理軟件以及相應(yīng)的檢索服務(wù)體制組成。

中央計算機(服務(wù)器)及其外部設(shè)備

數(shù)據(jù)庫檢索與管理軟件

聯(lián)機數(shù)據(jù)庫

通信網(wǎng)絡(luò)

用戶檢索終端及用戶接口軟件5.1.2聯(lián)機存取系統(tǒng)服務(wù)方式

傳統(tǒng)服務(wù)追溯檢索定題服務(wù)聯(lián)機訂購原文電子郵件數(shù)據(jù)庫光盤特色服務(wù)如FirstSearch的一體化服務(wù)、DIALOG公司的跨文檔檢索和分級別檢索以及萬方數(shù)據(jù)公司的數(shù)字化期刊、咨詢服務(wù)等。5.2聯(lián)機存取系統(tǒng)國內(nèi)外概況國外聯(lián)機存取系統(tǒng)

DIALOG系統(tǒng)

STN系統(tǒng)

OCLCFirstSearch國內(nèi)聯(lián)機存取系統(tǒng)

萬方數(shù)據(jù)資源系統(tǒng)()CNKI數(shù)據(jù)資源系統(tǒng)(ki.net)維普數(shù)據(jù)資訊系統(tǒng)(http://www.tydata.com/index.asp)下一節(jié)返回返回返回5.3DIALOG和OCLCFirstSearch簡介

5.3.1DIALOG系統(tǒng)

DIALOG系統(tǒng)的聯(lián)入方式

以Telnet方式聯(lián)入

以WWW方式聯(lián)入

http://www.DIALOGWhttp://www.DIALOGChttp://www.DIALOGShttp://library.DIALOG.com/bluesheetsDIALOG系統(tǒng)數(shù)據(jù)庫簡介

DIALOG系統(tǒng)常用數(shù)據(jù)庫工程索引(EI)科學(xué)文摘(INSPEC)世界專利索引(WPI)化學(xué)文摘(CASearch)科學(xué)引文索引(SciSearch)經(jīng)濟商業(yè)文摘(ABI/INFORM)學(xué)位論文文摘(DissertationAbstractsOnline)美國政府報告(NTIS)美國專利(U.S.Patents)歐洲專利(EuropeanPatents)生物文摘(BIOSISPreviews)金屬文摘(METADEX)物理文摘(SPIN)能源科學(xué)與技術(shù)(EnergyScienceandTechnology)污染文摘(PollutionAbstracts)宇航數(shù)據(jù)庫(AerospaceDatabase)日本專利(JAPIO)醫(yī)學(xué)索引(MEDLINE)地質(zhì)數(shù)據(jù)庫(GeoRef)分析文摘(AnalyticalAbstracts)數(shù)學(xué)文摘(MathSci)環(huán)境文摘(EnvionmentalBibliography)會議論文索引(ConferencePapersIndex)流體工程文摘(FluidEngineeringAbstracts)教育資源中心(ERIC)工程材料文摘(EngineeredMaterialsAbstracts)機械工程文摘(ISMECAbstracts)陶瓷文摘(CeramicAbstracts)

DIALOG系統(tǒng)檢索式構(gòu)造

用索引字段構(gòu)造檢索式

DIALOG系統(tǒng)基本檢索字段的后綴和檢索示例

DIALOG系統(tǒng)常見輔助字段的前綴和檢索示例字段名后綴代碼示例功能說明題名/TIComputer/TI查找題名字段中含有檢索詞computer的記錄敘詞/DEEconomics/DE查找敘詞字段中含有檢索詞economics的所有記錄字段名前綴代碼示例功能說明作者AU=Au=johnson查找在作者字段中含有檢索詞johnson的所有記錄公司名稱CO=Co=fordmotor查找公司名稱字段為Fordmotor的所有記錄用邏輯算符(and等)和位置算符構(gòu)造檢索式(如下示例)用截詞符構(gòu)造檢索式(如下示例)位置算符示例功能說明(w)Electronic(w)business查找含有檢索詞electronicbusiness的記錄且兩詞次序不能顛倒,之間不可有任何詞(nw)Electronic(3w)business查找含有檢索詞electronicbusiness的記錄且兩詞次序不能顛倒,但兩詞之間還可以有3個其他詞截詞方式示例功能說明無限截詞Effect?查找含有以effect為詞干的詞的索引記錄。有限截詞Effect???查找含有以effect為詞干的,其后有3個字符的詞所有記錄。詞間截詞Wom?n查找含有women、womon等詞的所有記錄。DIALOG系統(tǒng)的檢索指令(示例如下)DIALOG系統(tǒng)付費方式DIALOG系統(tǒng)工作時間

僅在北京時間星期天下午6時至星期一凌晨2時停止開放,其他時間均提供服務(wù)。指令標(biāo)識符簡稱示例功能說明BeginB?B8開庫指令,調(diào)出所查文檔并對文檔做出說明,示例含義為進入8號文檔(注:8號文檔為美國工程所有數(shù)據(jù)庫)SelectS?Se-business/AB查找指令,在該指令后輸入檢索詞或檢索式,系統(tǒng)就會從數(shù)據(jù)庫中查出含有這些檢索詞或檢索式的文獻記錄,將結(jié)果反饋給用戶,并賦予一個集合號。示例檢索式中使用文摘字段進行查詢范圍限制。5.3.2OCLCFirstSearch聯(lián)機存取FirstSearch的主要特色

提供一體化的服務(wù)

強大的檢索手段

靈活多樣的輔助索引

專門配置了Web界面的管理模塊

數(shù)據(jù)庫記錄中包含館藏信息

信息量大

面向最終用戶

收費低FirstSearch的應(yīng)用環(huán)境及其聯(lián)入方式FirstSearch數(shù)據(jù)庫簡介目前利用FirstSearch可以檢索到65個數(shù)據(jù)庫,這些數(shù)據(jù)庫絕大多數(shù)是由美國的國家機構(gòu)、聯(lián)合會、研究院、圖書館和大公司等單位提供。部分?jǐn)?shù)據(jù)庫在DIALOG系統(tǒng)中也有收錄。數(shù)據(jù)庫記錄中有文獻信息、館藏信息、索引、名錄、文摘和全文資料等內(nèi)容。資料的類型包括書籍、連續(xù)出版物、報紙、雜志、膠片、計算機軟件、音頻資料、樂譜等。數(shù)據(jù)庫被分成15個主題范疇,如表所示:

FirstSearch數(shù)據(jù)庫的主題范疇藝術(shù)和人文科學(xué)Arts&Humanities工商管理和經(jīng)濟Business&Economics會議和會議錄Comferences&Proceedings消費者事物和人物ConsumerAffairs&People教育Education工程和技術(shù)Engineering&Technology綜合類General普通科學(xué)GeneralScience生命科學(xué)LifeScience醫(yī)學(xué)和健康(消費者)Medicine&Health,Consumer醫(yī)學(xué)和健康(專業(yè)人員)Medicine&Health,Professional新聞和時事News&CurrentEvents公共事務(wù)和法律PublicAffairs&Law快速參考QuickReference社會科學(xué)SocialSciences由OCLC自己建設(shè)的數(shù)據(jù)庫有:

ArticleFirstContentsFirstNetFirstPapersFirstProceddingsWorldCatFirstSearch檢索式的構(gòu)造

利用索引表或下拉式列表構(gòu)造檢索式(適用于基本檢索和高級檢索屏幕)

基本檢索屏幕用索引表構(gòu)造檢索式

高級檢索屏幕一般用下拉式列表構(gòu)造檢索式

利用標(biāo)識符構(gòu)造檢索式(適用于專家檢索屏幕)

在Searchfor:后的文本框內(nèi)鍵入包括索引標(biāo)識符和檢索詞的檢索字符串。如果要檢索一個準(zhǔn)確短語,把短語放在引號內(nèi)。

從Indexedin:下拉列表中選擇一個標(biāo)識符用于任何沒有標(biāo)識符檢索詞。在FirstSearch中,可構(gòu)造如下類型的檢索式:

單標(biāo)識符檢索式。

多標(biāo)識符檢索式。

固定短語(或稱準(zhǔn)確短語)檢索式。

有順序和間隔距離的檢索式(與DIALOG中位置算符功能相當(dāng))

組合檢索式

帶括號的檢索式注意不要選用FirstSearch規(guī)定的禁止詞

使用復(fù)數(shù)標(biāo)識(+)實現(xiàn)單復(fù)通檢

使用截斷符(*)實現(xiàn)同根詞的檢索

使用通配符(#和?)實現(xiàn)對不確定詞的檢索

注意FirstSearch系統(tǒng)規(guī)定預(yù)留符在檢索式中的表達FirstSearch系統(tǒng)付費方式可依檢索次數(shù)和年定購兩種方式付費FirstSearch系統(tǒng)開放時間星期一至星期六,24小時全天開放。星期天北京時間下午3至7時停止開放。5.4聯(lián)機存取系統(tǒng)檢索5.4.1DIALOG系統(tǒng)檢索

DIALOG提供多種基于Internet的檢索界面,其中DIALOGWEB方式適合于一般用戶,它提供兩種檢索方式:引導(dǎo)式檢索式和命令式檢索式。引導(dǎo)式檢索式利用屏幕提供的菜單,在系統(tǒng)引導(dǎo)下完成檢索。命令式檢索則比較復(fù)雜。

檢索具體步驟:

聯(lián)入系統(tǒng)通過www瀏覽器輸入http://www.dialogweb.com

登錄(如圖)下一節(jié)返回返回通過DIAINDEX選擇數(shù)據(jù)庫(如圖),選擇主題進入下級目錄(如圖)在DIALINDEX中進行初步檢索(如圖)選擇數(shù)據(jù)庫,開始檢索。(如圖)選擇數(shù)據(jù)庫中命中文獻最多的數(shù)據(jù)庫,點擊“BeginDatabase進入命令檢索頁面多次反饋檢索(如圖)顯示檢索結(jié)果(如圖)打印或發(fā)送檢索結(jié)果記錄檢索結(jié)束,與DIALOG系統(tǒng)斷開連接下一節(jié)返回返回返回返回返回返回5.4.2萬方數(shù)據(jù)資源統(tǒng)一服務(wù)存取系統(tǒng)檢索萬方數(shù)據(jù)資源統(tǒng)一服務(wù)系統(tǒng)概況

萬方數(shù)據(jù)資源系統(tǒng)包括科技信息子系統(tǒng)、數(shù)字化期刊和商務(wù)信息子系統(tǒng)3個部分。信息檢索經(jīng)典檢索

基本檢索(關(guān)鍵詞檢索)(如圖)

高級檢索(如圖)專業(yè)檢索

簡單詞檢索

索引關(guān)系檢索

簡單布爾運算檢索

索引關(guān)系和布爾運算組合檢索

相鄰詞與布爾修飾符檢索下一節(jié)返回返回返回返回返回5.4.3CNKI數(shù)據(jù)資源系統(tǒng)檢索CNKI數(shù)據(jù)資源系統(tǒng)概況

通過網(wǎng)址ki.net進入主頁面,輸入帳號和密碼,并選擇相應(yīng)的服務(wù)方式,進入所選數(shù)據(jù)庫檢索界面初級檢索(如圖)

頁面轉(zhuǎn)換工具條,用來進行頁面間轉(zhuǎn)換。

檢索工具條,用于數(shù)據(jù)庫檢索項的輸入。

目錄工具條,確定檢索范圍的工具。

使用方法與步驟

確定檢索范圍

選取檢索字段

輸入檢索詞

選擇結(jié)果的排序方式

進行檢索高級檢索(如圖)。檢索結(jié)果示例界面(如圖)下一節(jié)5.4.3CNKI數(shù)據(jù)資源系統(tǒng)檢索專業(yè)檢索

專業(yè)檢索比高級檢索功能更強大,但需要檢索人員根據(jù)系統(tǒng)的檢索語法編制檢索式進行檢索。適用于熟練掌握檢索技術(shù)的專業(yè)檢索人員。本系統(tǒng)提供的專業(yè)檢索分單庫和跨庫兩種形式。5.4.4維普數(shù)據(jù)資訊系統(tǒng)檢索維普數(shù)據(jù)資訊系統(tǒng)概況通過網(wǎng)址http://www.tydate.com/index.asp中文科技期刊全文數(shù)據(jù)庫檢索。界面如圖

選擇檢索入口

限定檢索范圍(導(dǎo)航樹學(xué)科范圍、年限、期刊范圍及同義詞庫、同名作者庫)

檢索式和復(fù)合檢索

利用二次檢索

直接輸入復(fù)合檢索式

進行檢索

獲取文獻全文5.5Internet環(huán)境下聯(lián)機存取系統(tǒng)檢索5.5.1聯(lián)機信息檢索與網(wǎng)絡(luò)信息檢索比較

聯(lián)機信息檢索與網(wǎng)絡(luò)信息檢索的相似之處檢索實質(zhì)相同邏輯組織大體相同提供檢索的邏輯組配手段相似檢索入口相同

聯(lián)機信息檢索與網(wǎng)絡(luò)信息檢索的差異標(biāo)引所依據(jù)的語言不同系統(tǒng)界面設(shè)計不同信息組織方式不同5.5Internet環(huán)境下聯(lián)機存取系統(tǒng)檢索5.5.2聯(lián)機信息檢索與網(wǎng)絡(luò)信息檢索效益比較聯(lián)機信息檢索的優(yōu)勢和缺陷優(yōu)勢:聯(lián)機存取系統(tǒng)在信息數(shù)量上的優(yōu)勢聯(lián)機存取系統(tǒng)在信息質(zhì)量上的優(yōu)勢聯(lián)機存取系統(tǒng)在檢索效率上的優(yōu)勢缺陷:聯(lián)機信息檢索費用昂貴聯(lián)機信息檢索需要一定的檢索技巧5.5Internet環(huán)境下聯(lián)機存取系統(tǒng)檢索基于Internet的網(wǎng)絡(luò)信息檢索的優(yōu)勢和缺陷優(yōu)勢:檢索費用低用戶界面友好信息內(nèi)容和形式新穎多樣、原文可獲得性高缺陷:

網(wǎng)絡(luò)上免費提供的信息質(zhì)量、時效性和可靠性還不能得到充分的保證由于缺乏必要的管理和法律制約,Internet上的信息資源開發(fā)與服務(wù)還存在著各種問題,如網(wǎng)絡(luò)安全、有害與違法信息的傳播、版權(quán)保護、信息資源的管理和組織、網(wǎng)絡(luò)信息檢索的檢索低等問題。5.5Internet環(huán)境下聯(lián)機存取系統(tǒng)檢索5.5.3網(wǎng)絡(luò)環(huán)境下聯(lián)機信息檢索發(fā)展策略聯(lián)入Internet改善用戶界面調(diào)整收費制度返回返回返回返回檢索功能區(qū)域?qū)W科分類導(dǎo)航樹刊名導(dǎo)航檢出題錄細覽區(qū)域檢出題錄粗覽返回返回第6章Internet網(wǎng)絡(luò)信息存取網(wǎng)絡(luò)信息存取原理與方法Internet網(wǎng)絡(luò)存取系統(tǒng)及其檢索網(wǎng)絡(luò)信息檢索策略與技巧6.1網(wǎng)絡(luò)信息存取原理與方法6.1.1網(wǎng)絡(luò)信息檢索的特點

存取范圍覆蓋Internet上的幾乎所有資源

傳統(tǒng)檢索方法與全新檢索技術(shù)相結(jié)合

用戶界面友好且操作方便

具備良好的導(dǎo)航和編輯功能

用戶透明度6.1.2網(wǎng)絡(luò)信息檢索一般方法

瀏覽

通過資源指南(ResourceGuide)來查找相應(yīng)的信息

利用網(wǎng)絡(luò)信息檢索工具

使用搜索軟件

充分利用E-mail獲取信息資源6.1.3網(wǎng)絡(luò)信息存取工具搜索引擎的構(gòu)成用戶系統(tǒng)用戶接口搜索器索引器檢索器www信息資源FTP信息資源Gopher信息資源WAIS信息資源

搜索引擎網(wǎng)絡(luò)網(wǎng)絡(luò)Telnet信息資源用戶服務(wù)組信息資源搜索引擎基本原理用戶訪問策略搜索引擎用戶界面接口搜索引擎本地的摘要信息數(shù)據(jù)庫各萬維網(wǎng)站點資源各記錄鏈接詳細信息反饋訪問摘要信息反饋

網(wǎng)絡(luò)信息檢索工具類型

按照網(wǎng)絡(luò)信息資源類型劃分

www檢索工具

非www檢索工具

按照檢索機制劃分(分析其優(yōu)缺點)

關(guān)鍵詞檢索工具

分類目錄檢索工具

混合型檢索工具

按照包含檢索工具數(shù)量劃分

單一型檢索工具

多元型檢索工具(并行,串行,ALL-IN-ONE方式)

按照檢索內(nèi)容劃分(p222)

綜合型檢索工具

專題型檢索工具

特殊型檢索工具網(wǎng)絡(luò)信息檢索工具的功能基本檢索功能

布爾邏輯檢索(NOT/nor/!、AND/and/&、OR/or/|)字符串檢索(“”功能)

截詞檢索

字段限制檢索(題名,著者,關(guān)鍵詞等)

位置檢索高級檢索功能(p223)

自然語言檢索(直接輸入自燃語言)

模糊檢索(搜尋相關(guān)概念,上下位概念)

概念檢索(指同義詞和近義詞)

區(qū)分大小寫檢索

管道檢索(用管道符“|”表檢索順序)

相關(guān)信息反饋檢索(點擊相關(guān)網(wǎng)頁,網(wǎng)站等。Yahoo,Lycos的“morelikethis”等)

檢索范圍限制(語言、地域、類型、后綴、時間等)6.2Internet網(wǎng)絡(luò)存取系統(tǒng)及其檢索6.2.1關(guān)鍵詞檢索工具的性能和使用英文搜索引擎介紹

AltaVista()

AltaVista是資格最老的搜索引擎,1995年誕生于DEC研發(fā)中心,是目前最受歡迎的網(wǎng)絡(luò)信息檢索工具之一。它以搜索功能強大、響應(yīng)速度快和信息量豐富而著稱。注:由于種種原因,目前國內(nèi)用戶無法直接訪問AltaVista。Excite特色:概念搜索:首先將檢索詞按字意自動擴展或加以限定,然后根據(jù)“智能概念抽取”技術(shù)查找相關(guān)的文獻。數(shù)據(jù)庫規(guī)模和范圍:有包含5500萬網(wǎng)頁的新聞組數(shù)據(jù)庫,每天搜索300個新聞媒體,精選了6萬多站點供檢索。支持目錄檢索和關(guān)鍵詞檢索,有基本檢索和高級檢索(searchhome里邊):基本檢索支持關(guān)鍵詞、詞組和自燃語言檢索。自燃語言檢索越詳細越好。支持“+”和“-”,布爾操作符,括號,還可進行組合檢索,能對語言、國家、域名進行限制。結(jié)果顯示:支持按日期和出版物排序,結(jié)果包括相關(guān)得分、題名、摘要、URL,也可只顯示題名,還可在滅國中用“l(fā)ikethis”檢索。更新:1到2周。評價:便于簡單查詢,摘要可讀性強,當(dāng)相關(guān)性排序質(zhì)量一般,搜索出的結(jié)果不能指明其格式和文件大小。

Excite()Lycos特色:功能強大,無所不有的搜索引擎,在歐洲、亞洲、美洲的35個國家和地區(qū)設(shè)置了鏡像站點。(主頁如下頁所示)規(guī)模和范圍:利用多個數(shù)據(jù)庫提供關(guān)鍵詞和分類主題查詢以及其他服務(wù)。高級檢索利用Fast數(shù)據(jù)庫(3.4億個網(wǎng)頁),自身的目錄指南包含5000萬網(wǎng)頁。檢索功能:簡單和高級檢索。用“+”“-”表示要求和排除,缺省是and。高級檢索不支持布爾運算符,但用下拉菜單選擇檢索任何詞或精確匹配等。字段限制檢索有題名、URL、主機名或域名。可選對象有:所有書、web、城市、軟件、FTP檢索、多媒體、新聞、股票等包含25種語言。不去分大小寫。結(jié)果顯示:按照流行網(wǎng)站、web網(wǎng)站、新聞的順序列出,可進行再搜索,結(jié)果包括題名、摘要、URL。更新:2~4周。評價:搜索圖像和聲音文件功能較強;優(yōu)點在于使用簡便、排序功能好、查準(zhǔn)率較高。缺點是結(jié)果重復(fù)率較高,有死鏈接。

Lycos()

HotBot特色:1996年5月推出的搜索引擎,1998年10月被Lycos收購。是一個提供最新最全面信息服務(wù)的門戶網(wǎng)站。規(guī)模和范圍:數(shù)據(jù)庫包含有1.1億個網(wǎng)頁,主題分類目錄有專家維護。除檢索web頁面、新聞討論組之外,還有股票、電子商務(wù)、新聞、商業(yè)信息服務(wù)等。檢索功能:簡單和高級檢索。簡單檢索利用下拉菜單可選擇利用單詞、短語、題名、人物、URL、布爾檢索,可對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論