![第八章信息檢索_第1頁](http://file4.renrendoc.com/view10/M01/11/00/wKhkGWWpuCyABpIZAABqZT6yioQ097.jpg)
![第八章信息檢索_第2頁](http://file4.renrendoc.com/view10/M01/11/00/wKhkGWWpuCyABpIZAABqZT6yioQ0972.jpg)
![第八章信息檢索_第3頁](http://file4.renrendoc.com/view10/M01/11/00/wKhkGWWpuCyABpIZAABqZT6yioQ0973.jpg)
![第八章信息檢索_第4頁](http://file4.renrendoc.com/view10/M01/11/00/wKhkGWWpuCyABpIZAABqZT6yioQ0974.jpg)
![第八章信息檢索_第5頁](http://file4.renrendoc.com/view10/M01/11/00/wKhkGWWpuCyABpIZAABqZT6yioQ0975.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
信息檢索根本原理
1計(jì)算機(jī)檢索根本原理概述1.1計(jì)算機(jī)檢索概念通過計(jì)算機(jī)進(jìn)行的文獻(xiàn)信息檢索稱為計(jì)算機(jī)檢索。隨著計(jì)算機(jī)技術(shù)、遠(yuǎn)程通訊技術(shù)和信息存儲(chǔ)技術(shù)的飛速開展,信息檢索由手工檢索過渡到了計(jì)算機(jī)信息檢索。計(jì)算機(jī)檢索的成功應(yīng)用,為我們更為及時(shí)、準(zhǔn)確、全面地繼承、利用和開展人類的科研成果提供了先進(jìn)的手段。1計(jì)算機(jī)檢索根本原理概述1.2計(jì)算機(jī)檢索開展第一個(gè)階段:脫機(jī)檢索階段〔50年代至60年代〕脫機(jī)檢索:即批處理檢索檢索要求檢索系統(tǒng)檢索結(jié)果檢索人員→檢索策略→成批檢索→用戶缺點(diǎn):1.地理上的障礙:遠(yuǎn)、不便于檢索結(jié)果的獲取2.時(shí)間上的遲滯:定期檢索,不能及時(shí)獲取3.封閉式的檢索:指檢索策略一經(jīng)輸入系統(tǒng)就不能更改,更不能依據(jù)機(jī)檢應(yīng)答來修改檢索式1計(jì)算機(jī)檢索根本原理概述第二個(gè)階段:聯(lián)機(jī)檢索階段〔OnlineRetrieval〕〔60-80年代)終端設(shè)備通訊網(wǎng)絡(luò)檢索系統(tǒng)用戶—>檢索策略—>人機(jī)對(duì)話———>獲取信息
三個(gè)時(shí)期:60年代開發(fā)試驗(yàn);70年代末應(yīng)用階段;80年代以后進(jìn)入信息—計(jì)算機(jī)—衛(wèi)星通信三維一體的新階段,即:信息文獻(xiàn)不受地區(qū)、國家限制而真正實(shí)現(xiàn)全世界資源共享為目的的國際聯(lián)機(jī)信息檢索階段。1計(jì)算機(jī)檢索根本原理概述著名的國際聯(lián)機(jī)檢索系統(tǒng)有:美國的DIALOG系統(tǒng);美國OnlineRetrievalofBibliographicInformationTime-Share(ORBIT)系統(tǒng),文獻(xiàn)信息分時(shí)聯(lián)機(jī)檢索;1976年書目檢索效勞社(BRS)的聯(lián)機(jī)檢索系統(tǒng);〞醫(yī)學(xué)文獻(xiàn)分析與檢索系統(tǒng)〞MEDLARS系統(tǒng),還有〞歐洲空間組織情報(bào)檢索效勞中心〞的ESA/IRS系統(tǒng)、英國的BLAESE系統(tǒng)等。這些系統(tǒng)很快開展成為國際性情報(bào)檢索系統(tǒng),數(shù)據(jù)庫種類及其檢索存儲(chǔ)記錄都在迅速增加,如:美國的Dialog系統(tǒng),1984年就有200多個(gè)數(shù)據(jù)庫,其中包括美國的《醫(yī)學(xué)索引》、荷蘭《醫(yī)學(xué)文摘》、美國《生物學(xué)文摘》、美國《化學(xué)文摘》等。如今此聯(lián)機(jī)檢索系統(tǒng)仍然是世界上最有影響的聯(lián)機(jī)檢索系統(tǒng)。DIALOG系統(tǒng)DIALOG學(xué)科覆蓋面廣,幾乎涉及全部學(xué)科范圍包括綜合性科學(xué)、自然科學(xué)、應(yīng)用科學(xué)和工藝學(xué),社會(huì)科學(xué)和人文科學(xué),時(shí)事報(bào)道和商業(yè)經(jīng)濟(jì)等。其數(shù)據(jù)來源于各種不同的圖書、報(bào)紙、雜志期刊、技術(shù)報(bào)告、會(huì)議論文、專著、專利、標(biāo)準(zhǔn)、報(bào)表、目錄、手冊(cè)等上的信息。其數(shù)據(jù)形式包括:文獻(xiàn)型??文獻(xiàn)的題錄和文摘;數(shù)值型-統(tǒng)計(jì)表、商業(yè)財(cái)政數(shù)據(jù)等;名錄字典型-手冊(cè)、指南、名錄等;全文型-論文、報(bào)告、新聞報(bào)道的全文等。DIALOG的一些著名數(shù)據(jù)庫列舉:DIALOG的近600個(gè)數(shù)據(jù)庫中,有許多極具代表性的和常用的數(shù)據(jù)庫,著名的數(shù)據(jù)庫如CA〔化學(xué)文摘〕、INSPEC〔英國科學(xué)文摘〕、MEDLINE〔醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫〕、MATHSCI〔數(shù)學(xué)文獻(xiàn)數(shù)據(jù)庫〕、BA〔生物學(xué)文摘〕、NTIS〔美國政府報(bào)告〕等都參加到DIALOG系統(tǒng)中;還有著名的幾大檢索數(shù)據(jù)庫,如SCI〔科學(xué)引文索引〕、EI〔工程索引〕、ISTP〔科技會(huì)議錄索引〕、SSCI〔社會(huì)科學(xué)引文索引〕、AHCI〔藝術(shù)與人文科學(xué)引文索引〕等也都可從DIALOG系統(tǒng)中檢索;再有世界著名的DERWENT專利數(shù)據(jù)庫以及美國專利、歐洲專利、日本專利等數(shù)據(jù)庫也都可在DIALOG中查詢。DIALOG更有一些全文數(shù)據(jù)庫,如IAC的計(jì)算機(jī)全文庫、《紐約時(shí)報(bào)>和《華盛頓郵報(bào)>等的全文庫等。1計(jì)算機(jī)檢索根本原理概述第三階段:光盤檢索階段1983年,出現(xiàn)了一種新的存儲(chǔ)器,CD-ROM光盤。光盤檢索具有儲(chǔ)量極大而體積微小,要求設(shè)備簡單,可隨地安裝,使用方便、易于操作,檢索費(fèi)用低〔不需要昂貴的聯(lián)機(jī)檢索通訊費(fèi)用〕,因可隨時(shí)修改檢索策略而具有很高的查全率和查準(zhǔn)率等優(yōu)點(diǎn)。例:ChemicalAbstractsIndex光盤〔1987-1991〕:由美國化學(xué)文摘社與美國劍橋光盤公司聯(lián)合研制,收錄1987-1991年《化學(xué)文摘》的全部內(nèi)容。1計(jì)算機(jī)檢索根本原理概述科學(xué)引文索引(光盤)SCI〔ScienceCitationIndex〕:由美國費(fèi)城科學(xué)情報(bào)研究所編輯出版,收錄1961年以來有關(guān)生命科學(xué)、醫(yī)學(xué)、物理、化學(xué)、農(nóng)業(yè)、工程技術(shù)、行為科學(xué)等方面的文獻(xiàn)及引文。
中國學(xué)術(shù)期刊全文光盤〔CAJ〕:是由清華大學(xué)開發(fā)研制,分題錄、文摘、全文三個(gè)層次的數(shù)據(jù)庫,其中全文數(shù)據(jù)庫是國內(nèi)最常用的全文數(shù)據(jù)庫。1計(jì)算機(jī)檢索根本原理概述第四階段:網(wǎng)絡(luò)化檢索階段進(jìn)入90年代,隨著衛(wèi)星通訊、公共數(shù)據(jù)通訊、光纜通訊技術(shù)以及信息高速公路事業(yè)在全世界的迅猛開展,計(jì)算機(jī)情報(bào)檢索走向了全球大聯(lián)網(wǎng)。
網(wǎng)上資源具有信息的時(shí)效性、內(nèi)容的廣泛性、訪問的快速性、搜索的網(wǎng)絡(luò)性和資源的動(dòng)態(tài)性五大特點(diǎn),那么要及時(shí)、準(zhǔn)確、有效地獲取與自身需求相關(guān)的實(shí)用信息,對(duì)所有網(wǎng)絡(luò)用戶都非常具有挑戰(zhàn)性。1計(jì)算機(jī)檢索根本原理概述INTERNET就是這個(gè)時(shí)期的最杰出代表。它能夠跨越時(shí)空,進(jìn)行實(shí)時(shí)信息檢索、資源共享的國際性計(jì)算機(jī)網(wǎng)絡(luò)。INTERNET飛速的開展,已成為人們進(jìn)行全球范圍的合作、信息交流與資源共享的不可替代的通訊交流方式。
隨著計(jì)算機(jī)技術(shù)的智能化、數(shù)據(jù)庫載體的高密度化和多媒體化、通訊技術(shù)的網(wǎng)絡(luò)化,計(jì)算機(jī)情報(bào)檢索將走向辦公室化、家庭化。2計(jì)算機(jī)檢索根本原理一般地說,計(jì)算機(jī)檢索包括:信息的存儲(chǔ)和檢索兩個(gè)局部,即對(duì)應(yīng)數(shù)據(jù)庫的建立和查找兩個(gè)局部。2.1信息存儲(chǔ)就是文獻(xiàn)標(biāo)引人員對(duì)文獻(xiàn)內(nèi)容進(jìn)行主題分析,即把文獻(xiàn)包含的信息內(nèi)容分析成假設(shè)干能代表文獻(xiàn)主題的概念,并用詞表、分類表等標(biāo)準(zhǔn)化標(biāo)識(shí)的情報(bào)檢索語言對(duì)文獻(xiàn)主題進(jìn)行標(biāo)引、按所選數(shù)據(jù)庫結(jié)構(gòu)的索引結(jié)構(gòu)輸入到計(jì)算機(jī)進(jìn)行存儲(chǔ),同時(shí)把入選文獻(xiàn)中的其他特征標(biāo)識(shí)〔標(biāo)題、著者、文摘、原文出處等〕也一起輸入計(jì)算機(jī),編制成一系列索引數(shù)據(jù)庫,這便是信息的存儲(chǔ)。2計(jì)算機(jī)檢索根本原理2.2信息檢索1、檢索者對(duì)檢索課題進(jìn)行主題分析、明確檢索范圍,形成能代表情報(bào)需求的假設(shè)干主題概念。2、把這些主題概念轉(zhuǎn)換成計(jì)算機(jī)信息檢索語言,即用數(shù)據(jù)庫檢索工具書對(duì)各概念選詞和進(jìn)行邏輯組配,編制成檢索提問式。3、用計(jì)算機(jī)檢索系統(tǒng)功能在文獻(xiàn)資料數(shù)據(jù)庫中將信息需求主題概念和數(shù)據(jù)庫內(nèi)文獻(xiàn)主題概念標(biāo)識(shí)進(jìn)行匹配,找到命中文獻(xiàn)。用圖表示如下:計(jì)算機(jī)檢索原理的示意圖信息檢索的根本技術(shù)3文獻(xiàn)信息數(shù)據(jù)庫的根本概念3.1數(shù)據(jù)庫的定義和類型一、數(shù)據(jù)庫定義:根據(jù)ISO/DIS5127號(hào)標(biāo)準(zhǔn)〔文獻(xiàn)與情報(bào)工作術(shù)語〕,數(shù)據(jù)庫〔database〕的定義為:“至少由一種文檔組成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。〞通俗地說,數(shù)據(jù)庫就是在計(jì)算機(jī)存儲(chǔ)設(shè)備上按一定方式存儲(chǔ)的相互關(guān)聯(lián)的數(shù)據(jù)集合,數(shù)據(jù)庫是計(jì)算機(jī)技術(shù)與情報(bào)檢索技術(shù)相結(jié)合的產(chǎn)物,是現(xiàn)代重要的信息資源管理工具,是情報(bào)檢索系統(tǒng)的核心局部之一。數(shù)據(jù)庫的質(zhì)量直接影響情報(bào)檢索系統(tǒng)的功能和效率。3文獻(xiàn)信息數(shù)據(jù)庫的根本概念二、數(shù)據(jù)庫類型按照國際上通用的分類方法,常劃分為以下類型:1.參考數(shù)據(jù)庫〔referencedatabases〕:指引用戶到另一信息源以獲得原文或其他細(xì)節(jié)的一類數(shù)據(jù)庫:包括書目數(shù)據(jù)庫和指南數(shù)據(jù)庫兩種。(1)書目數(shù)據(jù)庫〔bibliographicdatabases〕指存儲(chǔ)某個(gè)領(lǐng)域的二次文獻(xiàn)〔如文摘、題錄、目錄等書目數(shù)據(jù)〕的一類數(shù)據(jù)庫。例如,美國化學(xué)文摘數(shù)據(jù)庫CASearch、EI,中國機(jī)械工程文摘數(shù)據(jù)庫,各國生產(chǎn)發(fā)行的機(jī)讀目錄〔MARC〕等,即屬于此類型。3文獻(xiàn)信息數(shù)據(jù)庫的根本概念(2)指南數(shù)據(jù)庫〔referencedatabases〕指存儲(chǔ)關(guān)于某些機(jī)構(gòu)、人物、出版物、工程、程序、活動(dòng)等對(duì)象的簡要描述,指引用戶獲取更詳細(xì)的信息的一類數(shù)據(jù)庫。亦稱指示性數(shù)據(jù)庫。例如,各種機(jī)構(gòu)名錄數(shù)據(jù)庫、人物傳記數(shù)據(jù)庫、產(chǎn)品數(shù)據(jù)庫、軟件數(shù)據(jù)庫、研究開發(fā)工程數(shù)據(jù)庫、基金數(shù)據(jù)庫等,均屬此類。2.源數(shù)據(jù)庫〔sourcedatabases〕:提供原始資料或具體數(shù)據(jù)的數(shù)據(jù)庫。它又可分為以下幾種類型:3文獻(xiàn)信息數(shù)據(jù)庫的根本概念〔1〕數(shù)值數(shù)據(jù)庫(numericdatabases)指專門提供以數(shù)值方式表示的數(shù)據(jù)〔或包括其統(tǒng)計(jì)處理表示法〕的一種源數(shù)據(jù)庫,如各種統(tǒng)計(jì)數(shù)據(jù)庫、財(cái)務(wù)數(shù)據(jù)庫、科學(xué)技術(shù)數(shù)據(jù)庫等?!?〕文本-數(shù)值數(shù)據(jù)庫〔textual-numericdatabases):同時(shí)提供文本信息和數(shù)值數(shù)據(jù)的一種源數(shù)據(jù)庫,如某些公司信息庫、產(chǎn)品市場報(bào)告數(shù)據(jù)庫、毒物數(shù)據(jù)庫和物性數(shù)據(jù)庫等?!?〕全文數(shù)據(jù)庫〔full-textdatabases〕指存儲(chǔ)文獻(xiàn)全文或其中主要局部的一種源數(shù)據(jù)庫,簡稱全文庫,如法律法規(guī)全文庫、期刊全文庫等。3文獻(xiàn)信息數(shù)據(jù)庫的根本概念〔4〕術(shù)語數(shù)據(jù)庫〔terminologicalbank〕指專門存儲(chǔ)名詞術(shù)語信息一種源數(shù)據(jù)庫,各種電子化辭書也包括在內(nèi)?!?〕圖像數(shù)據(jù)庫〔graphicsdatabases〕指用來存儲(chǔ)各種圖像或圖形信息及有關(guān)文字說明資料的一種源數(shù)據(jù)庫,主要應(yīng)用于建筑、設(shè)計(jì)、廣告、產(chǎn)品目錄、圖片或照片等資料類型的計(jì)算機(jī)存儲(chǔ)與檢索。除了上述幾種類型的數(shù)據(jù)庫以個(gè),還有能同時(shí)存儲(chǔ)多種不同類型數(shù)據(jù)的數(shù)據(jù)庫混合型數(shù)據(jù)庫〔mixeddatabases〕。3文獻(xiàn)信息數(shù)據(jù)庫的根本概念2.3.2數(shù)據(jù)庫的構(gòu)成
從使用觀點(diǎn)來看,數(shù)據(jù)庫主要由文檔、記錄、字段三個(gè)層次構(gòu)成。1、文檔:假設(shè)干個(gè)邏輯記錄構(gòu)成的信息集合稱為文檔〔file〕。用戶選擇所需的聯(lián)機(jī)系統(tǒng)數(shù)據(jù)庫時(shí),多數(shù)數(shù)據(jù)庫以單一的文檔編號(hào)出現(xiàn)。此時(shí)文檔〔file〕的概念和數(shù)據(jù)庫〔database〕相當(dāng)。但有些數(shù)據(jù)庫因規(guī)模龐大,被分成假設(shè)干個(gè)文檔。例如,在DAILOG系統(tǒng)中,CASearch數(shù)據(jù)庫被分成308號(hào)〔1967-1971〕,309號(hào)〔1977-1981〕,311號(hào)〔1982-1986〕和312號(hào)〔1986-〕等文檔。3文獻(xiàn)信息數(shù)據(jù)庫的根本概念2.記錄記錄是由假設(shè)干字段組成的文獻(xiàn)單元,是計(jì)算機(jī)檢索系統(tǒng)存儲(chǔ)文獻(xiàn)款目和標(biāo)引的信息載體。在全文數(shù)據(jù)庫中,一個(gè)記錄相當(dāng)于一篇完整的文獻(xiàn);在書目數(shù)據(jù)庫中,一個(gè)記錄相當(dāng)于一條文摘或題錄。比較典型的EI〔COMPENDEX〕,INSPEC,美國專利數(shù)據(jù)庫的記錄。3文獻(xiàn)信息數(shù)據(jù)庫的根本概念3.字段:是文獻(xiàn)著錄的根本單元,它是對(duì)實(shí)體的具體屬性進(jìn)行描述的結(jié)果。在書目數(shù)據(jù)庫中,記錄中含有題名、著者、出版年、主題詞、文摘等字段。文獻(xiàn)數(shù)據(jù)庫字段分為根本字段和輔助字段兩類。根本字段和輔助字段在檢索策略的構(gòu)成方法上往往有些區(qū)別。根本字段通常是默認(rèn)的主題途徑檢索范圍,如果需要查找專門的根本字段或者輔助字段,通常要以某種方法予以指定。常見的字段名稱和代碼〔也稱段碼〕如下表所示。文獻(xiàn)數(shù)據(jù)庫中常見的字段和段碼4計(jì)算機(jī)檢索策略的構(gòu)建與調(diào)整檢索策略是為實(shí)現(xiàn)檢索目標(biāo)而制定的全盤方案和方案,是對(duì)整個(gè)檢索過程的謀劃和指導(dǎo)。也可以說,所謂檢索策略,就是在分析情報(bào)提問實(shí)質(zhì)的根底上,確定檢索途徑與檢索用詞,并明確各詞之間的邏輯關(guān)系與查找步驟的科學(xué)安排。4.1計(jì)算機(jī)檢索策略的構(gòu)建1、布爾邏輯規(guī)定檢索詞之間的邏輯關(guān)系的算符,稱為布爾邏輯算符。布爾邏輯算符包括邏輯“或〔OR〕〞、邏輯“與〔AND〕〞和邏輯“非〔NOT〕〞?!?〕、邏輯“或〞〔OR〕運(yùn)算符也可用“+〞代替,是用來組配具有同義或同族概念的詞,如同義詞、相關(guān)詞等。其含義是,檢出的記錄中,至少含有兩個(gè)檢索詞中的一個(gè)。OR算符的根本作用是擴(kuò)大檢索范圍,增加命中文獻(xiàn)量,防止漏檢,提高檢索結(jié)果的查全率,OR運(yùn)算符還有一個(gè)去重的功能。4.1計(jì)算機(jī)檢索策略的構(gòu)建例如,如果以提問式“SSPIPETUBE〞檢索EICOMPENDEX〔1998〕文檔,所得結(jié)果為:S11834PIPE〔管〕S22022TUBE〔電子管〕S33647PIPEORTUBE(2)邏輯"與"〔AND〕運(yùn)算符也可用"*"代替,用來組配不同檢索概念。其含義是檢出的記錄必須同時(shí)含有所有的檢索詞。AND算符的根本作用是對(duì)檢索詞加以限定,逐步縮小檢索范圍,減少命中文獻(xiàn)量,提高檢索結(jié)果的查準(zhǔn)率。在實(shí)際檢索中,不同概念組面之間以及同一組面內(nèi)的不同含義的詞之間通常使用AND算符。4.1計(jì)算機(jī)檢索策略的構(gòu)建例如:以提問式"SSCOMMUNICATIONANDSATELLITE"檢索EICOMPENDEX〔1998〕文檔,所得結(jié)果為:S112940COMMUNICATION〔通訊〕S22173SATELLITE〔衛(wèi)星〕S3842COMMUNICATIONANDSATELLITE(3)邏輯"非"〔NOT〕運(yùn)算符也可用"-"代替,但在檢索時(shí)建議使用NOT,以防止與詞間的分隔符"-"混淆,NOT算符是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時(shí)含有其后的詞。4.1計(jì)算機(jī)檢索策略的構(gòu)建NOT算符的根本作用是縮小檢索范圍,但并不一定能提高文獻(xiàn)命中的準(zhǔn)確性,往往只是起到減少文獻(xiàn)輸出量的作用。在聯(lián)機(jī)檢索中,可降低檢索費(fèi)用。例如,以"PATENTNOTGERMAN"檢索EICOMPENDEX〔1998〕文檔,所得結(jié)果為:S1110PATENT〔專利〕S2325GERMAN〔德國〕S3108PATENTNOTGERMAN4.1計(jì)算機(jī)檢索策略的構(gòu)建2.字段限制字段限制也是調(diào)整檢索策略的一種重要的手段。多數(shù)檢索系統(tǒng)對(duì)不指定字段的檢索詞,通常在所有根本字段中進(jìn)行搜索,如果想指定在文獻(xiàn)的題目等字段中查找所希望的檢索詞,就需要使用字段限制。字段限制適用于在已有一定數(shù)量輸出記錄的根底上,通過指定字段的方法,減少輸出篇數(shù),提高檢索結(jié)果的查準(zhǔn)率。字段限制〔DIALOG聯(lián)機(jī)檢索系統(tǒng)為例〕(1)根本字段限制根本字段主要是指題目、敘詞、識(shí)別詞和文摘四個(gè)字段。根本字段限制的用法是在需要指定的字段的檢索詞后加上后綴運(yùn)算符“/〞和段碼。例如,檢索策略“OPTICAL/TIANDFIBER/TI〞的含義是指定在題目字段中查找含有“optical〔光學(xué)〕〞和“fiber〔纖維〕〞兩詞的所有記錄。
字段限制〔DIALOG聯(lián)機(jī)檢索系統(tǒng)為例〕(2)輔助字段限制除根本字段以外的可檢索字段都可稱為輔助字段。輔助字段運(yùn)算符的用法是在需要指定字段的檢索詞(有時(shí)檢索詞須放在雙引號(hào)內(nèi))之前加上段碼和前綴運(yùn)算符“=〞。例如,AU=“Robert,S.〞的含義是在作者字段中查找含人名為“Robert,S.〞的所有記錄。下面是其他常用的輔助字段限制及其實(shí)例:指定刊物名稱JN=APPLIEDPHYSICS指定語言字段LA=ENGLISH指定年份字段PY=19994.1計(jì)算機(jī)檢索策略的構(gòu)建3.截詞算符截詞算符就是使計(jì)算機(jī)保存檢索詞中的相同詞干局部,允許檢索詞可有一定范圍的變化,這種功能可減少輸入步驟,簡化檢索程序,擴(kuò)大檢索范圍,提高查全率。不同的數(shù)據(jù)庫有不同的截字符,DIALOG系統(tǒng)用“?〞,ORBIT系統(tǒng)用“+〞,功能根本相同。截詞有前方一致、前方一致、中間一致和中間屏蔽四種形式。前方一致,允許詞尾有所變化;前方一致,允許詞頭有所變化,中間一致,詞頭、詞尾都可變化;中間屏蔽,允許詞中間的某些字母有變化。4.1計(jì)算機(jī)檢索策略的構(gòu)建4.范圍限制查找范圍算符的作用主要是用戶利用輔助索引時(shí),對(duì)查找文獻(xiàn)的年限范圍進(jìn)行限制。等于:如在日期檢索項(xiàng)輸入“1990*〞,那么表示1990年發(fā)表的文獻(xiàn)大于:輸入“>1990*〞大于等于:“>=1990*〞不等于:“<>1990*〞范圍:如在日期檢索項(xiàng)輸入“1991*:1994*〞,那么表示查找1991~1994年的文獻(xiàn)其它:短語檢索、自然語言檢索(小節(jié))4.2計(jì)算機(jī)檢索步驟和策略調(diào)整方法1.分析課題(1)一般的課題概念分析方法:分析主要概念,找出能代表這些概念的假設(shè)干個(gè)詞或詞組,對(duì)新學(xué)科、交叉學(xué)科和邊緣學(xué)科的課題,要搞清楚這些概念關(guān)系。概念分析的結(jié)果應(yīng)以概念組為單元的詞或詞組形式列出,以便下一步制訂檢索策略。例如,“聚乙烯的合成〔synthesisofpolyethylene〕〞這個(gè)課題可劃分為兩個(gè)概念,即“聚乙烯〔polyethylene〕〞與“合成〔synthesis〕〞。4.2計(jì)算機(jī)檢索步驟和策略調(diào)整方法(2)隱含概念的分析:課題所隱含的概念從專業(yè)角度作深入分析,才能提煉出能夠確切反映課題內(nèi)容的檢索概念。例如,“垃圾的處理〞中的“處理〞一詞隱含著“回收〞“再生〞等具體的處理方法,再如,課題“大型機(jī)械電子滲漏儀〞,其中“電子〞〔electronic〕一詞,在該專業(yè)中往往是用“傳感器〞來表示,即用“sensor〞、“transducer〞或“l(fā)oad-cell〞等來表示。類似的,諸如“工藝〞、“分析〞、“應(yīng)用〞,以及諸如“有機(jī)物〞、“無機(jī)物〞、“重金屬〞、“輕金屬〞、“高分子材料〞等外延十分寬的概念,一般都應(yīng)轉(zhuǎn)換成具體的方法或材料、化合物來表示。4.2計(jì)算機(jī)檢索步驟和策略調(diào)整方法(3)核心概念的選限:有些檢索詞中已經(jīng)含有的某些概念,在概念予以排除。例如,課題“玻璃纖維增強(qiáng)石膏制品〞,從字面上看,這個(gè)課題可劃為三個(gè)概念:即“玻璃纖維〞、“增強(qiáng)〞、“石膏制品〞。但石膏制品中參加玻璃纖維,其目的就是為了增強(qiáng)石膏制品,因此可將“增強(qiáng)〞這一概念排除之外。如果有些檢索概念已經(jīng)表達(dá)在數(shù)據(jù)庫中,這些概念也應(yīng)該予以排除。如陶瓷文摘數(shù)據(jù)庫〔CeramicAbstracts〕,“陶瓷〔ceramic〕〞這一概念一般可以排除;而COMPUTER
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)藝設(shè)計(jì)中的材質(zhì)與質(zhì)感現(xiàn)代辦公空間應(yīng)用案例
- 環(huán)境影響綜合評(píng)估的實(shí)踐與思考
- 現(xiàn)代網(wǎng)絡(luò)編程語言的性能優(yōu)化探討
- 11 爸爸媽媽在我心中(說課稿)-統(tǒng)編版道德與法治三年級(jí)上冊(cè)
- 9古詩三首《題西林壁》說課稿-2024-2025學(xué)年統(tǒng)編版語文四年級(jí)上冊(cè)
- 《5 童年在游戲中成長》說課稿-2024-2025學(xué)年三年級(jí)上冊(cè)綜合實(shí)踐活動(dòng)長春版
- Unit 4 Position Lesson 1 The Magic Show(說課稿)-2024-2025學(xué)年北師大版(三起)英語五年級(jí)上冊(cè)
- 2023三年級(jí)數(shù)學(xué)上冊(cè) 3 測(cè)量第1課時(shí) 毫米的認(rèn)識(shí)說課稿 新人教版
- 7 小書包 說課稿-2024-2025學(xué)年語文一年級(jí)上冊(cè)統(tǒng)編版
- 16大家一起來合作-團(tuán)結(jié)合作快樂多(說課稿)-統(tǒng)編版道德與法治一年級(jí)下冊(cè)
- 密度計(jì)法顆粒分析試驗(yàn)記錄(自動(dòng)和計(jì)算)
- 土方轉(zhuǎn)運(yùn)方案
- (11.3.1)-10.3蒸汽壓縮制冷循環(huán)
- JJF(紡織)064-2013織物防鉆絨性試驗(yàn)儀(摩擦法)校準(zhǔn)規(guī)范
- GB/T 21797-2008化學(xué)品有機(jī)磷化合物28天重復(fù)劑量的遲發(fā)性神經(jīng)毒性試驗(yàn)
- 2023年湖北成人學(xué)位英語考試真題
- 園區(qū)保安巡邏崗標(biāo)準(zhǔn)作業(yè)規(guī)程
- SJG 112-2022 既有建筑幕墻安全性鑒定技術(shù)標(biāo)準(zhǔn)高清最新版
- 旅游文本的翻譯課件
- 最全新能源材料-鋰離子電池材料189張課件
- 申論詳解(PPT課件)
評(píng)論
0/150
提交評(píng)論