




已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
文獻(xiàn)信息檢索基礎(chǔ)知識(shí)一基本概念1文獻(xiàn):定義:文獻(xiàn)是記錄有知識(shí)或信息的一切載體。具體地說(shuō)文獻(xiàn)是以文字、符號(hào)、圖形、聲頻、視頻等手段將信息、知識(shí)記錄在各種載體上所形成的物質(zhì)實(shí)體。即記錄有信息、知識(shí)的紙張、膠片、磁帶、磁盤(pán)、光盤(pán)及一些網(wǎng)絡(luò)資源都可以稱(chēng)之為文獻(xiàn)。文獻(xiàn)的主要功能是存儲(chǔ)信息、傳遞信息。文獻(xiàn)的特征:包括文獻(xiàn)的內(nèi)容特征和文獻(xiàn)的外表特征兩個(gè)方面。2信息:定義:信息是事物運(yùn)動(dòng)的狀態(tài)與方式的反映。簡(jiǎn)言之,信息就是事物發(fā)出的消息。人與人間傳遞信息可通過(guò):肢體語(yǔ)言、口頭語(yǔ)言、書(shū)面語(yǔ)言等。信息的特征:普遍性;時(shí)效性;客觀(guān)性;可加工性;共享性;可變換性;傳遞性;可轉(zhuǎn)化性3知識(shí):關(guān)于知識(shí)的定義亦有種種,西方20世紀(jì)60年代以來(lái)一直流行的說(shuō)法是經(jīng)濟(jì)合作與發(fā)展組織(oecd)在以知識(shí)為基礎(chǔ)的經(jīng)濟(jì)專(zhuān)題報(bào)告中所提的知識(shí)定義:“4個(gè)w”: know what (知道是什么) 關(guān)于事實(shí)方面的知識(shí)。 know why(知道為什么) 關(guān)于自然原理和規(guī)律方面的知識(shí)。 know how(知道怎么做) 關(guān)于技能或能力方面的知識(shí)。 know who(知道誰(shuí)有知識(shí)) 關(guān)于到哪里尋求知識(shí)的知識(shí)。定義:知識(shí)是人類(lèi)認(rèn)識(shí)的成果和結(jié)晶,是人類(lèi)在認(rèn)識(shí)和改造世界的社會(huì)實(shí)踐中獲得的對(duì)事物本質(zhì)的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。這是廣義的知識(shí)概念。知識(shí)具有主觀(guān)性、抽象性、客觀(guān)性的特點(diǎn)。二文獻(xiàn)的基本類(lèi)型與特征對(duì)文獻(xiàn)類(lèi)型的劃分,由于所選標(biāo)準(zhǔn)以及分析方法不同,有各種不同的劃分方法,一般可按下面幾種情況來(lái)劃分。1根據(jù)載體材料、存儲(chǔ)技術(shù)和傳遞方式的不同: 印刷型(又稱(chēng)紙制文獻(xiàn)、印本文獻(xiàn))以紙張為載體,用印刷方式(雕版印刷、活字印刷、石印、照相影印、計(jì)算機(jī)排印)記錄知識(shí)的文獻(xiàn),是傳統(tǒng)的文獻(xiàn)形式,也是現(xiàn)代的文獻(xiàn)信息資源的主要形式之一。印刷型文獻(xiàn)因方便實(shí)用,直觀(guān)性強(qiáng),是人類(lèi)交流和傳播信息的主要形式。缺點(diǎn):存儲(chǔ)的信息密度低,占據(jù)空間大,難以實(shí)現(xiàn)加工和利用的自動(dòng)化,不便于對(duì)其進(jìn)行長(zhǎng)期管理和長(zhǎng)期保存。主要類(lèi)型有:期刊、圖書(shū)等。縮微型以感光材料為載體,用縮微照相的方式,將文字、圖形、影像等信息按比例縮小后存儲(chǔ)在感光材料上,并借助于專(zhuān)用閱讀器而使用的文獻(xiàn)。目前最常用的是縮微膠卷(microfilm)和縮徽平片(microfiche)。聲像型又稱(chēng)音像型文獻(xiàn)或視聽(tīng)型文獻(xiàn),以磁性材料、光學(xué)材料等為載體,記錄聲音信息和圖像信息的文獻(xiàn)。它是人們最容易而且樂(lè)于接受的信息形式,主要特點(diǎn):存儲(chǔ)信息密度高,內(nèi)容直觀(guān)、真切,表現(xiàn)力強(qiáng),易于理解,尤其是適用于難以用文字、符號(hào)描述的復(fù)雜信息和自然現(xiàn)象。但需要專(zhuān)門(mén)設(shè)備對(duì)其進(jìn)行制作和閱讀。主要類(lèi)型:如唱片、錄音帶、錄像帶、電影膠片、幻燈片、激光視盤(pán)等。 機(jī)讀型 又稱(chēng)電子型文獻(xiàn)、數(shù)字信息資源,即用計(jì)算機(jī)閱讀的文獻(xiàn),并以光、電、磁性材料為存儲(chǔ)介質(zhì),采用計(jì)算機(jī)等高新技術(shù)為記錄手段,將信息存儲(chǔ)在磁帶、磁盤(pán)、光盤(pán)等載體中而形成的多種類(lèi)型的電子出版物。機(jī)讀型文獻(xiàn)包括計(jì)算機(jī)文檔、光盤(pán)數(shù)據(jù)庫(kù)、電子圖書(shū)、電子期刊、電子報(bào)紙、電子郵件和電傳文本等。其優(yōu)點(diǎn)是存貯密度高,存取速度快、查找方便,信息共享性好、易復(fù)制,原有記錄可以改變、更新。除具有與印刷出版物相當(dāng)?shù)奈墨I(xiàn)文本之外還可以提供多維的、有序化的可操作的功能。除檢索之外,還可以對(duì)文本進(jìn)行有目的的抽取、排序、重新組合,從而產(chǎn)生新的信息產(chǎn)品。第一類(lèi)文獻(xiàn)又稱(chēng)紙質(zhì)文獻(xiàn)或紙版文獻(xiàn),后三類(lèi)文獻(xiàn)統(tǒng)稱(chēng)為電子文獻(xiàn),當(dāng)前人們通常說(shuō)的電子版文獻(xiàn),大都指機(jī)讀型文獻(xiàn)。2按照文獻(xiàn)的出版形式劃分圖書(shū)定義:圖書(shū):是指具有獨(dú)立的內(nèi)容體系、相當(dāng)篇幅和完整裝幀形式的文獻(xiàn)。 圖書(shū)往往是以原始記錄為素材,對(duì)某領(lǐng)域進(jìn)行系統(tǒng)闡述,或?qū)ΜF(xiàn)有研究成果、技術(shù)和經(jīng)驗(yàn)進(jìn)行歸納、概括而成,多為總結(jié)性。特點(diǎn):內(nèi)容比較成熟、全面、系統(tǒng)、可靠且具有一定的新穎性。不足之處:出版周期長(zhǎng),傳遞信息速度慢。通過(guò)它可以全面、系統(tǒng)地了解一個(gè)學(xué)科或?qū)iT(mén)領(lǐng)域的研究歷史與現(xiàn)狀,在調(diào)查顯示的科研人員利用文獻(xiàn)的比重中,圖書(shū)只占15%左右。從信息檢索的角度看,圖書(shū)不構(gòu)成主要對(duì)象。科研人員一般不把它列為首選的使用對(duì)象。連續(xù)出版物(1)期刊:定義:又稱(chēng)雜志,是定期或不定期連續(xù)出版的、有統(tǒng)一的名稱(chēng)、固定的開(kāi)本、版式、有連續(xù)的序號(hào)、匯集了多位作者分別撰寫(xiě)的多篇文章,并由專(zhuān)門(mén)的機(jī)構(gòu)編輯出版的連續(xù)性出版物。期刊的種類(lèi)很多,有學(xué)術(shù)性刊物,普通的快報(bào)、消息性刊物,數(shù)據(jù)性刊物、檢索刊物亦以期刊的形式出版。較圖書(shū)更新迅速、反映研究動(dòng)態(tài)與前沿。目前,全世界每年出版的各類(lèi)期刊中,科技期刊約占2/3。我國(guó)現(xiàn)有的期刊中,科技期刊占54%以上。據(jù)統(tǒng)計(jì),科研人員從期刊中得到的信息約占65%以上,是十分重要的情報(bào)源。特點(diǎn):內(nèi)容新穎、信息量大、出版周期短、傳遞信息快、傳播面廣、時(shí)效性強(qiáng)用途:獲取最新研究成果和動(dòng)態(tài)核心期刊:某學(xué)科(或某領(lǐng)域)的核心期刊,是指那些發(fā)表該學(xué)科(或該領(lǐng)域)論文較多、使用率(含被引率、摘轉(zhuǎn)率和流通率)較高、學(xué)術(shù)影響較大的期刊。(2)報(bào)紙:有統(tǒng)一的名稱(chēng),定期連續(xù)出版,每期匯集許多篇新聞、報(bào)道、消息、評(píng)論等,多為對(duì)開(kāi)或四開(kāi),以單張散頁(yè)形式出版。以傳播新聞和評(píng)論、提供娛樂(lè)或生活服務(wù)為主要內(nèi)容。具有時(shí)事性、普及性、大眾性、服務(wù)性和傳遞信息迅速、信息量大的特點(diǎn),是一種十分重要的信息來(lái)源,有人稱(chēng)之為“第一傳媒”。報(bào)道快、及時(shí)、新穎、發(fā)行量大,是圖書(shū)、期刊等無(wú)法比擬的。特種文獻(xiàn)通常指那些出版發(fā)行方式或獲取途徑比較特殊的文獻(xiàn),非書(shū)非刊,形式多樣。(1)科技報(bào)告:也稱(chēng)技術(shù)報(bào)告、研究報(bào)告,是科學(xué)研究工作和開(kāi)發(fā)調(diào)查工作成果的記錄或正式報(bào)告。按研究階段可分為進(jìn)展報(bào)告和最終報(bào)告。特點(diǎn):信息新穎、敘述詳盡、保密性強(qiáng)、每份報(bào)告單獨(dú)成冊(cè)、有獨(dú)立的編號(hào)、有固定的機(jī)構(gòu)名稱(chēng)和較嚴(yán)格的陳述形式,是獲取最新信息的重要信息來(lái)源。科技報(bào)告內(nèi)容新穎、專(zhuān)業(yè)性強(qiáng),技術(shù)數(shù)據(jù)具體詳盡,完整可靠,信息含量高,有數(shù)據(jù)、圖表、實(shí)驗(yàn)記錄等相關(guān)資料,涉及領(lǐng)域十分廣泛。對(duì)于了解某項(xiàng)技術(shù)的研制試驗(yàn)和評(píng)價(jià)結(jié)果,某項(xiàng)科學(xué)技術(shù)問(wèn)題的現(xiàn)狀和發(fā)展,非常重要。科技報(bào)告的數(shù)量很大,在全世界的科技報(bào)告中,美國(guó)占了80%以上。如:美國(guó)政府四大報(bào)告:pb、ad、nasa、doe報(bào)告,都有各自的檢索工具。(2)會(huì)議文獻(xiàn):是了解有關(guān)領(lǐng)域發(fā)展情況的重要資源,有會(huì)前文獻(xiàn)、會(huì)中文獻(xiàn)、會(huì)后文獻(xiàn)之分(會(huì)議論文等:正式出版物)。(3)專(zhuān)利文獻(xiàn):專(zhuān)利制度的產(chǎn)物,是實(shí)行專(zhuān)利制度的國(guó)家,在接受申請(qǐng)和審批發(fā)明過(guò)程中形成的有關(guān)出版物的總稱(chēng)。包括專(zhuān)利說(shuō)明書(shū)、專(zhuān)利公報(bào)、專(zhuān)利分類(lèi)表、專(zhuān)利檢索工具以及與相關(guān)的法律性文件。 目前全世界有130多個(gè)國(guó)家建立了專(zhuān)利制度,我國(guó)的專(zhuān)利法是1984年3月通過(guò),1985年4月開(kāi)始實(shí)施的,它的目的在于通過(guò)保護(hù)發(fā)明人的合法權(quán)益推動(dòng)技術(shù)的發(fā)展。目前專(zhuān)利制度已進(jìn)入國(guó)際合作階段。各個(gè)國(guó)家的專(zhuān)利審批機(jī)構(gòu)、國(guó)際性專(zhuān)利組織都是獲取專(zhuān)利文獻(xiàn)的重要來(lái)源(另:專(zhuān)利網(wǎng)站、數(shù)據(jù)庫(kù))。(4)技術(shù)標(biāo)準(zhǔn):標(biāo)準(zhǔn)化的產(chǎn)物,是經(jīng)過(guò)公認(rèn)的權(quán)威機(jī)構(gòu)(標(biāo)準(zhǔn)化組織或有關(guān)機(jī)構(gòu))以特定的文件形式出現(xiàn)的標(biāo)準(zhǔn)化工作成果。由技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)及其他具有標(biāo)準(zhǔn)化性質(zhì)的類(lèi)似文件所組成,是從事生產(chǎn)和建設(shè)的一個(gè)共同依據(jù)。特點(diǎn):具有權(quán)威性、規(guī)范性、法律性、時(shí)效性、陳舊性。目前,各個(gè)領(lǐng)域都在標(biāo)準(zhǔn)化的影響范圍之內(nèi)。技術(shù)標(biāo)準(zhǔn)按內(nèi)容可分為基本標(biāo)準(zhǔn)、產(chǎn)品標(biāo)準(zhǔn)、方法標(biāo)準(zhǔn)、安全衛(wèi)生標(biāo)準(zhǔn)。技術(shù)標(biāo)準(zhǔn)是各國(guó)推行技術(shù)政策的工具,一個(gè)國(guó)家的指標(biāo)文獻(xiàn)可以反映其經(jīng)濟(jì)、技術(shù)政策、生產(chǎn)水平、資源情況和標(biāo)準(zhǔn)化水平。先進(jìn)的標(biāo)準(zhǔn)可供研制新產(chǎn)品,改進(jìn)工藝、操作水平提供參考;進(jìn)口設(shè)施的組裝、維修、零部件的配制需要標(biāo)準(zhǔn)文獻(xiàn)在對(duì)外貿(mào)易中,技術(shù)標(biāo)準(zhǔn)常常構(gòu)成非關(guān)稅壁壘。(5)學(xué)位論文:是指高等學(xué)?;蜓芯繖C(jī)構(gòu)的學(xué)生為取得某種(博士、碩士及學(xué)士)學(xué)位時(shí),在導(dǎo)師的指導(dǎo)下撰寫(xiě)并呈交的體現(xiàn)其學(xué)術(shù)研究水平,并供審查答辯用的研究論文。特點(diǎn):具有一定的獨(dú)創(chuàng)性;一般不公開(kāi)出版;質(zhì)量參差不齊。(6)政府出版物: 各國(guó)政府及其設(shè)立的專(zhuān)門(mén)機(jī)構(gòu)所頒發(fā)行政文件和科技文獻(xiàn)的總稱(chēng)。就其性質(zhì)可分為行政性文獻(xiàn)和科技性文獻(xiàn)兩大類(lèi)。行政性文獻(xiàn)包括國(guó)企記錄、政府法令、方針政策、規(guī)章制度、決議指示、調(diào)查報(bào)告、統(tǒng)計(jì)資料等;科技性文獻(xiàn)包括科技研究報(bào)告、科普材料、技術(shù)政策文件等。政府出版物具有正式性、權(quán)威性的特點(diǎn)。(7)技術(shù)檔案:是指科研生產(chǎn)活動(dòng)中形成的,有具體事物對(duì)象的技術(shù)文件、圖紙、圖表、照片和原始記錄等的總稱(chēng)。(8)產(chǎn)品樣本:產(chǎn)品樣本是對(duì)定型產(chǎn)品的性能、構(gòu)造原理、用途、使用方法和操作規(guī)程等所作的具體說(shuō)明。 3按加工的深度劃分:零次文獻(xiàn)信息:(non-printed document)指未經(jīng)出版發(fā)行的或未進(jìn)入社會(huì)交流的最原始的文獻(xiàn)。如:私人筆記、底稿、書(shū)稿、手稿、實(shí)驗(yàn)記錄、會(huì)議記錄、個(gè)人通訊等。具有內(nèi)容新穎、不成熟不定型不公開(kāi)交流、難以獲得的特點(diǎn)。零次文獻(xiàn)在內(nèi)容上有一定的價(jià)值,而且能彌補(bǔ)一般公開(kāi)文獻(xiàn)從信息的客觀(guān)形成到公開(kāi)傳播之間費(fèi)時(shí)甚多的弊病,其新穎程度頗受關(guān)注。一次文獻(xiàn)信息:(primary document)又稱(chēng)原始文獻(xiàn),通常是指著者以自己的研究成果為基礎(chǔ)創(chuàng)作或撰寫(xiě)的,已公開(kāi)發(fā)行進(jìn)入社會(huì)流通使用的文獻(xiàn),如:專(zhuān)著、學(xué)術(shù)論文、專(zhuān)利說(shuō)明、科技報(bào)告等。具有新穎性、創(chuàng)造性的特點(diǎn),是科技人員參考得最多的基本材料,有很高的直接參考價(jià)值和借鑒使用價(jià)值,但數(shù)量龐大,儲(chǔ)存分散,不易直接查找利用。二次文獻(xiàn)信息:(secondary document)二次文獻(xiàn)的生成過(guò)程即是對(duì)知識(shí)信息有序化的二次加工過(guò)程。是把大量的、分散的、無(wú)序的文獻(xiàn)收集進(jìn)來(lái),按照一定的方法進(jìn)行加工、整理、提煉、濃縮,使之系統(tǒng)化,便于查找而形成的文獻(xiàn)。如文摘、題錄、書(shū)目、索引等檢索工具。在現(xiàn)代社會(huì)信息量激增的形勢(shì)下,人們?yōu)榱丝焖俣?jīng)濟(jì)地傳遞信息、搜集和利用信息,更加關(guān)心和重視使用文摘雜志,具有濃縮性、匯集性、有序性的特點(diǎn)。三次文獻(xiàn)信息:(tertiary document)是選用大量有關(guān)的文獻(xiàn),經(jīng)過(guò)綜合、分析、研究而編寫(xiě)出來(lái)的文獻(xiàn)。通常是圍繞著某個(gè)專(zhuān)題,在利用二次文獻(xiàn)的基礎(chǔ)上,選用大量相關(guān)的一次文獻(xiàn),采用科學(xué)的方法,對(duì)文獻(xiàn)的內(nèi)容進(jìn)行深度加工、編寫(xiě)而成的。如綜述、述評(píng)、字典、詞典、辭典、百科全書(shū)、類(lèi)書(shū)、政書(shū)、手冊(cè)、年鑒、指南等?,F(xiàn)代技術(shù)的發(fā)展,使文獻(xiàn)的這種劃分界線(xiàn)變得模糊,大部分?jǐn)?shù)據(jù)庫(kù)集文獻(xiàn)線(xiàn)索檢索與原文獻(xiàn)獲取為一體。四者的相互關(guān)系從零次文獻(xiàn)、一次文獻(xiàn)、二次文獻(xiàn)到三次文獻(xiàn),它是一個(gè)由分散到集中,由無(wú)序到有序,由博而略地對(duì)知識(shí)信息進(jìn)行不同層次的加工過(guò)程。零次和一次文獻(xiàn)是最基本的信息源,是文獻(xiàn)信息檢索和利用的主要對(duì)象;二次文獻(xiàn)是一次文獻(xiàn)的集中提煉和有序化,是文獻(xiàn)信息檢索的工具;三次文獻(xiàn)是把分散的零次、一次、二次文獻(xiàn)按照專(zhuān)題或者知識(shí)的門(mén)類(lèi)進(jìn)行綜合分析加工而成的成果,是高度濃縮的文獻(xiàn)信息,它既是文獻(xiàn)信息檢索和利用的對(duì)象,也可作為檢索文獻(xiàn)信息的工具。它主要有兩大類(lèi)型:一是系統(tǒng)闡述某個(gè)領(lǐng)域的內(nèi)容、意義、歷史、現(xiàn)狀和發(fā)展趨勢(shì)的綜述性學(xué)科總結(jié),如綜述、評(píng)論、述評(píng)、進(jìn)展、動(dòng)態(tài)、教材等;二是把大量的定理、原理、數(shù)據(jù)、公式、方法等知識(shí)進(jìn)行濃縮和概括,編寫(xiě)成便于查閱的參考工具書(shū),如百科全書(shū)、手冊(cè)、年鑒、指南等。三次文獻(xiàn)內(nèi)容更集中,針對(duì)性更強(qiáng),系統(tǒng)性好,并有一定的檢索功能,有較高的參考價(jià)值。4根據(jù)出版形式和內(nèi)容公開(kāi)程度劃分白色文獻(xiàn) 白色文獻(xiàn)是指一切正式出版并在社會(huì)成員中公開(kāi)流通的文獻(xiàn),包括圖書(shū)、報(bào)紙、期刊等。這類(lèi)文獻(xiàn)多通過(guò)出版社、書(shū)店、郵局等正規(guī)渠道發(fā)行,向社會(huì)所有成員公開(kāi),其蘊(yùn)涵的信息大白于天下,人人均可利用。是當(dāng)今社會(huì)利用率最高的文獻(xiàn)?;疑墨I(xiàn) 灰色文獻(xiàn)指非公開(kāi)發(fā)行的內(nèi)部文獻(xiàn)或限制流通的文獻(xiàn)。因從正規(guī)渠道難以獲得,故又被稱(chēng)為“非常見(jiàn)文獻(xiàn)”或“特種文獻(xiàn)”。這類(lèi)文獻(xiàn)出版量小,發(fā)行渠道復(fù)雜,流通范圍有一定限制,不易收集。其收錄和獲取成本較高,但是價(jià)值卻很大。黑色文獻(xiàn) 包括兩方面的情況:其一,人們未破譯或未識(shí)別其中信息的文獻(xiàn),如考古出現(xiàn)的古老文字、未經(jīng)分析厘定的文獻(xiàn);其二,處于保密狀態(tài)或不愿公布其內(nèi)容的文獻(xiàn),如未解密的檔案、個(gè)人日記、私人信件等。這類(lèi)文獻(xiàn)除作者及特定人員外,一般社會(huì)成員極難獲得和利用。三、文獻(xiàn)信息檢索基礎(chǔ)知識(shí)1信息檢索的相關(guān)概念:信息檢索:即信息查找,是人們利用特定的檢索技巧與方法,從信息集合中對(duì)目標(biāo)資源進(jìn)行快速定位、獲取與信息需求相關(guān)的那部分信息的過(guò)程。也就是:將信息按照一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)用戶(hù)的需求找出有關(guān)信息的過(guò)程。有廣義,狹義之分。完整的信息檢索概念包括兩項(xiàng)工作:(1)信息存儲(chǔ)過(guò)程,即搜集、篩選、整理、積累現(xiàn)有信息及檢索工具,建立信息檢索系統(tǒng);(2)信息檢索過(guò)程,即利用信息檢索工具查找所需要的信息。狹義的信息檢索即利用信息檢索工具查找所需要的信息。則僅指該過(guò)程的后半部分,即從信息集合中找出所需要的信息的過(guò)程,相當(dāng)于人們通常所說(shuō)的信息查詢(xún)。4著錄:也稱(chēng)標(biāo)引。所謂“標(biāo)引”,是給這些文獻(xiàn)信息一個(gè)標(biāo)識(shí),引導(dǎo)我們使用這些標(biāo)識(shí)把文獻(xiàn)納入到檢索系統(tǒng)或者利用這些標(biāo)識(shí)檢索文獻(xiàn)。比如說(shuō)我們圖書(shū)館的目錄,就是把圖書(shū)的書(shū)名,著名,分類(lèi)號(hào)等項(xiàng)目著錄下來(lái),并按分類(lèi)號(hào)排列形成分類(lèi)目錄,或按書(shū)名順序排列形成書(shū)名目錄。2文獻(xiàn)信息檢索的類(lèi)型根據(jù)檢索方式(即依賴(lài)的檢索工具與檢索系統(tǒng))來(lái)劃分:手工檢索是利用檢索工具與工具書(shū)進(jìn)行的,在檢索之前,要對(duì)檢索工具的編排、檢索方法,包含的內(nèi)容進(jìn)行全面了解。計(jì)算機(jī)檢索是利用數(shù)據(jù)庫(kù)或檢索系統(tǒng)進(jìn)行的,輸入指令由計(jì)算機(jī)自動(dòng)匹配完成。因此擬定的檢索式應(yīng)該便于系統(tǒng)識(shí)別。3 文獻(xiàn)信息檢索系統(tǒng)31檢索系統(tǒng)的概念信息檢索系統(tǒng):又稱(chēng)情報(bào)檢索系統(tǒng),是指按某種方式、方法建立起來(lái)的,以提供信息檢索為目的一種有層次的信息存儲(chǔ)與檢索系統(tǒng),是表征有序的信息特征的集合體。其中二次或三次文獻(xiàn)信息是文獻(xiàn)信息系統(tǒng)的核心和概括。信息檢索系統(tǒng)的建立是以對(duì)所收錄信息的組織為基礎(chǔ)的,是一定范圍文獻(xiàn)、信息的全部記錄的有序集合。功能:報(bào)道文獻(xiàn)信息、存儲(chǔ)文獻(xiàn)信息、檢索文獻(xiàn)信息32文獻(xiàn)信息檢索系統(tǒng)的主要類(lèi)型嚴(yán)格地說(shuō),信息檢索系統(tǒng)是作為檢索工具存在的信息源集合,其功能側(cè)重于檢索。所以,在這里,我們把信息檢索系統(tǒng)的類(lèi)型也稱(chēng)作檢索工具的類(lèi)型。1目錄型目錄也稱(chēng)書(shū)目,是以一件或一種完整的出版物(如一本書(shū)、一種期刊等)作為著錄基本單位的檢索工具。按一定次序編排,僅提供檢索線(xiàn)索。主要描述文獻(xiàn)的外部特征。常見(jiàn)的目錄型檢索系統(tǒng)(檢索工具):國(guó)家書(shū)目:系統(tǒng)記錄一個(gè)國(guó)家某時(shí)期所出版的全部書(shū)籍的一種目錄,可以反映出一個(gè)國(guó)家書(shū)籍出版的現(xiàn)狀和歷史。比如:全國(guó)總書(shū)目。館藏目錄:主要提示某一圖書(shū)館或若干圖書(shū)館收藏書(shū)刊的信息。聯(lián)合目錄:是匯總?cè)舾蓤D書(shū)館或其它收藏單位所藏書(shū)刊的目錄。出版社目錄:根據(jù)出版社出版的圖書(shū)或書(shū)店發(fā)行的圖書(shū)館編制而成的目錄。2索引型索引:是根據(jù)一定的需要,把特定范圍內(nèi)的某些重要文獻(xiàn)中的有關(guān)款目或知識(shí)單元(如書(shū)名、刊名、人名、地名、語(yǔ)詞等),按照一定的方法編排,并指明出處,為用戶(hù)提供文獻(xiàn)線(xiàn)索的一種檢索工具。索引是一種常見(jiàn)的檢索工具,有些網(wǎng)絡(luò)數(shù)據(jù)庫(kù)便是以索引命名的,如十三經(jīng)索引、科學(xué)引文索引(sci)等。3題錄型:題錄是以單篇或單份文獻(xiàn)為著錄的基本單位的檢索工具,以文獻(xiàn)的題名、著者等特征信息為描述對(duì)象,提供對(duì)文獻(xiàn)出版的檢索工具。主要揭示、報(bào)道文獻(xiàn)的外表特征。4.文摘型文摘亦稱(chēng)提要、內(nèi)容摘要等,是指在題錄的基礎(chǔ)上,在每條著錄款目后邊用簡(jiǎn)練的語(yǔ)言文字,對(duì)文獻(xiàn)的內(nèi)容所做的簡(jiǎn)略、準(zhǔn)確的描述。不包括對(duì)原文的補(bǔ)充、解釋或評(píng)論。它不僅報(bào)道文獻(xiàn)的外部特征,也報(bào)道文獻(xiàn)的內(nèi)容特征,是二次文獻(xiàn)的核心,檢索工具的主體。著名的文摘有新華文摘、科學(xué)文摘等,工程索引雖以索引命名,卻是著名的文摘型檢索工具。5全文是一種面向全文、提供全文的新型檢索技術(shù)。它可以使用原文中任何一個(gè)有實(shí)際意義的詞作為檢索入口,得到的結(jié)果是源文獻(xiàn)而不是文獻(xiàn)的線(xiàn)索。四文獻(xiàn)信息檢索語(yǔ)言 1檢索語(yǔ)言的概述定義:檢索語(yǔ)言(information retrieval language)是信息存儲(chǔ)與檢索過(guò)程中用于描述信息特征和表達(dá)用戶(hù)信息提問(wèn)的一種專(zhuān)門(mén)語(yǔ)言。也稱(chēng)標(biāo)引語(yǔ)言、索引語(yǔ)言、信息檢索語(yǔ)言。檢索語(yǔ)言獨(dú)立于具體的檢索工具或檢索系統(tǒng)之外,作為一種軟件被若干檢索工具或檢索系統(tǒng)所利用。檢索語(yǔ)言的作用:對(duì)文獻(xiàn)的外部征和內(nèi)容進(jìn)行多層次描述,提供多種檢索途徑,以方便用戶(hù)從不同角度檢索查找。主要有以下兩種作用:加工與組織:對(duì)文獻(xiàn)中包含的知識(shí)內(nèi)容與外部特征進(jìn)行規(guī)范化標(biāo)引,對(duì)文獻(xiàn)的外部特征進(jìn)行規(guī)范化描述。匹配檢索:提供對(duì)標(biāo)引用語(yǔ)和檢索用語(yǔ)的相符性比較。2檢索語(yǔ)言的主要類(lèi)型按檢索語(yǔ)言的結(jié)構(gòu)與產(chǎn)生原理分:分類(lèi)語(yǔ)言、主題語(yǔ)言、代碼語(yǔ)言。1分類(lèi)語(yǔ)言相關(guān)概念:分類(lèi)語(yǔ)言:按知識(shí)門(mén)類(lèi)的邏輯次序?qū)π畔⑦M(jìn)行組織與檢索的語(yǔ)言,是從文獻(xiàn)內(nèi)容的學(xué)科屬性對(duì)文獻(xiàn)進(jìn)行描述與揭示,建立在對(duì)文獻(xiàn)、信息所屬內(nèi)容的特征基礎(chǔ)上的檢索語(yǔ)言。按分類(lèi)語(yǔ)言對(duì)檢索系統(tǒng)進(jìn)行組織,具有按學(xué)科組織與檢索相關(guān)文獻(xiàn)信息的作用,這就是分類(lèi)語(yǔ)言的族性檢索(從學(xué)科門(mén)類(lèi))功能。具有極好的擴(kuò)檢與微檢功能。類(lèi)目:是分類(lèi)語(yǔ)言的基本語(yǔ)匯。一個(gè)特定類(lèi)目由分類(lèi)號(hào)與類(lèi)目名稱(chēng)共同構(gòu)成。分類(lèi)號(hào)的主要功能是組織文獻(xiàn)與提供檢索。分類(lèi)號(hào)的標(biāo)記制度:純數(shù)字(如:科圖法)、字母與數(shù)字共同組成的混合制(如:中圖法)兩種。 類(lèi)目名稱(chēng)是用來(lái)說(shuō)明特定類(lèi)目所聚集的文獻(xiàn)、信息的學(xué)科范圍的一組文字。如“i247 中國(guó)現(xiàn)代長(zhǎng)篇小說(shuō)”(中國(guó)圖書(shū)館分類(lèi)法)中的“i247”為分類(lèi)號(hào),“當(dāng)代作品(1949-)”為類(lèi)目名稱(chēng)。 索取號(hào)或索書(shū)號(hào):是文獻(xiàn)在目錄或書(shū)庫(kù)中的地址號(hào),也就是圖書(shū)排架的號(hào)碼。由分類(lèi)號(hào)+種次號(hào)(或著者號(hào))構(gòu)成。如:i247.5/4-1。分類(lèi)語(yǔ)言的類(lèi)型:等級(jí)體系分類(lèi)語(yǔ)言(等級(jí)體系分類(lèi)法)、分析綜合型分類(lèi)語(yǔ)言(組配分類(lèi)語(yǔ)言)與混合分類(lèi)語(yǔ)言。其中最常見(jiàn)的是等級(jí)體系分類(lèi)語(yǔ)言。最常見(jiàn)的等級(jí)體系分類(lèi)法:國(guó)內(nèi):中國(guó)圖書(shū)館圖書(shū)分類(lèi)法(國(guó)家標(biāo)準(zhǔn))簡(jiǎn)稱(chēng)中圖法,中國(guó)圖書(shū)資料分類(lèi)法,簡(jiǎn)稱(chēng)資料法,中國(guó)科學(xué)院圖書(shū)館圖書(shū)分類(lèi)法,簡(jiǎn)稱(chēng)科圖法。國(guó)外:杜威十進(jìn)分類(lèi)法(國(guó)際上使用范圍最廣的)、國(guó)際十進(jìn)分類(lèi)法、美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類(lèi)法。目前各搜索引掣的網(wǎng)頁(yè)目錄采用的是等級(jí)體系結(jié)構(gòu),也就是采用了分類(lèi)語(yǔ)言對(duì)網(wǎng)絡(luò)信息進(jìn)行組織的通行方法,以便網(wǎng)絡(luò)用戶(hù)逐級(jí)點(diǎn)擊直到鎖定目標(biāo)資源。分類(lèi)語(yǔ)言的最大特色是它的族性檢索功能,使用它比較容易進(jìn)行擴(kuò)檢與縮檢。但這種檢索語(yǔ)言的局限亦十分明顯,即同一主題的文獻(xiàn)、信息常常被分散到不同的類(lèi)目之下。中國(guó)圖書(shū)館分類(lèi)法(中圖法)體系分類(lèi)法是以科學(xué)分類(lèi)為基礎(chǔ),依據(jù)概念的劃分與概括原理,把概括文獻(xiàn)內(nèi)容與事物的各種類(lèi)目組成一個(gè)層層隸屬、詳細(xì)列舉的等級(jí)結(jié)構(gòu)體系的一種文獻(xiàn)分類(lèi)法,亦稱(chēng)列舉式分類(lèi)法、枚舉式分類(lèi)法。中國(guó)圖書(shū)館分類(lèi)法中圖法是國(guó)家標(biāo)準(zhǔn)。共分五個(gè)基本部類(lèi):馬列主義、毛澤東思想;哲學(xué);社會(huì)科學(xué);自然科學(xué)和綜合性圖書(shū)。在五大部類(lèi)的基礎(chǔ)上,社會(huì)科學(xué)展開(kāi)為九大類(lèi),自然科學(xué)展開(kāi)為十大類(lèi),共計(jì)22個(gè)基本大類(lèi),稱(chēng)為一級(jí)類(lèi)目,每個(gè)基本大類(lèi)下又可劃分成若干個(gè)二級(jí)類(lèi)目,二級(jí)類(lèi)目下再劃分出若干個(gè)三級(jí)類(lèi)目,這樣屢屢劃分,逐級(jí)展開(kāi),類(lèi)目可細(xì)分至七級(jí)。1個(gè)字母或數(shù)字代表一級(jí)類(lèi)目。如:h311.2一共有五級(jí)。 由于t類(lèi)“工業(yè)技術(shù)”是一個(gè)龐大的體系,文獻(xiàn)數(shù)量巨大,因此又以雙字母標(biāo)記展開(kāi)了16個(gè)二級(jí)類(lèi),其重要程度不亞于基本大類(lèi)。2主題語(yǔ)言定義:主題語(yǔ)言是表達(dá)文獻(xiàn)內(nèi)容中所涉及的核心事物與概念的檢索語(yǔ)言。主題法:用以自然語(yǔ)言中的詞語(yǔ)或規(guī)范化的詞語(yǔ)作為揭示文獻(xiàn)主題的標(biāo)識(shí),并以此標(biāo)識(shí)編排組織和查找文獻(xiàn)的方法主題詞:指代特定概念與事物的語(yǔ)詞。主題詞有自然語(yǔ)言中的詞語(yǔ),也有從自然語(yǔ)言中優(yōu)選出的規(guī)范化詞語(yǔ)。 主題語(yǔ)言的類(lèi)型主題法在發(fā)展過(guò)程中,依選詞的不同,先后出現(xiàn)了標(biāo)題詞法、單元詞法、關(guān)鍵詞法和敘詞法等多種文獻(xiàn)組織與檢索的方法。關(guān)鍵詞法:關(guān)鍵詞是指那些出現(xiàn)在文獻(xiàn)標(biāo)題(篇名、章節(jié)名)、摘要和正文中,對(duì)表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的詞語(yǔ)。關(guān)鍵詞語(yǔ)言是直接選用文獻(xiàn)中的自然語(yǔ)言作為基本詞匯,并將那些能夠揭示文獻(xiàn)主題的關(guān)鍵性詞匯作為關(guān)鍵詞進(jìn)行標(biāo)引和檢索的一種檢索語(yǔ)言。關(guān)鍵詞是非規(guī)范的,無(wú)需查閱標(biāo)準(zhǔn)詞表,不受詞表控制,快捷簡(jiǎn)便,適于用計(jì)算機(jī)組織和檢索文獻(xiàn)信息。但由于關(guān)鍵詞法的詞語(yǔ)不規(guī)范,影響了文獻(xiàn)信息的查全率和查準(zhǔn)率。如果你所使用的關(guān)鍵詞不規(guī)范,隨意性太強(qiáng),就可能查不出相應(yīng)的文獻(xiàn)。所以選取關(guān)鍵詞時(shí)應(yīng)盡量考慮周全。首先由于名詞與名詞術(shù)語(yǔ)在取名上的多樣性,選詞時(shí)要對(duì)同義詞、近義詞、學(xué)名和俗名、不同譯名、簡(jiǎn)稱(chēng)與全稱(chēng)、不同寫(xiě)法等進(jìn)行選擇;對(duì)多義詞、同形異義詞進(jìn)行限定說(shuō)明;其次由于英文構(gòu)詞的多樣性,選詞時(shí)也要注意英語(yǔ)的復(fù)合詞、派生詞、單復(fù)數(shù)以及英文單詞拼寫(xiě)的變體等等,從而避免產(chǎn)生誤檢和漏檢。分類(lèi)語(yǔ)言、敘詞語(yǔ)言和關(guān)鍵詞語(yǔ)言是目前檢索系統(tǒng)所使用的通用檢索語(yǔ)言,是我們認(rèn)識(shí)和使用一種檢索工具與檢索系統(tǒng)的起點(diǎn)。目前大多數(shù)搜索引掣使用的都是關(guān)鍵詞語(yǔ)言,而學(xué)科信息門(mén)戶(hù)使用的基本是規(guī)范語(yǔ)言。五文獻(xiàn)信息檢索途徑1以文獻(xiàn)信息外表特征為檢索途徑:題名途徑:是以各種事物的名稱(chēng)為檢索點(diǎn)來(lái)檢索文獻(xiàn)信息。主要用于檢索圖書(shū),期刊與有關(guān)資料。著者途徑:以文獻(xiàn)著者的姓名字順為檢索點(diǎn)進(jìn)行檢索的一種途徑。這類(lèi)檢索工具有著者目錄、著者索引,機(jī)構(gòu)索引等。號(hào)碼途徑:是以文獻(xiàn)信息的號(hào)碼標(biāo)識(shí)為檢索點(diǎn)來(lái)檢索文獻(xiàn)信息的途徑。在已知文獻(xiàn)代碼情況下,利用代碼途徑檢索文獻(xiàn),可謂是一條既快又準(zhǔn)的捷徑。2以文獻(xiàn)信息內(nèi)容特征為檢索途徑:關(guān)鍵詞途徑是以文章作者所列出的、反映自己文章主題內(nèi)容的關(guān)鍵詞作為檢索點(diǎn)來(lái)檢索文獻(xiàn)。這是機(jī)檢中使用頻率很高的一種檢索途徑。分類(lèi)途徑是以文獻(xiàn)信息內(nèi)容所屬的學(xué)科類(lèi)別為檢索點(diǎn)來(lái)檢索文獻(xiàn)的一條途徑。它是檢索文獻(xiàn)的主要途徑之一。常用的工具有分類(lèi)目錄和分類(lèi)索引。主題途徑這是以反映文獻(xiàn)內(nèi)容的有關(guān)主題詞作為檢索點(diǎn)檢索文獻(xiàn)的一條途徑,它也是文獻(xiàn)檢索的主要途徑之一。按主題途徑檢索的關(guān)鍵是選準(zhǔn)主題詞,合理選擇和使用主題詞,對(duì)檢索結(jié)果的優(yōu)劣直接產(chǎn)生影響。主題檢索途徑是目前很受用戶(hù)歡迎的一種文獻(xiàn)信息檢索途徑。引文途徑利用被引文獻(xiàn)來(lái)查找原文獻(xiàn)的檢索方法。如: cnki中國(guó)期刊網(wǎng)被引用字段,維普中文期刊數(shù)據(jù)庫(kù)引文檢索途徑。 中文社會(huì)科學(xué)引文索引六、計(jì)算機(jī)信息檢索的基本技術(shù)與方法1 計(jì)算機(jī)文獻(xiàn)信息檢索的技術(shù)查全率(recall ratio)檢出相關(guān)文獻(xiàn)量/文獻(xiàn)庫(kù)內(nèi)相關(guān)文獻(xiàn)的總量 100%查準(zhǔn)率(precision ratio)檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量100%11布爾邏輯檢索(邏輯組配檢索)(boolean logical)指采用布爾邏輯表達(dá)式來(lái)表達(dá)用戶(hù)的檢索要求,并通過(guò)一定的算法和實(shí)現(xiàn)手段進(jìn)行檢索的過(guò)程。布爾邏輯表達(dá)式是采用布爾運(yùn)算符(邏輯與“and”、邏輯或“or”、邏輯非“not”等)來(lái)連接運(yùn)算檢索詞,以及表示運(yùn)算優(yōu)先級(jí)的括號(hào)組成的一種表達(dá)檢索要求的一種算式,簡(jiǎn)稱(chēng)提問(wèn)邏輯式。l 邏輯與“ and ”運(yùn)算符,也可用“*”表示,用來(lái)組配不同的概念的檢索詞。是一種概念相交和限定關(guān)系的組配。例如:“a and b”或“a * b”其含義是:檢出的信息中必須同時(shí)含有“a”和“b”兩個(gè)檢索詞。基本作用是對(duì)檢索范圍加以限定,逐步縮小檢索范圍,提高檢索結(jié)果的查準(zhǔn)率。例如,檢索“計(jì)算機(jī)在圖書(shū)館中的應(yīng)用”方面的文獻(xiàn),其提問(wèn)式可寫(xiě)成:計(jì)算機(jī) and 圖書(shū)館 或 計(jì)算機(jī)*圖書(shū)館l 邏輯或“ or ”運(yùn)算符,也可用“ + ”表示,是用來(lái)組配具有同義或同族概念的檢索詞。如:檢索提問(wèn)式:“a or b”或“a + b”其含義是數(shù)據(jù)庫(kù)記錄中任何一條記錄,只要含有“a”或“b”中任何一個(gè)檢索詞即為命中的文獻(xiàn)?;咀饔檬菙U(kuò)大檢索范圍,增加命中文獻(xiàn)量,提高文獻(xiàn)的查全率。如:“微機(jī) + 電腦 + pc機(jī)”、 “微機(jī) or 電腦 or pc機(jī)”l 邏輯非“ not ”運(yùn)算符,也可用“-”表示,“not”算符是排除含有某些詞的記錄,其邏輯提問(wèn)表達(dá)式為“a not b”或 “a - b”,即檢出的記錄中只能含有“not”算符前的檢索詞 a,但不能同時(shí)含有“not”后的檢索詞 b?;咀饔檬强s小檢索范圍,但并不一定能邏輯非提高文獻(xiàn)命中的準(zhǔn)確性,一般只起到減少文獻(xiàn)輸出量的作用。在聯(lián)機(jī)檢索中可降低檢索費(fèi)用。例如:“計(jì)算機(jī) not 微機(jī)”應(yīng)注意,由于“not”算符有排除掉相關(guān)文獻(xiàn)的可能,因此,在實(shí)際檢索中應(yīng)慎重使用。12截詞檢索截詞檢索是在詞干的不同位置添加截詞符“?”、“*”或“$”,以此代表詞的可變部位,以檢索一組概念相關(guān)或同一詞根的詞,從而減少相同詞干的檢索詞的輸入數(shù)量,提高檢全率的一種常用檢索方法。這種檢索方式可以擴(kuò)大檢索范圍,提高查全率,主要用于西文數(shù)據(jù)庫(kù)檢索。中文數(shù)據(jù)庫(kù)通常不使用這種技術(shù)。主要用于檢索詞的單復(fù)數(shù)、詞性的詞尾變化、詞根相同的一類(lèi)詞,以及同一詞的拼法變異等。在不同的檢索系統(tǒng)里用不同的符號(hào),一般為:*、?、!基本作用是提高查全率,防止漏檢。類(lèi)型: 根據(jù)截詞的位置不同,分為前截?cái)?、后截?cái)唷⒅薪財(cái)?前截?cái)啵河址Q(chēng)左截?cái)?,截詞符放在被截詞的左邊,可與后截?cái)嘁煌褂?。目前這種檢索技術(shù)應(yīng)用已經(jīng)極少,例如:*magnetic。 中截詞:把截詞符放在詞的中間。這種方式查找英美不同拼法的概念最有效。例如:如:wom*n 可檢出woman,women 后截?cái)啵菏乔胺揭恢聶z索,又稱(chēng)右截?cái)啵卦~符放在被截詞的右邊,是最常用的檢索技術(shù),例如:librar*。 根據(jù)截?cái)嗟臄?shù)量不同,分為有限截?cái)嗪蜔o(wú)限截?cái)唷?有限截?cái)啵合拗票唤財(cái)嗟淖址麛?shù)量,例如輸入apple? ? 表示被截?cái)嗟淖址挥袃蓚€(gè),可檢出apple、applet等結(jié)果。 無(wú)限截?cái)啵翰幌拗票唤財(cái)嗟淖址麛?shù)量。例如輸入educat?,可以檢索educator,educators,educated,educating,education,educational,等等。 注:不同的數(shù)據(jù)庫(kù)所用的截詞符不一樣,使用應(yīng)先查一下各數(shù)據(jù)庫(kù)的幫助加以確認(rèn)。1.3位置算符檢索表示兩個(gè)檢索詞間的位置臨近關(guān)系,又叫鄰接檢索。這種檢索技術(shù)通常只出現(xiàn)在西文數(shù)據(jù)庫(kù)中,在全文檢索中應(yīng)用較多。布爾邏輯運(yùn)算符表示兩個(gè)概念之間的邏輯關(guān)系,位置算符表示的是兩個(gè)概念在信息中的實(shí)際物理位置關(guān)系常用位置算符 w/n(with/n):兩詞相鄰,在一個(gè)標(biāo)引字段中w/n表示兩個(gè)詞不可以互換順序,二者之間可插入0-n個(gè)詞。 如:智能機(jī)器人(w/3)控制,可檢出“智能機(jī)器人控制”,“智能機(jī)器人行為控制”等 n/n(near/n):兩詞相鄰,n/n表示兩個(gè)詞可以互換順序,二者之間可插入n個(gè)詞。 如:智能機(jī)器人(n/3)控制,可檢出“智能機(jī)器人控制”,“控制算法對(duì)智能機(jī)器人的影響”等 f(field):同字段檢索,被f連接的檢索詞必須出現(xiàn)在同一字段中。 s(sub-field/sentence):同句檢索, 要求參加檢索運(yùn)算的兩個(gè)檢索詞必須在同一自然句中出現(xiàn)。1.4. 限制檢索通過(guò)設(shè)定相應(yīng)的檢索條件實(shí)現(xiàn)對(duì)檢索的優(yōu)化。是縮小或約束檢索結(jié)果的方法,最常用的是對(duì)特定字段的限定檢索。如:rice in ti(表示只在題目字段中查找文獻(xiàn)) rice in de(只在主題詞中查找) rice in ab(只在文摘中查找) au = smith,j.c (查作者為smith,j.c 的文章) py = 1998(只查1998年的文章) la =chinese (只查語(yǔ)種為中文的文獻(xiàn))常用的限制檢索方式: 字段檢索將檢索限定在特定字段內(nèi)進(jìn)行限制的方法。 字段限制范圍的大小順序是:題名關(guān)鍵詞摘要notandor1.7. 全文檢索:全文檢索是指對(duì)文獻(xiàn)全文內(nèi)容進(jìn)行字符串匹配檢索,包括字符串檢索、截詞檢索和位置檢索等技術(shù)。全文檢索技術(shù)是一種面向全文、提供全文的新型檢索技術(shù)。它可以使用原文中任何一個(gè)有實(shí)際意義的詞作為檢索入口,得到的結(jié)果是源文獻(xiàn)而不是文獻(xiàn)的線(xiàn)索。全文檢索系統(tǒng)必須具有一個(gè)全文數(shù)據(jù)庫(kù)。在全文庫(kù)的基礎(chǔ)上,對(duì)其字、詞、句、段等的加工、檢索與編輯。系統(tǒng)除了可以用布爾邏輯運(yùn)算式進(jìn)行檢索外,還具有文本檢索功能,并具有同義詞控制、后控詞表對(duì)檢索策略的自動(dòng)調(diào)整等功能。此外,系統(tǒng)還允許用戶(hù)以自然語(yǔ)言進(jìn)行檢索,直接獲取原文中的有關(guān)章、節(jié)、段、句等。1.8. 擴(kuò)檢:在試探性檢索所獲取的檢索結(jié)果過(guò)少,還不到檢索要求時(shí),應(yīng)采取擴(kuò)展檢索以擴(kuò)大檢索范圍,保證檢索率。采用的方法可以是增加檢索詞:如將原檢索詞的所有同義詞、別名、俗名作為檢索詞進(jìn)行組配檢索,使用截詞技術(shù)或擴(kuò)大檢索的年代與文獻(xiàn)范圍??s檢:亦稱(chēng)二次檢索,當(dāng)檢索結(jié)果數(shù)量過(guò)多,評(píng)價(jià)、篩選困難時(shí),為保證檢索精度與檢準(zhǔn)率,使用縮檢,即在原有檢索結(jié)果中進(jìn)行篩選,這個(gè)措施可反復(fù)采用,直到檢索結(jié)果符合要求。2 文獻(xiàn)信息檢索的基本步驟與策略采用檢索工具檢索文獻(xiàn)信息一般要經(jīng)歷5個(gè)緊密相連的步驟 1.分析研究課題,明確檢索要求 分析研究檢索課題是整個(gè)檢索過(guò)程的關(guān)鍵,是信息檢索成功與否的關(guān)鍵,檢索者首先要對(duì)課題作綜合分析,通過(guò)分析明確如下要求,(1)明確課題的專(zhuān)業(yè)范圍及其關(guān)健點(diǎn),選取主題詞。(2)明確所需文獻(xiàn)類(lèi)型。(3)確定所需文獻(xiàn)的時(shí)間范圍與語(yǔ)種范圍(4)分析檢索目的:以科研攻關(guān),解決具體的技術(shù)難題為目的。(5)研究探索:密切跟蹤,了解國(guó)內(nèi)外某一研究領(lǐng)域的最新成果與動(dòng)態(tài)。每一項(xiàng)理論或技術(shù)都有其發(fā)生、發(fā)展和形成的過(guò)程,檢索時(shí)就是根據(jù)研究課題相關(guān)知識(shí)發(fā)展的形成期、高峰期和穩(wěn)定期來(lái)確定檢索的時(shí)間范圍。檢索要求愈明確,檢索范圍愈具體,已知條件愈多,檢索效果愈好。因此,分析研究課題這一步進(jìn)展得如何,對(duì)其后的檢索程序至關(guān)重要檢索者切忌情況不明就貿(mào)然開(kāi)始檢索,這會(huì)導(dǎo)致走彎路或檢索失敗。檢索的目的與要求及檢索范圍作為選擇檢索工具與數(shù)據(jù)庫(kù)的依據(jù)。不同的數(shù)據(jù)庫(kù)其收集的文獻(xiàn)類(lèi)型、學(xué)科范圍,對(duì)文獻(xiàn)的回溯期限不同。2選擇檢索工具(或數(shù)據(jù)庫(kù))與檢索手段根據(jù)已經(jīng)明確的檢索要求與專(zhuān)業(yè)范圍,選擇合適的檢索工具或數(shù)據(jù)庫(kù)。確定檢索方法:追溯法、工具法(順查法,倒查法,抽查法)、綜合法中外文檢索工具與數(shù)據(jù)庫(kù)很多,檢索者要求對(duì)各種檢索工具或數(shù)據(jù)庫(kù)的性質(zhì),內(nèi)容和特點(diǎn)作深入了解,可借助于各種檢索工具指南,學(xué)科文獻(xiàn)指南或聯(lián)機(jī)數(shù)據(jù)庫(kù)目錄。機(jī)檢包括聯(lián)機(jī)檢索,脫機(jī)檢索,光盤(pán)檢索與網(wǎng)絡(luò)檢索,其中手工檢索基本上不花錢(qián),機(jī)檢速度快,效率高,但費(fèi)用也高。檢索者可根據(jù)時(shí)時(shí)間要求、設(shè)備狀況與經(jīng)費(fèi)條件來(lái)選擇合適的檢索手段。3確定檢索途徑與擬定檢索式采用哪種方法與途徑,要結(jié)合課題檢索要求與檢索工具或數(shù)據(jù)庫(kù)的特點(diǎn)來(lái)確定。就檢索途徑而言,如果課題檢索要求泛指性較強(qiáng)的文獻(xiàn)資料,最好用分類(lèi)途徑;如果課題檢索要求是專(zhuān)指度較高的文獻(xiàn)資料,最好選擇主題途徑,如果事先巳知文獻(xiàn)著者,分子式,專(zhuān)利號(hào),標(biāo)準(zhǔn)號(hào),報(bào)告號(hào)等條件,則利用著者途徑,分子式途徑與文獻(xiàn)代碼等途徑為好。必要時(shí)將這些途徑與分類(lèi)、主題途徑配合使用,將會(huì)收到更好的檢索效果。檢索提問(wèn)式是計(jì)算機(jī)信息檢索中用來(lái)表達(dá)用戶(hù)檢索提問(wèn)的邏輯表達(dá)式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成。4實(shí)施試檢索操作用分類(lèi)法與主題法檢索文獻(xiàn)時(shí),要選準(zhǔn)分類(lèi)號(hào)與主題詞,在機(jī)檢中還要構(gòu)造機(jī)檢策略,即用布爾邏輯或其它符號(hào)將檢索詞連接起來(lái),組成一種邏輯運(yùn)算式。在檢索過(guò)程中,無(wú)論是手檢或機(jī)檢,均需視檢出結(jié)果,如果試檢索的結(jié)果與檢索需求存在差距,則需要對(duì)檢索課題進(jìn)行再分析,不斷修改與完善檢索策略,以達(dá)到檢索的合理性與有效性。再分析的過(guò)程包括:重新選擇檢索系統(tǒng),選擇相關(guān)檢索詞,重新擬定檢索式,以及在原有檢索策略的基礎(chǔ)上進(jìn)行擴(kuò)檢、縮檢,設(shè)定較長(zhǎng)的文獻(xiàn)回溯期等。閱讀檢出結(jié)果,決定取舍。在手檢中對(duì)切題的文獻(xiàn)要記錄文獻(xiàn)資料的篇名(書(shū)名),著者,文摘、文種、來(lái)源等,尤其是文獻(xiàn)來(lái)源切不可遺漏。倘若是機(jī)檢,可選擇打印格式,聯(lián)機(jī)或脫機(jī)打印輸出即可。5檢索結(jié)果的評(píng)價(jià)與獲取原始文獻(xiàn)評(píng)價(jià)檢索結(jié)果是結(jié)合多種標(biāo)準(zhǔn)對(duì)檢索結(jié)果進(jìn)行評(píng)價(jià)、篩選,把真正符合需要的檢索結(jié)果保留下來(lái)。獲取原文是文獻(xiàn)檢索的最后一步,原文獲取可以通過(guò)多種途徑實(shí)現(xiàn)。全文數(shù)據(jù)庫(kù)的檢索與原文獲取可以一步完成,是檢索時(shí)的首選。而題錄與摘要信息檢索系統(tǒng)只能檢索到原文的線(xiàn)索,在這種情形下,應(yīng)盡可能通過(guò)本地資源獲取原文。如本地資源無(wú)法保障,則可以考慮使用電子文獻(xiàn)傳遞系統(tǒng)從其他圖書(shū)、情報(bào)機(jī)構(gòu)獲得原始文獻(xiàn)。目前大部分非全文數(shù)據(jù)庫(kù)多提供了原文的外鏈接,用戶(hù)可以根據(jù)需要選擇。3 計(jì)算機(jī)信息檢索的策略1分析研究課題,明確檢索要求檢索誤區(qū)1過(guò)分依賴(lài)搜索引擎。internet資源與專(zhuān)業(yè)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)來(lái)比,無(wú)論是質(zhì)量還是數(shù)量上都有很大的差距,檢索文獻(xiàn)目前來(lái)說(shuō)最主要的來(lái)源還應(yīng)是專(zhuān)業(yè)數(shù)據(jù)庫(kù),即正規(guī)的出版物上發(fā)表的文獻(xiàn)。檢索誤區(qū)2忽略摘要數(shù)據(jù)庫(kù)。摘要數(shù)據(jù)庫(kù)的數(shù)據(jù)量大,范圍廣,是查找文章線(xiàn)索極好的檢索工具。就目前的情況而言,不可能全部都能得到電子版的全文,先找到文章線(xiàn)索再根據(jù)線(xiàn)索查找印刷版的全文是一項(xiàng)不錯(cuò)的組合。2選擇數(shù)據(jù)庫(kù)或網(wǎng)絡(luò)檢索工具選擇合適檢索工具的前提是對(duì)網(wǎng)絡(luò)資源有一個(gè)較全面的、清晰的了解,具體地說(shuō)要對(duì)檢索工具的類(lèi)型、內(nèi)容特點(diǎn)、時(shí)間范圍、學(xué)科范圍、甚至出版商的大體情況都要有一個(gè)了解。方法: 注重平時(shí)的積累 不要盲目檢索,應(yīng)養(yǎng)成檢索前了解一下數(shù)據(jù)庫(kù)的習(xí)慣 注重與他人的交流 重視圖書(shū)館主頁(yè)的資源3提煉檢索詞,制定檢索式檢索詞盡可能選用詞或詞組,然后用布爾邏輯運(yùn)算符將檢索詞連接起來(lái),切忌把整個(gè)題名輸入到檢索框中。如:網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的安全性研究要提煉關(guān)鍵的、核心的詞作為檢索詞。去掉意義太泛或“無(wú)所謂有”的詞,有時(shí)不需要死摳字眼,意思匹配就可以了。漏檢:忽視了同義詞、相似詞等。檢索中不斷調(diào)整策略4實(shí)施試檢索操作檢索,再分析,再檢索,再分析。5檢索結(jié)果處理。七參考文獻(xiàn)著錄標(biāo)準(zhǔn)、范圍以及文后參考文獻(xiàn)的著錄格式1著錄標(biāo)準(zhǔn)(1)排列次序:依在正文中被首次引用的先后次序列出各條參考文獻(xiàn)。(2)具體要求:項(xiàng)目齊全,內(nèi)容完整,順序正確,標(biāo)點(diǎn)無(wú)誤。(3)注意事項(xiàng):只有3位及3位以?xún)?nèi)作者的,其姓名全部列上,中外作者一律姓前名后; 共有3位以上作者的,只列前3位,其后加“,等”或“,et al”; 外文文獻(xiàn)中表示縮寫(xiě)的實(shí)心句點(diǎn)“”一律略去; 原本就缺少某一項(xiàng)目時(shí),可將該項(xiàng)連同與其對(duì)應(yīng)的標(biāo)點(diǎn)符號(hào)一起略去; 頁(yè)碼不可省略,起止頁(yè)碼間用“-”相隔,不同的頁(yè)碼引用范圍之間用“,”相隔。 正文中參考文獻(xiàn)標(biāo)引一律用上標(biāo)形式的方括號(hào)內(nèi)數(shù)字表示,例如3,方括號(hào)和數(shù)字不必用粗體。2著錄范圍(共8類(lèi))(1)已在國(guó)內(nèi)外公開(kāi)出版的學(xué)術(shù)期刊上發(fā)表的論文;(2)由國(guó)內(nèi)外出版公司或出版社正式出版的學(xué)術(shù)著作(有isbn號(hào));(3)有isbn號(hào)的會(huì)議論文集及論文集中的析出論文;(4)博士和碩士學(xué)位論文;(5)專(zhuān)利文獻(xiàn);(6)國(guó)際標(biāo)準(zhǔn)、國(guó)家標(biāo)準(zhǔn)和部頒標(biāo)準(zhǔn);(7)報(bào)紙文章;(8)電子文獻(xiàn)。其他性質(zhì)的資料可以作為正文的隨文腳注。非紙張型電子文獻(xiàn)應(yīng)注明載體類(lèi)型,見(jiàn)后述。 3參考文獻(xiàn)類(lèi)型及其標(biāo)志根據(jù)gb3469 規(guī)定,對(duì)參考文獻(xiàn)類(lèi)型在文獻(xiàn)題名后應(yīng)該用方括號(hào)加以標(biāo)引,以單字母方式標(biāo)志以下各種參考文獻(xiàn)類(lèi)型:文獻(xiàn)類(lèi)型期刊論文專(zhuān)著會(huì)議論文學(xué)位論文專(zhuān)利標(biāo)準(zhǔn)報(bào)紙報(bào)告資料匯編標(biāo)志代碼jmcdpsnrg4電子文獻(xiàn)類(lèi)型標(biāo)志對(duì)于數(shù)據(jù)庫(kù)(database)、計(jì)算機(jī)程序(computer program)及電子公告(electronic bulletin board)等電子文獻(xiàn)類(lèi)型的參考文獻(xiàn),以下列字母作為標(biāo)志:電子參考文獻(xiàn)類(lèi)型數(shù)據(jù)庫(kù)計(jì)算機(jī)程序電子公告電子文獻(xiàn)類(lèi)型標(biāo)志dbcpeb對(duì)于非紙張型載體的電子文獻(xiàn),當(dāng)被引用為參考文獻(xiàn)時(shí)需在參考文獻(xiàn)類(lèi)型標(biāo)志中同時(shí)標(biāo)明其載體類(lèi)型,采用雙字母表示電子文獻(xiàn)載體類(lèi)型:磁帶(magnetic tape)mt; 磁盤(pán)(disk)dk; 光盤(pán)(cd-rom)cd; 聯(lián)機(jī)網(wǎng)絡(luò)(online)ol。以下列格式表示包括了文獻(xiàn)載體類(lèi)型的參考文獻(xiàn)類(lèi)型標(biāo)示:電子文獻(xiàn)類(lèi)型標(biāo)示/載體類(lèi)型標(biāo)示,如:db/ol聯(lián)機(jī)網(wǎng)上數(shù)據(jù)庫(kù)(database online);db/mt磁帶數(shù)據(jù)庫(kù)(database on magnetic tape)m/cd光盤(pán)圖書(shū) (monograph on cd-rom)cp/dk磁盤(pán)軟件 (computer program on disk)j/ol網(wǎng)上期刊 (journal serial online)eb/ol網(wǎng)上電子公告 (electronic bulletin board online)以紙張為載體的傳統(tǒng)文獻(xiàn)在引作參考文獻(xiàn)時(shí)可不必注明其載體類(lèi)型。 5.各類(lèi)參考文獻(xiàn)著錄格式編號(hào)文獻(xiàn)類(lèi)型 格式與示例1學(xué)術(shù)期刊 序號(hào)作者題名j刊名, 出版年份, 卷號(hào)(期號(hào)): 起頁(yè)-止頁(yè).1高景德,王祥珩交流電機(jī)的多回路理論j清華大學(xué)學(xué)報(bào),1987,27(1):1-8.2高景德,王祥珩交流電機(jī)的多回路理論j清華大學(xué)學(xué)報(bào),1987(1):1-8.3chen s,billing s a,cowan c f,et alpractical identification of marmax modelsjint j control,1990,52 (6):1327-1350.2 專(zhuān)著 序號(hào)作者書(shū)名m版次(首版免注)翻譯者出版地:出版社,出版. 起頁(yè)-止頁(yè).4
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二年級(jí)公共安全行為規(guī)范計(jì)劃
- 光伏電站土建施工危險(xiǎn)點(diǎn)識(shí)別及管理措施
- 高校學(xué)生干部個(gè)人學(xué)歷情況說(shuō)明范文
- 幼兒園園長(zhǎng)2025年節(jié)能環(huán)保工作總結(jié)及行動(dòng)計(jì)劃
- 婦產(chǎn)科護(hù)士長(zhǎng)崗位職責(zé)管理
- 融資租賃公司不良清收處置計(jì)劃
- 珠寶門(mén)店人員培訓(xùn)計(jì)劃
- 以形助數(shù)以數(shù)解形:高中數(shù)學(xué)數(shù)形結(jié)合解題教學(xué)的深度剖析與實(shí)踐
- 以平衡計(jì)分卡重塑C銀行客服中心績(jī)效體系:設(shè)計(jì)、應(yīng)用與革新
- 以學(xué)案為翼助力高中數(shù)學(xué)教學(xué)騰飛-基于多校實(shí)踐的深度剖析
- 2025數(shù)學(xué)新課程標(biāo)準(zhǔn)培訓(xùn)
- 稅務(wù)講座課件
- 2025年暑假實(shí)踐作業(yè)模板【課件】
- 學(xué)校食堂暑假前收尾工作指南
- 休閑車(chē)零部件回收再利用創(chuàng)新創(chuàng)業(yè)項(xiàng)目商業(yè)計(jì)劃書(shū)
- 滴灌帶生產(chǎn)項(xiàng)目可行性研究報(bào)告-D
- 消防系統(tǒng)維護(hù)保養(yǎng)方案
- 骨科護(hù)理實(shí)習(xí)生小講課
- 四川省南充市2023-2024學(xué)年七年級(jí)下學(xué)期期末考試道德與法治試卷(含答案)
- 2025至2030中國(guó)汽車(chē)散熱器行業(yè)市場(chǎng)發(fā)展分析及商業(yè)模式與投融資發(fā)展報(bào)告
- GB/T 45698-2025物業(yè)服務(wù)客戶(hù)滿(mǎn)意度測(cè)評(píng)
評(píng)論
0/150
提交評(píng)論