文獻(xiàn)信息檢索基礎(chǔ)知識(shí)_理論部分講義.doc_第1頁(yè)
文獻(xiàn)信息檢索基礎(chǔ)知識(shí)_理論部分講義.doc_第2頁(yè)
文獻(xiàn)信息檢索基礎(chǔ)知識(shí)_理論部分講義.doc_第3頁(yè)
文獻(xiàn)信息檢索基礎(chǔ)知識(shí)_理論部分講義.doc_第4頁(yè)
文獻(xiàn)信息檢索基礎(chǔ)知識(shí)_理論部分講義.doc_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

文獻(xiàn)信息檢索基礎(chǔ)知識(shí)一基本概念1文獻(xiàn):定義:文獻(xiàn)是記錄有知識(shí)或信息的一切載體。具體地說(shuō)文獻(xiàn)是以文字、符號(hào)、圖形、聲頻、視頻等手段將信息、知識(shí)記錄在各種載體上所形成的物質(zhì)實(shí)體。即記錄有信息、知識(shí)的紙張、膠片、磁帶、磁盤、光盤及一些網(wǎng)絡(luò)資源都可以稱之為文獻(xiàn)。文獻(xiàn)的主要功能是存儲(chǔ)信息、傳遞信息。文獻(xiàn)的特征:包括文獻(xiàn)的內(nèi)容特征和文獻(xiàn)的外表特征兩個(gè)方面。2信息:定義:信息是事物運(yùn)動(dòng)的狀態(tài)與方式的反映。簡(jiǎn)言之,信息就是事物發(fā)出的消息。人與人間傳遞信息可通過(guò):肢體語(yǔ)言、口頭語(yǔ)言、書面語(yǔ)言等。信息的特征:普遍性;時(shí)效性;客觀性;可加工性;共享性;可變換性;傳遞性;可轉(zhuǎn)化性3知識(shí):關(guān)于知識(shí)的定義亦有種種,西方20世紀(jì)60年代以來(lái)一直流行的說(shuō)法是經(jīng)濟(jì)合作與發(fā)展組織(oecd)在以知識(shí)為基礎(chǔ)的經(jīng)濟(jì)專題報(bào)告中所提的知識(shí)定義:“4個(gè)w”: know what (知道是什么) 關(guān)于事實(shí)方面的知識(shí)。 know why(知道為什么) 關(guān)于自然原理和規(guī)律方面的知識(shí)。 know how(知道怎么做) 關(guān)于技能或能力方面的知識(shí)。 know who(知道誰(shuí)有知識(shí)) 關(guān)于到哪里尋求知識(shí)的知識(shí)。定義:知識(shí)是人類認(rèn)識(shí)的成果和結(jié)晶,是人類在認(rèn)識(shí)和改造世界的社會(huì)實(shí)踐中獲得的對(duì)事物本質(zhì)的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。這是廣義的知識(shí)概念。知識(shí)具有主觀性、抽象性、客觀性的特點(diǎn)。二文獻(xiàn)的基本類型與特征對(duì)文獻(xiàn)類型的劃分,由于所選標(biāo)準(zhǔn)以及分析方法不同,有各種不同的劃分方法,一般可按下面幾種情況來(lái)劃分。1根據(jù)載體材料、存儲(chǔ)技術(shù)和傳遞方式的不同: 印刷型(又稱紙制文獻(xiàn)、印本文獻(xiàn))以紙張為載體,用印刷方式(雕版印刷、活字印刷、石印、照相影印、計(jì)算機(jī)排印)記錄知識(shí)的文獻(xiàn),是傳統(tǒng)的文獻(xiàn)形式,也是現(xiàn)代的文獻(xiàn)信息資源的主要形式之一。印刷型文獻(xiàn)因方便實(shí)用,直觀性強(qiáng),是人類交流和傳播信息的主要形式。缺點(diǎn):存儲(chǔ)的信息密度低,占據(jù)空間大,難以實(shí)現(xiàn)加工和利用的自動(dòng)化,不便于對(duì)其進(jìn)行長(zhǎng)期管理和長(zhǎng)期保存。主要類型有:期刊、圖書等。縮微型以感光材料為載體,用縮微照相的方式,將文字、圖形、影像等信息按比例縮小后存儲(chǔ)在感光材料上,并借助于專用閱讀器而使用的文獻(xiàn)。目前最常用的是縮微膠卷(microfilm)和縮徽平片(microfiche)。聲像型又稱音像型文獻(xiàn)或視聽型文獻(xiàn),以磁性材料、光學(xué)材料等為載體,記錄聲音信息和圖像信息的文獻(xiàn)。它是人們最容易而且樂于接受的信息形式,主要特點(diǎn):存儲(chǔ)信息密度高,內(nèi)容直觀、真切,表現(xiàn)力強(qiáng),易于理解,尤其是適用于難以用文字、符號(hào)描述的復(fù)雜信息和自然現(xiàn)象。但需要專門設(shè)備對(duì)其進(jìn)行制作和閱讀。主要類型:如唱片、錄音帶、錄像帶、電影膠片、幻燈片、激光視盤等。 機(jī)讀型 又稱電子型文獻(xiàn)、數(shù)字信息資源,即用計(jì)算機(jī)閱讀的文獻(xiàn),并以光、電、磁性材料為存儲(chǔ)介質(zhì),采用計(jì)算機(jī)等高新技術(shù)為記錄手段,將信息存儲(chǔ)在磁帶、磁盤、光盤等載體中而形成的多種類型的電子出版物。機(jī)讀型文獻(xiàn)包括計(jì)算機(jī)文檔、光盤數(shù)據(jù)庫(kù)、電子圖書、電子期刊、電子報(bào)紙、電子郵件和電傳文本等。其優(yōu)點(diǎn)是存貯密度高,存取速度快、查找方便,信息共享性好、易復(fù)制,原有記錄可以改變、更新。除具有與印刷出版物相當(dāng)?shù)奈墨I(xiàn)文本之外還可以提供多維的、有序化的可操作的功能。除檢索之外,還可以對(duì)文本進(jìn)行有目的的抽取、排序、重新組合,從而產(chǎn)生新的信息產(chǎn)品。第一類文獻(xiàn)又稱紙質(zhì)文獻(xiàn)或紙版文獻(xiàn),后三類文獻(xiàn)統(tǒng)稱為電子文獻(xiàn),當(dāng)前人們通常說(shuō)的電子版文獻(xiàn),大都指機(jī)讀型文獻(xiàn)。2按照文獻(xiàn)的出版形式劃分圖書定義:圖書:是指具有獨(dú)立的內(nèi)容體系、相當(dāng)篇幅和完整裝幀形式的文獻(xiàn)。 圖書往往是以原始記錄為素材,對(duì)某領(lǐng)域進(jìn)行系統(tǒng)闡述,或?qū)ΜF(xiàn)有研究成果、技術(shù)和經(jīng)驗(yàn)進(jìn)行歸納、概括而成,多為總結(jié)性。特點(diǎn):內(nèi)容比較成熟、全面、系統(tǒng)、可靠且具有一定的新穎性。不足之處:出版周期長(zhǎng),傳遞信息速度慢。通過(guò)它可以全面、系統(tǒng)地了解一個(gè)學(xué)科或?qū)iT領(lǐng)域的研究歷史與現(xiàn)狀,在調(diào)查顯示的科研人員利用文獻(xiàn)的比重中,圖書只占15%左右。從信息檢索的角度看,圖書不構(gòu)成主要對(duì)象??蒲腥藛T一般不把它列為首選的使用對(duì)象。連續(xù)出版物(1)期刊:定義:又稱雜志,是定期或不定期連續(xù)出版的、有統(tǒng)一的名稱、固定的開本、版式、有連續(xù)的序號(hào)、匯集了多位作者分別撰寫的多篇文章,并由專門的機(jī)構(gòu)編輯出版的連續(xù)性出版物。期刊的種類很多,有學(xué)術(shù)性刊物,普通的快報(bào)、消息性刊物,數(shù)據(jù)性刊物、檢索刊物亦以期刊的形式出版。較圖書更新迅速、反映研究動(dòng)態(tài)與前沿。目前,全世界每年出版的各類期刊中,科技期刊約占2/3。我國(guó)現(xiàn)有的期刊中,科技期刊占54%以上。據(jù)統(tǒng)計(jì),科研人員從期刊中得到的信息約占65%以上,是十分重要的情報(bào)源。特點(diǎn):內(nèi)容新穎、信息量大、出版周期短、傳遞信息快、傳播面廣、時(shí)效性強(qiáng)用途:獲取最新研究成果和動(dòng)態(tài)核心期刊:某學(xué)科(或某領(lǐng)域)的核心期刊,是指那些發(fā)表該學(xué)科(或該領(lǐng)域)論文較多、使用率(含被引率、摘轉(zhuǎn)率和流通率)較高、學(xué)術(shù)影響較大的期刊。(2)報(bào)紙:有統(tǒng)一的名稱,定期連續(xù)出版,每期匯集許多篇新聞、報(bào)道、消息、評(píng)論等,多為對(duì)開或四開,以單張散頁(yè)形式出版。以傳播新聞和評(píng)論、提供娛樂或生活服務(wù)為主要內(nèi)容。具有時(shí)事性、普及性、大眾性、服務(wù)性和傳遞信息迅速、信息量大的特點(diǎn),是一種十分重要的信息來(lái)源,有人稱之為“第一傳媒”。報(bào)道快、及時(shí)、新穎、發(fā)行量大,是圖書、期刊等無(wú)法比擬的。特種文獻(xiàn)通常指那些出版發(fā)行方式或獲取途徑比較特殊的文獻(xiàn),非書非刊,形式多樣。(1)科技報(bào)告:也稱技術(shù)報(bào)告、研究報(bào)告,是科學(xué)研究工作和開發(fā)調(diào)查工作成果的記錄或正式報(bào)告。按研究階段可分為進(jìn)展報(bào)告和最終報(bào)告。特點(diǎn):信息新穎、敘述詳盡、保密性強(qiáng)、每份報(bào)告單獨(dú)成冊(cè)、有獨(dú)立的編號(hào)、有固定的機(jī)構(gòu)名稱和較嚴(yán)格的陳述形式,是獲取最新信息的重要信息來(lái)源??萍紙?bào)告內(nèi)容新穎、專業(yè)性強(qiáng),技術(shù)數(shù)據(jù)具體詳盡,完整可靠,信息含量高,有數(shù)據(jù)、圖表、實(shí)驗(yàn)記錄等相關(guān)資料,涉及領(lǐng)域十分廣泛。對(duì)于了解某項(xiàng)技術(shù)的研制試驗(yàn)和評(píng)價(jià)結(jié)果,某項(xiàng)科學(xué)技術(shù)問題的現(xiàn)狀和發(fā)展,非常重要??萍紙?bào)告的數(shù)量很大,在全世界的科技報(bào)告中,美國(guó)占了80%以上。如:美國(guó)政府四大報(bào)告:pb、ad、nasa、doe報(bào)告,都有各自的檢索工具。(2)會(huì)議文獻(xiàn):是了解有關(guān)領(lǐng)域發(fā)展情況的重要資源,有會(huì)前文獻(xiàn)、會(huì)中文獻(xiàn)、會(huì)后文獻(xiàn)之分(會(huì)議論文等:正式出版物)。(3)專利文獻(xiàn):專利制度的產(chǎn)物,是實(shí)行專利制度的國(guó)家,在接受申請(qǐng)和審批發(fā)明過(guò)程中形成的有關(guān)出版物的總稱。包括專利說(shuō)明書、專利公報(bào)、專利分類表、專利檢索工具以及與相關(guān)的法律性文件。 目前全世界有130多個(gè)國(guó)家建立了專利制度,我國(guó)的專利法是1984年3月通過(guò),1985年4月開始實(shí)施的,它的目的在于通過(guò)保護(hù)發(fā)明人的合法權(quán)益推動(dòng)技術(shù)的發(fā)展。目前專利制度已進(jìn)入國(guó)際合作階段。各個(gè)國(guó)家的專利審批機(jī)構(gòu)、國(guó)際性專利組織都是獲取專利文獻(xiàn)的重要來(lái)源(另:專利網(wǎng)站、數(shù)據(jù)庫(kù))。(4)技術(shù)標(biāo)準(zhǔn):標(biāo)準(zhǔn)化的產(chǎn)物,是經(jīng)過(guò)公認(rèn)的權(quán)威機(jī)構(gòu)(標(biāo)準(zhǔn)化組織或有關(guān)機(jī)構(gòu))以特定的文件形式出現(xiàn)的標(biāo)準(zhǔn)化工作成果。由技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)及其他具有標(biāo)準(zhǔn)化性質(zhì)的類似文件所組成,是從事生產(chǎn)和建設(shè)的一個(gè)共同依據(jù)。特點(diǎn):具有權(quán)威性、規(guī)范性、法律性、時(shí)效性、陳舊性。目前,各個(gè)領(lǐng)域都在標(biāo)準(zhǔn)化的影響范圍之內(nèi)。技術(shù)標(biāo)準(zhǔn)按內(nèi)容可分為基本標(biāo)準(zhǔn)、產(chǎn)品標(biāo)準(zhǔn)、方法標(biāo)準(zhǔn)、安全衛(wèi)生標(biāo)準(zhǔn)。技術(shù)標(biāo)準(zhǔn)是各國(guó)推行技術(shù)政策的工具,一個(gè)國(guó)家的指標(biāo)文獻(xiàn)可以反映其經(jīng)濟(jì)、技術(shù)政策、生產(chǎn)水平、資源情況和標(biāo)準(zhǔn)化水平。先進(jìn)的標(biāo)準(zhǔn)可供研制新產(chǎn)品,改進(jìn)工藝、操作水平提供參考;進(jìn)口設(shè)施的組裝、維修、零部件的配制需要標(biāo)準(zhǔn)文獻(xiàn)在對(duì)外貿(mào)易中,技術(shù)標(biāo)準(zhǔn)常常構(gòu)成非關(guān)稅壁壘。(5)學(xué)位論文:是指高等學(xué)?;蜓芯繖C(jī)構(gòu)的學(xué)生為取得某種(博士、碩士及學(xué)士)學(xué)位時(shí),在導(dǎo)師的指導(dǎo)下撰寫并呈交的體現(xiàn)其學(xué)術(shù)研究水平,并供審查答辯用的研究論文。特點(diǎn):具有一定的獨(dú)創(chuàng)性;一般不公開出版;質(zhì)量參差不齊。(6)政府出版物: 各國(guó)政府及其設(shè)立的專門機(jī)構(gòu)所頒發(fā)行政文件和科技文獻(xiàn)的總稱。就其性質(zhì)可分為行政性文獻(xiàn)和科技性文獻(xiàn)兩大類。行政性文獻(xiàn)包括國(guó)企記錄、政府法令、方針政策、規(guī)章制度、決議指示、調(diào)查報(bào)告、統(tǒng)計(jì)資料等;科技性文獻(xiàn)包括科技研究報(bào)告、科普材料、技術(shù)政策文件等。政府出版物具有正式性、權(quán)威性的特點(diǎn)。(7)技術(shù)檔案:是指科研生產(chǎn)活動(dòng)中形成的,有具體事物對(duì)象的技術(shù)文件、圖紙、圖表、照片和原始記錄等的總稱。(8)產(chǎn)品樣本:產(chǎn)品樣本是對(duì)定型產(chǎn)品的性能、構(gòu)造原理、用途、使用方法和操作規(guī)程等所作的具體說(shuō)明。 3按加工的深度劃分:零次文獻(xiàn)信息:(non-printed document)指未經(jīng)出版發(fā)行的或未進(jìn)入社會(huì)交流的最原始的文獻(xiàn)。如:私人筆記、底稿、書稿、手稿、實(shí)驗(yàn)記錄、會(huì)議記錄、個(gè)人通訊等。具有內(nèi)容新穎、不成熟不定型不公開交流、難以獲得的特點(diǎn)。零次文獻(xiàn)在內(nèi)容上有一定的價(jià)值,而且能彌補(bǔ)一般公開文獻(xiàn)從信息的客觀形成到公開傳播之間費(fèi)時(shí)甚多的弊病,其新穎程度頗受關(guān)注。一次文獻(xiàn)信息:(primary document)又稱原始文獻(xiàn),通常是指著者以自己的研究成果為基礎(chǔ)創(chuàng)作或撰寫的,已公開發(fā)行進(jìn)入社會(huì)流通使用的文獻(xiàn),如:專著、學(xué)術(shù)論文、專利說(shuō)明、科技報(bào)告等。具有新穎性、創(chuàng)造性的特點(diǎn),是科技人員參考得最多的基本材料,有很高的直接參考價(jià)值和借鑒使用價(jià)值,但數(shù)量龐大,儲(chǔ)存分散,不易直接查找利用。二次文獻(xiàn)信息:(secondary document)二次文獻(xiàn)的生成過(guò)程即是對(duì)知識(shí)信息有序化的二次加工過(guò)程。是把大量的、分散的、無(wú)序的文獻(xiàn)收集進(jìn)來(lái),按照一定的方法進(jìn)行加工、整理、提煉、濃縮,使之系統(tǒng)化,便于查找而形成的文獻(xiàn)。如文摘、題錄、書目、索引等檢索工具。在現(xiàn)代社會(huì)信息量激增的形勢(shì)下,人們?yōu)榱丝焖俣?jīng)濟(jì)地傳遞信息、搜集和利用信息,更加關(guān)心和重視使用文摘雜志,具有濃縮性、匯集性、有序性的特點(diǎn)。三次文獻(xiàn)信息:(tertiary document)是選用大量有關(guān)的文獻(xiàn),經(jīng)過(guò)綜合、分析、研究而編寫出來(lái)的文獻(xiàn)。通常是圍繞著某個(gè)專題,在利用二次文獻(xiàn)的基礎(chǔ)上,選用大量相關(guān)的一次文獻(xiàn),采用科學(xué)的方法,對(duì)文獻(xiàn)的內(nèi)容進(jìn)行深度加工、編寫而成的。如綜述、述評(píng)、字典、詞典、辭典、百科全書、類書、政書、手冊(cè)、年鑒、指南等?,F(xiàn)代技術(shù)的發(fā)展,使文獻(xiàn)的這種劃分界線變得模糊,大部分?jǐn)?shù)據(jù)庫(kù)集文獻(xiàn)線索檢索與原文獻(xiàn)獲取為一體。四者的相互關(guān)系從零次文獻(xiàn)、一次文獻(xiàn)、二次文獻(xiàn)到三次文獻(xiàn),它是一個(gè)由分散到集中,由無(wú)序到有序,由博而略地對(duì)知識(shí)信息進(jìn)行不同層次的加工過(guò)程。零次和一次文獻(xiàn)是最基本的信息源,是文獻(xiàn)信息檢索和利用的主要對(duì)象;二次文獻(xiàn)是一次文獻(xiàn)的集中提煉和有序化,是文獻(xiàn)信息檢索的工具;三次文獻(xiàn)是把分散的零次、一次、二次文獻(xiàn)按照專題或者知識(shí)的門類進(jìn)行綜合分析加工而成的成果,是高度濃縮的文獻(xiàn)信息,它既是文獻(xiàn)信息檢索和利用的對(duì)象,也可作為檢索文獻(xiàn)信息的工具。它主要有兩大類型:一是系統(tǒng)闡述某個(gè)領(lǐng)域的內(nèi)容、意義、歷史、現(xiàn)狀和發(fā)展趨勢(shì)的綜述性學(xué)科總結(jié),如綜述、評(píng)論、述評(píng)、進(jìn)展、動(dòng)態(tài)、教材等;二是把大量的定理、原理、數(shù)據(jù)、公式、方法等知識(shí)進(jìn)行濃縮和概括,編寫成便于查閱的參考工具書,如百科全書、手冊(cè)、年鑒、指南等。三次文獻(xiàn)內(nèi)容更集中,針對(duì)性更強(qiáng),系統(tǒng)性好,并有一定的檢索功能,有較高的參考價(jià)值。4根據(jù)出版形式和內(nèi)容公開程度劃分白色文獻(xiàn) 白色文獻(xiàn)是指一切正式出版并在社會(huì)成員中公開流通的文獻(xiàn),包括圖書、報(bào)紙、期刊等。這類文獻(xiàn)多通過(guò)出版社、書店、郵局等正規(guī)渠道發(fā)行,向社會(huì)所有成員公開,其蘊(yùn)涵的信息大白于天下,人人均可利用。是當(dāng)今社會(huì)利用率最高的文獻(xiàn)?;疑墨I(xiàn) 灰色文獻(xiàn)指非公開發(fā)行的內(nèi)部文獻(xiàn)或限制流通的文獻(xiàn)。因從正規(guī)渠道難以獲得,故又被稱為“非常見文獻(xiàn)”或“特種文獻(xiàn)”。這類文獻(xiàn)出版量小,發(fā)行渠道復(fù)雜,流通范圍有一定限制,不易收集。其收錄和獲取成本較高,但是價(jià)值卻很大。黑色文獻(xiàn) 包括兩方面的情況:其一,人們未破譯或未識(shí)別其中信息的文獻(xiàn),如考古出現(xiàn)的古老文字、未經(jīng)分析厘定的文獻(xiàn);其二,處于保密狀態(tài)或不愿公布其內(nèi)容的文獻(xiàn),如未解密的檔案、個(gè)人日記、私人信件等。這類文獻(xiàn)除作者及特定人員外,一般社會(huì)成員極難獲得和利用。三、文獻(xiàn)信息檢索基礎(chǔ)知識(shí)1信息檢索的相關(guān)概念:信息檢索:即信息查找,是人們利用特定的檢索技巧與方法,從信息集合中對(duì)目標(biāo)資源進(jìn)行快速定位、獲取與信息需求相關(guān)的那部分信息的過(guò)程。也就是:將信息按照一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)用戶的需求找出有關(guān)信息的過(guò)程。有廣義,狹義之分。完整的信息檢索概念包括兩項(xiàng)工作:(1)信息存儲(chǔ)過(guò)程,即搜集、篩選、整理、積累現(xiàn)有信息及檢索工具,建立信息檢索系統(tǒng);(2)信息檢索過(guò)程,即利用信息檢索工具查找所需要的信息。狹義的信息檢索即利用信息檢索工具查找所需要的信息。則僅指該過(guò)程的后半部分,即從信息集合中找出所需要的信息的過(guò)程,相當(dāng)于人們通常所說(shuō)的信息查詢。4著錄:也稱標(biāo)引。所謂“標(biāo)引”,是給這些文獻(xiàn)信息一個(gè)標(biāo)識(shí),引導(dǎo)我們使用這些標(biāo)識(shí)把文獻(xiàn)納入到檢索系統(tǒng)或者利用這些標(biāo)識(shí)檢索文獻(xiàn)。比如說(shuō)我們圖書館的目錄,就是把圖書的書名,著名,分類號(hào)等項(xiàng)目著錄下來(lái),并按分類號(hào)排列形成分類目錄,或按書名順序排列形成書名目錄。2文獻(xiàn)信息檢索的類型根據(jù)檢索方式(即依賴的檢索工具與檢索系統(tǒng))來(lái)劃分:手工檢索是利用檢索工具與工具書進(jìn)行的,在檢索之前,要對(duì)檢索工具的編排、檢索方法,包含的內(nèi)容進(jìn)行全面了解。計(jì)算機(jī)檢索是利用數(shù)據(jù)庫(kù)或檢索系統(tǒng)進(jìn)行的,輸入指令由計(jì)算機(jī)自動(dòng)匹配完成。因此擬定的檢索式應(yīng)該便于系統(tǒng)識(shí)別。3 文獻(xiàn)信息檢索系統(tǒng)31檢索系統(tǒng)的概念信息檢索系統(tǒng):又稱情報(bào)檢索系統(tǒng),是指按某種方式、方法建立起來(lái)的,以提供信息檢索為目的一種有層次的信息存儲(chǔ)與檢索系統(tǒng),是表征有序的信息特征的集合體。其中二次或三次文獻(xiàn)信息是文獻(xiàn)信息系統(tǒng)的核心和概括。信息檢索系統(tǒng)的建立是以對(duì)所收錄信息的組織為基礎(chǔ)的,是一定范圍文獻(xiàn)、信息的全部記錄的有序集合。功能:報(bào)道文獻(xiàn)信息、存儲(chǔ)文獻(xiàn)信息、檢索文獻(xiàn)信息32文獻(xiàn)信息檢索系統(tǒng)的主要類型嚴(yán)格地說(shuō),信息檢索系統(tǒng)是作為檢索工具存在的信息源集合,其功能側(cè)重于檢索。所以,在這里,我們把信息檢索系統(tǒng)的類型也稱作檢索工具的類型。1目錄型目錄也稱書目,是以一件或一種完整的出版物(如一本書、一種期刊等)作為著錄基本單位的檢索工具。按一定次序編排,僅提供檢索線索。主要描述文獻(xiàn)的外部特征。常見的目錄型檢索系統(tǒng)(檢索工具):國(guó)家書目:系統(tǒng)記錄一個(gè)國(guó)家某時(shí)期所出版的全部書籍的一種目錄,可以反映出一個(gè)國(guó)家書籍出版的現(xiàn)狀和歷史。比如:全國(guó)總書目。館藏目錄:主要提示某一圖書館或若干圖書館收藏書刊的信息。聯(lián)合目錄:是匯總?cè)舾蓤D書館或其它收藏單位所藏書刊的目錄。出版社目錄:根據(jù)出版社出版的圖書或書店發(fā)行的圖書館編制而成的目錄。2索引型索引:是根據(jù)一定的需要,把特定范圍內(nèi)的某些重要文獻(xiàn)中的有關(guān)款目或知識(shí)單元(如書名、刊名、人名、地名、語(yǔ)詞等),按照一定的方法編排,并指明出處,為用戶提供文獻(xiàn)線索的一種檢索工具。索引是一種常見的檢索工具,有些網(wǎng)絡(luò)數(shù)據(jù)庫(kù)便是以索引命名的,如十三經(jīng)索引、科學(xué)引文索引(sci)等。3題錄型:題錄是以單篇或單份文獻(xiàn)為著錄的基本單位的檢索工具,以文獻(xiàn)的題名、著者等特征信息為描述對(duì)象,提供對(duì)文獻(xiàn)出版的檢索工具。主要揭示、報(bào)道文獻(xiàn)的外表特征。4.文摘型文摘亦稱提要、內(nèi)容摘要等,是指在題錄的基礎(chǔ)上,在每條著錄款目后邊用簡(jiǎn)練的語(yǔ)言文字,對(duì)文獻(xiàn)的內(nèi)容所做的簡(jiǎn)略、準(zhǔn)確的描述。不包括對(duì)原文的補(bǔ)充、解釋或評(píng)論。它不僅報(bào)道文獻(xiàn)的外部特征,也報(bào)道文獻(xiàn)的內(nèi)容特征,是二次文獻(xiàn)的核心,檢索工具的主體。著名的文摘有新華文摘、科學(xué)文摘等,工程索引雖以索引命名,卻是著名的文摘型檢索工具。5全文是一種面向全文、提供全文的新型檢索技術(shù)。它可以使用原文中任何一個(gè)有實(shí)際意義的詞作為檢索入口,得到的結(jié)果是源文獻(xiàn)而不是文獻(xiàn)的線索。四文獻(xiàn)信息檢索語(yǔ)言 1檢索語(yǔ)言的概述定義:檢索語(yǔ)言(information retrieval language)是信息存儲(chǔ)與檢索過(guò)程中用于描述信息特征和表達(dá)用戶信息提問的一種專門語(yǔ)言。也稱標(biāo)引語(yǔ)言、索引語(yǔ)言、信息檢索語(yǔ)言。檢索語(yǔ)言獨(dú)立于具體的檢索工具或檢索系統(tǒng)之外,作為一種軟件被若干檢索工具或檢索系統(tǒng)所利用。檢索語(yǔ)言的作用:對(duì)文獻(xiàn)的外部征和內(nèi)容進(jìn)行多層次描述,提供多種檢索途徑,以方便用戶從不同角度檢索查找。主要有以下兩種作用:加工與組織:對(duì)文獻(xiàn)中包含的知識(shí)內(nèi)容與外部特征進(jìn)行規(guī)范化標(biāo)引,對(duì)文獻(xiàn)的外部特征進(jìn)行規(guī)范化描述。匹配檢索:提供對(duì)標(biāo)引用語(yǔ)和檢索用語(yǔ)的相符性比較。2檢索語(yǔ)言的主要類型按檢索語(yǔ)言的結(jié)構(gòu)與產(chǎn)生原理分:分類語(yǔ)言、主題語(yǔ)言、代碼語(yǔ)言。1分類語(yǔ)言相關(guān)概念:分類語(yǔ)言:按知識(shí)門類的邏輯次序?qū)π畔⑦M(jìn)行組織與檢索的語(yǔ)言,是從文獻(xiàn)內(nèi)容的學(xué)科屬性對(duì)文獻(xiàn)進(jìn)行描述與揭示,建立在對(duì)文獻(xiàn)、信息所屬內(nèi)容的特征基礎(chǔ)上的檢索語(yǔ)言。按分類語(yǔ)言對(duì)檢索系統(tǒng)進(jìn)行組織,具有按學(xué)科組織與檢索相關(guān)文獻(xiàn)信息的作用,這就是分類語(yǔ)言的族性檢索(從學(xué)科門類)功能。具有極好的擴(kuò)檢與微檢功能。類目:是分類語(yǔ)言的基本語(yǔ)匯。一個(gè)特定類目由分類號(hào)與類目名稱共同構(gòu)成。分類號(hào)的主要功能是組織文獻(xiàn)與提供檢索。分類號(hào)的標(biāo)記制度:純數(shù)字(如:科圖法)、字母與數(shù)字共同組成的混合制(如:中圖法)兩種。 類目名稱是用來(lái)說(shuō)明特定類目所聚集的文獻(xiàn)、信息的學(xué)科范圍的一組文字。如“i247 中國(guó)現(xiàn)代長(zhǎng)篇小說(shuō)”(中國(guó)圖書館分類法)中的“i247”為分類號(hào),“當(dāng)代作品(1949-)”為類目名稱。 索取號(hào)或索書號(hào):是文獻(xiàn)在目錄或書庫(kù)中的地址號(hào),也就是圖書排架的號(hào)碼。由分類號(hào)+種次號(hào)(或著者號(hào))構(gòu)成。如:i247.5/4-1。分類語(yǔ)言的類型:等級(jí)體系分類語(yǔ)言(等級(jí)體系分類法)、分析綜合型分類語(yǔ)言(組配分類語(yǔ)言)與混合分類語(yǔ)言。其中最常見的是等級(jí)體系分類語(yǔ)言。最常見的等級(jí)體系分類法:國(guó)內(nèi):中國(guó)圖書館圖書分類法(國(guó)家標(biāo)準(zhǔn))簡(jiǎn)稱中圖法,中國(guó)圖書資料分類法,簡(jiǎn)稱資料法,中國(guó)科學(xué)院圖書館圖書分類法,簡(jiǎn)稱科圖法。國(guó)外:杜威十進(jìn)分類法(國(guó)際上使用范圍最廣的)、國(guó)際十進(jìn)分類法、美國(guó)國(guó)會(huì)圖書館圖書分類法。目前各搜索引掣的網(wǎng)頁(yè)目錄采用的是等級(jí)體系結(jié)構(gòu),也就是采用了分類語(yǔ)言對(duì)網(wǎng)絡(luò)信息進(jìn)行組織的通行方法,以便網(wǎng)絡(luò)用戶逐級(jí)點(diǎn)擊直到鎖定目標(biāo)資源。分類語(yǔ)言的最大特色是它的族性檢索功能,使用它比較容易進(jìn)行擴(kuò)檢與縮檢。但這種檢索語(yǔ)言的局限亦十分明顯,即同一主題的文獻(xiàn)、信息常常被分散到不同的類目之下。中國(guó)圖書館分類法(中圖法)體系分類法是以科學(xué)分類為基礎(chǔ),依據(jù)概念的劃分與概括原理,把概括文獻(xiàn)內(nèi)容與事物的各種類目組成一個(gè)層層隸屬、詳細(xì)列舉的等級(jí)結(jié)構(gòu)體系的一種文獻(xiàn)分類法,亦稱列舉式分類法、枚舉式分類法。中國(guó)圖書館分類法中圖法是國(guó)家標(biāo)準(zhǔn)。共分五個(gè)基本部類:馬列主義、毛澤東思想;哲學(xué);社會(huì)科學(xué);自然科學(xué)和綜合性圖書。在五大部類的基礎(chǔ)上,社會(huì)科學(xué)展開為九大類,自然科學(xué)展開為十大類,共計(jì)22個(gè)基本大類,稱為一級(jí)類目,每個(gè)基本大類下又可劃分成若干個(gè)二級(jí)類目,二級(jí)類目下再劃分出若干個(gè)三級(jí)類目,這樣屢屢劃分,逐級(jí)展開,類目可細(xì)分至七級(jí)。1個(gè)字母或數(shù)字代表一級(jí)類目。如:h311.2一共有五級(jí)。 由于t類“工業(yè)技術(shù)”是一個(gè)龐大的體系,文獻(xiàn)數(shù)量巨大,因此又以雙字母標(biāo)記展開了16個(gè)二級(jí)類,其重要程度不亞于基本大類。2主題語(yǔ)言定義:主題語(yǔ)言是表達(dá)文獻(xiàn)內(nèi)容中所涉及的核心事物與概念的檢索語(yǔ)言。主題法:用以自然語(yǔ)言中的詞語(yǔ)或規(guī)范化的詞語(yǔ)作為揭示文獻(xiàn)主題的標(biāo)識(shí),并以此標(biāo)識(shí)編排組織和查找文獻(xiàn)的方法主題詞:指代特定概念與事物的語(yǔ)詞。主題詞有自然語(yǔ)言中的詞語(yǔ),也有從自然語(yǔ)言中優(yōu)選出的規(guī)范化詞語(yǔ)。 主題語(yǔ)言的類型主題法在發(fā)展過(guò)程中,依選詞的不同,先后出現(xiàn)了標(biāo)題詞法、單元詞法、關(guān)鍵詞法和敘詞法等多種文獻(xiàn)組織與檢索的方法。關(guān)鍵詞法:關(guān)鍵詞是指那些出現(xiàn)在文獻(xiàn)標(biāo)題(篇名、章節(jié)名)、摘要和正文中,對(duì)表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的詞語(yǔ)。關(guān)鍵詞語(yǔ)言是直接選用文獻(xiàn)中的自然語(yǔ)言作為基本詞匯,并將那些能夠揭示文獻(xiàn)主題的關(guān)鍵性詞匯作為關(guān)鍵詞進(jìn)行標(biāo)引和檢索的一種檢索語(yǔ)言。關(guān)鍵詞是非規(guī)范的,無(wú)需查閱標(biāo)準(zhǔn)詞表,不受詞表控制,快捷簡(jiǎn)便,適于用計(jì)算機(jī)組織和檢索文獻(xiàn)信息。但由于關(guān)鍵詞法的詞語(yǔ)不規(guī)范,影響了文獻(xiàn)信息的查全率和查準(zhǔn)率。如果你所使用的關(guān)鍵詞不規(guī)范,隨意性太強(qiáng),就可能查不出相應(yīng)的文獻(xiàn)。所以選取關(guān)鍵詞時(shí)應(yīng)盡量考慮周全。首先由于名詞與名詞術(shù)語(yǔ)在取名上的多樣性,選詞時(shí)要對(duì)同義詞、近義詞、學(xué)名和俗名、不同譯名、簡(jiǎn)稱與全稱、不同寫法等進(jìn)行選擇;對(duì)多義詞、同形異義詞進(jìn)行限定說(shuō)明;其次由于英文構(gòu)詞的多樣性,選詞時(shí)也要注意英語(yǔ)的復(fù)合詞、派生詞、單復(fù)數(shù)以及英文單詞拼寫的變體等等,從而避免產(chǎn)生誤檢和漏檢。分類語(yǔ)言、敘詞語(yǔ)言和關(guān)鍵詞語(yǔ)言是目前檢索系統(tǒng)所使用的通用檢索語(yǔ)言,是我們認(rèn)識(shí)和使用一種檢索工具與檢索系統(tǒng)的起點(diǎn)。目前大多數(shù)搜索引掣使用的都是關(guān)鍵詞語(yǔ)言,而學(xué)科信息門戶使用的基本是規(guī)范語(yǔ)言。五文獻(xiàn)信息檢索途徑1以文獻(xiàn)信息外表特征為檢索途徑:題名途徑:是以各種事物的名稱為檢索點(diǎn)來(lái)檢索文獻(xiàn)信息。主要用于檢索圖書,期刊與有關(guān)資料。著者途徑:以文獻(xiàn)著者的姓名字順為檢索點(diǎn)進(jìn)行檢索的一種途徑。這類檢索工具有著者目錄、著者索引,機(jī)構(gòu)索引等。號(hào)碼途徑:是以文獻(xiàn)信息的號(hào)碼標(biāo)識(shí)為檢索點(diǎn)來(lái)檢索文獻(xiàn)信息的途徑。在已知文獻(xiàn)代碼情況下,利用代碼途徑檢索文獻(xiàn),可謂是一條既快又準(zhǔn)的捷徑。2以文獻(xiàn)信息內(nèi)容特征為檢索途徑:關(guān)鍵詞途徑是以文章作者所列出的、反映自己文章主題內(nèi)容的關(guān)鍵詞作為檢索點(diǎn)來(lái)檢索文獻(xiàn)。這是機(jī)檢中使用頻率很高的一種檢索途徑。分類途徑是以文獻(xiàn)信息內(nèi)容所屬的學(xué)科類別為檢索點(diǎn)來(lái)檢索文獻(xiàn)的一條途徑。它是檢索文獻(xiàn)的主要途徑之一。常用的工具有分類目錄和分類索引。主題途徑這是以反映文獻(xiàn)內(nèi)容的有關(guān)主題詞作為檢索點(diǎn)檢索文獻(xiàn)的一條途徑,它也是文獻(xiàn)檢索的主要途徑之一。按主題途徑檢索的關(guān)鍵是選準(zhǔn)主題詞,合理選擇和使用主題詞,對(duì)檢索結(jié)果的優(yōu)劣直接產(chǎn)生影響。主題檢索途徑是目前很受用戶歡迎的一種文獻(xiàn)信息檢索途徑。引文途徑利用被引文獻(xiàn)來(lái)查找原文獻(xiàn)的檢索方法。如: cnki中國(guó)期刊網(wǎng)被引用字段,維普中文期刊數(shù)據(jù)庫(kù)引文檢索途徑。 中文社會(huì)科學(xué)引文索引六、計(jì)算機(jī)信息檢索的基本技術(shù)與方法1 計(jì)算機(jī)文獻(xiàn)信息檢索的技術(shù)查全率(recall ratio)檢出相關(guān)文獻(xiàn)量/文獻(xiàn)庫(kù)內(nèi)相關(guān)文獻(xiàn)的總量 100%查準(zhǔn)率(precision ratio)檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量100%11布爾邏輯檢索(邏輯組配檢索)(boolean logical)指采用布爾邏輯表達(dá)式來(lái)表達(dá)用戶的檢索要求,并通過(guò)一定的算法和實(shí)現(xiàn)手段進(jìn)行檢索的過(guò)程。布爾邏輯表達(dá)式是采用布爾運(yùn)算符(邏輯與“and”、邏輯或“or”、邏輯非“not”等)來(lái)連接運(yùn)算檢索詞,以及表示運(yùn)算優(yōu)先級(jí)的括號(hào)組成的一種表達(dá)檢索要求的一種算式,簡(jiǎn)稱提問邏輯式。l 邏輯與“ and ”運(yùn)算符,也可用“*”表示,用來(lái)組配不同的概念的檢索詞。是一種概念相交和限定關(guān)系的組配。例如:“a and b”或“a * b”其含義是:檢出的信息中必須同時(shí)含有“a”和“b”兩個(gè)檢索詞?;咀饔檬菍?duì)檢索范圍加以限定,逐步縮小檢索范圍,提高檢索結(jié)果的查準(zhǔn)率。例如,檢索“計(jì)算機(jī)在圖書館中的應(yīng)用”方面的文獻(xiàn),其提問式可寫成:計(jì)算機(jī) and 圖書館 或 計(jì)算機(jī)*圖書館l 邏輯或“ or ”運(yùn)算符,也可用“ + ”表示,是用來(lái)組配具有同義或同族概念的檢索詞。如:檢索提問式:“a or b”或“a + b”其含義是數(shù)據(jù)庫(kù)記錄中任何一條記錄,只要含有“a”或“b”中任何一個(gè)檢索詞即為命中的文獻(xiàn)?;咀饔檬菙U(kuò)大檢索范圍,增加命中文獻(xiàn)量,提高文獻(xiàn)的查全率。如:“微機(jī) + 電腦 + pc機(jī)”、 “微機(jī) or 電腦 or pc機(jī)”l 邏輯非“ not ”運(yùn)算符,也可用“-”表示,“not”算符是排除含有某些詞的記錄,其邏輯提問表達(dá)式為“a not b”或 “a - b”,即檢出的記錄中只能含有“not”算符前的檢索詞 a,但不能同時(shí)含有“not”后的檢索詞 b?;咀饔檬强s小檢索范圍,但并不一定能邏輯非提高文獻(xiàn)命中的準(zhǔn)確性,一般只起到減少文獻(xiàn)輸出量的作用。在聯(lián)機(jī)檢索中可降低檢索費(fèi)用。例如:“計(jì)算機(jī) not 微機(jī)”應(yīng)注意,由于“not”算符有排除掉相關(guān)文獻(xiàn)的可能,因此,在實(shí)際檢索中應(yīng)慎重使用。12截詞檢索截詞檢索是在詞干的不同位置添加截詞符“?”、“*”或“$”,以此代表詞的可變部位,以檢索一組概念相關(guān)或同一詞根的詞,從而減少相同詞干的檢索詞的輸入數(shù)量,提高檢全率的一種常用檢索方法。這種檢索方式可以擴(kuò)大檢索范圍,提高查全率,主要用于西文數(shù)據(jù)庫(kù)檢索。中文數(shù)據(jù)庫(kù)通常不使用這種技術(shù)。主要用于檢索詞的單復(fù)數(shù)、詞性的詞尾變化、詞根相同的一類詞,以及同一詞的拼法變異等。在不同的檢索系統(tǒng)里用不同的符號(hào),一般為:*、?、!基本作用是提高查全率,防止漏檢。類型: 根據(jù)截詞的位置不同,分為前截?cái)?、后截?cái)?、中截?cái)?前截?cái)啵河址Q左截?cái)啵卦~符放在被截詞的左邊,可與后截?cái)嘁煌褂?。目前這種檢索技術(shù)應(yīng)用已經(jīng)極少,例如:*magnetic。 中截詞:把截詞符放在詞的中間。這種方式查找英美不同拼法的概念最有效。例如:如:wom*n 可檢出woman,women 后截?cái)啵菏乔胺揭恢聶z索,又稱右截?cái)?,截詞符放在被截詞的右邊,是最常用的檢索技術(shù),例如:librar*。 根據(jù)截?cái)嗟臄?shù)量不同,分為有限截?cái)嗪蜔o(wú)限截?cái)唷?有限截?cái)啵合拗票唤財(cái)嗟淖址麛?shù)量,例如輸入apple? ? 表示被截?cái)嗟淖址挥袃蓚€(gè),可檢出apple、applet等結(jié)果。 無(wú)限截?cái)啵翰幌拗票唤財(cái)嗟淖址麛?shù)量。例如輸入educat?,可以檢索educator,educators,educated,educating,education,educational,等等。 注:不同的數(shù)據(jù)庫(kù)所用的截詞符不一樣,使用應(yīng)先查一下各數(shù)據(jù)庫(kù)的幫助加以確認(rèn)。1.3位置算符檢索表示兩個(gè)檢索詞間的位置臨近關(guān)系,又叫鄰接檢索。這種檢索技術(shù)通常只出現(xiàn)在西文數(shù)據(jù)庫(kù)中,在全文檢索中應(yīng)用較多。布爾邏輯運(yùn)算符表示兩個(gè)概念之間的邏輯關(guān)系,位置算符表示的是兩個(gè)概念在信息中的實(shí)際物理位置關(guān)系常用位置算符 w/n(with/n):兩詞相鄰,在一個(gè)標(biāo)引字段中w/n表示兩個(gè)詞不可以互換順序,二者之間可插入0-n個(gè)詞。 如:智能機(jī)器人(w/3)控制,可檢出“智能機(jī)器人控制”,“智能機(jī)器人行為控制”等 n/n(near/n):兩詞相鄰,n/n表示兩個(gè)詞可以互換順序,二者之間可插入n個(gè)詞。 如:智能機(jī)器人(n/3)控制,可檢出“智能機(jī)器人控制”,“控制算法對(duì)智能機(jī)器人的影響”等 f(field):同字段檢索,被f連接的檢索詞必須出現(xiàn)在同一字段中。 s(sub-field/sentence):同句檢索, 要求參加檢索運(yùn)算的兩個(gè)檢索詞必須在同一自然句中出現(xiàn)。1.4. 限制檢索通過(guò)設(shè)定相應(yīng)的檢索條件實(shí)現(xiàn)對(duì)檢索的優(yōu)化。是縮小或約束檢索結(jié)果的方法,最常用的是對(duì)特定字段的限定檢索。如:rice in ti(表示只在題目字段中查找文獻(xiàn)) rice in de(只在主題詞中查找) rice in ab(只在文摘中查找) au = smith,j.c (查作者為smith,j.c 的文章) py = 1998(只查1998年的文章) la =chinese (只查語(yǔ)種為中文的文獻(xiàn))常用的限制檢索方式: 字段檢索將檢索限定在特定字段內(nèi)進(jìn)行限制的方法。 字段限制范圍的大小順序是:題名關(guān)鍵詞摘要notandor1.7. 全文檢索:全文檢索是指對(duì)文獻(xiàn)全文內(nèi)容進(jìn)行字符串匹配檢索,包括字符串檢索、截詞檢索和位置檢索等技術(shù)。全文檢索技術(shù)是一種面向全文、提供全文的新型檢索技術(shù)。它可以使用原文中任何一個(gè)有實(shí)際意義的詞作為檢索入口,得到的結(jié)果是源文獻(xiàn)而不是文獻(xiàn)的線索。全文檢索系統(tǒng)必須具有一個(gè)全文數(shù)據(jù)庫(kù)。在全文庫(kù)的基礎(chǔ)上,對(duì)其字、詞、句、段等的加工、檢索與編輯。系統(tǒng)除了可以用布爾邏輯運(yùn)算式進(jìn)行檢索外,還具有文本檢索功能,并具有同義詞控制、后控詞表對(duì)檢索策略的自動(dòng)調(diào)整等功能。此外,系統(tǒng)還允許用戶以自然語(yǔ)言進(jìn)行檢索,直接獲取原文中的有關(guān)章、節(jié)、段、句等。1.8. 擴(kuò)檢:在試探性檢索所獲取的檢索結(jié)果過(guò)少,還不到檢索要求時(shí),應(yīng)采取擴(kuò)展檢索以擴(kuò)大檢索范圍,保證檢索率。采用的方法可以是增加檢索詞:如將原檢索詞的所有同義詞、別名、俗名作為檢索詞進(jìn)行組配檢索,使用截詞技術(shù)或擴(kuò)大檢索的年代與文獻(xiàn)范圍。縮檢:亦稱二次檢索,當(dāng)檢索結(jié)果數(shù)量過(guò)多,評(píng)價(jià)、篩選困難時(shí),為保證檢索精度與檢準(zhǔn)率,使用縮檢,即在原有檢索結(jié)果中進(jìn)行篩選,這個(gè)措施可反復(fù)采用,直到檢索結(jié)果符合要求。2 文獻(xiàn)信息檢索的基本步驟與策略采用檢索工具檢索文獻(xiàn)信息一般要經(jīng)歷5個(gè)緊密相連的步驟 1.分析研究課題,明確檢索要求 分析研究檢索課題是整個(gè)檢索過(guò)程的關(guān)鍵,是信息檢索成功與否的關(guān)鍵,檢索者首先要對(duì)課題作綜合分析,通過(guò)分析明確如下要求,(1)明確課題的專業(yè)范圍及其關(guān)健點(diǎn),選取主題詞。(2)明確所需文獻(xiàn)類型。(3)確定所需文獻(xiàn)的時(shí)間范圍與語(yǔ)種范圍(4)分析檢索目的:以科研攻關(guān),解決具體的技術(shù)難題為目的。(5)研究探索:密切跟蹤,了解國(guó)內(nèi)外某一研究領(lǐng)域的最新成果與動(dòng)態(tài)。每一項(xiàng)理論或技術(shù)都有其發(fā)生、發(fā)展和形成的過(guò)程,檢索時(shí)就是根據(jù)研究課題相關(guān)知識(shí)發(fā)展的形成期、高峰期和穩(wěn)定期來(lái)確定檢索的時(shí)間范圍。檢索要求愈明確,檢索范圍愈具體,已知條件愈多,檢索效果愈好。因此,分析研究課題這一步進(jìn)展得如何,對(duì)其后的檢索程序至關(guān)重要檢索者切忌情況不明就貿(mào)然開始檢索,這會(huì)導(dǎo)致走彎路或檢索失敗。檢索的目的與要求及檢索范圍作為選擇檢索工具與數(shù)據(jù)庫(kù)的依據(jù)。不同的數(shù)據(jù)庫(kù)其收集的文獻(xiàn)類型、學(xué)科范圍,對(duì)文獻(xiàn)的回溯期限不同。2選擇檢索工具(或數(shù)據(jù)庫(kù))與檢索手段根據(jù)已經(jīng)明確的檢索要求與專業(yè)范圍,選擇合適的檢索工具或數(shù)據(jù)庫(kù)。確定檢索方法:追溯法、工具法(順查法,倒查法,抽查法)、綜合法中外文檢索工具與數(shù)據(jù)庫(kù)很多,檢索者要求對(duì)各種檢索工具或數(shù)據(jù)庫(kù)的性質(zhì),內(nèi)容和特點(diǎn)作深入了解,可借助于各種檢索工具指南,學(xué)科文獻(xiàn)指南或聯(lián)機(jī)數(shù)據(jù)庫(kù)目錄。機(jī)檢包括聯(lián)機(jī)檢索,脫機(jī)檢索,光盤檢索與網(wǎng)絡(luò)檢索,其中手工檢索基本上不花錢,機(jī)檢速度快,效率高,但費(fèi)用也高。檢索者可根據(jù)時(shí)時(shí)間要求、設(shè)備狀況與經(jīng)費(fèi)條件來(lái)選擇合適的檢索手段。3確定檢索途徑與擬定檢索式采用哪種方法與途徑,要結(jié)合課題檢索要求與檢索工具或數(shù)據(jù)庫(kù)的特點(diǎn)來(lái)確定。就檢索途徑而言,如果課題檢索要求泛指性較強(qiáng)的文獻(xiàn)資料,最好用分類途徑;如果課題檢索要求是專指度較高的文獻(xiàn)資料,最好選擇主題途徑,如果事先巳知文獻(xiàn)著者,分子式,專利號(hào),標(biāo)準(zhǔn)號(hào),報(bào)告號(hào)等條件,則利用著者途徑,分子式途徑與文獻(xiàn)代碼等途徑為好。必要時(shí)將這些途徑與分類、主題途徑配合使用,將會(huì)收到更好的檢索效果。檢索提問式是計(jì)算機(jī)信息檢索中用來(lái)表達(dá)用戶檢索提問的邏輯表達(dá)式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成。4實(shí)施試檢索操作用分類法與主題法檢索文獻(xiàn)時(shí),要選準(zhǔn)分類號(hào)與主題詞,在機(jī)檢中還要構(gòu)造機(jī)檢策略,即用布爾邏輯或其它符號(hào)將檢索詞連接起來(lái),組成一種邏輯運(yùn)算式。在檢索過(guò)程中,無(wú)論是手檢或機(jī)檢,均需視檢出結(jié)果,如果試檢索的結(jié)果與檢索需求存在差距,則需要對(duì)檢索課題進(jìn)行再分析,不斷修改與完善檢索策略,以達(dá)到檢索的合理性與有效性。再分析的過(guò)程包括:重新選擇檢索系統(tǒng),選擇相關(guān)檢索詞,重新擬定檢索式,以及在原有檢索策略的基礎(chǔ)上進(jìn)行擴(kuò)檢、縮檢,設(shè)定較長(zhǎng)的文獻(xiàn)回溯期等。閱讀檢出結(jié)果,決定取舍。在手檢中對(duì)切題的文獻(xiàn)要記錄文獻(xiàn)資料的篇名(書名),著者,文摘、文種、來(lái)源等,尤其是文獻(xiàn)來(lái)源切不可遺漏。倘若是機(jī)檢,可選擇打印格式,聯(lián)機(jī)或脫機(jī)打印輸出即可。5檢索結(jié)果的評(píng)價(jià)與獲取原始文獻(xiàn)評(píng)價(jià)檢索結(jié)果是結(jié)合多種標(biāo)準(zhǔn)對(duì)檢索結(jié)果進(jìn)行評(píng)價(jià)、篩選,把真正符合需要的檢索結(jié)果保留下來(lái)。獲取原文是文獻(xiàn)檢索的最后一步,原文獲取可以通過(guò)多種途徑實(shí)現(xiàn)。全文數(shù)據(jù)庫(kù)的檢索與原文獲取可以一步完成,是檢索時(shí)的首選。而題錄與摘要信息檢索系統(tǒng)只能檢索到原文的線索,在這種情形下,應(yīng)盡可能通過(guò)本地資源獲取原文。如本地資源無(wú)法保障,則可以考慮使用電子文獻(xiàn)傳遞系統(tǒng)從其他圖書、情報(bào)機(jī)構(gòu)獲得原始文獻(xiàn)。目前大部分非全文數(shù)據(jù)庫(kù)多提供了原文的外鏈接,用戶可以根據(jù)需要選擇。3 計(jì)算機(jī)信息檢索的策略1分析研究課題,明確檢索要求檢索誤區(qū)1過(guò)分依賴搜索引擎。internet資源與專業(yè)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)來(lái)比,無(wú)論是質(zhì)量還是數(shù)量上都有很大的差距,檢索文獻(xiàn)目前來(lái)說(shuō)最主要的來(lái)源還應(yīng)是專業(yè)數(shù)據(jù)庫(kù),即正規(guī)的出版物上發(fā)表的文獻(xiàn)。檢索誤區(qū)2忽略摘要數(shù)據(jù)庫(kù)。摘要數(shù)據(jù)庫(kù)的數(shù)據(jù)量大,范圍廣,是查找文章線索極好的檢索工具。就目前的情況而言,不可能全部都能得到電子版的全文,先找到文章線索再根據(jù)線索查找印刷版的全文是一項(xiàng)不錯(cuò)的組合。2選擇數(shù)據(jù)庫(kù)或網(wǎng)絡(luò)檢索工具選擇合適檢索工具的前提是對(duì)網(wǎng)絡(luò)資源有一個(gè)較全面的、清晰的了解,具體地說(shuō)要對(duì)檢索工具的類型、內(nèi)容特點(diǎn)、時(shí)間范圍、學(xué)科范圍、甚至出版商的大體情況都要有一個(gè)了解。方法: 注重平時(shí)的積累 不要盲目檢索,應(yīng)養(yǎng)成檢索前了解一下數(shù)據(jù)庫(kù)的習(xí)慣 注重與他人的交流 重視圖書館主頁(yè)的資源3提煉檢索詞,制定檢索式檢索詞盡可能選用詞或詞組,然后用布爾邏輯運(yùn)算符將檢索詞連接起來(lái),切忌把整個(gè)題名輸入到檢索框中。如:網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的安全性研究要提煉關(guān)鍵的、核心的詞作為檢索詞。去掉意義太泛或“無(wú)所謂有”的詞,有時(shí)不需要死摳字眼,意思匹配就可以了。漏檢:忽視了同義詞、相似詞等。檢索中不斷調(diào)整策略4實(shí)施試檢索操作檢索,再分析,再檢索,再分析。5檢索結(jié)果處理。七參考文獻(xiàn)著錄標(biāo)準(zhǔn)、范圍以及文后參考文獻(xiàn)的著錄格式1著錄標(biāo)準(zhǔn)(1)排列次序:依在正文中被首次引用的先后次序列出各條參考文獻(xiàn)。(2)具體要求:項(xiàng)目齊全,內(nèi)容完整,順序正確,標(biāo)點(diǎn)無(wú)誤。(3)注意事項(xiàng):只有3位及3位以內(nèi)作者的,其姓名全部列上,中外作者一律姓前名后; 共有3位以上作者的,只列前3位,其后加“,等”或“,et al”; 外文文獻(xiàn)中表示縮寫的實(shí)心句點(diǎn)“”一律略去; 原本就缺少某一項(xiàng)目時(shí),可將該項(xiàng)連同與其對(duì)應(yīng)的標(biāo)點(diǎn)符號(hào)一起略去; 頁(yè)碼不可省略,起止頁(yè)碼間用“-”相隔,不同的頁(yè)碼引用范圍之間用“,”相隔。 正文中參考文獻(xiàn)標(biāo)引一律用上標(biāo)形式的方括號(hào)內(nèi)數(shù)字表示,例如3,方括號(hào)和數(shù)字不必用粗體。2著錄范圍(共8類)(1)已在國(guó)內(nèi)外公開出版的學(xué)術(shù)期刊上發(fā)表的論文;(2)由國(guó)內(nèi)外出版公司或出版社正式出版的學(xué)術(shù)著作(有isbn號(hào));(3)有isbn號(hào)的會(huì)議論文集及論文集中的析出論文;(4)博士和碩士學(xué)位論文;(5)專利文獻(xiàn);(6)國(guó)際標(biāo)準(zhǔn)、國(guó)家標(biāo)準(zhǔn)和部頒標(biāo)準(zhǔn);(7)報(bào)紙文章;(8)電子文獻(xiàn)。其他性質(zhì)的資料可以作為正文的隨文腳注。非紙張型電子文獻(xiàn)應(yīng)注明載體類型,見后述。 3參考文獻(xiàn)類型及其標(biāo)志根據(jù)gb3469 規(guī)定,對(duì)參考文獻(xiàn)類型在文獻(xiàn)題名后應(yīng)該用方括號(hào)加以標(biāo)引,以單字母方式標(biāo)志以下各種參考文獻(xiàn)類型:文獻(xiàn)類型期刊論文專著會(huì)議論文學(xué)位論文專利標(biāo)準(zhǔn)報(bào)紙報(bào)告資料匯編標(biāo)志代碼jmcdpsnrg4電子文獻(xiàn)類型標(biāo)志對(duì)于數(shù)據(jù)庫(kù)(database)、計(jì)算機(jī)程序(computer program)及電子公告(electronic bulletin board)等電子文獻(xiàn)類型的參考文獻(xiàn),以下列字母作為標(biāo)志:電子參考文獻(xiàn)類型數(shù)據(jù)庫(kù)計(jì)算機(jī)程序電子公告電子文獻(xiàn)類型標(biāo)志dbcpeb對(duì)于非紙張型載體的電子文獻(xiàn),當(dāng)被引用為參考文獻(xiàn)時(shí)需在參考文獻(xiàn)類型標(biāo)志中同時(shí)標(biāo)明其載體類型,采用雙字母表示電子文獻(xiàn)載體類型:磁帶(magnetic tape)mt; 磁盤(disk)dk; 光盤(cd-rom)cd; 聯(lián)機(jī)網(wǎng)絡(luò)(online)ol。以下列格式表示包括了文獻(xiàn)載體類型的參考文獻(xiàn)類型標(biāo)示:電子文獻(xiàn)類型標(biāo)示/載體類型標(biāo)示,如:db/ol聯(lián)機(jī)網(wǎng)上數(shù)據(jù)庫(kù)(database online);db/mt磁帶數(shù)據(jù)庫(kù)(database on magnetic tape)m/cd光盤圖書 (monograph on cd-rom)cp/dk磁盤軟件 (computer program on disk)j/ol網(wǎng)上期刊 (journal serial online)eb/ol網(wǎng)上電子公告 (electronic bulletin board online)以紙張為載體的傳統(tǒng)文獻(xiàn)在引作參考文獻(xiàn)時(shí)可不必注明其載體類型。 5.各類參考文獻(xiàn)著錄格式編號(hào)文獻(xiàn)類型 格式與示例1學(xué)術(shù)期刊 序號(hào)作者題名j刊名, 出版年份, 卷號(hào)(期號(hào)): 起頁(yè)-止頁(yè).1高景德,王祥珩交流電機(jī)的多回路理論j清華大學(xué)學(xué)報(bào),1987,27(1):1-8.2高景德,王祥珩交流電機(jī)的多回路理論j清華大學(xué)學(xué)報(bào),1987(1):1-8.3chen s,billing s a,cowan c f,et alpractical identification of marmax modelsjint j control,1990,52 (6):1327-1350.2 專著 序號(hào)作者書名m版次(首版免注)翻譯者出版地:出版社,出版. 起頁(yè)-止頁(yè).4

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論