網(wǎng)絡(luò)信息資源檢索_第1頁(yè)
網(wǎng)絡(luò)信息資源檢索_第2頁(yè)
網(wǎng)絡(luò)信息資源檢索_第3頁(yè)
網(wǎng)絡(luò)信息資源檢索_第4頁(yè)
網(wǎng)絡(luò)信息資源檢索_第5頁(yè)
已閱讀5頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)絡(luò)信息資源檢索第一頁(yè),共六十二頁(yè),2022年,8月28日1信息檢索概述1.1信息檢索的概念1.2信息檢索的發(fā)展1.3信息檢索的分類(lèi)第二頁(yè),共六十二頁(yè),2022年,8月28日1.1信息檢索的概念

1950年,美國(guó)數(shù)學(xué)家莫爾斯首次提出“信息檢索”一詞。他認(rèn)為:信息檢索是一種時(shí)間性的通訊形式。其后,隨著信息檢索理論和實(shí)踐的更新發(fā)展,人們對(duì)信息檢索的認(rèn)識(shí)也在不斷深入。實(shí)際上,信息檢索具有廣義和狹義兩種含義。

第三頁(yè),共六十二頁(yè),2022年,8月28日

廣義上的信息檢索是指將信息按照一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用戶(hù)的需要找出有關(guān)信息的過(guò)程。狹義上的信息檢索是指從信息集合中找出所需信息的過(guò)程,相當(dāng)于信息查詢(xún)。

第四頁(yè),共六十二頁(yè),2022年,8月28日1.2信息檢索的發(fā)展

公元前6年,我國(guó)西漢時(shí)期的古文經(jīng)學(xué)家、目錄學(xué)家劉歆根據(jù)當(dāng)時(shí)的國(guó)家藏書(shū),編制了我國(guó)第一部綜合性的系統(tǒng)目錄《七略》,這也是我國(guó)最早的第一部圖書(shū)分類(lèi)法。但信息檢索作為一個(gè)學(xué)科來(lái)發(fā)展始于19世紀(jì)下半葉。至20世紀(jì)40年代,索引和檢索已經(jīng)成為圖書(shū)館獨(dú)立的工具和用戶(hù)服務(wù)項(xiàng)目。

第五頁(yè),共六十二頁(yè),2022年,8月28日

具體來(lái)看,信息檢索的發(fā)展可分為以下三個(gè)階段:第一階段——手工信息檢索階段手工信息檢索發(fā)展于19世紀(jì)末,這個(gè)階段的信息檢索手段主要利用的是書(shū)本式和卡片式,包括檢索型和資料型的工具書(shū)等幫助讀者查找圖書(shū)、期刊或現(xiàn)成答案。第六頁(yè),共六十二頁(yè),2022年,8月28日

第二階段——機(jī)械信息檢索階段機(jī)械信息檢索的發(fā)展期是20世紀(jì)40~50年代,生命周期很短暫,是手工檢索到計(jì)算機(jī)信息檢索的過(guò)渡階段。機(jī)械信息檢索主要包括兩種檢索手段:第七頁(yè),共六十二頁(yè),2022年,8月28日(1)穿孔卡片信息檢索系統(tǒng)使用諸如打孔機(jī)、驗(yàn)孔機(jī)、分類(lèi)機(jī)等機(jī)電設(shè)備記錄二次文獻(xiàn),用電刷作為檢索元件的信息檢索系統(tǒng)。(2)縮微制品信息檢索系統(tǒng)使用縮微照相記錄二次文獻(xiàn),以膠卷或膠片邊緣部分若干黑白小方塊的組合做檢索標(biāo)志,利用光電檢索元件查找文獻(xiàn)的系統(tǒng)。第八頁(yè),共六十二頁(yè),2022年,8月28日

第三階段——計(jì)算機(jī)信息檢索階段隨著1946年世界上第一臺(tái)電子計(jì)算機(jī)的問(wèn)世,計(jì)算機(jī)技術(shù)逐步走進(jìn)信息檢索領(lǐng)域,并與信息檢索理論緊密結(jié)合起來(lái),脫機(jī)批量情報(bào)檢索系統(tǒng)、聯(lián)機(jī)實(shí)時(shí)情報(bào)檢索系統(tǒng)相繼研制成功并商業(yè)化。

1954年美國(guó)海軍兵器中心圖書(shū)館利用IBM701機(jī)開(kāi)發(fā)計(jì)算機(jī)信息檢索系統(tǒng),它標(biāo)志著計(jì)算機(jī)信息檢索階段的開(kāi)始。第九頁(yè),共六十二頁(yè),2022年,8月28日計(jì)算機(jī)信息檢索可分為以下4個(gè)發(fā)展階段:(1)脫機(jī)檢索

20世紀(jì)50~60年代是脫機(jī)檢索的試驗(yàn)和實(shí)用化階段。批處理檢索是這個(gè)階段信息檢索的主要方式。這一階段的數(shù)據(jù)存取與數(shù)據(jù)通信能力都比較差。(2)聯(lián)機(jī)檢索

20世紀(jì)60~80年代是聯(lián)機(jī)檢索試驗(yàn)和實(shí)用化階段。這個(gè)階段的特點(diǎn)是聯(lián)機(jī)數(shù)據(jù)庫(kù)集中管理,具有完備的數(shù)據(jù)庫(kù)聯(lián)機(jī)檢索功能,但其數(shù)據(jù)通信能力仍然比較差。第十頁(yè),共六十二頁(yè),2022年,8月28日(3)光盤(pán)檢索光盤(pán)檢索階段始于20世紀(jì)80年代中期。這個(gè)階段比較特殊。在發(fā)達(dá)國(guó)家,光盤(pán)檢索是聯(lián)機(jī)檢索的支持和補(bǔ)充,但在通信技術(shù)不太發(fā)達(dá)的國(guó)家,由于它自身的優(yōu)點(diǎn),卻是用戶(hù)獲取信息的一個(gè)十分重要的手段。第十一頁(yè),共六十二頁(yè),2022年,8月28日(4)網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索開(kāi)始于20世紀(jì)90年代初,以Internet的出現(xiàn)為標(biāo)志,檢索系統(tǒng)大多采用分布式的網(wǎng)絡(luò)化管理。該階段的信息資源發(fā)生了變化,從普通的文獻(xiàn)轉(zhuǎn)化為數(shù)字形式、多媒體的文獻(xiàn)。信息檢索的用戶(hù)也由原來(lái)的情報(bào)專(zhuān)業(yè)人員擴(kuò)展到包括商務(wù)人員、管理人員、教師學(xué)生、各專(zhuān)業(yè)人士在內(nèi)的普通大眾,他們對(duì)信息檢索從結(jié)果到方式提出了更高、更多樣化的要求。適應(yīng)網(wǎng)絡(luò)化、智能化以及個(gè)性化的需要是目前信息檢索技術(shù)發(fā)展的新趨勢(shì)。第十二頁(yè),共六十二頁(yè),2022年,8月28日1.3信息檢索的分類(lèi)

人們?cè)谏鐣?huì)實(shí)踐中,根據(jù)工作、學(xué)習(xí)、科學(xué)研究的不同需要所進(jìn)行的信息檢索,大體上可以歸納為四類(lèi):

1、文獻(xiàn)檢索其檢索結(jié)果是文獻(xiàn)資料,包括有關(guān)文獻(xiàn)的出處、收藏單位等。文獻(xiàn)檢索主要是通過(guò)文獻(xiàn)檢索工具進(jìn)行的,如書(shū)目、索引、題錄、文摘等。

2、數(shù)據(jù)檢索其結(jié)果為數(shù)據(jù),包括公式、圖表、分子式等。

第十三頁(yè),共六十二頁(yè),2022年,8月28日3、事實(shí)檢索其結(jié)果為事實(shí)結(jié)論,包括事物、事件的性質(zhì)、定義、原理及發(fā)生的時(shí)間、地點(diǎn)、過(guò)程等。事實(shí)與數(shù)據(jù)檢索是信息檢索的派生檢索,但又是大量的、日常的、有具體對(duì)象的檢索。如查字或詞,查人物,查機(jī)構(gòu)名稱(chēng)和縮寫(xiě),查地名,查年代日期等等,這些事實(shí)和數(shù)據(jù)是一種確定性的信息檢索,檢索結(jié)果具有唯一性。第十四頁(yè),共六十二頁(yè),2022年,8月28日4、圖象、聲音檢索例如查找老北京、老上海的照片,查看南京的民國(guó)時(shí)期建筑圖片,了解孫中山先生作過(guò)的演說(shuō)錄音等,利用多媒體技術(shù)處理、檢索聲像信息,使圖象、聲音檢索更為快捷。第十五頁(yè),共六十二頁(yè),2022年,8月28日2信息檢索語(yǔ)言2.1信息檢索語(yǔ)言的概念2.2信息檢索語(yǔ)言的類(lèi)型第十六頁(yè),共六十二頁(yè),2022年,8月28日2.1信息檢索語(yǔ)言的概念信息檢索語(yǔ)言是一種專(zhuān)門(mén)的人工語(yǔ)言,又稱(chēng)標(biāo)引語(yǔ)言和索引語(yǔ)言,是信息系統(tǒng)中用以描述信息的內(nèi)容及外表特征和檢索者表達(dá)檢索提問(wèn)的語(yǔ)言,是兩者相互溝通的共同依據(jù),是用于信息標(biāo)引和檢索提問(wèn)的約定語(yǔ)言。第十七頁(yè),共六十二頁(yè),2022年,8月28日標(biāo)引人員可以用檢索語(yǔ)言來(lái)標(biāo)引文獻(xiàn),以便將文獻(xiàn)進(jìn)行整理,加工,存儲(chǔ)于檢索系統(tǒng)中。同時(shí),檢索人員也可以用檢索語(yǔ)言來(lái)表達(dá)信息檢索課題的內(nèi)容,以便把特定文獻(xiàn)從檢索系統(tǒng)中檢索出來(lái)。因此,檢索語(yǔ)言是一種把文獻(xiàn)的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人員和檢索人員溝通起來(lái)的人工語(yǔ)言。第十八頁(yè),共六十二頁(yè),2022年,8月28日檢索語(yǔ)言的功能與普通語(yǔ)言的功能相同,都是用于交際,知識(shí)檢索語(yǔ)言的應(yīng)用范圍很窄,僅限于在信息檢索系統(tǒng)中作為溝通存儲(chǔ)與檢索的共同符號(hào)標(biāo)識(shí)。如果沒(méi)有它信息檢索就無(wú)法實(shí)現(xiàn),信息的發(fā)布者和信息的需求者就無(wú)法交流。第十九頁(yè),共六十二頁(yè),2022年,8月28日2.2信息檢索語(yǔ)言的類(lèi)型

信息檢索語(yǔ)言按其結(jié)構(gòu)原理,可分為分類(lèi)語(yǔ)言、描述語(yǔ)言和代碼語(yǔ)言三大類(lèi)型。其中,描述語(yǔ)言包括標(biāo)題法、單元詞法、關(guān)鍵詞法和敘詞法等,它們可以統(tǒng)稱(chēng)為主題法系統(tǒng)。

1.分類(lèi)法

2.主題法第二十頁(yè),共六十二頁(yè),2022年,8月28日1.分類(lèi)法

所謂分類(lèi)法,就是根據(jù)文獻(xiàn)內(nèi)容的學(xué)科性質(zhì)和特點(diǎn)類(lèi)分文獻(xiàn)的方法。文獻(xiàn)分類(lèi)在文獻(xiàn)檢索中具有重要的作用,例如編制分類(lèi)目錄和索引,組織文獻(xiàn)的分類(lèi)排架,進(jìn)行文獻(xiàn)的分類(lèi)統(tǒng)計(jì)等等。掌握文獻(xiàn)分類(lèi)的基本原理,不但有利于從分類(lèi)途徑檢索文獻(xiàn),而且對(duì)于積累資料,分析、研究及處理文獻(xiàn)都十分有益。第二十一頁(yè),共六十二頁(yè),2022年,8月28日

為了保證文獻(xiàn)分類(lèi)的準(zhǔn)確性和一致性,必須預(yù)先編制一部合適的分類(lèi)法(或稱(chēng)分類(lèi)表),即類(lèi)分文獻(xiàn)的工具。古今中外,人們編制了數(shù)千部分類(lèi)法,比如《中國(guó)圖書(shū)館圖書(shū)分類(lèi)法》、《科圖法》、《冒號(hào)分類(lèi)法》等。下面主要介紹《中國(guó)圖書(shū)館圖書(shū)分類(lèi)法》——第二十二頁(yè),共六十二頁(yè),2022年,8月28日

簡(jiǎn)稱(chēng)《中圖法》,設(shè)有5個(gè)基本部類(lèi)和22個(gè)基本大類(lèi)。該分類(lèi)法采用字母與數(shù)字相結(jié)合的混合號(hào)碼構(gòu)成,用字母表示22個(gè)以及工業(yè)技術(shù)中的二級(jí)類(lèi)目,其他各級(jí)類(lèi)目均用數(shù)字表示,每三位數(shù)字后用分隔符號(hào)“·”以示醒目。分類(lèi)號(hào)排列的時(shí)候先按照字母順序進(jìn)行排序,字母相同按照字母后的數(shù)字一位一位地進(jìn)行比較來(lái)排序。第二十三頁(yè),共六十二頁(yè),2022年,8月28日

A馬克思主義、列寧主義、毛澤東思想

B哲學(xué)

C社會(huì)科學(xué)總論

D政治、法律

E軍事

F經(jīng)濟(jì)

G文化、科學(xué)、教育、體育

H語(yǔ)言、文字

I文學(xué)

J藝術(shù)

K歷史、地理社會(huì)科

學(xué)

第二十四頁(yè),共六十二頁(yè),2022年,8月28日N自然科學(xué)總論O數(shù)學(xué)科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué)R藥學(xué)、衛(wèi)生S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)

U交通運(yùn)輸V航空、航天X環(huán)境科學(xué)、勞動(dòng)保護(hù)科學(xué)Z綜合性圖書(shū)自然科學(xué)第二十五頁(yè),共六十二頁(yè),2022年,8月28日TTBTGTHTETU……TB1TB9TB2TB3TB4……TVTB1TB4TB3TB2TB5TB9……TB41TB42TB48TB49……TB47TB482TB488TB489……第二十六頁(yè),共六十二頁(yè),2022年,8月28日TP計(jì)算機(jī)類(lèi)舉例:T工業(yè)技術(shù)

TP自動(dòng)化技術(shù)、計(jì)算機(jī)技術(shù)

TP3計(jì)算技術(shù)、計(jì)算機(jī)技術(shù)

TP39計(jì)算機(jī)應(yīng)用

TP393計(jì)算機(jī)網(wǎng)絡(luò)

TP393.0一般性問(wèn)題

TP393.01計(jì)算機(jī)網(wǎng)絡(luò)理論

TP393.02計(jì)算機(jī)網(wǎng)絡(luò)結(jié)構(gòu)與設(shè)計(jì)第二十七頁(yè),共六十二頁(yè),2022年,8月28日

目前,《中圖法》已普遍應(yīng)用于全國(guó)各類(lèi)型的圖書(shū)館,國(guó)內(nèi)主要大型書(shū)目、檢索刊物、機(jī)讀數(shù)據(jù)庫(kù),以及《中國(guó)國(guó)家標(biāo)準(zhǔn)書(shū)號(hào)》等都著錄《中圖法》分類(lèi)號(hào)。第二十八頁(yè),共六十二頁(yè),2022年,8月28日分類(lèi)法優(yōu)點(diǎn)主要有:強(qiáng)調(diào)知識(shí)的系統(tǒng)化組織,符合人們認(rèn)識(shí)事物的習(xí)慣,便于用戶(hù)按學(xué)科系統(tǒng)檢索有關(guān)文獻(xiàn)信息;通常采用的阿拉伯?dāng)?shù)字和拉丁字母標(biāo)識(shí),通用性強(qiáng),使國(guó)際統(tǒng)一分類(lèi)達(dá)到資源共享成為可能。當(dāng)然分類(lèi)法也有很大的局限性,如:受其體系結(jié)構(gòu)的限制,直接的專(zhuān)指性差;類(lèi)目體系固定,事先列舉,不能及時(shí)反映新學(xué)科、新事物,修訂、增補(bǔ)很困難。第二十九頁(yè),共六十二頁(yè),2022年,8月28日2.主題法所謂主題法,就是以自然語(yǔ)言中的詞語(yǔ)或規(guī)范化的詞語(yǔ)作為揭示文獻(xiàn)主題的標(biāo)識(shí),并以此標(biāo)識(shí)編排組織和查找文獻(xiàn)的排檢方法。主題指文獻(xiàn)所具體論述的對(duì)象和研究的問(wèn)題;表達(dá)主題概念的詞語(yǔ)就叫主題詞。

第三十頁(yè),共六十二頁(yè),2022年,8月28日主題法和分類(lèi)法一樣,也是文獻(xiàn)信息單位廣泛使用的文獻(xiàn)信息整序法。它們揭示和檢索的對(duì)象都是各種類(lèi)型的文獻(xiàn)資料;都是從文獻(xiàn)資料的內(nèi)容途徑進(jìn)行揭示和檢索;都是文獻(xiàn)信息單位用來(lái)組織與編排檢索工具,向用戶(hù)揭示、宣傳和流通文獻(xiàn)資料的一種手段。那么主題法和分類(lèi)法的主要區(qū)別是什么呢?第三十一頁(yè),共六十二頁(yè),2022年,8月28日①揭示對(duì)象方面:主題法揭示文獻(xiàn)論述的具體事物或主題概念,一般不涉及學(xué)科類(lèi)別的判斷;而分類(lèi)法揭示的是文獻(xiàn)內(nèi)容的學(xué)科屬性,處理和檢索文獻(xiàn)都必須對(duì)文獻(xiàn)內(nèi)容的學(xué)科屬性作出判斷。

②使用標(biāo)識(shí)方面:主題法直接用詞語(yǔ)表示文獻(xiàn)主題,即用事物名稱(chēng)或概念詞語(yǔ)做描述文獻(xiàn)主題的標(biāo)識(shí)和檢索標(biāo)識(shí);分類(lèi)法則以抽象化的類(lèi)目代號(hào)——分類(lèi)號(hào)作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索標(biāo)識(shí)。前者直觀(guān)易懂,后者較簡(jiǎn)潔,但也較費(fèi)解。

第三十二頁(yè),共六十二頁(yè),2022年,8月28日③排列方式上:主題法按詞語(yǔ)字順排列,如同詞典,易學(xué)易查;分類(lèi)法按分類(lèi)號(hào)(學(xué)科或?qū)I(yè)門(mén)類(lèi)的代號(hào))排列,系統(tǒng)性較強(qiáng),但不熟悉有關(guān)分類(lèi)表則難以有效地利用它。④用途上:主題法較適合于期刊論文、研究報(bào)告、會(huì)議論文等單篇文獻(xiàn)的組織和檢索,且更適于計(jì)算機(jī)組織和檢索,而分類(lèi)法則比較適合于圖書(shū)或文集的組織和檢索。第三十三頁(yè),共六十二頁(yè),2022年,8月28日綜上所述,主題法和分類(lèi)法的作用是互補(bǔ)的,各有長(zhǎng)短,誰(shuí)也代替不了誰(shuí)。在文獻(xiàn)檢索中,我們應(yīng)當(dāng)盡量取二者之長(zhǎng),避二者之短,以取得最佳檢索效果。第三十四頁(yè),共六十二頁(yè),2022年,8月28日

最常使用的主題法有標(biāo)題詞法、敘詞法、關(guān)鍵詞法、任意詞法。

(1)標(biāo)題詞法(Subjectheading)是一種先組式的檢索語(yǔ)言,詞與詞之間的等級(jí)關(guān)系和組配方式由詞表給以規(guī)范,標(biāo)引文獻(xiàn)時(shí)使用一個(gè)或一組規(guī)范化的詞作為主題標(biāo)識(shí)。第三十五頁(yè),共六十二頁(yè),2022年,8月28日(2)敘詞法(Descriptor)又稱(chēng)敘述詞,描述詞,是一種用規(guī)范化的單元概念標(biāo)引文獻(xiàn)主題的方法,概念的組配可以在標(biāo)引和檢索時(shí)任意組配,是后組式的檢索語(yǔ)言。敘詞語(yǔ)言要求詞與概念之間一一對(duì)應(yīng),即一個(gè)概念只能用一個(gè)詞表達(dá),一個(gè)詞只能表達(dá)一個(gè)概念。為此,必須對(duì)自然語(yǔ)言加以一系列人工規(guī)范。第三十六頁(yè),共六十二頁(yè),2022年,8月28日①詞義規(guī)范:

同義詞:對(duì)同義詞、準(zhǔn)同義詞、近義詞、不同譯名、學(xué)名與俗名等加以規(guī)范,只能用一個(gè)規(guī)范化的詞作敘詞。

例:激光--萊塞、雷射

自行車(chē)--腳踏車(chē)

aircraft--plane、airplane、aeroplane

多義詞:對(duì)多義詞、同形詞作概念、含義上的規(guī)范,即限定。

例:遷移(心理學(xué))

反饋(學(xué)習(xí)心理)

輕叩(球類(lèi)運(yùn)動(dòng))

第三十七頁(yè),共六十二頁(yè),2022年,8月28日②詞類(lèi)規(guī)范:

虛詞不能做敘詞,實(shí)詞中選名詞、動(dòng)名詞做敘詞。

③詞形規(guī)范:

詞序(正序與倒序)

例:湖南-南湖論文-文論語(yǔ)言-言語(yǔ)

簡(jiǎn)稱(chēng)與全稱(chēng)

例:人大--全國(guó)人民代表大會(huì)

中國(guó)人民大學(xué)

書(shū)寫(xiě)繁簡(jiǎn)體、標(biāo)點(diǎn)符號(hào)等等。第三十八頁(yè),共六十二頁(yè),2022年,8月28日

我國(guó)的《漢語(yǔ)主題詞表》,就是一部大型的敘詞表,還有不少專(zhuān)業(yè)性的如《數(shù)學(xué)主題詞表》、《教育主題詞表》、《檔案主題詞表》等。敘詞語(yǔ)言標(biāo)引文獻(xiàn)主題信息準(zhǔn)確、規(guī)范,可以將同一主題的文獻(xiàn)集中在一個(gè)主題詞之下。但是,在自然語(yǔ)言中,新詞和新概念不斷產(chǎn)生,從新詞新概念產(chǎn)生,到其定型化并收入詞表,有較長(zhǎng)的過(guò)程,因此詞表的更新總是滯后于新詞新概念。也就是說(shuō),規(guī)范化的檢索語(yǔ)言標(biāo)引文獻(xiàn)準(zhǔn)確性高,但反映新概念不夠及時(shí)。第三十九頁(yè),共六十二頁(yè),2022年,8月28日3、關(guān)鍵詞法(Keywords)用從文獻(xiàn)中選出來(lái)的,未經(jīng)規(guī)范化處理的,表征文獻(xiàn)主要內(nèi)容的具有實(shí)質(zhì)性意義的詞匯來(lái)標(biāo)引文獻(xiàn)的方法。

關(guān)鍵詞不經(jīng)過(guò)規(guī)范化處理,不受詞表控制,直接使用自然語(yǔ)言,能及時(shí)反映最新概念,適合計(jì)算機(jī)自動(dòng)標(biāo)引。第四十頁(yè),共六十二頁(yè),2022年,8月28日(1)如何選擇關(guān)鍵詞①選擇有實(shí)質(zhì)性意義的詞匯

例如:檢索"詞匯的動(dòng)態(tài)與詞匯規(guī)范研究"這一課題,應(yīng)選擇詞匯動(dòng)態(tài)規(guī)范這三個(gè)有實(shí)質(zhì)性意義的詞②列舉出所有同義詞、近義詞,防止漏檢。

例如:微型計(jì)算機(jī)微機(jī)微電腦個(gè)人計(jì)算機(jī)個(gè)人電腦(同義詞)

學(xué)生--學(xué)員(近義詞)

第四十一頁(yè),共六十二頁(yè),2022年,8月28日(2)如何組配關(guān)鍵詞

大多數(shù)檢索系統(tǒng)都支持布爾邏輯運(yùn)算,布爾邏輯算符主要有:

邏輯與算符AND*A*B

表示檢索結(jié)果中必須同時(shí)包含A和B。

邏輯或算符OR+A+B

表示檢索結(jié)果中出現(xiàn)A,或者出現(xiàn)B。

邏輯非算符NOT–A-B

表示檢索結(jié)果中只能出現(xiàn)A,不能出現(xiàn)B。第四十二頁(yè),共六十二頁(yè),2022年,8月28日布爾算符的優(yōu)先級(jí):

邏輯非-最高,邏輯與*次之,邏輯或+最低。

可以用()改變優(yōu)先級(jí)A*C+B*C可表達(dá)為(A+B)*C

例如:寫(xiě)作*教學(xué)+作文*教學(xué),可表達(dá)為(寫(xiě)作+作文)*教學(xué)第四十三頁(yè),共六十二頁(yè),2022年,8月28日4、任意詞法這是基于計(jì)算機(jī)的全文檢索功能,使用任意詞檢索文獻(xiàn)的方法。優(yōu)點(diǎn)是只要全文中包含某一詞或詞組,就可以從該詞入手檢中這一文獻(xiàn)。但用任意詞檢索文獻(xiàn),誤檢率很高。這是因?yàn)椋?/p>

A.全文中包含某一詞,不等于文獻(xiàn)即研究這一主題;

B.任意詞不能反映自然語(yǔ)言中詞和詞之間的語(yǔ)義關(guān)系;

C.由于漢語(yǔ)的詞與詞之間沒(méi)有明顯間隔,會(huì)出現(xiàn)將前一詞的詞尾與后一詞的詞頭誤組為一個(gè)詞,或一個(gè)詞中包含著另一個(gè)詞,誤認(rèn)為是被檢詞等情況。第四十四頁(yè),共六十二頁(yè),2022年,8月28日例如:秦巴金屬礦產(chǎn)成礦概論

王蒙輝

使用任意詞檢索時(shí),最好要選擇按相關(guān)性排序,以減少誤檢。

各種檢索語(yǔ)言各有優(yōu)缺點(diǎn),大型檢索系統(tǒng)都同時(shí)提供多種檢索入口,以適應(yīng)不同的檢索要求。隨著分類(lèi)--主題一體化,后控制詞等新的方法已開(kāi)始應(yīng)用,標(biāo)引和檢索的準(zhǔn)確率和方便程度都會(huì)逐步提高。第四十五頁(yè),共六十二頁(yè),2022年,8月28日3信息檢索的方法與步驟3.1信息檢索的方法3.2信息檢索的步驟3.3檢索效果的評(píng)價(jià)第四十六頁(yè),共六十二頁(yè),2022年,8月28日3.1信息檢索的方法根據(jù)手段不同,信息檢索的方法可分為兩大類(lèi):手工檢索和計(jì)算機(jī)檢索。一、手工檢索即利用檢索工具查找文獻(xiàn)的一種方法。有以下幾種常用的方法:第四十七頁(yè),共六十二頁(yè),2022年,8月28日

(1)順查法:以課題研究的起始年代為起點(diǎn),由遠(yuǎn)及近,利用檢索工具逐年進(jìn)行查找,一直查到近期為止。特點(diǎn):查全率與查準(zhǔn)率都比較高,但是費(fèi)時(shí)費(fèi)力,勞動(dòng)量大,一般用于大型課題的查檢。第四十八頁(yè),共六十二頁(yè),2022年,8月28日(2)倒查法:由近及遠(yuǎn),逆著時(shí)間的順序利用檢索工具進(jìn)行文獻(xiàn)信息檢索的方法。其重點(diǎn)是放在近期文獻(xiàn)上,只需查到基本滿(mǎn)意即可。特點(diǎn):可以最快地獲取新資料,又可以反映最新的水平和動(dòng)向,比較省力,一般在查找新課題或有新內(nèi)容的老課題時(shí)可以用這個(gè)方法。節(jié)約時(shí)間,但是漏檢率高。第四十九頁(yè),共六十二頁(yè),2022年,8月28日(3)抽查法:抓住學(xué)科發(fā)展的興旺時(shí)期進(jìn)行查找。興旺時(shí)期,文獻(xiàn)數(shù)量遠(yuǎn)遠(yuǎn)高于其他時(shí)期,而且新的觀(guān)點(diǎn)、新的理論也會(huì)在這個(gè)時(shí)期產(chǎn)生。特點(diǎn):檢索時(shí)間比較少,獲得文獻(xiàn)較多,檢索效率高。但是,必須建立在熟悉學(xué)科發(fā)展特點(diǎn)的基礎(chǔ)上。第五十頁(yè),共六十二頁(yè),2022年,8月28日(4)追溯法:利用在文獻(xiàn)后面所附的參考文獻(xiàn)為線(xiàn)索,由近及遠(yuǎn),逐一追蹤的查找方法。特點(diǎn):不需要利用檢索工具,查找方法簡(jiǎn)單,但是效率不高,漏檢率高。(5)綜合法:將以上幾種檢索方法結(jié)合起來(lái)交替使用的方法。特點(diǎn):是一種“立體型”的檢索法。第五十一頁(yè),共六十二頁(yè),2022年,8月28日二、計(jì)算機(jī)檢索

指人們?cè)谟?jì)算機(jī)或計(jì)算機(jī)檢索網(wǎng)絡(luò)的終端機(jī)上,使用特定的檢索指令、檢索詞和檢索策略,從計(jì)算機(jī)檢索系統(tǒng)的數(shù)據(jù)庫(kù)中檢索出需要的信息。

第五十二頁(yè),共六十二頁(yè),2022年,8月28日計(jì)算機(jī)檢索特點(diǎn):(1)檢索方便快捷;(2)檢索功能強(qiáng)大;(3)獲得信息類(lèi)型多;(4)檢索范圍廣泛。

另外,計(jì)算機(jī)檢索類(lèi)型很多,如定題服務(wù)、聯(lián)機(jī)定購(gòu)服務(wù)、隨機(jī)問(wèn)答服務(wù)、回溯檢索服務(wù)等。第五十三頁(yè),共六十二頁(yè),2022年,8月28日3.2信息檢索的步驟一、分析研究課題,明確檢索要求在著手查找信息之前,首先要對(duì)課題進(jìn)行分析,即審題。在分析過(guò)程中需要明確學(xué)科或?qū)I(yè)的范圍,弄清檢索的真正意義以及實(shí)質(zhì)。

第五十四頁(yè),共六十二頁(yè),2022年,8月28日二、制定檢索策略,選擇檢索工具

所謂檢索策略,就是在明

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論