計算機信息檢索技術(shù)_第1頁
計算機信息檢索技術(shù)_第2頁
計算機信息檢索技術(shù)_第3頁
計算機信息檢索技術(shù)_第4頁
計算機信息檢索技術(shù)_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

英文數(shù)據(jù)庫的松奈與原文的獲取

吳賢奇

?文獻是我們獲取信息的主要來源.

?信息的來源:實踐?人?文獻

?文獻:知識的載體.

?文獻:圖書,期刊,報紙,專利(文獻).標準(文獻).

學位論文,科技報告.政府出版物,會議論文.

檔案,產(chǎn)品資料.

?數(shù)據(jù)庫是當代管理文獻信息,開發(fā)文獻信息

的最重要最主要的手段和技術(shù).

數(shù)據(jù)庫類型:

?1、文摘型數(shù)據(jù)庫:有文摘

?2、題錄型數(shù)據(jù)庫:通常稱之為索引型數(shù)據(jù)庫。無文摘c

?3、全文型數(shù)據(jù)庫:摘要(題錄)+全文

?4、數(shù)據(jù)型數(shù)據(jù)庫:數(shù)值、事實

?5、圖像(多媒體)數(shù)據(jù)庫:圖像(多媒體等)

數(shù)據(jù)庫知識

■文摘數(shù)據(jù)庫:

?收集范圍廣:語種多,文獻類型多,地理范圍廣。

?全文數(shù)據(jù)庫:

?收集范圍有限,主要用于某個單位或某個主題的

資料存貯。

?文摘數(shù)據(jù)庫與全文數(shù)據(jù)庫可實現(xiàn)無余逢鏈接。

號【華南農(nóng)業(yè)大學圖書館電子資逮】-InternetExplorer-|glx|

文件(E)編輯(E)查看(9收藏(⑴工具(D幫助(由文摘索引數(shù)據(jù)庫

IC后退?十一回閶;|搜索收藏夾?|、,

地址(3|<!9/elect/index.htm£輸,\天速手直接搜索二]Q轉(zhuǎn)到鏈接嬤,

上百度搜索]

年月日星期四

2006323922M全文數(shù)據(jù)庫

首頁>電子費;好>

[文黃索引數(shù)據(jù)庫】[電子期刊數(shù)據(jù)庫]

介T

Agricola[光盤版][簡介]AgricolaPlusTextJ

r簡T

Agris【光盤版][簡介]BlackwellLJ

r簡T

BlosisPreviews(BA)[簡介]CellPress]需出國帳號]LJ

r簡T

CA(化學文摘)[簡介]CESJLJ

r簡1

CABI[光盤版][簡介]CHSLLJ

tr簡u

EiVillage(H)[簡介]DOAJL

r簡T

LJ

ERIC[簡介]EBSCO-ASP

r簡T

EBSCO-BSPLJ

FSTA(食品科技文摘)[光盤版1[簡介]簡

rT

ElsevierSDOS國內(nèi)[國外]LJ

ISIProceedings[簡介]簡

r]

EnvironmentalUniverseL

MathSciNet圖學評論網(wǎng)絡版1[簡療]簡

rT

ESAJournalsonlineLJ

PQDDB[簡介]簡

rT

LJ

維普新聞題錄文箍庫[簡介]INFORMS

中文社會科學引文索引數(shù)據(jù)庫[簡介]KluwerOnline

MAlffiY材料學系列期刊[簡介]

全國報刊索引[簡介]

NationalLibraryofMedicine

Mature(國內(nèi))(國外)

?專業(yè)性數(shù)據(jù)庫:收集某個學科文獻資料的數(shù)據(jù)庫。

?綜合性數(shù)據(jù)庫:收集多個學科文獻資料的數(shù)據(jù)庫。

?我們必須要知道自己的專業(yè)數(shù)據(jù)庫以及與我們學

科相關(guān)的其它的專業(yè)性數(shù)據(jù)庫和綜合性數(shù)據(jù)庫

(即相關(guān)性數(shù)據(jù)庫)??蓮膰鴥?nèi)外各大學圖書館

的網(wǎng)站上獲取相關(guān)信息(資料)?;虻卿?/p>

/support/bluesheets

?三個主要中文數(shù)據(jù)庫提供商:

?清華同方(中國知識網(wǎng),中國期刊

網(wǎng)):WWW.CNKI.NET

?重慶維普數(shù)據(jù)有限公

司:WWW.CQVIP.COM

?萬方數(shù)據(jù)有限公

司:WWW.WANFANG.COM.CN

?英文數(shù)據(jù)庫主要提供商:

?國外數(shù)據(jù)庫提供商很多,且專業(yè)化較強,規(guī)模

大,信息管理水平高(主要體現(xiàn)在字段設(shè)置和

檢索技術(shù)上),數(shù)據(jù)量大,服務網(wǎng)絡化,更新快.

?WWW.THOMSOOCOM

?WWWQCLC.COM

?WWW.EL0RG

?WWW.ISINET.COM

?現(xiàn)階段,所有中英文數(shù)據(jù)庫的檢索

原理與技術(shù)基本上都是一樣的?!

?計算機檢索包含兩個過程:

先存貯,后檢索

?先存貯:信息管理專業(yè)人員將信息存貯在數(shù)據(jù)庫中。

即信息組織過程。

?后檢索:信息用戶利用數(shù)據(jù)庫進行檢索。即信息

檢索過程。

?存貯過程:信息組織過程。

?(1)標弓I:將文獻的各種信息(對檢索有用的信息,通常

稱之為特征信息)用自然語言的字、詞、句子、符號等按一定的

規(guī)則描述出來。

?文獻的特征信息:題名、作者、出版社、出版日期、頁數(shù)、

字數(shù)、分類號、主題詞、關(guān)鍵詞等等

?標引存在翻譯上的問題。

?(2)設(shè)計字段:一個字段對應文獻的一個特征信息。

?(3)將相應的信息標識輸入數(shù)據(jù)庫的相應字段

中。

?存貯過程就是一個建庫過程。建庫有人工和自動

兩種方式。

計算機信息組織過程

-一

段TIAUPBPYPDSBSSABLA

字段書名作者出版社出版年出版地主題詞分類文摘原文

名稱號語種

記錄三人民出2002北京中國古代I22三國演義chi

義羅貝

1中版社小說是.??

記毛澤張三北京大2003北京毛澤東、G25毛澤東chi

錄2東屆

學出版政治人物是

錄3■■■■■■■■■■■■■■■■■■■■■■■■■■■

?數(shù)據(jù)庫的字段及其含義:

-字段名稱:

?字段含義:

-字段符:

?字段內(nèi)容的標弓1(書寫)規(guī)則:

?對每一個數(shù)據(jù)庫,我們要知道它的字段及字段的

含義以及字段符。

?一般英文數(shù)據(jù)庫在Help中有說明。如無,可查相

關(guān)文獻資料。或上

www.dialog,com/support/bluesheets

?數(shù)據(jù)庫的建庫語種:

?數(shù)據(jù)庫是用何種自然語言建庫的。

?數(shù)據(jù)庫檢索界面的語種是可變的。但數(shù)據(jù)

庫的建庫語種是不可變的。

計算機檢索原理

?計算機檢索過程:詞形匹配

?這是我們永遠、時刻要記住的。

?實質(zhì)上,檢索的過程就是一個如何保

證檢索詞(或符號、句子)與數(shù)據(jù)庫

相應字段中的詞(或符號、句子)保

持一致。

字形相同:檢索詞要

計算機描與數(shù)據(jù)庫的標識詞一

致,或包含在句子中

數(shù)

據(jù)

內(nèi)

、

計算機檢索原理

?檢索內(nèi)容能用幾個關(guān)鍵詞來表達嗎?

數(shù)據(jù)庫與檢索系統(tǒng)

?數(shù)據(jù)庫與檢索系統(tǒng)是兩個不同的概念。

?數(shù)據(jù)庫是信息的集體體,是一種信息管理的方式。

?檢索系統(tǒng)是個軟件。檢索系統(tǒng)主要用于檢索數(shù)據(jù)

庫。

?一個檢索系統(tǒng)可以容納上百個數(shù)據(jù)庫,可同時對

上百個數(shù)據(jù)庫進行檢索。

?一個數(shù)據(jù)庫可依存于不同的檢索系統(tǒng)。

?檢索系統(tǒng):

?單機檢索系統(tǒng):通常說的單機數(shù)據(jù)庫。

?聯(lián)機檢索系統(tǒng):通常說的聯(lián)機數(shù)據(jù)庫。

?網(wǎng)絡檢索系統(tǒng):通常說的網(wǎng)絡數(shù)據(jù)庫。通過

在網(wǎng)站中嵌入檢索系統(tǒng)對數(shù)據(jù)庫進行檢索。

?網(wǎng)絡檢索系統(tǒng)也可以說是聯(lián)機檢索系統(tǒng)的

一種。在現(xiàn)代是最常見的。

?現(xiàn)在說的聯(lián)機檢索系統(tǒng)一般指使用專門的軟件實

現(xiàn)本地機與服務器連接的檢索系統(tǒng)。

?檢索系統(tǒng)按載體形式來分有:

?光盤檢索系統(tǒng):通常說的光盤數(shù)據(jù)庫。

?非光盤檢索系統(tǒng):一般指的是存在于硬盤等

載體的檢索系統(tǒng),也是現(xiàn)代最常用的。

?光盤檢索系統(tǒng)有單機形式和聯(lián)機形式兩種。一般

說的單機檢索系統(tǒng)就是指光盤單機檢索系統(tǒng)。

?光盤聯(lián)機檢索系統(tǒng):有專門的光盤服務器。

檢索方式

?檢索系統(tǒng)一般提供了三種檢索方式三種:

?裁次札超媒體檢索

,萊單式檢索

?命令式傳息檢索

■,什么要提偌三種給我們,都需要我們省握嗎7

超文本式、超媒體檢索

?在分類的基礎(chǔ)上,通過文字或多媒體與相

關(guān)知識產(chǎn)生鏈接,從而達到檢索目的的檢

索方式。

?操作非常簡單,人們只需學會使用鼠標和

認識漢字即可使用。

?主要用于瀏覽某類文獻。

?但是檢索結(jié)果不夠精確。查精率不高。

?一般檢索系統(tǒng)都提供了這種檢索

菜單式檢索

?是一種操作方便,界面友好操作簡便的檢

索方式。

?用戶只需輸入檢索詞,根據(jù)菜單的指引,

通過確定適當?shù)倪x項和功能筵便能完成檢

索。

?菜單式檢索是現(xiàn)階段最受歡迎的檢索方式。

命令式檢索一一專業(yè)檢索方式

?需要輸入檢索式來進行檢索。

?甚至還需要輸入一些操作命令(即系統(tǒng)不可能功

能按鈕)。

?命令式檢索的優(yōu)勢:

?檢索式更能清晰地表達復雜的檢索內(nèi)容和要求。

?檢索過程明了,便與檢索者判斷檢索是否滿意O

有利于掌握檢索過程。

?對于進行課題研究的文獻檢索,需要使用命令式

檢索方式。

些大型的檢索系統(tǒng)都使用命令檢索方式

計算機信息檢索技術(shù)

?在計算機檢索中,常用的檢索技術(shù)有:

?1、布爾邏輯檢索:

?2、字段限定檢索

?3、位置限定檢索

?4、啜吧艮定檢索:一般用于題名、文摘

全文等字段。

計算機信息檢索技術(shù)

?5、截詞檢索:

?6、詞表檢索:

?7、二次檢索:

?8、全文檢索:

布爾邏輯檢索

?當需要用于多個檢索詞來表達檢索內(nèi)容時,我們

需要處理這些檢索詞的邏輯關(guān)系。

?對檢索詞進行布爾邏輯運算

?布爾邏輯運算共有三種:

?邏輯與:AND*

?邏輯或:OR+

?邏輯非:NOT-

?AND、OR、NOT、*、+、稱之為邏輯算符

布爾邏輯檢索

?邏輯與:

?AND—英文系統(tǒng)

?*—中文系統(tǒng)

?若AANDB:即表示被檢索的文獻記錄中必須

同時含有A和B才算命中,AND兩側(cè)的檢索詞必須同

時出現(xiàn)在同一篇文獻記錄中,該篇文獻才算命中。

?用于交叉要領(lǐng)和限定關(guān)系的組配,它可以縮少檢

索范圍,準確表達檢索需求,有利于提高查準率。

布爾邏輯檢索

?邏輯或:

?OR—英文系統(tǒng)

?+—中文系統(tǒng)

?若AorB,則表示在一篇文獻記錄中只

要含有A或者B中的任何一個即算命中。

?用于并列關(guān)系的組配,可以擴大檢索范圍,防止

漏檢,有利于提高查全率。

布爾邏輯檢索

?邏輯非:

?NOT--英文系統(tǒng)

?---中文系統(tǒng)

?若ANOTB,則表示文獻記錄中包含A而不

包含B。

?這種組配用于從原來的檢索范圍中排除不需要的

和影響檢索結(jié)果的概念,使檢索結(jié)果更精確。

?如;查找有關(guān)能源方面的文獻,但不包含包括核能。

A(ENERGY)——78230ENERGY

B(NUCLEAR)--14778NUCLEAR

AnotB--------------63452ENERGYnotEUCLEAR

布爾邏輯檢索

?三者運算的優(yōu)先級一般如下:

?邏輯非>邏輯與>邏輯或

?在不同的系統(tǒng)中,三者的運算優(yōu)先級可能不同。

布爾邏輯檢索

?邏輯運算優(yōu)先級的限定:

?有時為了讓優(yōu)先級低的邏輯運算先進行,

使用括號來加以限定。

?如:AORBANDC

?(AORB)ANDC

布爾邏輯檢索

?邏輯運算的組合:

?當一個表達式中需要出現(xiàn)三種邏輯運算的多個

組合時,可使用括號來限定它們的運算優(yōu)先順序。

如:(AORB)ANDC

?有的系統(tǒng)支持雙重括號,有的系統(tǒng)只支持單重括。

?一個檢索系統(tǒng)對表達式中所包含的邏輯算符一般

是由限度的。如《BA》數(shù)據(jù)庫中,表達式中最多

只能含五十個邏輯算符,即五十個邏輯運算。

字段限定檢索

?對檢索詞的檢索途徑(出現(xiàn)的檢索字段)

進行限定

?即確定檢索詞在哪一個字段中進行檢索。

子段限定檢索—字段符

寸:

統(tǒng)

使

。

統(tǒng)

。

用,

ALJN二限查特定刊名

LA

號PN二限查特定專利

CS二機構(gòu)名稱

字段限定檢索--字段符

?DE=限在敘詞標引中查

?ID=限在自由標引詞中查

?TI=限在題目中查

?AB=限在文摘中查找

?CT=限查受控詞

?PA=限查專利

字段限定檢索--字段限定表述

?字段限定檢索的表述:

?一般為以下幾種形式

?1、字段符=檢索詞(主要用于中文系統(tǒng))

?2、檢索詞in字段符(主要用于英文系

統(tǒng))

?3、檢索詞within字段符(主要用于英文系統(tǒng))

■4、檢索詞wn字段符(主要用于英文系

統(tǒng))

?5、字段符(檢索詞)(主要用于英文系

統(tǒng))

■表示檢索詞必須出現(xiàn)在指定的字段內(nèi)

位置限定檢索

?為了準確表達檢索內(nèi)容,提高查準率。系

統(tǒng)一般對檢索詞進行詞位的限定。

?限定檢索詞的位置一般有兩種方式:

(1)使用位置算符,

(2)使用引號。

?位夫算符:檢索系統(tǒng)一般是采用位置算符

來實現(xiàn)位置檢索。

?常用的位置算符有:adjnearwith

withinwn

-不同的系統(tǒng)采用的位置算符不同.用法也不

位置限定檢索

?以DIALOG系統(tǒng)為例:

?DIALOG系統(tǒng)常用的位置算符共有四種:

?1、W或O—WKh表示算符兩側(cè)的檢索

詞(或檢索項)之間不得有其它字詞,而

且順序不能顛倒。

位置限定檢索

?(2)(nW)-nWorld(位置順序隔詞)

?表示算符兩側(cè)的檢索詞(或檢索項)之

間允許插入n個實詞或者虛詞,但順序不能

顛倒。

位置限定檢索

?(3)N(Near)(詞位置緊連)

?表示算符兩側(cè)的檢索詞必須緊密相連,中

間不插入其他字符。但兩詞次序可以顛倒。

位置限定檢索

?(4)(nN)一nNear(隔詞運算)

?表示算符兩側(cè)的檢索詞(或檢索項)之

間允許插入n個單詞,且兩側(cè)詞序可變。

位置限定檢索

?引號的用法:

?當需要將兩個或兩個以上的單詞作一個

詞組執(zhí)行檢索時,只需用引號將幾個詞引

起來即可。

?用于提高查準率

詞頻限定檢索

?限定某個檢索詞在字段或原文中出現(xiàn)的頻

次。

?詞頻符:FREQ

?如:CELL/FREQ=20,將檢中那些CELL出現(xiàn)的

次數(shù)不少于20的文獻。

截詞檢索

計算機按照檢索詞的部分片斷同索引詞進行對比,以提

供族性檢索的功能,提高查全率。

-一般有以下六種情況:

?1、右截斷:前方一致,后截斷

?2、左截斷:后方一致,前截斷

?3、左右同時截斷:中間一致

?4、完

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論