計(jì)算機(jī)檢索技術(shù)及中文數(shù)據(jù)庫使用方法_第1頁
計(jì)算機(jī)檢索技術(shù)及中文數(shù)據(jù)庫使用方法_第2頁
計(jì)算機(jī)檢索技術(shù)及中文數(shù)據(jù)庫使用方法_第3頁
計(jì)算機(jī)檢索技術(shù)及中文數(shù)據(jù)庫使用方法_第4頁
計(jì)算機(jī)檢索技術(shù)及中文數(shù)據(jù)庫使用方法_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)檢索技術(shù)

及中文數(shù)據(jù)庫使用方法

職工專題培訓(xùn)

主講段曉玲

一、計(jì)算機(jī)信息檢索的基本技術(shù):

布爾邏輯算符、截詞算符、位置算符、字段

限定檢索等等

在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜

的課題,如:“GPS在建筑中的應(yīng)用”,既涉

及GPS,又涉及建筑,還有“應(yīng)用”,這時(shí)候

就要編制出滿足要求的計(jì)算機(jī)檢索式,它是機(jī)檢

的基礎(chǔ)。

■、計(jì)算機(jī)信息檢索的基本技術(shù)

■布爾邏輯算符、截詞算符、位置算符、

字段限定檢索等等

■在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較

復(fù)雜的課題,如:“GPS在建筑中的應(yīng)

用”,既涉及GPS,又涉及建筑,還有

“應(yīng)用”,這時(shí)候就要編制出滿足要求

的計(jì)算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。

1布爾邏輯檢索

CBodleartLo&icRetrieval)

邏輯檢索的基礎(chǔ)是邏輯運(yùn)算,邏輯運(yùn)算

中最常用的是布爾邏輯運(yùn)算符(Boolean

LogicOperators),即與、或、非三種運(yùn)

算符號(hào),用它們可以表示概念之間的邏輯

關(guān)系。

檢索要邏輯檢課題表達(dá)式檢索結(jié)

求索果

概念

AND與計(jì)算機(jī)用于制圖AANDB縮小檢

、*ABA*B索范圍

提高查

準(zhǔn)率

概1土地管理與土地利用

ORAORB擴(kuò)大檢

爾AB

索范圍

列或十A+B

提高查

全率

某一主題去NOT非除光電測(cè)距以外的BNOTA提高查

掉一部分相A

電磁波測(cè)距準(zhǔn)率

關(guān)主題B-A

B

2位置算符(ProximityOperators)

位置算符是表示檢索詞之間位置關(guān)系的一種運(yùn)

算符。由于英文對(duì)一句話有多種表達(dá)方法,寫法可

能不同。如:"GPS在鐵路橋研究中的應(yīng)用”這個(gè)

課題,用英文表達(dá)可能是"UsingofGPSin

RailwayBridge”,也可能是“UsingofGPSin

BridgeofRailway”,因而可能編制出這樣的檢索

式,GPSAND(Railway(2N)Bridge)

我們可以通過位置檢索提高檢索的準(zhǔn)確率

(1)(W)算符與(nW)算符W是word

與with的縮寫。

特點(diǎn):W詞序不變,中間不可插詞,但兩

詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。

nW詞序不變,中間可插入N個(gè)詞。

如:potential(w)energy可能檢出

potentialenergyandfunction

又如:gone(2w)wind可能檢出gonewiththe

wind

(2)(N)與(nN)算符N是near的縮寫

?特西:R詞序不限,中間不可插詞,但兩

詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。

nN詞序不限,中間可插入N個(gè)詞。

如:econom??(2N)recovery可能檢出

economicrecovery,recoveryofthe

economy,

(3)同字段檢索A(F)B,F是field的縮寫。

特點(diǎn):A、B兩詞必須出現(xiàn)在同一字段中,

詞序與詞量不限。

如:environment(F)impact/DE,表示兩

個(gè)詞必須同時(shí)出現(xiàn)在敘詞字段內(nèi)。

(4)同句檢索A(S)B,S是sentence的縮寫。

悸點(diǎn):A、B粘兆魯同一自然句中(孑字段),

其詞序與詞量不受限制。

如:electric(S)plant可檢出electricpower

plants

如:EI中的NEAR;PQDD中的W/n(兩詞間距小

于n個(gè)單詞,且前后位置任意),Pre/n(兩詞間

距小于n個(gè)單詞,且前后位置一定)

3截詞算符(Truncatingoperators)

在英語詞匯中,一個(gè)詞可能有多種

形態(tài),如詞的單、復(fù)數(shù)形式的不同,英

美拼寫方法不同、詞性不同等。如果檢

索時(shí)將這類詞全部輸入進(jìn)去,會(huì)增加檢

索時(shí)間和費(fèi)用,采用截詞法可解決這一

問題。

矯謂藏詞檢索;是指在檢索標(biāo)識(shí)中保留相

同的部分,用相應(yīng)的截詞符代替可變化部

分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分

標(biāo)識(shí)的記錄全部檢索出來。常用“?”、

符號(hào)表示。

J1)本限辱斷;__________________

?■指圣檢蠢司后后截幾個(gè)有限的字母,如

名詞的單復(fù)數(shù),動(dòng)詞的詞尾變化等。

如輸入computer??表示有0T個(gè)字母變化,

可檢出computer和computers.

輸入stud???表示截?cái)嗵幱?-3個(gè)字母變化,

可檢出study,studies,studied,studing.

J2)?無.截即:_________________

)一?在惹索右后加一個(gè)“?”,表示該詞

后可加任意個(gè)字符。使用無限截詞,所截

詞根不能太短,否則會(huì)輸出許多無關(guān)文獻(xiàn),

造成誤檢。如:computer?可檢出

computers,computering,computered,

computerization.

(3),中日截呼:

’走檢藁詞吊間加二個(gè)或幾個(gè)?號(hào),主

要解決一些英美拼寫不同,單復(fù)數(shù)形式的

不同的詞的輸入,可簡(jiǎn)化輸入。

如:輸入wom?n可檢出

woman,women

各種算符在數(shù)據(jù)庫中的實(shí)際應(yīng)用

位置算符

>----?----?----?-------------------------

1)EI

NEARBridgeNEARPiling*

表示這兩個(gè)詞要彼此接近,前后順序不限。

W/nPig*W/2pine*表示兩個(gè)詞的距離不能超過n個(gè)單詞

AdjChanneladjtunnel表示含有這兩個(gè)詞,兩個(gè)詞相鄰,

位置一定

2)⑸Proceedings用同句算符(SAME):如Channelsame

tunnel,表示channel和tunnel出現(xiàn)在同一句子中才

符合檢索條件。

3)CSA:

?---?---?---?------------------

within"X”表示兩詞之間不得多于x個(gè)詞,前后住

置任意

如“womenwithin8movement"。順序不定)

4)Elsevier:

ADJ表示兩詞相鄰,笛后順序固定,與“詞檢索”的

結(jié)果相同;NEAR或NEARCNJ,表示兩詞相鄰,

中間可插入少于或等于n個(gè)單詞,前后順序可以發(fā)

生變化,如果不使用CNJ,宗統(tǒng)默認(rèn)值為10

5)PQDD

W/n(兩詞間距小于n個(gè)單詞,且前后位置

任意),Pre/n(兩詞間距小于n個(gè)單詞,且

前后位置一定)

6)ProQuest

'W/n’(表親連接兩個(gè)詞之間可以

插入n個(gè)詞,前后位置可顛倒)

如:Educationw/5intenet表示

education和internet之間可以插入

5個(gè)詞,并且前后位置可以顛倒。

Pre/n

表示前后'兩詞之間最多插入n個(gè)

詞,前后位置一定

如:U.Spre/neconomicpolicy

可檢出U?Said

economicpolicy,orU.Swartime

economicpolicy。

截詞符或通配符

望A\甲Pr?ceegings\ProQuest\CA用通配符

“?”和就詞符

輸入"patent"”,可以檢索到patent、patents>

patented等,(無限截?cái)啵?/p>

輸入"wom?n”,可以檢索到woman和women。

輸入"fib??”,可檢素到fiber和fibre。(有限

EI用“*”和“$”(詞根算符)

如:Optic*檢索結(jié)果中包括以0Ptic開頭后面加

任意

多個(gè)字母的詞例如0Ptic,optics,optical等

$manager(強(qiáng)調(diào)語義)檢索出與該詞極具有同

樣語意的詞如

$manage將檢出managers,managerial

和management等詞

X通配符不能用在檢索詞的最前面

4括號(hào)檢索(Parentheses)

用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的內(nèi)容做優(yōu)

先運(yùn)算。

用“()”可以表示優(yōu)先級(jí)。如比較

(GPSORGIS)ANDChina

GPSORGISANDChina

EI中的表示方法:RelevanceAND

((AalbersbergWNAU)OR(coolWNAU))

5、字段限制檢索

組成數(shù)據(jù)庫的最小單位是記錄,一條完整記錄中的

每一個(gè)著錄事項(xiàng)為字段。獻(xiàn)書目型數(shù)據(jù)庫的記錄基本

包括下列字段:

(1)存取號(hào)字段(AN,AccessNumber)這是計(jì)算

機(jī)檢索系統(tǒng)為每個(gè)數(shù)據(jù)庫的每篇記錄規(guī)定的能被計(jì)算

機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫中,每篇文獻(xiàn)記錄

只有一個(gè)存取號(hào);

(2)篇(題)名字段(TitleField,/TI)

(3)文摘字段(AbstractField,/AB)

(4)敘詞字段或受控詞字段(DestriptorField,

/bE;或ConfrolledtermField-SU)lS=^段是標(biāo)

引人員給文獻(xiàn)標(biāo)引的反映其主題概念的詞,這些

詞來自規(guī)范化的詞表。也稱主題詞。

(5)自由詞字段或非受控詞字段(Identified

Field,/ID;KeywordFieldKW;Uncontrolled

termField)這一字段也是標(biāo)引人員給文獻(xiàn)標(biāo)引

反映其主題概念的詞,但這些詞不是規(guī)范化詞表

中的詞。

(6)著者子段(Author,AU)

(7)著者機(jī)構(gòu)子段

(corporatesource,CS

^Affiliationsource,AF)

(8)刊名字段

(journal,JN或SourceTitle,ST)

(9)出版年子段

(publication,yearzPY)

(10)文獻(xiàn)類型子段

(ducumenttype,DT或Type,TY)

(工工)語種子段(language,LA)

(12)分類號(hào)子段(classification,CC)

使用作者檢索時(shí)應(yīng)注意姓名的書寫形式:

?在I身P中,,生前(筌稱)名后(縮寫):Gong,jy;EDC

■在SCI中,

■(1)姓(全稱)空格名(首字母并且連寫)

如:TaitNG;LIDR

■(2)名前(全稱),姓后

如:Zequn,guan;Qingquan,Li

■在EI中,姓名就比較復(fù)雜,一般有以下幾種情況:姓名都用全稱(姓

前名后);姓全稱名縮寫(或名之間用連字符);名前姓后全稱

如kehengyu=keheng-yu=ke,hengyu

kezh.y.=kezh-y;e,d.c.

hengyuke;dongchenze

§短謂檢索(phrasesearch)即精確檢索

短語用表示,檢索出與內(nèi)形式完全

相同的的短語,以提高檢索的精確度和準(zhǔn)確

7自然語言檢索(naturallanguage)

直接采用自然語言中的字、詞、句進(jìn)行提問

式檢索,同一般口語一樣。這種基于自然語

言的檢索方式又被稱為“智能檢索”,適合

不太熟悉網(wǎng)絡(luò)信息技術(shù)的人員使用。支持自

然語言檢索的有中文的悠游,英文的

AltaVista,

Excite,Infoseek,HotBot,AskJeeves9

F多我語聲理索(multilingualsearch)

撼茯多前語看的檢索環(huán)境供用戶選擇,

系統(tǒng)按用戶選定的語種進(jìn)行檢索并反饋

結(jié)果,支持多語種檢索的如:中文天

網(wǎng),英文AltaVista,Google等。

9模糊檢索(fuzzysearch)

又稱棘念檢索。?當(dāng)我們輸入一個(gè)檢索詞時(shí),搜索

引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)也發(fā)

來與關(guān)鍵詞意義相近的內(nèi)容。比如:我們查找

“查詢”一詞時(shí),模糊檢索會(huì)反饋來包含了“查

詢”、“查找”“查一查”、“尋找"、“搜索'

等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一般是完全符

合關(guān)鍵詞的在最前邊,其次是相近的?,F(xiàn)在大多

數(shù)搜索引擎都有這種功能,只是模糊的程度不同。

10字號(hào)大公寫檢皆

?如果的戶苗檢會(huì)式用小寫字母表示,搜索工具

既匹配大寫又匹配小寫,如:china(瓷器),

china(中國(guó));如果用大寫字母表示,搜索工

具認(rèn)為用戶指定了只要大寫,就只會(huì)查找那些

與用戶鍵入的輸入形式完全相同的結(jié)果,如:

china,只檢索出china。AltaVista等搜索引擎

支持區(qū)分大小寫的檢索

實(shí)際檢索中,往往將多種檢索技術(shù)混合使

用。如:

TI(WebORWWW)ANDmarket*

TS=(nanotub*SAMEcarbon)

NOTAU=SmalleyRE

例1:以汽車導(dǎo)航系統(tǒng)為研究課題,構(gòu)建

計(jì)算機(jī)邏輯檢索式

題名詞:汽車導(dǎo)航系統(tǒng)研究

題名擴(kuò)展詞:機(jī)動(dòng)車;全球定位技術(shù)

(GPS);設(shè)計(jì)調(diào)查

■計(jì)算機(jī)邏輯檢索式:

■(汽車+機(jī)動(dòng)車)*(導(dǎo)航系統(tǒng)+全球定

位技術(shù)+GPS)*(研究+設(shè)計(jì)+調(diào)查)

示例:有關(guān)“企業(yè)知識(shí)產(chǎn)權(quán)研究”

檢索式檢索結(jié)果

(*表示AND,+表示OR,限定篇名字段)(2004-2006)

—?-----?------?-----?-----------------

1企業(yè)知識(shí)產(chǎn)權(quán)191篇(準(zhǔn)確度最高漏檢大)

2企業(yè)*知識(shí)產(chǎn)權(quán)404(漏檢率較高)

3(企業(yè)+集團(tuán)+公司)*知識(shí)產(chǎn)權(quán)466(適合綜述性義獻(xiàn))

4(企業(yè)+集團(tuán)+公司)*(知識(shí)產(chǎn)權(quán)+專刑J權(quán)520(查全率查準(zhǔn)率較高)

+商標(biāo)權(quán)+著作權(quán)+名稱權(quán))

5(企業(yè)+集團(tuán)+公司)*(知識(shí)產(chǎn)權(quán)+專利權(quán)137(縮小范圍效果最佳)

+商標(biāo)權(quán)+著作權(quán)+名稱權(quán))*保護(hù)

■靜索結(jié)果__________________

檢索詞的選擇、邏輯算符的使用、同義詞近

義詞的擴(kuò)展、檢索字段的選擇等變化,對(duì)檢

索結(jié)果數(shù)量的多少、檢索的查全和查準(zhǔn)有很

大影響

■檢盤結(jié)果,過少;漏掉了相關(guān)文獻(xiàn)?

?放寬%索輯求,顯高檢全率

■去掉某個(gè)方面的檢索要求;

■放寬檢索范圍:學(xué)科領(lǐng)域、時(shí)間、文章類型,關(guān)鍵詞出

現(xiàn)的字段等;

■將描述檢索主題的詞想全,包括同義詞及縮寫形式;

如:MRIORmagneticresonanceimaging

■使用單數(shù)單詞檢索,可以檢索到大多數(shù)單詞單數(shù)、復(fù)數(shù)

和所有格,不規(guī)則單詞除外;

如:city可以檢索出city,cities,city's,cities'

■使用通配符;

■檢季結(jié)號(hào)過節(jié)很多文獻(xiàn)不相關(guān)?

?進(jìn)2步限整檢提高檢準(zhǔn)率

■更加準(zhǔn)確地描述檢索需求;

■嚴(yán)格限定檢索范圍:學(xué)科領(lǐng)域、時(shí)間、文章類型,

關(guān)鍵詞出現(xiàn)的字段等;

■選擇與檢索主題密切相關(guān)的詞和專業(yè)術(shù)語,如:

kidneydiseaseORrenalfailure,避免使用過于

寬泛的詞匯,如:influence;

■使用詞組檢索或位置檢索;

匚在檢索結(jié)果的基礎(chǔ)上進(jìn)行二次檢索;

:、數(shù)據(jù)庫的檢索方法

?--?--?--?

檢索界面

瀏覽方式檢索方式

(Browse)(Search)

>---?---?-瀏--覽?-方--式--(--B--r-o-w--s-e--)--

一般包括作者、作者單位、出版物名

稱及出版社索引或者按學(xué)科劃分的分類索引

如:ELElsevierCSAPROQUEST

IEEE\IEE重慶維普以及中國(guó)期刊網(wǎng)等等

都提供了各種不同的瀏覽方式

檢索方式(

—?—?—?—?-------S--e-a--r-c-h-)

基本檢索(basic\quick\simple\easy)

屬于一般性的檢索,它是根據(jù)自己的檢索需要,輸入字、

詞或簡(jiǎn)單的檢索式(不能使用位置檢索)來完成檢索的,是

一種初級(jí)性的檢索方式。

高級(jí)檢索(advance\expend\full\expert)

屬于專家性的檢索,可以根據(jù)自己的檢索需要,構(gòu)件比

較復(fù)雜的檢索式(可以使用邏輯、括號(hào)、截詞以及位置算符)

來完成高層次、高質(zhì)量的檢索,檢索結(jié)果快速、準(zhǔn)確。高級(jí)

檢索分為菜單式檢索和命令式檢索兩種

4,維普茨訊-中文科技期刊數(shù)據(jù)庫檢索-?111而?3InternetExplorer日.。封新郵件I□回區(qū)1

▼但:bttp;//vip.hb&ib.cxi/Visitnew.asp

文件但)編輯?查看9收藏夾(A)工具①)幫助(H)

…樂色維普資訊-中文科技期刊數(shù)據(jù)庫檢索G.川,?燉也),工具⑥),

,我的數(shù)據(jù)庫I幫助I退出登錄

高級(jí)檢索繚蹈'翁期刊導(dǎo)航

分類表

□一¥

□東

義r

列鄧小平會(huì)論

□□

宗教

學(xué)

□□

□□[C]社會(huì)科學(xué)總論

>>

□□[D]政治、法律

<<

□□[E]軍事

□□[F]經(jīng)濟(jì)

體育

□□[G]文化、科學(xué)、教育

□□[H]語言、文字

□□[I]文學(xué)

□□[J]藝術(shù)

□□[K]歷史、地理

□□[N]自然科學(xué)總論

□□[0]數(shù)理科學(xué)和化學(xué)

□□[P]天文學(xué)、地球科學(xué)

(Q]生物科學(xué)

M=題名或關(guān)健詞7|W]

提示:諳在分類表中選擇分類,將勾選的分類添加到右邊“所選分類”方植中.

如果要?jiǎng)h除某一所選分類,可在點(diǎn)擊該分類后直接雙擊刪除。

在檢索框處選擇檢索入口,輸入檢索條件,在所選分類中進(jìn)行再限制檢索。

V

t/。Internet,\ioox▼

中文數(shù)據(jù)庫的使用方法

中國(guó)期刊網(wǎng)

■重慶維普數(shù)據(jù)庫

■萬方數(shù)據(jù)庫

■全國(guó)期刊聯(lián)合目錄

■高校期刊聯(lián)合目錄

■書生之家

(一)收錄特點(diǎn)

■中國(guó)期刊網(wǎng)目前世界上最大的連續(xù)動(dòng)態(tài)更新的

中國(guó)期刊全文數(shù)據(jù)庫。收錄1979年至今約

7200種期刊全文。至2005年4月止,累積全

文文獻(xiàn)1370多萬篇。分為九大專輯:理工A、

理工B、理工C、農(nóng)業(yè)、醫(yī)藥衛(wèi)生、文史哲、經(jīng)

濟(jì)政治與法律、教育與社會(huì)科學(xué)、電子技術(shù)

與信息科學(xué);126個(gè)專題文獻(xiàn)數(shù)據(jù)庫。知識(shí)

來源:中國(guó)國(guó)內(nèi)約7200種核心期刊與專業(yè)特

色期刊的全文以及優(yōu)秀博碩士學(xué)位論文和重要

報(bào)紙

重慶寶普資W裾公司是科學(xué)技術(shù)部西南信息中心下屬的

一家大型專業(yè)化數(shù)據(jù)公司,是中文期刊數(shù)據(jù)庫建設(shè)事業(yè)的

奠基人。自1989年以來,一直致力于報(bào)刊等信息資源的深

層次開發(fā)和推廣應(yīng)用,業(yè)務(wù)集數(shù)據(jù)采集、數(shù)據(jù)加工、光盤

制作發(fā)行和網(wǎng)上信息服務(wù)于一體。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論