數(shù)據(jù)庫(kù)檢索方式(課堂PPT)_第1頁(yè)
數(shù)據(jù)庫(kù)檢索方式(課堂PPT)_第2頁(yè)
數(shù)據(jù)庫(kù)檢索方式(課堂PPT)_第3頁(yè)
數(shù)據(jù)庫(kù)檢索方式(課堂PPT)_第4頁(yè)
數(shù)據(jù)庫(kù)檢索方式(課堂PPT)_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.1第四章計(jì)算機(jī)信息檢索的基本技術(shù)與方法一、計(jì)算機(jī)信息檢索的基本技術(shù):一、計(jì)算機(jī)信息檢索的基本技術(shù): 布爾邏輯、截詞檢索、加權(quán)檢索,位置算符等布爾邏輯、截詞檢索、加權(quán)檢索,位置算符等。在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜的課題,在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜的課題,如:如:“GPSGPS在建筑中的應(yīng)用在建筑中的應(yīng)用”,既涉及,既涉及GPSGPS,又涉及又涉及建筑,還有建筑,還有“應(yīng)用應(yīng)用”,這時(shí)候就要編制出滿足要求的計(jì),這時(shí)候就要編制出滿足要求的計(jì)算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。1 1布爾邏輯檢索(布爾邏輯檢索(Boolean Logic Boolean Lo

2、gic RetrievalRetrieval) 邏輯檢索的基礎(chǔ)是邏輯運(yùn)算,邏輯運(yùn)算中最常用的邏輯檢索的基礎(chǔ)是邏輯運(yùn)算,邏輯運(yùn)算中最常用的是布爾邏輯運(yùn)算符(是布爾邏輯運(yùn)算符(Boolean Logic OperatorsBoolean Logic Operators), ,即與、即與、或、非三種運(yùn)算符號(hào),或、非三種運(yùn)算符號(hào),用它們可以表示概念之間的邏輯用它們可以表示概念之間的邏輯關(guān)系。關(guān)系。檢 索 要求邏輯檢索 課題 表達(dá)式 檢 索 結(jié)果概念相交、限定 AND與* 計(jì)算機(jī)用于制圖 A BA AND BA * B 縮小檢索范圍提高查準(zhǔn)率 概念平行、并列 OR或+ 土地管理與土地利用 A B A O

3、R B A+B擴(kuò)大檢索范圍提高查全率 某一主題去掉一部分相關(guān)主題 NOT非- 除光電測(cè)距以外的 A 電磁波測(cè)距 BB NOT AB-A提高查準(zhǔn)率 2 位置算符位置算符(Proximity Operators) 位置算符是表示檢索詞之間位置關(guān)系的一種運(yùn)位置算符是表示檢索詞之間位置關(guān)系的一種運(yùn)算符。由于英文對(duì)一句話有多種表達(dá)方法,寫法可算符。由于英文對(duì)一句話有多種表達(dá)方法,寫法可能不同。如:能不同。如:“GPS在鐵路橋研究中的應(yīng)用在鐵路橋研究中的應(yīng)用”這個(gè)這個(gè)課題,用英文表達(dá)可能是課題,用英文表達(dá)可能是“Using of GPS in Railway Bridge”, 也可能是也可能是“Using

4、 of GPS in Bridge of Railway”,因而可能編制出這樣的檢索因而可能編制出這樣的檢索式,式,GPS AND (Railway (2N)Bridge)我們可以通過位置檢索提高檢索的準(zhǔn)確率(1) (W)算符與算符與(nW)算符算符 W 是是word與與 with的縮寫。的縮寫。 特點(diǎn):特點(diǎn):W詞序不變,中間不可插詞,但兩詞間可有詞序不變,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。一個(gè)標(biāo)點(diǎn),連字符或空格。 nW詞序不變,中間可插入詞序不變,中間可插入N 個(gè)詞。個(gè)詞。 如:如:potential (w) energy可能檢出可能檢出potential energy an

5、d function 又如:又如:gone (2w)wind 可能檢出可能檢出gone with the wind (2) (N)與與(nN)算符算符 N是是near的縮寫的縮寫 特點(diǎn):特點(diǎn):N詞序不限,中間不可插詞,但兩詞間可有一詞序不限,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。個(gè)標(biāo)點(diǎn),連字符或空格。 nN詞序不限,中間可插入詞序不限,中間可插入N 個(gè)詞。個(gè)詞。 如:如:econom? (2N)recovery可能檢出可能檢出economic recovery,recovery of the economy,(3)同字段檢索)同字段檢索A(F)B,F(xiàn)是是field的縮寫。的縮寫。

6、特點(diǎn):特點(diǎn):A、B兩詞必須出現(xiàn)在同一字段中,詞序與兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限。詞量不限。 如:如:environment (F)impact/DE,表示兩個(gè)詞必須表示兩個(gè)詞必須同時(shí)出現(xiàn)在敘詞字段內(nèi)。同時(shí)出現(xiàn)在敘詞字段內(nèi)。(4) 同句檢索同句檢索A(S)B,S是是sentence的縮寫的縮寫。 特點(diǎn):特點(diǎn):A、B出現(xiàn)在同一自然句中(子字段),其出現(xiàn)在同一自然句中(子字段),其詞序與詞量不受限制。詞序與詞量不受限制。 如:如:electric (S)plant可檢出可檢出electric power plants如:如:EI中的中的NEAR;PQDD中的中的W/n (兩詞間距小于兩詞

7、間距小于n個(gè)單詞,且前后位置任意個(gè)單詞,且前后位置任意),Pre/n (兩詞間距小于兩詞間距小于n個(gè)單詞,且前后位置一定個(gè)單詞,且前后位置一定)3 3截詞算符截詞算符( (Truncating operators)Truncating operators) 原因原因:在英語(yǔ)詞匯中,一個(gè)詞可能有多種形態(tài),如詞的單、復(fù):在英語(yǔ)詞匯中,一個(gè)詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如果檢索時(shí)將數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如果檢索時(shí)將這類詞全部輸入進(jìn)去,會(huì)增加檢索時(shí)間和費(fèi)用,采用截詞法可解這類詞全部輸入進(jìn)去,會(huì)增加檢索時(shí)間和費(fèi)用,采用截詞法可解決這一問題

8、。決這一問題。 所謂截詞檢索,是指在檢索標(biāo)識(shí)中保留相同的部分,用相應(yīng)所謂截詞檢索,是指在檢索標(biāo)識(shí)中保留相同的部分,用相應(yīng)的截詞符代替可變化部分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分的截詞符代替可變化部分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分標(biāo)識(shí)的記錄全部檢索出來(lái)。常用標(biāo)識(shí)的記錄全部檢索出來(lái)。常用“?”、“*”符號(hào)表示。符號(hào)表示。 (1)有限截詞)有限截詞。即在檢索詞后后截幾個(gè)有限的字母,如名詞的。即在檢索詞后后截幾個(gè)有限的字母,如名詞的單復(fù)數(shù),動(dòng)詞的詞尾變化等。單復(fù)數(shù),動(dòng)詞的詞尾變化等。如輸入如輸入computer?表示有表示有0-1個(gè)字母變化,可檢出個(gè)字母變化,可檢出computer和和comput

9、ers. 輸入輸入stud?表示截?cái)嗵幱斜硎窘財(cái)嗵幱?-3個(gè)字母變化,可檢出個(gè)字母變化,可檢出study,studies,studied,studing.8(2)無(wú)限截?cái)啵o(wú)限截?cái)啵涸跈z索詞后加一個(gè):在檢索詞后加一個(gè)“?“,表,表示該詞后可加任意個(gè)字符。使用無(wú)限截詞,所截示該詞后可加任意個(gè)字符。使用無(wú)限截詞,所截詞根不能太短,否則會(huì)輸出許多無(wú)關(guān)文獻(xiàn),造成詞根不能太短,否則會(huì)輸出許多無(wú)關(guān)文獻(xiàn),造成誤檢。誤檢。 如:如:computer?可檢出可檢出computers,computering,computered,computerization.(3)中間截?cái)嘀虚g截?cái)啵涸跈z索詞中間加一個(gè)或幾個(gè)?:

10、在檢索詞中間加一個(gè)或幾個(gè)?號(hào),主要解決一些英美拼寫不同,單復(fù)數(shù)形式的號(hào),主要解決一些英美拼寫不同,單復(fù)數(shù)形式的不同的詞的輸入,可簡(jiǎn)化輸入。不同的詞的輸入,可簡(jiǎn)化輸入。 如:輸入如:輸入wom?n可檢出可檢出woman,women .9各種算符在數(shù)據(jù)庫(kù)中的實(shí)際應(yīng)用各種算符在數(shù)據(jù)庫(kù)中的實(shí)際應(yīng)用位置算符位置算符1)EI NEAR Bridge NEAR Piling*表示這兩個(gè)詞要彼此接近,前后順序不限。W/n Pig*W/2pine*表示兩個(gè)詞的距離不能超過n個(gè)單詞Adj Channel adj tunnel表示含有這兩個(gè)詞,兩個(gè)詞相鄰,位置一定2)ISI Proceedings 用同句算符(SA

11、ME):如如Channel same Channel same tunneltunnel,表示表示channel channel 和和tunnel tunnel 出現(xiàn)在同一句子中才出現(xiàn)在同一句子中才符合檢索條件。符合檢索條件。.103)CSA:within X“ 表示兩詞之間不得多于x個(gè)詞,前后位置任意 如“women within 8 movement” (順序不定)4)Elsevier: ADJ表示兩詞相鄰,前后順序固定,與詞檢索的結(jié)果相同;NEAR或NEAR(N),表示兩詞相鄰,中間可插入少于或等于n個(gè)單詞,前后順序可以發(fā)生變化,如果不使用(N),系統(tǒng)默認(rèn)值為10 .115)PQDD W

12、/n (兩詞間距小于n個(gè)單詞,且前后位置任意),Pre/n (兩詞間距小于n個(gè)單詞,且前后位置一定)6)ProQuest W/n(表示連接兩個(gè)詞之間可以插入n個(gè)詞 ,前后位置可顛倒) 如:Education w/5 intenet 表示education和internet之間可以插入5個(gè)詞 ,并且前后位置可以顛倒。 Pre/n(表示前后兩詞之間最多插入n個(gè)詞,前后位置一定 ) 如:U.S pre/n economic policy可檢出U.S aideconomic policy,or U.S wartime economic policy 。.12截詞符或通配符如:CSAISI Procee

13、dingsProQuestCA用通配符“?”和截詞符“* ” 輸入 “patent*”,可以檢索到 patent、patents、 patented等,(無(wú)限截?cái)啵?輸入wom?n,可以檢索到woman和women。 輸入“fib?”,可檢索到fiber和 fibre。(有限截?cái)啵?而EI用“* ” 和“$”(詞根算符) 如:Optic*檢索結(jié)果中包括以optic 開頭后面加任意多個(gè)字母的詞例如optic, optics,optical 等 $manager(強(qiáng)調(diào)語(yǔ)義)檢索出與該詞根具有同樣語(yǔ)意的詞如 $manage 將檢出managers, managerial 和management 等詞

14、 通配符不能用在檢索詞的最前面4 4括號(hào)檢索(括號(hào)檢索(ParenthesesParentheses)用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的內(nèi)容做優(yōu)用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的內(nèi)容做優(yōu)先運(yùn)算。先運(yùn)算。用用“()”可以表示優(yōu)先級(jí)。如比較可以表示優(yōu)先級(jí)。如比較 (GPSORGIS)ANDChina GPSORGIS ANDChinaEI 中的表示方法:中的表示方法:Relevance AND( Aalbersberg within AU)OR (cool within AU)5 5、字段限制檢索字段限制檢索 組成數(shù)據(jù)庫(kù)的最小單位是記錄,一條完整記錄中的組成數(shù)據(jù)庫(kù)的最小單位是記錄,一條完整記錄中的每一

15、個(gè)著錄事項(xiàng)為字段。獻(xiàn)書目型數(shù)據(jù)庫(kù)的記錄基本每一個(gè)著錄事項(xiàng)為字段。獻(xiàn)書目型數(shù)據(jù)庫(kù)的記錄基本包括下列字段:包括下列字段:(1) 存取號(hào)字段(存取號(hào)字段(AN, Access NumberAN, Access Number)這是計(jì)算這是計(jì)算機(jī)檢索系統(tǒng)為每個(gè)數(shù)據(jù)庫(kù)的每篇記錄規(guī)定的能被計(jì)算機(jī)檢索系統(tǒng)為每個(gè)數(shù)據(jù)庫(kù)的每篇記錄規(guī)定的能被計(jì)算機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫(kù)中,每篇文獻(xiàn)記錄機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫(kù)中,每篇文獻(xiàn)記錄只有一個(gè)存取號(hào);只有一個(gè)存取號(hào);(2) 篇(題)名字段(篇(題)名字段(Title Field, /TITitle Field, /TI)(3) 文摘字段(文摘字段(Abstract

16、 Field, /AB)Abstract Field, /AB).15(4) 敘詞字段或受控詞字段(敘詞字段或受控詞字段(Destriptor Field, Destriptor Field, /DE; /DE; 或或 Controlled term Field-SU) Controlled term Field-SU) 這一字段是標(biāo)這一字段是標(biāo)引人員給文獻(xiàn)標(biāo)引的反映其主題概念的詞,這些引人員給文獻(xiàn)標(biāo)引的反映其主題概念的詞,這些詞來(lái)自規(guī)范化的詞表。也稱主題詞。詞來(lái)自規(guī)范化的詞表。也稱主題詞。 (5)自由詞字段或非受控詞字段(自由詞字段或非受控詞字段(Identified Field, /ID;

17、 Keyword Field , /KY ;Uncontrolled term Field) 這一字段也是標(biāo)引人員給文獻(xiàn)標(biāo)引這一字段也是標(biāo)引人員給文獻(xiàn)標(biāo)引反映其主題概念的詞,但這些詞不是規(guī)范化詞表反映其主題概念的詞,但這些詞不是規(guī)范化詞表中的詞。中的詞。.16(6) 著者機(jī)構(gòu)子段(著者機(jī)構(gòu)子段(corporate source,CS或或AF)(7) 刊名字段(刊名字段(journal,JN或或ST)(8) 出版年子段(出版年子段(publication,year,PY)(9) 文獻(xiàn)類型子段(文獻(xiàn)類型子段(ducument type,DT或或TY)(10) 語(yǔ)種子段(語(yǔ)種子段(language,

18、LA)(11) 分類號(hào)子段(分類號(hào)子段(classification,CC).17注意事項(xiàng)注意事項(xiàng):作者檢索的縮寫形式:作者檢索的縮寫形式:在在SCI中中, 姓姓 (全稱)空格(全稱)空格 名(首字母名(首字母并且連寫)如:并且連寫)如:LI DR;GONG JY在在EI中中, 姓姓 名,全稱名,全稱(中文中文); 姓(全稱)姓(全稱)名(縮寫)名(縮寫)機(jī)構(gòu)檢索中機(jī)構(gòu)檢索中 SCI中有多個(gè)作者單位中有多個(gè)作者單位, 在同一字段中在同一字段中 EI 只收入第一作者的單位只收入第一作者的單位多字段檢索時(shí)要選所有字段多字段檢索時(shí)要選所有字段(all field).18 基本索引子段和輔助索引子段基

19、本索引子段和輔助索引子段一篇記錄中主要用來(lái)表達(dá)文獻(xiàn)內(nèi)容的一篇記錄中主要用來(lái)表達(dá)文獻(xiàn)內(nèi)容的子段稱為基本索引子段(子段稱為基本索引子段(basic index fields),如篇名子段、文摘子如篇名子段、文摘子段、敘詞子段、自由詞子段;而表達(dá)段、敘詞子段、自由詞子段;而表達(dá)文獻(xiàn)外部特征的子段稱為輔助索引子文獻(xiàn)外部特征的子段稱為輔助索引子段(段(additional index fields),包括著包括著者子段、著者機(jī)構(gòu)子段、文獻(xiàn)類型子者子段、著者機(jī)構(gòu)子段、文獻(xiàn)類型子段、語(yǔ)種子段等。段、語(yǔ)種子段等。.196短語(yǔ)檢索(phrase search)即精確檢索短語(yǔ)用“”表示,檢索出與“”內(nèi)形式完全相同

20、的的短語(yǔ),以提高檢索的精確度和準(zhǔn)確度7自然語(yǔ)言檢索(natural language search)直接采用自然語(yǔ)言中的字、詞、句進(jìn)行提問式檢索,同一般口語(yǔ)一樣。這種基于自然語(yǔ)言的檢索方式又被稱為“智能檢索”,適合不太熟悉網(wǎng)絡(luò)信息技術(shù)的人員使用。支持自然語(yǔ)言檢索的有中文的悠游,英文的AltaVista, Excite,Infoseek,HotBot,AskJeeves等.208多種語(yǔ)言檢索multilingual search)提供多種語(yǔ)言的檢索環(huán)境供用戶選擇,系統(tǒng)按用戶選定的語(yǔ)種進(jìn)行檢索并反饋結(jié)果,支持多語(yǔ)種檢索的 如:中文天網(wǎng),英文AltaVista,Google等。.219模糊檢索(模糊

21、檢索(fuzzy search)又稱概念檢索。當(dāng)我們輸入一個(gè)檢索詞時(shí),搜稱概念檢索。當(dāng)我們輸入一個(gè)檢索詞時(shí),搜索引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)索引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)也發(fā)來(lái)與關(guān)鍵詞意義相近的內(nèi)容。比如:我們也發(fā)來(lái)與關(guān)鍵詞意義相近的內(nèi)容。比如:我們查找查找“查詢查詢”一詞時(shí),模糊檢索會(huì)反饋來(lái)包含一詞時(shí),模糊檢索會(huì)反饋來(lái)包含了了“查詢查詢”、“查找查找”“”“查一查查一查”、“尋找尋找”、“搜索搜索”等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一般是完全符合關(guān)鍵詞的在最前邊,其次是相近般是完全符合關(guān)鍵詞的在最前邊,其次是相近的?,F(xiàn)在大多數(shù)搜索引擎都有這種功

22、能,只是的?,F(xiàn)在大多數(shù)搜索引擎都有這種功能,只是模糊的程度不同。模糊的程度不同。.2210 字母大小寫檢索字母大小寫檢索如果用戶的檢索式用小寫字母表示,搜索如果用戶的檢索式用小寫字母表示,搜索工具既匹配大寫又匹配小寫,如:工具既匹配大寫又匹配小寫,如:china(瓷器),瓷器),china(中國(guó));如果用大中國(guó));如果用大寫字母表示,搜索工具認(rèn)為用戶指定了只寫字母表示,搜索工具認(rèn)為用戶指定了只要大寫,就只會(huì)查找那些與用戶鍵入的輸要大寫,就只會(huì)查找那些與用戶鍵入的輸入形式完全相同的結(jié)果,如:入形式完全相同的結(jié)果,如:china,只檢只檢索出索出china。Alta Vista等搜索引擎支持區(qū)等搜

23、索引擎支持區(qū)分大小寫的檢索分大小寫的檢索.23注意:自然語(yǔ)言檢索、模糊檢索、多種語(yǔ)言檢索注意:自然語(yǔ)言檢索、模糊檢索、多種語(yǔ)言檢索和區(qū)分大小寫的檢索是網(wǎng)絡(luò)檢索所特有的。和區(qū)分大小寫的檢索是網(wǎng)絡(luò)檢索所特有的。在在實(shí)際檢索中,往往將多種檢索技術(shù)混合使用。實(shí)際檢索中,往往將多種檢索技術(shù)混合使用。如:查找標(biāo)題中含有如:查找標(biāo)題中含有“網(wǎng)絡(luò)營(yíng)銷網(wǎng)絡(luò)營(yíng)銷”的資料,它的的資料,它的計(jì)算機(jī)檢索提問式(表達(dá)式)可以是:計(jì)算機(jī)檢索提問式(表達(dá)式)可以是:TI(Web OR WWW) AND market*又如:又如:ISTP中的綜合表示方法中的綜合表示方法TS=(nanotub* SAME carbon) NOT

24、 AU=Smalley RE .24二、數(shù)據(jù)庫(kù)的檢索方法二、數(shù)據(jù)庫(kù)的檢索方法 檢索界面瀏覽方式( Browse )檢索方式 ( Search ).25瀏覽方式瀏覽方式 ( Browse ) 一般包括作者、作者單位、出版物名稱及出版社索引或者按學(xué)科劃分的分類索引 如:EI Elsevier CSA PROQUEST IEEEIEE 重慶維普以及中國(guó)期刊網(wǎng)等等都提供了各種不同的瀏覽方式.26檢索方式檢索方式 ( Search ) 基本檢索基本檢索 (basicquicksimpleeasy) 屬于一般性的檢索,它是根據(jù)自己的檢索需要,輸屬于一般性的檢索,它是根據(jù)自己的檢索需要,輸入字、詞或簡(jiǎn)單的檢

25、索式(不能使用位置檢索)來(lái)入字、詞或簡(jiǎn)單的檢索式(不能使用位置檢索)來(lái)完成檢索的,是一種初級(jí)性的檢索方式。完成檢索的,是一種初級(jí)性的檢索方式。 高級(jí)檢索高級(jí)檢索 (advanceexpendfullexpert) 屬于專家性的檢索,可以根據(jù)自己的檢索需要,構(gòu)屬于專家性的檢索,可以根據(jù)自己的檢索需要,構(gòu)件比較復(fù)雜的檢索式(可以使用邏輯、括號(hào)、截詞件比較復(fù)雜的檢索式(可以使用邏輯、括號(hào)、截詞以及位置算符)來(lái)完成高層次、高質(zhì)量的檢索,檢以及位置算符)來(lái)完成高層次、高質(zhì)量的檢索,檢索結(jié)果快速、準(zhǔn)確。索結(jié)果快速、準(zhǔn)確。 高級(jí)檢索分為:菜單式檢索和命令式檢索.3.34

26、.35三、三、 檢索效果的評(píng)價(jià)檢索效果的評(píng)價(jià)v查全率與查準(zhǔn)率是檢索質(zhì)量的兩個(gè)重要的評(píng)查全率與查準(zhǔn)率是檢索質(zhì)量的兩個(gè)重要的評(píng)價(jià)指標(biāo)。價(jià)指標(biāo)。v查全率查全率(recall ratio)=檢出的相關(guān)文獻(xiàn)量檢出的相關(guān)文獻(xiàn)量/檢索檢索系統(tǒng)中相關(guān)文獻(xiàn)總量系統(tǒng)中相關(guān)文獻(xiàn)總量即檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)即檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)中存在的合乎該需要的所有文獻(xiàn)的比例。查中存在的合乎該需要的所有文獻(xiàn)的比例。查全率高說明有用的東西都被你檢中了,但對(duì)全率高說明有用的東西都被你檢中了,但對(duì)于數(shù)量巨大的數(shù)據(jù)庫(kù)而言,要達(dá)到于數(shù)量巨大的數(shù)據(jù)庫(kù)而言,要達(dá)到100%的查的查全率是不可能的,在網(wǎng)絡(luò)條件下尤其如此

27、。全率是不可能的,在網(wǎng)絡(luò)條件下尤其如此。.36v查準(zhǔn)率查準(zhǔn)率(precision ratio)=檢出的相關(guān)文獻(xiàn)量檢出的相關(guān)文獻(xiàn)量/檢出的檢出的文獻(xiàn)總量。指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢文獻(xiàn)總量。指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢出文獻(xiàn)全部數(shù)量的比例。出文獻(xiàn)全部數(shù)量的比例。 準(zhǔn)確率高說明你檢出的東西都是有用的東西。一般準(zhǔn)確率高說明你檢出的東西都是有用的東西。一般地說,很少能達(dá)到地說,很少能達(dá)到100%的查準(zhǔn)率。的查準(zhǔn)率。v在查全與查準(zhǔn)兩個(gè)方面一般難以兩全,為了獲得很在查全與查準(zhǔn)兩個(gè)方面一般難以兩全,為了獲得很多有用的東西(達(dá)到高的查全率),需要較少的限多有用的東西(達(dá)到高的查全率),需要較少的

28、限制檢索條件,但這樣檢出的無(wú)用的東西就會(huì)很多制檢索條件,但這樣檢出的無(wú)用的東西就會(huì)很多(查準(zhǔn)率不高),反之亦然。(查準(zhǔn)率不高),反之亦然。 四、四、 檢索策略的實(shí)施技巧檢索策略的實(shí)施技巧 檢索策略:為實(shí)現(xiàn)檢索目標(biāo)而實(shí)施的方法。檢索策略:為實(shí)現(xiàn)檢索目標(biāo)而實(shí)施的方法。 檢索策略制定的原則:檢索策略制定的原則: 第一第一 快,即從檢索請(qǐng)求的提出到檢索結(jié)果快,即從檢索請(qǐng)求的提出到檢索結(jié)果的提交要快速:的提交要快速: 第二第二 準(zhǔn),即檢索結(jié)果要準(zhǔn)確,避免檢索出準(zhǔn),即檢索結(jié)果要準(zhǔn)確,避免檢索出過多無(wú)關(guān)內(nèi)容;過多無(wú)關(guān)內(nèi)容; 第三第三 全,檢索結(jié)果全面,滿足用戶的需求;全,檢索結(jié)果全面,滿足用戶的需求; 第四

29、第四 效益原則,即以最低的費(fèi)用獲取所佳效益原則,即以最低的費(fèi)用獲取所佳的信息。的信息。.38 歸納起來(lái)包括:歸納起來(lái)包括: (1)認(rèn)真進(jìn)行課題分析,確定正確的主題詞及學(xué)科認(rèn)真進(jìn)行課題分析,確定正確的主題詞及學(xué)科 分類情況分類情況 (2)正確選擇各種算符,如邏輯算符,位置算符,正確選擇各種算符,如邏輯算符,位置算符,截詞符。截詞符。(3)編制合理的計(jì)算機(jī)檢索式。編制合理的計(jì)算機(jī)檢索式。 (4)隨時(shí)調(diào)整檢索策略,減少漏檢和誤檢,提高查隨時(shí)調(diào)整檢索策略,減少漏檢和誤檢,提高查全率和查準(zhǔn)率。全率和查準(zhǔn)率。v首先,擴(kuò)大命中文獻(xiàn)數(shù)量以提高查全率:選用文首先,擴(kuò)大命中文獻(xiàn)數(shù)量以提高查全率:選用文摘字段檢索;

30、使用上位詞或近義詞、同義詞用邏摘字段檢索;使用上位詞或近義詞、同義詞用邏輯或輯或(OR)連接;利用截詞檢索。連接;利用截詞檢索。v其次,縮小檢索范圍以提高查準(zhǔn)率。檢索詞限定其次,縮小檢索范圍以提高查準(zhǔn)率。檢索詞限定在篇名和敘詞字段;使用下位詞,利用邏輯非去在篇名和敘詞字段;使用下位詞,利用邏輯非去掉無(wú)關(guān)信息;利用邏輯積限定相關(guān)主題。掉無(wú)關(guān)信息;利用邏輯積限定相關(guān)主題。 五、五、 計(jì)算機(jī)信息檢索的具體步驟計(jì)算機(jī)信息檢索的具體步驟 (方法)(方法) 1分析檢索課題,明確檢索要求分析檢索課題,明確檢索要求 (這是檢索的出發(fā)點(diǎn),依據(jù)這是檢索的出發(fā)點(diǎn),依據(jù)) 分析檢索課題:分析檢索課題的中心內(nèi)容和分析檢

31、索課題:分析檢索課題的中心內(nèi)容和所屬學(xué)科范圍,以便準(zhǔn)確選擇反映文獻(xiàn)內(nèi)容特所屬學(xué)科范圍,以便準(zhǔn)確選擇反映文獻(xiàn)內(nèi)容特征的主題詞、關(guān)鍵詞,確定出所屬學(xué)科的學(xué)科征的主題詞、關(guān)鍵詞,確定出所屬學(xué)科的學(xué)科性質(zhì)性質(zhì) 明確檢索需求,即弄清檢索目的及要解決的明確檢索需求,即弄清檢索目的及要解決的問題。用戶的檢索目的和要求是多種多樣的,問題。用戶的檢索目的和要求是多種多樣的,是撰寫學(xué)位論文,還是申報(bào)科研課題,是技術(shù)是撰寫學(xué)位論文,還是申報(bào)科研課題,是技術(shù)革新還是成果鑒定,目的不同,檢索的策略和革新還是成果鑒定,目的不同,檢索的策略和范圍也不同。檢索需求主要反映在用戶對(duì)命中范圍也不同。檢索需求主要反映在用戶對(duì)命中文

32、獻(xiàn)的類型、語(yǔ)種及所需文獻(xiàn)的年代等不同。文獻(xiàn)的類型、語(yǔ)種及所需文獻(xiàn)的年代等不同。.402 2 選擇檢索系統(tǒng)和數(shù)據(jù)庫(kù)選擇檢索系統(tǒng)和數(shù)據(jù)庫(kù) 在分析檢索課題,明確檢索要求在分析檢索課題,明確檢索要求的基礎(chǔ)上,必須綜合考慮檢索系統(tǒng)的基礎(chǔ)上,必須綜合考慮檢索系統(tǒng)的特點(diǎn)、收錄的學(xué)科范圍、各數(shù)據(jù)的特點(diǎn)、收錄的學(xué)科范圍、各數(shù)據(jù)庫(kù)的專業(yè)范圍、主題內(nèi)容、數(shù)據(jù)來(lái)庫(kù)的專業(yè)范圍、主題內(nèi)容、數(shù)據(jù)來(lái)源與文獻(xiàn)類型、技術(shù)含量、數(shù)據(jù)的源與文獻(xiàn)類型、技術(shù)含量、數(shù)據(jù)的存貯年限、更新頻率、檢索費(fèi)用以存貯年限、更新頻率、檢索費(fèi)用以及使用方法。及使用方法。.413 3 確定檢索項(xiàng)與檢索途徑確定檢索項(xiàng)與檢索途徑 檢索項(xiàng)主要指文獻(xiàn)記錄中的文獻(xiàn)特

33、征標(biāo)檢索項(xiàng)主要指文獻(xiàn)記錄中的文獻(xiàn)特征標(biāo)識(shí)。反映文獻(xiàn)內(nèi)容特征的檢索詞如:標(biāo)題識(shí)。反映文獻(xiàn)內(nèi)容特征的檢索詞如:標(biāo)題詞、敘詞、和關(guān)鍵詞;反映文獻(xiàn)外表特征詞、敘詞、和關(guān)鍵詞;反映文獻(xiàn)外表特征的如:作者、語(yǔ)種、文獻(xiàn)類型等。的如:作者、語(yǔ)種、文獻(xiàn)類型等。 檢索途徑指主題檢索或分類檢索。檢索途徑指主題檢索或分類檢索。4 4 編制計(jì)算機(jī)檢索式編制計(jì)算機(jī)檢索式十、十、 計(jì)算機(jī)檢索邏輯表達(dá)式舉例計(jì)算機(jī)檢索邏輯表達(dá)式舉例:例例1:GPS在建筑事業(yè)中的應(yīng)用在建筑事業(yè)中的應(yīng)用 主題詞主題詞:A:全球定位系統(tǒng);全球定位系統(tǒng);B:建筑測(cè)量;組配詞:建筑測(cè)量;組配詞:C:應(yīng)用應(yīng)用 表達(dá)式表達(dá)式:A AND B AND C例例

34、2:加拿大遙感活動(dòng)展望:加拿大遙感活動(dòng)展望 主題詞主題詞:A:遙感;遙感;B:測(cè)繪科技活動(dòng);組配詞:測(cè)繪科技活動(dòng);組配詞:C:加拿大;加拿大;D:展望展望 表達(dá)式:表達(dá)式:(A OR B)AND C AND D例例3:Peter教授在測(cè)量平差理論方面的研究教授在測(cè)量平差理論方面的研究 主題詞主題詞:A:測(cè)量平差;組配詞:測(cè)量平差;組配詞:B:理論;理論;C:研究;研究;D:Peter表達(dá)式表達(dá)式:A AND B AND C AND D 例例4:Batson關(guān)于土地規(guī)劃與地籍測(cè)量方面的論述關(guān)于土地規(guī)劃與地籍測(cè)量方面的論述 主題詞主題詞:A:土地規(guī)劃;土地規(guī)劃;B:地籍測(cè)量;組配詞:地籍測(cè)量;組配詞:C:評(píng)論;評(píng)論;D:Batson; 表達(dá)式表達(dá)式:(A OR B)AND C AND D .43例例5:專題測(cè)圖用于土地利用制圖和植被制圖:專題測(cè)圖用于土地利用制圖和植被制圖主題詞主題詞:A:專題測(cè)量?jī)x;專題測(cè)量?jī)x;B:土地利用制圖;土地利用制圖;C:植被制圖植被制圖; D:測(cè)繪儀器;測(cè)繪儀器

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論