網(wǎng)絡(luò)信息檢索與利用_第1頁
網(wǎng)絡(luò)信息檢索與利用_第2頁
網(wǎng)絡(luò)信息檢索與利用_第3頁
網(wǎng)絡(luò)信息檢索與利用_第4頁
網(wǎng)絡(luò)信息檢索與利用_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一節(jié) 計(jì)算機(jī)信息檢索計(jì)算機(jī)信息檢索在計(jì)算機(jī)和計(jì)算機(jī)檢索網(wǎng)絡(luò)或終端上,使用特定的檢索指令、檢索詞和檢索策略,將用戶的提問特征與數(shù)據(jù)源所采用的特征標(biāo)志進(jìn)行對(duì)比,然后將二者相一致或比較一致的信息提取出來供用戶使用的過程。利用計(jì)算機(jī)系統(tǒng)有效存儲(chǔ)和快速查找的能力發(fā)展起來的一種計(jì)算機(jī)應(yīng)用技術(shù)。它與信息的構(gòu)造、分析、組織、存儲(chǔ)和傳播有關(guān)。計(jì)算機(jī)信息檢索系統(tǒng)是信息檢索所用的硬件資源、系統(tǒng)軟件和檢索軟件的總合。第一節(jié) 計(jì)算機(jī)信息檢索一次性信息檢索系統(tǒng)二次性信息檢索系統(tǒng)適合于單個(gè)條目,即信息量不大而需要經(jīng)常適合于單個(gè)條目,即信息量不大而需要經(jīng)常修改的情況。修改的情況。適合于信息條目本身信息量較大而不常修改適合于

2、信息條目本身信息量較大而不常修改的情況。的情況。第二節(jié) 上機(jī)提問檢索式 檢索檢索表達(dá)式表達(dá)式是計(jì)算機(jī)檢索中用來表達(dá)用戶檢索提問的一種邏輯運(yùn)算式。是計(jì)算機(jī)檢索中用來表達(dá)用戶檢索提問的一種邏輯運(yùn)算式。 檢索檢索提問式提問式就是采用計(jì)算機(jī)信息檢索系統(tǒng)規(guī)定使用的組配符號(hào)(也稱為算符就是采用計(jì)算機(jī)信息檢索系統(tǒng)規(guī)定使用的組配符號(hào)(也稱為算符Operator)Operator),將反映不同檢,將反映不同檢索途徑的檢索單元組合在一起而形成的一種邏輯運(yùn)算表達(dá)式。它以計(jì)算機(jī)系統(tǒng)可以識(shí)別和執(zhí)行的命令形式索途徑的檢索單元組合在一起而形成的一種邏輯運(yùn)算表達(dá)式。它以計(jì)算機(jī)系統(tǒng)可以識(shí)別和執(zhí)行的命令形式將檢索方案表現(xiàn)出來,表

3、述了各個(gè)檢索單元之間的邏輯關(guān)系和位置關(guān)系等。將檢索方案表現(xiàn)出來,表述了各個(gè)檢索單元之間的邏輯關(guān)系和位置關(guān)系等。 它的基本要素如下它的基本要素如下: :1.檢索詞檢索詞2.邏輯算符邏輯算符3.位置算符位置算符4.截詞符截詞符 5.檢索字段符檢索字段符檢索詞(Search Term或Search word):能概括要檢索內(nèi)容的相關(guān)詞匯。檢索詞是表達(dá)信息需求和檢索課題內(nèi)容的基本單元,也是與系統(tǒng)中有關(guān)據(jù)庫進(jìn)行匹配運(yùn)算的基本單元,檢索詞選擇洽當(dāng)與否,直接影響檢索效果。 1、表示主題的檢索詞、表示主題的檢索詞 標(biāo)題詞:指經(jīng)規(guī)范化處理得先組定組式的詞匯。 單元詞:指從信息內(nèi)容中抽出的最基本的詞匯。 敘詞:指

4、從信息的內(nèi)容中抽出的、能概括表達(dá)信息內(nèi)容基本概念的名詞或術(shù)語,它是經(jīng)規(guī)范化處理的自然語言詞匯。 關(guān)鍵詞:指從信息單元的題目、正文或摘要中抽出德能表征信息主體內(nèi)容的具有實(shí)質(zhì)意義的詞語,它是未經(jīng)規(guī)范化處理的自然語言詞匯。 2、表示作者的檢索詞、表示作者的檢索詞。如作者姓名、機(jī)構(gòu)名。 3、表示分類的檢索詞、表示分類的檢索詞。如分類號(hào) 4、表示特殊意義的檢索詞。如、表示特殊意義的檢索詞。如ISBN、ISSN、DOI、引文標(biāo)引詞等。、引文標(biāo)引詞等。第二節(jié) 上機(jī)提問檢索式檢索詞第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符位置算符位置算符截詞符截詞符限值算符限值算符其他字符其他字符 檢索算符檢索算符:是檢索系統(tǒng)規(guī)

5、定的特定符號(hào),作用是把檢索詞連接組配起來,構(gòu)成檢索表達(dá)式,體現(xiàn)檢索策略。檢索系統(tǒng)使用的檢索算符一般有以下幾種: .布爾算符布爾算符:規(guī)定檢索詞之間的邏輯關(guān)系,指定文獻(xiàn)的特定詞中必須存在的條件或不能出現(xiàn)的條件。(1)邏輯與”and”(*)算符:A and B A*B 用來連接具有交叉,限定關(guān)系的概念,以及不同檢索組面上的概念,可增強(qiáng)檢索的專 性詞,縮小檢索范圍。 如:通訊衛(wèi)星 communication * satellite(2)邏輯或 “or” (+)算符:A or B A+B 可用來連接多個(gè)同義詞、近義詞和相關(guān)詞(并列關(guān)系概念),擴(kuò)大檢索范圍。 如:檢索“太陽” 方面的信息 sun OR

6、solar第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符位置算符位置算符截詞符截詞符限值算符限值算符其他字符其他字符(3)邏輯非“NOT” (-)算符: A Not B A-B 用于連接排除關(guān)系的檢索詞,即排除不需要的和影響檢索結(jié)果的概念,增強(qiáng)檢索的準(zhǔn)確性,縮小檢索范圍。 如:檢索“非核能的能源”方面的文獻(xiàn) energy NOT nuclear 三種邏輯運(yùn)算見下圖所示,綠色部分為檢出文獻(xiàn)檢索算符例:1. 要查找有關(guān)“土壤重金屬”方面的文獻(xiàn)2. 土壤和沉積物中的重金屬研究第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符邏輯算符位置算符截詞符截詞符限值算符限值算符其他字符其他字符運(yùn)用在檢索詞間,指定詞與詞間隔的距離

7、或指定先后順序,將概念表達(dá)準(zhǔn)確。常用于固定詞組、分子式、數(shù)學(xué)表達(dá)式中,目前聯(lián)機(jī)檢索系統(tǒng)常采用,不同系統(tǒng)算符不同,含義與作用不同。位置檢索也叫臨近檢索。文獻(xiàn)記錄中詞語的相對(duì)次序或位置不同,所表達(dá)的意思可能不同,而同樣一個(gè)檢索表達(dá)式中詞語的相對(duì)次序不同,其表達(dá)的檢索意圖也不一樣。布爾邏輯運(yùn)算符有時(shí)難以表達(dá)某些檢索課題確切的提問要求。字段限制檢索雖能使檢索結(jié)果在一定程度上進(jìn)一步滿足提問要求,但無法對(duì)檢索詞之間的相對(duì)位置進(jìn)行限制。位置算符檢索是用一些特定的算符(位置算符)來表達(dá)檢索詞與檢索詞之間的臨近關(guān)系,并且可以不依賴主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法。第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符

8、邏輯算符位置算符截詞符截詞符限值算符限值算符其他字符其他字符“(W)”算符“W”含義為“with”。這個(gè)算符表示其兩側(cè)的檢索詞必須緊密相連,除空格和標(biāo)點(diǎn)符號(hào)外,不得插入其他詞或字母,兩詞的詞序不可以顛倒?!埃╓)”算符還可以使用其簡略形式“()”。例如,檢索式為“communication (W) satellite”時(shí),系統(tǒng)只檢索含有“communication satellite”詞組的記錄?!?nw)”算符“(nw)”中的“w”的含義為“word”,表示此算符兩側(cè)的檢索詞必須按此前后鄰接的順序排列,順序不可顛倒,而且檢索詞之間不允許有其他的詞或字母,但允許有空格或連字符號(hào)。例如:last

9、er (1W) print課檢索出包含 “l(fā)aser printer”、“ laster color printer”和“ laster and printer”的記錄。“(N)”算符“(N)”中的“N”的含義為“near”.這個(gè)算符表示其兩側(cè)的檢索詞必須緊密相連,除空格和標(biāo)點(diǎn)符號(hào)外,不得插入其他詞或字母,兩詞的詞序可以顛倒。第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符邏輯算符位置算符截詞符截詞符限值算符限值算符其他字符其他字符“(nN)”算符“(nN)”表示允許兩詞間插入最多為n個(gè)其他詞,包括實(shí)詞和系統(tǒng)禁用詞。economic(2n)recovery:economic recovery, reco

10、very of the economy, recovery from economic troubles“(F)”算符“(F)”中的“F”的含義為“field”。這個(gè)算符表示其兩側(cè)的檢索詞必須在同一字段(例如同在題目字段或文摘字段)中出現(xiàn),詞序不限,中間可插任意檢索詞項(xiàng)?!埃⊿)”算符“(S)”中的“S”算符是“Sub-field/sentence”的縮寫,表示在此運(yùn)算符兩側(cè)的檢索詞只要出現(xiàn)在記錄的同一個(gè)子字段內(nèi)(例如,在文摘中的一個(gè)句子就是一個(gè)子字段),此信息即被命中。要求被連接的檢索詞必須同時(shí)出現(xiàn)在記錄的同一句子(同一子字段)中,不限制它們?cè)诖俗幼侄沃械南鄬?duì)次序,中間插入詞的數(shù)量也不限。例

11、如“high (W) strengh (S) steel”表示只要在同一句子中檢索出含有“high strengh 和steel”形式的均為命中記錄。 第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符邏輯算符位置算符位置算符截詞符限值算符限值算符其他字符其他字符在檢索詞中保留相同的部分,用相應(yīng)的算符(如:“?”)替代可變部分,并以此代表許多檢索用詞。可擴(kuò)大檢索范圍,即利用詞干、不完整詞進(jìn)行檢索。以“?”作截詞符。(1)無限截詞:截詞符“?”,用在詞干后,詞干后可跟任何個(gè)字母。如:transformer?(變壓器):transformer; transformers; transformer pulse(

12、脈沖式變壓器) ;transformer oil(變壓器油); transformer steel(變壓器用鋼);可表示年份:PY=198?表示查找1980-1989年間的文獻(xiàn)。表示作者姓名:AU=Green,?(姓名為Green的任何人) AU=Green?(以Green為詞干的所有姓的人)小數(shù)點(diǎn)后不能用截詞符限制進(jìn)行連續(xù)數(shù)字檢索:如25.025.9:不能用BP=25.?而應(yīng)使用BP=25.0:25.9(bp:boiling point 浮點(diǎn))第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符邏輯算符位置算符位置算符截詞符限值算符限值算符其他字符其他字符 (2)嵌入式截詞(中間式截詞):在詞中允許變化的

13、字母處用?號(hào)替代,常用于英美兩國拼法的差異.如:fib?broad fiberbroad, fibrebroud (纖維板纖維板)organi?ation organization, organization注意:使用截詞算符時(shí),截詞要適當(dāng),不宜將詞干截得過短,否則會(huì)造成大量誤檢,檢出許多詞性、詞義都改變的詞;中間變化字母數(shù)不同的不能中間截詞:如:color 與colour, Sulfur 與Sulphur 可用邏輯或算符解決:color Or colour sulfur or sulphur 第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符邏輯算符位置算符位置算符截詞符截詞符限值算符其他字符其他字符限

14、定檢索詞在數(shù)據(jù)庫中出現(xiàn)的字段范圍,對(duì)太多的命中記錄再行篩選。基本字段:題名TI 敘詞DE 文摘AB 關(guān)鍵詞 ID輔助字段:著者題名AU 機(jī)構(gòu)名CS 出版時(shí)間PY 語種LA 期刊名JN 如:查找由Gordon 所寫,1990年后發(fā)表的所有文獻(xiàn) AU=Gordon?and PY=199? 第二節(jié) 上機(jī)提問檢索式檢索算符邏輯算符邏輯算符位置算符位置算符截詞符截詞符限值算符限值算符其他字符禁用詞(Stop Word):聯(lián)機(jī)檢索系統(tǒng)通常都規(guī)定一些虛詞在檢索時(shí)不得使用,即不能作為檢索詞,遇到這種詞,可用位置算符將其避開或系統(tǒng)允許詞組(短語)檢索時(shí),作為詞組完整輸入。如:查“亂世佳人”(Gone with

15、the wind) Dialog 系統(tǒng)規(guī)定:An, For, The, And, From, To, By, of, with九個(gè)詞為禁用詞,則檢索式有兩種:用位置算符:Gone(2w)wind 詞組檢索“Gone with the wind”/T1第三節(jié) 檢索策略計(jì)算機(jī)檢索策略計(jì)算機(jī)檢索策略就是在分析檢索課題需求的基礎(chǔ)上明確檢索范就是在分析檢索課題需求的基礎(chǔ)上明確檢索范圍,選擇檢索途徑,確定檢索詞和檢索式的邏輯組配方法,通過圍,選擇檢索途徑,確定檢索詞和檢索式的邏輯組配方法,通過試檢或反饋進(jìn)行調(diào)整,使檢索結(jié)果體現(xiàn)用戶目標(biāo)的整個(gè)計(jì)劃過程。試檢或反饋進(jìn)行調(diào)整,使檢索結(jié)果體現(xiàn)用戶目標(biāo)的整個(gè)計(jì)劃過程

16、。 編制檢索策略的過程第三節(jié) 檢索策略1分析課題,明確目的檢索過程中的首要環(huán)節(jié),就是要明確課題需求,第一步如果搞錯(cuò)了,就談不上最后檢索結(jié)果的正確性。 由于用戶對(duì)自己的需求,特別是潛在的、模糊的需求并不總是非常明確,因此檢索時(shí)需要進(jìn)行分析,以求得一個(gè)完整而明確的表達(dá)。TIPS:關(guān)鍵詞:關(guān)鍵詞(1)分析課題檢索的目的 通常有幾種類型: 1) 開始某一項(xiàng)科學(xué)研究或承接某項(xiàng)工程設(shè)計(jì),需要對(duì)課題進(jìn)行開始某一項(xiàng)科學(xué)研究或承接某項(xiàng)工程設(shè)計(jì),需要對(duì)課題進(jìn)行全面的文獻(xiàn)普查,并從中篩選出所需的資料,用以編寫可行性報(bào)全面的文獻(xiàn)普查,并從中篩選出所需的資料,用以編寫可行性報(bào)告、計(jì)劃任務(wù)書等。告、計(jì)劃任務(wù)書等。 對(duì)這樣

17、的課題,應(yīng)選擇一個(gè)年限比較長的,收錄比較廣泛的相關(guān)專業(yè)的二次文獻(xiàn)數(shù)據(jù)庫,在全面回溯檢索的基礎(chǔ)上,選出相關(guān)的文獻(xiàn),再獲取一次文獻(xiàn)。 2) 為解決某個(gè)技術(shù)難題,查找關(guān)鍵性的技術(shù)資料。為解決某個(gè)技術(shù)難題,查找關(guān)鍵性的技術(shù)資料。 對(duì)這樣的課題,應(yīng)選擇工程和技術(shù)類數(shù)據(jù)庫或?qū)@麛?shù)據(jù)庫。 3) 為貿(mào)易與技術(shù)引進(jìn)、合資談判,了解國外市場(chǎng)、產(chǎn)品為貿(mào)易與技術(shù)引進(jìn)、合資談判,了解國外市場(chǎng)、產(chǎn)品與公司的行情。與公司的行情。 查找科學(xué)數(shù)據(jù)庫以了解技術(shù)的先進(jìn)性,查找市場(chǎng)、產(chǎn)品、公司等商情數(shù)據(jù)庫以對(duì)手的情況。 4) 為申報(bào)專利或鑒定成果,查找參考依據(jù)。為申報(bào)專利或鑒定成果,查找參考依據(jù)。 以選擇國內(nèi)外專利數(shù)據(jù)庫為主。 5)

18、 為某項(xiàng)決策查找有關(guān)情報(bào)。為某項(xiàng)決策查找有關(guān)情報(bào)。 根據(jù)決策的不同性質(zhì),進(jìn)行綜合性的全面文獻(xiàn)調(diào)研,涉及到科學(xué)研究、技術(shù)研究、產(chǎn)品、市場(chǎng)等最新發(fā)展動(dòng)態(tài)。 6) 為撰寫論文查找相關(guān)文獻(xiàn)等。為撰寫論文查找相關(guān)文獻(xiàn)等。 以期刊論文、學(xué)位論文等學(xué)術(shù)研究性的數(shù)據(jù)庫為主。 (2)明確題所涉及的學(xué)科范圍和專業(yè)面 明確課題所涉及的主要學(xué)科范圍、相關(guān)學(xué)科范圍、交叉學(xué)科范圍,并根據(jù)數(shù)據(jù)庫的主題收錄范圍進(jìn)行選擇。 分析檢索課題的基本方法與技巧:分析檢索課題的基本方法與技巧:(1) 分析檢索課題的內(nèi)容實(shí)質(zhì)必須準(zhǔn)確充分地表達(dá)檢索課題所需的實(shí)質(zhì)性內(nèi)容,如果表示的概念過大,必須準(zhǔn)確充分地表達(dá)檢索課題所需的實(shí)質(zhì)性內(nèi)容,如果表示

19、的概念過大,必然造成大量誤檢;而表達(dá)的概念過小,則會(huì)發(fā)生大量漏檢。必然造成大量誤檢;而表達(dá)的概念過小,則會(huì)發(fā)生大量漏檢。例如,查找例如,查找“從鍍鋅殘?jiān)谢厥珍\從鍍鋅殘?jiān)谢厥珍\”方面的文獻(xiàn)方面的文獻(xiàn)通過分析研究,檢索人員了解到該課題實(shí)質(zhì)上是要查找一種采用從高品位鍍鋅殘?jiān)蟹蛛x鐵的方式來回收鋅的工藝技術(shù)。于是,檢索者抓住了課題內(nèi)容的實(shí)質(zhì)后,將檢索課題修改為“從鋅塊中分離鐵”,從而獲得較滿意的檢索結(jié)果。如果按原題檢索,由于概念太大,必然會(huì)造成大量誤檢。(2) 找出隱性的主題概念并將抽象的主題概念轉(zhuǎn)化成具體的概念如:如:“城市生活垃圾的處理城市生活垃圾的處理”:處理一詞在這包含了具體的處理方:處理

20、一詞在這包含了具體的處理方式:回收、再生等式:回收、再生等 “大型機(jī)械電子滲漏儀”此課題中,電子一詞在該專業(yè)是用傳感器(sensor,transducer,load_cell)等來表示()找出核心概念,排除無關(guān)概念和重復(fù)概念,簡化邏輯關(guān)系主題分析與概念組面選取的一條原則是:應(yīng)在保證能準(zhǔn)確表達(dá)課題內(nèi)容的主題分析與概念組面選取的一條原則是:應(yīng)在保證能準(zhǔn)確表達(dá)課題內(nèi)容的前提下,盡可能地簡化邏輯關(guān)系,減少概念組面數(shù),以提高檢索效果。前提下,盡可能地簡化邏輯關(guān)系,減少概念組面數(shù),以提高檢索效果。例如例如“化妝品輻射滅菌化妝品輻射滅菌”課題課題該課題只有兩個(gè)概念組面即:化妝品、輻射該課題只有兩個(gè)概念組面即

21、:化妝品、輻射注意:注意:排除課題中那些檢索意義不大而且比較泛指的概念詞排除課題中那些檢索意義不大而且比較泛指的概念詞,如,如“展望展望”、“發(fā)展趨勢(shì)發(fā)展趨勢(shì)”、“現(xiàn)狀現(xiàn)狀”、“近況近況”、“生產(chǎn)生產(chǎn)”、“工藝工藝”、“應(yīng)用應(yīng)用”、“作用作用”、“方法方法”、“影響影響”、“效率效率”、“制造制造”、“結(jié)果結(jié)果”等等。等等。例如:例如:“干洗劑的近況及其使用干洗劑的近況及其使用”課題課題其核心概念是干洗劑其核心概念是干洗劑(4) 明確概念之間的邏輯關(guān)系分析出單元概念后,還要搞清它們之間的邏輯關(guān)系,將同一關(guān)系的概念集分析出單元概念后,還要搞清它們之間的邏輯關(guān)系,將同一關(guān)系的概念集合起來作為一個(gè)概

22、念組面,各個(gè)概念組面之間是交叉關(guān)系,即不同概念組面合起來作為一個(gè)概念組面,各個(gè)概念組面之間是交叉關(guān)系,即不同概念組面之間是邏輯乘的關(guān)系,而相同概念組面之間為邏輯加的關(guān)系。之間是邏輯乘的關(guān)系,而相同概念組面之間為邏輯加的關(guān)系。2、選擇檢索系統(tǒng)和數(shù)據(jù)庫應(yīng)根據(jù)課題分析結(jié)果、信息需求的各項(xiàng)要求,綜合考慮檢索系統(tǒng)的特點(diǎn)、應(yīng)根據(jù)課題分析結(jié)果、信息需求的各項(xiàng)要求,綜合考慮檢索系統(tǒng)的特點(diǎn)、學(xué)科范圍、文獻(xiàn)類型、數(shù)據(jù)庫的專業(yè)范圍、存儲(chǔ)年限、檢索費(fèi)用、使用方法學(xué)科范圍、文獻(xiàn)類型、數(shù)據(jù)庫的專業(yè)范圍、存儲(chǔ)年限、檢索費(fèi)用、使用方法以及現(xiàn)有的檢索系統(tǒng)和數(shù)據(jù)庫資源,選用合適的檢索系統(tǒng)和數(shù)據(jù)庫。以及現(xiàn)有的檢索系統(tǒng)和數(shù)據(jù)庫資源,

23、選用合適的檢索系統(tǒng)和數(shù)據(jù)庫。 3、確定檢索詞及檢索途徑檢索詞檢索詞(或檢索項(xiàng)或檢索項(xiàng))是構(gòu)成檢索式的基本單元,是文獻(xiàn)記錄中的文獻(xiàn)特征標(biāo)識(shí),可以是構(gòu)成檢索式的基本單元,是文獻(xiàn)記錄中的文獻(xiàn)特征標(biāo)識(shí),可以說反映文獻(xiàn)內(nèi)容特征的主題詞、自由詞等。也可以是反映文獻(xiàn)外表特征的作者、說反映文獻(xiàn)內(nèi)容特征的主題詞、自由詞等。也可以是反映文獻(xiàn)外表特征的作者、篇名等。篇名等。檢索途徑即檢索入口,計(jì)算機(jī)檢索系統(tǒng)的檢索途徑也可分為反映文獻(xiàn)信息內(nèi)容特征檢索途徑即檢索入口,計(jì)算機(jī)檢索系統(tǒng)的檢索途徑也可分為反映文獻(xiàn)信息內(nèi)容特征和反映文獻(xiàn)信息外部特征的兩類檢索途徑。和反映文獻(xiàn)信息外部特征的兩類檢索途徑。選擇索途徑是與確定檢索詞相

24、對(duì)應(yīng)的,確定了檢索詞也就意味著選擇檢索途徑。選擇索途徑是與確定檢索詞相對(duì)應(yīng)的,確定了檢索詞也就意味著選擇檢索途徑。4、制定提問檢索式檢索式是檢索策略的具體表述,是通過邏輯算符、位置算符、截詞算符等檢索式是檢索策略的具體表述,是通過邏輯算符、位置算符、截詞算符等把表達(dá)主題概念的各檢索單元組配連接起來既能表達(dá)主題內(nèi)容,又能為機(jī)器把表達(dá)主題概念的各檢索單元組配連接起來既能表達(dá)主題內(nèi)容,又能為機(jī)器識(shí)別和執(zhí)行的命令形式,也是決定檢索策略的質(zhì)量和檢索效果的重要因素。識(shí)別和執(zhí)行的命令形式,也是決定檢索策略的質(zhì)量和檢索效果的重要因素。制定檢索式可以分為以下幾個(gè)步驟。 (1)選擇合適的檢索用詞: 對(duì)于分析出來的

25、每個(gè)概念組面,用具體的檢索用詞來表示,如學(xué)?;顒?dòng)這個(gè)概念可以用具體的班級(jí)活動(dòng)、課外活動(dòng)、學(xué)生活動(dòng)等檢索詞來表示。一個(gè)概念可能有許多同義詞、近義詞,如果在規(guī)范化詞表中找不到規(guī)范敘詞來統(tǒng)一這些詞的話,就必須考慮各種形式的同義自由詞,以防漏檢許多文獻(xiàn)。(2)選擇合適的位置算符對(duì)于每一個(gè)概念組面選擇出來的檢索詞,為表達(dá)位置關(guān)系,可根據(jù)各系統(tǒng)的規(guī)定,使用位置算符,如,Wn、 W/n等。不同系統(tǒng)的位置算符,詞間的位置關(guān)系不同,得到檢索結(jié)果也不同,需要注意。同時(shí)不同的位置算符決定檢索的寬泛程度。檢索詞的位置關(guān)系一般根據(jù)用戶的專業(yè)知識(shí)或文獻(xiàn)中常見的這種詞的位置關(guān)系來確定。但如果資料見得較少,可以參考先檢索到的

26、一部分文獻(xiàn),再進(jìn)行策略調(diào)整和修改。(3)擬定合理的檢索式檢索式是上述各步驟和各種檢索技術(shù)的綜合體現(xiàn),是檢索策略的表達(dá)形式。檢索式編制得好壞直接關(guān)系到檢索的最終結(jié)果。 制定提問檢索式實(shí)例分析例例1、檢索、檢索“計(jì)算機(jī)容錯(cuò)技術(shù)計(jì)算機(jī)容錯(cuò)技術(shù)”方面的資料方面的資料 檢索詞:計(jì)算機(jī)檢索詞:計(jì)算機(jī) computer; computing 軟件軟件 software 容錯(cuò)技術(shù)容錯(cuò)技術(shù) fault tolerance 檢索表達(dá)式:檢索表達(dá)式: (計(jì)算機(jī)計(jì)算機(jī) +軟件軟件) 容錯(cuò)容錯(cuò) fault ( ) tolerance * (computer + computing +software)制定提問檢索式實(shí)例

27、分析例、查找有關(guān)例、查找有關(guān)“齒輪齒形的計(jì)算機(jī)輔助設(shè)計(jì)與分析齒輪齒形的計(jì)算機(jī)輔助設(shè)計(jì)與分析”方面的資料。方面的資料。 檢索詞:齒輪檢索詞:齒輪 :gear 齒形齒形: tooth geometry 計(jì)算機(jī)輔助設(shè)計(jì)計(jì)算機(jī)輔助設(shè)計(jì): CAD ;computer aided design 計(jì)算機(jī)輔助分析計(jì)算機(jī)輔助分析:CAA;computer aided analysis檢索表達(dá)式:檢索表達(dá)式: 齒輪齒輪 齒形齒形 (計(jì)算機(jī)輔助設(shè)計(jì)計(jì)算機(jī)輔助設(shè)計(jì) 計(jì)算機(jī)輔助分析計(jì)算機(jī)輔助分析 CAD CAA)tooth?( )geometry (s) gear * (CAD + CAA + computer ( )

28、 aided ( ) (design + analysis)制定提問檢索式實(shí)例分析 例、檢索:例、檢索:“殘疾人用人造臂殘疾人用人造臂”資料(機(jī)械控制的不要)資料(機(jī)械控制的不要)檢索詞:檢索詞:手臂:手臂:artificial_arm;fore-arm, upper-arm假肢:假肢: prosthese, prosthetics 機(jī)械:機(jī)械:mechanically 檢索式:檢索式:假肢手臂機(jī)械假肢手臂機(jī)械1 .(prosthetics OR prostheses)AND (artificial-arm OR fore-arm OR upper-arm)NOT mechanically2.

29、(prosthe? AND (artificial OR fore OR Upper)(w)arm?) NOT mechanical?制定提問檢索式實(shí)例分析 例例4、檢索有關(guān)、檢索有關(guān)“計(jì)算機(jī)數(shù)控機(jī)床計(jì)算機(jī)數(shù)控機(jī)床”方面的文獻(xiàn)方面的文獻(xiàn) 檢索詞:檢索詞: 計(jì)算機(jī)數(shù)據(jù)控制計(jì)算機(jī)數(shù)據(jù)控制 CNC; computernumericalcontrol 機(jī)床機(jī)床 lathe;turningmachine 檢索式檢索式: 計(jì)算機(jī)數(shù)據(jù)控制機(jī)床計(jì)算機(jī)數(shù)據(jù)控制機(jī)床 (CNC+ computer()numerical()control)(lathe? +turning()machine?)制定提問檢索式實(shí)例分析

30、例例5、檢索、檢索“汽車制造廠的計(jì)算機(jī)集成生產(chǎn)系統(tǒng)汽車制造廠的計(jì)算機(jī)集成生產(chǎn)系統(tǒng)” 檢索詞:檢索詞: 計(jì)算機(jī)集成生產(chǎn)系統(tǒng)計(jì)算機(jī)集成生產(chǎn)系統(tǒng):computer integrated Manufacturing; computer integrated production;CIM 汽車汽車:car; autobus; autocar; autotruck; automobile等及其復(fù)數(shù)形式等及其復(fù)數(shù)形式 檢索式檢索式:計(jì)算機(jī)集成生產(chǎn)系統(tǒng)計(jì)算機(jī)集成生產(chǎn)系統(tǒng)*汽車汽車 (CIM + computer()integrated()Manufacturingcomputer()integrated()p

31、roduction) ( car?+ auto?+ autotruck?+ automobile?)制定提問檢索式實(shí)例分析例例6、“用個(gè)人計(jì)算機(jī)進(jìn)行傳熱和傳質(zhì)的模擬用個(gè)人計(jì)算機(jī)進(jìn)行傳熱和傳質(zhì)的模擬”檢索詞:檢索詞: 傳熱:傳熱:heattransfer傳質(zhì):傳質(zhì): mass transfer 模擬:模擬:simulation 微機(jī);個(gè)人計(jì)算機(jī):微機(jī);個(gè)人計(jì)算機(jī):PC, personal computer檢索式檢索式:(傳熱傳熱+傳質(zhì)傳質(zhì))*模擬模擬*(PC+個(gè)人計(jì)算機(jī)個(gè)人計(jì)算機(jī)+微機(jī))微機(jī)) (heat+mass)(w)transfer*simulation*(PC+personal (w)c

32、omputer)制定提問檢索式小結(jié) 在編制中,應(yīng)注意以下幾點(diǎn):在編制中,應(yīng)注意以下幾點(diǎn): 第一,要仔細(xì)斟酌檢索詞,使之能準(zhǔn)確地反映提問的主題內(nèi)容。選第一,要仔細(xì)斟酌檢索詞,使之能準(zhǔn)確地反映提問的主題內(nèi)容。選詞太專指,則無法命中相應(yīng)的記錄,查全率低;太泛指則不能準(zhǔn)確詞太專指,則無法命中相應(yīng)的記錄,查全率低;太泛指則不能準(zhǔn)確地表達(dá)提問的實(shí)質(zhì),查準(zhǔn)率低。地表達(dá)提問的實(shí)質(zhì),查準(zhǔn)率低。 第二,根據(jù)檢索詞之間的邏輯關(guān)系和詞之間關(guān)系,用適當(dāng)?shù)倪\(yùn)算符第二,根據(jù)檢索詞之間的邏輯關(guān)系和詞之間關(guān)系,用適當(dāng)?shù)倪\(yùn)算符把檢索詞連接組配起來。同義詞、近義詞為等同關(guān)系把檢索詞連接組配起來。同義詞、近義詞為等同關(guān)系,用用OR連

33、接連接;不不同組面關(guān)系同組面關(guān)系,用用AND連接。連接。制定提問檢索式小結(jié) 第三,要了解所查數(shù)據(jù)庫的索引體系和檢索用詞規(guī)則。第三,要了解所查數(shù)據(jù)庫的索引體系和檢索用詞規(guī)則。 第四,要符合檢索系統(tǒng)的功能及限制條件的規(guī)定。注意數(shù)第四,要符合檢索系統(tǒng)的功能及限制條件的規(guī)定。注意數(shù)據(jù)庫索引中的詞是如何標(biāo)引的,是詞索引(據(jù)庫索引中的詞是如何標(biāo)引的,是詞索引(WORD)還是)還是短語索引(短語索引(PHRASE)?)?制定提問檢索式小結(jié) 第五,要注意概念的分析。算符使用正確但不能達(dá)到應(yīng)有檢索效果第五,要注意概念的分析。算符使用正確但不能達(dá)到應(yīng)有檢索效果的例子很多。的例子很多。 例如,一個(gè)查找歐洲投資流向的

34、題目,在列出檢索詞時(shí)就存在整體例如,一個(gè)查找歐洲投資流向的題目,在列出檢索詞時(shí)就存在整體與部分的關(guān)系,如果用與部分的關(guān)系,如果用EUROPE AND INVESTMENTS去檢索,就會(huì)有去檢索,就會(huì)有大量文獻(xiàn)漏檢,原因在于大量文獻(xiàn)漏檢,原因在于“歐洲歐洲”指一個(gè)整體地理概念,無法代表通指一個(gè)整體地理概念,無法代表通常意義上的英、法等各發(fā)達(dá)國家,而后者往其他國家和地區(qū)投資的常意義上的英、法等各發(fā)達(dá)國家,而后者往其他國家和地區(qū)投資的情況正是我們所需要的。因此,檢索時(shí)應(yīng)用:(情況正是我們所需要的。因此,檢索時(shí)應(yīng)用:(EUROPE OR BRTAIN OR FRANCE OR ITALY OR SPA

35、IN OR)AND INVESTMENTS。5、調(diào)整檢索策略 一、檢索式的制定常常不是一蹴而就的,需要在檢索的過程中根據(jù)一、檢索式的制定常常不是一蹴而就的,需要在檢索的過程中根據(jù)檢索的結(jié)果不斷進(jìn)行修正,以達(dá)到較好的檢索效果。檢索的結(jié)果不斷進(jìn)行修正,以達(dá)到較好的檢索效果。A.檢出的結(jié)果記錄過多:檢出的結(jié)果記錄過多:原因:檢索詞有多義詞現(xiàn)象原因:檢索詞有多義詞現(xiàn)象 某些檢索詞與人名、地名、刊名雷某些檢索詞與人名、地名、刊名雷同同 截詞時(shí)詞干留得太短截詞時(shí)詞干留得太短 無關(guān)概念沒有排除無關(guān)概念沒有排除 括號(hào)位置用得括號(hào)位置用得不當(dāng)不當(dāng) 檢索詞太少檢索詞太少所選的概念范疇太大原來限制較寬松所選的概念范

36、疇太大原來限制較寬松調(diào)整方法:換用表達(dá)準(zhǔn)確的單義詞調(diào)整方法:換用表達(dá)準(zhǔn)確的單義詞 增加相關(guān)概念,用增加相關(guān)概念,用“與與(And)”連接連接 考慮采用字段限制、位置算符考慮采用字段限制、位置算符 使用使用“非(非(NOT)”排除不相關(guān)概念排除不相關(guān)概念 調(diào)整括號(hào)的位置調(diào)整括號(hào)的位置5、調(diào)整檢索策略 B.檢出的命中記錄過少或?yàn)榱悖簷z出的命中記錄過少或?yàn)榱悖涸颍哼x用了不規(guī)范的主題詞或產(chǎn)品的俗稱、商品名原因:選用了不規(guī)范的主題詞或產(chǎn)品的俗稱、商品名 漏掉有關(guān)漏掉有關(guān)的同義詞的同義詞 上下級(jí)概念詞漏掉上下級(jí)概念詞漏掉 限制條件太多、太嚴(yán)格限制條件太多、太嚴(yán)格 拼寫、拼寫、輸入有誤輸入有誤 數(shù)據(jù)庫不合適數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論