第三章 文獻檢索技巧_第1頁
第三章 文獻檢索技巧_第2頁
第三章 文獻檢索技巧_第3頁
第三章 文獻檢索技巧_第4頁
第三章 文獻檢索技巧_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章文獻檢索技巧

覃雪

qinxue@

第一節(jié)文獻檢索的基本概念

第二節(jié)檢索技術(shù)

第三節(jié)文獻檢索流程

第一節(jié)文獻檢索的基本概念1.定義

文獻檢索是指從眾多的文獻中通過檢索工具或檢索系統(tǒng),迅速、準確地查找出與用戶提問有關(guān)的文獻信息線索的行為、方法和過程。文獻檢索組織與存儲檢索組織與存儲:是對數(shù)據(jù)進行標引的過程。對信息進行著錄、標引、整序,編制檢索工具和建立檢索系統(tǒng)的過程。檢索:是指面向信息需求而進行高度選擇性的查找過程。2.基本原理檢索過程實際上是比較、匹配(match)的過程,檢索提問只要與數(shù)據(jù)庫中的信息特征標識及其邏輯組配關(guān)系相一致,則“命中”,即找到了符合要求的信息。第二節(jié)檢索技術(shù)(一)布爾邏輯算符1.邏輯“與”(and或*):是指兩個概念的交集。AandB或A*B表示檢出同時含有A、B兩個檢索詞的記錄。邏輯“與”檢索增強檢索的專指性,縮小檢索范圍。I.FindAandBandC

2.邏輯“或”(or或+):是指兩個概念的并集。AorB或A+B表示檢出所有含有A詞或者B詞的記錄。邏輯“或”檢索擴大了檢索范圍,提高查全率。此運算符適于連接有同義關(guān)系或相關(guān)關(guān)系的詞。II.FindAorBorC

3.邏輯“非”(not或—):表示從兩個概念中除去交叉的部分。AnotB或A-B表示檢出含有A詞,但同時不含有B詞的記錄。邏輯“非”可以縮小檢索范圍,增強檢索的準確性。此運算符用于排除那些含有某個特定檢索詞的記錄,但如果使用不當將會排除有用文獻,從而導(dǎo)致漏檢,應(yīng)慎用。III.FindAorBnotC

使用邏輯算符時應(yīng)注意的事項:1.三種算符可同時在一個檢索式中使用,也可單獨使用。

2.邏輯算符的優(yōu)先級為:NOT>AND>OR3.在邏輯組配時,算符的兩側(cè)必須各留有一個空格。優(yōu)先算符優(yōu)先算符用()表示,在含有多個運算的檢索式中,可以用()將需要優(yōu)先運算的部分括上,系統(tǒng)會優(yōu)先運算()中的部分,然后在按照not,and,or的順序進行運算。如:(behaviourorbehavior)andhuman※邏輯算符的優(yōu)先級為()>NOT>AND>OR(二)截詞算符截詞,是指在檢索詞的適當位置截斷。截詞檢索就是用截斷的詞的一個局部進行的檢索,并認為凡滿足這個詞局部中的所有字符(串)的文獻,都為命中的文獻。截詞檢索是一種提高查全率,防止漏檢的檢索技術(shù),尤其在英文檢索中被廣泛使用。常用的截詞符號(即截詞符,也稱通配符)有:“*”表示截斷無限個字符,即無限截斷;

“?”表示截斷一個字符,即有限截斷。英美拼法:behavi*r檢出behaviour、behavior單復(fù)數(shù)形式:wom?n檢出woman、women詞根相同:comput*檢出compute、computed、computing、

computer、computers、computerize…按截詞的位置分:(1)后截斷。截去某個詞的后部,前方一致。最常用。如:child*能檢出child,children,children’s

(2)前截斷。截去某個詞的前部,后方一致。如:*computer能檢出minicomputer,microcomputer

(3)中間截斷。截取某個詞的中間部分,兩邊一致。如:organi??tion能檢出organization,organisation※注意:截詞符要緊接在詞干后面,截詞符和詞干之間不能有空格!!apple: ap*le ap?le 正確

ap_*_le ap_?_le 錯誤(三)位置算符

為了提高檢索的廣度和準確度,常常需要對檢索詞之間的位置關(guān)系加以限定。位置算符可限定算符兩邊的檢索詞出現(xiàn)在記錄中的位置,用以檢索出含有檢索詞且檢索詞之間的位置也符合特定要求的記錄。control(W)system只可檢出

controlsystem1.with:A(W)B

表示其兩側(cè)的檢索詞必須按前后順序出現(xiàn)在記錄中,不能顛倒,且兩詞之間不允許插入其他詞,只可能有一個空格、標點或連接號。其擴展為(nW),n=1~9,表示其兩側(cè)的檢索詞之間最多可插入n個詞,但位置不能顛倒。例如:“l(fā)ight(4W)rail”表示light與rail之間最多可插入4個詞,

但位置不能顛倒。2.near:A(N)B表示其兩側(cè)的檢索詞前后位置可以顛倒,在兩詞之間不允許插入其他詞,只可能有一個空格、標點或連接號。

其擴展為(nN),表示其兩側(cè)的檢索詞之間最多可插入n個詞,位置可顛倒。例如:“computer(N)network”,其檢中記錄可包含

“computernetwork”或“networkcomputer”。3.字段級位置算符表示兩側(cè)的檢索詞必須出現(xiàn)在同一字段中,詞序不限。

不同系統(tǒng)使用的符號各不相同。Field:“air(F)pollution”表示air與pollution必須在同一個段落中出現(xiàn)Same:“Ad=(CASsameShenzhen)”表示CAS與Shenzhen必須同時

出現(xiàn)在地址字段中(四)其他檢索技術(shù):字段限定:指將檢索詞限定在某個或某些字段中。可通過下拉菜

單選擇檢索字段,也可輸入檢索字段符來限定檢索字段。

例如:AU=Smith,表示要查找著者Smith發(fā)表的文獻。詞組檢索:使用“”雙引號將檢索詞組鎖定,進行精確查找。匹配度選擇:“精確匹配”與“模糊匹配”第三節(jié)文獻檢索流程文獻檢索分析檢索課題選擇檢索工具上機檢索并調(diào)整檢索策略構(gòu)建檢索提問式確定檢索詞輸出檢索結(jié)果1.分析檢索課題分析檢索課題,明確信息需求??梢詮囊韵聨讉€方面進行:(1)檢索內(nèi)容的確定:分析課題的主題內(nèi)容、所屬學科性質(zhì)(2)檢索范圍的確定:包括文獻類型、時間范圍、語種等。(3)充分利用已有文獻:可以利用相關(guān)文獻后面所附的參考文獻進行“滾雪球式”的檢索。2.選擇檢索工具應(yīng)該從以下幾個方面考慮:(1)數(shù)據(jù)庫收錄的信息內(nèi)容所涉及的學科范圍:綜合內(nèi)容數(shù)據(jù)庫,專業(yè)內(nèi)容數(shù)據(jù)庫(2)數(shù)據(jù)庫收錄的文獻類型、語種:中、外文期刊數(shù)據(jù)庫、專利文獻/標準文獻/會議文獻/學位論文數(shù)據(jù)庫(3)數(shù)據(jù)庫所提供的檢索途徑、檢索功能和服務(wù)方法3.確定檢索詞(1)提取有關(guān)課題實質(zhì)內(nèi)容的關(guān)鍵詞。

——通常從課題的主要概念,即課題名稱、采用的具體技術(shù)或方法、新穎性中提取。(2)選用意義明確的詞語,少用概念泛而檢索意義不大的詞?!呗?、性能、研究、技術(shù)、高效、先進……(×)(3)盡量使用規(guī)范化的表述?!x各學科的專用術(shù)語、規(guī)范用語。(4)避免使用過長的詞組和短語。(5)同義詞、近義詞、縮略詞。(6)英文檢索詞中的禁用詞:包括介詞、冠詞、代詞、連接詞、某些形容詞或副詞等。AN、AND、BY、FOR、FROM、OF、TO、THE、WITH

3.確定檢索詞檢索詞選擇技巧Ⅰ:排除重復(fù)概念例:項目“河豚毒素的液相色譜分析”從該項目名稱上看,其主要概念為“河豚毒素”、“液相色譜”和“分析”,

但由于液相色譜本身就是一種分析方法,它隱含了“分析”這一概念?!饕拍睿汉与喽舅亍⒁合嗌V

檢索詞的選擇技巧Ⅱ:找出隱含概念例:項目“唐山綜合防災(zāi)研究”唐山:由于唐山是一個城市,該項目實際為“城市綜合防災(zāi)的研究”災(zāi)害:地震、洪水、火災(zāi)研究:決策支持系統(tǒng)、專家系統(tǒng)

所采用的研究手段是決策支持系統(tǒng)和專家系統(tǒng)。

——主要概念:城市、地震、洪水、火災(zāi)、決策支持系統(tǒng)、專家系統(tǒng) 英文檢索詞的獲取收集中文文獻中的英文關(guān)鍵詞寫法; CNKI翻譯助手/試查相關(guān)英文數(shù)據(jù)庫,擴展、變更檢索詞。例:TiO2納米復(fù)合材料的制備與合成的研究TiO2nanometernanoparticlenanofilmcompositecompositespreparepreparationsynthesizesynthesissyntheses

4.構(gòu)建檢索提問式檢索式檢索詞連接組配符號=+邏輯運算符(logicaloperator)通配符(wildcardcharacter)、截詞算符優(yōu)先算符(priorityoperator)位置算符(proximityoperator)英文檢索式位置算符:限定檢索詞之間的位置關(guān)系,以提高檢索的廣度和準確度。每個數(shù)據(jù)庫對應(yīng)不同的位置算符,以SCI、EI為例,其位置算符是NEAR/x。NEAR/x可查找由該運算符連接的檢索詞之間相隔指定數(shù)量的單詞的記錄。用數(shù)字取代x可指定將檢索詞分開的最大單詞數(shù)。只使用NEAR而不使用/x,系統(tǒng)將查找檢索詞彼此相隔不到15個單詞的記錄。NEAR連接的檢索詞可以顛倒順序。例如:intelligent(near/0)robotintelligentrobot/robotintelligenteconomic(near/2)recoveryeconomicrecovery/recoveryoftheeconomic/ recoveryfromeconomictroubles

4.構(gòu)建檢索提問式(1)使用邏輯“或”運算符將主題詞與同義詞進行組配,以提高查全率。如,檢索與“激光”有關(guān)的文獻:激光OR鐳射OR萊塞(2)使用邏輯“與”運算符將不同概念進行組配,以提高檢索結(jié)果的專指

性,繼而提高查準率。如,檢索“激光在生物學領(lǐng)域的應(yīng)用”相關(guān)文獻:

(激光OR鐳射OR萊塞)AND生物學(3)合理選擇檢索字段:一般情況下首先選擇主題字段進行檢索;需查非常密切的相關(guān)文獻時,部分檢索詞可選擇在標題字段檢索;(4)構(gòu)建英文檢索式時,正確使用截詞符與位置算符,以達到最佳檢索效果。5.調(diào)整檢索策略檢索結(jié)果輸出的篇數(shù)過多??紤]縮小檢索范圍,提高查準率。調(diào)整方法如下:①進一步限定主題概念,用AND連接一些相關(guān)檢索項。②提高檢索詞的專指度,更多地采用下位詞或下位類。(復(fù)合材料---納米復(fù)合材料)③使用字段限定,將檢索詞限定在某個或某些字段范圍內(nèi)。

(全文→文摘/關(guān)鍵詞)④用NOT運算符,排除一些無關(guān)的檢索項。(慎用)檢索結(jié)果輸出的篇數(shù)過少,甚至為零??紤]擴大檢索范圍,提高查全率。調(diào)整方法如下:①選全同義詞并用OR與原詞連接后加入檢索式。②降低檢索詞的專指度,從詞表或檢出文獻中選一些上位詞或相關(guān)詞。③減少AND運算,刪去一些次要的概念組面。④進行截詞檢索。⑤取消某些過嚴的限制符,如字段限制符等。5.調(diào)整檢索策略示例課題:數(shù)字化圖書館的文獻檢索服務(wù)1.分析課題:

數(shù)字化圖書館+文獻檢索 digitallibraryanddocumentretrieval

digitallibrary

擴展:同義詞virtuallibrary

electroniclibrary

documentretrieval

并列概念

informationretrieval bibliographicretrieval2.數(shù)據(jù)庫的選擇(1)合適的主題范圍(2)合適的數(shù)據(jù)庫類型、年度范圍學科:圖書情報學

2000年后EI,SCI等檢索數(shù)據(jù)庫原檢索式:

digitallibraryanddocumentretrieval

并列概念

documentretrieval

/informationretrieval

/bibliographicretrieval同義詞digitallibrary/virtuallibrary/electroniclibrary

修改檢索式(documentretrievalorinformationretrievalorbibliographicretrieval)and(digitallibrar*orelectroniclibrar*orvirtuallibrar*)示例科研課題基于多重環(huán)境時間相似理論與貝葉斯方法的耐久性評估及預(yù)警系統(tǒng)

分析課題:針對**大橋建立基于多重環(huán)境時間相似理論與貝葉斯方法的耐久性評估及預(yù)警系統(tǒng)。研究對象:橋核心技術(shù)1:多重環(huán)境時間相似理論核心技術(shù)2:貝葉斯方法研究內(nèi)容:耐久性評估及預(yù)警系統(tǒng)如何確定檢索詞?基于多重環(huán)境時間相似理論與貝葉斯方法的耐久性評估及預(yù)警系統(tǒng)中文檢索詞初提:環(huán)境時間相似貝葉斯耐久性預(yù)警X方法X系統(tǒng)X理論橋評估X

多重檢索詞擴充中文檢索詞擴充的幾點思路:閱讀現(xiàn)有文獻,從題名、關(guān)鍵詞和摘要中選擇同義詞、近義詞利用初提檢索詞在數(shù)據(jù)庫中試檢,利用數(shù)據(jù)庫的關(guān)鍵詞、相似詞、相關(guān)詞、同義詞擴展功能(CNKI遠程新版入口、維普、萬方遠程)利用搜素引擎選擇檢索詞如何確定檢索詞?研究課題:中文檢索詞擴充:基于多重環(huán)境時間相似理論與貝葉斯方法的耐久性評估及預(yù)警系統(tǒng)環(huán)境時間相似貝葉斯預(yù)警橋評估Bayes/BayesianMETS預(yù)測評價混凝土/砼

中文檢索式編制編制檢索式如下:(環(huán)境時間相似ormets)and(貝葉斯orBayesorBayesian)and(橋or混凝土or砼)and

耐久性

and(評估or評價or預(yù)警or預(yù)測)砼

[tóng]試檢:建議使用專業(yè)檢索(萬方)“*”表示“并且”的含義“+”表示“或者”的含義“-”表示“不包含”的含義檢索式1:(環(huán)境時間相似ormets)and(貝葉斯orBayesorBayesian)and(橋or混凝土or砼)and耐久性and(評估or評價or預(yù)警or預(yù)測)檢索策略的調(diào)整檢索結(jié)果較少,可以擴檢--增加檢索詞,或?qū)z索詞的上位類詞、近義詞等補充進去--調(diào)整組配算符,如改“and”為“or”--增加或修改檢索入口,如增加文摘、全文檢索等調(diào)整本例題檢索式檢索式1:(環(huán)境時間相似ormets)and(貝葉斯orBayesorBayesian)and(橋or混凝土o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論