信息檢索原理_第1頁
信息檢索原理_第2頁
信息檢索原理_第3頁
信息檢索原理_第4頁
信息檢索原理_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章科技信息檢索原理與技術

ThePrinciplesandTechniquesofInformationRetrieval深圳大學圖書館2011年9月第一節(jié)信息檢索原理第二節(jié)信息檢索語言第三節(jié)信息檢索技術本章主要內容:

第三章主要講述信息資源的檢索原理、檢索語言及檢索技術。要求學生了解檢索語言和步驟,掌握布爾邏輯檢索、截詞檢索、限制檢索等基本檢索技術,能正確的制定檢索策略。本章的重點:檢索功能、檢索算符、檢索策略本章的難點:檢索式的制定和調整第一節(jié)信息檢索的原理

ThemethodsofInformationretrieval

1.檢索原理2.檢索類型3.檢索功能

第一節(jié)信息檢索的原理

1.1文獻信息存儲過程:將大量分散的文獻信息搜集起來,根據(jù)其內容特征或外表特征進行標引,形成表征這些文獻信息的特征標識,并存儲在一定的載體上,成為有查詢功能的檢索工具。1.檢索原理1.2標引:對文獻內容特征和外部特征進行分析形成概念標識,再依據(jù)一定的標準或規(guī)則(檢索語言:如分類號、主題詞、關鍵詞及著者選用規(guī)則等)將其用相應的標識充分、準確地表達出來。1.3文獻信息檢索過程:用戶根據(jù)自己的信息需求,提出檢索提問,然后使用有關的標引語言(也稱檢索語言)將擬定的檢索提問規(guī)范成檢索標識,用于檢索的過程。簡言之,信息檢索原理就是用戶將信息需求轉變?yōu)闄z索系統(tǒng)所能識別的檢索標識,與信息檢索系統(tǒng)中存儲的信息特征進行逐一比對,兩者完全一致或基本一致時,即為檢索命中信息,可按用戶要求從檢索系統(tǒng)中輸出。其檢索結果既可能是用戶需要的最終信息(一次信息),也可能是用戶需要的信息線索(二次信息),用戶可據(jù)此線索進一步進行判斷、篩選,以獲取所需要的最終信息。

信息檢索原理圖2.檢索類型

網(wǎng)絡數(shù)據(jù)庫在網(wǎng)絡學術資源中占據(jù)重要位置,它的形式多樣,但我們仍然可以將其歸納為以下三種類型:2.1書目數(shù)據(jù)庫主要為館藏書目數(shù)據(jù)庫和文摘、索引數(shù)據(jù)庫;它們提供的是獲取文獻的信息和線索。其特點如下:(1)覆蓋的學科范圍廣,來源出版物量大。如SCI、EI數(shù)據(jù)庫等。(2)配有強大的檢索系統(tǒng),檢索途徑多,支持復雜的檢索式。(3)內容更新及時。如EI數(shù)據(jù)庫是每周更新(4)提供全文鏈接或收藏館信息2.2全文數(shù)據(jù)庫包括全文電子期刊、電子圖書、學位論文、會議文獻、政府出版物、專利、標準等可直接獲取原文的數(shù)據(jù)庫,是近年來發(fā)展最快的數(shù)據(jù)庫資源。2.3參考工具類百科全書、科技手冊、電子詞典、統(tǒng)計年鑒等,是用來檢索數(shù)據(jù)、事實類問題的最佳參考信息源。

檢索功能是指檢索系統(tǒng)在檢索界面上提供給用戶的基本功能。它與系統(tǒng)的檢索技術是緊密結合的。比較通用的檢索功能有:瀏覽、索引、詞表、簡單檢索、高級檢索、專家檢索、二次檢索等。上述檢索功能都是技術上較為成熟,在檢索系統(tǒng)中得到廣泛應用的。

3.檢索功能3.1瀏覽檢索(Browse)

利用檢索系統(tǒng)提供的樹型結構,從“樹根”開始,逐層逐級打開,直到找到所需文獻。瀏覽功能最重要的作用就是為用戶提供一個知識體系,讓用戶可以俯瞰全貌,了解某一個方面信息總體情況。如主題瀏覽、分類瀏覽、文獻類型瀏覽等。

例如:

springerLink數(shù)據(jù)庫的瀏覽功能

瀏覽檢索可選擇期刊、圖書、叢書、電子參考書及圖片等進行瀏覽檢索例如:按期刊名稱瀏覽(按字順)點擊后打開本期內容3.2索引檢索(Index)

一些數(shù)據(jù)庫常將其文獻記錄的一個或幾個字段中具有實際檢索意義的詞,按字順排成一個表單式的索引,供用戶選擇檢索。索引的種類很多;如人名索引、出版物索引、地名索引、主題索引、機構索引等。

如圖所示的作者索引(取自EI數(shù)據(jù)庫)

用途:在不清楚作者名稱是全稱還是縮寫的情況下使用作者索引可節(jié)省檢索時間和保障查全率或查準率。索引檢索作者名索引檢索實例:用戶要檢索作者“劉劍洪”發(fā)表的文獻;按傳統(tǒng)拼寫方法為:liujianhong;但經(jīng)EI作者索引檢索發(fā)現(xiàn),該名字在EI數(shù)據(jù)庫中的另外一種拼法為liujian-hong用邏輯“或”來檢索該作者發(fā)表的文章得到檢索結果177條;其中l(wèi)iujianhong的結果為106條,Liujian-hong的結果為71條。

瀏覽索引中所有包含有該詞的姓名,從而確定自己查找的人名,進而點擊作者姓名,即可看到作者列表。

索引與瀏覽最大的不同,就在于瀏覽提供給用戶的是一個樹狀結構的概念體系,而索引是一個簡單的線性列表。但在檢索界面上,索引和瀏覽有時合二為一,統(tǒng)稱為瀏覽,用戶在界面上看不到嚴格區(qū)分的索引和瀏覽功能,只在使用時有所不同。

3.3詞表檢索詞表檢索是主題檢索途徑。一些檢索系統(tǒng)把自己的詞表編入檢索系統(tǒng)。用戶在確定檢索用主題詞的同時,可以直接進行檢索。檢索實例:用戶要進行有關“激光”的主題檢索;進入EBSCO數(shù)據(jù)庫后,選擇主題檢索途徑,然后輸入檢索詞“Laser”主題詞檢索輸入檢索詞,點擊“檢索”選擇主題詞系統(tǒng)出現(xiàn)的檢索結果如下;用戶可根據(jù)系統(tǒng)列出的有關主題詞按自己的需求進行選擇3.4簡單檢索(EasySearch)

簡單檢索又稱基本檢索。即為用戶提供一個簡單的檢索界面,幫助非專業(yè)或初入門的用戶方便的提交檢索式。頁面上通常只有一個檢索框,不提供或提供很少的檢索入口(通常是在全文中進行檢索),類似于搜索引擎。

簡單檢索由于不能構造比較復雜、精細的檢索式,因此檢索結果不是很準確。

檢索實例EasySearch

例如:要檢索有關“納米管”(nanotubes)的文獻;用戶可直接將檢索輸入檢索框內,點擊Search健檢索結果3.5高級檢索

(Advancedsearch)

高級檢索可利用組配檢索和字段檢索來構造比較細致的檢索式,幫助用戶進行精確檢索。使檢索更為靈活,檢索結果更加準確。

高級檢索主要包含:

組配檢索:

★布爾邏輯組配:libraryandinformation;

★位置算符組配:library(3w)information;

字段檢索---字段檢索是一種限制檢索詞在某一字段范圍出現(xiàn)的檢索方法。數(shù)據(jù)庫可供檢索字段有二種:①一種是反映內容的主題字段,如:題名、敘詞、標識詞和文摘等。②另一種是反映形式特征的檢索字段,如:作者、文獻類型、語種、出版時間等。檢索實例:要求在EBSCO數(shù)據(jù)庫中檢索文章題目中出現(xiàn)“Chinaeconomic”和文摘中出現(xiàn)“WTO”的文獻,并限定文獻出版的時間:2000.1—2010.1EBSCO數(shù)據(jù)庫的高級檢索界面Advancedsearch輸入檢索式((Chinaeconomic)/TIANDwto/AB);PY=2000.1—2010.1)檢索結果打開全文中文名英文名縮寫摘要AbstractAB題目TitleTI機構名稱Authoraffiliation;CorporateSource;

Organization;CompanyAFCSCN關鍵詞KeywordKW出版年PublicationYearPY全文Fulltext;AllfieldALL期刊名

Sourcetitle;journalname;publicationtitleSTJNPT高級檢索常用檢索字段中文名英文名縮寫語言LanguageLA國際標準刊號

ISSN

SN國際標準書號ISBNBN文獻類型DocumenttypeDT出版商PublisherPN3.5專家檢索(Expertsearch)

專家檢索可為專業(yè)用戶、資深用戶提供比較復雜的檢索界面。

專家檢索多為命令式檢索方式,適合熟悉檢索指令、檢索經(jīng)驗豐富的用戶使用。用戶可將編制好的檢索式填到檢索框中,即可進行檢索。使用專家檢索可構造較復雜的檢索式,達到較高的查全率和查準率,一般查新人員大多采用這種方式。

39專家檢索檢索式輸入框字段說明

檢索年代檢索實例:

要求檢索以下詞組同時出現(xiàn)在文摘中的文獻

lightweightsteelautobody

檢索式:lightweightsteelautobodyWNAB

(WNAB---在EI數(shù)據(jù)庫中,表示將檢索詞限定在文摘內)

輸入檢索式檢索結果43

專家檢索類似于一種命令式檢索,在專家檢索的界面上有一獨立的檢索框,用戶采用“within”命令(wn)和字段碼,可在特定的字段內進行檢索。例如:①在文摘中查找“Laserbeamcutting”;可以表示為“Laserbeamcutting”wnAB;②在題名中查找(seatbeltsORseatbelts);可表示為:(seatbeltsORseatbelts)wnTI

專家檢索采用布爾運算符(AND,OR,NOT)連接檢索詞。例如:輸入Gilbert,BarriewnAUANDAnalogDeviceswnAF;則檢索出由AnalogDevices(作者單位)的BarrieGilbert(作者)編寫的文獻。

3.6二次檢索(Refindsearch)

二次檢索是指在當前這次檢索結果范圍內,再次輸入不同的檢索詞,運用布爾邏輯檢索、截詞檢索等方式進行檢索。經(jīng)過多次的二次檢索,逐漸縮小文獻范圍,使檢索結果更符合您的查詢目標。

例如:檢索納米材料的有關文獻時,用“所有字段Allfield”途徑,第一次輸入關鍵詞“納米材料Nanomaterials”,檢索出來的結果較多,共有89

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論