淘花百度專用_第1頁
淘花百度專用_第2頁
淘花百度專用_第3頁
淘花百度專用_第4頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、淘花/百度專用1信息檢索基礎知識與信息信息檢索基礎知識與信息檢索技巧專題講座檢索技巧專題講座天津商學院圖書館吳鳳玉E-mail:電話:26684017淘花/百度專用2一、信息檢索信息檢索是將信息按一定的方式組織和存儲起信息檢索是將信息按一定的方式組織和存儲起來,并根據信息用戶的需要找出有關信息的過來,并根據信息用戶的需要找出有關信息的過程和技術程和技術。對于信息用戶而言,就是從信息集合中找出所對于信息用戶而言,就是從信息集合中找出所需信息的過程。需信息的過程。 信息檢索基本原理:信息檢索基本原理: 提問標識(檢索式)與文獻標識的對比提問標識(檢索式)與文獻標識的對比 淘花/百度專用3二、信息檢

2、索途徑檢索途徑:檢索途徑: 又稱為檢索點。又稱為檢索點。 依據文獻的依據文獻的外部特征外部特征(題名、責任者、(題名、責任者、 出版者、出版時間等)出版者、出版時間等) 和和內容特征內容特征(分類號、主題詞、關鍵詞(分類號、主題詞、關鍵詞 或自由詞等)來確定,是信息檢索的入口點?;蜃杂稍~等)來確定,是信息檢索的入口點。 淘花/百度專用4常用檢索途徑題名(篇名)途徑:題名(篇名)途徑:利用篇名中的字詞或篇名利用篇名中的字詞或篇名的一部分進行檢索。其結果是所有在篇名中出現該字、的一部分進行檢索。其結果是所有在篇名中出現該字、該詞或該部分的文章。該詞或該部分的文章。著者途徑著者途徑:利用文獻作者名字

3、進行檢索??刹榈皆摾梦墨I作者名字進行檢索??刹榈皆撟髡叩乃形墨I。作者的所有文獻。分類途徑分類途徑:利用分類名和分類號進行檢索。其結果利用分類名和分類號進行檢索。其結果是該類目所有的文獻。是該類目所有的文獻。淘花/百度專用5主題途徑主題途徑:利用與該篇文獻主題相關的規(guī)范詞(主利用與該篇文獻主題相關的規(guī)范詞(主題詞)進行檢索,其結果是包含該主題詞的所有文獻。題詞)進行檢索,其結果是包含該主題詞的所有文獻。關鍵詞途徑關鍵詞途徑:利用與該篇文獻主題相關的關鍵詞利用與該篇文獻主題相關的關鍵詞(自由詞)進行檢索,其結果是包含該關鍵詞的所有(自由詞)進行檢索,其結果是包含該關鍵詞的所有文獻。文獻。序號途

4、徑序號途徑:利用文獻的各種代碼、數字編制的索引利用文獻的各種代碼、數字編制的索引查找文獻,如專利號、技術標準的標準號、科技報告查找文獻,如專利號、技術標準的標準號、科技報告的報告號等。的報告號等。其他途徑其他途徑:如文獻類型、參考文獻、語種、出版如文獻類型、參考文獻、語種、出版(發(fā)表)年份、作者機構、出版機構等。(發(fā)表)年份、作者機構、出版機構等。淘花/百度專用6三、信息檢索常用方法(一一)布爾邏輯布爾邏輯: 用布爾邏輯算符來表達檢索詞間的邏輯組配關系,用布爾邏輯算符來表達檢索詞間的邏輯組配關系,是最基本、最常用的檢索技術。是最基本、最常用的檢索技術。 -邏輯或邏輯或(+,OR):):表達檢索

5、詞間的并列關表達檢索詞間的并列關系??蓴U大檢索范圍,提高查全率。如:系??蓴U大檢索范圍,提高查全率。如:A+B,表明,表明結果中含有結果中含有A或或B都為檢索命中都為檢索命中AB淘花/百度專用7 -邏輯與邏輯與(*,AND):):表達檢索詞間的交叉關表達檢索詞間的交叉關系??煽s小檢索范圍,提高查準率。如:系??煽s小檢索范圍,提高查準率。如:A*B,表明,表明結果必須同時含有結果必須同時含有A和和B才為命中才為命中 -邏輯非邏輯非(-,NOT):):表達檢索詞間的排除關系。表達檢索詞間的排除關系??煽s小檢索范圍,提高查準率,但要慎用。如:可縮小檢索范圍,提高查準率,但要慎用。如:A-B,表明結果

6、是表明結果是A中不包含中不包含B的那部分的那部分 ABAB淘花/百度專用8(二二)截詞檢索:截詞檢索: 又稱詞干檢索、模糊檢索。檢索時,只需用詞干又稱詞干檢索、模糊檢索。檢索時,只需用詞干加截詞符號,凡是含有與該詞干相同的文獻均能被檢加截詞符號,凡是含有與該詞干相同的文獻均能被檢出。該方法能很好避免漏檢現象的出現。出。該方法能很好避免漏檢現象的出現。檢索系統(tǒng)不同,截詞符也不同,常用的截詞符號檢索系統(tǒng)不同,截詞符也不同,常用的截詞符號有:有:?,*等。等。分為有限截詞(即一個截詞符只代表一個字符)和無分為有限截詞(即一個截詞符只代表一個字符)和無限截詞(一個截詞符可代表多個字符)。限截詞(一個截

7、詞符可代表多個字符)。按截斷的位置來分,截詞可分為后截斷、前截斷、中按截斷的位置來分,截詞可分為后截斷、前截斷、中截斷三種類型。截斷三種類型。淘花/百度專用9舉例說明舉例說明:后截斷,前方一致。如:后截斷,前方一致。如: comput* 表示表示computer,computers,computing等。等。 王偉?王偉? 可查出所有名字中含可查出所有名字中含“王偉王偉”的作者的文獻的作者的文獻前截斷,后方一致。如:前截斷,后方一致。如: *Computer 表示表示minicomputer,microcomputer等。等。中截斷,中間一致。如中截斷,中間一致。如 *comput* 表示表示

8、minicomputer,microcomputers等。等。 作者作者=張張?靜靜 檢索出張亞靜、張雪靜、張宇靜等。檢索出張亞靜、張雪靜、張宇靜等。 淘花/百度專用10(三)限制檢索(三)限制檢索限制檢索是縮小或約束檢索結果的方法,主要是指限限制檢索是縮小或約束檢索結果的方法,主要是指限定字段檢索,即是指定檢索詞在記錄中出現的字段。定字段檢索,即是指定檢索詞在記錄中出現的字段。常用的字段代碼有:常用的字段代碼有: TI(題名)(題名) AU(作者)(作者) AB(文摘)(文摘) JN(刊名)(刊名) PY(年代)(年代) LA(語種)(語種) 如:如: information science

9、/TI LA=english 文摘文摘=網絡信息資源網絡信息資源淘花/百度專用11四、機檢系統(tǒng)常用檢索方法簡單檢索簡單檢索(basic search):):是一種單項檢索。是一種單項檢索。一般只需輸入一個檢索詞,輔以相應的途徑即可進行一般只需輸入一個檢索詞,輔以相應的途徑即可進行檢索。檢索。二次檢索二次檢索:在原有簡單檢索的結果基礎上,再進行在原有簡單檢索的結果基礎上,再進行檢索。可反復使用,不斷擴大或縮小檢索范圍。檢索??煞磸褪褂?,不斷擴大或縮小檢索范圍。高級檢索高級檢索(advanced search):):是一種多項組是一種多項組合檢索,一般輸入多個檢索詞進行組配。有的檢索系合檢索,一般

10、輸入多個檢索詞進行組配。有的檢索系統(tǒng)也稱為復雜檢索或擴展檢索。統(tǒng)也稱為復雜檢索或擴展檢索。專家檢索專家檢索:用多個檢索詞與各種運算符組成檢索式,:用多個檢索詞與各種運算符組成檢索式,功能與高級檢索相似。功能與高級檢索相似。淘花/百度專用12五、檢索技巧五、檢索技巧信息檢索最重要的兩個指標:信息檢索最重要的兩個指標: “檢全率檢全率”與與“檢準率檢準率”檢準率:指檢出的相關文獻量與檢出文獻總量檢準率:指檢出的相關文獻量與檢出文獻總量 的比率。反應檢索結果的準確性。的比率。反應檢索結果的準確性。檢全率:指檢出的相檢全率:指檢出的相 關文獻量與檢索系統(tǒng)中相關文獻量與檢索系統(tǒng)中相 關文獻總量的比率。反映檢索結果的關文獻總量的比率。反映檢索結果的 全面性。全面性。淘花/百度專用13(一)提高檢準率的方法(一)提高檢準率的方法使用高相關度的檢索入口使用高相關度的檢索入口 題名題名/關鍵詞關鍵詞 文摘文摘 (全文)(全文)使用限制檢索使用限制檢索 如:在百度中可以進行多種限制:如:在百度中可以進行多種限制: 限定搜索網站限定搜索網站(site: );文檔格式;文檔格式(filetype:ppt、doc、pdf、xls等)。等)。反復使用二次檢索(反復使用二次檢索(and)使用使用“精確檢索精確檢索” 如:百度中的如:百度中的“”“”(雙引號)與(雙引號)與(書名號)(書名號)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論