信息檢索一般技術_第1頁
信息檢索一般技術_第2頁
信息檢索一般技術_第3頁
信息檢索一般技術_第4頁
信息檢索一般技術_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1信息檢索一般技術信息檢索一般技術第四講:第四講:王建濤QQ200821.導論導論u機檢u回憶“信息檢索原理圖”u信息檢索系統(tǒng)=硬件+軟件+數(shù)據庫u計算機信息檢索的實質就是由計算機將輸入的檢索策略與系統(tǒng)中存儲的文獻特征標識及其邏輯組配關系進行、的過程,需要人機協(xié)同作用來完成。200831.1 計算機信息檢索的類型計算機信息檢索的類型檢索系統(tǒng)存儲的內容文獻信息檢索系統(tǒng)事實信息檢索系統(tǒng)數(shù)值信息檢索系統(tǒng)圖像信息檢索系統(tǒng)多媒體信息檢索系統(tǒng)檢索系統(tǒng)工作方式脫機信息檢索系統(tǒng)(20世紀5060年代)聯(lián)機信息檢索系統(tǒng)(20世紀70年代光盤信息檢索系統(tǒng)(20世紀80年代網絡信息檢索系統(tǒng)(20世紀90年代2008

2、42 計算機信息檢索技術計算機信息檢索技術u計算機信息檢索技術是用戶信息需求和文獻信息集合之間的匹配比較技術。u由于信息檢索提問式是用戶需求與信息集合之間匹配的依據,u目前,計算機信息檢索技術已經從基本的、發(fā)展為高級的加權檢索、自然語言檢索、模糊檢索、概念檢索和相關檢索等多種技術并存。 200852.1 布爾邏輯檢索布爾邏輯檢索u布爾邏輯組配是現(xiàn)行計算機檢索的基本技術,主要通過“與(and,*)”、“或(or,+)”、 “非(not,-)”將檢索詞聯(lián)絡起來。 A and B 邏輯與。A和B都為真時,結果才為真 ,即:A*B,邏輯含義用圖表示是:20086 A or B 邏輯或。A或B中只要有一

3、個為真時,結果就為真,即:A+B A not B 邏輯非。A為真、B為假時,結果才為真,即:A-B20087布爾邏輯運算符的運算次序布爾邏輯運算符的運算次序u括號優(yōu)先與計算機編程中一樣(A OR B) AND C NOT Du不同的系統(tǒng)次序有差別,但總的來說一般次序為:NOT AND ORu例A:查找有關信息檢索的非英文文獻信息information 檢索retrieval 英文english(信息 and 檢索 ) not 英文(information and retriever) not english20088分析實例:分析實例:上海零售業(yè)的現(xiàn)狀與發(fā)展趨勢上海零售業(yè)的現(xiàn)狀與發(fā)展趨勢上海上

4、海 零售業(yè)零售業(yè) 現(xiàn)狀現(xiàn)狀 發(fā)展趨勢發(fā)展趨勢上海上海 and 零售業(yè)零售業(yè) and (現(xiàn)狀現(xiàn)狀 or 發(fā)展趨勢發(fā)展趨勢)200892.2 截詞檢索截詞檢索u截詞包括后截、中截、前截等。用?作為截詞符截詞包括后截、中截、前截等。用?作為截詞符(有些有些系統(tǒng)用系統(tǒng)用*),主要包括下列情形:,主要包括下列情形: u如 wom?n 可以檢索出: woman, women u如 coumput?可以檢索出Compute, Computer, Computing, computable200810 如:transplant?可以檢索出:transplant、transplanted、transplante

5、r 如: comput? 可以檢索出:compute;computer;computing200811通配符,無限截斷 % ?*“%國慶” 將檢索出所有字段為張國慶、歐陽國慶、國慶等的記錄。 如:“熱電材料% ”將檢索出熱電材料梯度化、熱電材料及其梯度化等的記錄。2008122.3 鄰近檢索鄰近檢索u (W) with,(nW)n with 表示檢索算符兩側的詞顛倒順序,n表示兩個詞中間可以插入=n個的詞(如:an in by of the) 如:control(1w)system可以檢索出“control system” “control in system”等的信息。200813(N) n

6、ear ,(nN)n near 表示檢索算符兩側的詞顛倒順序,n表示兩個詞中間可以插入=n個的詞(如:an in by of the) 如:control system可以檢索出“control system” “system control”等的信息。200814(F) (L)(F)- in the same field 表示檢索算符兩側的詞必須同時出現(xiàn)在記錄的同一字段內。(L)- link 表示檢索算符兩側的詞必須在數(shù)據庫界定的統(tǒng)一規(guī)范字段內。且有一定的從屬關系,可以用來鏈接主標題詞和副標題詞。200815(S)-in the same subfield or same paragraph

7、 表示檢索算符兩側的詞只要在同一個子字段(文摘中的句子)或全文數(shù)據庫的一個段落中出現(xiàn)就是匹配。2008162.4 限制檢索限制檢索u針對特定年代、特定類別、特定檢索點等作限制,包括前綴限制符和后綴限制符。后綴限制符例如:后綴限制符例如:/TI 限在題目中查限在題目中查/AB 限在文摘中查限在文摘中查/DE 限在敘詞標引中查限在敘詞標引中查前綴限制符例如:前綴限制符例如:AU= 限查特定作者限查特定作者JN= 限查特定刊名限查特定刊名 LA= 限查特定語種限查特定語種PN= 限查特定專利號限查特定專利號PY= 限查特定年代限查特定年代200817u如在谷歌和百度搜索引擎中的檢索特定的文獻類型:

8、“報告 filetype:pdf ”檢索指定網址內的信息: “報告 site:” 2008182.5 網絡檢索網絡檢索u短語檢索(半角雙引號)u自動糾錯檢索(如:李熬,你是不是要檢索李敖)u自動轉換檢索(如:漢語拼音轉換成文字)u自然語言檢索u概念檢索(同義詞/近義詞/狹義詞,如搜索引擎Excite)u相關檢索2008192.6 其它檢索的表述其它檢索的表述u二次檢索/在結果內檢索u精確檢索u模糊檢索u跨庫檢索/一站式檢索u擴展檢索(類似搜索引擎的概念檢索)u一般檢索/高級檢索/專家檢索/命令檢索u還有什么檢索?200820小結小結NO4-1u計算機信息檢索技術是用戶信息需求和文獻信息集合之間的匹配比較技術。、u幾乎所有的檢索系統(tǒng)都有布爾邏輯檢索、截詞檢索(模糊檢索)和限制檢索,而不同的檢索系統(tǒng)又會有一些特殊的檢索技術和功能。2008

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論