(word完整版)信息檢索知識點,推薦文檔_第1頁
(word完整版)信息檢索知識點,推薦文檔_第2頁
(word完整版)信息檢索知識點,推薦文檔_第3頁
(word完整版)信息檢索知識點,推薦文檔_第4頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、信息檢索考點整理1.信息檢索的概念廣義的信息檢索是指將信息按一定的方式組織、信息的過程,包括信息的存儲和檢索兩個過程;而狹義的信息檢索僅指有序化信息的檢索查找。存儲起來, 并根據(jù)信息用戶的需要找出有關2.信息檢索的原理就是將檢索者的檢索提問標識與存儲在檢索工具中的信息特征標識進行相符性比較,息特征標識與檢索提問標識相一致或者信息特征標識包含著檢索提問的標識,的信息就從檢索工具中輸出,輸出的信息就是初步命中檢索所需的信息。凡是信則具有該特征3.為什么說信息存儲和檢索是兩個不可分割的有機體?檢索的全過程包括存儲和檢索兩個過程,存儲和檢索是相輔相成、不可分割的。 存儲過程主要是利用檢索語言對文獻進行

2、標引,形成文獻特征標識并輸入檢索工具,為檢索提供有規(guī)律的檢索途徑; 檢索過程主要是利用檢索語言對檢索提問進行標引,形成檢索提問標識,再按照存儲所提供的檢索途徑,將檢索提問標識與文獻特征標識進行比較。檢索過程是存儲過程的逆過程。 因此,檢索者只有在全面了解存儲者是怎樣把文獻存入到檢索工具中去以后,才知道怎樣從檢索工具中把所需要的信息檢索出來。4.信息檢索的方法( 1)順查法( 2)倒查法( 3)抽查法( 4)追溯法( 5)循環(huán)法5.信息檢索的途徑( 1)內(nèi)部特征途徑a) 分類途徑b) 主題途徑( 2)外部特征途徑a) 題名途徑b) 著者途徑c) 文獻編號途徑d) 目錄檢索途徑e) 機構檢索法f)

3、 引文檢索途徑6.布爾模型的優(yōu)缺點優(yōu)點:( 1)簡單,形式簡潔,易于理解;( 2) 可操作性強,應用廣泛;( 3) 構成的邏輯提問式可以表達與用戶思維習慣相一致的查詢要求,提供非常精確的語義概念;( 4) 能處理結構化提問。缺點:( 1)表達用戶復雜需求效果欠佳( 2)準確匹配無法提供定量比較( 3)匹配標準不盡合理( 4)檢索結果不易控制7.概率排序原則:如果一個檢索系統(tǒng)對用戶的每個檢索提問的反應是以文獻集合中的文獻按相關性遞減的順序排列的,那么系統(tǒng)的總體效果是最好的。8.什么是計算機信息檢索?所謂計算機信息檢索,就是在計算機和人的共同作用下,按照一定的方法組織和存儲信息,并通過人機對話從計

4、算機存儲的大量數(shù)據(jù)中自動輸出用戶所需的那部分信息的過程。 實質(zhì)上計算機信息系檢索是利用計算機信息檢索系統(tǒng)存儲和查找信息的技術,是計算機硬件資源、系統(tǒng)軟件、檢索軟件和數(shù)據(jù)庫的綜合。9.計算機信息檢索的類型:(1)根據(jù)檢索系統(tǒng)的工作方式,可分為:a).脫機信息檢索脫機信息檢索是利用單臺計算機的輸入裝置進行檢索的系統(tǒng),用磁帶作為存儲介質(zhì),并且為連續(xù)的順序檢索方式,適合大批量的定題信息檢索。b).聯(lián)機信息檢索聯(lián)機信息檢索是利用計算機終端設備,通過通信線路或網(wǎng)絡,與世界上的信息檢索系統(tǒng)相連,從信息檢索系統(tǒng)的數(shù)據(jù)庫中進行檢索并獲取信息的過程。聯(lián)機檢索模式是主從式,即為所有的工作都在主機上進行,主機負擔重,

5、一旦主機癱瘓,整個系統(tǒng)都將處于癱瘓狀態(tài),因此對主機的性能要求極高。c).光盤信息檢索d).網(wǎng)絡信息檢索(2)根據(jù)信息的服務方式,可分為:a).定題檢索定題檢索是用戶根據(jù)課題的要求,事先編寫出邏輯檢索提問式,并將存儲在計算機的存儲器中,每次系統(tǒng)加入新的信息,系統(tǒng)便會按檢索要求,找出用戶所需的資料,并把結果分給用戶,用戶能及時得到最新的文獻信息。具有定期性、新穎性和批處理性的特點。b).回溯檢索回溯檢索是追溯查找過去的信息,讓用戶一次檢索一段時間內(nèi)與某一課題有關的信息。也可以查找最新的信息,可以適應多數(shù)用戶的查詢需要。c).日常檢索10.計算機信息檢索技術初級檢索6 個1) 布爾邏輯檢索2) 位置

6、限制檢索3) 短語檢索4) 截詞檢索5) 字段限制檢索6) 區(qū)分大小寫檢索11.計算機信息檢索技術高級檢索6 個1) 加權檢索2) 自然語言檢索3) 相關信息反饋(相似檢索)4) 概念檢索5) 模糊檢索6) 聚類檢索布爾邏輯檢索(1)邏輯與用 AND 或*表示 檢索式寫作 A AND B 或 A *B(2)邏輯或用“ OR”或“ +”表示(3)邏輯非用 NOT或表示ANOTB( A 當中除去 B 所剩下的)字段名稱及縮寫AB abstractTItitleAU authorJN journal nameLA languagePYpublication yearSP source publica

7、tion分類和聚類的異同相同點:基于“類”的思想進行檢索。不同點:( 1)分類基于分類法,其類目體系主要是先組式,有系統(tǒng)性的。類目與文獻之間具有相對獨立性。 而聚類則先有文獻后聚類, 類的性質(zhì)及整體類目體系完全由系統(tǒng)中的文獻決定。( 2)從類目形成過程看,分類是總到分,聚類由分到總。會構建檢索式(主要是積木型)12.計算機信息檢索策略含義狹義的計算機信息檢索策略是指檢索提問式的構建,即運用系統(tǒng)特定的檢索技術,確定檢索詞之間的邏輯關系,形成表達用戶信息需求的檢索提問式。廣義的計算機信息檢索策略是指在分析檢索課題的實質(zhì)內(nèi)容和明確檢索目標的基礎上,選擇檢索工具, 確定檢索途徑與檢索用詞, 以及檢索詞

8、之間邏輯關系與查找步驟最佳方案的一系列科學安排。13.計算機信息檢索策略類型(即聯(lián)機檢索五原則)( 1) 最專指面優(yōu)先:從最專指的概念入手( 2) 最低登錄量面優(yōu)先( 3) 積木型( 重點掌握,會構建此檢索式 )( 4) 引文珠型增長( 5) 逐次分餾14.網(wǎng)絡信息資源的評價方法:(1)定性評價法:是指按照一定的評價標準從主觀角度對網(wǎng)絡信息資源所做的優(yōu)選和評估,主要有指標體系法和調(diào)查表法。( 2) 定量評價法:國內(nèi)外比較典型的定量評價方法有信息計量法、層次分析法和對應分析法等三種。( 3) 綜合評價法:是定性評價和定量評價相結合的一種方法,有包括分析法、模糊綜合評價法等。( 4) 分類方法:分

9、為第三方評價法、用戶評價法和網(wǎng)絡計量法。15.搜索引擎的類型:( 1) 按檢索機制劃分:檢索型、目錄型和混合型檢索工具( 2) 按檢索內(nèi)容劃分:綜合型、專題型和特殊型檢索工具( 3) 按包含檢索工具數(shù)量劃分:單獨型和集合型檢索工具( 4) 按檢索資料類型分:萬維網(wǎng)檢索工具和非萬維網(wǎng)檢索工具16.元搜索引擎的含義所謂元搜索引擎, 是對分布于網(wǎng)絡的多種檢索工具的全局控制機制,面幫助用戶在多個搜索引擎中選擇和利用合適的搜索引擎來實現(xiàn)檢索操作。17.元搜索引擎的特點:( 1) 虛擬索引數(shù)據(jù)庫( 2) 查全率高( 3) 用戶界面友好( 4) 適宜二次加工( 5) 擴展性好18.元搜索引擎的工作原理搜索引

10、擎 1輸 入 查選 擇 搜提交查搜索引擎 2詢條件索引擎詢請求搜索引擎 3它通過一個統(tǒng)一用戶界整理返回結果顯示查詢結果19.實現(xiàn)跨語言信息檢索的方法:( 1)提問式翻譯方法( 2)文獻翻譯方法(唯一結果是源語言描述)( 3)提問式文獻翻譯方法(將查詢語言提問式翻譯成目標語言提問式,與目標語言描述的信息庫進行匹配,檢索相關信息,然后再把檢索結果的全部或部分內(nèi)容翻譯成查詢語言描述的信息。 檢索結果一般選擇部分翻譯,這樣工作量較小,容易提高翻譯的效率和質(zhì)量,部分翻譯一般是對結果文本的前兩行、文摘或文本中重要的詞進行翻譯,在重要詞的翻譯中,如何確定重要詞是決定這種方法效果的關鍵。( 4)中間語種翻譯方

11、法( 5)非翻譯方法20.語義網(wǎng)的應用( 1) Web 服務( 2) 智能信息檢索( 3) 基于語義的網(wǎng)頁搜索引擎( 4) 企業(yè)數(shù)據(jù)管理21.Ei 收錄論文的兩個層次( 1) Compendex 數(shù)據(jù)。數(shù)據(jù)的內(nèi)容全面,主要包括:論文標題;作者;作者單位;英文文摘;論文所在期刊名稱;卷,期;論文頁碼;分類碼;主題詞等等。其中:分類碼;主題詞需要專業(yè)人員單獨給出。( 2) Page One 數(shù)據(jù):數(shù)據(jù)內(nèi)容主要包括:論文標題;作者;作者單位;論文所在期刊名稱;卷,期;論文頁碼;少數(shù)數(shù)據(jù)帶有英文文摘。不需要任何專業(yè)人員再做工作。22.Compendex 數(shù)據(jù)和 Page One 數(shù)據(jù)的主要區(qū)別在于:數(shù)

12、據(jù)中是否有分類碼和主題詞;有這兩項內(nèi)容的數(shù)據(jù)是Compendex 數(shù)據(jù),反之是Page One 數(shù)據(jù)。有沒有主題詞和分類號是判斷論文是否被Compendex 數(shù)據(jù)正式收錄的唯一標志。23.主題指南按字母順序列出與分類表中類目名稱相關的主題詞, 并注明相關的分類號, 實際上是分類表的主題索引, 是從分類途徑檢索文獻的指南。 便于不能確定分類號的讀者實現(xiàn)從主題查到分類號,再由分類號查到文獻所在頁碼。24.SCI (科學引文索引)的編制結構及檢索方法( 1) 引文索引( 2) 來源索引( 3) 機構索引( 4) 輪排主題索引25.如何決定收錄期刊的數(shù)量和種類?(1)“加菲爾德文獻集中定律”確定適宜的

13、期刊數(shù)量該定律認為:在幾萬種科技期刊中,最重要的期刊(即核心期刊)不過一千種,甚至可能還不足 500。因而,把收錄期刊的范圍定在 3000 種以內(nèi),足以把重要的科技文獻包括在內(nèi)。(2)“費用效果原則”用來選擇每一種期刊,具體方法是“引用頻率統(tǒng)計法”先計算一種期刊在一年內(nèi)被引用的總次數(shù),再計算其中每篇論文的平均引文章,其他因素對引文章的影響通過加某些修正系數(shù)來解決,引用頻率越高,說明該刊質(zhì)量越高。通過上述兩個指標決定了收錄期刊的數(shù)量和種類26.什么是專利?這種受法律保護的發(fā)明就稱專利。含義:專利權法律受專利法保護的發(fā)明創(chuàng)造專利技術專利說明書等專利文獻文獻這三層含義的核心是受專利法保護的發(fā)明,而專

14、利權和專利文獻是專利的具體表現(xiàn)。27.什么是同族專利?同族專利指同一個發(fā)明為了在不同國家得到保護,而在這些國家分別申請的一系列內(nèi)容相同或基本相同的專利。 由于同族專利或相同專利都具有相同的優(yōu)先權項, 所以通過優(yōu)先權項可以方便、快捷地檢索出有關同一發(fā)明的全部相同專利或同族專利。28.專利的類型( 1) 發(fā)明專利( 2) 實用新型專利( 3) 外觀設計專利( 4) 植物性專利( 5) 防衛(wèi)性專利知識產(chǎn)權:工業(yè)產(chǎn)權和著作產(chǎn)權29.學位論文的文獻價值:( 1) 較高價值的一次文獻:寫作不受篇幅限制,論述詳盡:從研究背景、技術線路、實驗方法到數(shù)據(jù)獲取、分析結論論述翔實。( 2) 珍貴的信息資源價值:能集中反映所在單位的科研領域、學術活動、研究進展和最新成果,論文的使用者可以跟蹤名校導師的科研進程。( 3) 綜述性二次文獻: 對相應研究領域有系統(tǒng)深入的討論和綜述,擁有詳盡的參考文獻,可得到課題研究現(xiàn)狀綜述。( 4) 寫作技巧的啟發(fā)藍本:通過對學位論文的閱讀,可大致梳理出作者的寫作思路和研究方法,學習學位論文的寫作方法。30.信息檢索評價方法( 1) 測試文檔集合法( 2) 人機交互

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論