20150429網絡信息檢索1_第1頁
20150429網絡信息檢索1_第2頁
20150429網絡信息檢索1_第3頁
20150429網絡信息檢索1_第4頁
20150429網絡信息檢索1_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、幻燈片2第1章信息檢索如果說搜集信息是人類賴以生存、發(fā)展的一種本能,那么信息檢索則是每個大學生和科研人 員必須具備的一種基本技能。要有效、快速地獲取和利用最新信息,就必須掌握信息檢索的 技能。本章將為大家講述有關信息檢索的基礎理論?;脽羝?1信息檢索概念信息檢索是指將雜亂無序的信息有序化形成信息集合;并根據需要從信息集合中查找出特定 信息的全過程,全稱是信息存儲與檢索(Information Storage and Retrieval)。信息的存 儲主要是指對一定范圍內的信息進行篩選、描述其特征,加工使之有序化形成信息集合,即 建立數(shù)據庫,這是檢索的基礎;信息的檢索是指采用一定的方法與策略從數(shù)

2、據庫中查找出所 需信息,這是檢索的目的,是存儲的反過程。存儲與檢索是一個相輔相成的過程。為了迅速、 準確地檢索,就必須了解存儲的原理。通常人們所說的信息檢索是指后一過程,即信息查找 過程,也就是狹義的信息檢索(Informa tion Search)。幻燈片4信息源內容分析主題槻弩學科關晶、信息存儲與檢索原理檢素提問 內容分析 主題槪念 尸礫K 關鍵詞 |檢索詞表(分類法5主題福標引詞建/廠虛 素詞,信息標寂|組織信息集合J檢索|檢星標識輸出所需信息2信息檢索的類型信息檢索按檢索的目標、手段及時間范圍不同,可以劃分為: 書目檢索事實數(shù)據檢索手工檢索計算機檢索定題檢索和回溯檢索等?;脽羝?1書目

3、檢索Bibliographic Retrieval,通常稱文獻檢索(Document Retrieval)書目檢索是指以查找某一課題的相關文獻為目標的檢索,如查找某一學科、某一主題、某一地區(qū)、某一時期、某一著者、某一機構的有關文獻及其出處等。檢索結果是二次信 息,即獲得相關文獻的題目、作者、出處、摘要、收藏地址等信息。幻燈片7事實數(shù)據檢索(Fact and Data Retrieval)事實數(shù)據檢索是指以某一特定的事實或數(shù)據為目標的檢索,如查找某一人物的資料、某一術 語的解釋、某一事件的發(fā)生時間及其地點與發(fā)展情況、某一產品的生產廠家、某一儀器的參 數(shù)、某一數(shù)學公式、某種材料的性能參數(shù)等?;脽羝?/p>

4、8手工檢索(Manual Retrieval,簡稱手檢)手工檢索是檢索者與檢索工具直接對話,它依靠檢索者手翻、眼看、腦子判斷而進行, 不需要借助任何的輔助設備。手工檢索的特點是方便、靈活、判別直觀,可隨時修改檢索策 略,查準率較高。不足的是檢索速度較慢,漏檢現(xiàn)象比較嚴重,不便于進行復雜概念課題的 檢索。幻燈片94計算機檢索(Computer-based Retrieval,簡稱機檢)計算機檢索是指利用計算機通過各種數(shù)據庫查找所需信息,檢索過程是由人操縱計算機完 成的,匹配是由計算機進行的。在檢索過程中,人是整個檢索方案的設計者和操縱者。幻燈片105定題檢索(Selec tive Dissemi

5、na tion of Informat ion,簡稱 SDI)定題檢索是指根據用戶的需要,預先將制定好的檢索策略(檢索式)存入檢索系統(tǒng)中,定期(通 常按系統(tǒng)更新周期)對檢索系統(tǒng)的信息進行查詢,把檢索結果及時提供給有關用戶。這種檢 索可以查出系統(tǒng)中的最新相關信息,具有連續(xù)性、新穎性特點,可及時了解學科發(fā)展水平和 研究動向,對長期跟蹤特定課題的研究十分有益?;脽羝?16回溯檢索(Ret rospec tive Search,簡稱 RS)回溯檢索是指根據用戶需求,檢索系統(tǒng)的信息進行全面的檢索,將檢索結果一次性 提供給用戶。這種檢索具有一次性、廣泛性特點,適于在查新、撰寫綜述、述評或從事新課 題研究前

6、的專題文獻普查以及申請專利時采用?;脽羝?23檢索語言基本知識3.1檢索語言概述3.2檢索語言的類型幻燈片133.1檢索語言概述檢索語言,又稱為標引語言、索引語言、文獻檢索語言、信息存貯與檢索語言等。檢索語言是應文獻信息的加工、存貯和檢索的共同需要而編制的專門語言,它是表達概括文 獻信息內容和檢索課題內容的概念及其相互關系的一種概念標識系統(tǒng)。幻燈片14檢索語言所具備的功能對文獻的信息內容及其外表特征加以規(guī)范化的標引;對內容相同及相關的文獻信息加以集中或揭示其相關性;可使文獻信息的存貯集中化、系統(tǒng)化、組織化,便于檢索者按一定的排列次序進行有 序化檢索;便于將標引用語和檢索用語進行相符性比較?;脽?/p>

7、片153.2檢索語言的類型按語言的結構原理劃分,可將檢索語言的類型劃分為:(1)分類語言(體系分類語言、組配分類語言、混合分類語言)(2)主題語言(標題詞語言、敘詞語言、關鍵詞語言、單兀詞語言、引文語言)幻燈片16按照語言標識的組配方式劃分,可將檢索語言的類型劃分為:先組式檢索語言。后組式檢索語言?;脽羝?74信息檢索系統(tǒng)4.1信息檢索系統(tǒng)概述4.2信息檢索系統(tǒng)的組成4.3信息檢索系統(tǒng)類型4.4評價檢索系統(tǒng)的標準幻燈片184.1信息檢索系統(tǒng)概述實現(xiàn)信息檢索的必備手段是信息檢索系統(tǒng)。信息檢索系統(tǒng)是為滿足各式各樣的信息需要而建 立的一整套文獻信息的收集、加工、存儲和檢索使用的完整系統(tǒng)。這種系統(tǒng)可以

8、是提供手工 檢索使用的卡片目錄、書目、索引等信息檢索工具,也可以是計算機信息檢索系統(tǒng)。當今信 息檢索系統(tǒng)尤指計算機信息檢索系統(tǒng)?;脽羝?9信息檢索系統(tǒng)的基本要素有:(1)檢索文檔(file)(2)技術設備(3)語言工具(4)其他人員幻燈片204.2信息檢索系統(tǒng)的組成表芥1手工檢索系統(tǒng)和計算機檢索系統(tǒng)組成部分比較表內容手工檢索系統(tǒng)屮 印刷出版物)計算機檢索系統(tǒng)機讀數(shù)據庫)使用指南說明、樣例Helpp主體部分正文部分條目記錄)著錄項主文檔索引輔助索引q倒排(索引)文檔主題表、分類表q主題詞表、分類表q其他*資料來源索引幻燈片214.3信息檢索系統(tǒng)類型目錄(biblography)目錄是一批相關文獻

9、的著錄集合,是以報道文獻的出版信息為主要功能的工具。目錄通 常以一個完整的出版單位或收藏單位為基本的著錄單位,即以文獻的“本” “種”或“件” (item)為報道單位。它對文獻的描述比較簡單,每一個條目的著錄項(elements)都有書 (刊)名、卷(期)數(shù)、作者、出版年月、出版地以及書(刊)收藏情況等?;脽羝?2題錄(tit le)題錄是將圖書、報刊等文獻中論文的篇目按照一定的排檢索方法編排而成的,供人們 查找篇目出處的工具。它按照論文的篇名順序排列,按篇報道,具有廣、全快的特點。著錄 項通常包括篇名、著者(或含其所在單位)和來源出處,如我國的全國報刊索引美國 的化學題錄(chemical

10、Title)等?;脽羝?3文摘(abs trac t)文摘是以精練的語言把文獻信息的重要內容、學術觀點、數(shù)據及結構準確地摘錄下來,并按一定的著錄規(guī)則與排列方式編排起來,供讀者查閱使用的一種檢索工具。根據文摘的目的和途徑,文摘可劃分成指示性、報道性和評論性三種類型?;脽羝?4索引(index)索引是對一組信息集合的系統(tǒng)化的指引(systematic guide)。索引一般只起指引特定 信息內容及其存儲地址的作用。索引條目通常有三個著錄項:標目(也稱標識)、說明 語和存儲地址?;脽羝?54.4評價檢索系統(tǒng)的標準檢索系統(tǒng)的質量影響著檢索系統(tǒng)的使用效果,根據檢索課題選擇檢索系統(tǒng)時需要考慮檢索 系統(tǒng)的質

11、量,一般說來,可從以下幾個角度對檢索系統(tǒng)進行評價:檢索的方便性收錄全面性檢索效率報導及時性幻燈片261檢索的方便性檢索系統(tǒng)使用起來是否方便可行,決定著檢索系統(tǒng)的效用能否充分發(fā)揮。檢索方便性是由多 方面因素決定的,如信息的編排組織是否科學合理;索引系統(tǒng)是否完備;索引深度是否適中; 標識的專指度是否足夠等。幻燈片27收錄全面性檢索系統(tǒng)的全面性是指定它收錄的文獻信息是否全面。在通常情況下,可以用 以下三個指標來衡量:覆蓋面摘貯率報導數(shù)幻燈片28檢索效率檢索效率主要用查全率和查準率兩個指標來衡量。查全率是指從檢索系統(tǒng)檢出的有關某課題的文獻信息數(shù)據與檢索系統(tǒng)中實際與該 課題有關的文獻信息總量之比率。查準

12、率是指從檢索系統(tǒng)檢出的有關某課題的文獻信息數(shù)量與檢出的文獻信息總量 之比率。幻燈片29報導及時性檢索系統(tǒng)的及時性是指它所報導新出現(xiàn)文獻信息的速度,一般用“時差”來衡量, 時差是指文獻信息從其發(fā)表到檢索系統(tǒng)提供給用戶的這段時間間隔?;脽羝?05信息檢索的基本程序和方法5.1信息檢索的基本程序5.2信息檢索的基本方法5.3影響檢索效率的因素5.4信息檢索的基本策略幻燈片315.1信息檢索的基本程序1分析研究課題,明確檢索要求選擇檢索工具或檢索系統(tǒng)確定檢索途徑和檢索策略選定檢索方法5索取原始文獻幻燈片321分析研究課題,明確檢索要求分析課題,是實施檢索中最重要的一步,也是檢索效率高低或成敗的關鍵。面

13、對一個課題, 需要找出它的研究范圍,所處的國內外水平及將要達到的目的。在課題分析中要考慮以下幾 個問題:幻燈片33找出課題所涉及的主要內容和相關內容,從而形成主要概念和次要概念,選取主題詞;明確課題需要的文獻類型。確定檢索的時間范圍。課題需要的主語種;了解課題對查新、查準、查全諸方面有無具體要求。幻燈片34選擇檢索工具或檢索系統(tǒng)檢索工具或檢索系統(tǒng)的選擇是否恰當,將直接影響檢索質量??蓮囊韵聝蓚€因素來衡量: 收錄文獻的覆蓋面及文獻類型、學科范圍;文獻的質量及檢索的功能。幻燈片35確定檢索途徑和檢索策略檢索途徑的確定:檢索途徑即開始查找的入口點。常用的方法有分類檢索途徑、主題檢 索途徑、著者檢索途

14、徑、序號檢索途徑等。檢索策略的確定:所謂檢索策略就是檢索前制定的概念組配和執(zhí)行順序的方案。在計算 機檢索過程中,檢索策略具體表述為檢索式(strategy)。檢索式將各個檢索概念(一般 為表達主題內容的檢索)之間的邏輯關系、位置關系等用檢索系統(tǒng)規(guī)定的各種組配符連 接起來,成為機器可識別和執(zhí)行的命令形式?;脽羝?6選定檢索方法方法的選擇由檢索課題的要求和檢索工具的占有情況而定。如果檢索課題有較高的檢全率 要求,并且檢索課題的主題多、學科范圍廣、研究歷史較長,可以使用順査法;當檢索的 課題較新,研究的歷史短,并需要最新發(fā)表的文獻時,可考慮倒査法;當要系統(tǒng)地、迅速 準確地檢索有關文獻時,可用循環(huán)法,

15、經常進行檢索的人往往都用循環(huán)法;如果熟悉某學 科的發(fā)展史及演變歷史,可用抽査法。幻燈片37索取原始文獻當文獻類型和出版物的全稱明確以后,即可利用各種館藏目錄或聯(lián)合目錄查找所需文獻的 收藏單位,進行借閱或復制;或者通過國內終端直接向國際大型聯(lián)機檢索系統(tǒng)訂購原文。目 前,在一些光盤檢索和網絡信息檢索當中,也可以直接得到原文?;脽羝?8由于科技文獻類型的多樣性,決定了其收藏、管理方式和管理部門的不同,進而索取的 方式和途徑也不同。下面對各類文獻原文的收藏單位作以下介紹,以供參考。圖書期刊和會議文獻科技報告專利文獻標準文獻學位論文產品資料幻燈片39圖書圖書主要收藏于國家、各省、直轄市及高等院校的圖書館

16、,一些信息服務及科研機構也 有少量收藏。另外與主編或出版社聯(lián)系也有可能獲得原文?;脽羝?0期刊和會議文獻期刊主要由各高校圖書館及國家部(委)省、直轄市的科技信息研究所收藏。收藏學 術會議文獻的有:中國科技信息研究所、中國圖書館、中國科學院圖書館和中國國防科 技信息中心等部門。幻燈片41科技報告中國科技信息研究所是我國引進科技報告最主要的單位,上??萍夹畔⒀芯克?也有四大報告(即美國在二次大戰(zhàn)后一直連續(xù)出版的AD報告、PB報告、NASA報告和 DOE報告)的原文館藏;中國國防科技信息中心收藏有大量的AD和NASA報告,中國科 學院文獻中心是收藏PB報告最全的單位;核工業(yè)部情報所收藏有較多的DOE

17、報告。此 外,各研究單位及高等院校也有部分收藏,但是比較零散,不全面?;脽羝?2專利文獻專利文獻主要收藏在國家專利局文獻館,上??萍夹畔⒀芯克?。另外中國國防 科技信息中心、重慶科技情報所也有部分收藏。國際專利文獻中心(Int erna tional Pat ent Documen tation Cen ter,簡稱INPADOC )是一個世界性的專利文獻服務機構。 它搜集世界范圍的專利文獻,將各國每年新出版的專利文獻數(shù)據記錄輸入計算機,提供 專利服務?;脽羝?3標準文獻國內主要的收藏單位是國家技術監(jiān)督局及各部,省、直轄市的技術監(jiān)督局。國 家技術監(jiān)督局收藏了全部國內技術標準和世界發(fā)達國家的技術標

18、準?;脽羝?4學位論文學位論文除收藏于學位的授予單位外,中國圖書館、中國科技信息研究所、中 國社會科學院文獻情報中心是國家法定的學位論文收藏單位。中國圖書館全面負責收藏 整理國內外自然科學、人文科學和社會科學等方面的學位論文;中國科技信息研究所集 中收藏自然科學類學位論文(包括中圖法中下經濟類至調環(huán)境科學類);中國社會 科學院文獻情報中心主要收藏社會科學類學位論文。幻燈片45產品資料產品資料主要收藏于中國科學技術信息研究所、中國國際貿易促進委員會國外新產品樣本、樣品介紹中心等部門?;脽羝?65.2信息檢索的基本方法1順査法倒查法抽查法追溯法綜合法 幻燈片47順査法順查法指按照時間的順序,由遠及

19、近地利用檢索系統(tǒng)進行文獻信息檢索的方法。 這種方法能收集到某一課題的系統(tǒng)文獻,它適用于較大課題的文獻檢索。例如,已知某 課題的起始年代,現(xiàn)在需要了解其發(fā)展的全過程,就可以用順查法從最初的年代開始, 逐漸向近期查找。該方法優(yōu)點是漏檢率、誤檢率比較低,但消耗的勞動量最大。幻燈片48倒査法倒查法是由近及遠,從新到舊,逆著時間的順序利用檢索工具進行文獻信息檢索的方法。 此法的重點是放在近期文獻,只需查到基本滿足需要時為止。使用這種方法可以最快地 獲得新資料,而且近期的資料總是既概括了前期的成果,又反映了最新水平和動向,這 種方法勞動量較小,但是漏檢率較高。主要用于新課題立項前的調研?;脽羝?9抽査法抽

20、查法是針對檢索課題的特點,選擇有關該課題的文獻信息最可能出現(xiàn)或最多出現(xiàn)的時 間段,利用檢索工具進行重點檢索的方法。它適合于檢索某一領域研究高潮很明顯的、 某一學科的發(fā)展階段很清晰的、某一事物出現(xiàn)頻率在某一階段很突出的課題。該方法是 一種花時較少而又能查到較多有效文獻的一種檢索方法。幻燈片50追溯法追溯法是指不利用一般的檢索工具,而是利用已經掌握的文獻末尾所列的參考 文獻,進行逐一地追溯查找“引文”的一種最簡便的擴大情報來源的方法。它還可以從 查到的“引文”中再追溯查找“引文”,像滾雪球一樣,依據文獻間的引用關系,獲得 越來越多的內容相關文獻?;脽羝?1綜合法綜合法又稱為循環(huán)法,這是把上述方法加

21、以綜合運用的方法。綜合法既要利用檢 索工具進行常規(guī)檢索,又要利用文獻后所附參考文獻進行追溯檢索,分期分段地交替使 用幾種方法。即先利用檢索工具(系統(tǒng))檢到一批文獻,再以這些文獻末尾的參考目標 為線索逆行查找,如此循環(huán)進行,直到滿足要求時為止?;脽羝?25.3影響檢索效率的因素在具體的實際操作過程當中,有可能影響我們檢索效率的因素主要有以下幾個 方面:檢索語言的功能檢索途徑的數(shù)量著錄標引的質量檢索策略的優(yōu)劣檢索人員的素質幻燈片535.4信息檢索的基本策略目前聯(lián)機檢索策略的研究正受到人們的廣泛重視,并出現(xiàn)了各種各樣的檢索策略。 其中比較有影響的幾種聯(lián)機檢索策略有:最專指面優(yōu)先策略最少記錄面優(yōu)先策略

22、積木型概念組面策略引文珠形增長策略逐次分餾策略幻燈片541.最專指面優(yōu)先策略Most Specific Face First最專指面優(yōu)先的策略,是指在檢索時,首先選擇最專指的概念組面進行檢索,如果檢索 命中的文獻相當少,那么其他概念組面就不再加到檢索提問式中去;如果檢索命中的文 獻較多,就把其他概念組面加到檢索提問式中,以提高查準率?;脽羝?5最少記錄面優(yōu)先策略最少記錄面優(yōu)先策略與最專指面優(yōu)先策略類似,即先從估計檢索中的文獻記錄數(shù)最少的 概念組面入手,如果檢中的文獻記錄相當少,則不必檢索其他概念組面,反之,則將其 他概念組面加到檢索提問式中去,提高檢索結果的查準率?;脽羝?6.積木型概念組面策略積木型概念組面策略是把檢索課題分解成若干個概念組面,并分別先對這幾個概念組面 進行檢索,在每個概念組面中盡可能全地列舉同義

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論