版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
※了解信息檢索的定義和分類?!私馑阉饕娴姆诸惡驮怼!莆粘S眯畔z索技術(shù)?!莆帐褂弥W(wǎng)檢索文獻(xiàn)的方法。項(xiàng)目七
信息檢索任務(wù)一信息檢索概述一、信息檢索的定義和分類1.信息檢索的定義信息檢索是用戶獲取信息的主要方式,是查詢信息的方法和手段。信息檢索有廣義和狹義之分。廣義的信息檢索是將信息按一定的方式進(jìn)行加工、整理、組織并存儲起來,再根據(jù)用戶特定的需求將相關(guān)信息準(zhǔn)確地查找出來的過程。因此,信息檢索也稱信息的存儲與檢索。狹義的信息檢索僅指信息查詢,即用戶根據(jù)需要,采用某種方法或借助檢索工具,從信息集合中找出所需要的信息。2.信息檢索的分類根據(jù)檢索手段的不同,信息檢索可分為手工檢索和機(jī)械檢索。手工檢索是以手工翻檢的方式,通過圖書、期刊、目錄卡片等工具來檢索信息的一種手段,其優(yōu)點(diǎn)是回溯性好,沒有時(shí)間限制;缺點(diǎn)是費(fèi)時(shí),效率低。機(jī)械檢索則是利用計(jì)算機(jī)檢索數(shù)據(jù)庫的過程,其優(yōu)點(diǎn)是速度快;缺點(diǎn)是回溯性不好,并且有時(shí)間限制。在機(jī)械檢索過程中,網(wǎng)絡(luò)文獻(xiàn)檢索最為迅速,是信息檢索的主流。根據(jù)檢索對象的不同,信息檢索又可分為文獻(xiàn)檢索、數(shù)據(jù)檢索和事實(shí)檢索。這3種檢索的主要區(qū)別在于數(shù)據(jù)檢索和事實(shí)檢索需要檢索出包含在文獻(xiàn)中的信息本身,而文獻(xiàn)檢索檢索出包含所需要信息的文獻(xiàn)即可。二、常用的信息檢索技術(shù)是一種較為成熟且流行的檢索技術(shù),其基礎(chǔ)是邏輯運(yùn)算。常用的邏輯運(yùn)算符有邏輯與(AND)、邏輯或(OR)和邏輯非(NOT)3種1.布爾邏輯檢索也稱臨近檢索,是用一些特定的位置算符來表達(dá)檢索詞與檢索詞之間的順序和詞間距的檢索技術(shù)。位置算符主要有(W)算符、(nW)算符、(N)算符、(nN)算符、(F)算符及(S)算符2.位置檢索是預(yù)防漏檢、提高查全率的一種常用檢索技術(shù),其含義是,用截?cái)嗟脑~的一個(gè)局部進(jìn)行檢索,并認(rèn)為凡是滿足這個(gè)詞局部中的所有字符的文獻(xiàn),都為命中的文獻(xiàn)3.截詞檢索是一種在計(jì)算機(jī)檢索時(shí),將檢索范圍限定在數(shù)據(jù)庫特定的字段中的檢索技術(shù)。常用的檢索字段主要有標(biāo)題、摘要、關(guān)鍵詞、作者、作者單位及參考文獻(xiàn)等4.字段限制檢索三、信息檢索的原理和方法1.信息檢索的原理010203普通法追溯法分段法三、信息檢索的原理和方法是利用書目、文摘、索引等檢索工具進(jìn)行文獻(xiàn)資料查找的方法是利用已有文獻(xiàn)所附的參考文獻(xiàn)不斷追蹤查找的方法是追溯法和普通法的綜合,它將前兩種方法分期、分段交替使用,直至查到所需資料2.信息檢索的方法任務(wù)二搜索引擎設(shè)置一、搜索引擎的分類和原理1全文搜索引擎它們從互聯(lián)網(wǎng)中提取各個(gè)網(wǎng)站的信息,建立起數(shù)據(jù)庫,并能檢索與用戶查詢條件相匹配的記錄,最后按一定的排列順序返回結(jié)果2目錄式搜索引擎它是指以人工方式或半自動方式搜集信息,由搜索引擎的編輯人員查看信息之后,依據(jù)一定的標(biāo)準(zhǔn)對網(wǎng)絡(luò)資源進(jìn)行選擇、評價(jià),由人工形成信息摘要,并將信息置于事先確定的分類框架中而形成的主題目錄3元搜索引擎在接受用戶查詢請求后,通過一個(gè)統(tǒng)一的界面,同時(shí)在多個(gè)搜索引擎上搜索,并將結(jié)果返回給用戶1.搜索引擎的分類一、搜索引擎的分類和原理1234搜索引擎通過一種特定軟件跟蹤網(wǎng)頁的鏈接,從一個(gè)鏈接“爬到”另一個(gè)鏈接,像蜘蛛在蜘蛛網(wǎng)上爬行一樣,所以被稱為“蜘蛛”或“機(jī)器人”爬行搜索引擎通過“蜘蛛”跟蹤鏈接爬行到網(wǎng)頁,并將爬行的數(shù)據(jù)存入原始頁面數(shù)據(jù)庫,其中的頁面數(shù)據(jù)與用戶瀏覽器得到的HTML完全一樣抓取存儲搜索引擎將“蜘蛛”抓取回來的頁面,進(jìn)行各種預(yù)處理預(yù)處理用戶在搜索框輸入關(guān)鍵詞后,排名程序調(diào)用索引庫數(shù)據(jù),計(jì)算排名顯示給用戶,排名過程與用戶直接互動排名2.搜索引擎的原理二、常用的搜索引擎是全球最大的中文搜索引擎,它致力于向用戶提供“簡單,可依賴”的信息獲取方式1.百度搜索引擎通過一個(gè)統(tǒng)一的用戶界面,幫助用戶在多個(gè)搜索引擎中選擇和利用合適的搜索引擎來實(shí)現(xiàn)檢索操作,是對分布于網(wǎng)絡(luò)中的多種檢索工具的全局控制機(jī)制2.360搜索引擎是搜狐公司推出的全球首個(gè)第三代互動式中文搜索引擎,它致力于對中文互聯(lián)網(wǎng)信息的深度挖掘,幫助用戶加快信息獲取速度,為用戶創(chuàng)造價(jià)值3.搜狗搜索引擎任務(wù)三在中國知網(wǎng)中查文獻(xiàn)一、使用知網(wǎng)檢索文獻(xiàn)1.進(jìn)入知網(wǎng)在瀏覽器地址欄中輸入中國知網(wǎng)的網(wǎng)址,打開中國知網(wǎng)首頁。2.檢索分別單擊首頁上部的“文獻(xiàn)檢索”“知識元檢索”“引文檢索”選項(xiàng)卡,便可進(jìn)行相應(yīng)類別的檢索。(1)快速檢索(2)高級檢索(3)專業(yè)檢索(4)作者發(fā)文檢索二、文獻(xiàn)處理知網(wǎng)的注冊用戶可下載和瀏覽文獻(xiàn)全文,系統(tǒng)提供了CAJ和PDF兩種格式4.下載檢索出的結(jié)果可按照主題、學(xué)科、發(fā)表年度、研究層次、文獻(xiàn)類型、文獻(xiàn)來源、作者、機(jī)構(gòu)和基金進(jìn)行分組瀏覽3.分組瀏覽檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于FPC的多約束下DP船軌跡跟蹤控制方法研究
- 面向地面移動目標(biāo)無人機(jī)跟蹤控制方法研究
- 提前規(guī)劃考試復(fù)習(xí)時(shí)間表
- 打造專注力的秘密武器
- 二零二五年度專業(yè)音響設(shè)備租賃服務(wù)協(xié)議4篇
- 網(wǎng)絡(luò)美工工作總結(jié)
- 廚房衛(wèi)生安全管理
- 銀行業(yè)金融科技創(chuàng)新顧問工作總結(jié)
- 2024版毛概知識點(diǎn)
- 【臨床醫(yī)學(xué)】嚴(yán)重創(chuàng)傷的緊急救治
- 帶狀皰疹護(hù)理查房
- 平衡計(jì)分卡-化戰(zhàn)略為行動
- 幼兒園小班下學(xué)期期末家長會PPT模板
- 礦山安全培訓(xùn)課件-地下礦山開采安全技術(shù)
- 幼兒教師干預(yù)幼兒同伴沖突的行為研究 論文
- 湖南省省級溫室氣體排放清單土地利用變化和林業(yè)部分
- 《腰椎間盤突出》課件
- simotion輪切解決方案與應(yīng)用手冊
- 柴油發(fā)電機(jī)運(yùn)行檢查記錄表格
- DSC曲線反映PET得結(jié)晶度
- 科學(xué)素養(yǎng)全稿ppt課件(完整版)
評論
0/150
提交評論