第7章-網(wǎng)絡(luò)信息資源檢索與利用_第1頁(yè)
第7章-網(wǎng)絡(luò)信息資源檢索與利用_第2頁(yè)
第7章-網(wǎng)絡(luò)信息資源檢索與利用_第3頁(yè)
第7章-網(wǎng)絡(luò)信息資源檢索與利用_第4頁(yè)
第7章-網(wǎng)絡(luò)信息資源檢索與利用_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章

網(wǎng)絡(luò)信息資源檢索與利用

搜索引擎搜索引擎(searchengine),1995年開(kāi)始

搜索引擎指自動(dòng)從因特網(wǎng)搜集信息,經(jīng)過(guò)一定整理以后,提供給用戶進(jìn)行查詢的系統(tǒng)。因特網(wǎng)上的信息浩瀚萬(wàn)千,而且毫無(wú)秩序,所有的信息象汪洋上的一個(gè)個(gè)小島,網(wǎng)頁(yè)鏈接是這些小島之間縱橫交錯(cuò)的橋梁,而搜索引擎,則為用戶繪制一幅一目了然的信息地圖,供用戶隨時(shí)查閱。搜索引擎站---“網(wǎng)絡(luò)門(mén)戶”1、搜索引擎的工作原理

信息的收集處理信息的檢索輸出2、搜索引擎的分類(lèi)

目錄式搜索引擎:以人工方式或半自動(dòng)方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類(lèi)框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類(lèi)搜索引擎因?yàn)榧尤肓巳说闹悄?,所以信息?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。這類(lèi)搜索引擎的代表是:yahoo!、Galaxy、OpenDirectory……

Shou(搜狐)、Sina(新浪)….目錄式搜索引擎機(jī)器人搜索引擎由一個(gè)稱(chēng)為蜘蛛(Spider)的機(jī)器人程序以某種策略自動(dòng)地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫(kù),并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁(yè)的全文檢索服務(wù)。該類(lèi)搜索引擎的優(yōu)點(diǎn)是信息量大、更新及時(shí)、毋需人工干預(yù),缺點(diǎn)是返回信息過(guò)多,有很多無(wú)關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。這類(lèi)搜索引擎的代表是:AltaVista、NorthernLight、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國(guó)內(nèi)代表為:"天網(wǎng)"、悠游、OpenFind等。

元搜索引擎元搜索引擎:這類(lèi)搜索引擎沒(méi)有自己的數(shù)據(jù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁(yè)的全文檢索。這類(lèi)搜索引擎的優(yōu)點(diǎn)是返回結(jié)果的信息量更大、更全,缺點(diǎn)是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類(lèi)搜索引擎的代表是WebCrawler、InfoMarket等。

常用的一些搜索引擎網(wǎng)址(一)http://雅虎是中國(guó)最著名的目錄索引,是搜索引擎開(kāi)山鼻祖之一。它收錄了全球資訊網(wǎng)上數(shù)以萬(wàn)計(jì)的中文網(wǎng)站,不論你要找的網(wǎng)站是用國(guó)標(biāo)碼簡(jiǎn)體字、大五碼繁體字還是圖形中文,都可以在這里找到。1999年9月檢索途徑:通過(guò)分類(lèi)目錄、關(guān)鍵詞檢索檢索方法與技巧:支持布爾邏輯檢索(不支持“OR”)、可以使用引號(hào),強(qiáng)調(diào)“+”、“-”、指定關(guān)鍵字出現(xiàn)的段落(加t:、加u:)

英語(yǔ)不好也可以輕松瀏覽英文網(wǎng)頁(yè)

檢索結(jié)果:根據(jù)關(guān)聯(lián)程度排序同時(shí)列出“相關(guān)……”其它:與Google合作常用的一些搜索引擎網(wǎng)址(二)

http://1998年創(chuàng)立,搜狐“分類(lèi)與搜索”已收錄網(wǎng)站四十多萬(wàn),已形成龐大的中文網(wǎng)站數(shù)據(jù)庫(kù)。搜狐的目錄導(dǎo)航式搜索引擎完全是由人工加工而成,相比機(jī)器人加工的搜索引擎來(lái)講具有很高的精確性、系統(tǒng)性和科學(xué)性。

檢索途徑:通過(guò)分類(lèi)目錄、關(guān)鍵詞檢索

檢索方法與技巧:支持布爾邏輯檢索、“-”、“&”、“/”、“()”、空格檢索結(jié)果:根據(jù)關(guān)聯(lián)程度排序;返回五種分類(lèi)結(jié)果其它:直通車(chē);搜狐黃頁(yè)常用的一些搜索引擎網(wǎng)址(三)http://

1997年,(簡(jiǎn)體中文)提供有類(lèi)目檢索和網(wǎng)站檢索兩種方式。支持AND和“-”等條件查詢。以搜索精度高、速度快成為最受歡迎的搜索引索,是目前搜索的領(lǐng)軍人物。檢索方法與技巧:模塊分類(lèi)、關(guān)鍵詞檢索;支持布爾邏輯檢索(自動(dòng)添加AND),支持“OR”,“-”前面加空格;忽略常見(jiàn)詞;對(duì)通配符支持有限檢索特色:網(wǎng)頁(yè)快照、手氣不錯(cuò);相似網(wǎng)頁(yè)、查詢電話號(hào)碼、查找PDF文件、股票報(bào)價(jià)、查找字典釋意、用Google查找地圖、工具條服務(wù)、網(wǎng)頁(yè)翻譯、單詞糾錯(cuò)、繁簡(jiǎn)轉(zhuǎn)換;使用偏好常用的一些搜索引擎網(wǎng)址(四)

中國(guó)提供搜索引擎的主要網(wǎng)站中,超過(guò)80%由百度提供。1999年底,百度成立于美國(guó)硅谷,2000年百度回中國(guó)發(fā)展。是國(guó)內(nèi)唯一商業(yè)化的全文搜索引擎,提供搜狐、新浪、263、TOM等站點(diǎn)的搜索服務(wù)。檢索方法與技巧:模塊分類(lèi)、關(guān)鍵詞檢索;要求“一字不差”,支持布爾邏輯檢索(可以用空格代替AND/+);可以使用檢索語(yǔ)法檢索特色:

百度快照、自動(dòng)糾錯(cuò)、百度搜霸;使用偏好;百度與google比較搜索英文不必說(shuō)用google,搜索中文呢?很多人并不了解它們更新的情況,google發(fā)展早,因而它貯存了大量舊的信息,百度發(fā)展遲,信息較新。更新速度:對(duì)中文google一般半月至一月一更新,而且僅搜索到三級(jí)鏈接,三級(jí)以下便不在搜索,那么我如何看到最新的google搜索的結(jié)果呢?這個(gè)站點(diǎn):/,可見(jiàn)google采用不同服務(wù)器逐步更新的。百度的更新較快,半月一次,最快一周。百度和google語(yǔ)法的應(yīng)用找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT這些文件名都是網(wǎng)友想找的重點(diǎn),至于各是什么類(lèi)型文件,請(qǐng)上網(wǎng)查一下便知道了,這里不多說(shuō)了。尤其老板讓你做個(gè)powerpoint,找不到圖怎么辦?用google去搜索?;舅阉髡Z(yǔ)法——查找文件方法是利用語(yǔ)法filetype:后綴名。如找PDF文件,在正常關(guān)鍵詞后面加filetype:PDF即可,搜索結(jié)果全是PDF文件。找特定題目的網(wǎng)頁(yè)語(yǔ)法intitle:網(wǎng)站查找友情鏈接:

"link:"(英文單字link后加冒號(hào))用于搜索鏈接到某個(gè)URL地址的網(wǎng)頁(yè)??梢粤私庥心男┚W(wǎng)頁(yè)把鏈接指向您的網(wǎng)頁(yè)。基本搜索語(yǔ)法——查找站點(diǎn)查找特定站點(diǎn):

site:www.*.com如金庸古龍site:

但不可加入http://或/這類(lèi),否則是錯(cuò)的。查找美國(guó)教育網(wǎng)上的宇宙大爆炸jpg圖片搜索:“BIGBANGfiletype:jpg

site:edu”結(jié)果:搜索有關(guān)BIGBANGfiletype:jpg

site:edu

的圖片Site可將搜索定位于某一個(gè)域名上,有利于縮小搜索范圍,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大學(xué)內(nèi)有用的資源。site:tw,site:edu.tw,site:.......

這是定位于國(guó)家或地區(qū),將搜索局限于某些國(guó)家或地區(qū),或加上edu,則是這些國(guó)家或地區(qū)的大學(xué),效果自然更好。特殊語(yǔ)法:inurl

“inurl”語(yǔ)法返回的網(wǎng)頁(yè)鏈接中包含第一個(gè)關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁(yè)文檔中。有很多網(wǎng)站把某一類(lèi)具有相同屬性的資源名稱(chēng)顯示在目錄名稱(chēng)或者網(wǎng)頁(yè)名稱(chēng)中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語(yǔ)法找到這些相關(guān)資源鏈接,然后,用第二個(gè)關(guān)鍵詞確定是否有某項(xiàng)具體資料。INURL語(yǔ)法和基本搜索語(yǔ)法的最大區(qū)別在于,前者通常能提供非常精確的專(zhuān)題資料。

示例:查找MIDI曲“滄海一聲笑”

搜索:inurl:midi

滄海一聲笑結(jié)果:已搜索有關(guān)inurl:midi

滄海一聲笑的中文(簡(jiǎn)體)網(wǎng)頁(yè)。

注意:“inurl:”后面不能有空格,GOOGLE也不對(duì)URL符號(hào)如“/”進(jìn)行搜索。例如,GOOGLE會(huì)把“cgi-bin/phf”中的“/”當(dāng)成空格處理。google其它功能—查縮略詞的全稱(chēng)利用google查縮略詞的全稱(chēng),如果寫(xiě)作時(shí)突然忘了某個(gè)縮略詞的全稱(chēng),當(dāng)時(shí)手頭若有金山詞霸等軟件則是易事,若無(wú)可考慮使用google,將其中文名與其縮略名作為關(guān)鍵詞搜索,效果很好.google其它功能——查英文單詞的中文名稱(chēng)google是最全的英中詞典,你找到一個(gè)英文詞,卻不知中文怎么辦?google其它功能——搜索電話如果想知道某個(gè)公司的電話,往往許多人喜歡這樣選關(guān)鍵詞:公司名稱(chēng)tel,結(jié)果得到的根本不是你需要的。如果你知道這個(gè)公司的性質(zhì)或?qū)儆谑裁吹胤降?,則可以這樣搜索:區(qū)號(hào)公司名,這比上述關(guān)鍵詞要有效得多,這也涉及到搜索效率的問(wèn)題。常用的一些搜索引擎網(wǎng)址(五)元搜索引擎,1995年,Washington大學(xué)開(kāi)發(fā),2000年被Infospace收購(gòu)。檢索方法與技巧:模塊分類(lèi)、關(guān)鍵詞檢索;支持布爾邏輯檢索;可以使用檢索語(yǔ)法;搜索引擎的查詢技巧

分析研究對(duì)象,選用搜索引擎

確定搜索途徑,使用不同方式

正確選用搜索引擎的搜索選項(xiàng)

正確選用搜索引擎的各項(xiàng)搜索功能

根據(jù)反饋,修改檢索

縮小搜索范圍:利用二次搜索(重新查詢、在結(jié)果中再查、在結(jié)果中去除)、使用檢索語(yǔ)法構(gòu)造恰當(dāng)?shù)臋z索表達(dá)式、選用正確的關(guān)鍵詞。擴(kuò)大搜索范圍:使用同義詞或近義詞、使用檢索語(yǔ)法or和截詞檢索、使用多個(gè)搜索引擎和元搜索引擎如何提高查全率?選擇上位詞和相關(guān)詞;如:查找關(guān)于孫中山的文獻(xiàn),先用孫中山查,再用孫文、國(guó)父查找。調(diào)節(jié)檢索式的網(wǎng)羅度,刪除不必要的組面,如and(并且);進(jìn)行族性檢索(分類(lèi)檢索或用or

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論