淺談網絡環(huán)境下搜索引擎的使用_第1頁
淺談網絡環(huán)境下搜索引擎的使用_第2頁
淺談網絡環(huán)境下搜索引擎的使用_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、淺談網絡環(huán)境下搜索引擎的使用摘要隨著網絡信息時代的到來,信息檢索處于一個互聯的網絡系統(tǒng)之中,用戶、信息檢索技術、信息資源構成信息檢索三個根本要素。主要通過Inteet搜索引擎來介紹信息檢索技術。關鍵詞網絡信息檢索搜索引擎一、前言隨著Internet的迅速開展,網上信息正以爆炸性的速度增長,其資源內容幾乎涉及所有領域,已經成為知識、信息的集合體,是人們獲取信息的根本工具。在Internet網上進展閱讀和檢索,就好比進入了世界上最大的圖書館,而這個圖書館里的書刊、雜志、廣告、新聞及各種形式的文獻信息全都沒有規(guī)律地排放著,沒有一個中心目錄將這些信息組織起來。正是因為Internet資源既豐富又分散且

2、處于無序狀態(tài),使得人們在網上查找自己所需的信息并非易事。這時為滿足人眾信息檢索的需求,搜索引擎便應運而生。搜索引擎是指使用某些自動索引軟件來發(fā)現、搜集網絡上的信息,然后對搜集的網頁進展標引,建立一個可供查詢的大型數據庫。Inteet提供了多種不同的檢索工具,它們各自有各自的數據庫、語言、檢索功能和顯示方式,對用戶來說,最重要的就是熟悉這些工具的性能,掌握檢索技巧,進步檢索的命中率。二、搜索引擎的工作原理搜索引擎的工作原理可以簡單概括為:從互聯網上抓取網頁建立索引數據庫在索引數據庫中搜索排序。從互聯網上抓取網頁利用可以從互聯網上自動搜集網頁的Spider又名為:Rbt,raler,rs,ande

3、rs)系統(tǒng)程序,自動訪問互聯網,并沿著任何網頁中的所有URL爬到其它網頁,重復這過程,并把爬過的所有網頁搜集回來。建立索引數據庫由分析索引系統(tǒng)程序對搜集回來的網頁進展分析,提取相關網頁信息包括網頁所在URL、編碼類型、頁面內容包含的關鍵詞、關鍵詞位置、生成時間、大孝與其它網頁的鏈接關系等,根據一定的相關度算法進展大量復雜計算,得到每一個網頁針對頁面內容中及超鏈中每一個關鍵詞的相關度或重要性,然后用這些相關信息建立網頁索引數據庫。在索引數據庫中搜索排序當用戶輸入關鍵詞搜索后,由搜索系統(tǒng)程序從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁。因為所有相關網頁針對該關鍵詞的相關度早已算好,所以只需按照

4、現成的相關度數值排序,相關度越高,排名越靠前。最后由頁面生成系統(tǒng)將搜索結果的鏈接地址和頁面內容摘要等內容組織起來返回給用戶。說到這里,網絡搜索引擎的根本工作原理根本上讓大家理解了。三、檢索技巧一)科學選擇關鍵詞。由于搜索引擎智能化程度的影響,它只能在現存的數據庫中查找匹配的關鍵詞,因此,這種匹配相比照擬盲目,我們在選擇關鍵詞時,要注意兩方面的問題,才有可能得到較好的搜索效果。二)使用雙引號進展準確查詢。假如查找的是一個詞組或多個漢字,最好的方法就是將它們用雙引號括起來,這樣得到的結果最少、最準確。三)使用加號(+)、減號(一)限定查找。很多搜索引擎都支持在搜索詞前冠以加號(+)限定搜索結果中必

5、須包含的詞匯,用減號(一)限定搜索結果不能包含的詞匯。四)靈敏運用使用通配符。很多搜索引擎支持通配符號,如“*代表一連串字符,“?代表單個字符。五)使用邏輯詞輔助查找。比擬大的搜索引擎都支持使用邏輯詞進展更復雜的搜索界定,常用的有:AND(和)、R(或)、NT(否)及NEAR(兩個單詞的靠近程度),恰當應用它們可以使搜索結果非常準確。另外,也可以使用括號將搜索詞分別組合,如(新聞R足球)AND米盧)NT新聞R足球)六)有針對性地選擇搜索引擎。用不同的搜索引擎進展查詢得到的結果常常有很大的差異,這是因為它們的設計目的和開展走向存在著許多的不同,比方:Dnlad是針對軟件類的搜索引擎,可搜尋大量的

6、自由軟件和共享軟件。驅動之家主要是提供查找驅動程序及硬件廠商信息。七)使用元詞檢索。大多數搜索引擎都支持“元詞(etards)功能,用戶把元詞放在關鍵詞的前面,就可以告訴搜索引擎你想要檢索的內容具有哪些明確的特征。例如,你在搜索引擎中輸入“title:清華大學,就可以查到網頁標題中帶有清華大學的網頁。其他元詞還包括:iage,用于檢索圖片;link,用于檢索鏈接到某個選定網站的頁面;URL,用于檢索地址中帶有某個關鍵詞的網頁。八)細化查詢。許多搜索引擎都提供了對搜索結果進展細化與再查詢的功能,如有的搜索引擎在結果中有查詢類似網頁的按鈕,還有一些那么可以對得到的結果進展新一輪的查詢。九盡可能將搜

7、索范圍限制在特定的領域里。比方在yah中文網站中,你要查找的是與電腦相關的知識,那么你沒有必要讓搜索引擎在休閑與運動、安康與醫(yī)藥、藝術與人文等其他分類中查找。你可以進入“電腦與因特網這一類,選中“檢索此目錄下的網站。然后再開場搜索。四、完畢語要完成一個有效的搜索,首先要確定要檢索的主題,選擇適宜的檢索工具、抽取適當的關鍵詞。為防止可能出現搜索結果的冗余性,要盡可能限制查詢范圍,正確構造檢索式。同時要使用邏輯條件限制及模糊或準確查詢的功能保證能真正檢索到我們所需的網絡信息資源??傊?,只要掌握一定的方法與技巧并經常理論利用搜索引擎一定能從網上獲取許多有價值的信息。由于網上信息具有動態(tài)性、多變性,今天能看到的信息也許明天便不復存在,要注意對檢索到的有價值信息的進展保存。參考文獻1.符紹宏,雷菊霞因特網信息資源檢索與利用北京:清華大學出版社,20002.陳春陽.如何利用網絡搜索引擎檢索網絡信息資源.蘭州工業(yè)高等專科學校學報.20223.劉毓華.網絡信息資源檢索初探.現代情報,20224.陳永斌,邱葦網絡時代搜索引擎帶來的社會問題J圖書情報lT作,2022;(3):l191225.宋蓓玲,王新淺析構建網絡信息檢索體系J現代情報2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論