




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、Internet 信息檢索與利用Internet Internet 的基本知識的基本知識WWWWWW搜索引擎搜索引擎Internet 的基本知識的基本知識Internet三大基本應用三大基本應用Internet需要具備的條件需要具備的條件Internet中的基本概念和術語中的基本概念和術語Internet三大基本應用三大基本應用1.遠程登陸遠程登陸(TELNET)2.電子郵件電子郵件-發(fā)送或接收信息發(fā)送或接收信息(E-MAIL)3.文件傳輸文件傳輸-通過文件傳輸協(xié)議通過文件傳輸協(xié)議(FTP), 實現(xiàn)推拉式服務實現(xiàn)推拉式服務. 1.1.方便客戶端的訪問方便客戶端的訪問設置統(tǒng)一設置統(tǒng)一 瀏覽器(瀏
2、覽器(www www 或稱或稱WebWeb瀏覽器);瀏覽器);2.2.網(wǎng)上計算機都能通用網(wǎng)上計算機都能通用設置統(tǒng)一設置統(tǒng)一 標注語言(標注語言(HTMLHTML超文本標注語言);超文本標注語言);(超文本語言超文本語言瀏覽器與服務器之瀏覽器與服務器之間的一種通訊協(xié)議間的一種通訊協(xié)議)3.3.全世界統(tǒng)一的頁面指針全世界統(tǒng)一的頁面指針URLURL統(tǒng)統(tǒng)一資源定位格式。一資源定位格式。Internet需要具備三方面的條件需要具備三方面的條件1.1.調制解調器(調制解調器(MODEMMODEM):): 戲稱戲稱“貓貓”,是上網(wǎng)必需的設備。,是上網(wǎng)必需的設備。它可以將計算機的數(shù)字信號轉換(調它可以將計算機
3、的數(shù)字信號轉換(調制制ModulationModulation)成模擬信號,通過)成模擬信號,通過電話線路傳送到另一臺計算機(比如電話線路傳送到另一臺計算機(比如服務器)上,接受端用它的服務器)上,接受端用它的 Modem Modem 將將其還原(解調其還原(解調demodulationdemodulation)為計)為計算機能識別的數(shù)字信號,從而實現(xiàn)雙算機能識別的數(shù)字信號,從而實現(xiàn)雙方的信息交換方的信息交換 InternetInternet中的幾個基本概念和術語中的幾個基本概念和術語 2.2.服務器(服務器(SERVERSERVER):): 一臺功能強大的計算機,有一臺功能強大的計算機,有較
4、高的速度、較大的存儲空間以較高的速度、較大的存儲空間以及斷電保護措施等。它能夠在網(wǎng)及斷電保護措施等。它能夠在網(wǎng)絡中為用戶提供通訊、文件共享、絡中為用戶提供通訊、文件共享、網(wǎng)絡打印等功能。網(wǎng)絡打印等功能。 3.3.WWW WWW (World Wide WebWorld Wide Web):): WWW WWW 是一個基于超文本方式的信息檢索工具,是一個基于超文本方式的信息檢索工具,它為用戶提供了一種友好的信息查詢接口,是它為用戶提供了一種友好的信息查詢接口,是 INTERNET INTERNET 上的信息服務系統(tǒng)。它把上的信息服務系統(tǒng)。它把 INTERNET INTERNET 上不同地點的相關
5、信息聚集起來,通過上不同地點的相關信息聚集起來,通過 WWW WWW 瀏瀏覽器(又叫做覽器(又叫做 WEB WEB 瀏覽器)檢索它們,無論用瀏覽器)檢索它們,無論用戶所需的信息在什么地方,只要瀏覽器為用戶檢戶所需的信息在什么地方,只要瀏覽器為用戶檢索到之后,就可以將這些信息(文字、圖片、動索到之后,就可以將這些信息(文字、圖片、動畫、聲音等)畫、聲音等)“提取提取”到用戶的計算機屏幕上。到用戶的計算機屏幕上。WWW WWW 采用了超文本鏈接,你只需輕輕點擊鼠標,采用了超文本鏈接,你只需輕輕點擊鼠標,就可以很方便地從一個信息頁轉移到另一個信息就可以很方便地從一個信息頁轉移到另一個信息頁頁 4.4
6、.主頁(主頁(HOMEPAGE HOMEPAGE ):): 全稱應該是 WWW 主頁。它指的是 WWW 服務的起始裝入信息頁,是 WWW 用戶可以看見的第一信息界面,你連接到主頁后,除了可以直接在主頁了解到主頁制作者的一般信息外,還可以可以又進入到另外的一個畫面再進一步地獲取到更多的信息。也就通過主頁上定義的超級鏈(hyperlink)訪問網(wǎng)頁。 5.5.電子郵件(電子郵件(E-MAILE-MAIL):): 這是一種最常用的這是一種最常用的 INTERNET INTERNET 功能,功能,也是一種最便捷的利用計算機和通信網(wǎng)也是一種最便捷的利用計算機和通信網(wǎng)絡傳遞信息的現(xiàn)代化手段。電子郵件的絡傳
7、遞信息的現(xiàn)代化手段。電子郵件的傳遞由傳遞由 SMTP SMTP 協(xié)議來完成,網(wǎng)絡用戶可協(xié)議來完成,網(wǎng)絡用戶可以通過以通過 INTERNET INTERNET 與全世界的與全世界的INTERNET INTERNET 用戶收發(fā)信件。電子郵件的內(nèi)容,不僅用戶收發(fā)信件。電子郵件的內(nèi)容,不僅僅包含文字,還可以包含圖像、聲音,僅包含文字,還可以包含圖像、聲音,動畫等多媒體信息動畫等多媒體信息. . 6.HTTP6.HTTP(Hypertext Transfer Hypertext Transfer ProtocolProtocol):): 超文本傳輸協(xié)議。該協(xié)議經(jīng)超文本傳輸協(xié)議。該協(xié)議經(jīng)常用來在網(wǎng)絡上傳送
8、常用來在網(wǎng)絡上傳送 WEB WEB 頁。頁。當用戶以當用戶以 http:/ http:/ 開始一個鏈開始一個鏈接的名字時,是告訴瀏覽器去接的名字時,是告訴瀏覽器去訪問使用訪問使用 HTTP HTTP 的的 WEB WEB 頁。頁。 7.7.URLURL(Uniform Resource LocatorUniform Resource Locator):): 統(tǒng)一資源定位器。是統(tǒng)一資源定位器。是 WEB WEB 的地址的地址編碼編碼,WEB ,WEB 上所有能訪問的資源都有一上所有能訪問的資源都有一個唯一的個唯一的 URL URL 。URL URL 包括:所用的傳包括:所用的傳輸協(xié)議,服務器名稱
9、、文件的完整路徑。輸協(xié)議,服務器名稱、文件的完整路徑。例如:在瀏覽器例如:在瀏覽器 URL URL 處鍵入處鍵入 http:/http:/ 就可以訪問西就可以訪問西安科技商貿(mào)職業(yè)學院的網(wǎng)站了。安科技商貿(mào)職業(yè)學院的網(wǎng)站了。 8.8.IPIP地址(地址(INTERNET PROTOCOLINTERNET PROTOCOL):): 互聯(lián)網(wǎng)絡協(xié)議地址?;ヂ?lián)網(wǎng)絡協(xié)議地址。INTERNET INTERNET 上每上每臺主機都有一個唯一的地址(或者叫名臺主機都有一個唯一的地址(或者叫名字),它是數(shù)字形式的一組地址,例如:字),它是數(shù)字形式的一組地址,例如:00202.195.149
10、.100,它是計算機在網(wǎng)絡上,它是計算機在網(wǎng)絡上的數(shù)字標識,一般分為兩部分:網(wǎng)絡地的數(shù)字標識,一般分為兩部分:網(wǎng)絡地址(址(NETIDNETID)、主機地址()、主機地址(HOSTIDHOSTID)。)。IPIP地址分為五類地址分為五類:A:A、B B、C C、D D、E E,常用的,常用的是是 B B、C C 兩類。兩類。 10.10.搜索引擎搜索引擎(Search Engine):(Search Engine): 搜索引擎是搜索引擎是WWW WWW 瀏覽器查詢信息搜索瀏覽器查詢信息搜索工具工具, , 是一個用來查詢搜索世界各地是一個用來查詢搜索世界各地 INTERNET INTERNET
11、網(wǎng)絡資源的網(wǎng)絡資源的 WEB WEB 服務器。它服務器。它就象一本書的目錄,就象一本書的目錄,INTERNET INTERNET 上各個站上各個站點的網(wǎng)址就象是頁碼。你可以通過關鍵點的網(wǎng)址就象是頁碼。你可以通過關鍵字(字(keywordkeyword)或者主題分類的方式查找)或者主題分類的方式查找感興趣的信息所在的感興趣的信息所在的 WEB WEB 頁面。是網(wǎng)上頁面。是網(wǎng)上動態(tài)檢索工具。動態(tài)檢索工具。 搜索引擎(搜索引擎(Search EnginesSearch Engines) 是一種利用網(wǎng)絡自動搜索技術,對是一種利用網(wǎng)絡自動搜索技術,對因特網(wǎng)各種資源進行標引,并為檢索者因特網(wǎng)各種資源進行標
12、引,并為檢索者提供檢索的工具。人們常把搜索引擎稱提供檢索的工具。人們常把搜索引擎稱之為網(wǎng)絡之門,它包括萬維網(wǎng)搜索引擎、之為網(wǎng)絡之門,它包括萬維網(wǎng)搜索引擎、新聞論壇搜索引擎、黃頁搜索引擎、元新聞論壇搜索引擎、黃頁搜索引擎、元搜索引擎等多種類型的搜索引擎,數(shù)量搜索引擎等多種類型的搜索引擎,數(shù)量已達數(shù)百種。已達數(shù)百種。主要可概括為以下幾個過程:主要可概括為以下幾個過程:(1 1)信息的采集和存儲信息的采集和存儲 搜索引擎一般采用自動方式收集和搜索引擎一般采用自動方式收集和存儲信息,即運用存儲信息,即運用“網(wǎng)絡機器人網(wǎng)絡機器人”自動自動運行的軟件,搜索引擎追尋運行的軟件,搜索引擎追尋WWWWWW網(wǎng)上的
13、鏈網(wǎng)上的鏈接行進,找到接行進,找到WebWeb頁并將它們調出,搜索頁并將它們調出,搜索引擎將自動給引擎將自動給WebWeb頁上的某些字或全部字頁上的某些字或全部字作上索引,形成目標摘要格式文件后,作上索引,形成目標摘要格式文件后,再形成網(wǎng)絡可訪問的數(shù)據(jù)庫。再形成網(wǎng)絡可訪問的數(shù)據(jù)庫。搜索引擎的工作原理搜索引擎的工作原理 (2)信息索引的建立)信息索引的建立 信息采集和存儲后,要建立索信息采集和存儲后,要建立索引查詢系統(tǒng),它是同建庫系統(tǒng)配套引查詢系統(tǒng),它是同建庫系統(tǒng)配套的子系統(tǒng),決定索引時空比、布爾的子系統(tǒng),決定索引時空比、布爾邏輯操作、表達式匹配、結構化和邏輯操作、表達式匹配、結構化和非結構化文
14、件處理、詞語匹配、匹非結構化文件處理、詞語匹配、匹配相關性排序等。配相關性排序等。 建立信息索引就是創(chuàng)建文檔信息建立信息索引就是創(chuàng)建文檔信息的特征記錄,使檢索者能夠快速地的特征記錄,使檢索者能夠快速地檢索到所需的信息。檢索到所需的信息。 (3 3)檢索界面的建立)檢索界面的建立 搜索引擎檢索界面接受檢索者搜索引擎檢索界面接受檢索者提交的查詢請求(包括查詢內(nèi)容及提交的查詢請求(包括查詢內(nèi)容及邏輯關系),并根據(jù)檢索者所輸入邏輯關系),并根據(jù)檢索者所輸入的關鍵詞在其索引中查找,并尋找的關鍵詞在其索引中查找,并尋找相應的相應的WebWeb頁地址。頁地址。(4 4)搜索結果的相關性處理)搜索結果的相關性
15、處理 搜索引擎的檢索結果通常很龐大,大搜索引擎的檢索結果通常很龐大,大量的文件使得檢索者無法逐一瀏覽。搜量的文件使得檢索者無法逐一瀏覽。搜索引擎可以按文件的相關程度進行排列,索引擎可以按文件的相關程度進行排列,最相關的文件通常排在最前面。最相關的文件通常排在最前面。1.單詞檢索單詞檢索2.“詞組詞組/短語檢索短語檢索”也稱也稱“完全符合檢索完全符合檢索” 檢索結果必須含有與提問式完全一樣檢索結果必須含有與提問式完全一樣 ( 包括次序包括次序 ) 的字串。在搜索比較專指的的字串。在搜索比較專指的文獻時,就要使用雙引號(文獻時,就要使用雙引號(“”“”)進行)進行詞組檢索。但一些專用語盡管沒有加引
16、詞組檢索。但一些專用語盡管沒有加引號,仍可作為專用語處理。例如:號,仍可作為專用語處理。例如:mother-in-law搜索引擎的檢索特性搜索引擎的檢索特性3 布爾邏輯符號布爾邏輯符號1).與符號與符號: & ,“AND , , +2).或符號或符號: |,or,OR3).非符號非符號: not,!,-注意:注意:中文搜索引擎查詢時一般不需要使用中文搜索引擎查詢時一般不需要使用“AND”,因為搜索引擎會在關鍵詞之間的空格處自動添因為搜索引擎會在關鍵詞之間的空格處自動添加加“AND”;有的中文搜索引擎不支持;有的中文搜索引擎不支持“OR”的的搜索,無法接受搜索,無法接受“或者包含詞語或者
17、包含詞語A,或者包含詞,或者包含詞語語B”的網(wǎng)頁的網(wǎng)頁大多數(shù)搜索引擎都可用大多數(shù)搜索引擎都可用“+”表示必須包括某表示必須包括某詞,詞,“-”表示必須排除某詞表示必須排除某詞4 詞間位置限定檢索詞間位置限定檢索: 搜索引擎中較少使搜索引擎中較少使用用, 僅僅AltaVista, MSN Search等少數(shù)搜等少數(shù)搜索引擎可用索引擎可用NEAR進行位置限定進行位置限定5. 字段限定檢索字段限定檢索: 一般搜索引擎給出的一般搜索引擎給出的可檢字段有網(wǎng)頁標題可檢字段有網(wǎng)頁標題(t: 或或 title)、域名、域名(domain)、)、URL、鏈接(、鏈接(link:)等。:)等。有些搜索引擎還可限定
18、文件類型,如有些搜索引擎還可限定文件類型,如google中可在關鍵詞后輸入中可在關鍵詞后輸入filetype: ,限定檢索結果的文件類型(如限定檢索結果的文件類型(如ppt, jpg,pdf等)等)6 截詞檢索截詞檢索 多用于國外搜索引擎。一般用多用于國外搜索引擎。一般用詞干法或前方一致。有的中文搜索引擎不詞干法或前方一致。有的中文搜索引擎不使用使用“詞干法詞干法”,也不支持,也不支持“截詞符截詞符”(*)搜索搜索7. 大小寫敏感大小寫敏感 多用于人名、專有名詞檢索,多用于人名、專有名詞檢索,可提高查準率。大部分搜索引擎不區(qū)分大可提高查準率。大部分搜索引擎不區(qū)分大小寫,僅小寫,僅AltaVis
19、ta等少數(shù)搜索引擎支持此等少數(shù)搜索引擎支持此功能。功能。8 二次檢索二次檢索 多數(shù)搜索引擎都有多數(shù)搜索引擎都有“縮小搜索縮小搜索”或或“在結果中搜索在結果中搜索”功能,在已獲得的檢功能,在已獲得的檢索結果中進行索結果中進行“二次檢索二次檢索”A.A.目錄式的搜索引擎目錄式的搜索引擎(Directory)(Directory) 它提供一種可檢索和查詢的等級式它提供一種可檢索和查詢的等級式主題目錄,以超文本鏈接方式將不同主題目錄,以超文本鏈接方式將不同學科、專業(yè)、行業(yè)和區(qū)域的信息按照學科、專業(yè)、行業(yè)和區(qū)域的信息按照分類或主題目錄的方式組織起來。各分類或主題目錄的方式組織起來。各類目錄下面列出屬于這
20、一類別的網(wǎng)站類目錄下面列出屬于這一類別的網(wǎng)站名稱和網(wǎng)址鏈接以及每個網(wǎng)站的內(nèi)容名稱和網(wǎng)址鏈接以及每個網(wǎng)站的內(nèi)容簡介。著名的雅虎(簡介。著名的雅虎(YahooYahoo)就是一個)就是一個典型的目錄式搜索引擎。典型的目錄式搜索引擎。搜索引擎的類型搜索引擎的類型英文YAHOO!主頁主題分類目錄“Science”的詳細類目”Biology”的下位類目“Biotechnology”下位類目“Biotechnology”中”Genetic Engineering”的下位類目及相關網(wǎng)絡信息B.B.全文式搜索引擎全文式搜索引擎這類搜索引擎的數(shù)據(jù)庫中保存著網(wǎng)站這類搜索引擎的數(shù)據(jù)庫中保存著網(wǎng)站每一個網(wǎng)頁的全部內(nèi)容
21、,用戶在檢索每一個網(wǎng)頁的全部內(nèi)容,用戶在檢索框中輸入需要查詢的關鍵詞或短語,框中輸入需要查詢的關鍵詞或短語,搜索引擎返回與輸入關鍵詞相關的一搜索引擎返回與輸入關鍵詞相關的一個個網(wǎng)頁的地址和一段文字。著名的個個網(wǎng)頁的地址和一段文字。著名的搜索引擎百度、搜索引擎百度、AltaVistaAltaVista、GOOGLEGOOGLE等就是全文式搜索引擎。等就是全文式搜索引擎。 最大的中文搜索引擎百度Google主頁主頁Google及其使用及其使用Google 是由英文單詞是由英文單詞“googol”變化而來變化而來,表示表示 1 后邊帶有后邊帶有 100 個零的數(shù)字個零的數(shù)字,代表代表Google想征
22、服網(wǎng)上無窮無盡資料的雄心想征服網(wǎng)上無窮無盡資料的雄心世界上最大的搜索引擎世界上最大的搜索引擎。通過對通過對 30 多億網(wǎng)頁多億網(wǎng)頁進行整理,提供搜索結果,而且搜索時間通常進行整理,提供搜索結果,而且搜索時間通常不到半秒不到半秒有基本搜索和高級搜索兩種方式。有基本搜索和高級搜索兩種方式。Google及其使用及其使用檢索特性檢索特性兩詞之間用空格表示兩詞之間用空格表示“AND”支持短語搜索支持短語搜索 ,用,用“”“”對拼音關鍵詞能進行自動中文轉換對拼音關鍵詞能進行自動中文轉換不支持不支持“詞干法詞干法”可以查找可以查找 某種某種格式格式的的 文件文件,如關鍵詞后加上,如關鍵詞后加上filetyp
23、e:pdf,便可檢索到,便可檢索到PDF格式的文件格式的文件中英文單詞互譯中英文單詞互譯:只需輸入一個關鍵詞只需輸入一個關鍵詞(“翻譯翻譯”,“fy” 和和“FY” 任選其一)和要查的中任選其一)和要查的中 (英英) 文單詞,文單詞,Google返回的網(wǎng)上字典鏈接即刻便可知道返回的網(wǎng)上字典鏈接即刻便可知道檢索詞檢索詞詞詞的英文(或中文)翻譯。的英文(或中文)翻譯。也可利用也可利用 Google 目錄根據(jù)主題來縮小搜索范圍目錄根據(jù)主題來縮小搜索范圍高級搜索界面 C.C.綜合式搜索引擎綜合式搜索引擎此類搜索引擎既可以搜索網(wǎng)站也可搜此類搜索引擎既可以搜索網(wǎng)站也可搜索全文,用戶輸入關鍵詞后,可以選索全
24、文,用戶輸入關鍵詞后,可以選擇是搜索網(wǎng)站還是網(wǎng)頁,不同的選擇擇是搜索網(wǎng)站還是網(wǎng)頁,不同的選擇返回不同的結果。國內(nèi)著名的搜狐返回不同的結果。國內(nèi)著名的搜狐(SohuSohu)、網(wǎng)易等就是此類搜索引擎)、網(wǎng)易等就是此類搜索引擎。D. D. 元搜索引擎(元搜索引擎(Meta-search Engine) 是在搜索引擎基礎上建立的可以同時查詢多個搜索引擎的WWW站點,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎。雖然元搜索引擎依賴其他獨立搜索引擎而存在,但它們集成了不同性能和不同風格的搜索引擎并發(fā)展了一些新的查詢功能,查一個元搜索引擎就相當于查多個獨立搜索引擎,可以收到事半功倍的效果,故值得選用。著名元搜索引擎著名元搜索引擎ProFusionProFusion ( http:/)擁有智能化的搜索方案,提供諸如搜索引擎選擇、檢索類型、結果顯示、摘要選項、鏈接檢查等較多的檢索選項,支持個性化設置,可以選擇三個最好的搜索引擎、或三個最快的搜索引擎、或全部搜索引擎、或手工選擇任意幾個搜索引擎來進行搜索。自動實現(xiàn)符合特殊檢索語法要求的轉換,如在調用Excite、InfoSeek、WebCrawler時將“NEAR”轉換成“AND”,在調用GoTo、Yahoo時將“NOT”刪除等。surfactant cosmeticP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人工建筑勞務合同范本
- 入園合同范例
- 個人陶瓷采購合同范本
- 勞務派遣補充合同范本
- 切磚清工合同范本
- 光明果蔬配送合同范本
- 借款合同范本網(wǎng)上查詢
- 轉租飯店合同范本
- 凈化車間改造工程合同范本
- 會所會籍合同范本
- 班會課件:逆風飛翔破繭成蝶-從《哪吒之魔童鬧?!房辞啻浩诘某砷L與責任
- 合肥科技職業(yè)學院單招計算機類考試復習題庫(含答案)
- 2.1 堅持依憲治國 教案 -2024-2025學年統(tǒng)編版道德與法治八年級下冊
- 【語文試卷+答案】2024-2025學年泉州高二上期末質檢
- 2018-2022年北京市中考真題數(shù)學試題匯編:填空壓軸(第16題)
- 《修繕定額講解》課件
- 大學學生宿舍管理員工作培訓
- 初三物理常識試卷單選題100道及答案
- 浙江2024公務員考試真題及答案
- 高中英語新課程標準解讀課件
- 1.2《友邦驚詫論》教學設計-【中職專用】高二語文同步講堂(高教版2024·拓展模塊上冊)
評論
0/150
提交評論