第九章網(wǎng)絡信息檢索的原理與技術_第1頁
第九章網(wǎng)絡信息檢索的原理與技術_第2頁
第九章網(wǎng)絡信息檢索的原理與技術_第3頁
第九章網(wǎng)絡信息檢索的原理與技術_第4頁
第九章網(wǎng)絡信息檢索的原理與技術_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 信息檢索信息檢索 原理與技術原理與技術第九章第九章 網(wǎng)絡信息檢索的原理及技術網(wǎng)絡信息檢索的原理及技術制作人:張美制作人:張美2014年年6月月10日日第三節(jié)第三節(jié) 網(wǎng)絡信息的采集網(wǎng)絡信息的采集 第四節(jié)第四節(jié) 網(wǎng)絡信息的搜索網(wǎng)絡信息的搜索 第一節(jié)第一節(jié). 網(wǎng)絡信息檢索基礎網(wǎng)絡信息檢索基礎 第二節(jié)第二節(jié).網(wǎng)絡信息檢索基本原理網(wǎng)絡信息檢索基本原理 討討 論論 題題3. 元數(shù)據(jù)?元數(shù)據(jù)?MARC元數(shù)據(jù)?元數(shù)據(jù)?DC元數(shù)據(jù)?元數(shù)據(jù)? 4. RDF?它的作用是什么?有啥特點?它的作用是什么?有啥特點? 1. 什么是什么是網(wǎng)絡蜘蛛網(wǎng)絡蜘蛛?工作原理?工作原理?2. 什么是主題信息采集技術什么是主題信息采集

2、技術? 7. 什么是數(shù)據(jù)庫集群系統(tǒng)?優(yōu)勢和分類?什么是數(shù)據(jù)庫集群系統(tǒng)?優(yōu)勢和分類? 5. Z39.50作用及特點?提供的服務?作用及特點?提供的服務? 6. 網(wǎng)絡信息資源集成有什么意義?網(wǎng)絡信息資源集成有什么意義? 第一節(jié)第一節(jié). 網(wǎng)絡信息檢索基礎網(wǎng)絡信息檢索基礎 網(wǎng)網(wǎng)絡絡信信息息檢檢索索廣義:指信息采集、組織、存儲與檢索的全過程廣義:指信息采集、組織、存儲與檢索的全過程狹義:指廣義檢索過程中的檢索部分,即用戶根狹義:指廣義檢索過程中的檢索部分,即用戶根據(jù)網(wǎng)絡檢索工具查找網(wǎng)絡信息的過程據(jù)網(wǎng)絡檢索工具查找網(wǎng)絡信息的過程第二節(jié)第二節(jié).網(wǎng)絡信息檢索基本原理網(wǎng)絡信息檢索基本原理 用戶用戶行為行為模式模

3、式網(wǎng)絡信息網(wǎng)絡信息檢索技術檢索技術用戶在進用戶在進行網(wǎng)絡信行網(wǎng)絡信息檢索活息檢索活動時的檢動時的檢索行為的索行為的一些特點一些特點和規(guī)律和規(guī)律網(wǎng)頁搜索技術網(wǎng)頁搜索技術標引技術標引技術索引技術索引技術檢索技術檢索技術排序技術排序技術實現(xiàn)網(wǎng)絡實現(xiàn)網(wǎng)絡信息檢索信息檢索功能的軟功能的軟件和數(shù)據(jù)件和數(shù)據(jù)集合集合網(wǎng)絡信息網(wǎng)絡信息檢索系統(tǒng)檢索系統(tǒng)架構架構2.12.3Internet人工收集自動收集 頁面分類頁面分類信息資源采集信息資源采集 地址列表地址列表 數(shù)據(jù)過濾數(shù)據(jù)過濾 用戶界面用戶界面索引數(shù)據(jù)庫索引數(shù)據(jù)庫檢索服務器檢索服務器用用 戶戶圖9-4 信息檢索系統(tǒng)的體系結構第三節(jié)第三節(jié) 網(wǎng)絡信息的采集網(wǎng)絡信息

4、的采集 網(wǎng)網(wǎng)絡絡信信息息采采集集廣義:包括網(wǎng)絡信息檢索系統(tǒng)的所有信息采集和錄入活動廣義:包括網(wǎng)絡信息檢索系統(tǒng)的所有信息采集和錄入活動 (如:電子化掃描、人工錄入等(如:電子化掃描、人工錄入等-系統(tǒng)通用方式)系統(tǒng)通用方式)狹義:指網(wǎng)絡搜索引擎的信息采集狹義:指網(wǎng)絡搜索引擎的信息采集網(wǎng)絡信息采集的主要任務:為網(wǎng)絡信息資源庫錄入信息資源網(wǎng)絡信息采集的主要任務:為網(wǎng)絡信息資源庫錄入信息資源網(wǎng)絡搜索引擎的信息采網(wǎng)絡搜索引擎的信息采集分為兩個步驟:集分為兩個步驟:1、站點索引、站點索引2、網(wǎng)絡搜索、網(wǎng)絡搜索4.1 搜索引擎及其分類第四節(jié)第四節(jié) 網(wǎng)絡信息的搜索網(wǎng)絡信息的搜索 1.搜索引擎搜索引擎綜合分類綜合

5、分類(1)全文搜索引擎()全文搜索引擎(代表:代表:Google、Fast/AllTheWeb、AltaVista等等)(2)目錄索引(代表:)目錄索引(代表:Yahoo!)(3)元搜索引擎(代表:)元搜索引擎(代表:InfoSpace、Dogpile、Vivisimo)2、常用的搜索引擎:、常用的搜索引擎:Google、百度、北大天網(wǎng)中英文搜索引擎、新浪、百度、北大天網(wǎng)中英文搜索引擎、新浪、 雅虎中國搜索引擎、搜狐、網(wǎng)易雅虎中國搜索引擎、搜狐、網(wǎng)易3、特色的搜索引擎:、特色的搜索引擎:(1)新聞搜索引擎()新聞搜索引擎(Google/百度新聞搜索、中搜新聞搜索)百度新聞搜索、中搜新聞搜索)(

6、2)音樂搜索引擎(搜刮網(wǎng)、百度)音樂搜索引擎(搜刮網(wǎng)、百度MP3搜索、搜索、1234567搜索)搜索)(3)圖像搜索引擎()圖像搜索引擎(Google/百度圖像搜索、百度圖像搜索、VisionNext搜索)搜索)(4)商機搜索引擎)商機搜索引擎 (soaso價格搜索引擎、價格搜索引擎、8848購物搜索購物搜索)4.2 搜索引擎索引技術搜索引擎索引技術網(wǎng) 頁 正文信息正向索引反向索引分析網(wǎng)頁分析網(wǎng)頁過濾過濾切分切分倒排倒排圖圖 4.2 搜索引擎索引建立流程搜索引擎索引建立流程u1、分析網(wǎng)頁、分析網(wǎng)頁u2、建立倒排索引文件、建立倒排索引文件u3、搜索結果的排序、搜索結果的排序 (1)搜索引擎結果排

7、序方法分類)搜索引擎結果排序方法分類a、基于內容的排序方法、基于內容的排序方法b、基于鏈接的排序方法、基于鏈接的排序方法c、基于其他要素的排序方法、基于其他要素的排序方法(2)PagaRank算法算法(3)搜索引擎結果排序技術搜索引擎結果排序技術PagaRank算法算法PageRank:即網(wǎng)頁排名,又稱網(wǎng)頁級別、即網(wǎng)頁排名,又稱網(wǎng)頁級別、Google左側排名或佩奇排名。左側排名或佩奇排名。 是是Google用來衡量一個網(wǎng)站好壞的唯一標準!用來衡量一個網(wǎng)站好壞的唯一標準!創(chuàng)始人:拉里佩奇創(chuàng)始人:拉里佩奇(Larry Page ) Google創(chuàng)始人之一創(chuàng)始人之一算法核心思想:算法核心思想:Pag

8、eRank通過通過網(wǎng)絡浩瀚的超鏈接關系網(wǎng)絡浩瀚的超鏈接關系來確定一個來確定一個頁頁面面的的等級等級。Google把從把從A頁面到頁面到B頁面的鏈接頁面的鏈接解釋為解釋為A頁面給頁面給B頁面投頁面投票票,Google根據(jù)根據(jù)投票來源投票來源(甚至來源的來源,即鏈接到(甚至來源的來源,即鏈接到A頁面的頁面)頁面的頁面)和和投票目標的等級投票目標的等級來決定新的等級。這樣,來決定新的等級。這樣,PageRank會根據(jù)網(wǎng)頁會根據(jù)網(wǎng)頁B所所收到的收到的投票數(shù)量來投票數(shù)量來評估該網(wǎng)頁的重要性。此外,評估該網(wǎng)頁的重要性。此外,PageRank還會評估每還會評估每個投票網(wǎng)頁的重要性,因為個投票網(wǎng)頁的重要性,因

9、為某些重要網(wǎng)頁的投票被認為具有較高的價值,某些重要網(wǎng)頁的投票被認為具有較高的價值,這樣,它所鏈接的網(wǎng)頁就能獲得較高的價值這樣,它所鏈接的網(wǎng)頁就能獲得較高的價值。PagaRank算法相關概念算法相關概念PR值:用來值:用來評價網(wǎng)頁的重要性評價網(wǎng)頁的重要性,PR值越大越重要值越大越重要,其級別從,其級別從0到到10級。級。一般一般PR值值達到達到4,就,就算是一個不錯的網(wǎng)站了算是一個不錯的網(wǎng)站了。Google把自己的網(wǎng)站的把自己的網(wǎng)站的PR值定到值定到10,這說明,這說明Google這個網(wǎng)站是非常受歡迎的,也可以說這這個網(wǎng)站是非常受歡迎的,也可以說這個網(wǎng)站非常重要。個網(wǎng)站非常重要。阻尼因數(shù):阻尼因

10、數(shù):(damping factor)其值為0.85 阻尼系數(shù)d定義為用戶不斷隨機點擊鏈接的概率,所以,它取決于點擊的次數(shù),被設定為0-1之間。d的值越高,繼續(xù)點擊鏈接的概率就越大。因此,用戶停止點擊并隨機沖浪至另一頁面的概率在式子中用常數(shù)(1-d)表示。無論入站鏈接如何,隨機沖浪至一個頁面的概率總是(1-d)。(1-d)本身也就是頁面本身所具有的PageRank值。PagaRank算法的簡單計算算法的簡單計算假設一個由只有假設一個由只有4個頁面組成的集合:個頁面組成的集合:A,B,C和和D。如果所有頁面。如果所有頁面都鏈向都鏈向A,那么,那么A的的PR(PageRank)值將是)值將是B,C及

11、及D的和。的和。 繼續(xù)假設繼續(xù)假設B也有鏈接到也有鏈接到C,并且,并且D也有鏈接到包括也有鏈接到包括A的的3個頁面。一個個頁面。一個頁面不能投票頁面不能投票2次。所以次。所以B給給每個頁面每個頁面半票。半票。以同樣的邏輯,以同樣的邏輯,D投出的投出的票只有票只有三分之一三分之一算到了算到了A的的PageRank上。上。 換句話說,換句話說,根據(jù)鏈出總數(shù)平分一個頁面的根據(jù)鏈出總數(shù)平分一個頁面的PR值值。 如圖所示的例子來說明PageRank的算過程 PR值計算公式值計算公式PR(A)= (1-d)/N+d(PR(t1)/C(t1)+.+PR(tn)/C(tn) N: 網(wǎng)絡中網(wǎng)頁總數(shù) d: 阻尼因

12、數(shù) PR(x): 網(wǎng)頁x的PR值 C(tn):網(wǎng)頁tn的鏈出網(wǎng)頁數(shù) 一個頁面的PageRank是由其他頁面的PageRank計算得到。Google不斷的重復計算每個頁面的PageRank。如果給每個頁面一個隨機PageRank值(非0),那么經(jīng)過不斷的重復計算,這些頁面的PR值會趨向于正常和穩(wěn)定。這就是搜索引擎使用它的原因。1. 網(wǎng)網(wǎng) 絡絡 蜘蜘 蛛蛛網(wǎng)絡蜘蛛網(wǎng)絡蜘蛛 即即 網(wǎng)絡爬蟲網(wǎng)絡爬蟲 (Web Spider)。)。 網(wǎng)絡爬蟲,是一種按照一定的規(guī)則,自動的抓取萬維網(wǎng)網(wǎng)絡爬蟲,是一種按照一定的規(guī)則,自動的抓取萬維網(wǎng)信息的程序或者腳本。另外一些不常使用的名字還有螞蟻,自信息的程序或者腳本。另

13、外一些不常使用的名字還有螞蟻,自動索引,模擬程序或者蠕蟲。動索引,模擬程序或者蠕蟲。 把互聯(lián)網(wǎng)比喻成一個蜘蛛網(wǎng),那么把互聯(lián)網(wǎng)比喻成一個蜘蛛網(wǎng),那么Spider就是在網(wǎng)上就是在網(wǎng)上爬來爬去的蜘蛛。網(wǎng)絡蜘蛛是通過網(wǎng)頁的鏈接地址來尋爬來爬去的蜘蛛。網(wǎng)絡蜘蛛是通過網(wǎng)頁的鏈接地址來尋找網(wǎng)頁,從找網(wǎng)頁,從 網(wǎng)站某一個頁面(通常是首頁)開始,讀取網(wǎng)站某一個頁面(通常是首頁)開始,讀取網(wǎng)頁的內容,找到在網(wǎng)頁中的其它鏈接地址,然后通過網(wǎng)頁的內容,找到在網(wǎng)頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個網(wǎng)頁,這樣一直循環(huán)下去,直這些鏈接地址尋找下一個網(wǎng)頁,這樣一直循環(huán)下去,直到把這個網(wǎng)到把這個網(wǎng) 站所有的網(wǎng)頁都

14、抓取完為止。站所有的網(wǎng)頁都抓取完為止。網(wǎng)網(wǎng) 絡絡 蜘蜘 蛛蛛 的的 基基 本本 原原 理理 廣度優(yōu)先廣度優(yōu)先搜索策略是搜索策略是指在抓取過指在抓取過程中,在完程中,在完成當前層次成當前層次的搜索后,的搜索后,才進行下一才進行下一層次的搜索。層次的搜索。該算法的設該算法的設計和實現(xiàn)相計和實現(xiàn)相對簡單。在對簡單。在目前為覆蓋目前為覆蓋盡可能多的盡可能多的網(wǎng)頁,一般網(wǎng)頁,一般使用廣度優(yōu)使用廣度優(yōu)先搜索方法。先搜索方法。 深度優(yōu)先深度優(yōu)先搜索策略從搜索策略從起始網(wǎng)頁開起始網(wǎng)頁開始,選擇一始,選擇一個個URL進入,進入,分析這個網(wǎng)分析這個網(wǎng)頁中的頁中的URL,選擇一個再選擇一個再進入。如此進入。如此一個

15、鏈接一一個鏈接一個鏈接地抓個鏈接地抓取下去,直取下去,直到處理完一到處理完一條路線之后條路線之后再處理下一再處理下一條路線。條路線。 最佳優(yōu)先搜索策略按照一定的網(wǎng)頁分最佳優(yōu)先搜索策略按照一定的網(wǎng)頁分析算法,預測候選析算法,預測候選URL與目標網(wǎng)頁的相似與目標網(wǎng)頁的相似度,或與主題的相關性,并選取評價最好度,或與主題的相關性,并選取評價最好的一個或幾個的一個或幾個URL進行抓取。進行抓取。網(wǎng)網(wǎng) 絡絡 蜘蜘 蛛蛛 對于搜索引擎來說,要抓取對于搜索引擎來說,要抓取Internet上所有的網(wǎng)頁幾乎上所有的網(wǎng)頁幾乎是不可能的。從目前公布的數(shù)據(jù)來看,容量最大的搜索引是不可能的。從目前公布的數(shù)據(jù)來看,容量最

16、大的搜索引擎也不過抓取了整個網(wǎng)頁數(shù)量的擎也不過抓取了整個網(wǎng)頁數(shù)量的40%左右。左右。1、砸去技術的瓶頸,無法遍歷、砸去技術的瓶頸,無法遍歷 所有的網(wǎng)頁所有的網(wǎng)頁 2、存儲技術和處理技術的問題:、存儲技術和處理技術的問題: 如果按照每個頁面的平均大小為如果按照每個頁面的平均大小為20KB計算,計算,100億億網(wǎng)頁的容量是網(wǎng)頁的容量是100*2000GB,及時能夠存儲,下載也存在及時能夠存儲,下載也存在問題,如果按照一臺計算機每秒下載問題,如果按照一臺計算機每秒下載20KB計算,需要計算,需要340臺計算機不停地下載一年時間臺計算機不停地下載一年時間網(wǎng)網(wǎng) 絡絡 蜘蜘 蛛蛛 有的網(wǎng)頁如果不想讓網(wǎng)絡蜘

17、蛛抓取,可以對有的網(wǎng)頁如果不想讓網(wǎng)絡蜘蛛抓取,可以對數(shù)據(jù)進行加密和權限設置數(shù)據(jù)進行加密和權限設置如果在網(wǎng)站上有訪問日志記錄,如果在網(wǎng)站上有訪問日志記錄,網(wǎng)站管理員就能知道,哪些搜索引擎網(wǎng)站管理員就能知道,哪些搜索引擎的網(wǎng)絡蜘蛛來過,什么時候來過,以的網(wǎng)絡蜘蛛來過,什么時候來過,以及讀了多少條數(shù)據(jù)等及讀了多少條數(shù)據(jù)等2. 簡述簡述什么是主題信息采集技術?什么是主題信息采集技術? 信息采集技術:是指利用計算機軟件技術,針對定信息采集技術:是指利用計算機軟件技術,針對定制的目標數(shù)據(jù)源,實時進行信息采集、抽取、挖掘、處制的目標數(shù)據(jù)源,實時進行信息采集、抽取、挖掘、處理,將非結構化的信息從大量的網(wǎng)頁中抽

18、取出來保存到理,將非結構化的信息從大量的網(wǎng)頁中抽取出來保存到結構化的數(shù)據(jù)庫中,從而為各種信息服務系統(tǒng)提供數(shù)據(jù)結構化的數(shù)據(jù)庫中,從而為各種信息服務系統(tǒng)提供數(shù)據(jù)輸入的整個過程。輸入的整個過程。 所謂主題,是指用戶所需搜集信息的特征。主題信息所謂主題,是指用戶所需搜集信息的特征。主題信息采集的任務是在盡可能短的時間內,搜集盡可能多主題采集的任務是在盡可能短的時間內,搜集盡可能多主題相關信息,盡可能少的搜索與主題無關的信息相關信息,盡可能少的搜索與主題無關的信息 主題信息采集策略主要有:基于內容評價的搜主題信息采集策略主要有:基于內容評價的搜索策略、基于鏈接結構的評價策略、基于未來回索策略、基于鏈接結

19、構的評價策略、基于未來回報價值的搜索策略、基于綜合價值的搜索策略以報價值的搜索策略、基于綜合價值的搜索策略以及基于動態(tài)價值評價的搜索策略。及基于動態(tài)價值評價的搜索策略。3. 、什么是元數(shù)據(jù)?什么是MARC元數(shù)據(jù)?什么是DC元數(shù)據(jù)?MARC和DC各自有什么優(yōu)點和不足?元數(shù)據(jù)元數(shù)據(jù)一、元數(shù)據(jù):元數(shù)據(jù)是指關于數(shù)據(jù)的數(shù)據(jù)??梢詮膹V義和狹義上來理解。一、元數(shù)據(jù):元數(shù)據(jù)是指關于數(shù)據(jù)的數(shù)據(jù)??梢詮膹V義和狹義上來理解。廣義:是指描述信息資源的一切數(shù)據(jù)廣義:是指描述信息資源的一切數(shù)據(jù)狹義:指任何用于發(fā)現(xiàn)、識別、描述和定位網(wǎng)絡電子資源的數(shù)據(jù),是描狹義:指任何用于發(fā)現(xiàn)、識別、描述和定位網(wǎng)絡電子資源的數(shù)據(jù),是描述網(wǎng)絡

20、信息資源的一種數(shù)據(jù)格式。述網(wǎng)絡信息資源的一種數(shù)據(jù)格式。二、二、MARC元數(shù)據(jù):元數(shù)據(jù):MARC(機器可讀目錄,簡稱機讀目錄)是利用計算(機器可讀目錄,簡稱機讀目錄)是利用計算機識度和處理的目錄。機識度和處理的目錄。MARC是用于描述、存儲、交換、控制和檢索的一是用于描述、存儲、交換、控制和檢索的一套機讀書目數(shù)據(jù)的標準格式。套機讀書目數(shù)據(jù)的標準格式。lMARC具有標準的信息交換格式,方便具有標準的信息交換格式,方便數(shù)據(jù)交換;數(shù)據(jù)交換;l完整的書目描述,并且具有多種檢索點;完整的書目描述,并且具有多種檢索點;l各類信息資源在圖書館目錄中的集成;各類信息資源在圖書館目錄中的集成;l兼容性強。兼容性強

21、。lMARC無法及時處理大量的網(wǎng)絡信息資源;無法及時處理大量的網(wǎng)絡信息資源;lMARC對信息標引的專業(yè)性要求很高,不適于大多數(shù)普對信息標引的專業(yè)性要求很高,不適于大多數(shù)普通的信息用戶;通的信息用戶;l用用MARC格式著錄的工作流程比較復雜,需要設計專業(yè)格式著錄的工作流程比較復雜,需要設計專業(yè)的編目軟件,編目人員要同時掌握軟件操作能力和熟悉著的編目軟件,編目人員要同時掌握軟件操作能力和熟悉著錄規(guī)則;錄規(guī)則;l對于網(wǎng)絡資源來說,對于網(wǎng)絡資源來說,MARC所設的項目過于繁雜;所設的項目過于繁雜;lMARC元數(shù)據(jù)的產(chǎn)生速度不如其他元數(shù)據(jù)標準快。元數(shù)據(jù)的產(chǎn)生速度不如其他元數(shù)據(jù)標準快。三、三、DC元數(shù)據(jù):

22、元數(shù)據(jù):DC(Dublin Core)元數(shù)據(jù)即)元數(shù)據(jù)即“都柏林核心元數(shù)據(jù)都柏林核心元數(shù)據(jù)”, 是諸多元數(shù)據(jù)標準(規(guī)范)中最受關注且應用最廣泛的網(wǎng)絡信息組織元數(shù)是諸多元數(shù)據(jù)標準(規(guī)范)中最受關注且應用最廣泛的網(wǎng)絡信息組織元數(shù)據(jù)標準之一據(jù)標準之一DC用于網(wǎng)絡信息資源編目具有以下優(yōu)勢:用于網(wǎng)絡信息資源編目具有以下優(yōu)勢:uDC可以直接網(wǎng)絡數(shù)據(jù);可以直接網(wǎng)絡數(shù)據(jù);u通用性;通用性;u擴展性;擴展性;u適應性;適應性;u兼容性;兼容性;u靈活性;靈活性;u 簡單性。簡單性。4. 什么是什么是RDF?它的作用是什么?它有什么特點?它的作用是什么?它有什么特點? RDF:資源描述框架(資源描述框架(RDF)

23、是用于描述網(wǎng)絡資源的)是用于描述網(wǎng)絡資源的 W3C 標準,比如網(wǎng)頁的標題、作者、修改日期、內容以及版權信標準,比如網(wǎng)頁的標題、作者、修改日期、內容以及版權信息。息。作用:作用:為多種元數(shù)據(jù)的交互操作提供平臺,為各種資源描為多種元數(shù)據(jù)的交互操作提供平臺,為各種資源描述界提供定義所需要元數(shù)據(jù)單元的能力,采用述界提供定義所需要元數(shù)據(jù)單元的能力,采用“資源資源屬屬性性屬性值屬性值”的的“主謂賓主謂賓”結構,提供一種框架容器。結構,提供一種框架容器。1)獨立性)獨立性 2)使用)使用XML作為其描述語法作為其描述語法5. Z39.50標準協(xié)議的作用及特點標準協(xié)議的作用及特點,提供了哪些基本服務?提供了哪

24、些基本服務? 作用作用:將各個系統(tǒng)的具體實現(xiàn)映射到抽象模:將各個系統(tǒng)的具體實現(xiàn)映射到抽象模型上,才能使不同的系統(tǒng)在一個相互理解的、標型上,才能使不同的系統(tǒng)在一個相互理解的、標準的通信平臺上進行交互,滿足互操作的需要。準的通信平臺上進行交互,滿足互操作的需要。l 該協(xié)議是一種應用層協(xié)議,與使用的計算機平臺、操作系統(tǒng)該協(xié)議是一種應用層協(xié)議,與使用的計算機平臺、操作系統(tǒng)及檢索軟件無關,允許系統(tǒng)之間具有高度的互操作性。及檢索軟件無關,允許系統(tǒng)之間具有高度的互操作性。l 能夠提供一致性的檢索接口進行多數(shù)據(jù)庫查詢。能夠提供一致性的檢索接口進行多數(shù)據(jù)庫查詢。l 該協(xié)議是一種面向連接的有狀態(tài)的協(xié)議,記錄和維持

25、用戶聯(lián)該協(xié)議是一種面向連接的有狀態(tài)的協(xié)議,記錄和維持用戶聯(lián)機查詢的狀態(tài),便于實現(xiàn)復雜的查詢功能,查詢效率高。機查詢的狀態(tài),便于實現(xiàn)復雜的查詢功能,查詢效率高。l 該協(xié)議面向數(shù)據(jù)庫檢索,支持多種類型的數(shù)據(jù)格式與檢索點該協(xié)議面向數(shù)據(jù)庫檢索,支持多種類型的數(shù)據(jù)格式與檢索點使客戶端易于整合并連接不同的服務器與數(shù)據(jù)庫。使客戶端易于整合并連接不同的服務器與數(shù)據(jù)庫。 Z39.50標準協(xié)議提供的基本服務標準協(xié)議提供的基本服務 1、初、初 始始 化化11、終、終 止止10、擴、擴 展展 服服 務務9、解、解 釋釋8、資、資 源源 控控 制制7、存、存 取取 控控 制制6、分、分 類類5、瀏、瀏 覽覽4、刪、刪 除除 結結 果果 集集3、檢、檢 索索2、查、查 詢詢6. 網(wǎng)絡信息資源集成有什么意義?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論