![【畢業(yè)學(xué)位論文】(Word原稿)COMMIX中的XML查詢(xún)和視圖管理-軟件工程_第1頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/9/44133011-06ac-4228-858c-6823e19971fe/44133011-06ac-4228-858c-6823e19971fe1.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)COMMIX中的XML查詢(xún)和視圖管理-軟件工程_第2頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/9/44133011-06ac-4228-858c-6823e19971fe/44133011-06ac-4228-858c-6823e19971fe2.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)COMMIX中的XML查詢(xún)和視圖管理-軟件工程_第3頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/9/44133011-06ac-4228-858c-6823e19971fe/44133011-06ac-4228-858c-6823e19971fe3.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)COMMIX中的XML查詢(xún)和視圖管理-軟件工程_第4頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/9/44133011-06ac-4228-858c-6823e19971fe/44133011-06ac-4228-858c-6823e19971fe4.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)COMMIX中的XML查詢(xún)和視圖管理-軟件工程_第5頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/9/44133011-06ac-4228-858c-6823e19971fe/44133011-06ac-4228-858c-6823e19971fe5.gif)
已閱讀5頁(yè),還剩30頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
北京大學(xué)本科生畢業(yè)論文 第 1 頁(yè) 的 詢(xún)和視圖管理 in 月 北京大學(xué)本科生畢業(yè)論文 第 2 頁(yè) 摘要: 隨著 術(shù) 的迅速發(fā)展,各種在線(xiàn)數(shù)據(jù)源不斷涌現(xiàn)。然而由于 各種 信息源的高度異構(gòu)性,各個(gè)數(shù)據(jù)源的信息組織方式 、 所采用的數(shù)據(jù)模型、數(shù)據(jù)結(jié)構(gòu)、內(nèi)容表示、查詢(xún)語(yǔ)言都會(huì)有很大不同。因而面對(duì)海量的信息,人們往往會(huì)被淹沒(méi)在信息的海洋中。如何幫助用戶(hù)在信息的海洋中快速準(zhǔn)確地查找到所需的信息,則是當(dāng)前信息檢索和數(shù)據(jù)庫(kù)領(lǐng)域的一個(gè)重要研究方向。 是在這種背景下提出的一個(gè)基于 海量信息集成系統(tǒng)。 北京大學(xué)計(jì)算機(jī)系數(shù)據(jù)庫(kù)教研室承擔(dān)開(kāi)發(fā)的國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃項(xiàng)目“網(wǎng)絡(luò)環(huán)境下海量信息組織與處理的理論與方法”項(xiàng)目中的“面向內(nèi)容的海量信息集成、分析處理和服務(wù)”課題的原型系統(tǒng)。 該系統(tǒng)將國(guó)內(nèi)各主要電子商務(wù)網(wǎng)站的 息源通過(guò)包裝器 化為 據(jù),然后集成到一個(gè)統(tǒng)一的數(shù)據(jù)視圖之中,完成 基于內(nèi)容的精確查詢(xún)。在 引入了 化視圖的技術(shù),以提高系統(tǒng)的查詢(xún)效率。 本論文的工作是設(shè)計(jì)并實(shí) 現(xiàn)了 的視圖 管理 系統(tǒng)的部分功能。為了克服信息集成系統(tǒng)中查詢(xún)響應(yīng)時(shí)間長(zhǎng),系統(tǒng)查詢(xún)效率低的缺點(diǎn),在 引入了物化視圖的技術(shù)來(lái)加快查詢(xún)。 是系統(tǒng)中實(shí)現(xiàn) 物化 視圖機(jī)制 的管理 系統(tǒng)。 在本文完成之時(shí), 的大部分功能已經(jīng)實(shí)現(xiàn),管理員已經(jīng)能夠通過(guò)一個(gè)圖形化的界面完成對(duì)視圖的操作。同時(shí) 的查詢(xún)處理器已能夠有效地使用物化視圖集中的視圖來(lái)回答查詢(xún),大大提高了系統(tǒng)的查詢(xún)效率。 關(guān)鍵詞: 詢(xún)、視圖、 京大學(xué)本科生畢業(yè)論文 第 3 頁(yè) 目錄 第一章 優(yōu)越性 7 缺陷 7 有效性( 9 10 11 第二章 12 12 2 5 5 6 6 17 18 19 20 第三章 21 23 23 24 取部分查詢(xún)結(jié)果 24 定信息源與不定信息源查詢(xún) 25 第四章 設(shè)計(jì)目標(biāo) 26 設(shè)計(jì)方案 26 關(guān)鍵問(wèn)題和解決方案 27 實(shí)現(xiàn) 27 27 圖創(chuàng)建模塊 29 圖刷新模塊 31 北京大學(xué)本科生畢業(yè)論文 第 4 頁(yè) 圖刪除模塊 32 圖查看模塊 32 總結(jié)與展望 34 致謝 34 參考文獻(xiàn) 35 文章組織結(jié)構(gòu) : 第一章介紹了 一些基本概念。第二章介紹了 視圖創(chuàng)建的基礎(chǔ) 詢(xún)語(yǔ)言的發(fā)展情況。第三章介紹了北京大學(xué)計(jì)算機(jī)系數(shù)據(jù)庫(kù)教研室開(kāi)發(fā)的 型系統(tǒng)。第四章敘述了 統(tǒng)中視圖管理器 設(shè)計(jì)與實(shí)現(xiàn)。 北京大學(xué)本科生畢業(yè)論文 第 5 頁(yè) 第一章 介 整的名 稱(chēng)是可擴(kuò)展的標(biāo)記語(yǔ)言( 伴隨著超文本標(biāo)記語(yǔ)言 蓬勃發(fā)展而產(chǎn)生的。 是標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言 子集。通俗的說(shuō),就是 的標(biāo)簽 以任意的,而 的標(biāo)簽是有統(tǒng)一的格式的。下面我們來(lái)比較一下 言盡管在網(wǎng)頁(yè)的顯示上有它的優(yōu)勢(shì),但是它也有它的不足之處。 我們先來(lái)看個(gè) 例子: 例 示如下所示: 示例 商品編號(hào) 商品名稱(chēng) 價(jià)格 1 牙膏 2 牙刷 北京大學(xué)本科生畢業(yè)論文 第 6 頁(yè) 商品編號(hào) 商品名稱(chēng) 價(jià)格 1 牙膏 2 牙刷 表 面的例子我們可以看到 沒(méi)有包括數(shù)據(jù)的結(jié)構(gòu)信息,如 1 對(duì)應(yīng)的是商品編號(hào)、牙刷對(duì)應(yīng)的是商品名稱(chēng)。 可以彌補(bǔ)這一缺點(diǎn)。 我們把上邊的 寫(xiě)成 下: 例 這句在所有的 像“所有商品”、“商品”、“商品編號(hào)”等為 檔的元素 所有商品”為根元素 個(gè) 檔只能有一個(gè)根元素 ;“單位”為“商品價(jià)格”的屬性 牙膏”、“元”為元素或?qū)傩缘闹怠?在 顯示的結(jié)果如下圖: 圖 以看到 就既包括了數(shù)據(jù)的結(jié)構(gòu)信息又包括了數(shù)據(jù)的信息。但是它的結(jié)構(gòu)的信息并不完整,比如從 檔中我們不能知道商品價(jià)格 一個(gè)數(shù)還是一個(gè)字符串 ,即我們不知道它的類(lèi)型 。所以我們稱(chēng)之為半結(jié)構(gòu)化數(shù)據(jù)( 它介于結(jié)構(gòu)化數(shù)據(jù)和無(wú)結(jié)構(gòu)化數(shù)據(jù)之間。 1 牙膏 牙刷 京大學(xué)本科生畢業(yè)論文 第 7 頁(yè) 優(yōu)越性 上面的例子我們已經(jīng)可以看到 一些優(yōu)越性。這里我總結(jié)一下: 1. 異構(gòu)數(shù)據(jù)之間的集成、整合和通信 有了 們可以把復(fù)雜的異構(gòu)的數(shù)據(jù)簡(jiǎn)單化,這樣可以使異構(gòu)的數(shù)據(jù)之間的集成、整合和通信成為了可能。 為電子數(shù)據(jù)交換 最主要的工具在商業(yè)上有著巨大的應(yīng)用市場(chǎng)。 2. 更精確的查詢(xún)和搜索 因?yàn)?包括了數(shù)據(jù)的結(jié)構(gòu)信息,所以查 詢(xún) 檔比查詢(xún) 檔的準(zhǔn)確性和效率更高。 例如在 不能知道它是價(jià)格。而在 我們的很容易的就可以知道 價(jià)格。 在一般的 索引擎上,用戶(hù)想查詢(xún)價(jià)格 小于 2 元錢(qián)的商品是查不出來(lái)的,而在 查詢(xún) 卻 是可以精確地查出來(lái)的。 3. 擴(kuò)展性強(qiáng),有著 更 加廣闊的應(yīng)用 出現(xiàn)為我們提供的很廣闊空間,我們可以根據(jù)應(yīng)用定義自己標(biāo)簽。 實(shí)際上,現(xiàn)在許多行業(yè)、機(jī)構(gòu)都利用 典型的是下面兩個(gè)實(shí)例:化學(xué)置標(biāo)語(yǔ)言 數(shù)學(xué)置標(biāo)語(yǔ)言 缺陷 然結(jié)構(gòu)簡(jiǎn)單功能強(qiáng)大,它也有它 目前 發(fā)展上的劣勢(shì)。 1. 瀏覽器和編輯工具還不是很成熟。 然支持 一些功能但是并不完善。目前最常用的 輯器 輯的基本功能。 2. 對(duì) 檔的保護(hù)還不成熟 由于 以文本格式存儲(chǔ)的所以任何人用一般的編輯工具都可以編輯。大家可能經(jīng)常會(huì)問(wèn):“為什么看不到使用 術(shù)的網(wǎng)站出現(xiàn)呢?”我覺(jué)得 阻礙電子商務(wù)網(wǎng)站發(fā)展的原因之一就是 據(jù)的加密。大家設(shè)身處地地想想就知道:為什么要把我自己的數(shù)據(jù)不加密的可以被任何人訪(fǎng)問(wèn)呢。目前對(duì) 檔的加密方法并沒(méi)有制定統(tǒng)一的標(biāo)準(zhǔn),因此對(duì)檔的加密保護(hù)還有待進(jìn)一步的成熟。 北京大學(xué)本科生畢業(yè)論文 第 8 頁(yè) 是用來(lái)規(guī)定文檔語(yǔ)法規(guī)則的。一個(gè) 件必須遵守文件類(lèi)型描述 定義的種種規(guī)定。例如在例 加入 成為: 例 是說(shuō)“所有商品”可以包括多個(gè)“商品”元素?!?*”表示元素可以不出現(xiàn)或出現(xiàn)多次,這與正則語(yǔ)言中的 *、 +號(hào)的概念是一樣的。 表示元素 “ 商品價(jià)格 ” 有一個(gè)屬性 “ 單位 ”, 屬性類(lèi)型是字符串 # 這是一個(gè)內(nèi)部 例子。內(nèi)部 指 檔中帶有 義,與之對(duì)應(yīng)的還有外部 部 指 義在 檔外的另一個(gè)文檔中,在 檔中指 明其對(duì)應(yīng)的外部 檔即可。例如: 例 1 牙膏 牙刷 北京大學(xué)本科生畢業(yè)論文 第 9 頁(yè) 除了 有 以用來(lái)規(guī)范 隨著 現(xiàn)才出現(xiàn)的。在 我們可以生成一個(gè) 檔的 是 簡(jiǎn)單的說(shuō) 是一個(gè)描述另外一個(gè) 檔結(jié)構(gòu)的 檔。具體地 法這里略。 作用異曲同工,而現(xiàn)在的趨勢(shì)是: 逐漸被 取代 。 有效性( 另外一個(gè)重要的概念是 式良好( 有效性( 格式良好是指 有標(biāo)簽的嵌套,而 有效性是指 檔符合其指定的文檔類(lèi)型說(shuō)明( 者 例 格式良好的但不是有效的,例 是格式良好的又是有效的。 檔的格式良好是必須的,當(dāng)然在不知道它的結(jié)構(gòu)說(shuō)明的情況下, 檔的有效性也是應(yīng)該有的。建議使用格式良好和有效的 檔。 北京大學(xué)本科生畢業(yè)論文 第 10 頁(yè) 容描述與顯示方式是相分離的。 在瀏覽器中的顯示有兩種方法。一種是用 有一種是 兩種方法應(yīng)該使用哪一種就一直有爭(zhēng)議。 對(duì)兩者都 有 支持 。 例如我們要顯示出如: 商品編號(hào) 商品名稱(chēng) 價(jià)格 1 牙膏 2 牙刷 表 用 需要這樣寫(xiě): 例 聲明 板,并調(diào)用該模板。 根據(jù) ,系統(tǒng)最先 匹配 樹(shù)的根節(jié)點(diǎn)。根節(jié)點(diǎn)用 /表示 。 標(biāo)志匹配 樹(shù)中的所有商品的節(jié)點(diǎn)。 商品 表示 要求對(duì)于所有標(biāo)記為“商品 ” 的子節(jié)點(diǎn) 進(jìn)行處理。對(duì)于每一個(gè)“商品 ” 子樹(shù)中的內(nèi)容為其生成表中一行的內(nèi)容。 表示取商品編號(hào)的值顯示出來(lái)。 商品編號(hào) 商品名稱(chēng) 商品價(jià)格 北京大學(xué)本科生畢業(yè)論文 第 11 頁(yè) 還要在 指定相應(yīng)的 例 用 方法這里略。沒(méi)有具體說(shuō)明的 術(shù)可以參考文獻(xiàn) L。 我們可以比較一下傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)和 據(jù)。我們會(huì)發(fā)現(xiàn)這其中有許多的相似之處。 應(yīng)關(guān)系數(shù)據(jù)庫(kù)中的表結(jié)構(gòu)定義。但是還是有區(qū)別的,關(guān)系數(shù)據(jù)庫(kù)中表定義中的包括了例如字符型、整型等完整的類(lèi)型信息,而 即使一個(gè)有效的 半結(jié)構(gòu)化數(shù)據(jù)的 沒(méi)有 完整的結(jié)構(gòu)信息, 例如 對(duì)于 150 來(lái)說(shuō)它沒(méi)有標(biāo)識(shí)它是字符串還是整數(shù)。 檔對(duì)應(yīng)關(guān)系數(shù)據(jù)庫(kù)中的表,但是這并不是一一對(duì)應(yīng)。 檔 是 樹(shù)結(jié)構(gòu),而關(guān)系數(shù)據(jù)庫(kù)中的表只是二維結(jié)構(gòu),所以必須要求表的元素是表才可以。這將 從根本 改變傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu), 所以 大多數(shù)的關(guān)系數(shù)據(jù)庫(kù)的還不支持表結(jié)構(gòu)的嵌套, 但是 現(xiàn)在幾乎所有的關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)都支持關(guān)系數(shù)據(jù)庫(kù)導(dǎo)出 檔。導(dǎo)出是比較簡(jiǎn)單的, 而 導(dǎo)入是比較麻煩的。 支持 檔導(dǎo)入和導(dǎo)出到關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)中,但是它的導(dǎo)入和導(dǎo)出不是可逆的。它的導(dǎo)入的做法是為每一的標(biāo)簽都生成一個(gè)表。每一個(gè)表都有一個(gè)主碼和一個(gè)外碼,其中的外碼是用來(lái)標(biāo)識(shí)它的父元素的。但是有了這種結(jié)構(gòu)還是不能完整的轉(zhuǎn)化回檔。 關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)的互相轉(zhuǎn)換也是當(dāng)前的一個(gè)研究方向。 北京大學(xué)本科生畢業(yè)論文 第 12 頁(yè) 第二章 詢(xún)語(yǔ)言 雖然 檔具備了模式信息,但是 據(jù)模型其實(shí)是嵌套關(guān)系模型的擴(kuò)展,因而傳統(tǒng)的結(jié)構(gòu)化查詢(xún)語(yǔ)言 都不具備查詢(xún) 檔的能力。因而設(shè)計(jì)新的適應(yīng) 據(jù)模型的查詢(xún)語(yǔ)言成為一個(gè)研究熱點(diǎn)。 在有許多中查詢(xún)語(yǔ)言: 等。其功能和查詢(xún)語(yǔ)言的形式也各不相同。 種常用的 查詢(xún)語(yǔ)言現(xiàn)在還沒(méi)有制定出統(tǒng)一的標(biāo)準(zhǔn),還處在研究階段。我們看一看已有的一些典型的 詢(xún)語(yǔ)言 。 統(tǒng)采用的是 詢(xún)語(yǔ)言。 所以采用 詢(xún)語(yǔ)言是有原因的。 持連接、嵌套等強(qiáng)大使用方式,下面我們就可以看到。 實(shí)驗(yàn)室 提出 的 一種基于 查詢(xún)語(yǔ)言,它用查詢(xún)的方式可實(shí)現(xiàn)據(jù)的檢索、轉(zhuǎn)換和集成。 通過(guò)說(shuō)明路徑表達(dá)式和模式的方式,給出 句)。同時(shí), 可以給出構(gòu)造查詢(xún)輸出的 據(jù)的模板,其輸出結(jié)果仍為 檔( 通過(guò) 句)。 下面是 結(jié)構(gòu) : 例 形式上看 構(gòu),與 相似。其 句由模式和關(guān)系表達(dá)式組成,這意味著被選出的數(shù)據(jù)項(xiàng)要滿(mǎn)足兩個(gè)條件: 一是 數(shù)據(jù)項(xiàng)的類(lèi)型(或 值必須與指定的模式匹配; 二是 數(shù)據(jù)項(xiàng)的值要滿(mǎn)足關(guān)系表 $a $a100 北京大學(xué)本科生畢業(yè)論文 第 13 頁(yè) 達(dá)式。 在查詢(xún)條件中加入模式匹配是 結(jié)構(gòu)化查詢(xún)語(yǔ)言最大的不同之處。 主要特點(diǎn)。 1. 用模式( 匹配數(shù)據(jù) 用元素模式來(lái)匹配 檔。下面的例子將從 a.b.c/指的文檔中找出所有 版的書(shū)的作者。 例 . 用嵌套查詢(xún)來(lái)處理可選元素 關(guān)系數(shù)據(jù)的一個(gè)主要區(qū)別在于 常有可選的元素 , 例如 在 中是可選的 ,即不要求每本書(shū)都有價(jià)格信息 。假如要列出所有的書(shū)名,有價(jià)格的要同時(shí)列出價(jià)格 ,我們 看如下的查詢(xún): 例 述查詢(xún)是不正確的,因?yàn)樗?中必須含 元素 ,沒(méi)有價(jià)格的書(shū)將不被列出。 通過(guò)嵌套查詢(xún)來(lái)處理可選部分, 可以 將上面的查詢(xún)修改如下: 例 $T $p IN a.b.c/$t $p b a.b.c/ $t b $t b p t $a a.b.c/$a 北京大學(xué)本科生畢業(yè)論文 第 14 頁(yè) 右邊可為 可為變量。 第二個(gè) 詢(xún)稱(chēng)為嵌套查詢(xún)。 3. 用嵌套查詢(xún)來(lái)分組 另一個(gè)區(qū)別是嵌套和分組。例如,我們可以將一本書(shū)的所有的作者組合到一個(gè) 元素中。假如我們要找出每個(gè)作者寫(xiě)的所有的書(shū)的書(shū)名,可用下面的查詢(xún)來(lái)重組數(shù)據(jù): 例 . 連接 在兩個(gè)匹配表達(dá)式中使用同一個(gè)變量可實(shí)現(xiàn)鏈接。下面的例子找出至少出版了兩本書(shū)的所有作者。 例 . 正則 路徑表達(dá)式 考慮下面的 定的遞歸定義: 其中每一個(gè)元素可以包含其他任意深度的嵌套部分。為實(shí)現(xiàn)這樣的結(jié)構(gòu), 供了規(guī)則的路徑表達(dá)方式,它可以詳細(xì)說(shuō)明任意深度的元素路徑。例如下面的查詢(xún)將產(chǎn)生每一個(gè)組成元素的 分的內(nèi)容,這些組成元素的 內(nèi)容為 “而不論 層的嵌套。 p IN“a.b.c/ $p a a $t p t $a N“ a.b.c/ $a N“ a.b.c/ a 北京大學(xué)本科生畢業(yè)論文 第 15 頁(yè) 例 里的 是規(guī)則的路徑表達(dá)方式,它可以表達(dá) 規(guī)定模式中組成部分的任意序列。 斯坦福大學(xué)開(kāi)發(fā)的半結(jié)構(gòu)化數(shù)據(jù)庫(kù)管理系統(tǒng) 查詢(xún)語(yǔ)言,用于查詢(xún)半結(jié)構(gòu)化數(shù)據(jù)。 用 擴(kuò)展的 風(fēng)格 , 言可以用于支持 統(tǒng)的對(duì)半結(jié)構(gòu)化數(shù)據(jù)的查詢(xún)和更新。 統(tǒng)的開(kāi)發(fā)起始于 1995 年,最初建立在半結(jié)構(gòu)化模型上。在 1998年底至 1999 年初, 隨著 產(chǎn)生, 統(tǒng)全面移植到 據(jù)模型上,從而 查詢(xún)語(yǔ)言。 能強(qiáng)大,同樣支持連接、嵌套等。 圖形化的 詢(xún)語(yǔ)言,一個(gè) 詢(xún)可以應(yīng)用于任意 檔并產(chǎn)生一個(gè)作為結(jié)果的 檔。 一個(gè)基本的 詢(xún)由一對(duì)圖組成,它們稱(chēng)作 。每個(gè)圖由標(biāo)注的頂點(diǎn)(矩形框)和連接它們的有向弧組成。矩形代表 的元素,弧代表屬性和原子元素,標(biāo)注的弧代表元素間的引用關(guān)系。 用弧上的 *操作符代表任意的導(dǎo)航操作,并且使用“ 點(diǎn)匹配文當(dāng)中的任意元素。 下圖 表示查找 所有 1975 年以后出生的 男 居民。 圖 $r N “a.b.c/ $r 北京大學(xué)本科生畢業(yè)論文 第 16 頁(yè) 從上圖我們可以看出, 的 代表了用戶(hù)對(duì)文檔中感興趣的信息,并說(shuō)明信息的位置和必須滿(mǎn)足的條件。 文檔中查找 素,并且使得包含: 值為“ M”的 性 ; 素下面任意層次的 素 , 并且包含一個(gè)值為“ 性 ; 包含 1975 年前的 素的 F 素。 執(zhí)行將包含一系列由 檔片斷組成的子圖。 負(fù)責(zé)查詢(xún)結(jié)果的組建,每個(gè)由 執(zhí)行產(chǎn)生的子圖將在 生成一個(gè)結(jié)果的子圖,并經(jīng)過(guò)組裝后生成最后的結(jié)果。 們以前講過(guò)的 光可以用于 顯示, 也可以用于查詢(xún) 可作為 詢(xún)語(yǔ)言基礎(chǔ)。 義了 語(yǔ)法規(guī)范,該語(yǔ)法規(guī)范將被用來(lái)把 件轉(zhuǎn)換成 其他格式的文檔。一個(gè) 式表集合了一系列設(shè)計(jì)規(guī)則,用于從 件中抽取信息,并將其轉(zhuǎn)換成 其他格式。這種轉(zhuǎn)換采用了公開(kāi)的方式,使其能夠更加方便地被程序員描述。而且 將提供多種腳本語(yǔ)言的通道,以滿(mǎn)足更為復(fù)雜的應(yīng)用需求。 例如我們想查出價(jià)格 小 于 2 元的商品只需修改例 : 例 果變?yōu)椋?商品編號(hào) 商品名稱(chēng) 商品價(jià)格 2 牙刷 表 特定為 檔設(shè)計(jì),它是一種通用查詢(xún)語(yǔ)言,提供用于查詢(xún),定位和模式的簡(jiǎn)單語(yǔ)法。 煉,簡(jiǎn)單,具有強(qiáng)大的功能。 式語(yǔ)言提供了易于理解的方式描述待處理節(jié)點(diǎn)。 但 它是說(shuō)明性而不是過(guò)程性語(yǔ)言,只需使用類(lèi)目錄結(jié)構(gòu)的簡(jiǎn)單模式描述需要查找節(jié)點(diǎn)的類(lèi)型。例如, 示查找包含在 素中的 素。 供對(duì) 式語(yǔ)言的自然擴(kuò)展。在 示類(lèi)型節(jié)點(diǎn)的基礎(chǔ)上增加了布爾邏輯,過(guò)濾,節(jié)點(diǎn)集合索引等。盡管 式語(yǔ)言的超集, 計(jì)用于許多情況,可以用于提供節(jié)點(diǎn)的鏈接,查找信息和許多其他應(yīng)用。 從文檔中查詢(xún)信息的符號(hào),這些信息可能是一個(gè)節(jié)點(diǎn)集合、節(jié)點(diǎn)關(guān)系信息或?qū)С鲋?。本說(shuō)明書(shū)沒(méi)有指定輸出的格式,查詢(xún)結(jié)果可能是單個(gè)節(jié)點(diǎn)、節(jié)點(diǎn)列表、 檔、其他結(jié)構(gòu)序列。即: 不指定返回的二進(jìn)制格式,而是邏輯結(jié)果。 在一些實(shí)現(xiàn)中,查 詢(xún)結(jié)果可能是一個(gè) 檔或者是傳回 樹(shù)。在其他情況下,結(jié)果可能是其他類(lèi)型的結(jié)構(gòu),例如:指向節(jié)點(diǎn)指針的集合。因此,封閉性并不能保證,如果實(shí)現(xiàn)方案返回 檔,則該文檔必須格式良好,從而保證了封閉性。 商品價(jià)格 北京大學(xué)本科生畢業(yè)論文 第 17 頁(yè) 詢(xún)語(yǔ)言的比較 我們通過(guò)下面的例子來(lái)比較上面介紹的幾種查詢(xún)語(yǔ)言,這里描述的是一個(gè)制造商與汽車(chē)的 檔: 例 們想選擇和提取 元素,滿(mǎn)足的條件是 的 小于等于 10,下面給出了幾種不同語(yǔ)言的查詢(xún)語(yǔ)句: 例 例 999 T 999 26800 $r m IN $r 10 =10 北京大學(xué)本科生畢業(yè)論文 第 19 頁(yè) 有序樹(shù): 對(duì)無(wú)序樹(shù)中的每個(gè)節(jié)點(diǎn)加入序號(hào)即可。 (略) 無(wú)序樹(shù)和有序樹(shù)模型都有自己的應(yīng)用范圍。無(wú)序樹(shù)一般認(rèn)為無(wú)序樹(shù)模型比較貼近 為應(yīng)用中的節(jié)點(diǎn)的先后順序并不重要。對(duì)于分成段、節(jié)、句的文檔來(lái)說(shuō)有序樹(shù)模型是必須的。查詢(xún)效率上說(shuō),無(wú)序樹(shù)的查詢(xún)比有序樹(shù)的查詢(xún)要簡(jiǎn)單。 在不考慮連接、嵌套等情況的前提下, 詢(xún)的主要算法是樹(shù)中尋找滿(mǎn)足給定 模式的子樹(shù),并且根據(jù)尋找到的子樹(shù)構(gòu)造出 新的子樹(shù)。但是 由于例如 查詢(xún)語(yǔ)句中支持正則語(yǔ)言 以及連接等操作 所以 實(shí)際的情況并不是這么的簡(jiǎn)單。 如果我們只考慮在一個(gè) 檔中進(jìn)行查詢(xún)的話(huà)該問(wèn)題等價(jià)于子樹(shù)同構(gòu)問(wèn)題( 子樹(shù)同構(gòu)問(wèn)題 的原問(wèn)題 是子圖同構(gòu)問(wèn)題。 子圖同構(gòu)問(wèn)題:給定兩個(gè)圖 G, H,找到 G 的一個(gè)子圖同構(gòu)于 H。已經(jīng)證明這的問(wèn)題是的。但是如果對(duì) G 和 H 加以限制的話(huà),問(wèn)題可以變得容易,甚至可以在多項(xiàng)式時(shí)間內(nèi)解決的。 子樹(shù)同構(gòu)問(wèn)題是子圖同構(gòu)問(wèn)題的子問(wèn)題。 由于 檔的數(shù)據(jù)模型是根樹(shù),所以問(wèn)題要簡(jiǎn)單一些。 已 經(jīng)證明了當(dāng) G 和 H 都是根樹(shù)時(shí),子樹(shù)同構(gòu)問(wèn)題有多項(xiàng)式算法。 算法的主要思想如下: 對(duì)于所有的 G 內(nèi)部節(jié)點(diǎn) V 和 H 的根結(jié)點(diǎn) U。 V 的 排序 子節(jié)點(diǎn).,2,1。 U 的 排序子節(jié)點(diǎn).,2,1。 如果匹配則對(duì)于每個(gè)成 子圖才可以,遞歸調(diào)用判斷否是 子圖同構(gòu)。 如果對(duì)于 每個(gè)則輸出 ,H)算法描述如下: If u 沒(méi)有子節(jié)點(diǎn) u=v f v 有子節(jié)點(diǎn) 照后序周游 v 在 u o f v 沒(méi)有子節(jié)點(diǎn) o f v 有子節(jié)點(diǎn) 京大學(xué)本科生畢業(yè)論文 第 20 頁(yè) 算法 圖 G 的總節(jié)點(diǎn)數(shù)為 n,子圖 H 的總節(jié)點(diǎn)數(shù)為 k, 可以證明 該算法時(shí)間代價(jià)為 )( 2 圖是對(duì)應(yīng)關(guān)系數(shù)據(jù)庫(kù)中的物化視圖而提出的概念。由于 息量龐大, 網(wǎng)絡(luò)傳輸能力有限, 我們可以保存部分 詢(xún)的結(jié)果在本地?cái)?shù)據(jù)庫(kù)中,再次查詢(xún)時(shí)就可以訪(fǎng)問(wèn)本地的 物化視圖,這樣做可以更加快速而精確查詢(xún),減少相應(yīng)時(shí)間,提高查詢(xún)效率。 圖的創(chuàng)建 就是由用戶(hù)使用 查詢(xún)語(yǔ)言對(duì)不同信息源進(jìn)行查詢(xún),生成結(jié)果 檔,并將結(jié)果文檔保存到本地?cái)?shù)據(jù)庫(kù)中去。再次查詢(xún)時(shí)可以用戶(hù)在視圖中進(jìn)行查詢(xún),這樣做提高了查詢(xún)效率和減少了相應(yīng)時(shí)間。 所有的內(nèi)部節(jié)點(diǎn) f v=u v1, u1, 序子節(jié)點(diǎn) i=1 do or i=1 to t f f O 京大學(xué)本科生畢業(yè)論文 第 21 頁(yè) 第三章 型系統(tǒng)簡(jiǎn)介 北京大學(xué)計(jì)算機(jī)系數(shù)據(jù)庫(kù)教研室承擔(dān)開(kāi)發(fā)的國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃項(xiàng)目“網(wǎng)絡(luò)環(huán)境下海量信息組織與處理的理論與方法”項(xiàng)目中的“面向內(nèi)容的海量信息集成、分析處理和服務(wù)”課題的原型系統(tǒng)。 該系統(tǒng)將經(jīng)過(guò) 裝后的 息源集成到集成層的一個(gè)統(tǒng)一的數(shù)據(jù)視圖之中,提供給上層應(yīng)用,以支持對(duì)數(shù)據(jù)的基于內(nèi)容的精確查詢(xún)。 系結(jié)構(gòu) 一種基于客戶(hù)服務(wù)器的體系結(jié)構(gòu),它是一個(gè) 基于 海量信息集成系統(tǒng),系統(tǒng)的最主要的特點(diǎn)是 : 采用 “多查詢(xún)語(yǔ)法樹(shù)組合分析方法 ”,分析 戶(hù)查詢(xún)請(qǐng)求,為集成模式的構(gòu)造服務(wù)。 采用 “集成模式計(jì)算模型 ”,設(shè)計(jì)并建立相應(yīng)的集成模式,從而實(shí)現(xiàn)了集成模式的自動(dòng)構(gòu)造,并保證了其精確度 。 利用 據(jù)庫(kù)存儲(chǔ)集成層的 圖,優(yōu)化了 存儲(chǔ)結(jié)構(gòu) 。 設(shè)計(jì)和實(shí)現(xiàn) 詢(xún)語(yǔ)言,實(shí)現(xiàn)了 基于內(nèi)容的精確查詢(xún) 。 體系結(jié)構(gòu)如圖 示可分為 4 個(gè)主要部分: 圖 京大學(xué)本科生畢業(yè)論文 第 22 頁(yè) 運(yùn)行在客戶(hù)端的可視化用戶(hù)界面,用戶(hù)可以通過(guò)該界面提出查詢(xún)。該圖形用戶(hù)界面有如下特點(diǎn): 支持用戶(hù)以 方式來(lái)構(gòu)建 查詢(xún) ,所以即使用戶(hù)不熟悉 詢(xún)語(yǔ)言,也可以方便、直觀地構(gòu)建查詢(xún)語(yǔ)句。 支持用戶(hù)直接提交的 詢(xún)。 查詢(xún)方式所表達(dá)的查詢(xún)能力是有限的,如果用戶(hù)熟悉 詢(xún)語(yǔ)言,可以自己編寫(xiě)查詢(xún)語(yǔ)句,以完成更復(fù) 雜的查詢(xún)功能。 用 寫(xiě)的,通過(guò) 式運(yùn)行在客戶(hù)端。這種結(jié)構(gòu)的優(yōu)點(diǎn)在于,客戶(hù)端無(wú)需安裝特定的應(yīng)用,可以直接通過(guò) 式方便地訪(fǎng)問(wèn)服務(wù)器以完成 的精確查詢(xún)。 第二部分是查詢(xún)處理器 運(yùn)行在服務(wù)器端的應(yīng)用。查詢(xún)處理器的主要功能是接受用戶(hù)端提出的查詢(xún),經(jīng)過(guò)分析處理,執(zhí)行查詢(xún),并將執(zhí)行結(jié)果交給客戶(hù)端顯示。查詢(xún)處理器的主要特點(diǎn)是: 支持獲取查詢(xún)的部分結(jié)果。 針對(duì)網(wǎng)上查詢(xún)的特征,查詢(xún)處理器支持部分結(jié)果的獲取。處理器允許用戶(hù)指定獲取的查詢(xún)結(jié)果的數(shù)量, 在獲得到指定數(shù)目的結(jié)果之后,查詢(xún)結(jié)束。通過(guò)這種方式,用戶(hù)可以在查詢(xún)結(jié)果的精確度和查詢(xún)響應(yīng)時(shí)間之間,自行權(quán)衡,給用戶(hù)很大的自由度。 支持指定信息源和不定信息源的查詢(xún) 查詢(xún)處理器中支持既對(duì)不定信息源的查詢(xún),也支持指定信息源的查詢(xún)。在查詢(xún)語(yǔ)句中,用戶(hù)可以用“ *”不明確指定從哪些數(shù)據(jù)源獲取數(shù)據(jù),這樣,查詢(xún)處理器會(huì)通過(guò)內(nèi)部的定位機(jī)制,找到所有可能含有查詢(xún)結(jié)果的信息源,而后進(jìn)一步到信息源獲得數(shù)據(jù),完成查詢(xún)。同時(shí),如果用戶(hù)只對(duì)某信息源的數(shù)據(jù)感興趣,也可以在查詢(xún)中指定從哪個(gè)數(shù)據(jù)源獲取數(shù)據(jù)完成查詢(xún)。 支持利用視 圖的查詢(xún) 支持兩種使用視圖的機(jī)制。一種是顯示的方式,另一種是隱式的方式。顯示的方式中,在建立起物化視圖之后,將視圖 交給用戶(hù) 許用戶(hù)在視圖之上構(gòu)建查詢(xún),查詢(xún)處理器將利用存放在本地的視圖來(lái)回答查詢(xún)。而在隱式的方式中,系統(tǒng)對(duì)不是建立在視圖之上的查詢(xún)進(jìn)行分析后,如果判斷其可以利用視圖來(lái)回答,那么處理器會(huì)對(duì)原查詢(xún)進(jìn)行相應(yīng)的查詢(xún)重寫(xiě),重寫(xiě)后的查詢(xún)計(jì)劃將盡可能的利用視圖中的數(shù)據(jù)來(lái)回答查詢(xún)。無(wú)論哪種視圖使用方式,數(shù)據(jù)的存放位置對(duì)用戶(hù)都是透明的,也就是用戶(hù)并不知道數(shù)據(jù)是存放在視圖中,還是存放在數(shù) 據(jù)源。用戶(hù)可以任意地提出查詢(xún),而由查詢(xún)處理器負(fù)責(zé)到相應(yīng)的位置獲取數(shù)據(jù)回答查詢(xún)。 第三部分是視圖管理器,負(fù)責(zé)有關(guān)視圖的建立、更新和維護(hù)。在 引入了物化視圖技術(shù)來(lái)存放用戶(hù)經(jīng)常訪(fǎng)問(wèn)的數(shù)據(jù),以提高查詢(xún)效率。該部分的特點(diǎn)是 : 集成了視圖的管理界面 提供給管理員的界面集成了對(duì)視圖的添加、更新、查看和刪除功能,使管理員能夠方便地對(duì)視圖進(jìn)行調(diào)整和維護(hù)。添加視圖模塊可以讓管理員用圖形化的方式定義所需添加的視圖,并將其物化。更新視圖模塊允許管理員重新計(jì)算系統(tǒng)中已存在視圖的內(nèi)容,并決定是否海量更新該視圖的內(nèi)容。而刪除 視圖則允許管理員對(duì)系統(tǒng)中過(guò)時(shí)的視圖加以清除,以釋放空間建立新視圖。查看視圖則允許管理員查看系統(tǒng)中視圖的定義, 構(gòu)和視圖內(nèi)容。該北京大學(xué)本科生畢業(yè)論文 第 23 頁(yè) 界面將對(duì)視圖的增、刪、改、查集成為一體,以方便管理員對(duì)視圖的操作。 支持 圖的存儲(chǔ) 化視圖采用傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)進(jìn)行保存。將 統(tǒng)進(jìn)行擴(kuò)展,開(kāi)發(fā)了供對(duì) 據(jù)片斷的管理,并在此基礎(chǔ)上開(kāi)發(fā)了 化視圖的存儲(chǔ)管理模塊。 最后一部分是索引模塊,該模塊主要是為查詢(xún)處理器的優(yōu)化提供定位機(jī)制。由于查詢(xún)處理器支持不定數(shù)據(jù)源的查詢(xún),所以系統(tǒng)必須有相應(yīng)的數(shù)據(jù)源定位能力。索引就是系統(tǒng)所采用的定位機(jī)制。索引模塊通過(guò)和搜索引擎相結(jié)合,定位所有可能的滿(mǎn)足查詢(xún)要求信息源,返回給查詢(xún)處理器。 系統(tǒng)從圖形用戶(hù)界面 獲得查詢(xún),交給查詢(xún)處理器處理。處理器在接收到查詢(xún)后進(jìn)行分析,如果查詢(xún)是建立在視圖之上,那么處理器將從視圖管理模塊中獲得相應(yīng)視圖內(nèi)容,回答查詢(xún);否則進(jìn)一步分析查詢(xún)是否可通過(guò)視圖回答,如果 能使用視圖內(nèi)容 盡量使用視圖內(nèi)容來(lái)回答查詢(xún),若不能由 視圖回答,那么處理器將查詢(xún)轉(zhuǎn)換成中間語(yǔ)言,交給索引定位器,索引定位器則發(fā)出相應(yīng)請(qǐng)求,定位到所有可能滿(mǎn)足查詢(xún)的信息源 回給查詢(xún)處理器,查詢(xún)處理器再到相應(yīng)的信息源收集數(shù)據(jù)完成查詢(xún)。 在 統(tǒng)中采用了數(shù)據(jù)倉(cāng)庫(kù)中物化視圖的技術(shù)來(lái)存放數(shù)據(jù)源中的(部分)數(shù)據(jù)或查詢(xún)的中間結(jié)果,及用戶(hù)經(jīng)常訪(fǎng)問(wèn)的數(shù)據(jù) 。再次 執(zhí)行查詢(xún)時(shí)將盡可能利用視圖中的數(shù)據(jù)來(lái)回答查詢(xún),以減少網(wǎng)上的數(shù)據(jù)傳輸和查詢(xún)的響應(yīng)時(shí)間。 由于 息量的巨大,各數(shù)據(jù)源的千變?nèi)f化,要將所有數(shù)據(jù)源中的數(shù)據(jù)都 作為 物化視圖存貯 起來(lái)是 不現(xiàn)實(shí)的,因而物化視圖的選擇是一個(gè)重要考慮因素 。 它對(duì)整個(gè)系統(tǒng)的性能都有決定性的影響。 應(yīng)該物化保存那些能夠給整個(gè)系統(tǒng)帶來(lái)最大效益的視圖,這樣才能在有限的空間限制下,最大限度的發(fā)揮物化視圖的功能以提高效率。 既然要將視圖物化在本地,就要涉及物化視圖中數(shù)據(jù)的存儲(chǔ)管理,同時(shí)還要考慮對(duì)視圖的更新。而由于要物化的數(shù)據(jù)量通常是比較大的,而 據(jù)由于自身結(jié)構(gòu)復(fù)雜性和靈活性,其物化計(jì)算代價(jià)通常是很大的。因此在數(shù)據(jù)源發(fā)生更新時(shí),采用增量維護(hù)的方式要比重新計(jì)算物化視圖要有效得多。 系統(tǒng)提供給管理員一個(gè) 面,該界 面集成了對(duì)視圖的各種管理功能,使管理員可以方便直接地通過(guò)該界面完成對(duì)視圖的查看、添加、更新和刪除操作。 持 基于內(nèi)容的精確查詢(xún),改變了傳統(tǒng)的 息檢索中的基于關(guān)鍵字的搜索技術(shù)。在傳統(tǒng)的信息檢索中,基于關(guān)鍵字的搜索引擎和元搜索引擎扮演了信息檢索的主要角色?;陉P(guān)鍵詞匹配是它們的主要技術(shù),檢索結(jié)果按系統(tǒng)決定的相關(guān)程度進(jìn)行排序。這種方法與在傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)、對(duì)象關(guān)系數(shù)據(jù)庫(kù)的查詢(xún)最大不同北京大學(xué)本科生畢業(yè)論文 第 24 頁(yè) 之處就是查詢(xún)結(jié)果的精確度。因?yàn)樵趥鹘y(tǒng)數(shù)據(jù)庫(kù)中 存儲(chǔ)了大量的具有嚴(yán)格結(jié)構(gòu)的帶類(lèi)型的數(shù)據(jù),其查詢(xún)語(yǔ)言,如 分利用了嚴(yán)格的數(shù)據(jù)結(jié)構(gòu)信息模式,使用戶(hù)可以使用描述性的查詢(xún)語(yǔ)言對(duì)數(shù)據(jù)進(jìn)行精確查詢(xún)。但要用傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)方法捕捉非結(jié)構(gòu)化數(shù)據(jù)檔或半結(jié)構(gòu)化數(shù)據(jù)之中數(shù)據(jù)的聯(lián)系是十分困難的。在信息檢索領(lǐng)域,對(duì)文檔數(shù)據(jù)進(jìn)行基于關(guān)鍵詞的搜索存在有效的技術(shù)。這種搜索必然比 詢(xún)更不精確,因?yàn)榛陉P(guān)鍵詞的檢索沒(méi)有模式信息可以利用。因此,檢索的結(jié)果通常是排序的,需要用戶(hù)的交互才能定位到相關(guān)的數(shù)據(jù)。 出現(xiàn)使得 基于內(nèi)容的精確查詢(xún)成為可 能,因?yàn)?據(jù)是一種半結(jié)構(gòu)化數(shù)據(jù),具有自描述性,其數(shù)據(jù)本身就包含有相應(yīng)的結(jié)構(gòu)信息或稱(chēng)為模式信息。同時(shí),可以有輔助的結(jié)構(gòu)信息,如 。 隱含在 面向文檔的數(shù)據(jù)視圖與 面向模式的數(shù)據(jù)視圖之間的橋梁。它使得數(shù)據(jù)庫(kù)系統(tǒng)更加緊密地集成到 用中。 要對(duì) 據(jù)進(jìn)行查詢(xún),對(duì)語(yǔ)言有相應(yīng)的要求。目前提出的 查詢(xún)語(yǔ)言主要包括 形化的查詢(xún)語(yǔ)言 等。 現(xiàn)了 夠完成對(duì)網(wǎng)上 檔的精確查詢(xún)。 詢(xún)表達(dá) 的查詢(xún)表達(dá)支持 直接的 詢(xún)語(yǔ)句兩種方式。 式定義查詢(xún)是通過(guò)圖形化的界面提供給用戶(hù) 戶(hù)通過(guò) 方式構(gòu)造所需的查詢(xún)。 負(fù)責(zé)生成相應(yīng)的 詢(xún)語(yǔ)句,提交給服務(wù)器端,并負(fù)責(zé)將結(jié)果以圖形化的方式顯示給用戶(hù)。這種方式使得那些即使不熟悉 詢(xún)語(yǔ)言的用戶(hù),也可以方便、直觀地構(gòu)建查詢(xún)。 另一種方式則是提供給那些對(duì) 詢(xún)語(yǔ)言比較熟悉,同時(shí)有更高查詢(xún)要求的用戶(hù)。這些用戶(hù)可以直接提交比較復(fù) 雜的 詢(xún)語(yǔ)句,更充分地利用 大的查詢(xún)功能。 兩種方式的結(jié)合使得系統(tǒng)有更大的靈活性、可用性,同時(shí)也更加友好,不同的用戶(hù)群可以根據(jù)查詢(xún)的復(fù)雜性要求選擇相應(yīng)的查詢(xún)表達(dá)方式。 取部分查詢(xún)結(jié)果 持獲得部分查詢(xún)結(jié)果的獲取。由于基于 查詢(xún)可能涉及多個(gè)信息源,而這些信息源都是高度自治的。它們自主地更新維護(hù),發(fā)布信息,也隨時(shí)可能出現(xiàn)故障而離線(xiàn),同時(shí)這些信息源的查詢(xún)能力,對(duì)查詢(xún)的響應(yīng)時(shí)間也是大不相同的。所以如果要獲得回答查詢(xún)所需的所有數(shù)據(jù)可能需要等待的時(shí)間很長(zhǎng) ,甚至于如果在查詢(xún)的執(zhí)行中涉及某個(gè)離線(xiàn)的數(shù)據(jù)源,那么該查詢(xún)就會(huì)由于獲得不了查詢(xún)所需所有數(shù)據(jù)而阻塞在該信息源上。另一方面,用戶(hù)可能并不需要所有滿(mǎn)足查詢(xún)要求的結(jié)果,或者不愿為這樣的精確結(jié)果而等待過(guò)久,因而只要能得到部分結(jié)果就可以了。 北京大學(xué)本科生畢業(yè)論文 第 25 頁(yè) 針對(duì)網(wǎng)上查詢(xún)的這種特點(diǎn),查詢(xún)處理器支持部分結(jié)果的獲取。處理器允許用戶(hù)指定希望獲取結(jié)果的數(shù)量,在獲得到指定數(shù)目的結(jié)果之后,查詢(xún)結(jié)束。如果用戶(hù)沒(méi)有指定,查詢(xún)處理器也是通過(guò)增量地方式,逐步傳遞部分查詢(xún)結(jié)果給用戶(hù)直至所有結(jié)果都獲得為止,在此過(guò)程中,如果用戶(hù)已找到滿(mǎn)足要求的結(jié)果,可以自行終止 查詢(xún)。通過(guò)這種方式,用戶(hù)可以在查詢(xún)結(jié)果的精確度和查詢(xún)響應(yīng)時(shí)間之間,自行權(quán)衡,給用戶(hù)很大的自主權(quán)。 定信息源與不定信息源查詢(xún) 網(wǎng)上查詢(xún)的一個(gè)很大特點(diǎn)是只表明要查什么,很少用戶(hù)能明確指出到那兒查。因而系統(tǒng)應(yīng)能自動(dòng)定位到所有的可能含有滿(mǎn)足查詢(xún)條件的數(shù)據(jù)的信息源。在 查詢(xún)處理器中就針對(duì)這種情況,支持對(duì)不定信息源的查詢(xún)。在查詢(xún)語(yǔ)句中,可以指定到某個(gè)特定的信息源獲取數(shù)據(jù),也可以用“ *”不明確指定數(shù)據(jù)源。這時(shí),處理器將查詢(xún)轉(zhuǎn)換成中間語(yǔ)言,交給索引定位器,索引定位器 將 相應(yīng)請(qǐng)求定位到所有可能滿(mǎn)足查詢(xún) 的信息源 回給查詢(xún)處理器,查詢(xún)處理器再到相應(yīng)的信息源收集數(shù)據(jù)完成查詢(xún)。 這種不定信息源的查詢(xún)大大提高了系統(tǒng)的可以性,因?yàn)橐笥脩?hù)對(duì)網(wǎng)上如此多信息源的結(jié)構(gòu)信息了如指掌,以構(gòu)造出確定信息源的查詢(xún)顯然是很不合理,也不現(xiàn)實(shí)。有了這種不定信息源查詢(xún)的處理能力,就可以解決這一問(wèn)題,使得用戶(hù)即使無(wú)法確定要到那里得到所需信息,也能通過(guò)系統(tǒng)自動(dòng)定位能力而得到想要的信息。 北京大學(xué)本科生畢業(yè)論文 第 26 頁(yè) 第 四 章 圖 管理的設(shè)計(jì)與實(shí)現(xiàn) 負(fù)責(zé)視圖管理的主要功能模塊,其 主要設(shè)計(jì)目標(biāo)是提供一種利用視圖提高 詢(xún)效率的機(jī)制。對(duì)用戶(hù)提出的查詢(xún),如果在每次執(zhí)行中都要到所有相關(guān)的信息源收集數(shù)據(jù),進(jìn)而回答查詢(xún),那么網(wǎng)上的數(shù)據(jù)傳輸量將是一個(gè)不容忽視的因素。而有限的帶寬使得獲得這些海量信息成為信息查詢(xún)的瓶頸,大數(shù)據(jù)量的網(wǎng)上信息傳輸無(wú)疑會(huì)大大影響整個(gè)系統(tǒng)的執(zhí)行效率。要提高查詢(xún)的執(zhí)行效率可以從兩個(gè)方面考慮一是提高信息傳輸?shù)乃俣?,二是減少信息傳輸量。因此在 采用了傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)中常用的物化視圖的機(jī)制來(lái)加快查詢(xún)。這樣系統(tǒng)就可以根據(jù)查詢(xún),盡可能地利用物化視圖中的數(shù)據(jù)來(lái)直接回答查 詢(xún),從而最大程度地避免了直接到網(wǎng)上獲得數(shù)據(jù)。 是負(fù)責(zé)管理物化視圖的主要功能模塊。它提供一個(gè)圖形化的界面,使得管理員可以方便的查看、添加、刪除和維護(hù)視圖。由于 一種半結(jié)構(gòu)化數(shù)據(jù)的表示形式,和傳統(tǒng)的有嚴(yán)格結(jié)構(gòu)模式的關(guān)系視圖有很大差異,因而在 設(shè)計(jì)中有許多全新的挑戰(zhàn)。 物化視圖的選擇。物化視圖的選擇在數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)中就是一個(gè)很核心的問(wèn)題。在我們的集成系統(tǒng)中,如何確定集成模式,也同樣是決定系統(tǒng)性能的關(guān)鍵性問(wèn)題。 給定一個(gè)有限的空間(集成層),如何建立集成模式(物化視圖 ),才能使得查詢(xún)的響應(yīng)時(shí)間和集成模式(物化視圖)的維護(hù)代價(jià)達(dá)到最小。 一個(gè)合理的有效的集成模式應(yīng)該物化保存那些能夠給整個(gè)系統(tǒng)帶來(lái)最大效益的視圖,這樣才能在有限的空間限制下,最大限度的發(fā)揮物化視圖的功能以提高 效率。 針對(duì)以上所面臨的挑戰(zhàn), 統(tǒng)中 總體設(shè)計(jì)目標(biāo)是 : 提供給管理員一個(gè)方便直觀的視圖管理工 具,使管理員可以方便的實(shí)現(xiàn)對(duì)視圖的查看、添加、刪除和更新等操作; 提供一個(gè)有效的集成模式建立機(jī)制,使得系統(tǒng)所建立的視圖是合理和有效的,能最大程度地利用有限空間,發(fā)揮最佳的效 益。 對(duì)系統(tǒng)中建立的眾多視圖,應(yīng)該有一套方便完善的管理機(jī)制。視圖是建立在各個(gè)信息源之上的數(shù)據(jù)快照,它并不能保證和數(shù)據(jù)源的絕對(duì)同步,也就是說(shuō),視圖中的數(shù)據(jù)不是實(shí)時(shí)數(shù)據(jù)。要保證視圖內(nèi)容的準(zhǔn)確性和實(shí)時(shí)性,必須及時(shí)對(duì)視圖進(jìn)行更新。另一方面,隨著系統(tǒng)不斷地運(yùn)行變化,需要根據(jù)數(shù)據(jù)源信息的變化和用戶(hù)訪(fǎng)問(wèn)情況的變化及時(shí)向系統(tǒng)中添加新的視圖,以反映變化的信息和用戶(hù)需求;同時(shí) , 那些用戶(hù)以往感興趣而現(xiàn)在已很少訪(fǎng)問(wèn)的“過(guò)時(shí)”的視圖應(yīng)刪除,以便及時(shí)釋放空間建立其他的視圖。所有這些對(duì)視圖的管 理,管理員
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- S-3-Keto-sphinganine-d18-0-hydrochloride-生命科學(xué)試劑-MCE-1677
- CP-LC-0729-生命科學(xué)試劑-MCE-3226
- Actinobolin-plus-Actinobolin-生命科學(xué)試劑-MCE-7644
- 3-4-Methylenedioxy-pyrovalerone-metabolite-2-hydrochloride-生命科學(xué)試劑-MCE-1172
- 2025年度國(guó)際貿(mào)易違約風(fēng)險(xiǎn)預(yù)防與處理合同
- 2025年度范文正式版合同文員崗位職責(zé)規(guī)范與職業(yè)素養(yǎng)培養(yǎng)協(xié)議
- 二零二五年度2025年競(jìng)業(yè)禁止及保密協(xié)議模板
- 2025年度風(fēng)力發(fā)電場(chǎng)租賃定金協(xié)議模板
- 2025年度籃球聯(lián)賽裁判員免責(zé)聲明及賽事執(zhí)行合同
- 二零二五年度自媒體合伙人合同版:自媒體平臺(tái)內(nèi)容創(chuàng)作與推廣合同
- 小兒肺炎治療與護(hù)理
- 《高處作業(yè)安全》課件
- 春節(jié)后收心安全培訓(xùn)
- 小學(xué)教師法制培訓(xùn)課件
- 電梯操作證及電梯維修人員資格(特種作業(yè))考試題及答案
- 市政綠化養(yǎng)護(hù)及市政設(shè)施養(yǎng)護(hù)服務(wù)方案(技術(shù)方案)
- SLT824-2024 水利工程建設(shè)項(xiàng)目文件收集與歸檔規(guī)范
- 鍋爐本體安裝單位工程驗(yàn)收表格
- 我國(guó)水體中抗生素的污染現(xiàn)狀、危害及防治建議
- 手術(shù)出血量的評(píng)估
- 報(bào)價(jià)單(產(chǎn)品報(bào)價(jià)單)
評(píng)論
0/150
提交評(píng)論