


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于xml的文檔資料管理上
1文檔資料的問題萬維網(wǎng)是一個分布廣泛、全球范圍廣泛的信息服務(wù)中心。它包括新聞、廣告、消費(fèi)信息、金融管理、教育、電子商務(wù)和許多其他信息服務(wù)。因此,高效資源和web知識的管理具有很大的挑戰(zhàn)。目前文檔管理所面臨的難題主要表現(xiàn)在以下幾個方面。(1)文檔資料的數(shù)量極其龐大。當(dāng)前萬維網(wǎng)上的文檔資料過于龐大,其數(shù)據(jù)量以兆兆字節(jié)計(jì)算,而且仍然在迅速地增長。(2)文檔資料的組織形式多種多樣。目前的文檔資料以不同的格式存儲于不同的數(shù)據(jù)組織形式之中,其中包括文本數(shù)據(jù)、關(guān)系數(shù)據(jù)庫數(shù)據(jù)、面向?qū)ο髷?shù)據(jù)庫數(shù)據(jù)、文件數(shù)據(jù)以及聲音、圖像、郵件等。(3)Web頁面的復(fù)雜性高于任何傳統(tǒng)的文本文檔。Web頁面缺乏統(tǒng)一的結(jié)構(gòu),它包含了遠(yuǎn)比任何一組書籍或其它文本文檔多得多的風(fēng)格和內(nèi)容。為解決以上問題,就必須實(shí)現(xiàn)文檔的同一性結(jié)構(gòu)組織,和頁面內(nèi)容的有效的標(biāo)識和索引。所謂同一性結(jié)構(gòu)組織,意即數(shù)據(jù)文件的組織結(jié)構(gòu)不依賴于系統(tǒng)平臺和數(shù)據(jù)庫管理平臺;實(shí)現(xiàn)頁面內(nèi)容的有效標(biāo)識,即將數(shù)據(jù)信息與格式信息相分離,從而以有表述能力的標(biāo)簽語言表達(dá)文檔內(nèi)容。2基于rssp的意義具有形成了xm-l-pcp的注意條XML技術(shù)作為文檔管理難題的解決手段已經(jīng)日益被人們接受和采納。一方面,大量的原始信息開始通過特定的轉(zhuǎn)換機(jī)制,整合為XML數(shù)據(jù);另一方面,未來將會有大量的Web頁面用XML書寫,并遵循一組良好的文檔類型定義,從而有利于促進(jìn)不同Web站點(diǎn)間的信息交換,更便于實(shí)現(xiàn)對各種組織形式的海量文檔資料的有效管理。XML的最大優(yōu)點(diǎn)在于它的數(shù)據(jù)存儲格式不受顯示格式的制約。一般來說,一篇文檔包括三個要素:數(shù)據(jù)、結(jié)構(gòu)以及顯示方式。XML把文檔的三要素獨(dú)立開來,分別處理。首先把顯示格式從數(shù)據(jù)內(nèi)容中獨(dú)立出來,保存在樣式表單文件中,這樣如果需要改變文檔的顯示方式,只要修改樣式表單文件就行了。XML的自我描述性質(zhì)能夠很好地表現(xiàn)許多復(fù)雜的數(shù)據(jù)關(guān)系,使得基于XML的應(yīng)用程序可以在XML文件中準(zhǔn)確高效地搜索相關(guān)的數(shù)據(jù)內(nèi)容,忽略其他不相關(guān)部分。XML還有其他許多優(yōu)點(diǎn),比如它有利于不同系統(tǒng)之間的信息交流,并有希望成為數(shù)據(jù)和文檔交換的標(biāo)準(zhǔn)機(jī)制。3創(chuàng)建系統(tǒng)配方本節(jié)主要描述基于XML的文檔管理,內(nèi)容包括以下幾個方面:(1)XML數(shù)據(jù)存取機(jī)制;(2)XML與數(shù)據(jù)庫;(3)XML文檔創(chuàng)建;(4)XML文檔類型定義;(5)XML文檔的顯示。3.1數(shù)據(jù)庫的應(yīng)用從整體上講,XML定義了應(yīng)用間傳遞數(shù)據(jù)的結(jié)構(gòu),而且這種結(jié)構(gòu)的描述不是基于二進(jìn)制的、只能由程序去判讀的代碼,而是一種簡單的、能夠用通用編輯器讀取的文本。XML數(shù)據(jù)源多種多樣,根據(jù)具體的應(yīng)用,大概可分為下面三種:一種是XML純文本文檔,第二種是關(guān)系型數(shù)據(jù)庫,第三種則來源于其他各種應(yīng)用數(shù)據(jù),如郵件、目錄清單、商務(wù)報(bào)告等。其中,第一種來源,即XML純文本文檔是最基本的也是最為簡單的,將數(shù)據(jù)存儲于文件中,其最大的優(yōu)點(diǎn)在于可以直接方便地讀取,或者加以樣式信息在瀏覽器中顯示,或者通過DOM接口編程同其他應(yīng)用相連。第二種數(shù)據(jù)來源是對第一種來源的擴(kuò)展,其目的是便于開發(fā)各種動態(tài)應(yīng)用,其優(yōu)點(diǎn)則在于通過數(shù)據(jù)庫系統(tǒng)對數(shù)據(jù)進(jìn)行管理,然后再利用服務(wù)器端應(yīng)用(如ASP,JSP)等進(jìn)行動態(tài)存取。這種方式最適合于當(dāng)前最為流行的基于三層結(jié)構(gòu)的應(yīng)用開發(fā)。3.2關(guān)系數(shù)據(jù)庫中的表與表之間的關(guān)聯(lián)數(shù)據(jù)庫提供了對于大批量數(shù)據(jù)的有效存儲管理和快速信息檢索、查詢的功能。從體系結(jié)構(gòu)上看,數(shù)據(jù)庫技術(shù)的發(fā)展歷經(jīng)了網(wǎng)絡(luò)型數(shù)據(jù)庫、層次型數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫。雖然面向?qū)ο髷?shù)據(jù)庫融入了面向?qū)ο蠹夹g(shù),但是到目前為止,在各個領(lǐng)域使用最廣的還是關(guān)系數(shù)據(jù)庫。關(guān)系數(shù)據(jù)庫管理系統(tǒng)采用二維表格作為存儲數(shù)據(jù)的模型,表格由行和列組成,一般情況下,列被稱作“字段”用于表示組成數(shù)據(jù)有效信息的屬性,而行則用于指示一條完整的數(shù)據(jù)記錄。由于數(shù)據(jù)間的相關(guān)性可以通過表與表之間關(guān)鍵字來關(guān)聯(lián),由此產(chǎn)生了“關(guān)系”類型數(shù)據(jù)庫的由來。針對XML數(shù)據(jù),一般有兩種存儲方式:一是將其按結(jié)構(gòu)層次拆分開來分別存于不同字段,二是將XML文檔原封不動地存入數(shù)據(jù)庫。3.3ent的關(guān)系型數(shù)據(jù)庫現(xiàn)在假定文檔保存在一個名叫document的關(guān)系型數(shù)據(jù)庫中,其中有football表,包含了甲A聯(lián)賽的報(bào)道??梢远x以下XML文檔結(jié)構(gòu):3.4屬性的互動關(guān)系文檔類型定義詳細(xì)描述了一組文檔結(jié)構(gòu)規(guī)則,提供了一連串的元素、屬性、表示法和文檔中的各種實(shí)體以及其相互間的關(guān)系。對應(yīng)于上面的XML文檔,可以進(jìn)行下面的文檔類型定義:3.5web服務(wù)器xllXSL是為XML文檔定義的一種標(biāo)識語言,提供了遠(yuǎn)遠(yuǎn)超過CSS的強(qiáng)大功能.它包含了一套元素集的XML語法規(guī)范,該語法規(guī)范用宋把XML文檔轉(zhuǎn)換成HTML文檔。一個XSL樣式表集合了一系列設(shè)計(jì)規(guī)則,以用于將信息從XML文檔中提取出來,并將其轉(zhuǎn)換成HTML等其它格式。XSL憑借其可擴(kuò)展性能夠控制無窮無盡的標(biāo)簽,而控制每個標(biāo)簽的方式也是無窮無盡的,于是給Web提供了高級的布局特性。同時(shí),XSL不僅僅是應(yīng)用格式,當(dāng)使用XML瀏覽器時(shí),XSL源文檔中的信息將被評價(jià)、重新安排,然后重新組裝。這樣,最終所得到的不只是XML的數(shù)據(jù)版本,而且還可以被很容易地添加、修改和重新排序的靈活的源信息。這個最終產(chǎn)品叫做結(jié)果樹。這樣,XSL能使Web瀏覽器直接根據(jù)用戶的不同需求改變文檔的表示法,如數(shù)據(jù)的顯示順序改變,從而不需要再與服務(wù)器進(jìn)行交互通信。通過變換樣式表,同一個文檔可以顯示得更大,或者經(jīng)過折疊,只顯示外面的一層。4實(shí)現(xiàn)相關(guān)文本文檔的同一性,提高資源的整合和共享為了解決文檔管理所面臨的難題(1)文檔資料的數(shù)量極其龐大、(2)文檔資料的組織形式多種多樣和(3)Web頁面的復(fù)雜性高于任何傳統(tǒng)的文本文檔,就必須實(shí)現(xiàn)文檔的同一性結(jié)構(gòu)組織,和頁面內(nèi)容的有效的標(biāo)識和索引。基于XML技術(shù)實(shí)現(xiàn)文檔管理,已經(jīng)日益被人們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 診所投資合作合同范本
- 2025至2030年中國環(huán)保裝飾膠數(shù)據(jù)監(jiān)測研究報(bào)告
- 2025至2030年中國玉晶米數(shù)據(jù)監(jiān)測研究報(bào)告
- 承包權(quán)合同范本
- 隔斷合同范本格式
- 2025至2030年中國流延膜生產(chǎn)線數(shù)據(jù)監(jiān)測研究報(bào)告
- 互動傳媒承包合同
- 未來教室現(xiàn)代教育技術(shù)的實(shí)踐與思考
- 臨時(shí)工培訓(xùn)補(bǔ)貼協(xié)議
- 2024年遵義市赤水市公益性崗位人員招聘筆試真題
- 中華護(hù)理學(xué)會團(tuán)體標(biāo)準(zhǔn)測試題庫含答案
- 防暴隊(duì)形演練和講解
- 2024年醫(yī)療器械經(jīng)營質(zhì)量管理規(guī)范培訓(xùn)課件
- 廣電和通信設(shè)備電子裝接工(高級工)理論考試復(fù)習(xí)題庫(含答案)
- 2024年河南住戶調(diào)查業(yè)務(wù)題庫
- 中小企業(yè)(民營企業(yè))ESG星級評價(jià)
- 電氣工程及其自動化職業(yè)規(guī)劃課件
- 天車安全操作培訓(xùn)教材
- 《籃球運(yùn)球》教案(共四篇)
- 國企關(guān)于違反“三重一大”決策制度責(zé)任追究辦法
- CRF病例報(bào)告表模板
評論
0/150
提交評論