


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、分布式數(shù)據(jù)庫的復(fù)制和分片Analysis of data replication and fragmentation in Distributed DatabaseYAN Qiu-ling1, ZHU Jun-tao2(1.College of Information Science and Technology, Henan University of Technology ,Zhengzhou 450001,China;2.Zhengzhou Railway vocational and Technical College, Zhengzhou 450052,China): This pa
2、per compares distributed database with centralized database, and anaysises the problems in the storage and access speed of centralized database. In this paper, we give the concept of data replication and fragmentation in distributed database ,as well as principles and methods. Finally, we analysis t
3、he key problems data replication and fragmentation solved.1 引言 在集中式數(shù)據(jù)庫中,將所有數(shù)據(jù)集中存儲(chǔ)到一臺(tái)計(jì)算機(jī)上, 由主機(jī)上的數(shù)據(jù)庫管理系統(tǒng)統(tǒng)一管理整個(gè)數(shù)據(jù)庫, 用戶可從終端 上發(fā)出數(shù)據(jù)操作命令,經(jīng)主機(jī)上的數(shù)據(jù)庫管理系統(tǒng)接收處理后, 將結(jié)果數(shù)據(jù)返回給用戶。 隨著企業(yè)規(guī)模越來越大, 企業(yè)分布于物 理位置不同的多個(gè)地方, 尤其是一些跨國公司, 在全球有很多的 分公司。 采用集中式數(shù)據(jù)庫的體系結(jié)構(gòu), 位于多個(gè)位置的站點(diǎn)要 訪問一個(gè)存放數(shù)據(jù)的主機(jī),這樣,對(duì)主機(jī)的要求 1 就很高:首 先,當(dāng)企業(yè)規(guī)模很大,數(shù)據(jù)量很大時(shí),數(shù)據(jù)僅僅存放在一臺(tái)計(jì)算
4、 機(jī)上,該計(jì)算機(jī)的存儲(chǔ)空間就要求很高, 通常是一個(gè)中型機(jī)或者 小型機(jī),而這樣的配置通常費(fèi)用會(huì)很高。其次,當(dāng)多個(gè)計(jì)算機(jī)同 時(shí)訪問該主機(jī)時(shí),會(huì)造成訪問速度很慢,性能下降,這種速度有 時(shí)甚至是難以忍受的。最后,過多的依賴于中間的主機(jī)節(jié)點(diǎn),一 旦該節(jié)點(diǎn)出現(xiàn)故障,會(huì)使整個(gè)系統(tǒng)處于崩潰狀態(tài)。2 分布式數(shù)據(jù)庫的特點(diǎn)基于上面的這些原因, 集中式的結(jié)構(gòu)不能適應(yīng)當(dāng)前的物理位 置上分散的要求。 分布式數(shù)據(jù)庫是物理上分散而邏輯上集中的數(shù) 據(jù)庫系統(tǒng)。它有這樣的一些優(yōu)點(diǎn): 1)物理分布性 數(shù)據(jù)按照就近 原則,存放在距離它最近的一個(gè)或者多個(gè)站點(diǎn); 2)邏輯整體性 雖 然數(shù)據(jù)存放在各個(gè)不同的站點(diǎn),但將各個(gè)站點(diǎn)的數(shù)據(jù)集合起來,
5、 仍然是集中式中的整個(gè)數(shù)據(jù)庫中的數(shù)據(jù); 3)站點(diǎn)的自治性 相互 的站點(diǎn)之間不存在主從關(guān)系, 地位是平等的, 任何一個(gè)站點(diǎn)出現(xiàn) 問題,不影響其它站點(diǎn), 每個(gè)站點(diǎn)上的數(shù)據(jù)由本地的數(shù)據(jù)庫管理 系統(tǒng)來進(jìn)行管理。分布式數(shù)據(jù)庫系統(tǒng)通過把分布在計(jì)算機(jī)網(wǎng)絡(luò)的不同結(jié)點(diǎn)或 場(chǎng)地 ,物理上屬于多個(gè)數(shù)據(jù)子集,邏輯上屬于同一系統(tǒng)之?dāng)?shù)據(jù)集 合的海量數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)應(yīng)用, 以實(shí)現(xiàn)比集中式數(shù)據(jù)庫系統(tǒng)更好的 性能、可擴(kuò)充性、可用性和自治性。從數(shù)據(jù)意義上講,數(shù)據(jù)分布 即數(shù)據(jù)分片與分配的合理與否或者說合理性的高低, 不僅影響著 訪問的局部性, 即盡可能地把用戶要求訪問的數(shù)據(jù)就在本結(jié)點(diǎn)或 本場(chǎng)地,而且也制約著數(shù)據(jù)查詢及事務(wù)處理的效率。要
6、實(shí)現(xiàn)分布式系統(tǒng),必須要對(duì)數(shù)據(jù)進(jìn)行復(fù)制和分片 2 。所 謂復(fù)制,就是將數(shù)據(jù)存放在多個(gè)站點(diǎn)上,這樣,在一個(gè)站點(diǎn)出現(xiàn) 故障時(shí), 可以通過訪問存放在另外站點(diǎn)上的副本,仍然可以正常工作。 分片就是系統(tǒng)把數(shù)據(jù)劃分為幾個(gè)片, 各片存儲(chǔ)在不同的分 片上。在實(shí)際應(yīng)用中,通常是將兩者結(jié)合在一起,先對(duì)數(shù)據(jù)進(jìn)行 分片,然后將分片進(jìn)行復(fù)制。3 數(shù)據(jù)復(fù)制和分片3.1 數(shù)據(jù)復(fù)制和分片的目的將數(shù)據(jù)進(jìn)行分片和復(fù)制后存放在多個(gè)站點(diǎn)上 3 ,當(dāng)一個(gè)站 點(diǎn)發(fā)生故障時(shí), 整個(gè)系統(tǒng)仍然可以正常工作, 提高整個(gè)系統(tǒng)的可 用性和可靠性。3.2 數(shù)據(jù)分片的原則 4設(shè)全局關(guān)系R被劃分為邏輯片段S=S1,S2,,Sn,貝U S滿 足:1)完整性:
7、所有的分片 S1, S2,,Sn應(yīng)該可以組合成一 個(gè)整體 S;2)不相交性:各個(gè)分片都應(yīng)該是不相交的;3) 重構(gòu)性:所有的分片應(yīng)該可以重構(gòu)成原來的關(guān)系R。3.3 分片的方法通常有兩種基本的方法:水平分片和垂直分片。1) 水平分片:一個(gè)表 T被分成若干片:T1, T2,,Tn, 其中每個(gè)片包含T的一部分行并且T的每一行都會(huì)出現(xiàn)在一個(gè)片 中。2) 垂直分片:一個(gè)表 T被分成若干片:T1 , T2,,Tn, 每片包含T的一部分列。每一列必須至少被一個(gè)片包含,并且每 個(gè)片必須包含候選碼的列。 (值得注意的是,在垂直分片中,為 了以后可以重構(gòu)的需要, 必須在每個(gè)分片中包括候選鍵的屬性列 5 。)4 數(shù)據(jù)
8、分配4.1 數(shù)據(jù)分配所謂數(shù)據(jù)分配, 就是將分片的數(shù)據(jù)放在多個(gè)站點(diǎn), 利用冗余 6 來達(dá)到系統(tǒng)的最大可用性和可靠性。將分片的副本放在多個(gè) 站點(diǎn),當(dāng)本地系統(tǒng)要訪問數(shù)據(jù)時(shí), 首先判斷該數(shù)據(jù)是本地的數(shù)據(jù) 還是其他站點(diǎn)的數(shù)據(jù), 如果是本地的數(shù)據(jù), 就直接可以在本地進(jìn) 行讀取。 這樣就縮短了系統(tǒng)的響應(yīng)時(shí)間。 當(dāng)要訪問的數(shù)據(jù)的站點(diǎn) 發(fā)生故障不可用時(shí), 系統(tǒng)可以直接訪問其副本所在的站點(diǎn), 以此 來達(dá)到系統(tǒng)的最大可用性。4.2 數(shù)據(jù)分配的原則1)處理局部性 將數(shù)據(jù)盡量放在本地站點(diǎn)及其相鄰的站點(diǎn), 這樣可以在一定程度上減少站點(diǎn)之間的通信代價(jià)。2)各個(gè)站點(diǎn)負(fù)荷的平衡性 使各個(gè)站點(diǎn)的負(fù)荷 (各個(gè)站點(diǎn)所 負(fù)擔(dān)的全局任務(wù)
9、和局部任務(wù)) 均勻化, 提高各站點(diǎn)的本地和全局 應(yīng)用,盡量提高各站點(diǎn)的并行性。5 數(shù)據(jù)透明性數(shù)據(jù)透明性是指對(duì)于用戶而言, 并不需要知道數(shù)據(jù)的存儲(chǔ)情 況,分片情況以及位置情況。數(shù)據(jù)透明性包括三個(gè)方面:1)分片透明性 (fragmentation transparency) 指的是用戶 或應(yīng)用程序不用去考慮關(guān)系是如何分片以及具體的分片情況, 就 可以對(duì)全局關(guān)系進(jìn)行操作;2)復(fù)制透明性 (replication transparency) 指的是用戶并 不需要知道數(shù)據(jù)的副本存放在哪個(gè)或哪幾個(gè)站點(diǎn);3) 位置透明性 (location transparency) 指的是用戶或者應(yīng) 用程序不用去考慮邏輯
10、片斷存儲(chǔ)在哪個(gè)具體的結(jié)點(diǎn)。6 數(shù)據(jù)復(fù)制和分片產(chǎn)生的問題分布式數(shù)據(jù)庫中, 進(jìn)行數(shù)據(jù)復(fù)制和分片可以有效的提高物理 分散站點(diǎn)之間訪問的速度, 提高系統(tǒng)的可用性。 但是也產(chǎn)生了如 何保持多個(gè)分布的一致性和副本更新的一致性 7 ,以及事務(wù)管 理的問題。1)保持多副本的一致性:保持多副本的一致性,也就是使 得當(dāng)對(duì)一個(gè)數(shù)據(jù)進(jìn)行更新時(shí), 要保證其所有的副本的數(shù)據(jù)也得到 更新,并且所有的副本的數(shù)據(jù)是一致的。進(jìn)行數(shù)據(jù)的復(fù)制,提高 了讀操作的性能, 在很大程度上保證了站點(diǎn)的可用性, 但是卻增 加了更新時(shí)的開銷,從而造成系統(tǒng)效率下降。2)保持分布的一致性:數(shù)據(jù)被更新之后,使得數(shù)據(jù)的原有 分片不再從邏輯上是一個(gè)整體。 比如將全校學(xué)生按照系別進(jìn)行分 片,數(shù)學(xué)系的張三因?yàn)檗D(zhuǎn)系到計(jì)算機(jī)系, 導(dǎo)致其系別屬性值變?yōu)?“計(jì)算機(jī)”,而他的信息因?yàn)榉制脑颍匀淮娣旁凇皵?shù)學(xué) 系”的分片中。導(dǎo)致“數(shù)學(xué)系”的分片從邏輯上不在是一個(gè)整 體。3)分布事務(wù)管理:由于數(shù)據(jù)是分布在不同站點(diǎn)的,對(duì)數(shù)據(jù) 的更新操作也應(yīng)該是分布的,這涉及到并發(fā)控制和恢復(fù)的問題。 也就是保證對(duì)數(shù)據(jù)進(jìn)行更新時(shí), 要把所有的數(shù)據(jù)都更新。 一旦有 一個(gè)副本沒有更新,那么整個(gè)事務(wù)處理失敗。7 結(jié)束語 分布式數(shù)據(jù)庫系統(tǒng)符合當(dāng)今社會(huì)發(fā)展的趨勢(shì),為物理上分 散,邏輯上集中的企業(yè)提供了很好的體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 彩鋼瓦鋼結(jié)構(gòu)建筑拆除與環(huán)保處理合同
- 電商代理業(yè)務(wù)運(yùn)營及市場(chǎng)拓展合同
- 四年級(jí)數(shù)學(xué)(除數(shù)是兩位數(shù))計(jì)算題專項(xiàng)練習(xí)及答案
- 分期公司財(cái)務(wù)管理制度
- 創(chuàng)業(yè)公司會(huì)計(jì)管理制度
- 北京民企績效管理制度
- 區(qū)域公司財(cái)務(wù)管理制度
- 12科學(xué)測(cè)量(第4課時(shí))課件-浙教版科學(xué)七年級(jí)上冊(cè)
- Unit2IconicAttractionsReadingforWriting課件-高中英語人教版選擇性-1
- Unit9SectionB1a-1d課件人教版八年級(jí)英語下冊(cè)
- 契約戀愛協(xié)議書范本范本電子版
- 2023醫(yī)療質(zhì)量安全核心制度要點(diǎn)釋義(第二版)對(duì)比版
- 2022年廣西百色市中考物理試題(含答案解析)
- 職業(yè)技能等級(jí)認(rèn)定投訴舉報(bào)制度
- 2024年服裝輔料項(xiàng)目可行性研究報(bào)告
- 四川省2024年中考生物試卷十二套合卷【附答案】
- 呼吸機(jī)霧化吸入療法護(hù)理實(shí)踐專家共識(shí)
- 《銀行業(yè)從業(yè)人員職業(yè)操守和行為準(zhǔn)則》課件
- 人教版四年級(jí)美術(shù)下冊(cè)《第15課設(shè)計(jì)文化衫》說課稿
- 2024至2030年中國汽車售后服務(wù)行業(yè)市場(chǎng)深度調(diào)研及前景趨勢(shì)與投資發(fā)展研究報(bào)告
- 人工氣候室投標(biāo)書
評(píng)論
0/150
提交評(píng)論