![第11章_海量信息存儲_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/3/2c6e71e7-447a-4683-a7e0-491190f13bc5/2c6e71e7-447a-4683-a7e0-491190f13bc51.gif)
![第11章_海量信息存儲_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/3/2c6e71e7-447a-4683-a7e0-491190f13bc5/2c6e71e7-447a-4683-a7e0-491190f13bc52.gif)
![第11章_海量信息存儲_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/3/2c6e71e7-447a-4683-a7e0-491190f13bc5/2c6e71e7-447a-4683-a7e0-491190f13bc53.gif)
![第11章_海量信息存儲_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/3/2c6e71e7-447a-4683-a7e0-491190f13bc5/2c6e71e7-447a-4683-a7e0-491190f13bc54.gif)
![第11章_海量信息存儲_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/3/2c6e71e7-447a-4683-a7e0-491190f13bc5/2c6e71e7-447a-4683-a7e0-491190f13bc55.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、內(nèi)容提要物聯(lián)背景下如何適應(yīng)海量信息存儲的需求呢?隨著物聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)中心數(shù)據(jù)中心將成為解決海量數(shù)據(jù)存儲的主要手段。本章將介紹典型的網(wǎng)絡(luò)存儲體系結(jié)構(gòu)以及數(shù)據(jù)中心的基本概念。第10章介紹了數(shù)據(jù)庫管理系統(tǒng)的基本概念數(shù)據(jù)庫模型的發(fā)展關(guān)系數(shù)據(jù)庫的基本概念利用關(guān)系代數(shù)寫查詢表達式物聯(lián)網(wǎng)數(shù)據(jù)管理的特點本章重點介紹三種基本的網(wǎng)絡(luò)存儲體系結(jié)構(gòu),并以Google數(shù)據(jù)中心為例,介紹大規(guī)模數(shù)據(jù)中心的相關(guān)技術(shù),最后簡要開源分布式計算框架Hadoop。內(nèi)容回顧11.1 物聯(lián)網(wǎng)對海量信息存儲的需求物聯(lián)網(wǎng)對海量信息存儲的需求11.2 網(wǎng)絡(luò)存儲體系結(jié)構(gòu)11.3 數(shù)據(jù)中心信息存儲的發(fā)展歷程如何?物聯(lián)網(wǎng)對海量信息存儲的需求促使了
2、哪些技術(shù)的發(fā)展?本章內(nèi)容數(shù)據(jù)存儲的發(fā)展歷史甲骨文甲骨文紙質(zhì)書籍紙質(zhì)書籍?dāng)?shù)字化存儲數(shù)字化存儲物聯(lián)網(wǎng)對海量信息存儲的需求全球信息總量迅猛增長2007年產(chǎn)生的數(shù)據(jù)量為281EB ( 1EB=10億GB )物聯(lián)網(wǎng)中對象的數(shù)量將龐大到以百億為單位物聯(lián)網(wǎng)中的對象積極參與業(yè)務(wù)流程的需求高強度計算需求數(shù)據(jù)的持續(xù)在線可獲取特性導(dǎo)致了網(wǎng)絡(luò)化存儲和大型數(shù)據(jù)中心的誕生11.1 物聯(lián)網(wǎng)對海量信息存儲的需求11.2 網(wǎng)絡(luò)存儲體系結(jié)構(gòu)網(wǎng)絡(luò)存儲體系結(jié)構(gòu)11.3 數(shù)據(jù)中心三種基本的網(wǎng)絡(luò)存儲體系結(jié)構(gòu):直接附加存儲,網(wǎng)絡(luò)附加存儲,存儲區(qū)域網(wǎng)絡(luò),各有什么特點?本章內(nèi)容直接附加存儲直接附加存儲直接附加存儲(Direct-Attache
3、d Storage, DAS)將存儲系統(tǒng)通過纜線直接與服務(wù)器或工作站相連一般包括多個硬盤驅(qū)動器,與主機總線適配器通過電纜或光纖在存儲設(shè)備和主機總線適配器之間不存在其他網(wǎng)絡(luò)設(shè)備實現(xiàn)了計算機內(nèi)存儲到存儲子系統(tǒng)的跨越網(wǎng)絡(luò)附加存儲網(wǎng)絡(luò)附加存儲網(wǎng)絡(luò)附加存儲(Network Attached Storage, NAS)文件級的計算機數(shù)據(jù)存儲架構(gòu)計算機連接到一個僅為其它設(shè)備提供基于文件級數(shù)據(jù)存儲服務(wù)的網(wǎng)絡(luò)NAS與與DAS的區(qū)別的區(qū)別DAS是一種對已有服務(wù)器的簡單擴展,并沒有真正實現(xiàn)網(wǎng)絡(luò)互聯(lián)。NAS則是將網(wǎng)絡(luò)作為存儲實體,更容易實現(xiàn)文件級別的共享。NAS性能上比DAS有所增強存儲區(qū)域網(wǎng)絡(luò)存儲區(qū)域網(wǎng)絡(luò)存儲區(qū)域網(wǎng)
4、絡(luò) (Storage Area Network, SAN)通過網(wǎng)絡(luò)方式連接存儲設(shè)備和應(yīng)用服務(wù)器的存儲架構(gòu)由服務(wù)器、存儲設(shè)備和SAN連接設(shè)備組成SAN的特點的特點存儲共享支持服務(wù)器從SAN直接啟動三種網(wǎng)絡(luò)存儲結(jié)構(gòu)的比較三種網(wǎng)絡(luò)存儲結(jié)構(gòu)的比較DAS管理容易,結(jié)構(gòu)簡單;集中式體系結(jié)構(gòu),不能滿足大規(guī)模數(shù)據(jù)訪問的需求;存儲資源利用率低,資源共享能力差,造成“信息孤島”。NAS網(wǎng)絡(luò)的存儲實體,容易實現(xiàn)文件級別共享;性能嚴(yán)重依賴于網(wǎng)絡(luò)流量,用戶數(shù)過多,讀寫過頻繁時性能受限。SAN存儲管理簡化,存儲容量利用率提高;無直接文件級別的訪問能力,但可在SAN基礎(chǔ)上建立文件系統(tǒng)。11.1 物聯(lián)網(wǎng)對海量信息存儲的需求1
5、1.2 網(wǎng)絡(luò)存儲體系結(jié)構(gòu)11.3 數(shù)據(jù)中心數(shù)據(jù)中心什么是數(shù)據(jù)中心?典型的數(shù)據(jù)中心有哪些?數(shù)據(jù)中心的研究熱點是什么?本章內(nèi)容什么是數(shù)據(jù)中心?維基百科維基百科:“數(shù)據(jù)中心是一整套復(fù)雜的設(shè)施。它不僅僅包括計算機系統(tǒng)和其它與之配套的設(shè)備(例如通信和存儲系統(tǒng)),還包含冗余的數(shù)據(jù)通信連接、環(huán)境控制設(shè)備、監(jiān)控設(shè)備以及各種安全裝置。”Google:“多功能的建筑物,能容納多個服務(wù)器以及通信設(shè)備。這些設(shè)備被放置在一起是因為它們具有相同的對環(huán)境的要求以及物理安全上的需求,并且這樣放置便于維護?!睌?shù)據(jù)中心的起源與發(fā)展大型機微型機大規(guī)模數(shù)據(jù)中心(Mega Data Center)數(shù)據(jù)中心的起源與發(fā)展大規(guī)模數(shù)據(jù)中心已經(jīng)
6、得到推廣數(shù)據(jù)中心標(biāo)準(zhǔn)數(shù)據(jù)中心建設(shè)者面對的難題如何規(guī)劃一個新的數(shù)據(jù)中心?怎樣對數(shù)據(jù)中心進行升級?數(shù)據(jù)中心的標(biāo)準(zhǔn)數(shù)據(jù)中心的標(biāo)準(zhǔn)對相關(guān)經(jīng)驗進行了總結(jié)ANSI/TIA/EIA-942(簡稱TIA-942):數(shù)據(jù)中心標(biāo)準(zhǔn)電信產(chǎn)業(yè)協(xié)會(TIA)提出美國國家標(biāo)準(zhǔn)學(xué)會(ANSI)批準(zhǔn)數(shù)據(jù)中心標(biāo)準(zhǔn):TIA-942選址選址:需要考慮多方面因素建設(shè)和運營成本應(yīng)用需求政策優(yōu)惠布局布局:按功能區(qū)域劃分功能區(qū)域組成數(shù)據(jù)中心標(biāo)準(zhǔn):TIA-942(續(xù))TIA-942還對纜線系統(tǒng),可靠性分級,能源系統(tǒng)和降溫系統(tǒng)等做了規(guī)定。纜線系統(tǒng)規(guī)格如何放置纜線能源系統(tǒng)外部電力供應(yīng)電池組發(fā)電機降溫系統(tǒng)降溫設(shè)備架空地板冷通道與熱通道典型數(shù)據(jù)中心
7、:Google 數(shù)據(jù)中心簡介簡介全球共建有近40個大規(guī)模數(shù)據(jù)中心單個數(shù)據(jù)中心需要至少50兆瓦功率,約等于一個小型城市所有家庭的用電量獨特的硬件設(shè)備:定制的以太網(wǎng)交換機、能源系統(tǒng)等自行研發(fā)的軟件技術(shù):Google File System、MapReduce、BigTable等Google File System GFS的設(shè)計架構(gòu)的設(shè)計架構(gòu)一個GFS集群包含一個主服務(wù)器和多個塊服務(wù)器,并被多個客戶端訪問。文件分成固定大小的“塊”。每個塊在創(chuàng)建時都由主服務(wù)器分配一個固定不變的64位句柄唯一標(biāo)識。塊服務(wù)器把塊作為Linux文件存儲在本地磁盤上,并根據(jù)指定的塊句柄和字節(jié)范圍對數(shù)據(jù)塊進行讀寫操作。Goog
8、le File System GFS的設(shè)計架構(gòu)(續(xù))的設(shè)計架構(gòu)(續(xù))主服務(wù)器維護所有文件系統(tǒng)的元數(shù)據(jù),包括名字空間、訪問控制信息、文件到塊的映射信息以及塊當(dāng)前的位置。此外,主服務(wù)器還控制其它系統(tǒng)級的活動。主服務(wù)器周期性地與塊服務(wù)器通信,以下達指令和收集狀態(tài)。GFS客戶端代碼被嵌入到每個應(yīng)用中。它實現(xiàn)了文件系統(tǒng)API,實現(xiàn)主服務(wù)器與塊服務(wù)器的通信從而代表應(yīng)用實現(xiàn)讀寫操作??蛻舳伺c服務(wù)器交互從而實現(xiàn)元數(shù)據(jù)操作,但所有的數(shù)據(jù)操作都通過直接與塊服務(wù)器交互而完成。MapReduceMapReduce是一種針對超大規(guī)模數(shù)據(jù)集的編程模型和系統(tǒng)用MapReduce開發(fā)出的程序可在大量商用計算機集群上并行執(zhí)行、
9、處理計算機的失效以及調(diào)度計算機間的通信MapReduce的基本思想用戶寫的兩個程序:Map和Reduce一個在計算機集群上執(zhí)行多個程序?qū)嵗目蚣躆apReduceMapReduce程序的執(zhí)行過程程序的執(zhí)行過程BigTableBigTable是一種用來在海量數(shù)據(jù)規(guī)模下(例如包含以PB為單位的數(shù)據(jù)量和數(shù)千臺廉價計算機的應(yīng)用)管理結(jié)構(gòu)化數(shù)據(jù)的分布式存儲系統(tǒng)。應(yīng)用應(yīng)用Google地球網(wǎng)頁索引RSS閱讀器BigTable每個BigTable都是一個稀疏的、分布式的多維有序圖,按行鍵值、列鍵值和時間戳建立索引典型數(shù)據(jù)中心:Hadoop什么是什么是Hadoop?Apache開源組織的一個分布式計算開源框架用
10、于在大型集群的廉價服務(wù)器設(shè)備上運行數(shù)據(jù)密集型分布式應(yīng)用程序在早期實際上是Google文件系統(tǒng)與MapReduce分布式計算框架及相關(guān)IT基礎(chǔ)服務(wù)的開源實現(xiàn)Hadoop包括多個子項目HDFS、 MapReduce、 HBase 、Chukwa、Pig、ZooKeeper等HDFSHadoop Distributed File System數(shù)據(jù)中心的研究熱點2006年Google在數(shù)據(jù)中心項目上的花費為19億美元,而2007年該項支出增加到24億美元。Google在俄勒岡州的數(shù)據(jù)中心有近100兆瓦的功率,滿負(fù)荷運行時消耗的電力基本上和紐卡斯?fàn)枺∟ewcastle)一個城市所有家庭的用電量加起來一樣
11、多。研究熱點:研究熱點:如何在保證服務(wù)質(zhì)量的前提下降低成本?數(shù)據(jù)中心的成本構(gòu)成基礎(chǔ)設(shè)施部分包括能源系統(tǒng)、降溫系統(tǒng)、各種防火設(shè)備、安保設(shè)備等。降低這一部分成本往往涉及到機械設(shè)備制造技術(shù)或政策優(yōu)惠等因素,與計算機學(xué)科的關(guān)聯(lián)程度相對較低。我們分別從服務(wù)器,網(wǎng)絡(luò)設(shè)備,能源三個方面對造成高成本的原因和目前的解決方法進行簡要介紹。服務(wù)器成本服務(wù)器網(wǎng)絡(luò)設(shè)備能源服務(wù)器的實際利用效率較低分配到各服務(wù)器的應(yīng)用不能完全利用某些組件對應(yīng)用需求的預(yù)測比較難,無法做到按需分配為了提高系統(tǒng)的可靠性,一般都留有冗余設(shè)備提高服務(wù)器利用率的關(guān)鍵關(guān)鍵在于及時應(yīng)對需求的動態(tài)變化網(wǎng)絡(luò)設(shè)備成本服務(wù)器網(wǎng)絡(luò)設(shè)備能源主要來源主要來源交換機、路
12、由器、負(fù)載均衡設(shè)備傳統(tǒng)的數(shù)據(jù)中心使用樹形結(jié)構(gòu),核心交換機和路由器構(gòu)成流量瓶頸,且造價昂貴研究熱點:研究熱點:新的數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)以交換機為中心的多層樹形結(jié)構(gòu):例如Fat-Tree以服務(wù)器為中心的互聯(lián)結(jié)構(gòu):例如DCell能源成本服務(wù)器網(wǎng)絡(luò)設(shè)備能源研究熱點研究熱點降低服務(wù)器工作能耗降低同等性能設(shè)備能耗提高同等能耗設(shè)備性能可調(diào)整負(fù)載的服務(wù)器減少降溫系統(tǒng)能耗精細(xì)、精準(zhǔn)的溫度控制集裝箱式模塊化數(shù)據(jù)中心數(shù)據(jù)中心能耗構(gòu)成本章小結(jié)內(nèi)容回顧內(nèi)容回顧本章介紹了三種基本的網(wǎng)絡(luò)存儲體系結(jié)構(gòu),并討論了數(shù)據(jù)中心的基本概念,以Google數(shù)據(jù)中心和Hadoop為例,簡要介紹了數(shù)據(jù)中心的相關(guān)技術(shù),最后指出了數(shù)據(jù)中心的研究熱點。重點掌握重點掌握了解物聯(lián)網(wǎng)對海量數(shù)據(jù)存儲的迫切需求。重點
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 時尚品牌店裝修合同樣本
- 2025年度特種設(shè)備安全管理停薪留職協(xié)議
- 夜間快遞運輸線路外包合同
- 保險公司裝修質(zhì)量保證協(xié)議
- 產(chǎn)業(yè)園裝修貸款合同范本
- 2025年度網(wǎng)絡(luò)安全應(yīng)急響應(yīng)工程師聘請合同-@-1
- 學(xué)校教室半包裝修合同樣本
- 工廠車間裝修包工協(xié)議
- 家電賣場展位裝修合同書
- 保險公司裝修制式合同樣本
- 自卸車司機實操培訓(xùn)考核表
- 教師個人基本信息登記表
- 中考現(xiàn)代文閱讀理解題精選及答案共20篇
- ESD測試作業(yè)指導(dǎo)書-防靜電手環(huán)
- 高頻變壓器的制作流程
- 春季開學(xué)安全第一課PPT、中小學(xué)開學(xué)第一課教育培訓(xùn)主題班會PPT模板
- JJG30-2012通用卡尺檢定規(guī)程
- 部編版人教版二年級上冊語文教材分析
- 艾賓浩斯遺忘曲線復(fù)習(xí)方法表格模板100天
- APR版制作流程
- 《C++程序設(shè)計》完整教案
評論
0/150
提交評論