下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
云計(jì)算及大數(shù)據(jù)技術(shù)課后習(xí)題云計(jì)算及大數(shù)據(jù)技術(shù)課后習(xí)題云計(jì)算及大數(shù)據(jù)技術(shù)課后習(xí)題第一章云計(jì)算與大數(shù)據(jù)基礎(chǔ)
在信息產(chǎn)業(yè)的發(fā)展歷程中。硬件驅(qū)動力,網(wǎng)絡(luò)驅(qū)動力,作為兩個(gè)重要的內(nèi)在動力在不一樣樣的時(shí)期起重視要的作用
2~5
西摩克雷超級計(jì)算機(jī)之父
約翰麥克錫云計(jì)算之父
蒂姆伯納斯李萬維網(wǎng)發(fā)明人第一個(gè)網(wǎng)頁開發(fā)者
吉姆格雷大數(shù)據(jù)之父
6.MapReduce思想本源LISP語言
7.依照資源封裝層次,云計(jì)算分為Iaaspaassaas三種
教材P2教材P8教材P10第二章云計(jì)算與大數(shù)據(jù)相關(guān)技術(shù)
一致性hash算法原理:
哈希算法是一種從稀有值到親密值范圍的照射方法,在積蓄和計(jì)算定位時(shí)可以被看做是
一種路由算法。經(jīng)過這類路與哦算法文件塊能被唯一的定位到一個(gè)節(jié)點(diǎn)的地址。傳統(tǒng)的hash
算法容錯(cuò)性和擴(kuò)展性都不好,無法有效的適應(yīng)面向數(shù)據(jù)系統(tǒng)節(jié)點(diǎn)的動向變化。意思就是當(dāng)集
群需要增加節(jié)點(diǎn),傳統(tǒng)的hash算法不簡單檢測到新增加的節(jié)點(diǎn),此為擴(kuò)展性不好,而一致
hash算法增加一個(gè)節(jié)點(diǎn)只會影響增加的這個(gè)節(jié)點(diǎn)到前一個(gè)節(jié)點(diǎn)之間的數(shù)據(jù)。容錯(cuò)性就是
若是不幸一個(gè)機(jī)器C宕機(jī)了,那么機(jī)器B和C之間的數(shù)據(jù)都會被D執(zhí)行,那么受影響的數(shù)據(jù)可是機(jī)器B和C之間的數(shù)據(jù)。自然,容錯(cuò)性和擴(kuò)展性對于節(jié)點(diǎn)數(shù)很多的集群是比較有意義的,
對于節(jié)點(diǎn)較少的集群憂如這兩個(gè)特點(diǎn)并沒有什么誘惑力。
一致性hash的實(shí)質(zhì)目的就是解決節(jié)點(diǎn)頻頻變化時(shí)的任務(wù)分配問題,一致性hash將整個(gè)
hash值空間組織成一個(gè)虛假圓環(huán),我們這里假設(shè)某hash函數(shù)H值空間為0~(2^32-1),即32
位無符號整形。下面簡述一下一致性hash的原理:
這是一致性hash的整個(gè)值空間0~(2^32-1)
下一步將各個(gè)服務(wù)器使用Hash進(jìn)行一個(gè)哈希,詳盡可以選擇服務(wù)器的ip或主機(jī)名作為
要點(diǎn)字進(jìn)行哈希,這樣每臺機(jī)器就能確定其在哈希環(huán)上的地址,假設(shè)使用四臺機(jī)器進(jìn)行hash:
將數(shù)據(jù)key使用相同的函數(shù)Hash計(jì)算出哈希值,并確定此數(shù)據(jù)在環(huán)上的地址,今后地址沿環(huán)順時(shí)針“行走”,第一臺遇到的服務(wù)器就是其應(yīng)該定位到的服務(wù)器。
比方我們有ObjectA、ObjectB、ObjectC、ObjectD四個(gè)數(shù)據(jù)對象,經(jīng)過哈希計(jì)算后,在環(huán)空間上的地址以下:
依照一致性哈希算法,數(shù)據(jù)A會被定為到NodeA上,B被定為到NodeB上,C被定為
NodeC上,D被定為到NodeD上
下面我們看看當(dāng)集群機(jī)器比較少的情況
比方系統(tǒng)中只有兩臺服務(wù)器,其環(huán)分布以下,
此時(shí)必然造成大量數(shù)據(jù)集中到NodeA上,而只有很少量會定位到NodeB上。為認(rèn)識決這
種數(shù)據(jù)傾斜問題,一致性哈希算法引入了虛假節(jié)點(diǎn)系統(tǒng),即對每一個(gè)服務(wù)節(jié)點(diǎn)計(jì)算多個(gè)哈希,
每個(gè)計(jì)算結(jié)果地址都放置一個(gè)此服務(wù)節(jié)點(diǎn),稱為虛假節(jié)點(diǎn)。詳盡做法可以在服務(wù)器ip或主
機(jī)名的后邊增加編號來實(shí)現(xiàn)。比方上面的情況,可以為每臺服務(wù)器計(jì)算三個(gè)虛假節(jié)點(diǎn),于是
可以分別計(jì)算“NodeA#1”、“NodeA#2”、“NodeA#3”、“NodeB#1”、“NodeB#2”、“NodeB#3”的哈希值,于是形成六個(gè)虛假節(jié)點(diǎn):
同時(shí)數(shù)據(jù)定位算法不變,可是多了一步虛假節(jié)點(diǎn)到實(shí)質(zhì)節(jié)點(diǎn)的照射,比方定位到“Node
A#1”、“NodeA#2”、“NodeA#3”三個(gè)虛假節(jié)點(diǎn)的數(shù)據(jù)均定位到NodeA上。這樣就解決
了服務(wù)節(jié)點(diǎn)少時(shí)數(shù)據(jù)傾斜的問題。在實(shí)質(zhì)應(yīng)用中,平時(shí)將虛假節(jié)點(diǎn)數(shù)設(shè)置為32甚至更大,
因此即使很少的服務(wù)節(jié)點(diǎn)也能做到相對均勻的數(shù)據(jù)分布。
2.科學(xué)研究的四個(gè)范式:察看實(shí)驗(yàn)、理論、計(jì)算仿真、數(shù)據(jù)
3.物聯(lián)網(wǎng)產(chǎn)業(yè)鏈分為:表記,感知,辦理,信息傳達(dá)
4.非關(guān)系型數(shù)據(jù)庫分為:
(1)Column-Oriented
面向檢索的列式積蓄,其積蓄構(gòu)造為列式構(gòu)造如:Google的bigtable,apache
的hbase
Key-Value
面向高性能的并發(fā)讀/寫的緩積蓄藏,構(gòu)造近似于Hash表(hash算法真的要好好學(xué),
用的地方太多了,性能的確也是最高的),每個(gè)key分別對應(yīng)一個(gè)value,這類數(shù)
據(jù)庫適合用來作為緩存系統(tǒng)使用,比方:MemcacheDB,BerkeleyDB,redis,flare
Document-Oriented
面向海量數(shù)據(jù)接見的文檔積蓄,這類積蓄近似key-value形式,可是value主要以
JSON也許XML等格式進(jìn)行積蓄,比方:mongoDB,CouchDB
第三章虛假化技術(shù)和Goldberg指出:虛假機(jī)擁有同一性,高效性,可控性
2.虛假化技術(shù)從計(jì)算機(jī)系統(tǒng)構(gòu)造層次上可分為以下5類:指令集架構(gòu)級虛假化,硬件抽象
層虛假化,操作系統(tǒng)層虛假化,編程語言上的虛假化,庫函數(shù)虛假化
3.常用的虛假化軟件系統(tǒng)有VirtualBox,VMwareWorkstation,KVM
系統(tǒng)虛假化擁有硬件沒關(guān)性,間隔性,多實(shí)例,,特權(quán)功能等優(yōu)點(diǎn)。
系統(tǒng)虛假化可分為服務(wù)器虛假化桌面虛假化網(wǎng)絡(luò)虛假化
6.服務(wù)器虛假化依照虛假化的部分可分為CPU虛假化,內(nèi)存虛假化,I/O虛假化
什么是廣義虛假化技術(shù):
答:虛假化技術(shù)是一種邏輯簡化技術(shù),實(shí)現(xiàn)物理層向邏輯層的變化,對物理層運(yùn)動復(fù)雜性的障蔽,是系統(tǒng)對外運(yùn)動表現(xiàn)出簡單的邏輯運(yùn)行狀態(tài)
虛假化技術(shù)有哪些優(yōu)勢劣勢
優(yōu)勢:1.虛假化技術(shù)可提升資源利用率
供應(yīng)相互間隔,高效的應(yīng)用執(zhí)行環(huán)境
虛假化可以簡化資源和資源管理
虛假化實(shí)現(xiàn)軟件和硬件的分別
劣勢1.可能會使物理計(jì)算機(jī)負(fù)載過重2.升級和保護(hù)引起的安全問題3.物理計(jì)算機(jī)的影響第四章集群系統(tǒng)基礎(chǔ)
1.云計(jì)算領(lǐng)域存在兩個(gè)主要技術(shù)路線,一個(gè)是基于集群技術(shù)的云計(jì)算資源整合技術(shù),一個(gè)是基于虛假機(jī)的云計(jì)算資源切分技術(shù)2.集群的設(shè)計(jì)要考慮5個(gè)要點(diǎn)的問題是可用性單一系統(tǒng)映像作業(yè)管理并行文件系統(tǒng)高效通信3.傳統(tǒng)的集群系統(tǒng)可以分為高可用性系統(tǒng)負(fù)載均衡高性能虛假化4類。4簡述Beowulf系統(tǒng)的主要特點(diǎn)答:1Beowulf系統(tǒng)平時(shí)由一個(gè)管理節(jié)點(diǎn)和多個(gè)計(jì)算節(jié)點(diǎn)組成2Beowulf系統(tǒng)平時(shí)用最常有的硬件設(shè)備組成3Beowulf系統(tǒng)同城采用哪些廉價(jià)且廣為流傳的軟件5Lustre積蓄系統(tǒng)的組成有MDS,MDT,OSS,OST,Client
簡述面向計(jì)算分布式系統(tǒng),混雜分布式系統(tǒng),面向數(shù)據(jù)的分布式系統(tǒng)的實(shí)現(xiàn)系統(tǒng),剖析三種系統(tǒng)的差異.
面向計(jì)算分布式系統(tǒng):P59混雜型分布式系統(tǒng):
別:P64表3中分布式系統(tǒng)的比較
P60
面向數(shù)據(jù)的分布式系統(tǒng):
P61
剖析區(qū)
第五章MPI-面向計(jì)算的高性能集群技術(shù)
1,什么是MPI
MPI(MessagePassingInterface)信息傳達(dá)接口。它自己不是一個(gè)詳盡的實(shí)現(xiàn),而可是一
種標(biāo)準(zhǔn)描述。2,MPI支持
FORTRAN77、C
、Fortran90
、
C++
等語言的調(diào)用,能滿足大多數(shù)科學(xué)計(jì)算的應(yīng)用需要。
3,簡述MPICH并行環(huán)境建立的主要步驟。
(1).配置好NFS服務(wù),實(shí)現(xiàn)所有節(jié)點(diǎn)對主節(jié)點(diǎn)指定文件夾的共享,該文件夾為MPICH的安裝
地址,數(shù)據(jù)和程序的積蓄地址,這樣就可以防備在每個(gè)節(jié)點(diǎn)安裝MPICH,啟動計(jì)算時(shí)也可以
防備每次向各個(gè)節(jié)點(diǎn)發(fā)散程序。
(2).配置好各個(gè)節(jié)點(diǎn)間的互信,這一步就是實(shí)現(xiàn)集群內(nèi)部個(gè)節(jié)點(diǎn)間無密碼接見,因?yàn)镸PICH
在計(jì)算時(shí)需要在各節(jié)點(diǎn)進(jìn)行數(shù)據(jù)交換,集群內(nèi)的節(jié)點(diǎn)應(yīng)用相互相信的節(jié)點(diǎn)。
(3).編譯安裝置置MPICH。
4.著手配置MPI節(jié)點(diǎn)間的ssh無密碼接見。
(1)生成私鑰id_dsa和公鑰
(2)將該密鑰用作認(rèn)證,進(jìn)行接見授權(quán)。
(3)將~/.ssh目錄下的文件復(fù)制到所有節(jié)點(diǎn)。
(4)檢查可否可以直接(不需要密碼)登錄其他節(jié)點(diǎn)。
5,簡述基于蒙特卡羅思想求π值的編程方法,并編寫用MPI程序。
蒙特卡羅方法,又稱為隨機(jī)抽樣或統(tǒng)計(jì)試驗(yàn)方法。
代碼在84
第六章Hadoop-分布式大數(shù)據(jù)系統(tǒng)
1.谷歌三寶:mapreduce,bigtable,gfs
的工作過程:p93
分塊策略:p95
第七章HPCC-面向數(shù)據(jù)的高性能計(jì)算集群系統(tǒng)
1,簡述HPCC的主要特點(diǎn)。
1)興隆靈便的ECL語言,顯著提升了程序員編程的效率。
2)HPCC系統(tǒng)供應(yīng)的Roxie集群供應(yīng)了高效的在線盤問和剖析服務(wù)。
3)ECL程序第一編譯為優(yōu)化的C++,高速性能獲取保證。
4)高效的錯(cuò)誤恢復(fù)和冗余備份系統(tǒng)。
5)牢固和可靠的系統(tǒng)。
6)有對于其他平臺,在較低的系統(tǒng)耗資上實(shí)現(xiàn)了更高的性能。
2,高性能計(jì)算目前可以分為兩類:一類是面向計(jì)算的高性能計(jì)算,另一類是面向數(shù)據(jù)的高性能計(jì)算。3,數(shù)據(jù)密集型集群計(jì)算系統(tǒng)主要有HadoopHPCCStormApacheDrillRapidMinerPentaho4,HPCC系統(tǒng)從整體物理上可以看作在同一個(gè)集群上部署了Thor(數(shù)據(jù)加工辦理平臺)、Roxie(數(shù)據(jù)盤問、剖析和數(shù)據(jù)庫房)兩套集群計(jì)算系統(tǒng)。5,HPCC的系統(tǒng)服務(wù)器包括ECL服務(wù)器、Dali服務(wù)器、Sasha服務(wù)器、DFU服務(wù)器、ESP服務(wù)器6,簡述HPCC平臺數(shù)據(jù)檢索任務(wù)的執(zhí)行過程。(1)加載原始數(shù)據(jù)(2)切分、發(fā)散待辦理的數(shù)據(jù)(3)發(fā)散后原始數(shù)據(jù)的ETL辦理(4)向Roxie集群宣布118
7,熟悉HPC
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年股權(quán)質(zhì)押增信反擔(dān)保協(xié)議
- 房產(chǎn)交易2024年二手房買賣協(xié)議
- 2024年韓國娛樂圈離婚協(xié)議模板
- 低空經(jīng)濟(jì)行業(yè)動態(tài)及市場需求趨勢報(bào)告
- 服務(wù)器安全運(yùn)維專業(yè)服務(wù)協(xié)議2024
- 2024年不動產(chǎn)代理協(xié)議
- 淘寶訂單合同范本
- 2025年中國金剛石鉆頭行業(yè)發(fā)展現(xiàn)狀、市場規(guī)模、投資前景分析報(bào)告(智研咨詢)
- 擔(dān)保交易合同范本
- 欄桿安裝合同范本
- 大學(xué)美育(同濟(jì)大學(xué)版)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 過敏性休克完整版本
- 應(yīng)急第一響應(yīng)人理論考試試卷(含答案)
- DZ∕T 0213-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 石灰?guī)r、水泥配料類(正式版)
- 2024年湖北省工業(yè)建筑集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 軟件工程師專業(yè)人物訪談
- 盤縣地域分異匯總
- aspcms后臺操作說明書
- 免疫學(xué)發(fā)展簡史及展望PPT課件
- 熱水供暖設(shè)計(jì)說明
- 個(gè)人上學(xué)簡歷模板
評論
0/150
提交評論