




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)公司內(nèi)部編號(hào):(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTl-1概述隨著海量數(shù)據(jù)問題的出現(xiàn),海量管理能力,多類型,變化快,高可用性,低 成本,高端可擴(kuò)展性等需求給企業(yè)數(shù)據(jù)戰(zhàn)略帶來(lái)了巨大的挑戰(zhàn)。企業(yè)數(shù)據(jù)倉(cāng)庫(kù)、 數(shù)據(jù)中心的技術(shù)選型變得尤其重要!所以在選型之前,有必要對(duì)目前市場(chǎng)上各種 大數(shù)據(jù)量的解決方案進(jìn)行分析。2主流分布式并行處理數(shù)據(jù)庫(kù)產(chǎn)品介紹 2 1 Greenplum2. 1.1基礎(chǔ)架構(gòu)GreenPIUm是基于HaclOOP的一款分布式數(shù)據(jù)庫(kù)產(chǎn)品,在處理海量數(shù)據(jù)方面相比傳統(tǒng)數(shù)據(jù)庫(kù)有著較大的優(yōu)勢(shì)。GreenPIUnI整體架構(gòu)如下圖:MaSterSeVerSO
2、VX2 、/、/NetWOrkSegmen t勰IrC需尿數(shù)脇徹?cái)?shù)據(jù)庫(kù)由 MaSter SeVerS 和 Segment SeVerS 通過(guò) InterCOnneCt 互聯(lián)組成。MaSter主機(jī)負(fù)責(zé):建立與客戶端的連接和管理;SQL的解析并形成執(zhí)行計(jì) 劃;執(zhí)行計(jì)劃向Segment的分發(fā)收集Segment的執(zhí)行結(jié)果;MaSter不存儲(chǔ)業(yè)務(wù)數(shù) 據(jù),只存儲(chǔ)數(shù)據(jù)字典。Segment主機(jī)負(fù)責(zé):業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)和存??;用戶查詢SQL的執(zhí)行。2. 1. 2主要特性GreenPIUm整體有如下技術(shù)特點(diǎn):Shared-nothing 架構(gòu)海量數(shù)據(jù)庫(kù)采用最易于擴(kuò)展的Shared-nothing架構(gòu),每個(gè)節(jié)點(diǎn)都有自己
3、的 操作系統(tǒng)、數(shù)據(jù)庫(kù)、硬件資源,節(jié)點(diǎn)之間通過(guò)網(wǎng)絡(luò)來(lái)通信?;?gNet SOftware Interconnect數(shù)據(jù)庫(kù)的內(nèi)部通信通過(guò)基于超級(jí)計(jì)算的“軟件Switch”內(nèi)部連接層,基于通 用的gNet (GigE, IOGigE) NICs/SWitCheS在節(jié)點(diǎn)間傳遞消息和數(shù)據(jù),釆用高 擴(kuò)展協(xié)議,支持?jǐn)U展到1000個(gè)以上節(jié)點(diǎn)。并行加載技術(shù)利用并行數(shù)據(jù)流引擎,數(shù)據(jù)加載完全并行,加載數(shù)據(jù)可達(dá)到4。5T/小時(shí)(理 想配置)。并且可以直接通過(guò)SQL語(yǔ)句對(duì)外部表進(jìn)行操作支持行、列壓縮存儲(chǔ)技術(shù)海量數(shù)據(jù)庫(kù)支持ZLIB和QUlCKLZ方式的壓縮,壓縮比可到10: 1。壓縮數(shù)據(jù) 不一定會(huì)帶來(lái)性能的下降,壓縮表
4、通過(guò)利用空閑的CPU資源,而減少I/O資源占 用。海量數(shù)據(jù)庫(kù)除支持主流的行存儲(chǔ)模式外,還支持列存儲(chǔ)模式。如果常用的查 詢只取表中少量字段,則列模式效率更高,如查詢需要取表中的大量字段,行模 式效率更高。海量數(shù)據(jù)庫(kù)的多種壓縮存儲(chǔ)技術(shù)在提高數(shù)據(jù)存儲(chǔ)能力的同時(shí),也可根據(jù)不同應(yīng)用需求提高查詢的效率2. 1. 3主要局限列存儲(chǔ)模式的使用有限制,不支持delete/UPdate操作。用戶不可靈活控制事務(wù)的提交,用戶提交的處理將被自動(dòng)視作整體事務(wù), 整體提交,整體回滾。數(shù)據(jù)庫(kù)需要額外的空間清理維護(hù)(VaCUUm),給數(shù)據(jù)庫(kù)維護(hù)帶來(lái)額外的工 作量。用戶不能靈活分配或控制服務(wù)器資源。對(duì)磁盤IO有比較高的要求。備
5、份機(jī)制還不完善,沒有增量備份。2 2 Vertica2. 2.1基礎(chǔ)架構(gòu)與以往常見的行式關(guān)系型數(shù)據(jù)庫(kù)不同,VertiCa是一種基于列存儲(chǔ)(COIUmn-Oriented)的數(shù)據(jù)庫(kù)體系結(jié)構(gòu),這種存儲(chǔ)機(jī)構(gòu)更適合在數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ) 和商業(yè)智能方面發(fā)揮特長(zhǎng)。常見的RDBMS都是面向行(ROW-Oriented DatabaSe)存儲(chǔ)的,在對(duì)某一列 匯總計(jì)算的時(shí)候兒乎不可避免的要進(jìn)行額外的I/O尋址掃描,而面向列存儲(chǔ)的數(shù) 據(jù)庫(kù)能夠連續(xù)進(jìn)行I/O操作,減少了 I/O開銷,從而達(dá)到數(shù)量級(jí)上的性能提升。同時(shí),VertiCa支持海量并行存儲(chǔ)(MPP)架構(gòu),實(shí)現(xiàn)了完全無(wú)共享,因此 擴(kuò)展容易,可以利用廉價(jià)的硬件來(lái)獲取高
6、的性能,具有很高的性價(jià)比。如下圖,展示的是單節(jié)點(diǎn)上的VertiCa的基本體系結(jié)構(gòu)。VertiCa體系結(jié)構(gòu)作為關(guān)系型數(shù)據(jù)庫(kù),VertiCa的查詢SQL也是在前端被解析和優(yōu)化的。但與 傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)有所不同,VertiCa內(nèi)部是混合存儲(chǔ)的,包括兩種不同的存 儲(chǔ)結(jié)構(gòu):寫優(yōu)化器(WOS)和讀優(yōu)化器(ROS) o(1) 寫優(yōu)化器 WOS (Write0pt imized StOre )是位于主存儲(chǔ)器上的一個(gè)數(shù)據(jù)結(jié)構(gòu),用于有效的支持?jǐn)?shù)據(jù)插入和更新操作; 數(shù)據(jù)的存放是無(wú)序的,非壓縮的。(2) 讀優(yōu)化器 ROS (Reaei-OPtimiZed StOre )是磁盤物理存儲(chǔ),存放的是排序和壓縮后的數(shù)據(jù)庫(kù)大
7、塊數(shù)據(jù),因此這里的查 詢相比于WoS性能更好。(3) TUPIe MOVer 進(jìn)程是VertiCa內(nèi)部的一個(gè)進(jìn)程,定期的以大數(shù)據(jù)塊的形式把數(shù)據(jù)從WOS移到 ROS,由于是對(duì)整個(gè)WoS操作,TUPIeMoVer 一次能非常有效的排序很多記錄,最 后批量把它們寫入磁盤。在VertiCa內(nèi)部,不論是WoS還是RoS都是按列存儲(chǔ)的。2. 2. 2主要特性Vertica的關(guān)鍵特性:1 列存儲(chǔ)(COIUmn-OrientatiOn)由于大多數(shù)的查詢都是要從磁盤讀取數(shù)據(jù),因此可以說(shuō)disk I/O在很大程 度上決定了一個(gè)查詢的最終響應(yīng)時(shí)間。2 壓縮機(jī)制(AggreSSiVe COmPreSSiOn)在數(shù)據(jù)存
8、儲(chǔ)方面,VertiCa利用內(nèi)部的特定算法對(duì)數(shù)據(jù)進(jìn)行壓縮處理。這樣 的機(jī)制會(huì)大大減少disk I/O的時(shí)間(D),同時(shí)由于VertiCa對(duì)掃描和聚合等 操作也在內(nèi)部進(jìn)行了優(yōu)化,可以直接處理壓縮后的數(shù)據(jù),這樣CPU的工作負(fù)載(C)也減少了。如上例中的AVG聚合函數(shù),VertiCa是不需要將壓縮數(shù)據(jù)先做 類似解壓這種處理的,因此查詢性能得到優(yōu)化。3 讀優(yōu)化存儲(chǔ)(Read-OPtiIniZed StOrage)VertiCa的數(shù)據(jù)庫(kù)存儲(chǔ)容器RoS COntainer專門為讀操作進(jìn)行了優(yōu)化設(shè)計(jì), 且其中的數(shù)據(jù)是經(jīng)過(guò)了排序和壓縮處理的,即每個(gè)磁盤頁(yè)上不會(huì)有空白空間,而 傳統(tǒng)的數(shù)據(jù)庫(kù)一般會(huì)在每頁(yè)上預(yù)留空間以
9、便日后的insert操作來(lái)使用。4多種排序方式的兀余存儲(chǔ)為了高可用性和備份恢復(fù)的需要,VertiCa會(huì)按照不同的排序方式對(duì)數(shù)據(jù)做 冗余存儲(chǔ),這不但避免了大量的日志操作,也為查詢帶來(lái)了便利。VertiCa的查 詢優(yōu)化器會(huì)自動(dòng)選擇最優(yōu)的排序方式來(lái)完成特定的查詢。5并行無(wú)共享設(shè)計(jì)VertiCa支持完全無(wú)共享海量并行存儲(chǔ)(MPP)架構(gòu),隨著硬件SerVer的增 加,多個(gè)CPU并行處理,性能也可以得到線性的擴(kuò)展,這樣用戶使用廉價(jià)的硬件 就可以獲得較高的性能改善。6其他管理特征除了有優(yōu)越的性能以外,VertiCa在數(shù)據(jù)庫(kù)管理方面也進(jìn)行了非常人性化的 設(shè)計(jì)。VertiCa DatabaSe DeSigner
10、是一個(gè)界面化的常管理工具,并且能為用戶 作出詳盡的DB層物理設(shè)計(jì)方案,大大減少了日后的性能調(diào)優(yōu)方面的開銷。VertiCa通過(guò)K-Safety值的設(shè)置,完成了數(shù)據(jù)庫(kù)的備份恢復(fù)機(jī)制,并保證 了高可用性。對(duì)于數(shù)據(jù)庫(kù)中的每個(gè)表每個(gè)列,VertiCa都會(huì)在至少K+1個(gè)節(jié)點(diǎn)上 存儲(chǔ),如果有K個(gè)節(jié)點(diǎn)宕機(jī),依然能夠保證VertiCa DB是完整可用的;當(dāng)損壞 的節(jié)點(diǎn)恢復(fù)時(shí),VertiCa自動(dòng)完成節(jié)點(diǎn)間的熱交換,把其他節(jié)點(diǎn)上的正確數(shù)據(jù)恢 復(fù)過(guò)來(lái)。通過(guò)這種機(jī)制也保證了 VertCia庫(kù)的節(jié)點(diǎn)數(shù)目可以自由伸縮而不會(huì)影響 到數(shù)據(jù)庫(kù)的操作。VertiCa通過(guò)兩種技術(shù)來(lái)實(shí)現(xiàn)在線的持續(xù)數(shù)據(jù)裝載而不會(huì)影響到數(shù)據(jù)庫(kù)的訪 問。V
11、ertiCa通常運(yùn)行在快照隔離(SnaPShOt ISOIatiOn)模式下,該模式下查 詢讀取的是最近的一致的數(shù)據(jù)庫(kù)快照,這個(gè)快照是不能被并發(fā)的UPdate或 delete操作更改的,因此查詢操作也不需要占用鎖,這種方式保證了數(shù)據(jù)裝載 (insert)和其他查詢能互不干擾。另外,VertiCa可以把數(shù)據(jù)直接裝載到WoS 結(jié)構(gòu)中,WOS中的數(shù)據(jù)是不排序或索引的,所以裝載速度會(huì)很快,然后再由 TUPIe MOVer進(jìn)程在后臺(tái)把數(shù)據(jù)移入RoS中,由于TUPIeMOVer的操作是大塊讀 取(bulk-IOad)的,所以性能也很好。2. 2. 3主要局限不支持SQL存儲(chǔ)過(guò)程及函數(shù),用戶需通過(guò)UDFS
12、(USer DefinedFUnCtion,基于C+)來(lái)自定義函數(shù)或過(guò)程。 軟件授權(quán)按原始未經(jīng)壓縮的裸數(shù)據(jù)量計(jì)算。列存儲(chǔ)的一些劣勢(shì),復(fù)雜查詢等性能不理想。對(duì)內(nèi)存有比較高的要求。在國(guó)內(nèi)還沒有成功案例。2. 3 Sybase IQ2. 3. 1基礎(chǔ)架構(gòu)SYBASE IQ是SybaSe公司推出的特別為數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的關(guān)系型數(shù)據(jù)庫(kù)。SYBASE IQ的架構(gòu)與大多數(shù)關(guān)系型數(shù)據(jù)庫(kù)不同,它特別的設(shè)計(jì)用以支持大量并發(fā) 用戶的即席查詢。其設(shè)計(jì)與執(zhí)行進(jìn)程優(yōu)先考慮查詢性能,其次是完成批量數(shù)據(jù)更 新的速度。而傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)引擎的設(shè)計(jì)既考慮在線的事務(wù)進(jìn)程乂考慮數(shù)據(jù)倉(cāng) 庫(kù)(而事實(shí)上,往往更多的關(guān)注事務(wù)進(jìn)程)。SybaSe
13、在2010年推出的SybaSe IQ就采用了全共享架構(gòu)的PIeXQ技術(shù), 該技術(shù)重新定義了企業(yè)范圍的業(yè)務(wù)信息,全共享架構(gòu)可輕松支持涉及海量數(shù)據(jù) 集、海量并發(fā)用戶數(shù)和獨(dú)特工作流程的多種復(fù)雜分析樣式,大大增加了其效益。 與其他MPP解決方案不同,SybaSe IQ的PIeXQ網(wǎng)格技術(shù)能夠動(dòng)態(tài)管理可輕松 擴(kuò)展并且專用于不同組和流程的一系列計(jì)算與存儲(chǔ)資源中的分析工作量,從而使 其能夠以更低的成本更輕松地支持口益增長(zhǎng)的數(shù)據(jù)量以及快速增長(zhǎng)的用戶社區(qū)。SybaSe IQ采用業(yè)內(nèi)領(lǐng)先的MPP列式數(shù)據(jù)庫(kù)和最先進(jìn)的數(shù)據(jù)庫(kù)內(nèi)分析技術(shù), 并革命性地加入MaPReeIUCe與HadOOP集成,以應(yīng)對(duì)大數(shù)據(jù)時(shí)代的分析挑戰(zhàn)
14、,開 啟洞察關(guān)鍵業(yè)務(wù)的能力。SybaSe IQ正在打破數(shù)據(jù)分析的壁壘,徹底改變“大數(shù) 據(jù)分析”領(lǐng)域?;诔墒斓腜IeXQ技術(shù)構(gòu)建的SybaSe IQ米用下圖所不的三層構(gòu)架:基本層:數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS),這是一個(gè)全共享MPP分析DBMS引擎, 是SybaSe IQ最大的獨(dú)特優(yōu)勢(shì)。第二層:分析應(yīng)用程序服務(wù)層,其提供C+和JaVa數(shù)據(jù)庫(kù)內(nèi)API,并可 實(shí)現(xiàn)與外部數(shù)據(jù)源的集成和聯(lián)邦;包括四種 與HadOOP的集成方法。頂層:SybaSe IQ生態(tài)系統(tǒng),由四個(gè)強(qiáng)大且不同的合作伙伴和認(rèn)證ISV應(yīng) 用程序組成。基于這種PIeXQ技術(shù),SybaSe IQ將大數(shù)據(jù)轉(zhuǎn)變成可指揮每個(gè)人都行動(dòng)的情報(bào) 信息,從而
15、在整個(gè)企業(yè)的用戶和業(yè)務(wù)流程范圍內(nèi)輕松具備大數(shù)據(jù)的分析能力。2. 3. 2主要特性SybaSe IQ O的關(guān)鍵特性:1. 更強(qiáng)的數(shù)據(jù)管理大量增強(qiáng)的功能改善了 SybaSe IQ的數(shù)據(jù)管理、部署和可維護(hù)性。更快速的批量加載:批量加載數(shù)據(jù)通過(guò)ODBC和JDBC接口插入到SybaSe 中,從而實(shí)現(xiàn)具有更高可擴(kuò)展性的應(yīng)用程序,同時(shí)可極大提高加載性能。更出色的文本壓縮:更出色地對(duì)VARCHAR、VARBINARW CHAR和BINARY壓 縮可實(shí)現(xiàn)以更高效率、更低成本部署高性能文本分析應(yīng)用程仔,同時(shí)極大提高壓 縮速率。2. 豐富的應(yīng)用程序SybaSe IQ增加了一系列API和工具,用于創(chuàng)建在數(shù)據(jù)庫(kù)內(nèi)運(yùn)行的
16、高級(jí)分 析算法,并且能通過(guò)PIeXQ網(wǎng)格能充分利用大規(guī)模并行處理的能力。支持自帶MaP RedUCe的表參數(shù)化用戶自定義函數(shù)(UDF)這是SybaSe IQ 的本地應(yīng)用程序編程接口,可使應(yīng)用程序編程人員在SybaSe IQ數(shù)據(jù)庫(kù)服務(wù)器 內(nèi)構(gòu)建和部署C+÷庫(kù)。使用這些API可實(shí)現(xiàn)專有算法或算法包,安全地位于 SybaSe IQ內(nèi),通過(guò)在保存于SybaSe IQ數(shù)據(jù)庫(kù)服務(wù)器中的數(shù)據(jù)附近執(zhí)行,以 快10倍的速度返回結(jié)果。此框架可實(shí)現(xiàn)在SybaSe IQ中開發(fā)和部署 MaPRedUCe程序,以分析涉及結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)格式的超大數(shù)據(jù) 集。C+、MaP和RedUCe算法通過(guò)標(biāo)準(zhǔn)SQ
17、L加以調(diào)用,并且由SybaSe IQ強(qiáng) 大的查詢引擎自動(dòng)在PIeXQ網(wǎng)格中進(jìn)行分發(fā)和并行化。HadOOP集成與聯(lián)邦將基于HadOOP的分析的結(jié)果與運(yùn)行于Sase IQ中的查詢相集成。SybaSe是唯一一家提供4種不同方法將標(biāo)準(zhǔn)SQL查詢(客戶端聯(lián) 邦、ETL處理、數(shù)據(jù)聯(lián)邦和查詢聯(lián)邦)中的HadOoP數(shù)據(jù)和分析與分析數(shù)據(jù)庫(kù)相集 成的丿商。SybaSe IQ充分利用HadOOP來(lái)識(shí)別海量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)集中 的相關(guān)數(shù)據(jù)點(diǎn),然后將HadOOP中的相關(guān)數(shù)據(jù)點(diǎn)集成到SybaSe IQ中,以便利 用傳統(tǒng)數(shù)據(jù)和來(lái)白其他數(shù)據(jù)源的結(jié)果集進(jìn)行分析。預(yù)測(cè)模型標(biāo)記語(yǔ)言(PMML)支持一一通過(guò)ZementiS提供的
18、認(rèn)證插件,自動(dòng) 執(zhí)行使用業(yè)界標(biāo)準(zhǔn)語(yǔ)言定義在SAS、SPSS、“R”等工具以及其他流行預(yù)測(cè)工作平 臺(tái)產(chǎn)品中所創(chuàng)建的分析模型。充分利用流行的分析工具構(gòu)建預(yù)測(cè)模型,自動(dòng)執(zhí)行 在SybaSe IQ中部署的預(yù)測(cè)模型,并使用業(yè)界標(biāo)準(zhǔn)語(yǔ)言,以避免形成廠商捆綁?!癛”集成:一一用戶可使用RJDBC接口,以及流行的開源統(tǒng)計(jì)工具“R” 查詢SybaSe IQ數(shù)據(jù)庫(kù)。此外,用戶還可以將來(lái)自SybaSe IQ的“R”庫(kù)作為 SQL查詢中的函數(shù)調(diào)用加以執(zhí)行,并返回結(jié)果集。3. 數(shù)據(jù)庫(kù)內(nèi)分析庫(kù)更新的數(shù)據(jù)庫(kù)內(nèi)統(tǒng)計(jì)和數(shù)據(jù)挖掘庫(kù)(來(lái) FUZZy LOgiX的DBLytiX):在SybaSe IQ內(nèi)運(yùn)行的高級(jí)分析、統(tǒng)計(jì)和數(shù)據(jù)挖掘
19、算法庫(kù)。SybaSe IQ中的更新可 使該庫(kù)充分利用一些數(shù)據(jù)挖掘算法中的MaPRedUCe APl進(jìn)行大規(guī)模并行處理,并 且包含多種新函數(shù),例如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和AdaPtiVe BOOStingO4. 擴(kuò)展的生態(tài)系統(tǒng)SybaSe IQ還非常適合面向大數(shù)據(jù)分析的端到端全面解決方案。重要的工具 和互補(bǔ)的合作伙伴產(chǎn)品可在以下方面提供幫助:SybaSe POWerDeSigner 參考架構(gòu)生成器:可通過(guò)在實(shí)施SybaSe IQ數(shù)據(jù) 倉(cāng)庫(kù)和數(shù)據(jù)集市時(shí)生成最佳硬件配置,快速實(shí)現(xiàn)價(jià)值。SybaSe COntrOI Center(SCC):改進(jìn)方面包括大量管理功能,例如過(guò)程、 函數(shù)、UDF(表、TPF和
20、JaVaEE )及文本索引。用戶能夠更輕松地管理SCC中頻 繁使用的功能,以及更輕松地部署內(nèi)置、外部和文本數(shù)據(jù)庫(kù)內(nèi)分析。此外該版本 還包含了新的SQL執(zhí)行窗口,該窗口可實(shí)現(xiàn)易于測(cè)試的特定SQL例程。已通過(guò)SAPBUSineSSObjeCtS認(rèn)證:SybaSe IQ己通過(guò)認(rèn)證,可與SAP BUSineSS ObjeCtS BUSineSS IntelIigenCe PlatfOrm 和 SAP BUSineSS ObjeCtS Data SerViCeS配合使用,以提供豐富的端到端業(yè)務(wù)分析框架。2. 3. 3主要局限SybaSe IQ MPP 是 Share-DiSk 架構(gòu)增加硬件,無(wú)法線性的提
21、升數(shù)據(jù)庫(kù)性能。列存儲(chǔ)的一些劣勢(shì),裝載速度,復(fù)雜查詢等性能不理想。插入操作上表級(jí)鎖,影響數(shù)據(jù)導(dǎo)入時(shí)影響表上的并發(fā)操作。(*)2 4 Teradata Aster DataTeradata天睿公司的ASter Data分析平臺(tái)是市場(chǎng)領(lǐng)先的大數(shù)據(jù)分析解決方案。ASter Data分析平臺(tái)嵌入了 MapReduce,對(duì)新數(shù)據(jù)源和多結(jié)構(gòu)數(shù)據(jù)類型 進(jìn)行更深入的分析處理,提供具有突破性的性能和可擴(kuò)展性的分析能力。ASter Data解決方案利用ASter Data專利SQL-MaPRedUCe來(lái)并行處理數(shù)據(jù)和應(yīng)用程 序,可在大范圍內(nèi)提供豐富的分析洞察力。2. 4.1基礎(chǔ)架構(gòu)TD ASter Data平臺(tái)架構(gòu)
22、如下:其中ASter DatabaSe架構(gòu)如下:2. 4. 2主要特性TD ASter Data有如下技術(shù)特點(diǎn):Shared-Othing 架構(gòu)海量數(shù)據(jù)庫(kù)采用最易于擴(kuò)展的Shared-nothing架構(gòu),每個(gè)節(jié)點(diǎn)都有自己的 操作系統(tǒng)、數(shù)據(jù)庫(kù)、硬件資源,節(jié)點(diǎn)之間通過(guò)網(wǎng)絡(luò)來(lái)通信。SQL- MaPRedUCeSQL-MaPRedUCe是ASter Data公司的專利,在同類技術(shù)中(GreenPIUnI)屬 于領(lǐng)先地位。SQL-MaPRedUCe框架可以使數(shù)據(jù)科學(xué)家和商業(yè)分析師對(duì)復(fù)雜的信息 進(jìn)行快速調(diào)查分析,允許一組關(guān)聯(lián)計(jì)算機(jī)(計(jì)算機(jī)群集)使用軟件語(yǔ)言(如 Java、C#、PythOn> C+和R)并行進(jìn)行程序表達(dá),然后通過(guò)標(biāo)準(zhǔn)SQL激活 (調(diào)用)使用?;贛PP的并行分析平臺(tái)第一個(gè)大規(guī)模并行分析平臺(tái),借助S Q L -MaPRedUCe支持嵌入式分析應(yīng) 用程序,使企業(yè)能顯著加快TB乃至PB級(jí)數(shù)據(jù)的處理,為提供新的交互性大數(shù) 據(jù)應(yīng)用帶來(lái)了無(wú)數(shù)機(jī)會(huì)可視化集成開發(fā)環(huán)境第一個(gè)可視化集成開發(fā)環(huán)境(ASter Da
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 金屬工具在工藝品制作的創(chuàng)新應(yīng)用考核試卷
- 輪椅設(shè)計(jì)與定制考核試卷
- 虛擬IP形象廣告考核試卷
- 理解數(shù)據(jù)一致性在數(shù)據(jù)庫(kù)中的實(shí)現(xiàn)試題及答案
- 行政組織在公共政策中的作用研究試題及答案
- 石墨在生物醫(yī)學(xué)成像材料的設(shè)計(jì)考核試卷
- 選礦設(shè)備故障診斷與維修考核試卷
- 文化用品行業(yè)科技創(chuàng)新考核試卷
- 酒吧經(jīng)營(yíng)策略與酒水銷售技巧考核試卷
- 公路工程施工質(zhì)量試題及答案要點(diǎn)
- 1旅游概述《旅游學(xué)概論》省公開課一等獎(jiǎng)全國(guó)示范課微課金獎(jiǎng)?wù)n件
- DL∕T 5390-2014 發(fā)電廠和變電站照明設(shè)計(jì)技術(shù)規(guī)定
- 2024版民政局離婚協(xié)議書格式范文
- 2024-2030年電影放映機(jī)行業(yè)市場(chǎng)現(xiàn)狀供需分析及重點(diǎn)企業(yè)投資評(píng)估規(guī)劃分析研究報(bào)告
- 安檢五步法的安檢流程
- 腫瘤學(xué)概論課件
- HJ 651-2013 礦山生態(tài)環(huán)境保護(hù)與恢復(fù)治理技術(shù)規(guī)范(試行)
- 日內(nèi)高頻交易策略研究
- 關(guān)愛生命-急救與自救技能智慧樹知到期末考試答案章節(jié)答案2024年上海交通大學(xué)醫(yī)學(xué)院
- 2024年浙江省金華市東陽(yáng)市中考二模語(yǔ)文試題(原卷版+解析版)
- 湖南省懷化市2022-2023學(xué)年五年級(jí)下學(xué)期語(yǔ)文期末試卷(含答案)
評(píng)論
0/150
提交評(píng)論