MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)

上傳人：f*** IP屬地：天津上傳時(shí)間：2022-09-20 格式：DOCX 頁(yè)數(shù)：17 大?。?2.36KB 積分：15 舉報(bào) 版權(quán)申訴

MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)_第2頁(yè)

MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)_第3頁(yè)

MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)_第4頁(yè)

MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)_第5頁(yè)

已閱讀5頁(yè)，還剩12頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、概述隨著海量數(shù)據(jù)問(wèn)題的出現(xiàn)，海量管理能力，多類型，變化快，高可用性，低成本，高端可擴(kuò)展性等需求給企業(yè)數(shù)據(jù)戰(zhàn)略帶來(lái)了巨大的挑戰(zhàn)。企業(yè)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)中心的技術(shù)選型變得尤其重要！所以在選型之前，有必要對(duì)目前市場(chǎng)上各種大數(shù)據(jù)量的解決方案進(jìn)行分析。主流分布式并行處理數(shù)據(jù)庫(kù)產(chǎn)品介紹2.1 Greenplum2.1.1 基礎(chǔ)架構(gòu)Greenplum 是基于 Hadoop 的一款分布式數(shù)據(jù)庫(kù)產(chǎn)品，在處理海量數(shù)據(jù)方面相比傳統(tǒng)數(shù) 據(jù)庫(kù)有著較大的優(yōu)勢(shì)。Greenplum 整體架構(gòu)如下圖：MasterSeversNetworkSegmentSevers數(shù)據(jù)存儲(chǔ)MasterSeversNetworkSegmentS

2、evers數(shù)據(jù)存儲(chǔ)數(shù)據(jù)加載數(shù)據(jù)庫(kù)由 Mas ter Severs 和 Segmen t Severs 通過(guò) Int erconnect 互聯(lián)組成。Mas ter主機(jī)負(fù)責(zé)：建立與客戶端的連接和管理；SQL的解析并形成執(zhí)行計(jì)劃；執(zhí)行計(jì) 劃向Segme nt的分發(fā)收集Segment的執(zhí)行結(jié)果；Mas ter不存儲(chǔ)業(yè)務(wù)數(shù)據(jù)，只存儲(chǔ)數(shù)據(jù)字典。Segment主機(jī)負(fù)責(zé)：業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)和存??；用戶查詢SQL的執(zhí)行。2.1.2主要特性Greenplum整體有如下技術(shù)特點(diǎn)：Shared-nothing 架構(gòu)數(shù)據(jù)庫(kù)、硬件資源，節(jié)點(diǎn)之間通過(guò)網(wǎng)絡(luò)來(lái)通信?；?gNe t Soft ware Int erconnec t

3、數(shù)據(jù)庫(kù)的內(nèi)部通信通過(guò)基于超級(jí)計(jì)算的“軟件Switch內(nèi)部連接層，基于通用的gNet （GigE, lOGigE） NICs/switches在節(jié)點(diǎn)間傳遞消息和數(shù)據(jù)，采用高擴(kuò)展協(xié)議，支持?jǐn)U展到1000個(gè)以上節(jié)點(diǎn)。并行加載技術(shù)利用并行數(shù)據(jù)流引擎，數(shù)據(jù)加載完全并行，加載數(shù)據(jù)可達(dá)到4。5T/小時(shí)（理想配置）。并且可以直接通過(guò)SQL語(yǔ)句對(duì)外部表進(jìn)行操作支持行、列壓縮存儲(chǔ)技術(shù)海量數(shù)據(jù)庫(kù)支持ZLIB和QUICKLZ方式的壓縮，壓縮比可到10：1。壓縮數(shù)據(jù)不一定會(huì) 帶來(lái)性能的下降，壓縮表通過(guò)利用空閑的CPU資源，而減少I/O資源占用。海量數(shù)據(jù)庫(kù)除支持主流的行存儲(chǔ)模式外，還支持列存儲(chǔ)模式。如果常用的查詢只取

4、表中少量字段，則列模式效率更高，如查詢需要取表中的大量字段，行模式效率更高。海量數(shù)據(jù)庫(kù)的多種壓縮存儲(chǔ)技術(shù)在提高數(shù)據(jù)存儲(chǔ)能力的同時(shí)，也可根據(jù)不同應(yīng)用需求提高查詢的效率2.1.3主要局限列存儲(chǔ)模式的使用有限制，不支持delete/update操作。用戶不可靈活控制事務(wù)的提交，用戶提交的處理將被自動(dòng)視作整體事務(wù)，整體提交, 整體回滾。數(shù)據(jù)庫(kù)需要額外的空間清理維護(hù)（vacuum），給數(shù)據(jù)庫(kù)維護(hù)帶來(lái)額外的工作量。用戶不能靈活分配或控制服務(wù)器資源。對(duì)磁盤(pán)IO有比較高的要求。備份機(jī)制還不完善，沒(méi)有增量備份。2.2 Vertica2.2.1基礎(chǔ)架構(gòu)與以往常見(jiàn)的行式關(guān)系型數(shù)據(jù)庫(kù)不同，Vertica是一種基于

5、列存儲(chǔ)(Column-Oriented) 的數(shù)據(jù)庫(kù)體系結(jié)構(gòu)，這種存儲(chǔ)機(jī)構(gòu)更適合在數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)和商業(yè)智能方面發(fā)揮特長(zhǎng)。常見(jiàn)的RDBMS都是面向行(Row-Oriented Database)存儲(chǔ)的，在對(duì)某一列匯總計(jì)算的時(shí)候幾乎不可避免的要進(jìn)行額外的I/O尋址掃描，而面向列存儲(chǔ)的數(shù)據(jù)庫(kù)能夠連續(xù)進(jìn)行 I/O操作，減少了 I/O開(kāi)銷，從而達(dá)到數(shù)量級(jí)上的性能提升。同時(shí)，Vertica支持海量并行存儲(chǔ)(MPP)架構(gòu)，實(shí)現(xiàn)了完全無(wú)共享，因此擴(kuò)展容易，可以利用廉價(jià)的硬件來(lái)獲取高的性能，具有很高的性價(jià)比。如下圖，展示的是單節(jié)點(diǎn)上的Vertica的基本體系結(jié)構(gòu)。Vertica體系結(jié)構(gòu)作為關(guān)系型數(shù)據(jù)庫(kù)，Vert

6、ica的查詢SQL也是在前端被解析和優(yōu)化的。但與傳統(tǒng)的關(guān) 系型數(shù)據(jù)庫(kù)有所不同，Vertica內(nèi)部是混合存儲(chǔ)的，包括兩種不同的存儲(chǔ)結(jié)構(gòu)：寫(xiě)優(yōu)化器 (WOS)和讀優(yōu)化器(ROS)。寫(xiě)優(yōu)化器 WOS (Wri te-Op ti mized St ore)是位于主存儲(chǔ)器上的一個(gè)數(shù)據(jù)結(jié)構(gòu)，用于有效的支持?jǐn)?shù)據(jù)插入和更新操作；數(shù)據(jù)的存放是無(wú)序的，非壓縮的。讀優(yōu)化器 ROS (Read-Op timized St ore)是磁盤(pán)物理存儲(chǔ)，存放的是排序和壓縮后的數(shù)據(jù)庫(kù)大塊數(shù)據(jù)，因此這里的查詢相比于 WOS 性能更好。Tuple Mover 進(jìn)程是Vertica內(nèi)部的一個(gè)進(jìn)程，定期的以大數(shù)據(jù)塊的形式把數(shù)據(jù)從WO

7、S移到ROS，由于是對(duì)整個(gè)WOS操作，TupleMover 一次能非常有效的排序很多記錄，最后批量把它們寫(xiě)入磁盤(pán)。在Vertica內(nèi)部，不論是WOS還是ROS都是按列存儲(chǔ)的。2.2.2主要特性Vertica 的關(guān)鍵特性：列存儲(chǔ)(Column-orien tation)由于大多數(shù)的查詢都是要從磁盤(pán)讀取數(shù)據(jù)，因此可以說(shuō) disk I/O 在很大程度上決定了一個(gè)查詢的最終響應(yīng)時(shí)間。壓縮機(jī)制(Aggressive Compression)在數(shù)據(jù)存儲(chǔ)方面， Vertica 利用內(nèi)部的特定算法對(duì)數(shù)據(jù)進(jìn)行壓縮處理。這樣的機(jī)制會(huì) 大大減少disk I/O的時(shí)間(D)，同時(shí)由于Vertica對(duì)掃描和聚合等

8、操作也在內(nèi)部進(jìn)行了優(yōu)化，可以直接處理壓縮后的數(shù)據(jù)，這樣CPU的工作負(fù)載(C)也減少了。如上例中的AVG 聚合函數(shù)，Vertica是不需要將壓縮數(shù)據(jù)先做類似解壓這種處理的，因此查詢性能得到優(yōu) 化。讀優(yōu)化存儲(chǔ)(Read-Optimized Storage)Vertica的數(shù)據(jù)庫(kù)存儲(chǔ)容器ROS Container專門(mén)為讀操作進(jìn)行了優(yōu)化設(shè)計(jì)，且其中的數(shù)據(jù)是經(jīng)過(guò)了排序和壓縮處理的，即每個(gè)磁盤(pán)頁(yè)上不會(huì)有空白空間，而傳統(tǒng)的數(shù)據(jù)庫(kù)一般會(huì)在每頁(yè)上預(yù)留空間以便日后的insert操作來(lái)使用。4多種排序方式的冗余存儲(chǔ)為了高可用性和備份恢復(fù)的需要，Vertica會(huì)按照不同的排序方式對(duì)數(shù)據(jù)做冗余存儲(chǔ), 這不但避免了

9、大量的日志操作，也為查詢帶來(lái)了便利。Vertica的查詢優(yōu)化器會(huì)自動(dòng)選擇最優(yōu)的排序方式來(lái)完成特定的查詢。5并行無(wú)共享設(shè)計(jì)Vertica支持完全無(wú)共享海量并行存儲(chǔ)(MPP)架構(gòu)，隨著硬件Server的增加，多個(gè) CPU 并行處理，性能也可以得到線性的擴(kuò)展，這樣用戶使用廉價(jià)的硬件就可以獲得較高的性能改善。6其他管理特征除了有優(yōu)越的性能以外，Vertica在數(shù)據(jù)庫(kù)管理方面也進(jìn)行了非常人性化的設(shè)計(jì)。Vertica Database Designer 是一個(gè)界面化的日常管理工具，并且能為用戶作出詳盡的DB層物理設(shè)計(jì)方案，大大減少了日后的性能調(diào)優(yōu)方面的開(kāi)銷。Vertica 通過(guò) K-Safety 值

10、的設(shè)置，完成了數(shù)據(jù)庫(kù)的備份恢復(fù)機(jī)制，并保證了高可用性。對(duì)于數(shù)據(jù)庫(kù)中的每個(gè)表每個(gè)列，Vertica都會(huì)在至少K+1個(gè)節(jié)點(diǎn)上存儲(chǔ)，如果有K個(gè) 節(jié)點(diǎn)宕機(jī)，依然能夠保證Vertica DB是完整可用的；當(dāng)損壞的節(jié)點(diǎn)恢復(fù)時(shí)，Vertica自動(dòng)完成節(jié)點(diǎn)間的熱交換，把其他節(jié)點(diǎn)上的正確數(shù)據(jù)恢復(fù)過(guò)來(lái)。通過(guò)這種機(jī)制也保證了 Vertcia庫(kù)的節(jié)點(diǎn)數(shù)目可以自由伸縮而不會(huì)影響到數(shù)據(jù)庫(kù)的操作。Vertica通過(guò)兩種技術(shù)來(lái)實(shí)現(xiàn)在線的持續(xù)數(shù)據(jù)裝載而不會(huì)影響到數(shù)據(jù)庫(kù)的訪問(wèn)。Vertica通常運(yùn)行在快照隔離(Snapshot Isolation)模式下，該模式下查詢讀取的是最近的一致的數(shù)據(jù)庫(kù)快照，這個(gè)快照是不能被并發(fā)的up

11、date或delete操作更改的，因此查詢操作也不需要占用鎖，這種方式保證了數(shù)據(jù)裝載(inser t)和其他查詢能互不干擾。另外，Vertica可以把數(shù)據(jù)直接裝載到W0S結(jié)構(gòu)中，W0S中的數(shù)據(jù)是不排序或索引的，所以裝載速度會(huì)很快，然后再由Tuple Mover進(jìn)程在后臺(tái)把數(shù)據(jù)移入ROS中，由于TupleMover 的操作是大塊讀取(bulk-load)的，所以性能也很好。2.2.3主要局限不支持SQL存儲(chǔ)過(guò)程及函數(shù)，用戶需通過(guò)UDFs (User Defined Function,基于C+) 來(lái)自定義函數(shù)或過(guò)程。軟件授權(quán)按原始未經(jīng)壓縮的裸數(shù)據(jù)量計(jì)算。列存儲(chǔ)的一些劣勢(shì)，復(fù)雜查詢等性能不理想

12、。對(duì)內(nèi)存有比較高的要求。在國(guó)內(nèi)還沒(méi)有成功案例。2.3.1基礎(chǔ)架構(gòu)SYBASE IQ是Sybase公司推出的特別為數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的關(guān)系型數(shù)據(jù)庫(kù)。SYBASE IQ的架構(gòu)與大多數(shù)關(guān)系型數(shù)據(jù)庫(kù)不同，它特別的設(shè)計(jì)用以支持大量并發(fā)用戶的即席查詢。其設(shè) 計(jì)與執(zhí)行進(jìn)程優(yōu)先考慮查詢性能，其次是完成批量數(shù)據(jù)更新的速度。而傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù) 引擎的設(shè)計(jì)既考慮在線的事務(wù)進(jìn)程又考慮數(shù)據(jù)倉(cāng)庫(kù)(而事實(shí)上，往往更多的關(guān)注事務(wù)進(jìn)程)。Sybase在2010年推出的Sybase IQ 15.3就采用了全共享架構(gòu)的PlexQ技術(shù)，該技術(shù)重新定義了企業(yè)范圍的業(yè)務(wù)信息，全共享架構(gòu)可輕松支持涉及海量數(shù)據(jù)集、海量并發(fā)用戶數(shù)和獨(dú)特工作流

13、程的多種復(fù)雜分析樣式，大大增加了其效益。與其他 MPP 解決方案不同， Sybase IQ 的 PlexQ 網(wǎng)格技術(shù)能夠動(dòng)態(tài)管理可輕松擴(kuò)展并且專用于不同組和流程的一系列計(jì)算與存儲(chǔ)資源中的分析工作量，從而使其能夠以更低的成本更輕松地支持日益增長(zhǎng)的數(shù)據(jù)量以及快速增長(zhǎng)的用戶社區(qū)。Sybase IQ 15.4采用業(yè)內(nèi)領(lǐng)先的MPP列式數(shù)據(jù)庫(kù)和最先進(jìn)的數(shù)據(jù)庫(kù)內(nèi)分析技術(shù)，并革命性地加入MapReduce與Hadoop集成，以應(yīng)對(duì)大數(shù)據(jù)時(shí)代的分析挑戰(zhàn)，開(kāi)啟洞察關(guān)鍵業(yè)務(wù) 的能力。Sybase IQ 15.4正在打破數(shù)據(jù)分析的壁壘，徹底改變“大數(shù)據(jù)分析”領(lǐng)域?；诔墒斓腜lexQ技術(shù)構(gòu)建的Sybase IQ

14、采用下圖所示的三層構(gòu)架：基本層：數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)，這是一個(gè)全共享MPP分析DBMS引擎，是Sybase IQ 最大的獨(dú)特優(yōu)勢(shì)。第二層：分析應(yīng)用程序服務(wù)層，其提供C+和Java數(shù)據(jù)庫(kù)內(nèi)API,并可實(shí)現(xiàn)與外部數(shù)據(jù)源的集成和聯(lián)邦；包括四種與Hadoop的集成方法?；谶@種PlexQ技術(shù)，Sybase IQ 15.4將大數(shù)據(jù)轉(zhuǎn)變成可指揮每個(gè)人都行動(dòng)的情報(bào)信息, 從而在整個(gè)企業(yè)的用戶和業(yè)務(wù)流程范圍內(nèi)輕松具備大數(shù)據(jù)的分析能力。2.3.2主要特性Sybase IQ(154)的關(guān)鍵特性：?更強(qiáng)的數(shù)據(jù)管理大量增強(qiáng)的功能改善了 Sybase IQ的數(shù)據(jù)管理、部署和可維護(hù)性。更快速的批量加載：批量加載數(shù)

15、據(jù)通過(guò)ODBC和JDBC接口插入到Sybase中，從而實(shí) 現(xiàn)具有更高可擴(kuò)展性的應(yīng)用程序,同時(shí)可極大提高加載性能。更出色的文本壓縮：更出色地對(duì) VARCHAR、VARBINARY、CHAR 和 BINARY 壓縮可實(shí)現(xiàn) 以更高效率、更低成本部署高性能文本分析應(yīng)用程序，同時(shí)極大提高壓縮速率。?豐富的應(yīng)用程序Sybase IQ 15.4 增加了一系列 API 和工具，用于創(chuàng)建在數(shù)據(jù)庫(kù)內(nèi)運(yùn)行的高級(jí)分析算法，并且能通過(guò) PlexQ 網(wǎng)格能充分利用大規(guī)模并行處理的能力。支持自帶Map Reduce的表參數(shù)化用戶自定義函數(shù)(UDF)這是Sybase IQ的本地應(yīng) 用程序編程接口，可使應(yīng)用程序編程人員在

16、Sybase IQ 數(shù)據(jù)庫(kù)服務(wù)器內(nèi)構(gòu)建和部署 C+ 庫(kù)。使用這些 API 可實(shí)現(xiàn)專有算法或算法包，安全地位于 Sybase IQ 內(nèi)，通過(guò)在保存于 Sybase IQ 數(shù)據(jù)庫(kù)服務(wù)器中的數(shù)據(jù)附近執(zhí)行，以快 10 倍的速度返回結(jié)果。此框架可實(shí)現(xiàn) 在 Sybase IQ 中開(kāi)發(fā)和部署 MapReduce 程序，以分析涉及結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)格式的超大數(shù)據(jù)集C+、Map和Reduce算法通過(guò)標(biāo)準(zhǔn)SQL加以調(diào)用，并且由SybaseIQ強(qiáng)大的查詢引擎自動(dòng)在PlexQ網(wǎng)格中進(jìn)行分發(fā)和并行化。Hadoop集成與聯(lián)邦將基于Hadoop的分析的結(jié)果與運(yùn)行于Sybase IQ中的查詢相集成。Syba

17、se是唯一一家提供4種不同方法將標(biāo)準(zhǔn)SQL查詢（客戶端聯(lián)邦、ETL處理、數(shù) 據(jù)聯(lián)邦和查詢聯(lián)邦）中的Hadoop數(shù)據(jù)和分析與分析數(shù)據(jù)庫(kù)相集成的廠商。Sybase IQ 15.4 充分利用Hadoop來(lái)識(shí)別海量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)集中的相關(guān)數(shù)據(jù)點(diǎn)，然后將Hadoop中的相關(guān)數(shù)據(jù)點(diǎn)集成到 SybaseIQ 中，以便利用傳統(tǒng)數(shù)據(jù)和來(lái)自其他數(shù)據(jù)源的結(jié)果集進(jìn)行分析。預(yù)測(cè)模型標(biāo)記語(yǔ)言（PMML）支持通過(guò) Zementis 提供的認(rèn)證插件，自動(dòng)執(zhí)行使用業(yè)界標(biāo)準(zhǔn)語(yǔ)言定義在SAS、SPSS、“R”等工具以及其他流行預(yù)測(cè)工作平臺(tái)產(chǎn)品中所創(chuàng)建的分析模型。充分利用流行的分析工具構(gòu)建預(yù)測(cè)模型，自動(dòng)執(zhí)行在Syb

18、ase IQ中部署的預(yù)測(cè) 模型，并使用業(yè)界標(biāo)準(zhǔn)語(yǔ)言，以避免形成廠商捆綁?！癛”集成：用戶可使用RJDBC接口，以及流行的開(kāi)源統(tǒng)計(jì)工具“R”查詢Sybase IQ數(shù)據(jù)庫(kù)。此外，用戶還可以將來(lái)自Sybase IQ的“R”庫(kù)作為SQL查詢中的函數(shù)調(diào)用加以執(zhí)行，并返回結(jié)果集。? 數(shù)據(jù)庫(kù)內(nèi)分析庫(kù)更新的數(shù)據(jù)庫(kù)內(nèi)統(tǒng)計(jì)和數(shù)據(jù)挖掘庫(kù)（來(lái)自Fuzzy ? Logix的DBLytix）:在Sybase IQ 內(nèi)運(yùn)行的高級(jí)分析、統(tǒng)計(jì)和數(shù)據(jù)挖掘算法庫(kù)。Sybase IQ 15.4中的更新可使該庫(kù)充分利用一些數(shù)據(jù)挖掘算法中的MapReduce API進(jìn)行大規(guī)模并行處理，并且包含多種新函數(shù)，例如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和

19、Adap tive Boos ting。? 擴(kuò)展的生態(tài)系統(tǒng)合作伙伴產(chǎn)品可在以下方面提供幫助:Sybase PowerDesigner? 16.1參考架構(gòu)生成器：可通過(guò)在實(shí)施Sybase IQ數(shù)據(jù)倉(cāng)庫(kù) 和數(shù)據(jù)集市時(shí)生成最佳硬件配置，快速實(shí)現(xiàn)價(jià)值。Sybase Control Center（SCC）:改進(jìn)方面包括大量管理功能，例如過(guò)程、函數(shù)、UDF（表、 TPF和JavaEE ）及文本索引。用戶能夠更輕松地管理SCC中頻繁使用的功能，以及更輕松地部署內(nèi)置、外部和文本數(shù)據(jù)庫(kù)內(nèi)分析。此外該版本還包含了新的SQL執(zhí)行窗口，該窗口可實(shí)現(xiàn)易于測(cè)試的特定SQL例程。已通過(guò) SAP?BusinessObje

20、cts?認(rèn)證：Sybase IQ 15.4 已通過(guò)認(rèn)證，可與 SAP Business Objects Business Intelligence Platform 4.0 和 SAP Business Objects? Data Services 4.0配合使用，以提供豐富的端到端業(yè)務(wù)分析框架。2.3.3主要局限Sybase IQ MPP 是 Share-Disk 架構(gòu)增加硬件，無(wú)法線性的提升數(shù)據(jù)庫(kù)性能。列存儲(chǔ)的一些劣勢(shì)，裝載速度，復(fù)雜查詢等性能不理想。插入操作上表級(jí)鎖，影響數(shù)據(jù)導(dǎo)入時(shí)影響表上的并發(fā)操作。（*）2.4 Teradata Aster DataTeradata天睿公司的Aster

21、 Data分析平臺(tái)是市場(chǎng)領(lǐng)先的大數(shù)據(jù)分析解決方案。Ast er Da ta分析平臺(tái)嵌入了 MapReduce，對(duì)新數(shù)據(jù)源和多結(jié)構(gòu)數(shù)據(jù)類型進(jìn)行更深入的分析處理，提供具有突破性的性能和可擴(kuò)展性的分析能力。As ter Da ta解決方案利用Aster Data專利SQL-MapReduce來(lái)并行處理數(shù)據(jù)和應(yīng)用程序，可在大范圍內(nèi)提供豐富的分析洞察力。2.4.1基礎(chǔ)架構(gòu)TD As ter Data平臺(tái)架構(gòu)如下：其中Ast er Dat abase架構(gòu)如下：242主要特性TD Aster Data有如下技術(shù)特點(diǎn)：Shared-nothing 架構(gòu)海量數(shù)據(jù)庫(kù)采用最易于擴(kuò)展的Shared-no thin

22、g架構(gòu)，每個(gè)節(jié)點(diǎn)都有自己的操作系統(tǒng)、數(shù)據(jù)庫(kù)、硬件資源，節(jié)點(diǎn)之間通過(guò)網(wǎng)絡(luò)來(lái)通信。S Q L - MapReduceSQL-MapReduce是Aster Data公司的專利，在同類技術(shù)中（Greenplum）屬于領(lǐng)先地位。SQL-MapReduce框架可以使數(shù)據(jù)科學(xué)家和商業(yè)分析師對(duì)復(fù)雜的信息進(jìn)行快速調(diào)查分析, 允許一組關(guān)聯(lián)計(jì)算機(jī)（計(jì)算機(jī)群集）使用軟件語(yǔ)言（如Java、C#、Python、C+和R）并行進(jìn)行程序表達(dá)，然后通過(guò)標(biāo)準(zhǔn)SQL激活（調(diào)用）使用?；贛PP的并行分析平臺(tái)第一個(gè)大規(guī)模并行分析平臺(tái)，借助S Q L -MapReduce支持嵌入式分析應(yīng)用程序，使企業(yè)能顯著加快TB乃至PB級(jí)數(shù)據(jù)的處理，為提供新的交互性大數(shù)據(jù)應(yīng)用帶來(lái)了無(wú)數(shù)機(jī)可視化集成開(kāi)發(fā)環(huán)境第一個(gè)可視化集成開(kāi)發(fā)環(huán)境

人人文庫(kù)> 全部分類> 行業(yè)資料 > 機(jī)電工程

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

MPP數(shù)據(jù)庫(kù)對(duì)比總結(jié)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔