




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、概述隨著海量數(shù)據(jù)問(wèn)題的出現(xiàn),海量管理能力,多類型,變化快,高可用性,低成本,高 端可擴(kuò)展性等需求給企業(yè)數(shù)據(jù)戰(zhàn)略帶來(lái)了巨大的挑戰(zhàn)。企業(yè)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)中心的技術(shù)選 型變得尤其重要!所以在選型之前,有必要對(duì)目前市場(chǎng)上各種大數(shù)據(jù)量的解決方案進(jìn)行分 析。主流分布式并行處理數(shù)據(jù)庫(kù)產(chǎn)品介紹2.1 Greenplum2.1.1 基礎(chǔ)架構(gòu)Greenplum 是基于 Hadoop 的一款分布式數(shù)據(jù)庫(kù)產(chǎn)品,在處理海量數(shù)據(jù)方面相比傳統(tǒng)數(shù) 據(jù)庫(kù)有著較大的優(yōu)勢(shì)。Greenplum 整體架構(gòu)如下圖:MasterSeversNetworkSegmentSevers數(shù)據(jù)存儲(chǔ)MasterSeversNetworkSegmentS
2、evers數(shù)據(jù)存儲(chǔ)數(shù)據(jù)加載數(shù)據(jù)庫(kù)由 Mas ter Severs 和 Segmen t Severs 通過(guò) Int erconnect 互聯(lián)組成。Mas ter主機(jī)負(fù)責(zé):建立與客戶端的連接和管理;SQL的解析并形成執(zhí)行計(jì)劃;執(zhí)行計(jì) 劃向Segme nt的分發(fā)收集Segment的執(zhí)行結(jié)果;Mas ter不存儲(chǔ)業(yè)務(wù)數(shù)據(jù),只存儲(chǔ)數(shù)據(jù)字典。Segment主機(jī)負(fù)責(zé):業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)和存??;用戶查詢SQL的執(zhí)行。2.1.2主要特性Greenplum整體有如下技術(shù)特點(diǎn):Shared-nothing 架構(gòu)數(shù)據(jù)庫(kù)、硬件資源,節(jié)點(diǎn)之間通過(guò)網(wǎng)絡(luò)來(lái)通信?;?gNe t Soft ware Int erconnec t
3、數(shù)據(jù)庫(kù)的內(nèi)部通信通過(guò)基于超級(jí)計(jì)算的“軟件Switch內(nèi)部連接層,基于通用的gNet (GigE, lOGigE) NICs/switches在節(jié)點(diǎn)間傳遞消息和數(shù)據(jù),采用高擴(kuò)展協(xié)議,支持?jǐn)U展 到1000個(gè)以上節(jié)點(diǎn)。并行加載技術(shù)利用并行數(shù)據(jù)流引擎,數(shù)據(jù)加載完全并行,加載數(shù)據(jù)可達(dá)到4。5T/小時(shí)(理想配置)。 并且可以直接通過(guò)SQL語(yǔ)句對(duì)外部表進(jìn)行操作支持行、列壓縮存儲(chǔ)技術(shù)海量數(shù)據(jù)庫(kù)支持ZLIB和QUICKLZ方式的壓縮,壓縮比可到10:1。壓縮數(shù)據(jù)不一定會(huì) 帶來(lái)性能的下降,壓縮表通過(guò)利用空閑的CPU資源,而減少I/O資源占用。海量數(shù)據(jù)庫(kù)除支持主流的行存儲(chǔ)模式外,還支持列存儲(chǔ)模式。如果常用的查詢只取
4、表 中少量字段,則列模式效率更高,如查詢需要取表中的大量字段,行模式效率更高。海量數(shù)據(jù)庫(kù)的多種壓縮存儲(chǔ)技術(shù)在提高數(shù)據(jù)存儲(chǔ)能力的同時(shí),也可根據(jù)不同應(yīng)用需求 提高查詢的效率2.1.3主要局限列存儲(chǔ)模式的使用有限制,不支持delete/update操作。用戶不可靈活控制事務(wù)的提交,用戶提交的處理將被自動(dòng)視作整體事務(wù),整體提交, 整體回滾。數(shù)據(jù)庫(kù)需要額外的空間清理維護(hù)(vacuum),給數(shù)據(jù)庫(kù)維護(hù)帶來(lái)額外的工作量。用戶不能靈活分配或控制服務(wù)器資源。對(duì)磁盤(pán)IO有比較高的要求。備份機(jī)制還不完善,沒(méi)有增量備份。2.2 Vertica2.2.1基礎(chǔ)架構(gòu)與以往常見(jiàn)的行式關(guān)系型數(shù)據(jù)庫(kù)不同,Vertica是一種基于
5、列存儲(chǔ)(Column-Oriented) 的數(shù)據(jù)庫(kù)體系結(jié)構(gòu),這種存儲(chǔ)機(jī)構(gòu)更適合在數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)和商業(yè)智能方面發(fā)揮特長(zhǎng)。常見(jiàn)的RDBMS都是面向行(Row-Oriented Database)存儲(chǔ)的,在對(duì)某一列匯總計(jì)算 的時(shí)候幾乎不可避免的要進(jìn)行額外的I/O尋址掃描,而面向列存儲(chǔ)的數(shù)據(jù)庫(kù)能夠連續(xù)進(jìn)行 I/O操作,減少了 I/O開(kāi)銷,從而達(dá)到數(shù)量級(jí)上的性能提升。同時(shí),Vertica支持海量并行存儲(chǔ)(MPP)架構(gòu),實(shí)現(xiàn)了完全無(wú)共享,因此擴(kuò)展容易, 可以利用廉價(jià)的硬件來(lái)獲取高的性能,具有很高的性價(jià)比。如下圖,展示的是單節(jié)點(diǎn)上的Vertica的基本體系結(jié)構(gòu)。Vertica體系結(jié)構(gòu)作為關(guān)系型數(shù)據(jù)庫(kù),Vert
6、ica的查詢SQL也是在前端被解析和優(yōu)化的。但與傳統(tǒng)的關(guān) 系型數(shù)據(jù)庫(kù)有所不同,Vertica內(nèi)部是混合存儲(chǔ)的,包括兩種不同的存儲(chǔ)結(jié)構(gòu):寫(xiě)優(yōu)化器 (WOS)和讀優(yōu)化器(ROS)。寫(xiě)優(yōu)化器 WOS (Wri te-Op ti mized St ore)是位于主存儲(chǔ)器上的一個(gè)數(shù)據(jù)結(jié)構(gòu),用于有效的支持?jǐn)?shù)據(jù)插入和更新操作;數(shù)據(jù)的存 放是無(wú)序的,非壓縮的。讀優(yōu)化器 ROS (Read-Op timized St ore)是磁盤(pán)物理存儲(chǔ),存放的是排序和壓縮后的數(shù)據(jù)庫(kù)大塊數(shù)據(jù),因此這里的查詢相比于 WOS 性能更好。Tuple Mover 進(jìn)程是Vertica內(nèi)部的一個(gè)進(jìn)程,定期的以大數(shù)據(jù)塊的形式把數(shù)據(jù)從WO
7、S移到ROS,由于 是對(duì)整個(gè)WOS操作,TupleMover 一次能非常有效的排序很多記錄,最后批量把它們寫(xiě)入 磁盤(pán)。在Vertica內(nèi)部,不論是WOS還是ROS都是按列存儲(chǔ)的。2.2.2主要特性Vertica 的關(guān)鍵特性:列存儲(chǔ)(Column-orien tation)由于大多數(shù)的查詢都是要從磁盤(pán)讀取數(shù)據(jù),因此可以說(shuō) disk I/O 在很大程度上決定 了一個(gè)查詢的最終響應(yīng)時(shí)間。壓縮機(jī)制(Aggressive Compression)在數(shù)據(jù)存儲(chǔ)方面, Vertica 利用內(nèi)部的特定算法對(duì)數(shù)據(jù)進(jìn)行壓縮處理。這樣的機(jī)制會(huì) 大大減少disk I/O的時(shí)間(D),同時(shí)由于Vertica對(duì)掃描和聚合等
8、操作也在內(nèi)部進(jìn)行了 優(yōu)化,可以直接處理壓縮后的數(shù)據(jù),這樣CPU的工作負(fù)載(C)也減少了。如上例中的AVG 聚合函數(shù),Vertica是不需要將壓縮數(shù)據(jù)先做類似解壓這種處理的,因此查詢性能得到優(yōu) 化。讀優(yōu)化存儲(chǔ)(Read-Optimized Storage)Vertica的數(shù)據(jù)庫(kù)存儲(chǔ)容器ROS Container專門(mén)為讀操作進(jìn)行了優(yōu)化設(shè)計(jì),且其中的 數(shù)據(jù)是經(jīng)過(guò)了排序和壓縮處理的,即每個(gè)磁盤(pán)頁(yè)上不會(huì)有空白空間,而傳統(tǒng)的數(shù)據(jù)庫(kù)一般 會(huì)在每頁(yè)上預(yù)留空間以便日后的insert操作來(lái)使用。4多種排序方式的冗余存儲(chǔ)為了高可用性和備份恢復(fù)的需要,Vertica會(huì)按照不同的排序方式對(duì)數(shù)據(jù)做冗余存儲(chǔ), 這不但避免了
9、大量的日志操作,也為查詢帶來(lái)了便利。Vertica的查詢優(yōu)化器會(huì)自動(dòng)選擇 最優(yōu)的排序方式來(lái)完成特定的查詢。5并行無(wú)共享設(shè)計(jì)Vertica支持完全無(wú)共享海量并行存儲(chǔ)(MPP)架構(gòu),隨著硬件Server的增加,多個(gè) CPU 并行處理,性能也可以得到線性的擴(kuò)展,這樣用戶使用廉價(jià)的硬件就可以獲得較高的 性能改善。6其他管理特征除了有優(yōu)越的性能以外,Vertica在數(shù)據(jù)庫(kù)管理方面也進(jìn)行了非常人性化的設(shè)計(jì)。Vertica Database Designer 是一個(gè)界面化的日常管理工具,并且能為用戶作出詳盡 的DB層物理設(shè)計(jì)方案,大大減少了日后的性能調(diào)優(yōu)方面的開(kāi)銷。Vertica 通過(guò) K-Safety 值
10、的設(shè)置,完成了數(shù)據(jù)庫(kù)的備份恢復(fù)機(jī)制,并保證了高可用性。對(duì)于數(shù)據(jù)庫(kù)中的每個(gè)表每個(gè)列,Vertica都會(huì)在至少K+1個(gè)節(jié)點(diǎn)上存儲(chǔ),如果有K個(gè) 節(jié)點(diǎn)宕機(jī),依然能夠保證Vertica DB是完整可用的;當(dāng)損壞的節(jié)點(diǎn)恢復(fù)時(shí),Vertica自 動(dòng)完成節(jié)點(diǎn)間的熱交換,把其他節(jié)點(diǎn)上的正確數(shù)據(jù)恢復(fù)過(guò)來(lái)。通過(guò)這種機(jī)制也保證了 Vertcia庫(kù)的節(jié)點(diǎn)數(shù)目可以自由伸縮而不會(huì)影響到數(shù)據(jù)庫(kù)的操作。Vertica通過(guò)兩種技術(shù)來(lái)實(shí)現(xiàn)在線的持續(xù)數(shù)據(jù)裝載而不會(huì)影響到數(shù)據(jù)庫(kù)的訪問(wèn)。Vertica通常運(yùn)行在快照隔離(Snapshot Isolation)模式下,該模式下查詢讀取的 是最近的一致的數(shù)據(jù)庫(kù)快照,這個(gè)快照是不能被并發(fā)的up
11、date或delete操作更改的,因 此查詢操作也不需要占用鎖,這種方式保證了數(shù)據(jù)裝載(inser t)和其他查詢能互不干擾。 另外,Vertica可以把數(shù)據(jù)直接裝載到W0S結(jié)構(gòu)中,W0S中的數(shù)據(jù)是不排序或索引的,所 以裝載速度會(huì)很快,然后再由Tuple Mover進(jìn)程在后臺(tái)把數(shù)據(jù)移入ROS中,由于TupleMover 的操作是大塊讀取(bulk-load)的,所以性能也很好。2.2.3主要局限不支持SQL存儲(chǔ)過(guò)程及函數(shù),用戶需通過(guò)UDFs (User Defined Function,基于C+) 來(lái)自定義函數(shù)或過(guò)程。軟件授權(quán)按原始未經(jīng)壓縮的裸數(shù)據(jù)量計(jì)算。列存儲(chǔ)的一些劣勢(shì),復(fù)雜查詢等性能不理想
12、。對(duì)內(nèi)存有比較高的要求。在國(guó)內(nèi)還沒(méi)有成功案例。2.3.1基礎(chǔ)架構(gòu)SYBASE IQ是Sybase公司推出的特別為數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的關(guān)系型數(shù)據(jù)庫(kù)。SYBASE IQ的 架構(gòu)與大多數(shù)關(guān)系型數(shù)據(jù)庫(kù)不同,它特別的設(shè)計(jì)用以支持大量并發(fā)用戶的即席查詢。其設(shè) 計(jì)與執(zhí)行進(jìn)程優(yōu)先考慮查詢性能,其次是完成批量數(shù)據(jù)更新的速度。而傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù) 引擎的設(shè)計(jì)既考慮在線的事務(wù)進(jìn)程又考慮數(shù)據(jù)倉(cāng)庫(kù)(而事實(shí)上,往往更多的關(guān)注事務(wù)進(jìn)程)。Sybase在2010年推出的Sybase IQ 15.3就采用了全共享架構(gòu)的PlexQ技術(shù),該技 術(shù)重新定義了企業(yè)范圍的業(yè)務(wù)信息,全共享架構(gòu)可輕松支持涉及海量數(shù)據(jù)集、海量并發(fā)用 戶數(shù)和獨(dú)特工作流
13、程的多種復(fù)雜分析樣式,大大增加了其效益。與其他 MPP 解決方案不同, Sybase IQ 的 PlexQ 網(wǎng)格技術(shù)能夠動(dòng)態(tài)管理可輕松擴(kuò)展并且專用于不同組和流程的一系 列計(jì)算與存儲(chǔ)資源中的分析工作量,從而使其能夠以更低的成本更輕松地支持日益增長(zhǎng)的 數(shù)據(jù)量以及快速增長(zhǎng)的用戶社區(qū)。Sybase IQ 15.4采用業(yè)內(nèi)領(lǐng)先的MPP列式數(shù)據(jù)庫(kù)和最先進(jìn)的數(shù)據(jù)庫(kù)內(nèi)分析技術(shù),并革 命性地加入MapReduce與Hadoop集成,以應(yīng)對(duì)大數(shù)據(jù)時(shí)代的分析挑戰(zhàn),開(kāi)啟洞察關(guān)鍵業(yè)務(wù) 的能力。Sybase IQ 15.4正在打破數(shù)據(jù)分析的壁壘,徹底改變“大數(shù)據(jù)分析”領(lǐng)域?;诔墒斓腜lexQ技術(shù)構(gòu)建的Sybase IQ
14、采用下圖所示的三層構(gòu)架:基本層:數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS),這是一個(gè)全共享MPP分析DBMS引擎,是Sybase IQ 最大的獨(dú)特優(yōu)勢(shì)。第二層:分析應(yīng)用程序服務(wù)層,其提供C+和Java數(shù)據(jù)庫(kù)內(nèi)API,并可實(shí)現(xiàn)與外部 數(shù)據(jù)源的集成和聯(lián)邦;包括四種與Hadoop的集成方法?;谶@種PlexQ技術(shù),Sybase IQ 15.4將大數(shù)據(jù)轉(zhuǎn)變成可指揮每個(gè)人都行動(dòng)的情報(bào)信息, 從而在整個(gè)企業(yè)的用戶和業(yè)務(wù)流程范圍內(nèi)輕松具備大數(shù)據(jù)的分析能力。2.3.2主要特性Sybase IQ(154)的關(guān)鍵特性:?更強(qiáng)的數(shù)據(jù)管理大量增強(qiáng)的功能改善了 Sybase IQ的數(shù)據(jù)管理、部署和可維護(hù)性。更快速的批量加載:批量加載數(shù)
15、據(jù)通過(guò)ODBC和JDBC接口插入到Sybase中,從而實(shí) 現(xiàn)具有更高可擴(kuò)展性的應(yīng)用程序,同時(shí)可極大提高加載性能。更出色的文本壓縮: 更出色地對(duì) VARCHAR、VARBINARY、CHAR 和 BINARY 壓縮可實(shí)現(xiàn) 以更高效率、更低成本部署高性能文本分析應(yīng)用程序,同時(shí)極大提高壓縮速率。?豐富的應(yīng)用程序Sybase IQ 15.4 增加了一系列 API 和工具,用于創(chuàng)建在數(shù)據(jù)庫(kù)內(nèi)運(yùn)行的高級(jí)分析算 法,并且能通過(guò) PlexQ 網(wǎng)格能充分利用大規(guī)模并行處理的能力。支持自帶Map Reduce的表參數(shù)化用戶自定義函數(shù)(UDF)這是Sybase IQ的本地應(yīng) 用程序編程接口,可使應(yīng)用程序編程人員在
16、Sybase IQ 數(shù)據(jù)庫(kù)服務(wù)器內(nèi)構(gòu)建和部署 C+ 庫(kù)。使用這些 API 可實(shí)現(xiàn)專有算法或算法包,安全地位于 Sybase IQ 內(nèi),通過(guò)在保存于 Sybase IQ 數(shù)據(jù)庫(kù)服務(wù)器中的數(shù)據(jù)附近執(zhí)行,以快 10 倍的速度返回結(jié)果。此框架可實(shí)現(xiàn) 在 Sybase IQ 中開(kāi)發(fā)和部署 MapReduce 程序,以分析涉及結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化 數(shù)據(jù)格式的超大數(shù)據(jù)集C+、Map和Reduce算法通過(guò)標(biāo)準(zhǔn)SQL加以調(diào)用,并且由SybaseIQ強(qiáng)大的查詢引擎自動(dòng)在PlexQ網(wǎng)格中進(jìn)行分發(fā)和并行化。Hadoop集成與聯(lián)邦 將基于Hadoop的分析的結(jié)果與運(yùn)行于Sybase IQ中的查詢相 集成。Syba
17、se是唯一一家提供4種不同方法將標(biāo)準(zhǔn)SQL查詢(客戶端聯(lián)邦、ETL處理、數(shù) 據(jù)聯(lián)邦和查詢聯(lián)邦)中的Hadoop數(shù)據(jù)和分析與分析數(shù)據(jù)庫(kù)相集成的廠商。Sybase IQ 15.4 充分利用Hadoop來(lái)識(shí)別海量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)集中的相關(guān)數(shù)據(jù)點(diǎn),然后將Hadoop中 的相關(guān)數(shù)據(jù)點(diǎn)集成到 SybaseIQ 中,以便利用傳統(tǒng)數(shù)據(jù)和來(lái)自其他數(shù)據(jù)源的結(jié)果集進(jìn)行分 析。預(yù)測(cè)模型標(biāo)記語(yǔ)言 (PMML) 支持通過(guò) Zementis 提供的認(rèn)證插件,自動(dòng)執(zhí)行使用 業(yè)界標(biāo)準(zhǔn)語(yǔ)言定義在SAS、SPSS、“R”等工具以及其他流行預(yù)測(cè)工作平臺(tái)產(chǎn)品中所創(chuàng)建的 分析模型。充分利用流行的分析工具構(gòu)建預(yù)測(cè)模型,自動(dòng)執(zhí)行在Syb
18、ase IQ中部署的預(yù)測(cè) 模型,并使用業(yè)界標(biāo)準(zhǔn)語(yǔ)言,以避免形成廠商捆綁?!癛”集成:用戶可使用RJDBC接口,以及流行的開(kāi)源統(tǒng)計(jì)工具“R”查詢Sybase IQ數(shù)據(jù)庫(kù)。此外,用戶還可以將來(lái)自Sybase IQ的“R”庫(kù)作為SQL查詢中的函數(shù)調(diào)用加 以執(zhí)行,并返回結(jié)果集。? 數(shù)據(jù)庫(kù)內(nèi)分析庫(kù)更新的數(shù)據(jù)庫(kù)內(nèi)統(tǒng)計(jì)和數(shù)據(jù)挖掘庫(kù)(來(lái)自Fuzzy ? Logix的DBLytix):在Sybase IQ 內(nèi)運(yùn)行的高級(jí)分析、統(tǒng)計(jì)和數(shù)據(jù)挖掘算法庫(kù)。Sybase IQ 15.4中的更新可使該庫(kù)充分利用 一些數(shù)據(jù)挖掘算法中的MapReduce API進(jìn)行大規(guī)模并行處理,并且包含多種新函數(shù),例如 支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和
19、Adap tive Boos ting。? 擴(kuò)展的生態(tài)系統(tǒng)合作伙伴產(chǎn)品可在以下方面提供幫助:Sybase PowerDesigner? 16.1參考架構(gòu)生成器:可通過(guò)在實(shí)施Sybase IQ數(shù)據(jù)倉(cāng)庫(kù) 和數(shù)據(jù)集市時(shí)生成最佳硬件配置,快速實(shí)現(xiàn)價(jià)值。Sybase Control Center(SCC):改進(jìn)方面包括大量管理功能,例如過(guò)程、函數(shù)、UDF(表、 TPF和JavaEE )及文本索引。用戶能夠更輕松地管理SCC中頻繁使用的功能,以及更輕 松地部署內(nèi)置、外部和文本數(shù)據(jù)庫(kù)內(nèi)分析。此外該版本還包含了新的SQL執(zhí)行窗口,該窗 口可實(shí)現(xiàn)易于測(cè)試的特定SQL例程。已通過(guò) SAP?BusinessObje
20、cts?認(rèn)證:Sybase IQ 15.4 已通過(guò)認(rèn)證,可與 SAP Business Objects Business Intelligence Platform 4.0 和 SAP Business Objects? Data Services 4.0配合使用,以提供豐富的端到端業(yè)務(wù)分析框架。2.3.3主要局限Sybase IQ MPP 是 Share-Disk 架構(gòu)增加硬件,無(wú)法線性的提升數(shù)據(jù)庫(kù)性能。列存儲(chǔ)的一些劣勢(shì),裝載速度,復(fù)雜查詢等性能不理想。插入操作上表級(jí)鎖,影響數(shù)據(jù)導(dǎo)入時(shí)影響表上的并發(fā)操作。(*)2.4 Teradata Aster DataTeradata天睿公司的Aster
21、 Data分析平臺(tái)是市場(chǎng)領(lǐng)先的大數(shù)據(jù)分析解決方案。Ast er Da ta分析平臺(tái)嵌入了 MapReduce,對(duì)新數(shù)據(jù)源和多結(jié)構(gòu)數(shù)據(jù)類型進(jìn)行更深入的分析 處理,提供具有突破性的性能和可擴(kuò)展性的分析能力。As ter Da ta解決方案利用Aster Data專利SQL-MapReduce來(lái)并行處理數(shù)據(jù)和應(yīng)用程序,可在大范圍內(nèi)提供豐富的分析洞 察力。2.4.1基礎(chǔ)架構(gòu)TD As ter Data平臺(tái)架構(gòu)如下:其中Ast er Dat abase架構(gòu)如下:242主要特性TD Aster Data有如下技術(shù)特點(diǎn):Shared-nothing 架構(gòu)海量數(shù)據(jù)庫(kù)采用最易于擴(kuò)展的Shared-no thin
22、g架構(gòu),每個(gè)節(jié)點(diǎn)都有自己的操作系統(tǒng)、 數(shù)據(jù)庫(kù)、硬件資源,節(jié)點(diǎn)之間通過(guò)網(wǎng)絡(luò)來(lái)通信。S Q L - MapReduceSQL-MapReduce是Aster Data公司的專利,在同類技術(shù)中(Greenplum)屬于領(lǐng)先地 位。SQL-MapReduce框架可以使數(shù)據(jù)科學(xué)家和商業(yè)分析師對(duì)復(fù)雜的信息進(jìn)行快速調(diào)查分析, 允許一組關(guān)聯(lián)計(jì)算機(jī)(計(jì)算機(jī)群集)使用軟件語(yǔ)言(如Java、C#、Python、C+和R)并 行進(jìn)行程序表達(dá),然后通過(guò)標(biāo)準(zhǔn)SQL激活(調(diào)用)使用?;贛PP的并行分析平臺(tái)第一個(gè)大規(guī)模并行分析平臺(tái),借助S Q L -MapReduce支持嵌入式分析應(yīng)用程序,使 企業(yè)能顯著加快TB乃至PB級(jí)數(shù)據(jù)的處理,為提供新的交互性大數(shù)據(jù)應(yīng)用帶來(lái)了無(wú)數(shù)機(jī)可視化集成開(kāi)發(fā)環(huán)境第一個(gè)可視化集成開(kāi)發(fā)環(huán)境
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025疫情背景下合同解除的法律探討
- 2025鋼材買賣合同范本
- 2025年室外給排水管網(wǎng)建設(shè)項(xiàng)目合同
- 2025國(guó)際服務(wù)貿(mào)易的合同
- 2025合同項(xiàng)目完成證明
- 2025魚(yú)塘租賃合同范本
- 山東省泰安市肥城市2024-2025學(xué)年下學(xué)期八年級(jí)期中考試地理試題(含答案)
- 講述籃球裁判員的執(zhí)法魅力試題及答案
- 監(jiān)控道閘安裝協(xié)議合同
- 物流送貨工合同協(xié)議
- 江西卷-2025屆高考?xì)v史4月模擬預(yù)測(cè)卷(解析版)
- bim安全教育試題及答案
- GB 19762-2025離心泵能效限定值及能效等級(jí)
- 2024年電工(高級(jí)技師)考前必刷必練題庫(kù)500題(含真題、必會(huì)題)
- 2024年內(nèi)蒙古航開(kāi)城市投資建設(shè)有限責(zé)任公司招聘筆試沖刺題(帶答案解析)
- DZ∕T 0207-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 硅質(zhì)原料類(正式版)
- 意大利(百得)TBG 系列燃燒機(jī)說(shuō)明書(shū)
- 證據(jù)清單模板
- 婚前醫(yī)學(xué)檢查證明(含存根)
- 安徽合肥住宅工程質(zhì)量通病防治導(dǎo)則
- 《抑郁癥健康教育》PPT課件.ppt
評(píng)論
0/150
提交評(píng)論