版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、正文目錄 HYPERLINK l _bookmark0 華為數(shù)據(jù)庫分析4 HYPERLINK l _bookmark2 華為 DB 開發(fā)歷程4 HYPERLINK l _bookmark4 初識華為 GaussDB6 HYPERLINK l _bookmark10 詳解華為 GaussDB11 HYPERLINK l _bookmark11 華為 GaussDB 20011 HYPERLINK l _bookmark20 華為 GaussDB 30018 HYPERLINK l _bookmark22 數(shù)據(jù)庫產(chǎn)品對比分析21 HYPERLINK l _bookmark23 Oracle 數(shù)據(jù)庫
2、21 HYPERLINK l _bookmark30 AWS 數(shù)據(jù)庫25 HYPERLINK l _bookmark33 華為 GaussDB:對比28 HYPERLINK l _bookmark35 總結(jié)31 HYPERLINK l _bookmark36 風(fēng)險提示31 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)圖表目錄 HYPERLINK l _bookmark1 圖表 1: 數(shù)據(jù)庫的演進4 HYPERLINK l _bookmark3 圖表 2: 華為 GaussDB 對 AI 技術(shù)的應(yīng)用5 HYPERLINK l _bookmark5 圖表 3: 華為 G
3、aussDB 特點6 HYPERLINK l _bookmark6 圖表 4: 華為 GaussDB 產(chǎn)品線7 HYPERLINK l _bookmark7 圖表 5: OLTP&OLAP 對比8 HYPERLINK l _bookmark8 圖表 6: 華為 GaussDB OLTP&OLAP 特點9 HYPERLINK l _bookmark9 圖表 7: 華為 GaussDB HTAP 特點10 HYPERLINK l _bookmark12 圖表 8: 數(shù)據(jù)庫:行式存儲11 HYPERLINK l _bookmark13 圖表 9: 數(shù)據(jù)庫:列式存儲12 HYPERLINK l _bo
4、okmark14 圖表 10: 數(shù)據(jù)庫:行式&列式存儲對比12 HYPERLINK l _bookmark15 圖表 11: 華為 GaussDB 200 架構(gòu)14 HYPERLINK l _bookmark16 圖表 12: 華為 GaussDB 200 軟件構(gòu)成16 HYPERLINK l _bookmark17 圖表 13: 華為 GaussDB 特點16 HYPERLINK l _bookmark18 圖表 14: 華為 GaussDB 200 架構(gòu)17 HYPERLINK l _bookmark19 圖表 15: 華為 GaussDB200 數(shù)據(jù)查詢過程18 HYPERLINK l
5、_bookmark21 圖表 16: 華為 GaussDB 300 集群架構(gòu)20 HYPERLINK l _bookmark24 圖表 17: Oracle 數(shù)據(jù)庫不斷演進21 HYPERLINK l _bookmark25 圖表 18: Oracle 數(shù)據(jù)庫 18C 的升級22 HYPERLINK l _bookmark26 圖表 19: Oracle 數(shù)據(jù)庫 19C 的升級22 HYPERLINK l _bookmark27 圖表 20: Oracle 數(shù)據(jù)庫支持多種數(shù)據(jù)類型23 HYPERLINK l _bookmark28 圖表 21: Oracle 的分布式數(shù)據(jù)庫24 HYPERLI
6、NK l _bookmark29 圖表 22: Oracle 數(shù)據(jù)庫支持多種數(shù)據(jù)類型25 HYPERLINK l _bookmark31 圖表 23: Amazon Aurora 典型客戶27 HYPERLINK l _bookmark32 圖表 24: Amazon DynamoDB 典型客戶28 HYPERLINK l _bookmark34 圖表 25: 華為 GaussDB 200 典型客戶29 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn) HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)華為數(shù)據(jù)庫分析數(shù)據(jù)庫是計算機行業(yè)的基礎(chǔ)核心軟件
7、,所有應(yīng)用軟件的運行和數(shù)據(jù)處理都要與其進行數(shù)據(jù)交互。2008 年阿里提出“去 IOE”,而 10 年之后,我們現(xiàn)在來看,發(fā)現(xiàn) Oracle 的數(shù)據(jù)庫是最難替換的。不僅是因為 Oracle 的數(shù)據(jù)庫沉淀了大量的企業(yè)客戶數(shù)據(jù),更是因為數(shù)據(jù)庫產(chǎn)品開發(fā)難度確實比較大。數(shù)據(jù)庫的開發(fā)難度不亞于操作系統(tǒng),屬于整個 IT 架構(gòu)的基礎(chǔ)軟件(數(shù)據(jù)庫軟件在操作系統(tǒng)之上,我們可以將其稱為類中間層的基礎(chǔ)軟件)。而且數(shù)據(jù)庫的開發(fā)需要與底層計算架構(gòu)高度相關(guān)和耦合,是適配 X86 架構(gòu),還是適配 ARM 架構(gòu)等等。當(dāng)然以上這些都是數(shù)據(jù)庫的與其他基礎(chǔ)器件的適配,數(shù)據(jù)庫難度更大的地方在于如何實現(xiàn)對數(shù)據(jù)高效、穩(wěn)定、持續(xù)的管理。Or
8、acle、微軟的數(shù)據(jù)庫之所以能長久不衰,一方面在于 其強大的技術(shù)開發(fā)和產(chǎn)品升級迭代能力,另一方面在于其對數(shù)據(jù)庫的 Knowhow 理解足夠深,這個是其他廠商短期難以超越的。回到這篇文章的主題:華為數(shù)據(jù)庫。華為在 IT 的底層架構(gòu),逐步搭建起自己的基礎(chǔ)架構(gòu), 建立華為生態(tài)。我們這次把華為數(shù)據(jù)庫進行講解,并對目前主流的數(shù)據(jù)庫進行對比。只有對比,才能發(fā)現(xiàn)不同。圖表1: 數(shù)據(jù)庫的演進資料來源:華為官網(wǎng),華泰證券研究所華為 DB 開發(fā)歷程華為對數(shù)據(jù)庫的開發(fā)經(jīng)歷了長達 12 年左右的時間。2007 年,華為開始著手研發(fā)內(nèi)存數(shù)據(jù)庫,項目代號為 GMDB。這個項目的背景是,當(dāng)時電信實施實時計費,電信行業(yè)對數(shù)據(jù)
9、庫有特殊的要求,有些需要定制化開發(fā)。而當(dāng)時國外的數(shù)據(jù)庫產(chǎn)品主要是標(biāo)準(zhǔn)化產(chǎn)品。為了滿足客戶需求,華為當(dāng)時開始研發(fā)內(nèi)存數(shù)據(jù)庫。2010 年,華為開始從內(nèi)存數(shù)據(jù)庫向通用關(guān)系型數(shù)據(jù)庫進行拓展,逐步將非內(nèi)存數(shù)據(jù)庫的功能融入到數(shù)據(jù)庫產(chǎn)品中。2012 年,華為數(shù)據(jù)庫性能得到顯著提升,GMDB 開始逐步商用化,主要應(yīng)用于電信計費。同時,該產(chǎn)品也在華為內(nèi)部的部分部門開始使用。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)2013 年,華為 OLTP 數(shù)據(jù)庫開始上線(后面我們會詳細介紹 OLTP 和 OLAP)。2014 年,華為開發(fā)出第一個 OLAP 數(shù)據(jù)庫版本(OLAP 我們可以簡
10、單理解為:是針對大量數(shù)據(jù)的分析型數(shù)據(jù)庫)。2015 年,華為與工商銀行一起聯(lián)合研發(fā)。Gauss OLAP 數(shù)據(jù)庫在工商銀行上線,逐步替代海外的數(shù)據(jù)倉庫。2017 年,華為與招商銀行一起聯(lián)合開發(fā) GaussDB。同時,華為啟動面向事務(wù)和分析混合處理的數(shù)據(jù)庫開發(fā),即 HTAP。2018 年,華為 Gauss OLTP 數(shù)據(jù)庫(事務(wù)型數(shù)據(jù)庫)開始在招商銀行綜合支付交易系統(tǒng)成功上線。承接招商銀行 “手機銀行”和“掌上生活”兩大 App 交易流水流量。2018 年,Gauss HTAP 數(shù)據(jù)庫推出,并在民生銀行得到應(yīng)用。從華為 Gauss 數(shù)據(jù)庫產(chǎn)品演化至今來看,華為數(shù)據(jù)庫產(chǎn)品的研發(fā)是從內(nèi)存數(shù)據(jù)庫開始,
11、逐步向通用關(guān)系型數(shù)據(jù)庫延伸,這與Oracle、AWS 數(shù)據(jù)庫開發(fā)的起點并不完全一樣。華為數(shù)據(jù)庫產(chǎn)品類型,包括了 OLTP、OLAP,同時還研發(fā)出 HTAP 產(chǎn)品。我們認為, 從產(chǎn)品應(yīng)用角度來看,華為 OLAP(分析型數(shù)據(jù)庫)大規(guī)模應(yīng)用的時點更早一些。Oracle 的 OLTP(事務(wù)型數(shù)據(jù)庫)在全球領(lǐng)域的競爭優(yōu)勢非常明顯,這一領(lǐng)域的數(shù)據(jù)庫產(chǎn)品比較難替代。華為的 OLTP 數(shù)據(jù)庫是通過與大客戶合作,特別是銀行大客戶合作(工商銀行、招商銀行),來不斷進行產(chǎn)品迭代和完善的。我們認為,這也是華為數(shù)據(jù)庫能夠快速成長的主要原因。圖表2: 華為 GaussDB 對 AI 技術(shù)的應(yīng)用資料來源:華為官網(wǎng),華泰證券
12、研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)初識華為 GaussDB華為在數(shù)據(jù)庫領(lǐng)域已經(jīng)有 12 年的開發(fā)經(jīng)驗,從早期的摸索到現(xiàn)在的產(chǎn)品逐步成熟,中間也是經(jīng)歷了很多歷程。目前,華為數(shù)據(jù)庫逐步建立起三大產(chǎn)品系列。華為的數(shù)據(jù)庫產(chǎn)品系列命名為:GaussDB,高斯數(shù)據(jù)庫。高斯,是德國偉大的數(shù)學(xué)家,近代數(shù)學(xué)的寞基者之一,高斯、阿基米德、歐拉、牛頓被世人稱為世界上最偉大的四位數(shù)學(xué)家。華為將自己的數(shù)據(jù)庫命名為 Gauss 系列,也有向數(shù)學(xué)致敬的意味。GaussDB:開源數(shù)據(jù)庫。華為的 Gauss 數(shù)據(jù)庫是一個開源數(shù)據(jù)庫,基于 PostgreSQL9.2 開發(fā)。我們知道
13、PostgreSQL 本身就是一個開源數(shù)據(jù)庫品牌?,F(xiàn)在除了 Oracle DB、微軟的 SQL Server 等傳統(tǒng)老牌數(shù)據(jù)產(chǎn)品之外,目前新開發(fā)的數(shù)據(jù)庫產(chǎn)品,開源數(shù)據(jù)庫占比較大的部分。包括我們看到的 AWS 的 Aurora 數(shù)據(jù)庫、阿里的飛天數(shù)據(jù)庫、華為的 Gauss 數(shù)據(jù)庫,以及數(shù)據(jù)庫新進入者 MongoDB 等。GaussDB:分布式&AI 原生。華為 GaussDB 是一個企業(yè)級 AI-Native 分布式數(shù)據(jù)庫。GaussDB 采用 MPP(Massive Parallel Processing)架構(gòu),支持行存儲與列存儲,提供PB(Petabyte,2 的 50 次方字節(jié))級別數(shù)據(jù)量
14、的處理能力??梢詾槌笠?guī)模數(shù)據(jù)管理提供高性價比的通用計算平臺,也可用于支撐各類數(shù)據(jù)倉庫系統(tǒng)、BI(Business Intelligence) 系統(tǒng)和決策支持系統(tǒng),為上層應(yīng)用的決策分析提供服務(wù)。華為 GaussDB 將 AI 能力植入到數(shù)據(jù)庫內(nèi)核的架構(gòu)和算法中,為用戶提供更高性能、更高可用、更多算力支持的分布式數(shù)據(jù)庫。圖表3: 華為 GaussDB 特點資料來源:華為官網(wǎng),華泰證券研究所GaussDB:三大產(chǎn)品線系列。高斯數(shù)據(jù)庫研發(fā)始于 2011 年。目前已經(jīng)開發(fā)有三個產(chǎn)品系列:GaussDB 100、GaussDB 200、GaussDB 300。GaussDB 100:主要以 OLTP 為
15、主。GaussDB 100 研發(fā)開始于 2011 年,與后面的GaussDB 200/300 不同,GaussDB 100 并不是一個分布式數(shù)據(jù)庫。GaussDB 100 包括兩條線,一條產(chǎn)品線是基于單機版開源數(shù)據(jù)庫 PostgreSQL 研發(fā)的產(chǎn)品,另一條線是自研內(nèi)核的 GaussDB 100 產(chǎn)品。后面這一條線是近幾年華為研發(fā)的產(chǎn)品。目前該產(chǎn)品已經(jīng)應(yīng)用在招商銀行。GaussDB 100 主要是 OLTP,即事務(wù)型數(shù)據(jù)庫。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)GaussDB 200:以 OLAP 為主,兼顧 OATP。華為 GaussDB 200 開始于
16、2012 年,在基于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的 SQL 引擎和事務(wù)強一致性等基礎(chǔ)上,進行了分布式、并行計算的改造。歷時 6 年,打造了一款架構(gòu)領(lǐng)先的分析型數(shù)據(jù)庫,為各行業(yè) PB 級海量數(shù)據(jù)分析提供有競爭力的解決方案。GaussDB 200 既可以適用于 OLTP,也可以應(yīng)用于 OLAP。GaussDB 300:HTAP,OLTP 和 OLAP。GaussDB 300 是一個分布式并行關(guān)系型數(shù)據(jù)庫系統(tǒng),是企業(yè)級分布式 HTAP 數(shù)據(jù)庫(Hybrid Transaction and Analytical Process,混合事務(wù)和分析處理)。GaussDB 300 架構(gòu)上著重構(gòu)筑傳統(tǒng)數(shù)據(jù)庫的企業(yè)級能力和互
17、聯(lián)網(wǎng)分布式數(shù)據(jù)庫的高擴展和高可用能力,完全兼容 SQL 標(biāo)準(zhǔn),提供百萬級 TPMC 的交易處理能力和企業(yè)級可靠性。GaussDB 200/300 都是基于開源數(shù)據(jù)庫 PostgreSQL 研發(fā),雖然是基于開源數(shù)據(jù)庫,但已經(jīng)對開源代碼進行了大量修改,在很大程度上接近于自研。GaussDB 200/300 既可以支持 OLTP 也可以支持 OLAP,也是華為投入精力最大、研發(fā)時間最長的產(chǎn)品線。目前已經(jīng)在工商銀行和民生銀行應(yīng)用。圖表4: 華為 GaussDB 產(chǎn)品線資料來源:華為官網(wǎng),華泰證券研究所在以上我們對華為 GaussDB 的介紹當(dāng)中,提到了數(shù)據(jù)庫領(lǐng)域比較重要的兩個概念:OLTP 和 OLA
18、P。下面我們就介紹下這兩個概念,以及其所對應(yīng)的數(shù)據(jù)庫類型。華為 GaussDB 數(shù)據(jù)庫包括:事務(wù)性(OLTP)數(shù)據(jù)庫、分析型(OLAP)數(shù)據(jù)庫和混合負載(HTAP)數(shù)據(jù)庫。這里需要解釋下 OLTP、OLAP、HTAP 之間的區(qū)別,這也是數(shù)據(jù)庫最基本的內(nèi)容。數(shù)據(jù)庫系統(tǒng)一般分為兩種類型:一種是面向前臺應(yīng)用的,應(yīng)用比較簡單,但是重吞吐和高并發(fā)的 OLTP 類型;一種是重計算的,對大數(shù)據(jù)集進行統(tǒng)計分析的 OLAP 類型。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)OLTP:聯(lián)機事務(wù)處理 OLTP(on-line transaction processing)它是事件驅(qū)動、
19、面向應(yīng)用的,比如電子商務(wù)網(wǎng)站的交易系統(tǒng)就是典型的 OLTP 系統(tǒng)。OLTP 的基本特點是:數(shù)據(jù)在系統(tǒng)中產(chǎn)生;基于交易的處理系統(tǒng)(Transcation-Based);每次交易牽涉的數(shù)據(jù)量很?。粚憫?yīng)時間要求非常高;用戶數(shù)量非常龐大,主要是操作人員; 數(shù)據(jù)庫的各種操作主要基于索引進行。OLAP:聯(lián)機分析處理 OLAP(On-Line Analytical Processing)是基于數(shù)據(jù)倉庫的信息分析處理過程,是數(shù)據(jù)倉庫的用戶接口部分。OLAP 系統(tǒng)是跨部門的、面向主題的,其基本特點是:本身不產(chǎn)生數(shù)據(jù),其基礎(chǔ)數(shù)據(jù)來源于生產(chǎn)系統(tǒng)中的操作數(shù)據(jù)(OperationalData);基于查詢的分析系統(tǒng);復(fù)
20、雜查詢經(jīng)常使用多表聯(lián)結(jié)、全表掃描等,牽涉的數(shù)量往往十分龐大; 響應(yīng)時間與具體查詢有很大關(guān)系;用戶數(shù)量相對較小,其用戶主要是業(yè)務(wù)人員與管理人員;由于業(yè)務(wù)問題不固定,數(shù)據(jù)庫的各種操作不能完全基于索引進行。OLTP 是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng)用,主要是基本的、日常的事務(wù)處理,例如銀行交易。OLAP 是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。OLTP 系統(tǒng)強調(diào)數(shù)據(jù)庫內(nèi)存效率,強調(diào)內(nèi)存各種指標(biāo)的命令率,強調(diào)綁定變量,強調(diào)并發(fā)操作。OLAP 系統(tǒng)則強調(diào)數(shù)據(jù)分析,強調(diào) SQL 執(zhí)行市場,強調(diào)磁盤 I/O,強調(diào)分區(qū)等。圖表5: OLTP&OLAP 對比OLTPO
21、LAP用戶操作人員,低層管理人員決策人員,高級管理人員功能日程操作處理分析決策DB 設(shè)計面向應(yīng)用面向主題數(shù)據(jù)當(dāng)前的,最新的,細節(jié)的,二維的,分離的歷史的,聚焦的,多維的,集成的,統(tǒng)一的存取讀/寫數(shù)十條記錄讀上百萬條記錄工作單位簡單的事務(wù)復(fù)雜的查詢用戶數(shù)上千個上百萬個DB 大小100MB-GB100GB-TB時間要求具有實時性對時間的要求不嚴格主要應(yīng)用數(shù)據(jù)庫數(shù)據(jù)倉庫資料來源:至頂網(wǎng),華泰證券研究所HTAP:混合事務(wù)和分析處理(Hybrid Transaction and Analytical Process),既可以應(yīng)用于事務(wù)型數(shù)據(jù)庫場景,亦可以應(yīng)用于分析型數(shù)據(jù)庫場景。 HYPERLINK /
22、謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)GaussDB OLTP 數(shù)據(jù)庫,業(yè)界首創(chuàng) Switch Turbo 技術(shù),AZ 內(nèi) TRO1 秒,滿足金融場景下的數(shù)據(jù)庫高可用訴求。GaussDB OLAP 數(shù)據(jù)庫,可以幫助客戶實現(xiàn) PB 級海量數(shù)據(jù)高效分析,目前已經(jīng)廣泛應(yīng)用于金融、運營商、政府等行業(yè)。圖表6: 華為 GaussDB OLTP&OLAP 特點資料來源:華為官網(wǎng),華泰證券研究所GaussDB HTAP 數(shù)據(jù)庫,多模引擎支持五種數(shù)據(jù)類型融合處理,包括流、圖、空間、文本、結(jié)構(gòu)化,可以解決集中式架構(gòu)擴展性和性能瓶頸問題,同時分散風(fēng)險,提升業(yè)務(wù)連續(xù) 性。圖表7: 華為 GaussDB H
23、TAP 特點資料來源:華為官網(wǎng),華泰證券研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)華為 GaussDB 值得關(guān)注的點:1、全球首款 AI-Native 數(shù)據(jù)庫。AI 原生數(shù)據(jù)庫是GaussDB 的主要特點之一。華為將AI 引擎內(nèi)置到GaussDB 全系產(chǎn)品中, 使其具備一定的自運維、自管理、自調(diào)優(yōu)、故障自診斷和自愈的能力。華為也希望把在芯片、算法上面的優(yōu)勢,集中體現(xiàn)到數(shù)據(jù)庫上來??陀^來講,其實對于在數(shù)據(jù)庫中植入 AI 技術(shù),并不是一個新鮮做法。Oracle 在幾個版本之前就開始就植入了 AI 技術(shù),開啟了“Autonomous”之旅。2、異構(gòu)計算支持 X8
24、6、ARM、GPU、NPU。這個也是 Gauss 數(shù)據(jù)庫與其他數(shù)據(jù)庫比較大的不同。目前主流的數(shù)據(jù)庫產(chǎn)品,包括OracleDB、MySQL、SQL Server 等,基本都是支持 X86 架構(gòu)。我們認為,華為數(shù)據(jù)庫對于異構(gòu)計算的支持,可能是為該數(shù)據(jù)庫未來向更多計算場景的應(yīng)用做準(zhǔn)備。我們知道, 5G 帶來計算場景的變革或?qū)⒏蟆?HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)詳解華為 GaussDB華為的 Gauss 數(shù)據(jù)庫現(xiàn)在推廣的產(chǎn)品主要是 GaussDB 100、GaussDB 200 和 GaussDB 300。我們這里主要對 GaussDB 200 和 Gaus
25、sDB 300 這兩個系列產(chǎn)品進行介紹和解讀。華為 GaussDB 2001、GaussDB 200 簡介GaussDB 200 是企業(yè)級的大規(guī)模并行處理關(guān)系型數(shù)據(jù)庫,采用 MPP(Massively Parallel Processing)架構(gòu),支持行存儲與列存儲,提供 PB(Petabyte,2 的 50 次方字節(jié))級別數(shù)據(jù)量的處理能力。從以上對 GaussDB 的描述中,我們至少能夠理解到以下幾層意思:GaussDB 200 是一個關(guān)系型數(shù)據(jù)庫,不是 No-SQL 數(shù)據(jù)庫。它利用了分布式并行處理技術(shù)。早期傳統(tǒng)數(shù)據(jù)庫并不是分布式架構(gòu)。分布式并行架構(gòu)更適合于處理互聯(lián)網(wǎng)高并發(fā)數(shù)據(jù)。支持行存儲和
26、列存儲。這里需要解釋下,數(shù)據(jù)庫領(lǐng)域中的行存儲和列存儲區(qū)別。行存儲(Row-based):對于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,比如甲骨文的 OracleDB 和 MySQL, IBM 的 DB2、微軟的 SQL Server 等,一般都是采用行存儲(Row-based)行。在基于行式存儲的數(shù)據(jù)庫中,數(shù)據(jù)是按照行數(shù)據(jù)為基礎(chǔ)邏輯存儲單元進行存儲的,一行中的數(shù)據(jù)在存儲介質(zhì)中以連續(xù)存儲形式存在。圖表8: 數(shù)據(jù)庫:行式存儲資料來源:至頂網(wǎng),華泰證券研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)列式存儲(Column-based)是相對于行式存儲來說的,新興的 Hbase、HP Ver
27、tica、EMC Greenplum 等分布式數(shù)據(jù)庫均采用列式存儲。在基于列式存儲的數(shù)據(jù)庫中, 數(shù)據(jù)是按照列為基礎(chǔ)邏輯存儲單元進行存儲的,一列中的數(shù)據(jù)在存儲介質(zhì)中以連續(xù)存儲形式存在。圖表9: 數(shù)據(jù)庫:列式存儲資料來源:至頂網(wǎng),華泰證券研究所傳統(tǒng)的行式數(shù)據(jù)庫,是按照行存儲的,維護大量的索引和物化視圖無論是在時間(處理) 還是空間(存儲)面成本都很高。而列式數(shù)據(jù)庫恰恰相反,列式數(shù)據(jù)庫的數(shù)據(jù)是按照列存儲,每一列單獨存放,數(shù)據(jù)即是索引。只訪問查詢涉及的列,大大降低了系統(tǒng) I/O,每一列由一個線來處理,而且由于數(shù)據(jù)類型一致,數(shù)據(jù)特征相似,極大方便壓縮。圖表10: 數(shù)據(jù)庫:行式&列式存儲對比資料來源:至頂
28、網(wǎng),華泰證券研究所第一,從存儲角度來看,對于列式存儲來說,一行數(shù)據(jù)包含一個列或者多個列,每列有單獨一個 cell 來存儲數(shù)據(jù)。而行式存儲,則是把一行數(shù)據(jù)作為一個整體來存儲。另外,列式存儲天生就是適合壓縮,因為同一列里面的數(shù)據(jù)類型基本是相同。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)第二,從查詢角度來看,行式存儲比較適合隨機查詢,而且,關(guān)系型數(shù)據(jù)庫(RDBMS) 大多提供二級索引,在整行數(shù)據(jù)的讀取上,要優(yōu)于列式存儲。但是,行式存儲不適合掃描, 這意味著要查詢一個范圍的數(shù)據(jù),行式存儲需要掃描整個表基于以上,我們可以看出,GaussDB 200 兼具了行存儲和列存儲的
29、優(yōu)勢。MPP 架構(gòu)。這個與上面的分布式并行是一體的。在數(shù)據(jù)庫中,MPP 架構(gòu)并不是新技術(shù)。目前 Oracle 的數(shù)據(jù)庫,包括國內(nèi)的南大通用的分析型數(shù)據(jù)庫(OLAP)都采用了 MPP 架構(gòu)。MPP (Massively Parallel Processing),即大規(guī)模并行處理,在數(shù)據(jù)庫非共享集群中,每個節(jié)點都有獨立的磁盤存儲系統(tǒng)和內(nèi)存系統(tǒng),業(yè)務(wù)數(shù)據(jù)根據(jù)數(shù)據(jù)庫模型和應(yīng)用特點劃分到各個節(jié)點上,每臺數(shù)據(jù)節(jié)點通過專用網(wǎng)絡(luò)或者商業(yè)通用網(wǎng)絡(luò)互相連接,彼此協(xié)同計算,作為整體提供數(shù)據(jù)庫服務(wù)。非共享數(shù)據(jù)庫集群有完全的可伸縮性、高可用、高性能、優(yōu)秀的性價比、資源共享等優(yōu)勢。簡單來說,MPP 是將任務(wù)并行的分散到多
30、個服務(wù)器和節(jié)點上,在每個節(jié)點上計算完成后, 將各自部分的結(jié)果匯總在一起得到最終的結(jié)果。說起 MPP,我們不得不說大數(shù)據(jù)處理中應(yīng)用到的里另一個技術(shù):Hadoop。這個詞曾經(jīng)在2016 年中國大數(shù)據(jù)行業(yè)比較流行。我們來看下,MPPDB、Hadoop 與傳統(tǒng)數(shù)據(jù)庫技術(shù)在應(yīng)用場景上的對比。MPPDB 與 Hadoop 都是將運算分布到節(jié)點中獨立運算后進行結(jié)果合并(分布式計算),但由于依據(jù)的理論和采用的技術(shù)路線不同而有各自的優(yōu)缺點和適用范圍。兩種技術(shù)以及傳統(tǒng)數(shù)據(jù)庫技術(shù)的對比如下:Hadoop 和 MPP 兩種技術(shù)的特定和適用場景為:Hadoop 在處理非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)上具備優(yōu)勢,尤其適合海量數(shù)據(jù)批
31、處理等應(yīng)用要求。MPP 適合替代現(xiàn)有關(guān)系數(shù)據(jù)機構(gòu)下的大數(shù)據(jù)處理,具有較高的效率。MPP 適合多維度數(shù)據(jù)自助分析、數(shù)據(jù)集市等;Hadoop 適合海量數(shù)據(jù)存儲查詢、批量數(shù)據(jù)ETL、非機構(gòu)化數(shù)據(jù)分析(日志分析、文本分析)等。由上述對比可預(yù)見未來大數(shù)據(jù)存儲與處理趨勢:MPPDB+Hadoop 混搭使用,用 MPP 處理 PB 級別的、高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù),同時為應(yīng)用提供豐富的 SQL 和事務(wù)支持能力;用Hadoop 實現(xiàn)半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)處理。這樣可以同時滿足結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的高效處理需求。GaussDB 200 在核心技術(shù)上跟傳統(tǒng)數(shù)據(jù)庫相比有巨大優(yōu)勢,可以解決很多行業(yè)用戶的數(shù)據(jù)處理性
32、能問題,可以為超大規(guī)模數(shù)據(jù)管理提供高性價比的通用計算平臺,并可用于支撐各類數(shù)據(jù)倉庫系統(tǒng)、BI(Business Intelligence)系統(tǒng)和決策支持系統(tǒng),統(tǒng)一為上層應(yīng)用的決策分析等提供服務(wù)。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)2、GaussDB 200 應(yīng)用場景GaussDB 200 面向行業(yè)大數(shù)據(jù)應(yīng)用,可以適用于以下場景:詳單查詢GaussDB 200 具備 PB 級數(shù)據(jù)負載能力,通過內(nèi)存分析技術(shù)滿足海量數(shù)據(jù)邊入庫邊查詢要求,適用于安全、電信、金融、物聯(lián)網(wǎng)等行業(yè)的詳單查詢業(yè)務(wù)。從這點可以看出,這一功能的實現(xiàn)是發(fā)揮了 GaussDB 200 在 OLT
33、P 方面能力。數(shù)據(jù)倉庫GaussDB 200 具備百 TB 級數(shù)據(jù)支撐能力,可以高效處理百億行多表連接查詢,適用于操作數(shù)據(jù)存儲 ODS(Operational Data Store)、企業(yè)數(shù)據(jù)倉庫 EDW(Enterprise Data Warehouse)、數(shù)據(jù)集市 DM(Data Mart)。以上這一功能體現(xiàn)了 GaussDB 200 在 OLAP 方面的能力?;旌县撦dGaussDB 200 基于海量數(shù)據(jù)查詢統(tǒng)計分析能力與事務(wù)處理能力,行列混存技術(shù)同時滿足聯(lián)機事務(wù)處理 OLTP(On-Line Transaction Processing)與聯(lián)機分析處理 OLAP(Online Analy
34、tical Processing)混合負載場景。大數(shù)據(jù)分析支持結(jié)構(gòu)化數(shù)據(jù) PB 級分析能力。分布式并行數(shù)據(jù)庫集群滿足 PB 級結(jié)構(gòu)化大數(shù)據(jù)的分析能力。圖表11: 華為 GaussDB 200 架構(gòu)資料來源:華為官網(wǎng),華泰證券研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)GaussDB 200 是一個分布式并行關(guān)系型數(shù)據(jù)庫系統(tǒng)。提供了以下功能:標(biāo)準(zhǔn) SQL 支持支持標(biāo)準(zhǔn)的 SQL-92/SQL:1999/SQL:2003 規(guī)范,支持 GBK 和 UTF-8 字符集,支持SQL 標(biāo)準(zhǔn)函數(shù)與分析函數(shù),支持存儲過程。數(shù)據(jù)庫存儲管理功能支持表空間,支持在線擴容功能。提供
35、組件管理和數(shù)據(jù)節(jié)點 HA(High Availability)支持數(shù)據(jù)庫事務(wù) ACID 特性(即原子性 Atomicity、一致性 Consistency、隔離性Isolation 和持久性 Durability),支持單節(jié)點故障恢復(fù),支持負載均衡等。應(yīng)用程序接口支持標(biāo)準(zhǔn) JDBC 4.0 的特性和 ODBC 3.5 特性。安全管理支持 SSL 安全網(wǎng)絡(luò)連接、用戶權(quán)限管理、密碼管理、安全審計等功能,保證數(shù)據(jù)庫在管理層、應(yīng)用層、系統(tǒng)層和網(wǎng)絡(luò)層的安全性。3、GaussDB 200 技術(shù)特點GaussDB 200 具有低成本、高性能、高可靠和支持海量數(shù)據(jù)存儲的特點。低成本基于分布式 x86 架構(gòu),客
36、戶硬件投資成本低。支持標(biāo)準(zhǔn)的 SQL92、SQL99、SQL2003 規(guī)范,支持客戶應(yīng)用系統(tǒng)平滑遷移。高性能行列混合存儲引擎,數(shù)據(jù)按照最優(yōu)負載模型選擇存儲方式,性能更優(yōu)。支持基于服務(wù)等級協(xié)議 SLA(Service-Level Agreement)策略的負載管理,保障并發(fā)任務(wù)的服務(wù)質(zhì)量。支持基于代價的查詢優(yōu)化模型,提升復(fù)雜查詢性能。分布式、并行化的查詢處理模型,充分利用系統(tǒng)計算資源和 IO 資源。支持并行數(shù)據(jù)導(dǎo)出和導(dǎo)入。高可靠硬件級高可靠:磁盤 Raid、交換機堆疊及網(wǎng)卡 bond、不間斷電源 UPS(Uninterruptible Power Supply)。件級高可靠:集群 CM、CN、G
37、TM、DN 實例全方位 HA。數(shù)據(jù)存儲安全可靠:在安全認證的基礎(chǔ)上,支持數(shù)據(jù)在數(shù)據(jù)庫內(nèi)的加密存儲,防止三方人員繞過數(shù)據(jù)庫認證機制直接讀取數(shù)據(jù)文件中的數(shù)據(jù)。支持海量數(shù)據(jù)集群最大可擴展至 2048 個節(jié)點,支撐 PB 級數(shù)據(jù)管理能力。集群規(guī)模按用戶需求彈性伸縮,擴展業(yè)務(wù)不中斷,減少用戶投資成本。圖表12: 華為 GaussDB 200 軟件構(gòu)成資料來源:華為官網(wǎng),華泰證券研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)各組件提供功能如下:GaussDB 200:基于 MPP 架構(gòu)的新型數(shù)據(jù)庫,為 GaussDB 200 提供 PB 級數(shù)據(jù)負載能力、百 TB 級數(shù)據(jù)支
38、撐能力、海量數(shù)據(jù)查詢統(tǒng)計分析能力與事務(wù)處理能力、支持結(jié)構(gòu)化數(shù)據(jù) PB 級分析能力等。Manager:作為運維系統(tǒng),負責(zé) GaussDB 200 的集群管理,支持大規(guī)模集群的安裝部署、監(jiān)控、告警、用戶管理、權(quán)限管理、審計、服務(wù)管理、健康檢查、問題定位、升級和補丁等。GaussDB 200 采用 Share-nothing 架構(gòu),由多個擁有獨立且互不共享 CPU、內(nèi)存、存儲等系統(tǒng)資源的節(jié)點組成。在這樣的系統(tǒng)架構(gòu)中,業(yè)務(wù)數(shù)據(jù)被分散存儲在多個物理節(jié)點上, 數(shù)據(jù)分析任務(wù)被推送到數(shù)據(jù)所在位置就近執(zhí)行,通過控制模塊的協(xié)調(diào),并行地完成大規(guī)模的數(shù)據(jù)處理工作,實現(xiàn)對數(shù)據(jù)處理的快速響應(yīng)。Share-nothing
39、又稱為無共享架構(gòu)。圖表13: 華為 GaussDB 特點資料來源:華為官網(wǎng),華泰證券研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)Share-nothing 架構(gòu)具備如下優(yōu)點:最易于擴展的架構(gòu)為商業(yè)智能 BI(Business Intelligence)和數(shù)據(jù)分析的高并發(fā)、大數(shù)據(jù)量計算提供按需擴展的能力;自動化的并行處理機制。內(nèi)部自動并行處理,無需人工分區(qū)或優(yōu)化數(shù)據(jù)加載與訪問方式與一般數(shù)據(jù)庫相同;數(shù)據(jù)分布在所有的并行節(jié)點上; 每個節(jié)點只處理其中一部分數(shù)據(jù)。最優(yōu)化的 I/O 處理所有的節(jié)點同時進行并行處理;節(jié)點之間完全無共享,無 I/O 沖突。增加節(jié)點實現(xiàn)存儲、
40、查詢及加載性能的線性擴展GaussDB 200 由多個 MPPDBServer 組成,GaussDB 200 結(jié)構(gòu)具體如圖所示。圖表14: 華為 GaussDB 200 架構(gòu)資料來源:華為官網(wǎng),華泰證券研究所作為關(guān)系型數(shù)據(jù)庫系統(tǒng),GaussDB 200 主要業(yè)務(wù)為數(shù)據(jù)的查詢與存儲。GaussDB 200 進行數(shù)據(jù)查詢的流程如圖 15 所示。具體查詢流程如下:用戶通過應(yīng)用程序發(fā)出查詢本地數(shù)據(jù)的 SQL 請求到 Coordinator。Coordinator 接收用戶的 SQL 請求,分配服務(wù)進程,向 GTM 請求分配全局事務(wù)信息。3)GTM 接收到 Coordinator 的請求,返回全局事務(wù)信
41、息給 Coordinator。4)Coordinator 根據(jù)數(shù)據(jù)分布信息以及系統(tǒng)元信息,解析 SQL 為查詢計劃樹,從查詢計劃樹中提取可以發(fā)送到 Datanode 的執(zhí)行步驟,封裝成 SQL 語句或者子執(zhí)行計劃樹,發(fā)送到 Datanode 執(zhí)行。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)5)Datanode 接收到讀取任務(wù)后,查詢具體 Storage 上的本地數(shù)據(jù)塊。6)Datanode 任務(wù)執(zhí)行后,將執(zhí)行結(jié)果返回給 Coordinator。7)Coordinator 將查詢結(jié)果通過應(yīng)用程序返回給用戶。GaussDB 200 數(shù)據(jù)存儲流程與數(shù)據(jù)查詢流程相近,請
42、參考數(shù)據(jù)查詢流程,此處不再介紹。圖表15: 華為 GaussDB200 數(shù)據(jù)查詢過程資料來源:華為官網(wǎng),華泰證券研究所華為 GaussDB 300GaussDB 300 是企業(yè)級分布式HTAP 數(shù)據(jù)庫(Hybrid Transaction and Analytical Process, 混合事務(wù)和分析處理),架構(gòu)上著重構(gòu)筑傳統(tǒng)數(shù)據(jù)庫的企業(yè)級能力和互聯(lián)網(wǎng)分布式數(shù)據(jù)庫的高擴展和高可用能力,完全兼容 SQL 標(biāo)準(zhǔn),提供百萬級 TPMC 的交易處理能力和企業(yè)級可靠性。GaussDB 300 是一個分布式并行關(guān)系型數(shù)據(jù)庫系統(tǒng)。提供了以下功能:標(biāo)準(zhǔn) SQL 支持支持標(biāo)準(zhǔn)的 SQL92/SQL99/SQL2
43、003 規(guī)范,支持 GBK 和 UTF-8 字符集,支持 SQL 標(biāo)準(zhǔn)函數(shù)與分析函數(shù),支持存儲過程。數(shù)據(jù)庫存儲管理功能支持表空間,支持在線擴容功能。提供組件管理和數(shù)據(jù)節(jié)點 HA(High Availability)支持數(shù)據(jù)庫事務(wù) ACID 特性(即原子性 Atomicity、一致性 Consistency、隔離性 Isolation和持久性 Durability),支持單節(jié)點故障恢復(fù),支持負載均衡等。應(yīng)用程序接口支持標(biāo)準(zhǔn) JDBC 4.0 的特性和 ODBC 3.5 特性。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)安全管理支持 SSL 安全網(wǎng)絡(luò)連接、用戶權(quán)限管理
44、、密碼管理、安全審計等功能,保證數(shù)據(jù)庫在管理層、應(yīng)用層、系統(tǒng)層和網(wǎng)絡(luò)層的安全性。GaussDB 300 具備如下特性:高擴展: 容量和性能按需水平擴展無共享架構(gòu),性能線性擴展能力。 應(yīng)用透明的 Sharding 能力。高可用: 雙活和兩地三中心高可用讀寫分離和兩地三中心部署。分片雙活和兩地三中心部署。高性能: 支持高吞吐強一致性事務(wù)能力高并發(fā) MVCC 和日志管理。跨節(jié)點高性能、強一致事務(wù)。易管理: 易遷移,易監(jiān)控,運維兼容 SQL2003, 存儲過程等高級功能。在線升級,在線擴容。GaussDB 300 的分布式能力做到對業(yè)務(wù)透明,能替換傳統(tǒng) OLTP 數(shù)據(jù)庫應(yīng)用,也能替換數(shù)據(jù)庫中間件、數(shù)據(jù)
45、庫分庫分表等 Sharding 方案。同時它也讓開發(fā)運維人員不用關(guān)注數(shù)據(jù)庫數(shù)據(jù)分布和擴展的細節(jié)問題,專注于業(yè)務(wù)開發(fā),極大的提升研發(fā)的生產(chǎn)力。GaussDB 300 應(yīng)用場景GaussDB 300 面向行業(yè)大數(shù)據(jù)應(yīng)用,可以適用于以下場景:核心交易處理具備大并發(fā)、百萬級 TPMC 事務(wù)處理能力,提供集群高可用、同城雙活和跨城市級容災(zāi)能力,能夠支撐銀行核心賬務(wù)、渠道交易、互聯(lián)網(wǎng)金融等關(guān)鍵 OLTP 應(yīng)用場景。復(fù)雜事務(wù)處理支持標(biāo)準(zhǔn) SQL92、SQL99 和 SQL2003,提供存儲過程、觸發(fā)器、分頁、游標(biāo)等能力,滿足 CRM、ERP 等典型企業(yè)應(yīng)用場景的復(fù)雜事務(wù)能力要求。混合負載場景基于行列混存、動
46、態(tài)負載管理和多租戶等技術(shù),具備復(fù)雜事務(wù)處理和海量數(shù)據(jù)查詢統(tǒng)計分析能力,同時滿足聯(lián)機事務(wù)處理 OLTP(On-Line Transaction Processing)與聯(lián)機分析處理 OLAP(Online Analytical Processing)混合負載場景。GaussDB 300 技術(shù)特點華為 GaussDB 300 具有如下技術(shù)特點:低成本基于分布式 x86 架構(gòu)(支持鯤鵬架構(gòu)),客戶硬件投資成本低。支持標(biāo)準(zhǔn)的 SQL92/SQL99/SQL2003 規(guī)范,支持客戶應(yīng)用系統(tǒng)平滑遷移。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)高性能通過列存儲、向量化執(zhí)行引擎
47、、分布式查詢處理等關(guān)鍵技術(shù),實現(xiàn)百億數(shù)據(jù)量查詢秒級響應(yīng)。支持海量數(shù)據(jù)集群最大可擴展至 32 個節(jié)點,支撐 TB 級數(shù)據(jù)管理能力。集群規(guī)模按用戶需求彈性伸縮,擴展業(yè)務(wù)不中斷,減少用戶投資成本。圖表16: 華為 GaussDB 300 集群架構(gòu)資料來源:華為官網(wǎng),華泰證券研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)數(shù)據(jù)庫產(chǎn)品對比分析這里我們主要講華為數(shù)據(jù)庫 GaussDB 與目前市場主流數(shù)據(jù)庫:Oracle、AWS 進行對比。Oracle 數(shù)據(jù)庫作為傳統(tǒng)數(shù)據(jù)庫產(chǎn)品的代表,其繼續(xù)在傳統(tǒng)計算場景占據(jù)較大的市場份額。同時,針對新興的計算場景和新的數(shù)據(jù)類型要求,Orac
48、le 數(shù)據(jù)庫也在進行轉(zhuǎn)型和迭代。AWS 數(shù)據(jù)庫作為新興數(shù)據(jù)庫廠商的代表,其數(shù)據(jù)庫產(chǎn)品更多的是為了滿足云計算(互聯(lián)網(wǎng))場景下對數(shù)據(jù)處理的需求。目前,AWS 的產(chǎn)品既包括關(guān)系型數(shù)據(jù)庫產(chǎn)品,也包括了非關(guān)系型數(shù)據(jù)庫產(chǎn)品。我們這一部分內(nèi)容,主要介紹下 Oracle 和 AWS 數(shù)據(jù)庫的最新進展。以此來對比下目前華為的 Gauss 數(shù)據(jù)庫與這兩大巨頭數(shù)據(jù)庫產(chǎn)品之間的異同。Oracle 數(shù)據(jù)庫Oracle 作為全球最大、歷史最悠久的數(shù)據(jù)庫廠商,在數(shù)據(jù)庫方面的技術(shù)領(lǐng)先型和創(chuàng)新性方面,依然保持了強大的優(yōu)勢。Oracle 數(shù)據(jù)庫自從 1978 年發(fā)布第一個版本之后,至今已經(jīng)有 41 年的時間。Oracle 在全球
49、數(shù)據(jù)庫的市場份額超過 50%。其不僅包括商用版的 Oracle DB,同時 MySQL 作為開源數(shù)據(jù)庫,也是 Oracle 旗下的產(chǎn)品。圖表17: Oracle 數(shù)據(jù)庫不斷演進資料來源:Oracle 官網(wǎng),華泰證券研究所1、Oracle DB 最新進展2019 年 Oracle 發(fā)布 Oracle DB 19C。在 2019 年 8 月 Oracle 云數(shù)據(jù)庫大會上,Oracle 介紹了其最新產(chǎn)品 Oracle DB 19C 的特性。Oracle DB 19C 可以在任何環(huán)境運行,本次版本增加的新功能包括:安全可靠的 Oracle 數(shù)據(jù)庫版本長期支持 12c 第 2 版系列(12.2、18、1
50、9)標(biāo)準(zhǔn)支持服務(wù)持續(xù)至 2023 年 3 月,擴展支持服務(wù)持續(xù)至 2026 年 3 月提供更多自治數(shù)據(jù)庫功能自動索引、實時統(tǒng)計 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)提供功能變更以改善整體客戶體驗面向物聯(lián)網(wǎng)的流插入,Active Data Guard 備用數(shù)據(jù)庫更新、針對云對象存儲的 SQL 查詢。圖表18: Oracle 數(shù)據(jù)庫 18C 的升級資料來源:Oracle 官網(wǎng),華泰證券研究所圖表19: Oracle 數(shù)據(jù)庫 19C 的升級資料來源:Oracle 官網(wǎng),華泰證券研究所針對以上這些,我們初看起來,可能還沒有太多直觀和概念的認識。我們先看下 Oracl
51、e數(shù)據(jù)庫正在做的數(shù)據(jù)庫革新。主要體現(xiàn)在幾個方面:1)自治數(shù)據(jù)庫 Autonomous Database 2)云 CloudExadata分片 Sharding區(qū) 塊 鏈 Blockchain 6)微服務(wù) Microservices我們先看下,Oracle 數(shù)據(jù)庫在自治方面的進展。首先對于“自治(Autonomous)”,我們可以理解為將 AI 技術(shù)逐步植入和迭加到已有的數(shù)據(jù)庫產(chǎn)品。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)Oracle 數(shù)據(jù)庫從 9i 版本,已經(jīng)開始實現(xiàn)“自動 Autonomous”的功能,包括自動查詢重寫和自動撤銷管理等功能。在之后的 10g、
52、11g、12c 等多個版本中,不斷加大和強化 AI 和機器學(xué)習(xí)技術(shù)的應(yīng)用。Oracle 的自治數(shù)據(jù)庫,集成了基于機器學(xué)習(xí)和人工智能技術(shù)的監(jiān)視、管理和分析功能。自治數(shù)據(jù)庫的機器學(xué)習(xí)和人工智能算法所使用的技術(shù)應(yīng)包括查詢優(yōu)化、自動內(nèi)存管理和自動存儲管理,以提供一個完全自主調(diào)優(yōu)的數(shù)據(jù)庫。自治數(shù)據(jù)庫的目標(biāo)是,實現(xiàn)數(shù)據(jù)庫調(diào)優(yōu)自動化,防止應(yīng)用中斷,并加強整個數(shù)據(jù)庫應(yīng)用的安全性。機器學(xué)習(xí)算法通過分析大量的記錄數(shù)據(jù),并標(biāo)記異常值和異常模式,幫助企業(yè)提高數(shù)據(jù)庫安全性,防止入侵者造成破壞。機器學(xué)習(xí)還可以在系統(tǒng)運行的同時自動、連續(xù)地對系統(tǒng)進行打補丁、調(diào)整、備份和升級,而無需人工干預(yù)。這將盡可能減少發(fā)生人為錯誤或惡意行
53、為的可能性,避免影響數(shù)據(jù)庫運作或安全性。對于 Oracle 數(shù)據(jù)庫,通常有這樣的看法:“Oracle 是一個關(guān)系型數(shù)據(jù)庫,因此無法管理和分析非結(jié)構(gòu)化數(shù)據(jù)”。對于以上這種看法,我們認為,對 Oracle 數(shù)據(jù)庫的認知,還停留在關(guān)系型數(shù)據(jù)庫本身的固定范式。Oracle 是一個多模型數(shù)據(jù)庫,可以支持多個計算場景下的數(shù)據(jù)管理,包括:文件、圖形、鍵值、空間地理等。因此,Oracle 數(shù)據(jù)庫可以對任何數(shù)據(jù)類型執(zhí)行 SQL 查詢。圖表20: Oracle 數(shù)據(jù)庫支持多種數(shù)據(jù)類型資料來源:Oracle 官網(wǎng),華泰證券研究所2、Oracle 數(shù)據(jù)庫的轉(zhuǎn)型為了應(yīng)對新的計算環(huán)境,新的數(shù)據(jù)格式以及新的應(yīng)用場景。目前
54、Oracle 數(shù)據(jù)庫也在逐步轉(zhuǎn)型。從單數(shù)據(jù)庫到分布式數(shù)據(jù)庫Oracle 的數(shù)據(jù)庫支持的數(shù)據(jù)計算量都比較大,為了滿足全球規(guī)模的 OLTP 應(yīng)用程序?qū)π⌒蛿?shù)據(jù)庫的需求,Oracle 利用原生分片技術(shù),將大型數(shù)據(jù)庫分成很多小型數(shù)據(jù)庫。 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)Oracle 的原生 SQL 對分片表可以做到 1000 個分片線性擴展的數(shù)據(jù)和用戶隔離到不同的分片在線添加和重組分片路由基于分片鍵,交叉分片查詢圖表21: Oracle 的分布式數(shù)據(jù)庫資料來源:Oracle 官網(wǎng),華泰證券研究所從關(guān)系型到以 Web 為中心的數(shù)據(jù)我們之前Oracle 數(shù)據(jù)庫有分歧
55、的地方在于,Oracle 的數(shù)據(jù)庫不能很好的支持互聯(lián)網(wǎng)數(shù)據(jù)。目前,Oracle 數(shù)據(jù)庫逐步向支持互聯(lián)網(wǎng)場景的數(shù)據(jù)。Oracle 利用原生 SQL 對 JSON 進行支持。JSON 是Web 新應(yīng)用程度最流行的數(shù)據(jù)格式。數(shù)據(jù)庫中的 JSON 極大簡化了應(yīng)用程序開發(fā)Oracle 將 JSON 存儲在表列中,并支持原生 SQL所有的 Oracle 功能都支持 JSON。3)從碎片化數(shù)據(jù)庫到融合數(shù)據(jù)庫目前,初創(chuàng)格式和云供應(yīng)商都在大力倡導(dǎo)單用途數(shù)據(jù)庫,其可以避免建立通用數(shù)據(jù)庫做需要的數(shù)十年的投資。能在某一個的應(yīng)用場景快速超越已有的市場領(lǐng)先者。比如,我們現(xiàn)在看到的 AWS 的數(shù)據(jù)庫,其開發(fā)了支持不用數(shù)據(jù)類
56、型和計算場景下的多樣化的數(shù)據(jù)庫。針對市場的多樣化數(shù)據(jù)場景需求和競爭對手的競爭,Oracle 開發(fā)了融合數(shù)據(jù)庫,將眾多單獨的數(shù)據(jù)庫產(chǎn)品融合到 Oracle 數(shù)據(jù)庫產(chǎn)品中,可以支持鍵值、分析、JSON 等多樣化的產(chǎn)品功能需求。圖表22: Oracle 數(shù)據(jù)庫支持多種數(shù)據(jù)類型資料來源:Oracle 官網(wǎng),華泰證券研究所 HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)AWS 數(shù)據(jù)庫AWS 數(shù)據(jù)庫的研發(fā)和推出,完全是適應(yīng)了云應(yīng)用程序和云計算場景下對數(shù)據(jù)庫新的要求。云時代應(yīng)用程序需要數(shù)據(jù)庫來存儲 TB 到 PB 級的新類型數(shù)據(jù),提供對數(shù)據(jù)的訪問(毫秒級延遲),每秒處理數(shù)百萬個請求
57、,并擴展以支持位于世界上任何地方的數(shù)百萬用戶。為了滿足這些要求,同時需要關(guān)系數(shù)據(jù)庫和非關(guān)系數(shù)據(jù)庫作為支撐。AWS 全托管的數(shù)據(jù)庫服務(wù),包括:關(guān)系數(shù)據(jù)庫(適用于事務(wù)性應(yīng)用程序)、非關(guān)系數(shù)據(jù)庫(適用于 Internet 規(guī)模應(yīng)用程序)、數(shù)據(jù)倉庫(適用于分析)、內(nèi)存數(shù)據(jù)存儲(適用于緩存和實時工作負載)、圖形數(shù)據(jù)庫(適用于構(gòu)建具有高度互聯(lián)數(shù)據(jù)的應(yīng)用程序)、時間序列數(shù)據(jù)庫(適用于衡量隨時間的變化)和分類賬數(shù)據(jù)庫(用于維護完整且可驗證的交易記錄)。1、AWS 關(guān)系型數(shù)據(jù)庫:Aurora關(guān)系數(shù)據(jù)庫存儲具有預(yù)定義架構(gòu)的數(shù)據(jù)及其之間的關(guān)系,設(shè)計用于支持 ACID 事務(wù)、維護引用完整性和數(shù)據(jù)一致性。應(yīng)用場景:傳統(tǒng)
58、應(yīng)用程序、ERP、CRM 和電子商務(wù)AWS 產(chǎn)品:Amazon Aurora MySQL、PostgreSQL Amazon RDSMySQL、PostgreSQL、MariaDB、Oracle、SQL Server Amazon Redshift2、鍵值數(shù)據(jù)庫:DynamoDB鍵值數(shù)據(jù)庫經(jīng)過優(yōu)化,以毫秒級的速度存儲和檢索大量鍵值對,避免關(guān)系數(shù)據(jù)庫的性能開銷和規(guī)模限制。應(yīng)用場景:Internet 規(guī)模的應(yīng)用程序、實時競價、購物車和客戶喜好AWS 產(chǎn)品:Amazon DynamoDB HYPERLINK / 謹請參閱尾頁重要聲明及華泰證券股票和行業(yè)評級標(biāo)準(zhǔn)3、文檔數(shù)據(jù)庫:DocumentDB文檔
59、數(shù)據(jù)庫設(shè)計用于存儲文檔等半結(jié)構(gòu)化的數(shù)據(jù),可供開發(fā)人員直觀地使用,因為數(shù)據(jù)通常以可讀文檔的形式呈現(xiàn)。應(yīng)用場景:內(nèi)容管理、個性化和移動應(yīng)用程序AWS 產(chǎn)品:Amazon DocumentDB(兼容 MongoDB)4、內(nèi)存數(shù)據(jù)庫:內(nèi)存中數(shù)據(jù)庫用于需要實時訪問數(shù)據(jù)的應(yīng)用程序。通過直接將數(shù)據(jù)存儲在內(nèi)存中,這些數(shù)據(jù)庫為不滿足于毫秒級延遲的應(yīng)用程序提供微秒級延遲。應(yīng)用場景:緩存、游戲排行榜和實時分析AWS 產(chǎn)品:Amazon ElastiCache for Redis適用于 Memcached 的 Amazon ElastiCache5、圖形數(shù)據(jù)庫對于需要讓數(shù)百萬用戶查詢和瀏覽高度互聯(lián)的圖形數(shù)據(jù)集之間的關(guān)
60、系并實現(xiàn)毫秒級延遲 的應(yīng)用,可以使用圖形數(shù)據(jù)庫。應(yīng)用場景:欺詐檢測、社交網(wǎng)絡(luò)和建議引擎AWS 產(chǎn)品:Amazon Neptune6、時間序列數(shù)據(jù)庫時間序列數(shù)據(jù)庫用于從大量隨時間變化的數(shù)據(jù)(稱為時間序列數(shù)據(jù))高效地收集、合并和提煉見解。應(yīng)用場景:IoT 應(yīng)用、開發(fā)運營和工業(yè)遙測AWS 產(chǎn)品:Amazon Timestream7、分類賬數(shù)據(jù)庫在您需要集中的可信權(quán)威方式來維護可擴展、完整、加密且可驗證的事務(wù)記錄時,可以使用分類賬數(shù)據(jù)庫。應(yīng)用場景:系統(tǒng)記錄、供應(yīng)鏈、注冊和銀行事務(wù)。AWS 產(chǎn)品:Amazon Quantum Ledger Database (QLDB) HYPERLINK / 謹請參閱
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑基礎(chǔ)工程樁基礎(chǔ)
- 2024至2030年中國工作母機專用聯(lián)軸器數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國實驗室電導(dǎo)率/電阻率計數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國雙面雙花毯數(shù)據(jù)監(jiān)測研究報告
- 經(jīng)管營銷企業(yè)資產(chǎn)損失所得稅稅前扣除管理辦法講解
- 探究函數(shù)與方程-深入理解代數(shù)與解題技巧
- 2024年中國高強度鋼結(jié)構(gòu)樓承板市場調(diào)查研究報告
- 2024年中國蒙娜麗莎工藝品市場調(diào)查研究報告
- 2024年中國立式剝皮機市場調(diào)查研究報告
- 急診病歷書寫標(biāo)準(zhǔn)化研究計劃
- 渤海小吏講中國史:秦并天下
- 工程監(jiān)理服務(wù)的設(shè)計和開發(fā)控制程序
- 治安管理處罰法共ppt
- 初中政治人教版九年級上冊《中國人中國夢》教育教學(xué)課件
- 小學(xué)生少先隊中隊長競選PPT
- 余熱發(fā)電專業(yè)考試500題及答案
- 機械制圖習(xí)題集答案(第六版)大連理工大學(xué)高等教育課件
- 依戀理論心理學(xué)培訓(xùn)課件
- 醫(yī)院口腔科院感與疾控綜合考評表
- 起重機維修服務(wù)方案
- 2023年上海華漕鎮(zhèn)人口協(xié)管員招考聘用筆試題庫含答案詳解版
評論
0/150
提交評論