弘則研究:生成式A1驅(qū)動(dòng)向量數(shù)據(jù)庫(kù)加速發(fā)展_第1頁
弘則研究:生成式A1驅(qū)動(dòng)向量數(shù)據(jù)庫(kù)加速發(fā)展_第2頁
弘則研究:生成式A1驅(qū)動(dòng)向量數(shù)據(jù)庫(kù)加速發(fā)展_第3頁
弘則研究:生成式A1驅(qū)動(dòng)向量數(shù)據(jù)庫(kù)加速發(fā)展_第4頁
弘則研究:生成式A1驅(qū)動(dòng)向量數(shù)據(jù)庫(kù)加速發(fā)展_第5頁
已閱讀5頁,還剩139頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

弘則研究科技組電話:021-6194-6708核心觀點(diǎn)提示?toB生成式AI應(yīng)用均需外掛知識(shí)庫(kù)以提升大模型精度,將驅(qū)動(dòng)向量數(shù)據(jù)庫(kù)的爆發(fā)。向量數(shù)據(jù)庫(kù)是非結(jié)構(gòu)化數(shù)據(jù)的特殊形式,它的核心是將各種數(shù)據(jù)(如文檔、音頻和視頻)轉(zhuǎn)化為空間向量進(jìn)行相似性搜索以提高不同數(shù)據(jù)類型的搜索效率和準(zhǔn)確性,這使其在AI和深度學(xué)習(xí)領(lǐng)域中有著廣泛的應(yīng)用。生成式AI出現(xiàn)后,尤其是在toB場(chǎng)景中需要應(yīng)用到向量數(shù)據(jù)庫(kù)在大模型上外掛“企業(yè)知識(shí)庫(kù)”,企業(yè)內(nèi)部數(shù)據(jù)將被存儲(chǔ)在向量數(shù)據(jù)庫(kù)中,以提升大模型精度。?向量數(shù)據(jù)庫(kù)潛在市場(chǎng)空間是傳統(tǒng)結(jié)構(gòu)化關(guān)系型數(shù)據(jù)庫(kù)的數(shù)倍達(dá)到千億美元。據(jù)信通院統(tǒng)計(jì)數(shù)據(jù),全球數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模在2020年為671億美元,到2025年有望達(dá)到798億美元,CAGR3.5%,估算關(guān)系型數(shù)據(jù)庫(kù)全球龍頭Oracle收入規(guī)模小幾百億美元。僅考慮現(xiàn)有非結(jié)構(gòu)化數(shù)據(jù)的向量化處理,估算需要的存儲(chǔ)空間增量為之前的數(shù)倍。未來隨著生成式AI應(yīng)用增量數(shù)據(jù)的爆發(fā),對(duì)于向量數(shù)據(jù)庫(kù)的需求會(huì)更大。?產(chǎn)業(yè)處在發(fā)展早期,尚未形成寡頭壟斷,廠商具備錯(cuò)位競(jìng)爭(zhēng)優(yōu)勢(shì)。全球市場(chǎng)不同背景廠商以不同商業(yè)模式切入向量數(shù)據(jù)庫(kù)賽道。美股上市公司中,MongoDB于今年12月在自身非結(jié)構(gòu)化司均對(duì)向量數(shù)據(jù)庫(kù)業(yè)務(wù)前景非常樂觀。A股上市公司中,星環(huán)科技于今年5月推出向量數(shù)據(jù)庫(kù)Hippo,目前已迭代到1.2版本,已有客戶開始試用。向量數(shù)據(jù)庫(kù)作為B端GenAI落地剛需,已經(jīng)進(jìn)入到商業(yè)化推廣和MongoDB),月,英特爾與星環(huán)科技聯(lián)合發(fā)布AIGC向量數(shù)據(jù)庫(kù)解決方案銀行和券商等客戶正在POC行業(yè)大模型和向量數(shù)據(jù)庫(kù)市值(億美元,億元)過去財(cái)年(FY23,2022)當(dāng)前財(cái)年(FY24,2023)下一財(cái)年(FY25,2024)收入3年CAGR毛利率PS收入預(yù)期PS收入預(yù)期PSMongoDB45%73%2126%--36%72%717%6--星環(huán)科技29%57%2442%42%頭并起,切分不同客戶群體IBMDB2是為大型機(jī)設(shè)計(jì)的關(guān)系數(shù)據(jù)庫(kù)采用關(guān)系數(shù)據(jù)庫(kù)模型,支持SQL查系統(tǒng),支持SQL查詢,并提供了一通過與Windows操作系統(tǒng)的緊密集Windows操作系統(tǒng)綁定70-80年代:Oracle最初憑借技術(shù)和戰(zhàn)略決策領(lǐng)先IBM推出產(chǎn)品搶占市場(chǎng),微軟起步較晚且主要客群集中在中小企業(yè)IBM開始構(gòu)建SystemR,歷史上第一個(gè)使用SQL查詢語言的數(shù)據(jù)時(shí)IBM的戰(zhàn)略重心仍在硬件業(yè)務(wù)繞IBM產(chǎn)品做協(xié)同工作V2,后續(xù)拿到CIA價(jià)值5萬美元IBMSQL查詢語言SQL查詢語言硬件+嵌入軟件,認(rèn)為價(jià)值量應(yīng)該通過硬件體現(xiàn)?System?SystemR在理論和研究上引入了主要關(guān)注數(shù)據(jù)存儲(chǔ)和基本的SQL庫(kù)的核心概念,如R樹索引、提供了基本的SQL查詢功能,沒580-90年代:計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的大規(guī)模應(yīng)用驅(qū)動(dòng)關(guān)系型數(shù)據(jù)庫(kù)繼續(xù)向高性能、高可靠性方向發(fā)展復(fù)雜。企業(yè)開始使用ERP、CRM等復(fù)雜的業(yè)務(wù)應(yīng)用SQL成為了標(biāo)準(zhǔn)的查詢語言,被廣泛應(yīng)用于各種數(shù)據(jù)庫(kù)系統(tǒng)。企業(yè)需要支持SQL的數(shù)據(jù)庫(kù)系統(tǒng),以確?個(gè)人計(jì)算機(jī)數(shù)據(jù)庫(kù)的興起:在IBMPC之前,數(shù)據(jù)庫(kù)主要運(yùn)行在大型機(jī)和小型機(jī)上。但隨著IBMPC的普及,開始出現(xiàn)為個(gè)人計(jì)算機(jī)設(shè)計(jì)的數(shù)據(jù)庫(kù)系統(tǒng),如dBASE、FoxPro和Paradox。這些數(shù)能是另一臺(tái)更強(qiáng)大的計(jì)算機(jī))負(fù)責(zé)數(shù)據(jù)管理。這種分離使得?數(shù)據(jù)庫(kù)工具和應(yīng)用的發(fā)展:隨著IBMPC的普及,開始出現(xiàn)了大量的數(shù)據(jù)庫(kù)工具和應(yīng)用,如查詢工具、報(bào)表生成器和數(shù)據(jù)庫(kù)開發(fā)工具。這些工具使得數(shù)據(jù)庫(kù)開發(fā)和管理變得更加簡(jiǎn)?數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)化:IBMPC的普及促進(jìn)了數(shù)據(jù)庫(kù)技術(shù)的標(biāo)準(zhǔn)化。SQL成為了標(biāo)準(zhǔn)的查詢語言,被廣泛應(yīng)用于各種數(shù)據(jù)庫(kù)系統(tǒng)。這使得開發(fā)者可以使用統(tǒng)一的語言和工具開發(fā)和管理數(shù)據(jù)庫(kù),而不用擔(dān)心不同數(shù)據(jù)?680-90年代:有力競(jìng)爭(zhēng)者增加,但最終輸在商業(yè)策略退出市場(chǎng)dBASEIBM???被SAP于2013年收購(gòu)?????2001年被IBM收購(gòu),其技術(shù)被整合到DB2?????????????????成為RDBMS成為RDBMS市場(chǎng)的領(lǐng)導(dǎo)主要數(shù)據(jù)庫(kù)為DB215Or????5?0?在NT-based5?0?IBM競(jìng)爭(zhēng),依賴操作系統(tǒng)?7進(jìn)入到21世紀(jì)之后,分布式、非結(jié)構(gòu)化、開源、轉(zhuǎn)云成為重要趨技術(shù)進(jìn)步:存儲(chǔ)和處理非結(jié)構(gòu)化數(shù)據(jù)的技術(shù)(如Hadoop、NoSQL數(shù)據(jù)庫(kù))得到了廣泛的研究和應(yīng)用運(yùn)維簡(jiǎn)化:云服務(wù)提供了數(shù)據(jù)庫(kù)的自動(dòng)管理全球化需求:隨著業(yè)務(wù)的全球化,企業(yè)需要非結(jié)構(gòu)化、開源和云數(shù)據(jù)庫(kù)趨勢(shì)出現(xiàn)后,在新興領(lǐng)域出現(xiàn)大量新進(jìn)入者,比如MongoDB、Redis、傳統(tǒng)的結(jié)構(gòu)化關(guān)系型數(shù)據(jù)庫(kù)最重要的ACID特性使其在特定應(yīng)用場(chǎng)景中非常重要ACIDACID事務(wù)特性??一旦事務(wù)被確認(rèn)一旦事務(wù)被確認(rèn),它的效果是永久的,即使在系統(tǒng)故障、崩潰或重啟后也不會(huì)丟失這通常通過將事務(wù)日志持久化到存儲(chǔ)介質(zhì)上來實(shí)現(xiàn)??一致性一致性AtomicityConsistency這意味著事務(wù)被視為一個(gè)單一的、原子性?事務(wù)確保數(shù)據(jù)庫(kù)從一個(gè)一致的狀態(tài)轉(zhuǎn)移到另一個(gè)一致的狀A(yù)tomicityConsistency這意味著事務(wù)被視為一個(gè)單一的、原子性?事務(wù)確保數(shù)據(jù)庫(kù)從一個(gè)一致的狀態(tài)轉(zhuǎn)移到另一個(gè)一致的狀態(tài)。在事務(wù)開始之前和結(jié)束之后,所有的業(yè)務(wù)規(guī)則都必須保持為真?例如,銀行轉(zhuǎn)賬應(yīng)確保轉(zhuǎn)賬前后的總金額保持不變例如,如果在銀行轉(zhuǎn)賬過程中,從一個(gè)賬戶扣款成功,但向另一個(gè)賬戶存款失敗,整個(gè)事務(wù)都會(huì)被回滾,確保資金的完整性DurabilityDurability?這確保并發(fā)事務(wù)的執(zhí)行不會(huì)互相干擾。每個(gè)事務(wù)應(yīng)該在一個(gè)隔離的環(huán)境中運(yùn)行,好像沒有其他事務(wù)并發(fā)執(zhí)行一樣例如讀未提交、讀已提交、可重復(fù)讀和串行化ACID特性在許多應(yīng)用場(chǎng)景中非常重要,尤其是在需要確保數(shù)據(jù)完整性和一致性的金融、醫(yī)療和零售等隨著大數(shù)據(jù)、云計(jì)算等技術(shù)成熟,關(guān)系型數(shù)據(jù)庫(kù)最重要的ACID特性開始制約其發(fā)展互聯(lián)網(wǎng)、社交媒體、物聯(lián)網(wǎng)和移動(dòng)設(shè)備導(dǎo)致RDBMS在處理PB級(jí)別的數(shù)據(jù)時(shí)可能會(huì)遇到性能瓶頸互聯(lián)網(wǎng)應(yīng)用和服務(wù)需要能夠支持?jǐn)?shù)百萬甚至數(shù)響應(yīng)。傳統(tǒng)的RDBMS可能難以滿足這種高并發(fā)、低延遲的需求云計(jì)算的興起要求數(shù)據(jù)庫(kù)能夠輕松地在多個(gè)服務(wù)器和數(shù)據(jù)中心之間擴(kuò)展。傳統(tǒng)的RDBMS 可能更適合其他數(shù)據(jù)模型。NoSQL數(shù)據(jù)庫(kù)提供了文檔、鍵值、列族和圖等多種數(shù)據(jù)模型,在互聯(lián)網(wǎng)和移動(dòng)應(yīng)用中,數(shù)據(jù)結(jié)構(gòu)可能經(jīng)常變化。傳統(tǒng)的RDBMS需要固定的表結(jié)構(gòu),而NoSQL數(shù)據(jù)庫(kù)通常更加靈活,允許數(shù)據(jù)結(jié)構(gòu)的動(dòng)態(tài)變化RDBMS可能不具備這種分布式和全球化的能力開源和NoSQL數(shù)據(jù)庫(kù)通常具有較低的總體擁有成本(TCO尤其是在硬件、許可和維分布式:基于CAP理論,在一致性、分區(qū)容錯(cuò)性和可用性三者之CAP理論CAP理論的的某個(gè)數(shù)據(jù)項(xiàng)在節(jié)點(diǎn)A上被修改,那么在CAP理論的核心觀點(diǎn)是,分布式系統(tǒng)在面對(duì)網(wǎng)絡(luò)分區(qū)時(shí),必須在一致性和可用性之間做出選擇。例如,一些系統(tǒng)可能會(huì)提供可調(diào)整的一致性級(jí)別,允許開發(fā)者根據(jù)需要分布式:集中式數(shù)據(jù)庫(kù)主數(shù)據(jù)中心來保證ACID特性,而分布式數(shù)據(jù)庫(kù)犧牲掉主數(shù)據(jù)中心以加速數(shù)據(jù)流轉(zhuǎn)A地發(fā)出匯款C地收到匯款A(yù)地發(fā)出匯款C地收到匯款異地?cái)?shù)據(jù)中心進(jìn)行同步備份。性能上會(huì)有瓶頸,Oracle通過RAC技術(shù)提升寫入A地?cái)?shù)據(jù)中心,修改寫入A地?cái)?shù)據(jù)中心,修改C地收到匯款A(yù)地發(fā)出匯款!A地?cái)?shù)據(jù)中心B地主數(shù)據(jù)中心C地?cái)?shù)據(jù)中心C地收到匯款A(yù)地發(fā)出匯款!通常使用某種形式的數(shù)據(jù)復(fù)制策略(例如,基于quorum的策略)來確保數(shù)據(jù)的一致性。A地節(jié)點(diǎn)會(huì)嘗試與其他節(jié)點(diǎn)(例如C地節(jié)點(diǎn))同步這個(gè)更改。這通常涉及到一個(gè)“多數(shù)同意”的過程,其中多數(shù)節(jié)點(diǎn)(不僅僅是A和C)必須同意更改才能繼續(xù)。一旦達(dá)到了A地?cái)?shù)據(jù)中心所需的quorum,C地?cái)?shù)據(jù)中心的節(jié)點(diǎn)會(huì)修改對(duì)應(yīng)收款人信息C地?cái)?shù)據(jù)中心分布式:相較于集中式數(shù)據(jù)庫(kù),可以提供更強(qiáng)的擴(kuò)展性、更低的網(wǎng)絡(luò)延遲和更強(qiáng)的安全性A地發(fā)起匯款請(qǐng)求,需要首先發(fā)送到B地中心數(shù)據(jù)庫(kù),然后再將結(jié)果返回到A和C地,這個(gè)分布式:相比集中式數(shù)據(jù)庫(kù),現(xiàn)階段分布式受制于數(shù)據(jù)一致性、遷移成本等,大規(guī)模商用仍存在落地難度分布式數(shù)據(jù)庫(kù)的設(shè)計(jì)和管理通常比單一節(jié)點(diǎn)的數(shù)據(jù)庫(kù)更復(fù)雜。根據(jù)CAP理論,分布式系統(tǒng)必須在一致性和可用性之間做出權(quán)衡。某些業(yè)務(wù)場(chǎng)景,如金融交易,可傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)通常有一個(gè)成熟的工具和生態(tài)系統(tǒng),包括備份、監(jiān)控、?一些新興的分布式數(shù)據(jù)庫(kù),如CockroachDB和TiDB,正在獲得越來越多的關(guān)注和采用,這表明分布非結(jié)構(gòu)化:互聯(lián)網(wǎng)催生不同數(shù)據(jù)類型的數(shù)據(jù)爆發(fā),傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)面臨困境?文檔型:使用JSON或BSON格式存儲(chǔ)數(shù)據(jù),每個(gè)文檔可以有不同的結(jié)構(gòu)?提供豐富的查詢API和語言,如MongoDB的查詢語言CAP理論傳統(tǒng)RDBMS的特點(diǎn)和挑戰(zhàn)NoSQL數(shù)據(jù)庫(kù)的特點(diǎn)和優(yōu)勢(shì)為了保證ACID特性,采用單一、集中式的架構(gòu)。雖然可以可能經(jīng)常變化,這使得RDBMS在適應(yīng)這些變化上面臨挑戰(zhàn)為了保證ACID特性,可能需要在事務(wù)處理中加鎖,這可能放寬了ACID的一些要求,采用最終一致性模云數(shù)據(jù)庫(kù):2012年左右移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)發(fā)展驅(qū)動(dòng)企業(yè)向彈性移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)驅(qū)使企業(yè)加速上云?CMO非常喜歡公共云。毫無疑問,各地的營(yíng)銷部門都在內(nèi)部IT之外部署Web和移動(dòng)應(yīng)用程序來與進(jìn)行大數(shù)據(jù)分析,因?yàn)閮?nèi)部IT缺乏時(shí)間、意愿或技能來構(gòu)建此類系統(tǒng)。這在IT參與規(guī)劃和的支持,GE正忙于在廣泛的工業(yè)產(chǎn)品中嵌入數(shù)百萬個(gè)傳感器。該平臺(tái)的一個(gè)關(guān)鍵組件是GemFire事?云客戶端很快就會(huì)占據(jù)統(tǒng)治地位。云的最終目標(biāo)與任何IT基礎(chǔ)設(shè)施相同:交付應(yīng)用程序。但在瀏覽混合云需求開始出現(xiàn)踐中,“爆發(fā)”到云端往往是不切實(shí)際的。但如果至少能管理一部分本地和比2010年增長(zhǎng)84.4%。排名前兩位的供應(yīng)商CATechnologies云數(shù)據(jù)庫(kù):超融合技術(shù)的成熟極大簡(jiǎn)化混合云環(huán)境的部署和管理分散式:服務(wù)器主要使用其內(nèi)部的磁盤或外部的直連存儲(chǔ)(DAS)存儲(chǔ)瓶頸:性能、容量等要求的提高整合式:直連存儲(chǔ)→集中式共享存儲(chǔ)模式計(jì)算瓶頸:服務(wù)器增多、資源利用率、管理成本邊際效應(yīng)出現(xiàn)計(jì)算虛擬化:服務(wù)器虛擬化提高資源利用率和運(yùn)維效率;但服務(wù)器與存儲(chǔ)之間使用的仍是三層架構(gòu)法提供靈活的縱向及橫向擴(kuò)展能力↓存儲(chǔ)擴(kuò)張瓶頸:存儲(chǔ)設(shè)備數(shù)量遞增,傳統(tǒng)架構(gòu)無法提供靈活的縱向及橫向擴(kuò)展能力物理融合:將服務(wù)器、存儲(chǔ)、存儲(chǔ)網(wǎng)絡(luò)交換機(jī)放置在同一個(gè)機(jī)架中以模塊方式銷售。I/O瓶頸:存儲(chǔ)未虛擬化,仍遭遇I/O瓶頸超融合:存儲(chǔ)虛擬化摒棄了三層架構(gòu)固有的問題,支持以更小的顆粒進(jìn)行橫向擴(kuò)展,更高的可用性和可擴(kuò)展性,很快成為新建、更新數(shù)據(jù)中心時(shí)的首選方案。?簡(jiǎn)化管理:超融合基礎(chǔ)設(shè)施(HCI)是一種將計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)功能集成在一起的基礎(chǔ)設(shè)施,可以簡(jiǎn)化IT管理,使部署和運(yùn)行應(yīng)用程序更加容易。這種模式對(duì)于混合云環(huán)?靈活性和可擴(kuò)展性:HCI通過提供一種可以輕松擴(kuò)展的基礎(chǔ)設(shè)施,支持了混合云環(huán)境的靈活性和可擴(kuò)展性。當(dāng)需要更多的計(jì)算或存儲(chǔ)資源時(shí),可以簡(jiǎn)單地添加更多的HCI節(jié)點(diǎn),而不需要進(jìn)行復(fù)雜的硬件升級(jí)或配置更改?一致的操作體驗(yàn):HCI可以提供一種一致的操作體驗(yàn),無論應(yīng)用程序是運(yùn)行在本地的HCI環(huán)境中,還是在云環(huán)境中Azure云上數(shù)據(jù)庫(kù)的混合云解決方案發(fā)言引用發(fā)言引用FY10Q4進(jìn)一步提高本地WindowsServer,SQLServer和SystemCenter產(chǎn)品與Azure平臺(tái)之間的一致性FY15Q2商業(yè)云連續(xù)第六個(gè)季度實(shí)現(xiàn)三位數(shù)收入增長(zhǎng),高級(jí)Azure服務(wù)的收入大幅增長(zhǎng)FY11Q1WindowsAzure訂閱量環(huán)比增長(zhǎng)40%FY15Q4我們看到SQL的大量采用,所以這就是AzureDB,機(jī)器學(xué)習(xí)即服務(wù)。FY11Q4WindowsAzure繼續(xù)擁有強(qiáng)勁的客戶勢(shì)頭,收入增長(zhǎng)加速FY16Q1SQL的這一里程碑與我們?cè)贏zure中的快速增長(zhǎng)及其在云魔力象限中的位置并列FY13Q4增加25%的企業(yè)客戶,超過50%的財(cái)富500強(qiáng)企業(yè)使用AzureFY16Q2我們的服務(wù)器不是一個(gè)獨(dú)特的部分,實(shí)際上是我們?cè)频倪吘?,我們正在通過AzureStack之類的東西來構(gòu)建FY14Q2Azure客戶凈席位增長(zhǎng)超過100%,70%的財(cái)富500強(qiáng)公司使用至少一項(xiàng)云服務(wù)FY16Q3我們?cè)贏zure中的高價(jià)值服務(wù)中添加了更多差異化服務(wù),即人工智能、IoT和業(yè)務(wù)分析FY14Q3Azure收入增長(zhǎng)150%以上,得益于新客戶和使用率的增加FY16Q4我們顯然支持我們所有的服務(wù)器。我們的每個(gè)服務(wù)器產(chǎn)品都有云注冊(cè)權(quán)限,無論是SQL,還是WindowsServerFY14Q4商業(yè)云收入增長(zhǎng)147%,Azure大幅增長(zhǎng),今年存儲(chǔ)翻了一番,計(jì)算量增加了兩倍。隨著核心服務(wù)的使用量增加,超過50%的Azure客戶現(xiàn)在也在使用更高價(jià)值的服務(wù)FY17Q1這就是SQLServer2016所代表的,因此我們擁有這些獨(dú)特的功能,例如能夠在SQL2016中將數(shù)據(jù)庫(kù)中的單個(gè)表一直延伸到云中,以獲得無限的表容量,然后讓您的應(yīng)用程序和查詢工作FY15Q1Azure實(shí)現(xiàn)了強(qiáng)勁增長(zhǎng);初創(chuàng)公司和ISV喜歡開放靈活的方法,并且正在Azure上快速構(gòu)建,40%的收入來自初創(chuàng)公司和ISV?Azure最初主要針對(duì)的是大型企業(yè)和政府機(jī)構(gòu),這些用戶通常已經(jīng)是微軟的現(xiàn)?微軟的Hyper-V虛擬化技術(shù)是一個(gè)由微軟開發(fā)的虛擬化平臺(tái),可以作為獨(dú)立產(chǎn)品使用,也可以作為WindowsServer的一個(gè)功能。虛擬化技術(shù)和其他遷移工具使云數(shù)據(jù)庫(kù):作為云廠商提供的云上打包服務(wù)之一,很難單獨(dú)量化拆分?jǐn)?shù)據(jù)庫(kù)產(chǎn)品帶來的影響,但其一定隨著云業(yè)務(wù)同向成長(zhǎng)250200500-AWSGoogle阿里云——AWSyoyGoogleyoy——Azureyoy阿里云yoy-龍頭AWS云業(yè)務(wù)收入規(guī)模千億美元,微軟600億美元,早期數(shù)據(jù)只能追溯到2015年15Q115Q215Q315Q416Q116Q216Q316Q417Q117Q217Q317Q418Q118Q218Q318Q419Q119Q219Q319Q420Q120Q220Q320Q421Q121Q221Q321Q422Q122Q222Q322Q423Q123Q215Q115Q215Q315Q416Q116Q216Q316Q417Q117Q217Q317Q418Q118Q218Q318Q419Q119Q219Q319Q420Q120Q220Q320Q421Q121Q221Q321Q422Q122Q222Q322Q423Q123Q2200%180%160%140%120%100%80%60%40%20%0%-20%開源:對(duì)于廠商來說,開源更多是戰(zhàn)略選擇而非被迫轉(zhuǎn)型通過提供開源版本的產(chǎn)品,廠商可以迅速擴(kuò)大其市場(chǎng)份額,吸引更多的用戶。這開源模式鼓勵(lì)社區(qū)的參與,這意味著廠商可以利用全球范圍內(nèi)的速了產(chǎn)品的開發(fā)和改進(jìn)且避免“重復(fù)造輪子”開源有助于建立行業(yè)標(biāo)準(zhǔn),從而吸引更多的通過開源某些關(guān)鍵技術(shù)或平臺(tái),廠商可以策略性減少競(jìng)爭(zhēng),開源項(xiàng)目通常吸引了大量的開發(fā)者和貢獻(xiàn)者。這為廠商提供相比國(guó)內(nèi),海外企業(yè)多采用多云策略,因此云廠商戰(zhàn)略重心集中?避免供應(yīng)商鎖定:企業(yè)不想被單一廠商鎖定,可以?風(fēng)險(xiǎn)分散:使用多云服務(wù)分散風(fēng)險(xiǎn),確保當(dāng)一個(gè)服?滿足特定需求:不同的云服務(wù)提供商可能在某些特?合規(guī)性和數(shù)據(jù)主權(quán):在某些地區(qū)或行業(yè),數(shù)據(jù)可能有軟件都是以嵌入硬件銷售的方式體現(xiàn)價(jià)值)CPU)開源:增值功能+技術(shù)支持模式?額外還有服務(wù)收費(fèi),比如數(shù)據(jù)維護(hù)服務(wù)、更新、安全補(bǔ)丁、技術(shù)支持等云托管模式(MongoDB)相比其他類型數(shù)據(jù)庫(kù),向量數(shù)據(jù)庫(kù)更擅長(zhǎng)進(jìn)行大數(shù)據(jù)量和多數(shù)據(jù)類型的快速檢索向量數(shù)據(jù)庫(kù)關(guān)系型數(shù)據(jù)庫(kù)非結(jié)構(gòu)化數(shù)據(jù)庫(kù)數(shù)據(jù)存儲(chǔ)專為高維向量數(shù)據(jù)優(yōu)化結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)靈活數(shù)據(jù)模型,支持非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)查詢效率高效的相似性搜索和語成熟的查詢語言(SQL),通常支持簡(jiǎn)單的查詢,義搜索適合結(jié)構(gòu)化查詢適合大數(shù)據(jù)分析擴(kuò)展性通常支持水平擴(kuò)展,適有些支持水平擴(kuò)展,但高度的水平擴(kuò)展能力,合大規(guī)模數(shù)據(jù)更多的是垂直擴(kuò)展適合大數(shù)據(jù)環(huán)境數(shù)據(jù)模型通常為高維向量嚴(yán)格的模式和完整性約束靈活的數(shù)據(jù)模型,無需預(yù)定義模式事務(wù)支持一般不支持或支持有限完全支持事務(wù)通常不支持或支持有限應(yīng)用場(chǎng)景推薦系統(tǒng)、圖像/聲音搜金融系統(tǒng)、企業(yè)資源計(jì)社交媒體平臺(tái)、大數(shù)據(jù)索、語義文本搜索劃、客戶關(guān)系管理分析、物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)通常較新,但正在迅速發(fā)展非常成熟,有多年的發(fā)展歷史通常較新,但在大數(shù)據(jù)和云計(jì)算領(lǐng)域有快速的發(fā)展所有數(shù)據(jù)格式均可以轉(zhuǎn)換成高維向量,通過向量相似性比較進(jìn)行?向量數(shù)據(jù)是一種數(shù)學(xué)表達(dá)形式,它由一組有序的數(shù)值組成,這些數(shù)值可以表示空間中的一個(gè)點(diǎn)、一個(gè)方向或者一個(gè)速度等。在向量數(shù)據(jù)中,每個(gè)數(shù)值都有其特定的?通過計(jì)算兩個(gè)向量之間的距離或夾角,我們可以得到這兩個(gè)向量的相似性。這個(gè)特性在很多應(yīng)用中都非常有用,例如在推薦系統(tǒng)中,我們可以通過計(jì)算用戶的興趣向量和商品性,來推薦用戶可能感興趣的商品。越相似的向量在?定性判斷向量化數(shù)據(jù)量大?。阂曨l>音頻≥文檔語義搜索不僅是匹配關(guān)鍵字,而是試圖理解真正意圖,帶來更準(zhǔn)確、更有上下文的搜索結(jié)果向量數(shù)據(jù)庫(kù)廠商主要提供向量化工具、向量和源數(shù)據(jù)的鍵值對(duì)存儲(chǔ)和查詢?鍵值對(duì)存儲(chǔ):同時(shí)存儲(chǔ)向量和源數(shù)據(jù)向量數(shù)據(jù)庫(kù)技術(shù)原理開源通用,用戶側(cè)對(duì)于技術(shù)差異的感知并不明顯,更多比拼生態(tài)社區(qū)、服務(wù)等軟性能力?召回率:指的是有多少個(gè)不同形式、不同提是召回率最高的,能做到60%以上,一般開源的word2vector模型只能做到30%-40%?從用戶感受上,細(xì)化向量化工具的維度在確性做到98%還是99%基本在使用上沒什?是否支持一些查詢的索引類型,比如歐式距?技術(shù)原理基本通用,現(xiàn)在門檻沒那么高?向量數(shù)據(jù)庫(kù)所提供的向量化工具、向量比對(duì)能力是不具備技術(shù)層面硬壁壘的,技術(shù)原理基本通用且開源,比如向量化工具基本可以在GitHub上下載源代碼?國(guó)內(nèi)廠商從團(tuán)隊(duì)啟動(dòng),人員規(guī)模不過百,可以平移NoSQL團(tuán)隊(duì)過來,基本三個(gè)月就可以出產(chǎn)品?廠商核心差異在于開源生態(tài)社區(qū):海外開源的起家都在于開源社區(qū)綁定了大量的程序員。像MongoDB、MySQL這些廠商,初級(jí)開發(fā)者、剛畢業(yè)的大學(xué)生這類群體,基本都比較通用,在大學(xué)課程里就包含這些廠商的知識(shí)。大量開發(fā)者會(huì)支持后續(xù)的產(chǎn)品迭代。MongoDB在傳統(tǒng)NoSQL領(lǐng)域所有測(cè)試任務(wù)中占主導(dǎo)地位;DB-Engine則側(cè)重品牌認(rèn)知的排名DB-DB-Engine向量數(shù)據(jù)庫(kù)榜單(MTEB)。MTEB涵蓋8個(gè)嵌入任務(wù),涵蓋總共58個(gè)數(shù)據(jù)集和112種語言。通過對(duì)MTEB上33個(gè)模型的基DB-Engine的分?jǐn)?shù)計(jì)算方法生成式AI的出現(xiàn)驅(qū)動(dòng)向量數(shù)據(jù)庫(kù)發(fā)展,軟件應(yīng)用均需要借助向量數(shù)據(jù)庫(kù)進(jìn)行相似性搜索,進(jìn)而生成更精準(zhǔn)回答互的指令,例如“我想預(yù)訂酒店”GPT模型能力為“預(yù)訂酒店”與服務(wù)的API通信、數(shù)據(jù)傳遞、認(rèn)訂服務(wù)的API來發(fā)送預(yù)訂請(qǐng)求大模型的應(yīng)用場(chǎng)景中,無論C/B端,只要涉及到個(gè)性化、專業(yè)化場(chǎng)景,均需要應(yīng)用到向量數(shù)據(jù)庫(kù)C端B端訓(xùn)練不管C/B端推理場(chǎng)景,多輪對(duì)話場(chǎng)景必須要用到向量數(shù)據(jù)庫(kù)以保存對(duì)話內(nèi)容,在未來隨著生成式AI將大規(guī)模落地,作為剛需配套的向量數(shù)據(jù)庫(kù)賽道將迎來加速,目前國(guó)內(nèi)外市場(chǎng)均處在較早期階段,市場(chǎng)競(jìng)爭(zhēng)格局極分散廠商有Milvus、Pinecone(為ChatGPT提供向量數(shù)據(jù)庫(kù))等;傳統(tǒng)非結(jié)構(gòu)化數(shù)據(jù)庫(kù)廠商如MongoDB也在今廠如阿里、騰訊、華為等均具備向量數(shù)據(jù)庫(kù)產(chǎn)品以補(bǔ)全自C端訓(xùn)練場(chǎng)景中,不需要對(duì)原數(shù)據(jù)集進(jìn)行保存,形成的知識(shí)會(huì)以參數(shù)文件的形式進(jìn)行存儲(chǔ),因此不需要向量數(shù)據(jù)庫(kù)提供教材,喂數(shù)據(jù)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)形成知識(shí)儲(chǔ)存在神經(jīng)網(wǎng)絡(luò)訓(xùn)練大模型時(shí),不斷把知識(shí)放進(jìn)去增加模型的維度和參數(shù),然后擬合成模型原有訓(xùn)練數(shù)據(jù)集的2%以上,才會(huì)愿意用微調(diào)的方式,增加的數(shù)據(jù)太少對(duì)通用大模型造不成影響。微調(diào)也有兩種方式,可以選擇全參數(shù)調(diào)整也可以選擇凍結(jié)一部分參數(shù)進(jìn)行調(diào)整。這種方式都B端訓(xùn)練場(chǎng)景中,企業(yè)內(nèi)部知識(shí)數(shù)據(jù)會(huì)存儲(chǔ)在向量數(shù)據(jù)庫(kù)中,用來提升大模型的回答精確度B端“嵌入”訓(xùn)練B端“嵌入”訓(xùn)練2)限制大模型泛化能力來提升問答準(zhǔn)確度:比如銀行智能客服場(chǎng)景,開卡、提額度等案唯一的。當(dāng)客戶提出問題,優(yōu)先去向量數(shù)據(jù)庫(kù)搜索唯一的答案,然后C/B端推理場(chǎng)景中,多輪對(duì)話場(chǎng)景必須要用到向量數(shù)據(jù)庫(kù),且數(shù)據(jù)庫(kù)用量會(huì)隨著對(duì)話數(shù)據(jù)量同向增長(zhǎng)C端推理場(chǎng)景C端推理場(chǎng)景本都需要向量數(shù)據(jù)庫(kù)來存儲(chǔ)每一個(gè)用戶的上下文回答,以便能讓大模型越個(gè)用戶。因?yàn)槊恳粋€(gè)用戶長(zhǎng)期的提問數(shù)據(jù)是不能內(nèi)化到大語言模型里的,要一個(gè)地方去存儲(chǔ)這些數(shù)據(jù),這個(gè)就是通過向量數(shù)據(jù)?C端場(chǎng)景可能會(huì)更強(qiáng)調(diào)對(duì)于多輪對(duì)話的長(zhǎng)期存儲(chǔ),數(shù)據(jù)量增長(zhǎng)會(huì)推動(dòng)向量數(shù)據(jù)庫(kù)需求增長(zhǎng)。相當(dāng)于每個(gè)C端用戶在通過多輪對(duì)話的方式去訓(xùn)練專屬于自己的個(gè)人助理,可以了解健身數(shù)據(jù)、飲食數(shù)據(jù)等個(gè)人習(xí)慣和偏好,這樣大模以C端場(chǎng)景會(huì)更希望多輪對(duì)話的信息可以長(zhǎng)期存儲(chǔ),這些數(shù)據(jù)量的增長(zhǎng)會(huì)推動(dòng)向量數(shù)B端推理場(chǎng)景B端推理場(chǎng)景要調(diào)用向量數(shù)據(jù)庫(kù)進(jìn)行回答)關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模大幾百億美元;受到生成式AI驅(qū)動(dòng)的向量數(shù)據(jù)庫(kù)應(yīng)用場(chǎng)景更多,潛在市場(chǎng)空間將超過關(guān)系型數(shù)據(jù)庫(kù)非關(guān)系型數(shù)據(jù)庫(kù)關(guān)系型數(shù)據(jù)庫(kù)關(guān)系型數(shù)據(jù)庫(kù)798億美元,CAGR3.5%,Oracle、MySQL、SQLServer等都是關(guān)系型數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)搜索數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)?關(guān)系型數(shù)據(jù)庫(kù)遵循ACID規(guī)則。主要集中在強(qiáng)一致性場(chǎng)景,比如銀行交易、零售電商、車票預(yù)訂等?非關(guān)系型數(shù)據(jù)庫(kù)放寬或取消了一些ACID的規(guī)則以達(dá)到更好的性能和更大的靈活性,擴(kuò)展性和并發(fā)用等)相比于關(guān)系型數(shù)據(jù)庫(kù)的應(yīng)用場(chǎng)景(核心業(yè)務(wù)數(shù)據(jù)完整),價(jià)值更低,因此企業(yè)更傾向于開源免費(fèi)的非關(guān)系型數(shù)據(jù)庫(kù),導(dǎo)致海外市場(chǎng)不同背景廠商以不同商業(yè)模式切入向量數(shù)據(jù)庫(kù)賽道中國(guó)市場(chǎng)云廠商將向量數(shù)據(jù)庫(kù)作為云服務(wù)矩陣中的一個(gè)SKU提供給客戶以提升全面服務(wù)能力MongoDB順應(yīng)NoSQL和大數(shù)據(jù)需求誕生,培養(yǎng)生態(tài)社區(qū)逐步實(shí)現(xiàn)技術(shù)支持+云托管模式的商業(yè)化MongoDBMongoDB發(fā)展歷程開發(fā)出MongoDB雛形API訪問的文檔數(shù)據(jù)庫(kù)MongoDB推出了Atlas服商合作,MongoDB自MongoDB推出ACID事持強(qiáng)事務(wù)的NoSQL數(shù)據(jù)庫(kù)MongoDB開始提供MongoDB的商業(yè)付費(fèi)↓MongoDB。發(fā)布MongoDB企業(yè)版MongoDB上線第一個(gè)源社區(qū)和MongoDB大MongoDB下載次數(shù)達(dá)?MongoDB有別于當(dāng)時(shí)其他的數(shù)據(jù)庫(kù)產(chǎn)品,使用和安裝都非常方便,在代碼中通過API就可以操作數(shù)?10gen一直通過開源社區(qū)和MongoDB大學(xué)擴(kuò)大影響力,吸引程序員入駐社區(qū),在社區(qū)按照不同地區(qū)上將MongoDB宣傳成程序員必備技能之一,掌握好這門技術(shù),不愁找不到工作。同時(shí)還和很多在線教育網(wǎng)站合作開展MongoDB的培訓(xùn)課程,從2012年起開始提供付費(fèi)技術(shù)支持互聯(lián)網(wǎng)內(nèi)容服務(wù)推動(dòng)大型數(shù)據(jù)庫(kù)應(yīng)用,MongoDB早期版本提供大規(guī)模數(shù)據(jù)處理、分片集群(水平擴(kuò)展能力)等功能MongoDBMongoDB產(chǎn)品演進(jìn)?在關(guān)系型數(shù)據(jù)庫(kù)中,當(dāng)數(shù)據(jù)量達(dá)到一定程度,單個(gè)節(jié)點(diǎn)服務(wù)器資源充分飽和無法保證及時(shí)的服務(wù)響應(yīng)時(shí)間時(shí),通常會(huì)采用分區(qū)分表的數(shù)據(jù)庫(kù)優(yōu)化方案。但是這些方案都是侵?2010年推出具有分片集群的1.6版本,在水平伸縮能力上要強(qiáng)于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)。MongoDB的自動(dòng)分片,可以在一個(gè)集群的幾個(gè)分片服務(wù)器內(nèi)自動(dòng)進(jìn)行數(shù)據(jù)的分布和均衡。在盡分布到多個(gè)存儲(chǔ)節(jié)點(diǎn)的同時(shí),為應(yīng)用開發(fā)者提供無縫的體驗(yàn)。開發(fā)者無須關(guān)心數(shù)MongoDB補(bǔ)足功能以適應(yīng)全業(yè)務(wù)場(chǎng)景,同時(shí)簡(jiǎn)單易用MongoDBMongoDB產(chǎn)品演進(jìn)?3.2版本中增加了操作符:$lookup,意味著作為NoSQL數(shù)據(jù)庫(kù),MongoDB開始支持關(guān)系型數(shù)據(jù)庫(kù)的核心功能:關(guān)聯(lián)。從3.2開始,可以一次同時(shí)查詢多個(gè)MongoDB的集合(表),不用像以前那樣,如果有多表查詢需要在代碼中發(fā)起多個(gè)數(shù)據(jù)庫(kù)查詢,然后在內(nèi)存中?2018年推出4.0版本具備多文檔ACID強(qiáng)事務(wù)機(jī)制,之前MongoDB對(duì)事務(wù)的支持僅限于單文檔內(nèi)。無法保證原子性和出錯(cuò)回滾機(jī)制,很多交易性的業(yè)務(wù)會(huì)有意避開MongoDB。而隨著4.0的發(fā)布,MongoDB可以用來支撐幾乎所有的業(yè)務(wù)場(chǎng)景?2020年推出的4.4版本解壓縮之后僅3個(gè)可執(zhí)MongoDB部署,都只需要這幾個(gè)組件):1)mongo:MongoDB與服務(wù)器發(fā)生交互;2)mongod:運(yùn)行MongoDB的主文件,可以作為單個(gè)數(shù)據(jù)庫(kù)實(shí)例、分片集群的成員或分片集群的配置服務(wù)器運(yùn)行;3)mongos:一個(gè)路由器應(yīng)用程序,用在具有水平伸縮能力收購(gòu)補(bǔ)全MongoDB能力并加深和開發(fā)者社群關(guān)系MongoDB歷次收購(gòu)提高了MongoDB在高寫入量工作負(fù)載下的性能。WiredTiger還為MongoDB帶來了壓縮、記錄級(jí)鎖定、多版本并發(fā)控制(MVCC)、多文檔事務(wù)以及對(duì)非常高插入工作負(fù)載的日志結(jié)構(gòu)合并樹(LSMmLabDBaaSmLab目前在其平臺(tái)上擁有大約100萬個(gè)托管數(shù)據(jù)庫(kù),包括免費(fèi)和付費(fèi)層。這次收購(gòu)將加深MongoDB與以開發(fā)者為中心的初創(chuàng)公司社群的關(guān)系,并有助于MongoDBAtlas的快速擴(kuò)張Realm這次收購(gòu)加強(qiáng)了MongoDB與專注于移動(dòng)和無服務(wù)器開發(fā)的開發(fā)者社群的關(guān)系。Realm擁有超過10萬名活躍開發(fā)者,其解決方案已被下載超過20億次。這次收購(gòu)與MongoDB全球云數(shù)據(jù)庫(kù)Atlas以及無服務(wù)MongoDB產(chǎn)品版本CloudManagerPremium和OpsManager管理工具,允許運(yùn)營(yíng)團(tuán)隊(duì)運(yùn)行、管理和配置MongoDB,包括能夠?qū)Υ蠹s100個(gè)系統(tǒng)指標(biāo)進(jìn)行監(jiān)控和報(bào)警,備份數(shù)據(jù)并將其恢復(fù)到任何時(shí)間點(diǎn)以進(jìn)行災(zāi)難恢復(fù),以及自動(dòng)執(zhí)分析師可以使用其MongoDBConnectorforBI產(chǎn)品,其中包括其最新發(fā)布Hadoop提供開源連接器,這些產(chǎn)品經(jīng)常用于數(shù)據(jù)分析提供了一個(gè)彈性的、可管理的產(chǎn)品,包括自動(dòng)配置和愈合、全面控、可管理的備份和恢復(fù)、默認(rèn)安全等功能。MongoDBAtlas讓客戶從管理數(shù)據(jù)庫(kù)和相關(guān)底層基礎(chǔ)設(shè)施的復(fù)雜性中解脫出來,從而可以和終端用戶體驗(yàn),并創(chuàng)新服務(wù)自己的客戶,把握新包含開發(fā)人員使用MongoDB所需的核心功能。使用MongoDBAtlas直接從社區(qū)版獲得收入,并通過向上銷售用戶到其企業(yè)高級(jí)訂閱MongoDB可以適應(yīng)不同行業(yè)的不同用例MongoDBMongoDB不同行業(yè)客戶MongoDBMongoDB不同用例MongoDB在2016年推出Atlas向云數(shù)據(jù)庫(kù)轉(zhuǎn)型據(jù)庫(kù)服務(wù)器和企業(yè)管理功能,使用戶可以完全掌控自管理的MongoDB環(huán)境的管理和安全性?MongoDBAtlas:是一個(gè)多云開發(fā)者數(shù)據(jù)平臺(tái),主要為用戶提供云端的數(shù)據(jù)庫(kù)服務(wù),使得用戶可以更加方便地使用和管理MongoDB商業(yè)模式仍為訂閱?報(bào)價(jià)按照服務(wù)器硬件性能報(bào)價(jià)(幾核CPU)?客戶可以選擇其CloudManagerPremium產(chǎn)品(適用于希望通過云端管理其平臺(tái)的客戶)或OpsManager(適用于內(nèi)部部署的客戶)?價(jià)格包含云基礎(chǔ)設(shè)施費(fèi)用,數(shù)據(jù)庫(kù)廠商再與云廠商結(jié)算Atlas客戶數(shù)占總客戶數(shù)90%以上,收入占比快速提升至65%,跨多云數(shù)據(jù)庫(kù)優(yōu)能力顯現(xiàn)54321029%27%23%25%29%27%23%25%23%23%30%20%10%0%FY22Q2FY22Q4FY23Q2FY23Q4FY24Q2?頭部百大客戶中,47%的企業(yè)客戶中,8成MongoDB的采購(gòu)是Atlas,驗(yàn)證海外企業(yè)“多客戶將工作負(fù)載從傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)遷移至MongoDB,帶來客戶數(shù)和單客戶ARR共同增長(zhǎng)MongoDB遷移工具M(jìn)ongoDB遷移工具?MongoDB自身提供專業(yè)的咨詢和咨詢服務(wù)以?MongoDB大學(xué)提供相關(guān)遷移工具的課程250020005000MongoDB持續(xù)推動(dòng)客戶數(shù)增長(zhǎng),成長(zhǎng)空間巨大250020005000MongoDBMongoDB用戶數(shù)(萬家)54321050%51%345%40%26%28%26%24%22%22%7050%51%345%40%26%28%26%24%22%22%7055FY22Q2FY22Q4FY23Q2FY23Q4FY24Q260%50%40%30%20%10%0%直銷收入占比直銷收入占比90%85%80%75%70%84%直銷客戶是指通過直銷團(tuán)隊(duì)84%直銷客戶是指通過直銷團(tuán)隊(duì)和渠道合作伙伴銷售的客戶88%88%88%87%87%86%86%85%FY22Q2FY22Q4FY23Q2FY23Q4FY24Q269%39439431%46%48%31%46%18%FY18FY19FY20FY21FY22FY2350050060%30030040%20020020%0財(cái)富1000財(cái)富100財(cái)富500財(cái)富2000ARR>$1m客戶數(shù)(家)MongoDB引導(dǎo)客戶將更多負(fù)載遷移,以此推動(dòng)單客戶ARR>$1m客戶數(shù)(家)25020050048%30%21367%48%30%21367%58%FY19FY20FY21FY22FY2370%60%50%40%30%20%10%0%MongoDBMongoDB客戶三年ARR擴(kuò)張情況ARR>$100k客戶數(shù)(ARR>$100k客戶數(shù)(家)500030%29%28%27%26%27%FY22Q2FY22Q4FY23Q2FY23Q4FY24Q231%30%29%28%27%26%25%24%250%200%150%100% 50%0%ARR>$100k客戶ARR>$1m客戶平均ARR100%100%250%200%150%100% 50%0%ARR>$100k客戶ARR>$1m客戶平均ARR100%100%100%195%200%211%MongoDB目前僅占1.8%和1.7%第一年第三年?NetARRExpansion第一年第三年生成式AI的出現(xiàn)在需求側(cè)和供給側(cè)共同給MongoDB帶來正向的增C端B端訓(xùn)練訓(xùn)練不需要對(duì)原數(shù)據(jù)集進(jìn)行保存,形成的知識(shí)會(huì)以參數(shù)文件的形式進(jìn)行存儲(chǔ),想要調(diào)用大模型可通過一段Python代碼讀取參數(shù)文件即可企業(yè)內(nèi)部應(yīng)用多采用嵌入而非微調(diào)的方式以節(jié)省成本,內(nèi)部知識(shí)數(shù)據(jù)會(huì)存儲(chǔ)在向量數(shù)據(jù)庫(kù)中,供通用/行業(yè)大模型進(jìn)行調(diào)用以與企業(yè)用戶交互推理不管C/B端推理場(chǎng)景,多輪對(duì)話場(chǎng)景必須要用到向量數(shù)據(jù)庫(kù)以保存對(duì)話內(nèi)容,在未來重新開啟對(duì)話時(shí)才會(huì)有“記憶”。數(shù)據(jù)庫(kù)用量會(huì)隨著對(duì)話數(shù)據(jù)量同向增長(zhǎng)SQL查詢轉(zhuǎn)換?從連接的關(guān)系數(shù)據(jù)庫(kù)中導(dǎo)入存儲(chǔ)過程和嵌入式SQL查詢?遷移工具使用生成式AI將這些轉(zhuǎn)換為MongoDB查詢?根據(jù)在遷移工具中設(shè)計(jì)的架構(gòu)創(chuàng)建MongoDB查詢?cè)u(píng)估:搜索并理解代碼庫(kù),以了解重構(gòu)應(yīng)用程序所涉及代碼轉(zhuǎn)換:建議應(yīng)用程序代碼與應(yīng)用程序架構(gòu)建議一限度地利用MongoDB測(cè)試:驗(yàn)證轉(zhuǎn)換后的應(yīng)用程序在MongoDB上的表現(xiàn)是否符合預(yù)期紅色為部署流程①將各種源數(shù)據(jù)(文本、代碼、圖片或視頻等)轉(zhuǎn)成向量數(shù)據(jù)(市面上有很多向量化處理工具)②“嵌入”向量數(shù)據(jù)并存儲(chǔ)源數(shù)據(jù),向量數(shù)據(jù)和源數(shù)據(jù)類似鍵值對(duì),一一對(duì)應(yīng)存儲(chǔ)③構(gòu)建對(duì)應(yīng)的提示工程黃色為使用流程①在應(yīng)用端進(jìn)行自然語言提問(LangChain技術(shù)框架會(huì)做規(guī)則判斷和邏輯編排,判定是否需要調(diào)用向量數(shù)據(jù)庫(kù)進(jìn)行回答)②若不需要,則直接由大模型回答或進(jìn)行互聯(lián)網(wǎng)搜索回答;若需要用到內(nèi)部知識(shí),則向量化工具將提問向量化③在向量數(shù)據(jù)庫(kù)中進(jìn)行向量相似性搜索④找到對(duì)應(yīng)的內(nèi)部知識(shí)源數(shù)據(jù)作為論據(jù)支撐⑤反饋到大模型進(jìn)行生成式回答具體應(yīng)用場(chǎng)景?索引文本/圖像/聲音/視頻、通過專有的增量數(shù)據(jù)增強(qiáng)基礎(chǔ)LLMs并減少幻覺、問答系統(tǒng)、改進(jìn)的推薦和相關(guān)性評(píng)分、動(dòng)態(tài)個(gè)性化、對(duì)話式支持、同義詞生成等MongoDB全訂閱收入,營(yíng)收增速中樞在40%,經(jīng)營(yíng)性現(xiàn)金流比例改善明顯,公司指引長(zhǎng)期Non-GAAPOPMargin20%+MongoDBMongoDB訂閱業(yè)務(wù)營(yíng)收(億美元)8642040%29%Imm訂閱營(yíng)收yoy——訂閱占比40%29%I92%93%95%96%96%96%96%97%92%76%61%41%49%47%41%FY18FY19FY20FY21FY22FY23FY24Q1FY24Q2100%80%60%40%20%0%MongoDBMongoDB毛利率整體毛利率——訂閱——服務(wù)100% 80% 60% 40% 20% 0%-20%100% 80% 60% 40% 20% 0%-20%-40%-60%FY15FY17FY19FY21FY23FY24Q2MongoDBMongoDB經(jīng)營(yíng)性現(xiàn)金流比例10% 0%-10%-20%-30%-40%-50%-60%——10% 0%-10%-20%-30%-40%-50%-60%5%1%-4% -13%-27% -20%-27%-38%-37%-35%-35%-33%-51%FY18FY19FY20FY21FY22FY23 MongoDB費(fèi)用率100% 50% 0% -50%-100%%%%%-9%毛利率100% 50% 0% -50%-100%%%%%-9%FY17FY19FY21FY23FY24Q2MongoDB連續(xù)兩季度超預(yù)期,并上調(diào)全年收入指引FY24Q1收入和客戶數(shù)超預(yù)期,上調(diào)全年預(yù)期?本季度公司實(shí)現(xiàn)營(yíng)業(yè)收入3.68億美元(+29%),超出華爾街預(yù)期的3.47億美元元,訂閱收入為3.547億美元,同比增長(zhǎng)29%,Atlas收入增長(zhǎng)40%;客戶數(shù)達(dá)到43,100個(gè),超出華?業(yè)績(jī)展望:預(yù)計(jì)全年實(shí)現(xiàn)收入15.22-15.42億美元FY24Q2收入超預(yù)期,上調(diào)全年預(yù)期?本季度公司實(shí)現(xiàn)營(yíng)業(yè)收入4.24億美元(+40%),大幅超出此前3.88-3.92億美元(+28%)的指引,主要由于非Atlas業(yè)務(wù)(EA和許可授權(quán))的強(qiáng)勁表現(xiàn),以及略好于預(yù)期的Atlas收入表現(xiàn)。實(shí)現(xiàn)毛利率78%(+5pcts),主要由于毛利極高的EA和許可授權(quán)收入(包括阿里續(xù)簽)大幅超預(yù)期。實(shí)現(xiàn)Non-GAAP營(yíng)業(yè)利潤(rùn)7910萬美元,對(duì)應(yīng)opmargin19%(+23pcts),亦大幅超出此前3600-3900萬美元的指引??蛻魯?shù)超過45,000個(gè),環(huán)比增加1900個(gè)客戶,同比增加8,000個(gè)。其中,直銷客戶6800個(gè),同比增加1,400個(gè)?業(yè)績(jī)展望:公司預(yù)計(jì)Q3將實(shí)現(xiàn)收入4-4.04億美元(+21%),實(shí)現(xiàn)Non-GAAP營(yíng)業(yè)利潤(rùn)4100-4400萬美元;預(yù)計(jì)全年實(shí)現(xiàn)收入15.96-16.08億美元(+26%),較此前15.22-15.42億美元顯著提升。主要反映Q3起始ARR的提升,并繼續(xù)預(yù)計(jì)Atlas的增長(zhǎng)將受到困難宏觀環(huán)境的影響,預(yù)計(jì)用量增長(zhǎng)將與去年Q2放緩后的平均水平相符,但在Q3有輕微的季節(jié)性收益?AI用例:向量數(shù)據(jù)庫(kù)處于預(yù)覽階段,但已經(jīng)看到大型客戶的極大興趣,包括某咨詢公司允許顧問在超過150萬份專家紀(jì)要中進(jìn)行語義檢索數(shù)據(jù)管理軟件市場(chǎng)空間千億美元,MongoDB單客戶ARR和客戶數(shù)共同提升推動(dòng)增長(zhǎng)MongoDB占客戶數(shù)據(jù)庫(kù)投入占比MongoDB占客戶數(shù)據(jù)庫(kù)投入占比IDC測(cè)算數(shù)據(jù)管理軟件市場(chǎng)規(guī)模(十億美元)014%15%14%13%13%10%9%5419%14%15%14%13%13%10%9%5412%12%MDB其他MDB其他98.2%98.3%20%16%MDB其他MDB其他98.2%98.3%ARRARR博客而博客而個(gè)迭代(開源UI)合并成ELK在AWS上推出服務(wù)的整套數(shù)據(jù)解決方案商業(yè)組件x-ELKStack的結(jié)合為用戶提供實(shí)時(shí)大數(shù)據(jù)分析解決方案,后期通過收購(gòu)進(jìn)一步補(bǔ)齊能力(2012)開源可插拔數(shù)據(jù)采集工具,后成為ELK開源UI,主要用于數(shù)據(jù)可視化,后成為Found(2015)基于AWS提供主機(jī)托管服務(wù),后基于此(2017)日志系統(tǒng)相比主要業(yè)務(wù)系統(tǒng)對(duì)業(yè)務(wù)影響不大。ELK構(gòu)成了最基礎(chǔ)的實(shí)時(shí)大數(shù)據(jù)分析?最初合并之時(shí),三大產(chǎn)品的工程師團(tuán)隊(duì)各自為戰(zhàn),導(dǎo)致版本發(fā)布、兼容十分混亂:“如果想使用的整套數(shù)據(jù)解決方案客戶可以部署內(nèi)部工作區(qū)搜索,無縫連接到其他生產(chǎn)力工具、CRM、云存儲(chǔ)平臺(tái)、協(xié)作工具、操作管理平臺(tái)和內(nèi)容管理系統(tǒng),可以從更多的來源攝指標(biāo)攝取、搜索、可視化和分析來自IT系統(tǒng)的數(shù)字和時(shí)間序列數(shù)APMAPM提供了對(duì)代碼級(jí)別應(yīng)用程序性能的洞察。開發(fā)人員可以對(duì)應(yīng)用程序進(jìn)行檢測(cè),并看到事客戶和用戶利用合成監(jiān)控來跟蹤和監(jiān)控支持業(yè)務(wù)運(yùn)營(yíng)的主機(jī)、網(wǎng)站、服務(wù)和應(yīng)安全包括對(duì)勒索軟件、惡意軟件、網(wǎng)絡(luò)釣魚、漏洞利用、無文件XDR當(dāng)SIEM和端點(diǎn)安全一起部署時(shí),它們提供了強(qiáng)大的安全姿態(tài)和對(duì)潛在威脅的廣泛可見性。XDR提供了一個(gè)統(tǒng)一的安全堆棧,保護(hù)端點(diǎn)、云和更廣泛的環(huán)境云安全通過豐富的云姿態(tài)可見性和對(duì)云工作負(fù)載的運(yùn)最低價(jià)測(cè)算基于云生產(chǎn)配置,120GB存儲(chǔ)空間/2個(gè)區(qū)域。按實(shí)例類型使用量定價(jià)訂閱收入超90%,分為自管型本地部署訂閱和全托管云訂閱,全86420營(yíng)業(yè)收入營(yíng)收oy57%42%營(yíng)業(yè)收入營(yíng)收oy57%42%24%42%yFY19FY20FY21FY22FY23086420自管型云托管型服務(wù)自管型云托管型服務(wù)FY19FY20FY21FY22FY2350%-40%50%-40%-30%-20%-10%-占總收入比——占訂閱收入比120%100%80%60%40%20%0%0%-自管型o自管型o云托管型o服務(wù)o48%80%80%y42%12%y34%25%FY19FY20FY21FY22FY23FYFY19FY20FY21FY22FY23250002000050000客戶數(shù)和ACV價(jià)值量共同驅(qū)動(dòng)增長(zhǎng)250002000050000ACV>$100K客戶數(shù)(家)ACV>$100K客戶數(shù)(家)79%9%62%9%40%33%24%FY17FY18FY19FY2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論