




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
7%-4%12/2202/2304/2306/2308/2310/237%-4%12/2202/2304/2306/2308/2310/23計算機行業(yè)計算機行業(yè)核心觀點:本增效的效果已有所顯現(xiàn)。ChatGPTPlug處理具有一定技術積累的基礎上,也于近期推出了向量數(shù)據(jù)庫產(chǎn)品。理的收費模式將是各廠商在低滲透率的環(huán)境下獲客的關鍵。量數(shù)據(jù)庫領域的布局可能導致行業(yè)競爭加??;技術開源導致中小企業(yè)入局向量數(shù)據(jù)庫領域。相對市場表現(xiàn)39%29%-14% 計算機滬深300請注意,周源并非香港證券及期貨事務監(jiān)察委員會的注冊持牌人,不可在香港從事受監(jiān)管活動。整報告日期合理價值(元/股) 二、向量數(shù)據(jù)庫處于商業(yè)化早期階段,隨各行業(yè)智能化升級而快速成長 45 8 9 9 40 41 42 43圖39:基于阿里云使用Zilliz向量數(shù)據(jù)庫服務的流程示意圖.......... 表9:星環(huán)科技數(shù)據(jù)分析大模型建設項目相關產(chǎn)品定價 投資要點:隨著AI大模型的發(fā)展,向量數(shù)據(jù)庫已成為賦能MLOps各環(huán)節(jié)必備的軟件基礎設施。算力集群規(guī)模持續(xù)擴大的趨勢下,從數(shù)據(jù)到模型的全生命周期管理需要更加專業(yè)的軟件工具用于生產(chǎn)效率的提升、流程的優(yōu)化和成本的節(jié)省。其中向量數(shù)據(jù)庫具備的快速檢索、混合存儲、向量嵌入等能力很好的解決了AI大模型在MLOps過程中存在向量數(shù)據(jù)庫是開發(fā)和應用AI大模型過程中必備的軟件基礎設施。向量數(shù)據(jù)庫是專門它通常采用基于向量相似度的查詢方式,即根據(jù)向量之間的相似度來檢索數(shù)據(jù)。這一功能特點不僅使得其可以提升訓練過程中特征提取和數(shù)據(jù)檢索等任務的效率,還向量數(shù)據(jù)庫為代表的工具類軟件有效解決了AI大模型全生命周期管理中的痛點,是從實際應用案例來看,向量數(shù)據(jù)庫在AI大模型的訓練和推理過程中降本增效的效果Qdrant向量數(shù)據(jù)庫產(chǎn)品與Pienso合作,已經(jīng)實現(xiàn)在開源AI大模型的基礎上開發(fā)私域AI應用的發(fā)展正逐步由點擴散到面,各領域智能化升級的快速進展將大大增強向量數(shù)據(jù)庫領域早期的探索,主要是以Zilliz、Weaviate和Pinecone等初創(chuàng)型公司引領。據(jù)庫產(chǎn)品多以開源的形式培育社區(qū)生態(tài),以及上云的方式擴大用戶覆蓋面。隨著向量數(shù)據(jù)庫在AI大模型中應用的重要性逐漸被挖掘,各廠商加大了該領域的研發(fā)。以騰訊云、華為云和星環(huán)科技為代表的廠商在非結構化數(shù)據(jù)的向量檢索工具已經(jīng)具有一定技術積累的基礎上,也于近期推出了向量數(shù)據(jù)庫產(chǎn)品。向量數(shù)據(jù)庫行業(yè)有望隨各行業(yè)智能化升級而快速成長。在技術方面,Zilliz和Weaviate將技術開源一方面推動了整體行業(yè)的進步,另一方面也縮小了行業(yè)內(nèi)公司在商業(yè)化方面,向量數(shù)據(jù)庫行業(yè)還處于市場培育期,Zilliz、Pinecone和騰訊云產(chǎn)品拓展過程有望加速,各行業(yè)用戶付費意愿有望提升。未來,向量數(shù)據(jù)庫商業(yè)化的節(jié)奏取決于各行業(yè)客戶使用AI大模型的實際需求以及其在AI大模型技術中應用的向量數(shù)據(jù)庫處于產(chǎn)品化和商業(yè)化的早期階段,配合標準化產(chǎn)品的技術服務是關鍵。向量數(shù)據(jù)庫發(fā)展時間較短,相應功能難以廣泛滿足各行業(yè)需求,在商業(yè)化落地過程技術服務的及時性和專業(yè)性將是向量數(shù)據(jù)庫公司新客拓展、老客留存的關鍵。我們中更具優(yōu)勢。相較于初創(chuàng)型的公司,星環(huán)科技已擁有410人的技術支持團隊(截至2022年12月底對于新產(chǎn)品的市場推廣、商業(yè)化策略制定以及客戶溝通云計算公司擁有的AI大模型以及海量非結構化數(shù)據(jù)為其向量數(shù)據(jù)庫產(chǎn)品打磨和應用云計算公司開發(fā)的向量數(shù)據(jù)庫在滿足其自研的AI大模型業(yè)務和海量數(shù)據(jù)檢索的需求的同時,也提升了產(chǎn)品性能,實踐了具體場景中的應用效果,為其對外提供服務打再到一定市場份額的發(fā)展,能夠享受更多下游快速滲透帶來的機會,而同行競爭帶未來,針對各場景需求特點,結合AI大模型的能力開發(fā)出滿足行業(yè)用戶需求的向量數(shù)據(jù)庫產(chǎn)品,以及根據(jù)實際產(chǎn)業(yè)趨勢制定合理的收費模式將是各廠商在低滲透率的中長期來看,云計算公司和數(shù)據(jù)庫廠商也存在合作的可能性。從海外的經(jīng)驗來看,以及產(chǎn)品線的延長,其在各個技術應用領域的需要尋求合作伙伴共同拓展業(yè)務。例商業(yè)化落地。我們認為,若第三方向量數(shù)據(jù)庫公司的產(chǎn)品具有足夠的競爭力,可以實現(xiàn)對相關軟硬件基礎設施的連帶銷售效果,云計算公司與其實現(xiàn)資源互補、產(chǎn)業(yè)合作的可能性將大大增加。投資建議:推薦星環(huán)科技。風險提示:商業(yè)化落地受下游應用拉動,兌現(xiàn)尚需時間;科技巨頭在向量數(shù)據(jù)庫領一、向量數(shù)據(jù)庫為AI大模型全生命周期管理提質增效隨著AI大模型的發(fā)展,向量數(shù)據(jù)庫已成為賦能MLOps各環(huán)節(jié)必備的軟件基礎設施。據(jù)量不斷增多,算力集群規(guī)模持續(xù)擴大的趨勢下,從數(shù)據(jù)到模型的全生命周期管理需要更加專業(yè)的軟件工具用于生產(chǎn)效率的提升、流程的優(yōu)化和成本的節(jié)省。其中向量數(shù)據(jù)庫具備的快速檢索、混合存儲、向量嵌入等能力很好的解決了AI大模型在MLOps過程中存在的知識時效性低、輸入能力有限、回答問題準確度低等問題,未來發(fā)展前景廣闊。AI大模型的訓練和推理各環(huán)節(jié)過程復雜、步驟較多,需要統(tǒng)一的軟件工具鏈進行管型測試、訓練監(jiān)控、生產(chǎn)部署等環(huán)節(jié),任何一個環(huán)節(jié)出現(xiàn)問題亦或不同環(huán)節(jié)之間的53%的項目能夠從AI原型轉化為生產(chǎn),AI生產(chǎn)轉化率低的主要原因在于模型全鏈路生命周期管理存在跨團隊協(xié)作難度大、過程和資產(chǎn)管理欠缺、生產(chǎn)和交付周期長等問題。因此,開發(fā)從數(shù)據(jù)到模型,貫通從開發(fā)到部署等多環(huán)節(jié)統(tǒng)一的流水線軟件MLOps是保障AI模型生產(chǎn)和管理的穩(wěn)定性、持續(xù)性、規(guī)模化和效率的關鍵。保證模型在生產(chǎn)過程中的連續(xù)性。MLOps的系統(tǒng)框架不是簡單的線性推進,而是各復進行數(shù)據(jù)收集和準備、模型開發(fā)和訓練、模型驗證和測試等步驟,以不斷對模型各個環(huán)節(jié)都有對應的軟件實現(xiàn)效率的提升。這些軟件和工具在各環(huán)節(jié)發(fā)揮著重要的點問題并形成需求,交付于數(shù)據(jù)科學家進行對接;數(shù)據(jù)科學家通過需求文檔初步建的有效溝通下對方案多次修改直到達成一致,以確保業(yè)務需求被正確認知,建模方案可行而高效,避免不同角色對于需求的理解不一致及風險不可控等問題,從源頭器學習算法進行建模。特征選擇也是模型性能的關鍵,需要從所有可用的特征中選擇最相關的特征子集用于模型訓練,減少復雜性,提高模型性能,并減少過擬合的模型可以根據(jù)最新的數(shù)據(jù)和反饋進行更新和優(yōu)化。測試階通常構造一組測試數(shù)據(jù)來常值敏感。器學習模型部署到生產(chǎn)環(huán)境,以便它可以開始為實際業(yè)務問題提供預測。它將模型這要求IT運維定期檢查模型的預測性能,以確保它仍然滿足業(yè)務需求;監(jiān)控模型服務),監(jiān)控模型的數(shù)據(jù)漂移,避免因為輸入數(shù)據(jù)的分布變化導致模型性能隨著時間的推移而下降。運維監(jiān)控是一個持續(xù)的過程,它需要在模型的整個生命周期中進行,以確保模型的持續(xù)性能和健康狀況。表1:MLOps的生命周期每個階段的主要輸入、主要步驟以及主要輸出內(nèi)容1)將業(yè)務需求轉為技術問題,確定使用機器學習過程需要的數(shù)據(jù),以及數(shù)據(jù)處理過程和規(guī)則(例如,數(shù)程、模型訓練及模型服務的代碼1)接入并提取原始數(shù)據(jù),包括流數(shù)據(jù)、靜態(tài)批處理數(shù)據(jù)或模型開發(fā)置發(fā)多輪模型訓練,不斷調整和選擇性能最優(yōu)算法和超參數(shù)。3)對不同模型參數(shù)進行交叉腳本、模型服務標模型測試據(jù)、特征。據(jù)模型實驗階段已選擇的算法和超參數(shù),對新數(shù)據(jù)進行自動訓練。4)執(zhí)行自動化的模型報告,產(chǎn)品發(fā)布運維監(jiān)控各類指標數(shù)據(jù)值AI大模型對MLOps提出了更高要求。相較于普通的AI模型,AI大模型的訓練復雜。例如,如何將模型分布式部署到多個節(jié)點上、如何保證模型的穩(wěn)定性和可靠從頭開始訓練,而是選擇一個通用性基礎較好的、開源的預訓練模型,在其基礎上評估測試等,各環(huán)節(jié)的耗時都取決于數(shù)據(jù)量、模型復雜度以及評估指標的選擇。因此數(shù)據(jù)處理工具、軟件平臺架構的選擇對于AI大模型的開發(fā)有關鍵作用。過程中,存在由于用戶提問方式不直接,給出的提示詞較為模糊,導致生成內(nèi)容質高提示詞與回答內(nèi)容之間匹配度已成為AI大模型的重要發(fā)展4.人工反饋對于AI大模型通用性效果的提升有關鍵作用:在模型的評估測試環(huán)節(jié),從而提升AI大模型整體的通用性。表2:AI大模型的屬性對MLOps過程中的影響各場景通用性較強:AI大模型在預先學習了各場景海量數(shù)據(jù)上,其包含了具有通用共性特征的底層卷積層,這部分有的、第三方的或開源的模型開始,以自定義微開發(fā)階段:超大規(guī)模計算集群的模型訓練需要分理解用戶真實需求是人機交互體驗的關鍵:許多AI大模型可以通過向量數(shù)據(jù)庫是開發(fā)和應用AI大模型過程中必備的軟件基礎設施。針對AI大模型的MLOps在架構方面的設計考慮了海量多源數(shù)據(jù)的訓練、預訓練大模型的導入以及大在訓練數(shù)據(jù)方面,由于所需處理的數(shù)據(jù)量較為龐大、類型更加復雜,向量數(shù)據(jù)庫是提升訓練和推理效率必備的工具軟件。AI大模型在大規(guī)模計算集群的環(huán)境下進行訓發(fā)和應用AI大模型過程中必備的軟件基礎設施。導入過程中,向量數(shù)據(jù)庫可以將不同類型的非結構化數(shù)據(jù)進行清洗、篩選并轉化為統(tǒng)一的向量嵌入格式,便于各類數(shù)據(jù)的交互和計算。在特征提取階段,向量數(shù)據(jù)庫在模型構建環(huán)節(jié),向量數(shù)據(jù)庫也可以在微調和剪枝等環(huán)節(jié)減少訓練數(shù)據(jù)量,節(jié)省訓全向量數(shù)據(jù)庫在AI大模型訓練和推理過程中有較大的應用空間。向量數(shù)據(jù)庫是專門用于存儲和管理向量數(shù)據(jù),其主要特點是能夠高效地存儲和查詢大規(guī)模的向量數(shù)據(jù)。它通常采用基于向量相似度的查詢方式,即根據(jù)向量之間的相似度來檢索數(shù)據(jù)。這一功能特點不僅使得其可以提升訓練過程中特征提取和數(shù)據(jù)檢索等任務的效率,還在推理過程中有效保護用戶隱私數(shù)據(jù)、保障應用過程的數(shù)據(jù)安全性。針對海量和多源訓練數(shù)據(jù),向量數(shù)據(jù)庫統(tǒng)一數(shù)據(jù)格式,為訓練任務效率提升打好基一個固定長度的向量。轉化后的向量數(shù)據(jù)不僅統(tǒng)一了數(shù)據(jù)格式,便于各類型數(shù)據(jù)之數(shù)據(jù)搜索的過程往往耗時較長。向量數(shù)據(jù)庫通過ANN(ApproximateNearest數(shù)據(jù)庫允許用戶只更新部分數(shù)據(jù),而不是整個數(shù)據(jù)集。這可以節(jié)省大量的計算資源和時間,特別是在數(shù)據(jù)集很大且更新頻繁的情況下。類型的數(shù)據(jù)轉化成為向量嵌入的方式不同。對于文字類信息,在字詞的屬性(主謂賓)等較為固定的情況下,語句中的語義信息的提取和識別有規(guī)律可循。將標點符號、不同屬性的字詞編碼,根據(jù)其在文中的作用對編碼反復進行排列組合的訓練即可以得到一組向量嵌入。而圖像類數(shù)據(jù)的編解碼難度更大。圖像數(shù)據(jù)是大量像素排列組合而成的,不僅單個像素的固定屬性難以確定,其排列組合的方式也無規(guī)律可入數(shù)據(jù)開始訓練的過程更加復雜。庫支持不同類型數(shù)據(jù)導入AI模型訓練中,解決了此前針對不同類型的數(shù)據(jù)導入需要的神經(jīng)網(wǎng)絡中進行訓練,其輸出結果為具有標識的統(tǒng)一格式的向量,可以被深層的神經(jīng)網(wǎng)絡識別。由于AI大模型的訓練涉及的數(shù)據(jù)量龐大,向量嵌入的方式可有效提過程中,原始數(shù)據(jù)轉換為向量數(shù)據(jù)后更好的適應了AI計算中涉及大量的矩陣運算。向量化后的數(shù)據(jù)將單一維度的運算擴展到高維度的矩陣運算,從而提升單次運算能于特征提取、抽象化等都有很好的性能滿足。此外,向量數(shù)據(jù)庫還可以提供快速隨向量數(shù)據(jù)庫在企業(yè)用戶隱私保護和推理任務準確性方面有突出表現(xiàn)。在AI大模型應防止企業(yè)隱私信息泄露。在這一過程中,向量數(shù)據(jù)庫作為通用AI大模型和企業(yè)私域數(shù)據(jù)間的橋梁,可以有效滿足用戶這一需求。其次,融合了最新資料和專業(yè)知識的向量數(shù)據(jù)庫可有效解決通用的AI大模型知識的時效低、輸入能力有限以及準確度低最新的數(shù)據(jù)來回答問題,但大模型的訓練語料在時效性上有一定局限。此外,企業(yè)和微調階段。在此情況下,向量數(shù)據(jù)庫可以充當外掛知識庫,為大模型提供最新數(shù)據(jù)或者企業(yè)客戶獨有的內(nèi)部知識庫。通過從知識庫中檢索與輸入相關的信息,作為上下文和問題一起輸入給AI大模型,基于信息生成答案,可以提升大模型的時效性記錄客戶端和大模型之間的對話信息,接收到新的消息時可以從整個歷史會話記錄中檢索與當前消息相關的人機交互信息,為大模型提供長期記憶。因此可以突破大語言模型對Token數(shù)的限制,避免上下文信息丟失的問題。表3:向量數(shù)據(jù)庫在AI大模型推理應用中的具體功能提供外掛知識庫提供長期記憶提供緩存能力4.Prompt輸入至LLM生成響應儲的嵌入并傳遞給查詢LLM據(jù)庫中練/微調、相較于微調成本更低、實時性提高性能、優(yōu)化計算資源和通過互聯(lián)網(wǎng)公開數(shù)據(jù)訓練的通用AI大模型難以覆蓋專業(yè)性較強以及最新的新聞數(shù)據(jù)。而用戶可以將最新資料和專業(yè)知識存入向量數(shù)據(jù)庫中,外接到通用AI大模型來解決據(jù)作為訓練語料。向量數(shù)據(jù)庫的實時更新、靈活編輯以及隱私保護的特點較好的彌補了通用AI大模型的缺陷。在ChatGPT的插件系統(tǒng)中,用戶即可在外接的向量數(shù)據(jù)們認為,外接的向量數(shù)據(jù)庫可以將用戶特定信息融入到交互內(nèi)容中,不僅大大拓展圖12:Weaviate向量數(shù)據(jù)庫嵌入ChatGPTAI大模型可以更好的理解用戶的搜索意圖,并將搜索請求擴展到相關領域的信息,布式環(huán)境中,向量數(shù)據(jù)庫還具有高效的并行計算能力,可以充分利用硬件資源步加快推理速度,以應對海量數(shù)據(jù)的處理需求。在應用階段,AI大模型存在較多的向量相似性搜索需求。AI大模型和用戶交互的信大模型識別和理解,之后這一組向量數(shù)據(jù)需要遍歷龐大的神經(jīng)網(wǎng)絡,搜索與之對應的另一組向量數(shù)據(jù)后才能生成用戶想要的文字。向量搜索的過程往往耗時較長,可能會影響到即刻需要得到內(nèi)容生成的用戶體驗。而向量數(shù)據(jù)庫通過ANN算法給不同從實際應用案例來看,向量數(shù)據(jù)庫在AI大模型的訓練和推理過程中降本增效的效果已有所顯現(xiàn)。Pinecone、Weaviate等向量Qdrant向量數(shù)據(jù)庫產(chǎn)品與Pienso合作,已經(jīng)實現(xiàn)在開源AI大模型的基礎上開發(fā)私域1.向量數(shù)據(jù)庫已應用于數(shù)據(jù)清洗、向量嵌入轉換、私域大模型開發(fā)等訓練過程去重。Atlas首先對文本語料庫進行語義層面的分析,性的數(shù)據(jù)進行聚類,并以向量形式嵌入到可視化地圖上。在可視化的界面中,用戶可使用工具對數(shù)據(jù)進行標注,根據(jù)業(yè)務需要,對特定類別數(shù)據(jù)進行清洗和篩選。之數(shù)據(jù)進行分類、標注和清理,優(yōu)化數(shù)據(jù)集,從而有效提高AI模型的訓練效率。與向量數(shù)據(jù)庫Qdrant合作,為客戶提供私域大模型解決方案。用戶可以基于私有數(shù)據(jù),使用簡單的可視化界面在各種流行的開源模型上開發(fā)定制AI模型。通過向量數(shù)理解對話或文檔,產(chǎn)生貼近語境的輸出,以及加速用戶模型的訓練和推理過程。在用戶隱私和數(shù)據(jù)安全。在模型推理場景中,向量數(shù)據(jù)庫的高性能的向量存儲和檢索能力已經(jīng)在問答系統(tǒng)、(1)外掛知識庫:在外接的向量數(shù)據(jù)庫中可以預先增加和編輯特定信息,再通過速搜索,實現(xiàn)反向圖像搜索、對象檢測、人臉比對等任務;數(shù)據(jù)來源:阿里云開發(fā)者社區(qū),廣發(fā)證券發(fā)接口。用戶在外接的向量數(shù)據(jù)庫中可以預先增加和編輯特定信息,再通過ChatGPT調用該插件后實現(xiàn)對于特定問題的回答。我們認為,外接的向量數(shù)據(jù)庫可以將用戶特定信息融入到交互內(nèi)容中,不僅大大拓展了AI大模型交互信息的范圍,還保證了答內(nèi)容效果示意接入向量數(shù)據(jù)庫的AI大模型已應用于企業(yè)內(nèi)部數(shù)據(jù)的智能化和隱私保護。隨著向量工具不僅有效提升其人員招聘各流程的數(shù)據(jù)的搜索效率以及資源對接的精準性,還保護企業(yè)用戶的數(shù)據(jù)不泄露給AI大模型作為訓練預料。我們認為,向量數(shù)據(jù)庫作為外掛知識庫接入AI大模型后能夠保護用戶隱私數(shù)據(jù)的能力被企業(yè)級客戶充分認識和理解后,其有望得到大規(guī)模推廣。圖21:MongoDB的AtlasVectorSeach向量據(jù)庫公司Zilliz開發(fā)了一個開源工具OSSChat,整合了各開相關文檔作為數(shù)據(jù)源,并將這些數(shù)據(jù)轉換為向量存儲在向量數(shù)據(jù)庫中。當用戶與金融科技公司ChipperCash在向量數(shù)據(jù)Pinecone的基礎上構建了一套身份驗證系將人臉圖像等身份信息轉換為向量并存儲在Pinecone向量數(shù)據(jù)庫中,通過對Pinecone向量數(shù)據(jù)庫的查詢返回前三個最優(yōu)匹配項,最后在后端進行查詢以返回匹提升商品推薦的精準度。向量數(shù)據(jù)庫將用戶的歷史行為、畫像和查詢等特征轉化為用戶特征向量,并與商品向量結合,通過計算相似度找到與用戶歷史行為或興趣相精確召回文檔,甚至出現(xiàn)與查詢無關的結果,但通過向量檢索,可以提前抽取商品和查詢的特征,并進行向量的近似召回,有效匹配了用戶需求,提升了商品推薦準圖24:向量數(shù)據(jù)庫為電子商務公司CRITEO企業(yè)應用AI大模型的需求和數(shù)據(jù)隱私保護的要求共同保障了向量數(shù)據(jù)庫在垂直應用類AI的應用前景。通過觀察向量數(shù)據(jù)庫在AI大模型各場景的應用,我們發(fā)現(xiàn)其不僅增強了AI大模型生成內(nèi)容的精準性和及時性,還可以作為外掛知識庫應用于垂直領域大模型的訓練。隨著以ChatGPT為代表的通用AI大模型產(chǎn)品的成熟,各行業(yè)用戶基于通用AI大模型開發(fā)的智能化應用帶來的降本增效的效果顯著。通用AI大模型被金在各行業(yè)智能化升級過程中,向量數(shù)據(jù)庫不僅可以將企業(yè)海量數(shù)據(jù)向量化后提升通用AI大模型應用的時效性和精準性,還可以保障企業(yè)隱私數(shù)據(jù)和信息不被通用AI大品的落地,AI應用的發(fā)展正逐步由點擴散到面,各領域智能化升級的快速進展將大二、向量數(shù)據(jù)庫處于商業(yè)化早期階段,隨各行業(yè)智能化升級而快速成長數(shù)據(jù)庫領域早期的探索,主要是以Zilliz、Weaviate和Pinecone等初創(chuàng)型公司引領。據(jù)庫產(chǎn)品多以開源的形式培育社區(qū)生態(tài),以及上云的方式擴大用戶覆蓋面。隨著向量數(shù)據(jù)庫在AI大模型中應用的重要性逐漸被挖掘,各廠商加大了該領域的研發(fā)。以騰訊云、華為云和星環(huán)科技為代表的廠商在非結構化數(shù)據(jù)的向量檢索工具已經(jīng)具有一定技術積累的基礎上,也于近期推出了向量數(shù)據(jù)庫產(chǎn)品。表4:向量數(shù)據(jù)庫開發(fā)公司和產(chǎn)品列表發(fā)布時間WeaviateWeaviateTencentCloudVector騰訊云針對非結構化數(shù)據(jù)的向量搜索引擎及相關工具。其開發(fā)的Milvus向量數(shù)據(jù)庫產(chǎn)品于2019年10月開源,為業(yè)內(nèi)公司在該領域技術的探索提供了豐富技術資源。從Milvus1.0即提供了相似性度量、ANN索引等核心算法以及可根據(jù)業(yè)務場景,預估數(shù)據(jù)量和節(jié)點規(guī)模,選擇免費版(適用于新手用戶開發(fā)單一使用時間范圍內(nèi)根據(jù)計算資源和存儲資源的使用量來收費。目前Zilliz的向量數(shù)據(jù)庫定制化需求也提供虛擬私有云部署的SaaS服務供客戶靈活選擇。/小時坡)/小時/小時/小時的技術開發(fā)專注于向量化的能力,即將各類不同的數(shù)據(jù)轉化成為向量數(shù)據(jù)。后續(xù),Weaviate的向量數(shù)據(jù)庫產(chǎn)品根據(jù)Embedding數(shù)量和資源使用量來收費。WeaviateEmbedding的數(shù)量是有向量的維度和數(shù)據(jù)對象的數(shù)量共同決定。而在基于第三方公間大小)的使用量來付費。表6:Weaviate向量數(shù)據(jù)庫基于Weaviate起步價按月收費的價格基于第三方公務按月收費的價格谷歌云上基于存儲資源收費的版本谷歌云上基于計算資源(CPU數(shù)量)收原始數(shù)據(jù)編碼為向量數(shù)據(jù)的階段采用多種編碼方式,不同編碼方式的向量數(shù)據(jù)在大模型的檢索過程中有快慢之分。混合搜索引擎可以篩選出檢索速度最快的向量嵌入方式作為結果反饋。而混合存儲則是將原本在內(nèi)存中存儲的向量索引部分轉移在磁的成本減少了10倍。我們認為Pinecone公司對于數(shù)據(jù)在AI大模型全周期中的流程優(yōu)化方面較一般公司研究更為深入,已經(jīng)有較深的技術積累,其開發(fā)的向量數(shù)據(jù)庫發(fā)展前景向好。Pinecone在公有云環(huán)境中提供容器化的SaaS服務,按照容器的數(shù)量和容量收費。在公有云環(huán)境下,容器是融合了CPU、內(nèi)存和硬盤等資源的基礎單元,是實現(xiàn)云端上提供的向量數(shù)據(jù)庫產(chǎn)品的收費價格根據(jù)容器類型、數(shù)量、容量以及云服務器平臺決定。目前,Pinecone推出免費版(單一容器)、標準版和企業(yè)版的向量數(shù)據(jù)庫產(chǎn)品。標準版和企業(yè)版的起步價分別為0.096美元/小時和0.144美元/小時。此外,Pinecone根據(jù)客戶定制化需求也提供虛擬私有云部署的表7:Pinecone向量數(shù)據(jù)庫收費模式(以標準版為例)基礎價格存儲優(yōu)化型4000萬個向量400萬個向量(第二代)400萬個向量礎設施。星環(huán)科技的Hippo向量數(shù)據(jù)庫具備的優(yōu)勢如下:同時支持多類索引,滿足不同業(yè)務場景;支持檢時序數(shù)據(jù)等多種模型數(shù)據(jù)進行統(tǒng)一存儲管理,通過統(tǒng)一接口實現(xiàn)數(shù)據(jù)跨模型聯(lián)合分 圖28:星環(huán)科技分布式向量數(shù)據(jù)庫Transwar場景,高性能版Hippo可支持單臺服務器1000QPS(Queries-per-second)的數(shù)據(jù)場景推出的標準化產(chǎn)品更加符合行業(yè)客戶需求,未來發(fā)展前景看好。社區(qū)版存儲密集版樹索引、位圖索引-訪問控制---√--√---√-數(shù)據(jù)存儲加密/傳輸加密備份-海)股份有限公司向特定對象發(fā)行股票申請文件的審核問詢函的回復》中的信息,下游客戶或因數(shù)據(jù)量的增加而產(chǎn)生持續(xù)擴容的需求。因此,向量數(shù)據(jù)庫產(chǎn)品的銷售表9:星環(huán)科技數(shù)據(jù)分析大模型建設項目相關產(chǎn)品定價參考面向部門級用戶的售賣模式下的BI工式基礎設施基線大模型騰訊云基于多年積累的向量引擎技術,推出了向量數(shù)據(jù)庫VectorDB。2023年7月,部的賦能工具OLAMA向量引擎,在其基礎上對于AI運算、檢索方面進行升級而來。騰訊云向量數(shù)據(jù)庫不僅能為大模型提供外部知識庫,提高大模型回答的準確性,還00讓相同的內(nèi)存可以存儲5-10倍的數(shù)據(jù)。成本、運維成本和人力成本開銷。(4)簡單易用:支持豐富的向量檢索能力。用戶通過HTTPAPI或者SDK接口即可快速操作數(shù)據(jù)庫,開發(fā)效率高。同時控制臺提供了完善的數(shù)據(jù)管理和監(jiān)控能力,操作簡單便捷。(5)穩(wěn)定可靠:向量數(shù)據(jù)庫源自騰訊內(nèi)部自研的向量檢索引擎OLAMA,近40個業(yè)生成對應的向量數(shù)據(jù)并插入數(shù)據(jù)庫或進行相似性檢索,實現(xiàn)了文本到向量數(shù)據(jù)的一騰訊云向量數(shù)據(jù)庫行業(yè)平均心3騰訊云向量數(shù)據(jù)庫行業(yè)平均表10:騰訊云向量數(shù)據(jù)庫提供實例類型免費測試版10存儲型僅供快速測試使用,更多0存儲型三可用區(qū):[2,節(jié)點數(shù)-1]騰訊云向量數(shù)據(jù)庫已被多家企業(yè)使用。截止到2023年1的各類問題,從而推動商機進展和獲取客戶;在電商領域,VectorDB應用于提升推薦、搜索、廣告業(yè)務的推薦效果;在出行領域,VectorDB有效提升自動駕駛騰訊結合公有云的技術和渠道優(yōu)勢,實現(xiàn)了VectorDB的快速推廣,為后續(xù)商業(yè)化收也反映了企業(yè)級客戶對于向量數(shù)據(jù)庫的需求是普遍存在于各行業(yè)中的。圖31:騰訊云向量數(shù)據(jù)VectorDB優(yōu)勢在于:提供更高的查詢QPS和更低的查詢延遲,適用于流量大、延遲敏感的場騰訊云向量數(shù)據(jù)庫基于CPU計算能力、內(nèi)存大小及其存儲能力,將節(jié)點規(guī)格劃分為們判斷,VectorDB的收費標準或與其產(chǎn)品性能以及消耗的計算和存儲資源相關。表11:騰訊云向量數(shù)據(jù)庫提供節(jié)點規(guī)格(GB)存儲下估算的向量規(guī)模,不包含標量數(shù)據(jù))存儲型1824824488級大規(guī)模向量數(shù)據(jù)快速查詢更新的能力,內(nèi)置自研的ANN索引算法可以使得查詢時已上線華為云,用戶根據(jù)CPU核數(shù)、內(nèi)存大小和態(tài)支撐能力為GaussDBVector產(chǎn)品競爭力及后續(xù)的商業(yè)化拓展提供了保表12:華為云GaussDBVector向量數(shù)據(jù)庫產(chǎn)品規(guī)格應用場景3超高IO5超高IO早期開始技術探索的公司并未形成明顯的技術壁壘和先發(fā)優(yōu)勢。在商業(yè)化方面,向本的產(chǎn)品給用戶試用,而基于公有云的SaaS服務和星環(huán)科技的社區(qū)版Hippo都嘗試通過軟件的輕量化及部署的便捷化來推廣向量數(shù)據(jù)庫產(chǎn)品。我們認為,向量數(shù)據(jù)庫在AI大模型訓練和推理過程中的實際效果得到用戶充分認識后,產(chǎn)品拓展過程有望業(yè)客戶使用AI大模型的實際需求以及其在AI大模型技術中應用的實際效果。及金融機構的業(yè)務普遍涉及敏感數(shù)據(jù),對數(shù)據(jù)安全具有較高要求,考慮數(shù)據(jù)安全的據(jù),2022年,美國SaaS公司數(shù)量為1.7萬個,中國SaaS公司數(shù)量為702個。020200軟件上云環(huán)境的差異導致中美開發(fā)向量數(shù)據(jù)庫的公司類別有所差異。海外的云計算以獨立第三方(Pinecone、Weaviate和Zilliz)為主模式接受度不高的環(huán)境下,以騰訊云和華為云為代表的云計算廠商更愿意選擇開發(fā)標準化的向量數(shù)據(jù)庫產(chǎn)品,對外開拓市場。因此,在國內(nèi)云計算公司與獨立第三方司對于向量數(shù)據(jù)庫產(chǎn)品的定位、商業(yè)化優(yōu)劣勢以及競合關系的變化。表13:在云計算平臺上提供SaaS服務的向量數(shù)據(jù)庫產(chǎn)品ZillizCloud、Weaviate、Pinecone、QdraZillizCloud、Weaviate、Pinecone、Qdra微軟云ZillizCloud、Weaviate、Pineco騰訊云TencentCloudVector1.獨立第三方公司的向量數(shù)據(jù)庫產(chǎn)品化和商業(yè)化能力是競爭的關鍵風險到提供個性化的投資建議,金融領域存在較多的智能化需求,但相關數(shù)據(jù)涉及三方公司的向量數(shù)據(jù)庫產(chǎn)品在金融、醫(yī)療等線下部署的場景中更易推廣。對于行業(yè)數(shù)據(jù)和需求理解深刻獨立第三方公司在向量數(shù)據(jù)庫商業(yè)拓展時更具優(yōu)勢。不同行業(yè)數(shù)據(jù)結構和組織方式不同,這導致向量數(shù)據(jù)庫在數(shù)據(jù)導入、轉換和向量化容的要求和需求不盡相同,向量檢索算法在訓練和推理階段在不同行業(yè)也有一定優(yōu)化提升的空間。從這一角度來看,對行業(yè)數(shù)據(jù)特點理解深刻且對用戶需求具有洞察力的公司開發(fā)的向量數(shù)據(jù)庫在部分行業(yè)具有一定優(yōu)勢,典型如星環(huán)科技在金融行業(yè)向量數(shù)據(jù)庫處于產(chǎn)品化和商業(yè)化的早期階段,配合標準化產(chǎn)品的技術服務是關鍵。向量數(shù)據(jù)庫發(fā)展時間較短,相應功能難以廣泛滿足各行業(yè)需求,在商業(yè)化落地過程技術服務的及時性和專業(yè)性將是向量數(shù)據(jù)庫公司新客拓展、老客留存的關鍵。我們中更具優(yōu)勢。相較于初創(chuàng)型的公司,星環(huán)科技已擁有410人的技術支持團隊(截至2022年12月底對于新產(chǎn)品的市場推廣、商業(yè)化策略制定以及客戶溝通研發(fā)人員技術支持人員銷售人員管理人員輕量化和免費版本的向量數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年模具設計師資格認證復習用試題及答案
- 如何進行體育經(jīng)紀人職業(yè)規(guī)劃試題及答案
- 創(chuàng)新思路的體育經(jīng)紀人資格考試試題及答案
- 模具設計成果的評估標準試題及答案
- 體育經(jīng)紀人考試試題及答案全解鎖
- 2024年模具設計師資格認證常見問題試題及答案
- 2024年裁判員考試知識延伸試題及答案
- 2024年體育經(jīng)紀人資格考試志愿者經(jīng)驗試題及答案
- 模具設計師資格考試職業(yè)路徑試題及答案
- 保安工作總結計劃環(huán)保行業(yè)保安工作的廢物管理
- 江蘇省2024年中職職教高考文化統(tǒng)考烹飪專業(yè)綜合理論真題試卷
- 2025年電力人工智能多模態(tài)大模型創(chuàng)新技術及應用報告-西安交通大學
- T-CBIA 009-2022 飲料濃漿標準
- 事故隱患內(nèi)部舉報獎勵制度
- 離婚協(xié)議書電子版下載
- 蘇教版二年級數(shù)學下冊《第2單元 練習二》教學課件PPT小學公開課
- 長期購銷合作協(xié)議書參考
- 入團志愿書(2016版本)(可編輯打印標準A4) (1)
- 警棍盾牌術基本動作
- 撰寫課題申請書的五個關鍵(課堂PPT)
- 英語作業(yè)分層設計案例
評論
0/150
提交評論