版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
?向?成式AI的向量數(shù)據(jù)庫:架構(gòu),性能與未來趨勢向量數(shù)據(jù)庫背景介紹Milvus整體架構(gòu)設(shè)計性能的關(guān)鍵-索引?向AI持續(xù)進化01向量數(shù)據(jù)庫背景介紹什么是向量數(shù)據(jù)什么是向量檢索找到離查詢向量最近的 條向量(TopK)怎么計算距離取決于模型定義使?怎樣的
Metric,常?的有
L2,IP
和Cosine
等什么是向量數(shù)據(jù)庫向量數(shù)據(jù)庫是?種專為存儲和查詢?維度向量數(shù)據(jù)?優(yōu)化的數(shù)據(jù)庫系統(tǒng)為什么需要向量數(shù)據(jù)庫AI
1.0時代,向量數(shù)據(jù)庫已經(jīng)被?泛應(yīng)?于機器學(xué)習(xí)應(yīng)?中,包括推薦系統(tǒng),搜索,?控,安防等系統(tǒng)中?,F(xiàn)在仍然是重要的使?場景為什么需要向量數(shù)據(jù)庫RetrievalAugmentedGeneration(RAG),向量數(shù)據(jù)庫作為存儲記憶體保存領(lǐng)域相關(guān)的知識,?于查找query相關(guān)的數(shù)據(jù)LLM從增強的提示詞中獲得為?戶量身定制的答案,增強了結(jié)果的相關(guān)性什么是?個好的向量數(shù)據(jù)庫性能擴展性易?性功能可觀測可運維?態(tài)集成故障恢復(fù)安全…您公司的logo02Milvus整體架構(gòu)設(shè)計云原?的分布式向量數(shù)據(jù)庫Proxy:接?層,負責(zé)請求編譯,檢查和路由Query:負責(zé)數(shù)據(jù)/索引的加載和查詢Data:負責(zé)數(shù)據(jù)批流轉(zhuǎn)化Index:索引構(gòu)建云原?的分布式向量數(shù)據(jù)庫強?的隔離性,建索引不爭搶查詢資源良好的擴展能?,?持百億級別的向量更加靈活的流式數(shù)據(jù)處理能?和增量更新/刪除能?實時性和性能的trade
offSegment是milvus查詢的最?單位growing
segment負責(zé)流式數(shù)據(jù)的查詢,保證數(shù)據(jù)的實時可?,性能差sealed
segment負責(zé)持久化數(shù)據(jù)的查詢。數(shù)據(jù)構(gòu)建過索引,性能好通過indexNode構(gòu)建索引替換queryNode上的數(shù)據(jù)加速查詢異步compaction把?些?segment合成?segment,加速查詢合并delete數(shù)據(jù),做物理刪除,對向量檢索更加友好批量寫??持bulk
insert功能,?戶提供json/csv/parquet等格式的?件,跳過消息隊列,直接插?到對象存儲?持Spark
connector,外部數(shù)據(jù)源可以通過Spark
ETL導(dǎo)?到Milvus全局索引根據(jù)不同租戶做劃分數(shù)據(jù)根據(jù)標量過濾條件劃分數(shù)據(jù)根據(jù)向量空間分布劃分數(shù)據(jù)Zilliz
cloud:向量數(shù)據(jù)庫即服務(wù)Zilliz
Cloud是Zilliz基于開源向量數(shù)據(jù)庫milvus打造的全托管企業(yè)級向量檢索云服務(wù)分為Serverless,SaaS和BYOC三個版本,?向不同需求和不同部署環(huán)境?前已經(jīng)登陸AWS,GCP,Azure,阿?云、騰訊云等您公司的logo03性能的關(guān)鍵-索引主流向量索引樹索引:維度災(zāi)難,性能差哈希:精確有限量化:精度有限,但?哈希更為常?圖索引:占?資源?,精度和性能優(yōu)異哈希量化圖樹knowhere引擎Knowhere作為milvus的核?向量引擎,集成了多種向量算法,供?戶?由選擇對外統(tǒng)?接?,?便集成新索引FLAT暴搜:效率很低,但100%準確!數(shù)據(jù)量少的時候可能優(yōu)于索引的性能IVF對數(shù)據(jù)點做聚類,分成若?個buckets查詢時找到query最近的nprobe個buckets,避免搜索全量數(shù)據(jù)Product
quantization將向量分成m段,每段?向量通過聚類編碼成聚類中?id,有效壓縮向量的內(nèi)存占?查詢時預(yù)計算query向量和每段聚類中?的距離,把距離計算轉(zhuǎn)化成查表操作HNSW?前最為?泛使?的圖索引建索引的原則:近鄰的近鄰?概率是近鄰,同時引??些?邊防?陷?局部最優(yōu)層次化的結(jié)構(gòu)快速定位,貪?式搜索找到最終結(jié)果DISKANNDisk中保存圖索引,并按照向量本身和鄰居id?起存的?式增強locality。每次IO同時得到原始向量計算精確距離,同時得到鄰居id,?到內(nèi)存中的PQ編碼計算近似距離?于導(dǎo)航DiskANN可以實現(xiàn)較低的內(nèi)存占?,達到還不錯的性能和?精度GPU
cagra和NVIDIA團隊合作,將gpu
cagra索引集成到knowhere,充分利?gpu的并?計算能?,加速索引構(gòu)建和查詢?nèi)绾芜x擇最合適的索引希望降低cost考慮采?disk的?案,量化的?案。希望提?accuracy則不去做激進的量化策略,要求很?則使?FLAT。希望提?performance,采?內(nèi)存圖索引/gpu索引?案不可能三?:必須在限制的條件中進?篩選最合適的策略Zilliz
cloud商業(yè)版索引引擎-cardinal更加?程化的代碼更智能的參數(shù)學(xué)習(xí)更加優(yōu)異的數(shù)據(jù)存儲布局更加極致的SIMD優(yōu)化您公司的logo04?向AI持續(xù)進化Filter
search帶標量過濾條件的向量檢索已經(jīng)成為?個基本需求milvus?持多種scalar
index加速標量過濾的效率。同時?持向量側(cè)通過標量分布構(gòu)建融合索引加速過濾Sparse
vector不?于dense
vector!
與dense
vector跟更加關(guān)注語義不同,sparse
vector提取了關(guān)鍵詞的信息,通過關(guān)鍵詞匹配找相關(guān)的結(jié)果,可解釋性強在out
of
domain的數(shù)據(jù)上sparse
vector更有優(yōu)勢Hybrid
search?持多向量多模態(tài)存儲和檢索,可以是多個densevector,也可以是densevector和sparse
vector的組合可以從更多信息的維度進?召回和rerankGrouping
search僅向量維度的召回不?定滿??戶的需求。在?本檢索時,?個向量代表?個chunk,缺少全?視?可以通過doc維度做聚合搜索更加易
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年“十佳班長”演講稿模版(2篇)
- 班級五一勞動節(jié)活動方案例文(2篇)
- 酒店消防應(yīng)急演練方案模版(3篇)
- 醫(yī)院院務(wù)公開實施細則例文(二篇)
- 學(xué)校行政值日人員職責(zé)模版(3篇)
- 管理處年度工作目標責(zé)任狀模版(3篇)
- 2024年度安全工作總結(jié)范例(2篇)
- GB/T 45036-2024糧油檢驗樣品信息采集技術(shù)規(guī)范
- 《講課用找規(guī)律》課件
- 交界痣的臨床護理
- 一年級第一學(xué)期口算題(20以內(nèi)口算天天練-15份各100題精確排版)
- 微胖女裝商業(yè)計劃書
- 材料力學(xué)第4版單輝祖習(xí)題答案
- 造紙企業(yè)清潔生產(chǎn)報告2014年
- 診所抗菌藥物管理制度
- 智慧嬰幼兒托管解決方案
- 設(shè)計構(gòu)成與應(yīng)用 完整全套教學(xué)課件 第1-12章 平面構(gòu)成設(shè)計元素- 立體構(gòu)成在建筑設(shè)計中的應(yīng)用
- 2、廣東省高速公路發(fā)展股份有限公司 2019年度內(nèi)控缺陷整改臺賬
- 物業(yè)公司安全生產(chǎn)檢查表
- 室內(nèi)配套設(shè)備家具、家電及窗簾等項目供貨服務(wù)方案技術(shù)投標方案
- 公司規(guī)章制度清單
評論
0/150
提交評論