高超:?向生成式AI的向量數(shù)據(jù)庫(kù):架構(gòu)性能與未來(lái)趨勢(shì)_第1頁(yè)
高超:?向生成式AI的向量數(shù)據(jù)庫(kù):架構(gòu)性能與未來(lái)趨勢(shì)_第2頁(yè)
高超:?向生成式AI的向量數(shù)據(jù)庫(kù):架構(gòu)性能與未來(lái)趨勢(shì)_第3頁(yè)
高超:?向生成式AI的向量數(shù)據(jù)庫(kù):架構(gòu)性能與未來(lái)趨勢(shì)_第4頁(yè)
高超:?向生成式AI的向量數(shù)據(jù)庫(kù):架構(gòu)性能與未來(lái)趨勢(shì)_第5頁(yè)
已閱讀5頁(yè),還剩66頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

面向生成式Al的向量數(shù)據(jù)庫(kù):架構(gòu),性能與未來(lái)趨勢(shì)高超/Zilliz工程師高超D向量數(shù)據(jù)庫(kù)背景介紹D性能的關(guān)鍵-索引向量數(shù)據(jù)庫(kù)背景介紹zilliz樣的Metric,常見的有L2,IP米zilliz·向量數(shù)據(jù)庫(kù)是一種專為存儲(chǔ)和查詢高維度向量數(shù)據(jù)而優(yōu)化的數(shù)據(jù)庫(kù)系統(tǒng)Vector已經(jīng)被廣泛應(yīng)用于機(jī)器學(xué)習(xí)應(yīng)用中,包括推薦系統(tǒng),搜索,風(fēng)控,安防等系統(tǒng)中。現(xiàn)在仍然是重要的使用場(chǎng)景搞笑美女網(wǎng)頁(yè)新同首頁(yè)圖說(shuō)新聞搞笑美女網(wǎng)頁(yè)新同首頁(yè)圖說(shuō)新聞該圖片可能是:榴蓮酥該圖片可能是:榴蓮酥相似圖片Generation(RAG),VectorVector米zilliz什么是一個(gè)好的向量數(shù)據(jù)庫(kù)·可觀測(cè)可運(yùn)維·加載和查詢4·Index:索引構(gòu)建爭(zhēng)搶查詢資源LogBroker目目目▲▲▲▲實(shí)時(shí)性和性能的tradeoff·Segment是milvus查詢的最小單位詢,保證數(shù)據(jù)的實(shí)時(shí)可見,性能差queryNode上的數(shù)據(jù)加速查詢segment,加速查詢向量檢索更加友好件,跳過(guò)消息隊(duì)列,直接插入到對(duì)象存儲(chǔ)全局索引向量數(shù)據(jù)庫(kù)即服務(wù)多實(shí)例架多實(shí)例架訪問(wèn)控制多AZ高可用監(jiān)控告警審計(jì)全商業(yè)版商業(yè)版理鑒權(quán)BYOC三個(gè)版本,面向不同需鑒權(quán)網(wǎng)絡(luò)控制網(wǎng)絡(luò)控制Azure,阿里云、騰訊云等主流向量索引●樹索引:維度災(zāi)難,性能差·量化:精度有限,但比哈希更為常用·圖索引:占用資源高,精度和性能優(yōu)異樹哈希量化圖·Knowhere作為milvus的核心向量引擎,集成了多種向量算法,供用戶自由選擇·對(duì)外統(tǒng)一接口,方便集成新索引米zilliz·暴搜:效率很低,但100%準(zhǔn)確!●數(shù)據(jù)量少的時(shí)候可能優(yōu)于索引的性能·對(duì)數(shù)據(jù)點(diǎn)做聚類,分成若干個(gè)buckets,避免搜索全量數(shù)據(jù)量通過(guò)聚類編碼成聚類中心id,有效壓縮向量的內(nèi)存占用·查詢時(shí)預(yù)計(jì)算query向量和每段聚類中心的距離,把距離計(jì)算轉(zhuǎn)化成查表操作y?Y?y?Y?y4y?y?y7y?·建索引的原則:近鄰的近鄰大概率是近鄰,同時(shí)引入一些長(zhǎng)邊防止陷入局部最優(yōu)索找到最終結(jié)果NeighborsVec2Neig計(jì)算精確距離,同時(shí)得到鄰居id,用到內(nèi)存中的PQ編碼計(jì)算近似距離用于導(dǎo)航·DiskANN可以實(shí)現(xiàn)較低的內(nèi)存占用,達(dá)到還不錯(cuò)的性能和高精度集成到knowhere,充分利用gpu的并行計(jì)算能力,加速索引構(gòu)建和查詢Milvus-CAGRAvsMilvus-HNSWMilvus-CAGRAvsMilvus-HNSW500K1536-dimT4A10GT4:16.8xA10G:25.8xT4:6.7xA10G:9x如何選擇最合適的索引量化的方案。·希望提高accuracy則不去做激進(jìn)的量化策略,要求很高則使用FLAT。索引/gpu索引方案Zillizcloud商業(yè)版索引引擎-cardinal成為一個(gè)基本需求標(biāo)量過(guò)濾的效率。同時(shí)支持向量側(cè)通過(guò)標(biāo)量分布構(gòu)建融合索引加速過(guò)濾774a63r33s42e640700006076304004300004200000000032dense=[0.2,0.3,0.5,0.7,...]#severalhundredfloatsMRR@10R@1000NDCG@10R@1000--檢索,可以是多個(gè)densevector,也可以是denseVectors_t→→Input:Multi-VectorsDataset:Multi-fields78.480.056.955.557.778.657.859.356.072.869.970.178.686.67.168.743.738.845.265.335.548.248.956.361.544.557.979.070.79.681.159.457.258.880.159.061.458.274.571.271.279.087.79.680.758.857.559.279.757.662.858.373.971.369.878.5的需求。在文本檢索時(shí),一個(gè)向量代表一個(gè)chunk,缺少全文視角Exam

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論