智算時代基于 Kubernetes 落地云原生 AI_第1頁
智算時代基于 Kubernetes 落地云原生 AI_第2頁
智算時代基于 Kubernetes 落地云原生 AI_第3頁
智算時代基于 Kubernetes 落地云原生 AI_第4頁
智算時代基于 Kubernetes 落地云原生 AI_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

張凱阿里云云原生應(yīng)用平臺2023年12月1日learninglearning)?度享..更快的創(chuàng)新和迭代交付.DockerKubernetesKubeflowKserveFluidMLFlow 支持TensorFlow,Pytorch,Deep任務(wù)級調(diào)度策略(Gang,Binpack,Capacity,架),Meegatron-llm云AIAI平臺/DatasetProc速Kube-queueDatasetProc速Kube-queueKubeflowArenaPipelineDeepspeed-Kserve/Tritonmer/RDM度yCPU(x86/arn)?Total/allocatedGPUKubeletgpu0gpu0gpu0gpu1gpu0gpu0gpu0gpu0gpu0gpu1gpu0gpu0ContainerContainerArgoArgo片/Ahttps/fluid-cloudnative/fluidSOSO分布式緩存Dataset源FluidvsOSSFS(20Gb/s)70000600005000040000300002000000ModelServingProgramModelHuggingFaceTGIServer/StableDiffusion/…DistributedCacheShardShardShardShardShardLLM模型加載耗時對比(單位:秒)ArenaArena--name=tf-dist-data--workers=6--gpus=2--data=tfdata:/data_dir–--env=num_batch=100--env=batch_size=80--tensorboard--image=ali-tensorflow:gpu-tf-1.6.0\"/root/hvd-distribute.sh122”ArenaArena/job:ps/task:0/job:worker/task:1/job:worker//job:ps/task:0/job:worker/task:1/job:worker/task:2/job:ps/task:0/job:worker/task:0(chief)elv3elv3 BaichuanBaichuan--image=xxx-text-generation-inference:0.8\"text-generation-launcher--disable-custom-kernels--model-idTensorflow--label/eci=true\--label/fluid-sidecar-target=eci\--annotation/eci-use-specs=ecs.gn6v-c8g1.2xlarge\--imag=xxx-bloom-finetune:v2\--data=oss-data:/mymodels\RemoteShuffleRemoteShuffle化SparkApplicationOperatorSparkDriverSparkExecutorPods天倚SparkExecutorPod倚天FluidACKSparkApplicationOperatorSparkDriverSparkExecutorPods天倚SparkExecutorPod倚天Fluid12341234低延時LB直通pod服務(wù)化運維arenaArena低延時LB直通pod服務(wù)化運維arenaArena度TensorflowTensorflowScaling

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論