FFA2024分論壇-云原生 合輯_第1頁
FFA2024分論壇-云原生 合輯_第2頁
FFA2024分論壇-云原生 合輯_第3頁
FFA2024分論壇-云原生 合輯_第4頁
FFA2024分論壇-云原生 合輯_第5頁
已閱讀5頁,還剩204頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

流批混部未來展望…ServerlessFlink…vn-agentvn-agent↓VirtualCluster標準化多租VirtualAPIServer輕量化多租VirtualAPIServer輕量化多租……↓↓↓agentansmagentansmflink-reserveflink-reserve-capacityflinkflink-pay-as-you-go…… …………AjobjobAjobjob …………replicas:2-ntopologySpreadConstra-labelSelector:matchLabels:/network-service-id:abcdmaxSkew:1topologyKey:topology.kubernetes.io/zonewhenUnsatisfiable:DoNotScheduleaffinity:nodeAffinity:requiredDuringSchedulingIgnoredDuri-matchExpressions:-key:topology.kubernetes.io/zoneoperator…………XXXXansmappswatchappswatchwatchwatch……pyxispyxis-managerTHANKYOUFlinkonYarnFlinkonK8sFlinkon20182023↓7.create6.createvalidate2.spec5.create...jobmanagerjobmanager2jobmanager1jobmanager1........taskmanager1....taskmanager1taskmanager2!!4.4.3.上傳jar1.提交jar3.上傳jar1.提交jar—學alerttalos!aggregatealerttalos!aggregateapply 核THANKYOUServerlessFlink:小紅書在云上k8sServerlessFlink:Xiaohongshu'sJourneyinMigratingandDeployingFlinkClusters………………各個子業(yè)務使用不同的獨占資源池,維護上百資源池人力成本巨大各個子業(yè)務使用不同的獨占資源池,維護上百資源池人力成本巨大Flink獨占池擴縮容流程復雜,涉及預算審批、云廠商開關機、機器環(huán)境初單次流程耗時在天級別nodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodFlink獨占集群公共混部集群FlinkQuotaFlinkQuotaB其他業(yè)務其他業(yè)務quotaCFlinkQuotaAFlinkQuotaAnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodFlinkPodnodeFlinkPodFlinkPodFlinkPodnodenodeFlinkPodnodenodeFlinkPodPodFlinkPodquota擴容quota縮容啟動quota擴容BaremetalSupplyBaremetalSupply標準混部池標準混部池Bu?erBu?erControllerAPIServerWorkload畫像服務Workload畫像服務ControllerMetricsAwareController更新預測指標獲取歷史監(jiān)控監(jiān)控系統(tǒng)resourcePro?lerMetricsAware監(jiān)控系統(tǒng)resourcePro?lerMetricsAware匯總畫像,更新NodeMetrics監(jiān)聽監(jiān)聽MetricsAwareAgentAgentAgentAgentresourcePro?lerlMetricsAwareresourcePro?lerlMetricsAware實時負載感知調度SchedulerDescheduler動態(tài)更新規(guī)則實時負載感知二次調度容器服務容器服務Node維度匯總待驅逐的pod構造Flink請求URL請求驅逐Pod列表請求驅逐Pod列表校驗pod是否在用返回RequestId或者結果根據(jù)RequestId輪訓結果申請冗余pod資源ready后拉黑pod并觸發(fā)task重啟返回是否可驅逐根據(jù)返回結果執(zhí)行驅逐或放棄釋放空閑pod根據(jù)返回結果執(zhí)行驅逐或放棄收到驅逐請求收到驅逐結果請求生成并返回RequestId返回生成并返回RequestId返回RequestId對應的請求狀態(tài)結束根據(jù)請求傳入的Pod結束根據(jù)請求傳入的Pod數(shù)量,申請對應的新Pod否是否申請完成 是否申請完成 是否超時是觸發(fā)checkpoint觸發(fā)checkpoint獲取Pod上的Task集合主動重啟Task上述流程正常上述流程正常執(zhí)行否設置驅逐請求為失敗否設置驅逐請求為失敗是設置驅逐請求為成功結束設置驅逐請求為成功結束使用CSIEphemeralInlineVolum資源擴縮容耗時資源擴縮容耗時擴大池化資源覆蓋度年底遷移60kcore左右總體成本收益接近10k年底遷移60kcore左右總體成本收益接近10kcore應用AutoScaler進一步THANKYOUjobjob1job2job3...managerapiserverflinkmanagerapiserverflink/cancel等操作fetchjarjobjob-修復線程池設置bugrest服務就緒慢-不等待service關聯(lián)pod-池化復用RestClient序列化操作頻繁-刪除不必要的序列化操作operator可調諧的單集群任務數(shù)達到2w提交作業(yè)吞吐可達1000app/分鐘,全程穩(wěn)定整體吞吐1000整體吞吐1000app/m單app啟動時延小于1.5minwatchindex優(yōu)化watcherswatchers單機Pod數(shù)與系統(tǒng)內存關系(G)864208單機Pod數(shù)與系統(tǒng)內存關系(G)86420850nodeCache:一輪調度中同質作業(yè)的調度cache,nodeCache:一輪調度中同質作業(yè)的調度cache,cachecachejobjobjoballocatejobache3allocatejobache3 源assignableexclusivewatchwatchapiserverwatchTaint/cordon/drainwatchTHANKYOULarge-ScaleCloud-NativePracticeOfFlinkatBilStreaming數(shù)量:6500+Batch數(shù)量:3000+Streaming數(shù)量:6500+Batch數(shù)量:3000+流批混部、Spark混部/opt/flink/opt/flinkconfconfpluginsusrlibL──tableapi等依賴jar物理機遷移機器從YARN物理機遷移機器從YARN集群遷移為Pod掛載物理磁盤磁盤異構物理機磁盤數(shù)量不統(tǒng)一磁盤故障,權限問題等磁盤異構物理機磁盤數(shù)量不統(tǒng)一磁盤故障,權限問題等磁盤負載不均RocksDB默認隨機選擇磁盤磁盤掛載在/mnt子目錄Flink進程啟動時篩選可用目錄磁盤優(yōu)化殘留數(shù)據(jù)在殘留數(shù)據(jù)在Pod退出時,不會刪除數(shù)據(jù)增加Podlifecycle,Pod退出時通過preStop清理數(shù)據(jù)開啟HA時:任務可以從正確的Checkpoint恢復,但遇PodPod處于失敗狀態(tài)Pod處于Pod處于Running狀態(tài)啟動時根據(jù)numberOfTaskSlots值調整閾值大小,避免固定參數(shù)的不足Pid數(shù)量限制優(yōu)化服務器無法創(chuàng)建線程優(yōu)化部分作業(yè)中線程泄漏,引起所在機器可用線程數(shù)不足,影響機器上所有作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論