版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
百度大數(shù)據(jù)即席查詢服務(wù)BaiduBigSQL/孫垚光自我介紹基礎(chǔ)架構(gòu)部分布式計(jì)算團(tuán)隊(duì)孫垚光09年-11年:Linux內(nèi)核/網(wǎng)絡(luò)協(xié)議棧優(yōu)化11年-今:分布式計(jì)算/百度開放云Hadoop/Spark百度開放云即席查詢服務(wù)(BigSQL)?BigSQL定位/特點(diǎn)?BigSQL架構(gòu)?BigSQL關(guān)鍵技術(shù)?BigSQL在Baidu內(nèi)部的應(yīng)用?下一步計(jì)劃即席查詢服務(wù)(BigSQL)?BigSQL定位/特點(diǎn)?BigSQL架構(gòu)?BigSQL關(guān)鍵技術(shù)?BigSQL在Baidu內(nèi)部的應(yīng)用?下一步計(jì)劃BigSQL定位?大數(shù)據(jù)即席查詢(Ad-HocQuery)平臺(tái)?:開箱即用,用戶無需關(guān)心機(jī)器/集群的運(yùn)維/細(xì)節(jié)?高性能/規(guī)模:裸機(jī)/優(yōu)化/最大PB量級(jí)以上?低成本:多租戶共享集群/按使用付費(fèi)BigSQL特點(diǎn)?數(shù)據(jù)格式:半結(jié)構(gòu)化(等)?使用接口:易用/多樣化()?語法集:兼容開源SparkSQL/HQL?按使用付費(fèi):按(Query復(fù)雜度+掃描數(shù)據(jù)量)計(jì)費(fèi)?多用戶協(xié)同:靈活的權(quán)限管理Ad-HocQuery?面向“人”的查詢ü交互式():?查詢具有較高時(shí)效性ü即席(Ad-Hoc):?查詢模式相對(duì)不固定?數(shù)據(jù)沒有(時(shí)間/成本)做過多預(yù)處理即席查詢多維分析Ad-HocQueryOLAP數(shù)據(jù)密度加工過程查詢模式弱(半)結(jié)構(gòu)化粗(淺)加工相對(duì)隨機(jī)高度結(jié)構(gòu)化深度加工相對(duì)固定SQLonHadoop/SparkSQL擴(kuò)展性1000臺(tái)以內(nèi)/PB以下千臺(tái)以上/PB以上查詢延遲架構(gòu)復(fù)雜性容錯(cuò)毫秒~秒中等秒~分鐘復(fù)雜無有調(diào)度策略啟停開銷小/常駐進(jìn)程分批大/現(xiàn)啟動(dòng)松散與存儲(chǔ)結(jié)合程度緊密BigSQL示意圖UserueryUserQueryBigSQLServiceStreamingBatchBOSr即席查詢服務(wù)(BigSQL)?BigSQL定位/特點(diǎn)?BigSQL架構(gòu)?BigSQL關(guān)鍵技術(shù)?BigSQL在Baidu內(nèi)部的應(yīng)用?下一步計(jì)劃BigSQL整體架構(gòu)SDKCLIRESTAPIConsole接入層(HttpServer)StateStoreSessionManagerIAMSessionWorkerSessionWorkerQuerySessionWorkerQueryQueryQueryQueryMetaStoreQuerySparkContextSparkContextSparkContext賬單監(jiān)控SchedulerCompute&StorageClusterBigSQL整體架構(gòu):接入層?易用性:各種形式的API?可用性:關(guān)鍵節(jié)點(diǎn)容錯(cuò)?安全:租戶認(rèn)證和鑒權(quán)、限制?賬單?監(jiān)控BigSQL整體架構(gòu):引擎層接入層SessionWorkerSessionWorkerSessionWorkerSessionWorker計(jì)算引擎(Spark)APPAPPAPPAPPExecutorExecutorExecutorExecutorExecutorExecutorExecutorExecutor分布式緩存(CacheManager)存儲(chǔ)引擎(DFS/ColumnStorage)即席查詢服務(wù)(BigSQL)?BigSQL定位/特點(diǎn)?BigSQL架構(gòu)?BigSQL關(guān)鍵技術(shù)?BigSQL在Baidu內(nèi)部的應(yīng)用?下一步計(jì)劃BigSQL關(guān)鍵技術(shù)(一)高性能BigSQL關(guān)鍵技術(shù)(一)高性能BigSQL關(guān)鍵技術(shù)(一)BigSQL關(guān)鍵技術(shù)(二)數(shù)據(jù)緩存層UserUser接入層計(jì)算引擎(Spark)CacheManager存儲(chǔ)引擎(HDFS+Parquet)BigSQL關(guān)鍵技術(shù)(二)數(shù)據(jù)緩存策略l按需緩存?Query運(yùn)行時(shí)觸發(fā)Cachemiss,異步load到緩存l數(shù)據(jù)預(yù)取?周期性Load相關(guān)到緩存?根據(jù)過去Query信息統(tǒng)計(jì)熱點(diǎn)數(shù)據(jù),提前Load到緩存典型案例:跨地域查詢加速(提升至少一個(gè)數(shù)量級(jí))BigSQL關(guān)鍵技術(shù)(三)優(yōu)化執(zhí)行l(wèi)智能參數(shù)優(yōu)化?利用Combine類,減少數(shù)?根據(jù)上游輸出,自動(dòng)優(yōu)化數(shù)目l調(diào)度優(yōu)化?評(píng)估數(shù)據(jù)量,自動(dòng)復(fù)用或者啟用新的l近似查詢?長(zhǎng)尾任務(wù)自動(dòng)忽略,保證時(shí)效性BigSQL關(guān)鍵技術(shù)(四)資源隔離/安全l基于的隔離?CPU/Memory/FS?本身的加固?網(wǎng)絡(luò)的互通與隔離lJVM沙箱層的多種安全策略l計(jì)算/存儲(chǔ)框架層的安全認(rèn)證和加密傳輸即席查詢服務(wù)(BigSQL)?BigSQL定位/特點(diǎn)?BigSQL架構(gòu)?BigSQL關(guān)鍵技術(shù)?BigSQL在Baidu內(nèi)部的應(yīng)用?下一步計(jì)劃在Baidu內(nèi)部的應(yīng)用鳳巢廣告數(shù)據(jù)分析l漏斗分析?分析廣告被過濾的原因,各個(gè)維度特征等l系統(tǒng)優(yōu)化和問題定位?分析系統(tǒng)業(yè)務(wù)日志,發(fā)現(xiàn)可優(yōu)化的指標(biāo)和潛在問題日均掃描數(shù)據(jù)量:xxPB即席查詢服務(wù)(BigSQL)?BigSQL定位/特點(diǎn)?BigSQL架構(gòu)?BigSQL關(guān)鍵技術(shù)?BigSQL在Baidu內(nèi)部的應(yīng)用?下一步計(jì)劃BigSQL后續(xù)規(guī)劃l持續(xù)投入技術(shù)研發(fā)?更智能的數(shù)據(jù)緩存層:細(xì)粒度/物化視圖選取?實(shí)時(shí)更新?向量執(zhí)行:提高CPU命中率?CBO:BigSQL后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度婚慶司儀婚禮現(xiàn)場(chǎng)化妝造型服務(wù)合同6篇
- 人教版初中歷史與社會(huì)七年級(jí)上冊(cè) 2.1.2 海洋對(duì)人類的影響說課稿及反思
- 人教版七年級(jí)歷史與社會(huì)上冊(cè) 2.2《自然黃靜》之氣象萬千、風(fēng)光迥異 說課稿
- 2025版快遞業(yè)務(wù)數(shù)據(jù)處理與信息安全保密合同2篇
- 湖北省黃岡市普通高中2024-2025學(xué)年高二上學(xué)期11月階段性聯(lián)考語文試卷(含答案)
- 2025年環(huán)保設(shè)施安裝與運(yùn)營服務(wù)合同3篇
- 湖北恩施市2024-2025學(xué)年九年級(jí)上學(xué)期語文期末考試題卷(含答案)
- 河南省南陽市(2024年-2025年小學(xué)六年級(jí)語文)統(tǒng)編版小升初模擬(上學(xué)期)試卷及答案
- 2025高考數(shù)學(xué)二輪復(fù)習(xí)-微培優(yōu)7 數(shù)列中的情境創(chuàng)新與數(shù)學(xué)文化【課件】
- Unit 7 第3課時(shí) Section B (1a-2b)2024-2025學(xué)年新教材七年級(jí)英語上冊(cè)同步說課稿(人教版2024)河北專版
- 工程項(xiàng)目移交交接單
- 角膜解剖結(jié)構(gòu)最全課件
- 部編人教版六年級(jí)下冊(cè)語文第3課古詩三首(優(yōu)質(zhì)公開課教案)
- 慢阻肺PPT精品課件
- 湘教文藝版小學(xué)五年級(jí)音樂上冊(cè)期末測(cè)試題
- 某項(xiàng)目及項(xiàng)目天棚吊頂安全性受力分析計(jì)算稿
- 艾滋病、梅毒和乙肝檢測(cè)服務(wù)流程
- 中聯(lián)16T吊車參數(shù)
- J-STD-020D[1].1中文版
- 鐵血鑄軍魂軍人風(fēng)采紀(jì)念冊(cè)戰(zhàn)友聚會(huì)部隊(duì)退伍退役轉(zhuǎn)業(yè)老兵歡送會(huì)電子相冊(cè)PPT實(shí)施課件
- 土壤侵蝕原理
評(píng)論
0/150
提交評(píng)論