版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
Flink大數(shù)據(jù)分析實(shí)戰(zhàn)讀書筆記模板01思維導(dǎo)圖目錄分析讀書筆記內(nèi)容摘要作者介紹精彩摘錄目錄0305020406思維導(dǎo)圖實(shí)戰(zhàn)書籍?dāng)?shù)據(jù)處理語言大數(shù)據(jù)主流案例數(shù)據(jù)架構(gòu)示例數(shù)量訂單第章基本概念策略圖單詞程序結(jié)構(gòu)模式本書關(guān)鍵字分析思維導(dǎo)圖內(nèi)容摘要內(nèi)容摘要本書作為Flink的入門書,從Flink核心編程語言Scala講起,涵蓋當(dāng)前Flink主流的開發(fā)組件。以實(shí)操為主,深入講解每一個(gè)操作步驟,包括DataSetAPI離線數(shù)據(jù)處理、FlinkSQL快速結(jié)構(gòu)化數(shù)據(jù)處理、DataStream實(shí)時(shí)數(shù)據(jù)處理,同時(shí)包括案例講解、源碼剖析、常用Shell命令和ScalaAPI詳解。即使沒有任何Flink基礎(chǔ)的讀者也可以對照書中的步驟成功搭建屬于自己的Flink集群,是一本真正的實(shí)操指南書籍。本書可作為大數(shù)據(jù)開發(fā)人員的隨身手冊,也可作為Flink新手入門的指導(dǎo)書籍,以及大數(shù)據(jù)從業(yè)者的參考用書。目錄分析1.1大數(shù)據(jù)開發(fā)總體架構(gòu)1.2什么是Flink1.3Flink的應(yīng)用場景1.4流計(jì)算框架對比第1章初識Flink1.5Flink的主要組件1.7快速體驗(yàn)Flink程序1.6Flink編程模型第1章初識Flink1.6Flink編程模型1.6.1數(shù)據(jù)集1.6.2編程接口1.6.3程序結(jié)構(gòu)1.7快速體驗(yàn)Flink程序1.7.1IntelliJIDEA安裝Scala插件1.7.2IntelliJIDEA創(chuàng)建Flink項(xiàng)目1.7.3示例:批處理單詞計(jì)數(shù)1.7.4示例:流處理單詞計(jì)數(shù)2.1Flink運(yùn)行時(shí)架構(gòu)2.3Flink數(shù)據(jù)分區(qū)2.2Flink任務(wù)調(diào)度原理第2章Flink運(yùn)行架構(gòu)及原理2.1Flink運(yùn)行時(shí)架構(gòu)2.1.1YARN集群架構(gòu)2.1.2FlinkStandalone架構(gòu)2.1.3FlinkOnYARN的架構(gòu)2.2Flink任務(wù)調(diào)度原理2.2.1任務(wù)鏈2.2.2并行度2.2.3共享TaskSlot2.2.4數(shù)據(jù)流2.2.5執(zhí)行圖2.2.6執(zhí)行計(jì)劃2.3Flink數(shù)據(jù)分區(qū)2.3.1分區(qū)數(shù)量2.3.2分區(qū)策略3.1Flink集群搭建3.3Flink命令行界面3.2FlinkHA模式第3章Flink安裝及部署3.5FlinkShell的使用3.4Flink應(yīng)用提交第3章Flink安裝及部署3.1Flink集群搭建3.1.1Flink本地模式搭建3.1.2FlinkStandalone搭建3.1.3FlinkOnYARN搭建3.2FlinkHA模式3.2.1FlinkStandalone模式的HA架構(gòu)3.2.2FlinkStandalone模式HA集群搭建3.2.3FlinkOnYARN模式HA集群搭建4.1基本概念4.2執(zhí)行模式4.3作業(yè)流程4.4程序結(jié)構(gòu)4.5Source數(shù)據(jù)源12345第4章FlinkDataStreamAPI4.6Transformation數(shù)據(jù)轉(zhuǎn)換4.7Sink數(shù)據(jù)輸出4.8數(shù)據(jù)類型與序列化4.9分區(qū)策略第4章FlinkDataStreamAPI4.10窗口計(jì)算4.12狀態(tài)管理4.11水印第4章FlinkDataStreamAPI4.13容錯(cuò)機(jī)制4.14案例分析:計(jì)算5秒內(nèi)輸入的單詞數(shù)量4.15案例分析:統(tǒng)計(jì)5分鐘內(nèi)每個(gè)用戶產(chǎn)生的日志數(shù)量4.16案例分析:統(tǒng)計(jì)24小時(shí)內(nèi)每個(gè)用戶的訂單平均消費(fèi)額第4章FlinkDataStreamAPI4.17案例分析:計(jì)算5秒內(nèi)每個(gè)信號燈通過的汽車數(shù)量4.19案例分析:天貓雙十一實(shí)時(shí)交易額統(tǒng)計(jì)4.18案例分析:Flink整合Kafka計(jì)算實(shí)時(shí)單詞數(shù)量第4章FlinkDataStreamAPI4.5Source數(shù)據(jù)源4.5.1基本數(shù)據(jù)源4.5.2高級數(shù)據(jù)源4.5.3自定義數(shù)據(jù)源4.9分區(qū)策略4.9.1內(nèi)置分區(qū)策略4.9.2自定義分區(qū)策略4.10窗口計(jì)算4.10.1事件時(shí)間4.10.2窗口分類4.10.3窗口函數(shù)4.10.4觸發(fā)器4.10.5清除器4.11水印4.11.1計(jì)算規(guī)則4.11.2允許延遲與側(cè)道輸出4.11.3生成策略4.12狀態(tài)管理4.12.1KeyedState4.12.2OperatorState4.13容錯(cuò)機(jī)制4.13.1Checkpoint4.13.2Barrier4.13.3重啟與故障恢復(fù)策略4.13.4Savepoint4.19案例分析:天貓雙十一實(shí)時(shí)交易額統(tǒng)計(jì)4.19.1創(chuàng)建自定義數(shù)據(jù)源4.19.2計(jì)算各個(gè)分類的訂單總額4.19.3計(jì)算全網(wǎng)銷售總額與分類Top35.1基本概念5.2動(dòng)態(tài)表5.3TableEnvironmentAPI5.4TableAPI第5章FlinkTableAPI&SQL5.5SQLAPI5.6TopN查詢5.7Catalog元數(shù)據(jù)管理5.8FlinkSQL整合Kafka5.9FlinkSQLCLI5.10FlinkSQL整合Hive010302040506第5章FlinkTableAPI&SQL5.11案例分析:FlinkSQL實(shí)時(shí)單詞計(jì)數(shù)5.12案例分析:FlinkSQL實(shí)時(shí)計(jì)算5秒內(nèi)用戶訂單總金額5.13案例分析:**用戶行為分析5.14案例分析:FlinkSQL智慧交通數(shù)據(jù)分析第5章FlinkTableAPI&SQL5.1基本概念5.1.1計(jì)劃器5.1.2API架構(gòu)5.1.3程序結(jié)構(gòu)5.2動(dòng)態(tài)表5.2.1流映射為動(dòng)態(tài)表5.2.2連續(xù)查詢5.2.3動(dòng)態(tài)表轉(zhuǎn)換為流5.3TableEnvironmentAPI5.3.1基本概念5.3.2創(chuàng)建TableEnvironment5.3.3示例:簡單訂單統(tǒng)計(jì)5.4TableAPI5.4.1基本概念5.4.2示例:訂單分組計(jì)數(shù)5.4.3示例:每小時(shí)訂單分組求平均值5.4.4關(guān)系操作5.5SQLAPI5.5.1DDL操作5.5.2DML操作5.5.3DQL操作5.5.4窗口函數(shù)5.5.5窗口聚合5.5.6分組聚合5.5.7OVER聚合5.5.8連接查詢5.6TopN查詢5.6.1OVER子句5.6.2示例:計(jì)算產(chǎn)品類別銷售額TopN5.6.3示例:搜索詞熱度統(tǒng)計(jì)5.6.4窗口TopN5.8FlinkSQL整合Kafka5.8.1基本概念5.8.2示例:FlinkSQL整合Kafka實(shí)現(xiàn)實(shí)時(shí)ETL5.9FlinkSQLCLI5.9.1啟動(dòng)SQLCLI5.9.2執(zhí)行SQL查詢5.9.3可視化結(jié)果模式5.10FlinkSQL整合Hive5.10.1整合步驟5.10.2TableAPI操作Hive5.10.3示例:FlinkSQL整合Hive分析搜狗用戶搜索日志5.13案例分析:**用戶行為分析5.13.1離線與實(shí)時(shí)計(jì)算業(yè)務(wù)架構(gòu)5.13.2Flume數(shù)據(jù)采集架構(gòu)5.13.3Kafka消息隊(duì)列架構(gòu)5.14案例分析:FlinkSQL智慧交通數(shù)據(jù)分析5.14.1項(xiàng)目介紹5.14.2數(shù)據(jù)準(zhǔn)備5.14.3統(tǒng)計(jì)正??跀?shù)量5.14.4統(tǒng)計(jì)車流量排名前3的卡口號5.14.5統(tǒng)計(jì)每個(gè)卡口通過速度最快的前3輛車5.14.6車輛軌跡分析6.1流圖6.3執(zhí)行圖6.2作業(yè)圖第6章Flink內(nèi)核源碼6.1流圖6.1.1StreamGraph核心對象6.1.2StreamGraph生成過程6.2作業(yè)圖6.2.1JobGraph的核心對象6.2.2JobGraph的生成過程6.3執(zhí)行圖6.3.1ExecutionGraph的核心對象6.3.2ExecutionGraph的生成過程7.1什么是Gelly7.2第一個(gè)Gelly程序7.3Gelly數(shù)據(jù)結(jié)構(gòu)7.4如何使用Gelly7.5圖操作12345第7章Gelly圖計(jì)算7.7案例分析:Gelly計(jì)算社交網(wǎng)絡(luò)中粉絲的平均年齡7.6圖常用API第7章Gelly圖計(jì)算7.5圖操作7.5.1基本操作7.5.2屬性操作7.5.3結(jié)構(gòu)操作7.5.4連接操作7.6圖常用API7.6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 絲印染在紡織品品牌建設(shè)中的應(yīng)用考核試卷
- 2025年01月北京震科經(jīng)緯防災(zāi)技術(shù)有限責(zé)任公司銷售人員公開招聘筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 國際貿(mào)易中的貨幣風(fēng)險(xiǎn)管理考核試卷
- 物流配送服務(wù)中人工智能技術(shù)的應(yīng)用與展望
- 交通運(yùn)輸中的電子支付與智慧出行考核試卷
- 現(xiàn)代醫(yī)院辦公區(qū)聲學(xué)設(shè)計(jì)方案
- 中介服務(wù)行業(yè)的職場性別平等促進(jìn)考核試卷
- 模具設(shè)計(jì)與制造(中級)理論模擬題(附參考答案)
- 構(gòu)建完善的知識產(chǎn)權(quán)管理教育體系
- 現(xiàn)代生產(chǎn)制造中的技術(shù)創(chuàng)新與流程再造
- 平衡計(jì)分卡-化戰(zhàn)略為行動(dòng)
- 課堂精練九年級全一冊數(shù)學(xué)北師大版2022
- 著衣母嬰臥像教學(xué)設(shè)計(jì)
- 維克多高中英語3500詞匯
- 【課件】DNA片段的擴(kuò)增及電泳鑒定課件高二下學(xué)期生物人教版(2019)選擇性必修3
- GB/T 6417.1-2005金屬熔化焊接頭缺欠分類及說明
- 科創(chuàng)板知識測評20個(gè)題目的答案
- 2023年湖北成人學(xué)位英語考試真題及答案
- 走好群眾路線-做好群眾工作(黃相懷)課件
- NY∕T 4001-2021 高效氯氟氰菊酯微囊懸浮劑
- 《社會(huì)主義市場經(jīng)濟(jì)理論(第三版)》第七章社會(huì)主義市場經(jīng)濟(jì)規(guī)則論
評論
0/150
提交評論