本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
第1章 流式数据架构理论
1.1 大数据处理架构演进历程
1.2 案例分析
1.2.1 SK电信驾驶安全性评分
1.2.2 流式机器学习应用
1.3 流式数据架构基本概念
1.3.1 流
1.3.2 时间
1.3.3 窗口
1.3.4 水印
1.3.5 触发器
1.3.6 数据处理模式
1.3.7 如何理解流式数据架构的内在机制
1.4 根据事件时间开滚动窗口
1.4.1 what:转换/where:窗口
1.4.2 when:水印
1.4.3 when:触发器
1.4.4 when:迟到生存期
1.4.5 how:累加模式
1.5 一致性
1.5.1 有状态计算
1.5.2 exactly-once语义
1.5.3 异步屏障快照
1.5.4 保存点
1.6 思考题
第2章 编程基础
2.1 Flink概述
2.2 让轮子转起来
2.2.1 本书约定
2.2.2 搭建单机版环境
2.2.3 配置IDEA
2.3 编程模型
2.3.1 分层组件栈
2.3.2 流式计算模型
2.3.3 流处理编程
2.4 运行时
2.4.1 运行时结构
2.4.2 任务调度
2.4.3 物理执行计划
2.5 思考题
第3章 流处理API
3.1 流处理API概述
3.2 时间处理
3.2.1 时间
3.2.2 水印
3.2.3 周期性水印生成器
3.2.4 间歇性水印生成器
3.2.5 递增式水印生成器
3.3 算子
3.3.1 算子函数