Flume & Kafka原理与实践培训-火龙果软件

咨询

成功案例

相关课程

全部课程 >大数据

Flume & Kafka原理与实践

4853 次浏览

107 次


郭老师
2007年加入阿里巴巴，历任资深开发工程师、技术专家、高级技术专家。

时间地点：北京上海深圳根据报名开班

课程费用：5000元/人

报公开课

要内训

企业内训：可以根据企业需求,定制内训,详见内训学习手册

认证方式：
培训前了解能力模型。
培训后进行能力评测：

在线考试

能力分析，给出学习建议

合格者颁发证书，作为职业技能资格证明

详解Flume架构，同时结合源代码分析了Flume事务的实现原理，并讲解如何实现自定义的Source, Sink, Channel, Interceptor

详解kafka架构，包含数据持久化方式——Topic / Partition / Segment，及数据发布方案——Producer，数据路由策略——Partitioner，和消息订阅方案——Consumer

分析Kafka实现高可用的原理，并将其推广到通用分布式系统，从而为分布式系统常见问题提供参考解决方案

分析Kafka的Consumer Group Rebalance方案原理及其演进过程，并分析不同方案的优劣

讲解Kafka Stream的适用场景，基于Partition的并发模型。同时分析流式处理系统的常见问题，以及Kafka Stream的对应解决方案。并给出Kafka Stream与其它流式处理系统的区别及各自适合的应用场景

培训目标：

了解Flume的适用场景，掌握Flume的事务原理及二次开发的注意事项，以及性能调优方案

掌握Kafka的使用方式，以及如何与现有业务系统集成

理解Kafka实现高可用的原理，了解Consumer Group Rebalance的原理及方案演进以及对业务代码的影响。同时为分布式系统经典问题提供思路

掌握Kafka Stream的原理及适用场景

掌握Kafka运维的核心问题解决方案

培训对象：大数据开发工程师

学员基础：具有java编程基础

授课方式： 定制课程 + 案例讲解 + 小组讨论，60%案例讲解，40%实践演练

培训内容：2天

1. Flume原理	1.1 Flume架构 1.2 Fan-in & Fan-out 1.3 Flume事务原理 1.4 Flume监控 1.5 Flume性能优化
2. Flume二次开发	2.1 Flume Event数据结构 2.2 自定义Source 2.3 自定义Sink 2.4 自定义Channel 2.5 自定义Interceptor
3. Kafka架构	3.1 Kafka整体架构 3.2 Topic & Partition 3.3 Producer最佳实践 3.4 消息路由之自定义Partitioner 3.5 两种不同的Consumer用法
4. Kafka高可用原理	4.1 Kafka面临的CAP问题 4.2 高可用下的数据分发 4.3 动态平衡策略ISR 4.4 基于Zookeeper的领导选举方案 4.5 Failover原理
5. Consumer Rebalance方案演进	5.1 为什么需要Rebalance 5.2 Rebalance实现的效果 5.3 自治式Rebalance原理及问题 5.4 集中式Rebalance实现原理 5.5 应用程序如何处理Consumer Rebalance
6. Kafka Stream	6.1 Kafka Stream架构 6.2 Kafka Stream并发模型 6.3 实现Topology的两种方式 6.4 窗口和Join原理与可恢复性保障 6.5 适用场景
7. Kafka运维与如何实现正好一次	7.1 重新分配Replica 7.2 Preferred Replica Leader Election 7.3 两阶段提交实现正好一次 7.4 幂等操作实现正好一次 7.5 数据处理与offset管理放在同一事务实现正好一次

报公开课

要内训

4853 次浏览

107 次

其他人还看了课程

Qlik Sense原理与数据分析技术 2824 次浏览

工业互联网：智能制造与数字化平台建设 2772 次浏览

Apache Kylin平台应用与实操 6523 次浏览

大数据工具Flume&Kafka集成实践 5652 次浏览

大数据架构设计实战演练 7582 次浏览

数据治理与数据资产管理 9660 次浏览

大数据搜索框架（ElasticSearch）与应用 6365 次浏览

	咨询服务：数据库设计与性能优化

咨询目标	对客户的数据库进行性能评价，设计优化，管理优化
咨询范围	数据库性能评价，数据库结构优化，数据访问SQL优化。
咨询方式	现有数据库调查，问题诊断，性能评价。对数据库进行逻辑结构优化，对数据库进行访问SQL优化。建立数据库运行监控平台。运行监控与优化方法指导。
成功案例	建设银行，中国农业银行，中国工商银行，中航信

详情咨询：010-62670969， zhgx@uml.net.cn

课程计划

UAF架构体系与实践 7-23[北京]

SysML和EA系统设计与建模 7-16[深圳]

Spec 驱动开发(SDD)实战 7-28[北京]

AI辅助软件测试方法与实践 7-31[在线]

AI智能体开发技术实践 8-6[上海]

基于UML和EA系统分析设计 8-20[上海]