熟练操作Streamsets ETL工具
掌握常见数据库CDC数据同步方式
学会对接常见的大数据组件(Impala+Kudu)
具备实时数仓架构设计思维
你将收获
熟练操作Streamsets ETL工具
掌握常见数据库CDC数据同步方式
学会对接常见的大数据组件(Impala+Kudu)
具备实时数仓架构设计思维
适用人群
课程介绍
本课程来自一线项目(实时数仓建设)。创建实时数仓,是当前很多公司的需求,如何搭建实时数仓的架构?实时数仓需要有实时同步数据的ETL工具。在架构选型时,调研了很多ETL工具,包括Kettle、Azkaban和Streamsets,最终选择了Streamsets。如果您是数仓架构师、大数据开发工程师,本课程对您来说,非常有益。
课程全程以实战的方式进行,每节课一到两个例子,并且会将创建实时数仓过程中的经验和教训穿插到例子讲解中,欢迎大家一起讨论实时数仓架构设计!
课程目录