- 数据仓库
流批一体ETL工具NiFi开发实战
本入门课程旨在向学生介绍 Apache NiFi 数据流框架的基本概念和功能。通过实际操作和案例演示,学生将学习如何配置 NiFi 并构建可扩展的数据流管道。此外,本课程还将介绍 NiFi 的常见用例和最佳实践。在本课程结束时,学生将对 NiFi 的基础知识以及如何使用 NiFi 构建可扩展的数据流管道有足够的了解。此外,学生还将了解 NiFi 的常见用例和最佳实践。
共20节 325人已学习¥36.0 免费试学 - 数据仓库
云原生消息系统Pulsar开发实战
1、以Pulsar2.9.1版本官方文档为基础,结合在项目中遇到的问题,综合梳理形成的课程。 2、每个知识点都有相关的代码测试类,代码实战和内部机制并重,知其然,知其所以然。 3、像B站的Pulsar视频致敬!Pulsar作为新一代云原生消息中间件,处于发展初期,开发实战视频较少,本套视频算是为Pulsar的推广尽一份力! 4、本套视频的作者从事数据架构师职位,不是培训机构的老师。视频中的某些示例来自真实项目中的代码,涵盖了Pulsar在实时数仓架构中的落地实践。 5、视频内容结合了《精通Apache Pulsar》和《Pulsar In Action》两本书中的内容。 6、欢迎大家一起交流基于Pulsar的流批一体的数仓架构设计。
共26节 146人已学习¥9.9 免费试学 - 大数据
基于Spark3.x的数据湖技术Delta Lake开发实战
本课程内容整理自一个湖仓一体的数仓项目。Delta Lake、Hudi和Iceberg是三大数据湖技术,当前处于发展初期,已有很多大型互联网公司采用这类技术。在搭建数据平台的过程中,一般会将数据湖和数据仓库结合起来使用,数据湖技术主要解决数据仓库的痛点之一:源头数据的表结构(Schema)变化如何处理?数仓如何存储非结构化数据?本课程通过一个一个代码示例,展示Delta Lake的每个特性,同时会结合实际项目,讲解Delta Lake技术的设计思路,其在湖仓一体建设过程中究竟起到了什么作用。
共13节 657人已学习¥69.0 免费试学 - 其他
构建实时数仓的流批一体ETL工具-Streamsets
本课程来自一线项目(实时数仓建设)。创建实时数仓,是当前很多公司的需求,如何搭建实时数仓的架构?实时数仓需要有实时同步数据的ETL工具。在架构选型时,调研了很多ETL工具,包括Kettle、Azkaban和Streamsets,最终选择了Streamsets。如果您是数仓架构师、大数据开发工程师,本课程对您来说,非常有益。 课程全程以实战的方式进行,每节课一到两个例子,并且会将创建实时数仓过程中的经验和教训穿插到例子讲解中,欢迎大家一起讨论实时数仓架构设计!
共26节 1995人已学习¥168.0 免费试学
- 1
李登峰
数据架构师
多年研发经验,专注于大数据实时数仓建设,丰富的实时数仓架构设计经验。
技术栈:Java、ETL、CDH、Spark、Kafka、Impala、Kudu等
课程数 4 学生数 3123