导航
课程首页
  • PM-Summit 全球产品经理大会云会员
  • SDCon 全球软件研发技术大会云会员
  • ML-Summit 全球机器学习技术大会云会员
  • C++性能优化高端培训
  • AI全栈开发实战营
精品课 极客时间

C 知道

登录
会员中心
消息
历史
创作中心
创作
学习中心
成为讲师

基于Kettle+Clickhouse+Superset构建实时大数据

基于Kettle+Clickhouse+Superset构建实时大数据
共75节 999人在学 课程详情
课程目录
讨论留言
  • 0、实时分析平台课程说明
  • 1、实时分析平台之Kettle初识讲解
  • 2、实时分析平台之Kettle安装部署
  • 3、实时分析平台之Kettle文本文件输入
  • 4、实时分析平台之Kettle Excel文件输入
  • 5、实时分析平台之Kettle CSV文件输入
  • 6、实时分析平台之Kettle文件XML输入
  • 7、实时分析平台之Kettle文件JSON输入
  • 8、实时分析平台之Kettle表输入
  • 9、实时分析平台之Kettle Excel文件输出
  • 10、实时分析平台之Kettle文本文件输出
  • 11、实时分析平台之Kettle SQL文件输出
  • 12、实时分析平台之Kettle表输出
  • 13、实时分析平台之Kettle表数据更新
  • 14、实时分析平台之Kettle表数据插入更新
  • 15、实时分析平台之Kettle表数据删除
  • 16、实时分析平台之Switch-case控件实战
  • 17、实时分析平台之Kettle数据过滤控件实战
  • 18、实时分析平台之Kettle空操作控件实战
  • 19、实时分析平台之Kettle增加常量控件实战
  • 20、实时分析平台之Kettle增加序列控件实战
  • 21、实时分析平台之Kettle值映射控件实战
  • 22、实时分析平台之Kettle终止控件实战
  • 23、实时分析平台之Zookeeper环境安装
  • 24、实时分析平台之Hadoop环境构建
  • 25、实时分析平台之Kafka环境构建
  • 26、实时分析平台之Hbase环境构建
  • 27、实时分析平台之Kettle Kafka插件安装
  • 28、实时分析平台之Kafka流应用控件实战
  • 29、实时分析平台之Java代码脚本控件实战
  • 30、实时分析平台之业务结构讲解以及表构建1
  • 31、实时分析平台之业务结构讲解以及表构建2
  • 32、实时分析平台之业务结构讲解以及表构建3
  • 33、实时分析平台之业务结构实体构建1
  • 34、实时分析平台之业务结构实体构建2
  • 35、实时分析平台之业务结构实体构建3
  • 36、实时分析平台之操作日志结构讲解
  • 37、实时分析平台之Hbase工具封装代码讲解
  • 38、实时分析平台之数据收集服务构建
  • 39、实时分析平台之用户状态数据处理
  • 40、实时分析平台之Clickhouse讲解
  • 41、实时分析平台之Clickhouse环境安装
  • 42、ClickHouse数据类型以及常用操作
  • 43、Clickhouse Java使用实战讲解
  • 44、Kettle集成Clickhouse插件
  • 45、Kettle Clickhouse配置
  • 46、实时分析平台之Kettle Json输出实战
  • 47、Clickhouse数据处理Java代码编写
  • 48、Clickhouse数据处理Java脚本实战
  • 49、实时分析平台之Superset讲解
  • 50、实时分析平台之Superset环境安装实战
  • 51、实时分析平台之Superset使用实战
  • 52、实时分析平台之流量新增用户数据解析提取1
  • 53、实时分析平台之流量新增用户数据解析提取2
  • 54、实时分析平台之流量新增用户数据解析提取3
  • 55、实时分析平台之流量新增用户数据过滤
  • 56、实时分析平台之流量新增用户数据常量设置
  • 57、实时分析平台之流量新增用户数据序列设置
  • 58、实时分析平台之流量新增用户数据设备映射
  • 59、实时分析平台之流量新增用户数据保存表输出
  • 60、实时分析平台之流量新增用户统计表输出
  • 61、实时分析平台之流量新增用户统计插入更新
  • 62、Superset配置流量新增用户可视化
  • 63、实时分析平台之Superset中文乱码问题解决
  • 64、实时分析平台之浏览次数趋势分析流程讲解
  • 65、实时分析平台之天活跃用户分析流程讲解
  • 66、实时分析平台之周活跃用户分析流程讲解
  • 67、实时分析平台之Binlog讲解
  • 68、实时分析平台之Binlog使用以及查看
  • 69、实时分析平台之Canal讲解
  • 70、Cannal安装以及整合Kafka实战
  • 71、实时分析平台之数据实时转换服务
  • 72、实时分析平台之订单趋势分析流程讲解
  • 73、实时分析平台之团购用户趋势分析流程讲解
  • 74、实时分析平台之部署以及整体效果演示
回复
切换为未回复评论
切换为时间正序
请发表友善的回复…
发表回复
播放页问题反馈
视频学习中有任何产品建议都可由此反
馈,我们将及时处理!

课时介绍

40、实时分析平台之Clickhouse讲解

课程介绍

1、ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以掌握一个ETL工具的使用,必不可少。

Kettle作为ETL工具是非常强大和方便的。Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

2、Clickhouse 是俄罗斯的“百度”Yandex公司在2016年开源的,一款针对大数据实时分析的高性能分布式数据库,与之对应的有hadoop生态hive,Vertica和百度出品的palo。这是战斗民族继nginx后,又开源的一款“核武器”。

Hadoop 生态体系解决了大数据界的大部分问题,当然其也存在缺点。Hadoop 体系的最大短板在于数据处理时效性。基于 Hadoop 生态的数据处理场景大部分对时效要求不高,按照传统的做法一般是 T + 1 的数据时效。即 Trade + 1,数据产出在交易日 + 1 天。

ClickHouse 的产生就是为了解决大数据量处理的时效性。独立于Hadoop生态圈。

3、Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。

 Superset 的前端主要用到了 React 和 NVD3/D3,而后端则基于 Python 的 Flask 框架和 Pandas、SQLAlchemy 等依赖库,主要提供了这几方面的功能:

01、集成数据查询功能,支持多种数据库,包括 MySQL、PostgresSQL、Oracle、SQL Server、SQLite、SparkSQL 等,并深度支持 Druid。

02、通过 NVD3/D3 预定义了多种可视化图表,满足大部分的数据展示功能。如果还有其他需求,也可以自开发更多的图表类型,或者嵌入其他的 JavaScript 图表库(如 HighCharts、ECharts)。

03、提供细粒度安全模型,可以在功能层面和数据层面进行访问控制。支持多种鉴权方式(如数据库、OpenID、LDAP、OAuth、REMOTE_USER 等)。

 

基于Kettle+Clickhouse+Superset构建亿级大数据实时分析平台课程将联合这三大开源工具,实现一个强大的实时分析平台。

该系统以热门的互联网电商实际业务应用场景为案例讲解,对电商数据的常见实战指标处理使用kettle等工具进行了详尽讲解,具体指标包括:流量分析、新增用户分析、活跃用户分析订单分析、团购分析。能承载海量数据的实时分析,数据分析涵盖全端(PC、移动、小程序)应用。

项目代码也是具有很高的商业价值的,大家可以根据自己的业务进行修改,便可以使用。

本课程包含的技术:

开发工具为:IDEA

Kettle

Clickhouse

Superset

Binlog

Canal

Kafka

Hbase

Hadoop

Zookeeper

Flink

SpringBoot

SpringCould

Python

Ancona

MySQL

等

 

课程亮点:

1.与企业对接、真实工业界产品

2.强大的ETL工具Kettle全流程讲解实现

3.ClickHouse高性能列式存储数据库

4.Superset现代化的企业级BI可视化

5.数据库实时同步解决方案

6.集成Flink实时数据转换解决方案

7.主流微服务SpringBoot后端系统

8.互联网大数据企业热门技术栈

9.支持海量数据的实时分析

10.支持全端实时数据分析

11.全程代码实操,提供全部代码和资料

12.提供答疑和提供企业技术方案咨询

 

推荐课程

信息系统项目管理师自考笔记

李明 · 727人在学

python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

王先生 · 22115人在学

手把手搭建Java超市管理系统【附源码】(毕设)

汤小洋 · 4207人在学

Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

黄菊华 · 788人在学

基于SSM酒店管理系统(毕设)

小尼老师 · 842人在学

java项目实战之购物商城(java毕业设计)

Long · 5155人在学

手把手搭建Java求职招聘系统【附源码】(毕设)

汤小洋 · 1506人在学

Python Django 深度学习 小程序

钟翔 · 2321人在学

城管局门前三包管理系统+微信小程序(vue+springboot)

赖国荣 · 599人在学

Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

李杰 · 3987人在学

正在试验
后自动删除环境
课程实验
本次实验时间已到期 00:00:00

    订阅失败

    基于Kettle+Clickhouse+Superset构建实时大数据
    基于Kettle+Clickhouse+Superset构建实时大数据 ...

    订阅列表已满,请先移出部分订阅内容。

    当前章节需购买后观看
    开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
    提交答案

    购买课程

    扫码完成付费,可继续学习全部课程内容

    加载中...
    课件正在飞速打包中,请耐心等待几秒钟~
    首页
    博客
    下载
    学习
    社区
    C知道
    GitCode
    InsCodeAI
    技术会议
    会员中心
    创作中心
    联系我们
    工作时间: 8:30 - 22:00
    客服电话: 400-660-0108
    kefu@csdn.net在线客服
    • 关于我们
    • 招贤纳士
    • 商务合作
    • 寻求报道
    • 京ICP备19004658号
    • 经营性网站备案信息
    • 公安备案号11010502030143
    • 营业执照
    • 北京互联网违法和不良信息举报中心
    • 家长监护
    • 中国互联网举报中心
    • 网络110报警服务
    • Chrome商店下载
    • 账号管理规范
    • 版权与免责声明
    • 版权申诉
    • 出版物许可证
    • ©1999-2024北京创新乐知网络技术有限公司