基于Flink+Doris构建亿级全端电商实时数据分析平台
课时介绍
课程介绍
上层应用业务对实时数据的需求,主要包含两部分内容:1、 整体数据的实时分析。2、 AB实验效果的实时监控。这几部分数据需求,都需要进行的下钻分析支持,我们希望能够建立统一的实时OLAP数据仓库,并提供一套安全、可靠的、灵活的实时数据服务。目前每日新增的曝光日志达到几亿条记录,再细拆到AB实验更细维度时,数据量则多达上百亿记录,多维数据组合下的聚合查询要求秒级响应时间,这样的数据量也给团队带来了不小的挑战。OLAP层的技术选型,需要满足以下几点:
1:数据延迟在分钟级,查询响应时间在秒级
2:标准SQL交互引擎,降低使用成本
3:支持join操作,方便维度增加属性信息
4:流量数据可以近似去重,但订单行要精准去重
5:高吞吐,每分钟数据量在千W级记录,每天数百亿条新增记录
6:前端业务较多,查询并发度不能太低
通过对比开源的几款实时OLAP引擎,可以发现Doris和ClickHouse能够满足上面的需求,但是ClickHouse的并发度太低是个潜在的风险,而且ClickHouse的数据导入没有事务支持,无法实现exactly once语义,对标准SQL的支持也是有限的。所以针对以上需求Doris完全能解决我们的问题,DorisDB是一个性能非常高的分布式、面向交互式查询的分布式数据库,非常的强大,随着互联网发展,数据量会越来越大,实时查询需求也会要求越来越高,DorisDB人才需求也会越来越大,越早掌握DorisDB,以后就会有更大的机遇。本课程基于真实热门的互联网电商业务场景为案例讲解,具体分析指标包含:AB版本分析,下砖分析,营销分析,订单分析,终端分析等,能承载海量数据的实时分析,数据分析涵盖全端(PC、移动、小程序)应用。
整个课程,会带大家实践一个完整系统,大家可以根据自己的公司业务修改,既可以用到项目中去,价值是非常高的。
本课程包含的技术:
开发工具为:IDEA、WebStorm
Flink1.9.0
DorisDB
Hadoop2.7.5
Hbase2.2.6
Kafka2.1.0
Hive2.2.0
HDFS、MapReduce
Flume、Zookeeper
Binlog、Canal、MySQL
SpringBoot2.0.8.RELEASE
SpringCloud Finchley.SR2
Vue.js、Nodejs、Highcharts、ElementUI
Linux Shell编程等
课程亮点:
1.与企业接轨、真实工业界产品
2.DorisDB高性能分布式数据库
3.大数据热门技术Flink
4.支持ABtest版本实时监控分析
5.支持下砖分析
6.数据分析涵盖全端(PC、移动、小程序)应用
7.主流微服务后端系统
8.天级别与小时级别多时间方位分析
9.数据库实时同步解决方案
10.涵盖主流前端技术VUE+jQuery+Ajax+NodeJS+ElementUI
11.集成SpringCloud实现统一整合方案
12.互联网大数据企业热门技术栈
13.支持海量数据的实时分析
14.支持全端实时数据分析
15.全程代码实操,提供全部代码和资料
16.提供答疑和提供企业技术方案咨询
企业一线架构师讲授,代码在老师的指导下企业可以复用,提供企业解决方案。
版权归作者所有,盗版将进行法律维权。
信息系统项目管理师自考笔记
李明 · 512人在学
python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据
王先生 · 20582人在学
手把手搭建Java超市管理系统【附源码】(毕设)
汤小洋 · 4047人在学
Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教
黄菊华 · 732人在学
基于SSM酒店管理系统(毕设)
小尼老师 · 785人在学
java项目实战之购物商城(java毕业设计)
Long · 5073人在学
手把手搭建Java求职招聘系统【附源码】(毕设)
汤小洋 · 1458人在学
Python Django 深度学习 小程序
钟翔 · 2234人在学
城管局门前三包管理系统+微信小程序(vue+springboot)
赖国荣 · 497人在学
Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序
李杰 · 3843人在学