直播结束
已报名用户,可提前15分钟进入直播间,千万不要忘记哦适合对象:所有人
价格:免费
目前在数据分析服务公司GrowingIO数据平台部门工作,Spark社区的Contributor,北京Spark Meetup组织者,2010年开始在电信领域实践应用hadoop,2013年开始关注Spark,从Shark开始向社区贡献代码。目前主要的研究方向是使用Spark搭建企业级的数据计算分析平台。
随着数据量的不断增加,企业越来越重视大数据处理的成本问题,越来越多的公司开始结合自己的业务特点,试用不同的存储方式来满足不同的应用场景。
但是数据的计算和分析往往要放在一起才能更加高效和灵活。 本次分享主要介绍一下如何通过Spark的DataSource API的读写外部数据源中的数据,并结合一些具体场景来分析和解释使用DataSource API的好处以及需要注意的问题,提纲如下:为什么需要多种数据源、Spark多数据源的实现机制、几个常用的数据源简介、GrowingIO使用案例。
20:30-21:10 讲师课程讲解
21:10-21:30 答疑
邮箱:zhonghao@csdn.net
电话:
微信:zhongyineng
首次报名用户,请关注公众号领取验证码
直播课程报名成功
课程名称:GrowingIO田毅:Spark多数据源处理
开课时间:2016-05-12 20:30
授课讲师:田毅