成功

扫码支付

购买商品:
商品价格:

价格读取中

支付方式:
微信

请扫码进行支付

支付宝

请扫码进行支付

二维码已过期,请点击刷新

大数据Spark企业级项目实战

张勇
技术总监/研发总监
讲师卡购买
购买讲师卡,免费观看讲师全部课程
北风网技术总监,在某大型电信设备公司担任架构师,主要从事电信领域的软件开发,经验丰富。对电信计费系统以及核心网软件系统有深入了解,对设计高可靠性,高扩展性的软件系统具有丰富经验。
显示更多
【课程介绍】
本教程从基础的Spark介绍开始,介绍Spark的各种部署模式以及动手进行搭建,然后逐步介绍其中RDD的计算模型,创建和常用的操作,以及其中一些分布式计算,RDD持久化,容错,shuffle机制,共享变量等内容。 而后在RDD的基础上,讲解SparkSQL的子框架,讲解sparkstreaming的子框架,介绍DSTREAM的概念。 后以2个项目来实际带学习者到开发环境中去动手开发,调试。
【课程收益】
了解Spark的特点,应用场景,RDD的计算模型, 学会动手搭建不同模式下的Spark集群,掌握RDD,掌握SparkSQL,掌握dataframe、SparkStreaming
课程大纲
第一章:spark简介
第二章:spark部署模式介绍
第三章:spark集群硬件,开发语言和java版本的选择
第四章:spark的rdd及其操作介绍
第五章:SparkSQL及DataFrame讲解
第六章:SparkStreaming和DStream介绍
第七章:SparkStreaming性能调优,容错和Kafka集成
第八章:SparkSQL项目实战之文本比对
第九章:SparkStreaming+ SparkSQL+Kafka 项目实战开发
阅读更多