你将收获

学习Apache Spark 3.0版本的一些新变化

学习Spark 3.0 core、Spark SQL、Spark Streaming、Spark MLlib、Spark GraphX 的版本更新

适用人群

所有Spark学习者和从业人员、有分布式计算框架应用经验的人员、高等院校学生

课程介绍

在大数据和AI紧密协同时代,最佳的AI系统依赖海量数据才能构建出高度复杂的模型,海量数据需要借助Al才能挖掘出终极价值。本书以数据智能为灵魂,以Spark 2.4.X版本为载体,以Spark+ AI商业案例实战和生产环境下几乎所有类型的性能调优为核心,对企业生产环境下的Spark+AI商业案例与性能调优抽丝剥茧地进行剖析。全书共分4篇,内核解密篇基于Spark源码,从一个实战案例入手,循序渐进地全面解析Spark 2.4.X版本的新特性及Spark内核源码;商业案例篇选取Spark开发中最具代表性的经典学习案例,在案例中综合介绍Spark的大数据技术;性能调优篇覆盖Spark在生产环境下的所有调优技术; Spark+ AI内幕解密篇讲解深度学习动手实践,通过整合Spark、PyTorch以及TensorFlow揭秘Spark上的深度学习内幕。本课程参考《Spark大数据商业实战三部曲》第二版,以Spark 3.0新版本为载体,讲解第二章的内容。

课程目录