Spark内核机制解析及性能调优教程（含资料）

无限期视频有效期

21节节数

257人学习人数

4.6分

课程评分

IT 节气

升级再获取10234荣耀值升级成荣耀讲师

268 课程数量

208585 学生人数

CTO/CIO/技术副总裁/总工程师

张长志技术全才、擅长领域：区块链、大数据、Java等。10余年软件研发及企业培训经验，曾为多家大型企业提供企业内训如中石化，中国联通，中国移动等知名企业。拥有丰富的企业应用软件开发经验、深厚的软件架构设计理论基础及实践能力。项目开发历程：基于大数据技术推荐系统，医疗保险大数据分析与统计推断，H5跨平台APP，携程酒店APP，Go语言实现Storm和ZK类似框架。

课程介绍
课程目录
讨论留言

你将收获

1.理解Spark的集群部署的内部机制、Spark内部调度的机制、Executor的内部机制、Shuffle的内部机制

2.掌握Spark的调优技能迈向高级大数据开发

适用人群

适合有大数据基础的学员

课程介绍

由于Spark基于内存计算的特性，集群的任何资源都可以成为Spark程序的瓶颈:CPU，网络带宽，或者内存。通常，如果内存容得下数据，瓶颈会是网络带宽。不过有时你同样需要做些优化，例如将RDD以序列化到磁盘，来降低内存占用。

本教程通过源码引导读者深入理解Spark的集群部署的内部机制、Spark内部调度的机制、Executor的内部机制、Shuffle的内部机制，进而讲述Tungsten的内部机制，让学员知其然知其所以然。教程的后部分，是任何Spark应用者都很好关注的Spark性能调优的内容。

课程目录