2
56

你将收获

全程案例贯穿始终,几乎每个知识点都有配套的案例

整个框架深入源码讲解

优化措施全部来源于企业开发

Hadoop相关企业真题全覆盖

适用人群

具有一定编程基础的人员

课程介绍

课程特点: 
1、全程案例贯穿始终,几乎每个知识点都有配套的案例; 
2、整个框架深入源码讲解; 
3、优化措施全部来源于企业开发; 
4、Hadoop相关企业真题全覆盖。 
本课程中你将学习到,Hadoop完全分布式集群搭建、Hadoop源码编译、HDFS的Shell操作、HDFS的API操作、HDFS的IO流操作、HDFS读写数据流程、NameNode和SecondaryNameNode工作机制、DataNode工作机制、集群节点动态服役和退役、HDFS2.x新特性、MapReduce编程规范、自定义序列化、自定义InputFormat、自定义OutputFormat、分区、排序、合并、分组、ReduceJoin、MapJoin、数据清洗、计数器、TopN案例、倒排索引案例、MapTask工作机制、ReduceTask工作机制、Shuffle工作机制、MapReduce工作流程、Job提交流程源码、MapReduce源码、数据压缩、Yarn工作机制、作业提交流程、YARN资源调度器、MapReduce企业优化、HDFS小文件企业优化、数据倾斜优化等。

课程讨论

老师能提供课件吗?

天天画大饼有意思吗,???

下在哪儿

大二,大数据专业,请问这个课程合适我吗???如果合适,请问还有那个大数据视频_Hadoop视频教程(下)的免费视频吗

在读大二,大数据专业,这个课程合适我吗???

这个“00”后的讲师也够骚气的,不过课讲的真好。

同学笔记

  • weixin_42822325 2020-12-02 22:26:46

    来源:组成 查看详情

    HDFS:

    1.NAMENode(nn)

    存储文件的元数据,如文件名,文件目录结构,文件属性等

    2.DATANode(dn)

    在本地文件存储文件块数据,以及数据的校验和

    3.Secondary NAMENode(2nn)

    辅助后台程序

    YARN架构概述:

    MapReduce

    1.map阶段并行处理输入数据

    2.reduce阶段对map结果进行汇总

     

  • weixin_42822325 2020-12-01 22:53:22

    来源:1.x和2.x区别 查看详情

    解耦 模块化

  • weixin_42822325 2020-12-01 22:42:11

    来源:Hadoop_优势(4高) 查看详情

    优势

    1.高可靠性:底层维护多个数据副本,某个计算元素故障,不会导致数据丢失

    2.高扩展性:集群间分配任务数据,方便扩展数以千计的节点

    3.高效性:并行工作,加快任务处理速度

    4.高

没有更多了