Hadoop大数据开发零基础实战
Hadoop离线计算与存储
- Hadoop生态系统总体架构
- VMWare新建虚拟机
- CentOS7操作系统安装
- Hadoop简介及核心组成
- HDFS体系架构与数据存储原理
- Hadoop集群环境配置_关闭防火墙
- Hadoop集群环境配置_设置固定IP
- Hadoop集群环境配置_修改主机名
- Hadoop集群环境配置_安装JDK
- Hadoop集群环境配置_克隆虚拟机
- Hadoop集群环境配置_修改克隆后主机的主机名和IP
- Hadoop集群环境配置_配置主机名IP映射
- Hadoop集群环境配置_配置SSH无密钥登录
- Hadoop集群搭建(上)
- Hadoop集群搭建(下)
- HDFS主要组件
- HDFS常用Shell命令操作
- HDFS与本地Linux系统的关系
- HDFS JavaAPI文件操作
- MapReduce设计思想(上)
- MapReduce设计思想(下)
- 案例实操:单词计数原理(上)
- 案例实操:单词计数原理(下)
- 案例实操:单词计数Java程序分析(上)
- 案例实操:单词计数Java程序分析(中)
- 案例实操:单词计数Java程序分析(下)
- 案例实操:单词计数程序打包导出
- 案例实操:单词计数程序提交到集群运行
- Eclipse集成Maven,创建Hadoop Maven项目并打包
- 案例实操:计算平均成绩_流程源码分析
- 案例实操:计算平均成绩_应用程序提交
- 案例实操:计算平均成绩_数据规范问题
- YARN工作原理及流程
- MapReduce在YARN上的工作流程
- MapReduce切片机制原理(上)
- MapReduce切片机制原理(中)
- MapReduce切片机制原理(下)
- MapReduce数据处理流程分析
ZooKeeper分布式协调系统
- ZooKeeper架构及数据模型
- ZooKeeper节点类型与分布式锁
- ZooKeeper集群搭建(上)
- ZooKeeper集群搭建(下)
- ZooKeeper命令行操作
- ZooKeeper JavaAPI操作_创建节点
- ZooKeeper JavaAPI操作_修改节点数据及源码分析
- ZooKeeper JavaAPI操作_查看节点数据及源码分析
- ZooKeeper JavaAPI操作_设置观察者Watcher
- ZooKeeper JavaAPI操作_Watcher持续监听
- 案例实操:监听服务器动态上下线_实现思路
- 案例实操:监听服务器动态上下线_实现代码(上)
- 案例实操:监听服务器动态上下线_实现代码(下)
HBase分布式数据库
Hive数据仓库工具
- Hive基本概念及数据单元
- Hive运行架构与原理
- Hive三种运行模式
- Hive内嵌模式安装与启动
- Hive本地模式安装与启动
- Hive本地模式多用户访问验证
- Hive远程模式安装与启动
- Hive远程模式访问验证
- Hive内部表(管理表)_创建并插入数据
- Hive内部表(管理表)_导入数据
- ive外部表_创建并导入数据
- Hive内部表(管理表)与外部表的区别
- Hive表分区概念
- Hive表分桶概念
- Hive表分区操作
- Hive表分区列不能作为分桶列
- Hive自定义函数UDF_实现隐藏手机号中间四位
- Hive JDBC查询数据
- 案例实操:搜狗用户搜索词分析_需求分析及数据导入
- 案例实操:搜狗用户搜索词分析_用户访问数量统计
- 案例实操:搜狗用户搜索词分析_链接排名与用户点击的相关性
- 案例实操:搜狗用户搜索词分析_上网时间段与访问量分析
- 案例实操:搜狗用户搜索词分析_域名与访问量分析
Kafka分布式消息系统
Flume分布式日志采集系统
Scala函数式编程语言
Spark内存计算系统
- Spark简介及运行架构(上)
- Spark简介及运行架构(下)
- Spark Standalone集群搭建
- Spark应用程序提交到集群(上)
- Spark应用程序提交到集群(下)
- Spark Shell使用
- 案例实操:Spark Shell单词计数演示
- Spark RDD概念架构
- Spark RDD创建方式
- Spark RDD map算子
- Spark RDD filter算子
- Spark RDD flatMap算子
- Spark RDD reduceByKey算子
- Spark RDD groupByKey算子
- Spark RDD union算子
- Spark RDD sortBy算子
- Spark RDD join算子
- Spark RDD 行动算子介绍
- Spark RDD常用行动算子及用法
- Spark RDD分区
- Spark RDD依赖关系
- Spark RDD Stage划分
- Spark RDD数据持久化
- Spark RDD检查点
- IDEA创建Maven管理的Spark项目
- 案例实操:Spark RDD单词计数_流程分析
- 案例分析:Spark RDD单词计数_代码编写
- 案例实操:Spark RDD单词计数_程序提交
- 案例实操:Spark RDD单词计数_查看DAG图
- 案例实操:Spark RDD分组求TopN_流程分析
- 案例实操:Spark RDD分组求TopN_代码编写
- 案例实操:Spark RDD分组求TopN_程序运行
- 案例实操:Spark RDD统计每日新增用户_流程分析
- 案例实操:Spark RDD统计每日新增用户_代码编写
- 案例实操:Spark RDD统计每日新增用户_结果排序
- Spark SQL概念架构
- Spark SQL DataFrame与DataSet
- 案例实操:Spark SQL编写单词计数程序
- Spark Streaming概念原理
- Spark Streaming DStream基本操作
- Spark Streaming DStream窗口操作
- 案例实操:Spark Streaming整合Kafka实现单词计数(上)
- 案例实操:Spark Streaming整合Kafka实现单词计数(下)
提交答案
视频学习中有任何产品建议都可由此反
馈,我们将及时处理!
馈,我们将及时处理!
课时介绍
HBase集群搭建(上)
课程介绍
2022最新课程,本课程适合在校大学生、大数据从业人员以及期望通过学习大数据跻身IT行业的人员,学习本课程需要具备一定的Java语言编程基础。
课程特色:以Hadoop生态和Spark生态系统为基础,围绕Hadoop对Zookeeper、Flume、Kafka等众多组件框架进行了深入讲解,从安装到底层原理,由浅入深,每个框架均配置有多个实战需求,最后通过案例实战,带领学员对大数据的实际应用有更深层次的理解和思考。
Spark生态课程从大数据重要的语言基础Scala讲起,并对重要框架Spark进行了深入讲解,内容包括Spark框架的基本使用以及案例分析。采用最新的架构体系,对案例中可能涉及的普遍需求和疑难需求进行了详细讲解,能广泛适配大部分企业的大数据处理系统。
掌握能力:掌握Hadoop研发能力、掌握离线数据存储和分析、掌握离线和实时数据的处理能力、Spark处理数据能力、高性能计算任务编写能力。
胜任职位:Hadoop研发工程师、ETL工程师、数据仓库工程师、离线分析工程师、Spark实时处理工程师。
![](https://img-bss.csdnimg.cn/202201120836363084.png)
![](https://img-bss.csdnimg.cn/202201120835098492.png)
![](https://img-bss.csdnimg.cn/202201120835217678.png)
![](https://img-bss.csdnimg.cn/202201121249007219.png)
推荐课程