你将收获

掌握hive的使用

掌握hive与hadoop的整合

hive on tez的使用

适用人群

本课程适合大数据运维工程师、大数据分析同学进行参考和学习。

课程介绍

本课程主要介绍hive的架构与应用,首先介绍了hive的实现结构,然后介绍了Hive Metastore三种模式,接着重点介绍hive的安装与配置,以及hive sql的基本操作,后面又介绍了hive beeline、hive on tez的使用,并测试了hive on MR和TEZ的性能优缺。

本课程以apache hadoop发行版本为例,介绍如何实现hadoop与hive的整合,hadoop环境采用手动安装的hadoop3.2.1环境,hive版本同样采用apache hive3.1.2发行版本。以3台主机为例作为hive安装环境,采用Centos7.7操作系统。

课程大纲如下:    

1、hive的架构与应用场景

2、Hive Metastore三种运行模式

3、hive安装以及与hadoop整合

4、hive的安装与配置

5、启动metastore与hiveserver2服务  

6、hive常用SQL操作

7、beeline的使用

8、tez的编译以及tez与hive整合步骤

9、测试tez功能以及与MR性能比较