0
42
¥ 0.00
立即开通
立即购买

你将收获

Hive的基本配置和应用

Hive的数据类型以及内置函数

用Hive实现离线应用开发

sqoop的应用开发和azkaban的介绍应用

适用人群

有一定基础,对HDFS和MapReduce有一定了解的学员。

课程介绍

本章将为大家解答以下问题:基于Hadoop的Hive工具的基本概念以及配置和启动。Hive的数据类型、表以及数据操作。如何用Hive进行数据查询。Hive的内置函数。如何用Hive实现电商的自动推荐。如何进行Sqoop的应用开发。Hive的UDF自定义函数介绍和应用。azkaban的介绍和实际应用。



课程讨论

暂无评论

同学笔记

  • qq_32439397 2020-06-04 09:44:01

    来源:Hive的配置和启动 查看详情

    1)解压安装hive

    tar -zxvf apache-hive.1.2.tar.gz

    2)安装MySQL数据库

    rpm安装包

    yum

     

    创建普通用户Hadoop

    创建数据库hive_meta

    3)配置hive

    hive-site.xml

    url    jdbc:mysql://master:3306/hive_meta?characterEncoding=utf-8

    driver

    username

    password

    4)在hive中导入JDBC连接数据库的Javadriver

    5)jline.jar

    由于Hadoop的版本过低,而hive版本高,替换jline.jar

    6)配置环境变量

    7)调用启动命令

    hive

    hive>

  • qq_32439397 2020-06-04 09:20:12

    来源:Hive的数据类型1 查看详情

    echo在Linux系统里是输出

    cd

    pwd

    vim

     

  • qq_32439397 2020-06-04 09:05:46

    来源:Hive的基本概念 查看详情

    hive其实就是一个数据仓库,大数据领域用于数据分析的引擎

    HDFS(数据存放)

    MapReduce(计算方式)

    hive提供类SQL实现机制HSQ

    hive-基于Hadoop的开源数据仓库工具,用于存储和处理海量结构化数据,通过表的方式管理数据;而实际上这些数据室分布式的存储在HDFS上的。

    hive的数据处理:通过HQL完成,转换成MapReduce任务

    hive其实就是一个壳(工具)

    hive:可扩展性、延展性、容错性

     

没有更多了

立即
领取

32元现金抵扣券

期限:限时领取

范围:千门课程任意选