包含课程

 • 394人 学习人数
  4.5分 课程评分
  超大数据集上的亚秒级查询工具Kylin教程
  Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。  Apache Kylin™令使用者仅需三步,即可实现超大数据集上的亚秒级查询。 * 定义数据集上的一个星形或雪花形模型 * 在定义的数据表上构建cube * 使用标准SQL通过ODBC、JDBC或RESTFUL API进行查询,仅需亚秒级响应时间即可获得查询结果 Kylin提供与多种数据可视化工具的整合能力,如Tableau,PowerBI等,令用户可以使用BI工具对Hadoop数据进行分析。 本套教程主要对Kylin的基础理论的讲解,涉及到各种重要概念、原理和API的用法,并对Kylin优化进行深入剖析。通过理论和实际的紧密结合,可以使学员对Kylin有充分的认识和理解,对大数据技术有更全面的了解,为日后成长为架构师打下基础。
  云计算/大数据
  Hadoop
  大数据
  开源社区
  分布式
 • 663人 学习人数
  4.5分 课程评分
  通俗易懂的Hive升级版教程(含配套资料)
  Hive是基于Hadoop的一个数据仓库工具,将繁琐的MapReduce程序变成了简单方便的SQL语句实现,深受广大软件开发工程师喜爱。Hive同时也是进入互联网行业的大数据开发工程师必备技术之一。在本课程中,你将学习到,Hive架构原理、安装配置、hiveserver2、数据类型、数据定义、数据操作、查询、自定义UDF函数、窗口函数、压缩和存储、企业级调优、以及结合影音项目需求,把整个Hive的核心知识点贯穿起来。更新:课件升级、添加自定义UDTF函数、企业常用函数以及更多企业面试真题详细讲解
  hive
  云计算/大数据
  大数据
  mapreduce
  函数
 • 689人 学习人数
  4.5分 课程评分
  通俗易懂的Azkaban教程(含配套资料)
  Azkaban是一个Hadoop workflow定时调度工具,它解决了多个Hadoop任务单元之间的前后依赖关系。它提供了十分友好的用户界面,使用简单,容易上手。在本课程中,你将学到,Azkaban的安装部署,Azkaban基础架构,Azkaban定时调度工作流程(包含Shell、MapReduce、Hive等)、Azkaban邮箱通知。
  云计算/大数据
  大数据
  mapreduce
  hadoop
  shell
 • 731人 学习人数
  4.4分 课程评分
  新版全面系统完整的Oozie教程
  本教程为官方授权出品教程 Oozie是大数据生态圈中一个基于工作流的任务调度工具,也是大数据工程师的一个常用工具。 在本课程中,你将学习到Oozie的原理、 安装配置、使用Oozie实现调度Shell脚本、 逻辑调度多个Shell脚本、 直接调度MapReduce任务以及定时逻辑调度多个任务等。
  云计算/大数据
  大数据
  mapreduce
  shell
  任务调度
 • 430人 学习人数
  4.4分 课程评分
  新版全面系统完整的Zookeeper视频教程
  Zookeeper主要应用于大数据开发中的,统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等场景。该框架相当于大数据框架中的润滑剂。是大数据大数据开发工程师必须会的框架之一。本套课程讲解了Zookeeper的集群安装、 选举机制、监听器原理、 写数据流程、Shell命令行操作、 客户端API操作、 服务器节点动态上下线综合案例,以及企业真实面试题。
  云计算/大数据
  大数据
  zookeeper
  视频
  shell
 • 1049人 学习人数
  4.5分 课程评分
  新版全面系统完整的Hbase视频教程
  本教程为授权出品作品 HBase是一个基于HDFS的分布式、面向列的开源数据库,是一个结构化数据的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。是每一个大数据都应该掌握的基本框架。在本课程中,主要讲述了HBase详细的架构原理及特点、HBase内部各个角色的详细介绍、安装配置、HBase的Shell操作、新旧版本的读写数据详细流程、HBase的API操作、使用MapReduce以及Hive对HBase数据分析、Rowkey设计、预分区设计、调优策略以及结合谷粒微博项目将核心知识点再次梳理,更熟练的运用HBase。
  大数据
  视频
  hbase
  云计算/大数据
  mapreduce
 • 596人 学习人数
  4.1分 课程评分
  新版全面系统完整的Sqoop教程
  本教程为联合出品 Sqoop是大数据生态圈中一个数据传输工具,也是大数据工程师的一个常用工具。在本课程中,你将学习到,Sqoop的原理、安装配置、使用Oozie实现数据在Mysql与HDFS(Hive、HBase)等框架之间的互导。
  大数据
  视频
  技术
  云计算/大数据
  Hadoop
 • 598人 学习人数
  4.1分 课程评分
  大数据技术之HA视频教程
  本教程由尚硅谷和张长志联合出品 HA(High Available)意为高可用,在本课程中主要是Hadoop的高可用,在实际开发环境中是必不可少的技术之一。 你将通过本课程学习到,Hadoop存在的单点故障问题,解决单点故障的方案,搭建手动故障转移的HDFS-HA集群,搭建基于Zookeeper的自动故障转移的HDFS-HA集群以及自动故障转移的Yarn-HA集群。  购买后资料问题请加老师QQ  2020363447
  大数据
  视频
  技术
  云计算/大数据
  Hadoop
 • 1112人 学习人数
  4.6分 课程评分
  全面系统完整的Flume教程
  Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。是大数据大数据开发工程师必须会的框架之一。在本课程中,你将学习到,Flume架构原理、安装配置、拓扑结构、使用Flume搭建监控端口采集数据、监控本地(或HDFS)文件(或文件夹)采集数据、多数据源采集数据、多数据出口收集日志、Flume负载均衡以及对于Flume的监控Ganglia的运用。购买后资料问题请加老师QQ  2020363447
  云计算/大数据
  Hadoop
  大数据
  负载均衡
  工程师
 • 1962人 学习人数
  4.6分 课程评分
  新版全面系统完整的Kafka视频教程
  本教程由尚硅谷和张长志联合出品Kafka是一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。在本课程中,你将学习到,Kafka架构原理、安装配置使用、详细的Kafka写入数据和处理数据以及写出数据的流程、新旧版本对比及运用、分区副本机制的详解、内部存储策略、高阶API直接消费数据、低阶API自行管理Offset消费数据、Kafka拦截器以及KafkaStream流式处理。购买后资料问题请加老师QQ  2020363447
  云计算/大数据
  大数据
  kafka
  api
  scala

套餐介绍

Hadoop生态圈主要用来解决海量数据的存储和分析计算问题。是大数据开发工程师必备技术之一。 课程特点: 1、全程案例贯穿始终,几乎每个知识点都有配套的案例; 2、整个框架深入源码讲解; 3、优化措施全部来源于企业开发; 4、Hadoop生态圈相关企业真题全覆盖。 第一章 Hadoop、Zookeeper 第二章 数据仓库工具hive 第三章 HA 第四章 Flume 第五章 分布式数据库Hbase 第六章 批量数据迁移的工具Sqoop 第七章 批量工作流任务调度器Azkaban 第八章 任务调度框架Oozie 第九章 亚秒级查询工具Kylin