包含课程

  • 943人 学习人数
    0.0分 课程评分
    大数据之Storm/实时数据处理视频教程
    大数据Storm实时数据处理视频培训课程:Strom是一个老牌的实时数据处理框架,在Spark Streaming流行前,Storm统治者整个流式计算的江湖。更详细的说,Storm是一个实时数据处理框架,具有低延迟/高可用/易扩展/数据不丢失等特点,同时,Storm还提供流类似与MapReduce的简单编程模型,便于开发。Storm的使用场景:实时监控与日志分析、管道系统和消息转换等。
    大数据
    Storm
    数据
    其他
    云计算/大数据
  • 605人 学习人数
    0.0分 课程评分
    大数据之Kafka
    Apache Kafka的应用有了显著的增长,它初由LinkedIn公司开发,Kafka是一种、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。Kafka新的客户包括Uber, Twitter, Netflix, LinkedIn, Yahoo, Cisco, Goldman Sachs 等。利用Kafka系统,用户可以发布大量的消息,同时也能实时订阅消费消息。
    大数据
    afka
    云计算/大数据
  • 536人 学习人数
    0.0分 课程评分
    大数据之Flume
    Flume是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
    大数据
    Flume
    其他
    云计算/大数据
  • 493人 学习人数
    0.0分 课程评分
    大数据之Pig和Sqoop
    Pig早是雅虎公司的一个基于Hadoop的并行处理架构,后来由Apache来负责维护,Pig是一个基于Hadoop的大规模数据分析平台。Sqoop专为大数据批量传输设计,能够分割数据集并创建Hadoop任务来处理每个区块,可以结构化数据导入到Hadoop分布式文件系统或Hive和HBase系统。
    大数据
    pig
    Hadoop
    云计算/大数据
  • 928人 学习人数
    0.0分 课程评分
    大数据HBase之入门进阶
    HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。本次课程适合HBase入门的学员,课程首先介绍了什么是HBase ,HBase安装以及Sell入门,其次通过介绍独立zk、JavaAPI、区域操作、HBase常用功能、过滤器等一系列功能操作进行详细解析,帮助学员更好的理解,最后以HA集成进行入门阶段的收尾,全程通俗易懂,为初学者提供了良好的学习素材。
    大数据
    hbase
    其他
    云计算/大数据
  • 523人 学习人数
    0.0分 课程评分
    大数据之ZooKeeper与Hadoop
    ZooKeeper是一个针对大型分布式系统的可靠协调系统,为分布式应用提供一致性服务,是Google的Chubby一个开源的实现。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。Zookeeper一个常用的使用场景就是用于担任服务生产者和服务消费者的注册中心。本讲通过实现Hadoop的高可用体验ZooKeeper工作机制。
    大数据
    hadoop
    zookeeper
    云计算/大数据
  • 956人 学习人数
    0.0分 课程评分
    大数据之Hive
    hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
    大数据
    hive
    hadoop
    Hadoop
    云计算/大数据
  • 856人 学习人数
    0.0分 课程评分
    大数据之Mapreduce
    MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。
    mapreduce
    大数据
    hadoop
    云计算/大数据
  • 618人 学习人数
    5.0分 课程评分
    大数据之HDFS/Hadoop集群管理
    HDFS是Apache Hadoop项目的一部分,是一个分布式文件系统,用于存储和管理文件,能提高超大文件的访问和存储速度。HDFS采用一次写入多次读取的流式数据访问模式保证了数据的一致性。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS适合服务于大规模数据集上的应用。
    大数据
    hdfs
    hadoop
    Hadoop
    云计算/大数据

套餐介绍

一、大数据之HDFS/Hadoop集群管理 HDFS是Apache Hadoop项目的一部分,是一个分布式文件系统,用于存储和管理文件,能提高超大文件的访问和存储速度。HDFS采用一次写入多次读取的流式数据访问模式保证了数据的一致性。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。 二、大数据之Mapreduce MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。 三、大数据之Hive hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 四、大数据之ZooKeeper与Hadoop ZooKeeper是一个针对大型分布式系统的可靠协调系统,为分布式应用提供一致性服务,是Google的Chubby一个开源的实现。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。 五、大数据之HBase HBase是一种构建在HDFS之上的分布式、面向列的存储系统。HBase在Hadoop之上提供了类似于Bigtable的能力,适用于实时读写、随机访问超大规模数据集。HBase不同于一般的关系数据库,它将大而稀疏的表放在服务器集群上,适合于非结构化数据存储的场景。 六、大数据之Pig和Sqoop Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来由Apache来负责维护,Pig是一个基于Hadoop的大规模数据分析平台。Sqoop专为大数据批量传输设计,能够分割数据集并创建Hadoop任务来处理每个区块,可以结构化数据导入到Hadoop分布式文件系统或Hive和HBase系统。 七、大数据之Flume Flume是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 八、大数据之Kafka Apache Kafka的应用有了显著的增长,它最初由LinkedIn公司开发,Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。Kafka最新的客户包括Uber, Twitter, Netflix, LinkedIn, Yahoo, Cisco, Goldman Sachs 等。 九、大数据之Storm/实时数据处理 Strom是一个老牌的实时数据处理框架,在Spark Streaming流行前,Storm统治者整个流式计算的江湖。更详细的说,Storm是一个实时数据处理框架,具有低延迟/高可用/易扩展/数据不丢失等特点,同时,Storm还提供流类似与MapReduce的简单编程模型,便于开发。