基于spark的机器学习项目实战

无限期视频有效期

54节节数

970人学习人数

2.9分

课程评分

免费试看

超级会员免费学抽豪礼

开通超级会员专栏·视频免费学

IT 节气

张勇

lv: 白银讲师

升级再获取93荣耀值升级成黄金讲师

当前荣耀值： 8 101

4 课程数量

1879 学生人数

后端技术经理

工作10年，外包、知名互联网公司、小创业公司、集团公司都做过。核心在于企业技术架构以及机器学习领域。三人行必有我师，希望我们一起探讨成长。

课程介绍
课程目录
讨论留言

你将收获

快速掌握spark开发，了解实现原理

熟悉机器学习的一些算法

能自主实现一套完成的机器学习架构

适用人群

初中级程序员，未接触过机器学习的开发人员，未接触过spark的开发人员

课程介绍

根据图识，项目将分为三个部分。整个项目基本思路是如何通过爬虫爬取大量数据放到Hbase，然后通过ETL工具初步转化筛选将数据存到mongodb，抽取mongodb的数据进行清洗处理算出模型放到hdfs。后续进来数据通过模型运算出数据的类型。项目系统主要包括前端+后端+机器学习，前端采用React Native，Native，后端采用Dubbo+Spring+java，机器学习采用Spark进行实现，本项目机器学习-spark代码运行在mesos上。

本课程我们只针对以上图示的浅蓝色部分内容（即与机器学习相关的内容），通过用真实的智能客户项目系统作为案例（案例附带源码，可以直接做二次开发），主要根据项目实例穿讲机器学习以及相关知识，包括有：数据提取，数据清洗以及分词，数据特征值提取、机器学习模型计算、数据分类等等，进行详细讲解。

本课程所需掌握的技术：java、scala、IK、Hdfs、Spark ml、Spark Streaming、Spark SQL、Kafka、Zookeeper、Mongodb、Spring-Data-Mongodb，由于每个技术需要掌握的程度不一样，对于我们用到的一些开源技术，课程中将会是简单介绍如何使用，不会着重讲解。课程重点讲解spark ml、spark Streaming，以及如何使用这些技术进行项目的实战，贯穿项目系统并且最后串联所有技术。spark基于2.0.1版本讲解

课程目录