0
77
¥ 99.00购买
开通会员,立省9.90元, 立即开通
立即购买

你将收获

1.对推荐系统有一个全面的初步认知,知道推荐系统的技能要求、价值、应用场景;

2.了解最主流的推荐算法基本原理;

3.了解在真实业务场景中怎么做好推荐系统,让推荐真正产生价值;

4.熟悉推荐系统的产品形态,针对不同的产品怎么更好地将推荐能力整合进去;

适用人群

本课程适合期望未来从事推荐系统开发的学生、已经工作但是期望转行做推荐系统的工程师、对推荐系统感兴趣的产品、运营等人员。

课程介绍

本课程是推荐系统的入门课程,主要从推荐系统背景介绍、推荐算法、推荐系统工程、推荐产品形态、实战等五个部分对推荐系统做初略的介绍。在背景介绍部分,会讲解推荐系统的技能要求、推荐系统的价值与应用场景、推荐系统团队组成及角色定位、推荐系统的未来发展等。在推荐算法部分,会讲解最主流的基于内容的、协同过滤等推荐算法。在工程实践部分会讲解怎么评估推荐系统、推荐系统AB测试等方面的工程知识。在产品形态部分,会讲解常用的推荐产品形态及怎么更好地将推荐能力整合到现有产品中,以及推荐系统与用户的交互方式。在实战部分,我们会带学员一起基于开源数据集从零开始搭建一个完整推荐系统,为学员以后的学习和工作打下良好的基础。

本课知识点

人工智能机器学习ab测试产品算法工作团队应用

课程讨论

老师讲的很好,但是有些问题不明白怎么提问呢?有交流群么?这些课程已经录制完了嘛?

666,视频内容丰富,学到很多

视频内容丰富,学到很多。请问什么时候更新呀

YouTube视频推荐。YouTube会根据你所点击视频内容推荐,同一个up主publish的,相同演员所饰演的其它内容的,或者偶尔会推荐相似内容的。而且会根据你所观看这个视频的长短来判断你是否喜欢这个这个视频。eg. 一些视频点了个开头你就切换了,YouTube可能会不再推荐该视频。 不足:用户有些时候会突然厌倦某些视频,不希望YouTube再推荐相关内容,但YouTube依然会推荐类似内容。

你好,加我微信liuq4360

视频啥时上传?视频啥时上传?视频啥时上传?视频啥时上传?

同学笔记

  • swety_gxy 2020-03-19 22:29:36

    来源:推荐系统离线评估 查看详情

    推荐系统离线评估

     

    1.什么是离线评估?

    离线评估在推荐算法全生命周期评估中的作用与位置,如图所示:

    离线评估是整个推荐系统评估的第一个环节,它处于算法模型训练和模型上线提供服务之间,也就是说,模型训练好之后,通过离线评估来选择一个比较好的模型,来作为上线服务的模型。

    总的来说,离线评估是在推荐算法模型开发与选型的过程中对推荐算法模型做评估,通过评估具体指标来选择合适的推荐算法,将算法部署上线为用户提供服务。

    推荐算法作为机器学习的一个算法,它的流程和一般的机器学习流程类似,如下图所示:

    离线评估通常发生在第二个阶段,即预测阶段。

    2.离线评估的目的

    推荐系统评估的目的就是从精确度、惊喜度、多样性等维度来评估出推荐系统的实际效果及表现,从中发现可能的优化点,通过优化推荐系统,期望更好地满足用户的诉求,为用户提供更优质的推荐服务,同时通过推荐获取更多的商业利益。

    3.常用的评估指标

    (1)均方根误差(RMSE)和平均绝对误差(MAE)

    要求用户对物品有真实的打分,但在实际中,用户对物品打分较少,故在推荐业务上应用较少。

    (2)准确率、召回率

    精确度:Pu

    召回率:Ru

    一般来说精确率和召回率不可能同时很差或者同时很优,它们是相对立的。在推荐过程中,我们一般希望这两者效果都好,因此用到F1指标(调和平均数)来权衡。

    下图第一行是单个用户的精确度和召回率的计算;第二行是所有用户的精确度和召回率的计算。

    (3)其他指标

    ---覆盖率:推荐的物品能够覆盖总物品的比例

    ---多样性:给用户推荐多类物品,满足用户多样性的兴趣偏好

    ---惊喜度:让用户有耳目一新的感觉,无意中给用户带来惊喜

    ---新颖性:推荐用户之前没有了解过的物品

  • swety_gxy 2020-03-19 22:02:10

    来源:数据与特征工程02 查看详情

    数据与特征工程2

    (4)特征工程的一般流程和步骤

    1)数值处理与特征增强 

    缺失值处理:均值、中位数、众数填充

     归一化(统一量纲):min-max归一化、分位数归一化、正态分布归一化

    2)特征表达与构建

    类别特征(离散特征):one-hot编码、TF-IDF编码

    数值特征(连续特征):直接使用(可能通过增强)、离散化(分桶)

    3)特征选择

    基于统计量:方差(选择方差大的)、皮尔森相关系数(两个变量之间的比较)

    基于模型:基于线性模型的系数大小、通过添加或者减少特征让模型效果更好

     

    (5)案例:构建特征利用logistic回归做CTR预估

    下面是logistic回归模型的公式:

     

     

  • swety_gxy 2020-03-19 21:08:35

    来源:数据与特征工程01 查看详情

    数据与特征工程1

    (1)推荐系统依赖的数据是什么?

    一般分为4大类:

    -用户行为数据:浏览、播放、收藏、点赞、评论、转发、加购物车、购买

    -用户属性数据(人口统计学):年龄、地域、性别、学历、职业、收入情况等

    -物品属性数据:例如视频,有标题、标签、演职员、年代、国别、语言等

    -上下文数据:指用户在使用过程中的一些场景数据。比如用户所在地域、时间、日期、用户当前状态等

    从数据格式上分:

    -结构化数据:主要是文本类的或者数值类型的,用户属性数据、物品属性数据;每一行数据表示一个样本信息。

    -半结构化数据:日志类数据,如用户行为数据,一般是json形式的。

    -非结构化数据:可能包含音频、图片、视频等,其无法用一个简单的数值表示,也没有清晰的类别定义,并且每条数据的大小各不相同。

    (2)什么是特征?什么是特征工程?

    ---什么是特征?

    特征通常是建立在原始数据上的特定表示,它是一个单独的可测量属性,通常用数据集中的列表示。对于一个通用的二维数据集,每个观测值由一行表示,每个特征由一列表示,对于每一个观测值有一个特定的值。

    特征通常从不同的维度来描述用户的信息。

     

    ---什么是特征工程?

    特征工程是将原始数据转化为特征的过程,这些特征可以更好地向预测模型描述潜在问题,从而提高对未见数据的准确性。它对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。

    如下图为机器学习的一般处理流程:

     

    (3)特征的分类有哪些?

    从特征的值类型来分:

    -类别特征:比如性别(无序)、等级(有序)

    -数值特征:比如身高、年龄

    -时空特征:时间(相对的、周期性的)、地理位置(层级关系、距离)

    从特征的可解释性来分:

    -显式特征:类别、数值、时空、TF-IDF、LDA

    -隐式特征:word2vec、矩阵分解等模型生成的嵌入特征。

    (4)特征工程的一般流程与步骤

     

没有更多了