仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-302
请扫码咨询

新媒易动态

NEWS CENTER

像推荐系统这块由多个模块组成的产品,只有了解了其数据流,才能知道这个系统是如何运作的

2021-06-22

我们来了解推荐系统框架的数据流。

一、概括

为什么要了解数据流?

对于一款非常复杂的产品,比如像推荐系统这块由多个模块组成的产品,只有了解了其数据流,才能知道这个系统是如何运作的。

对于产品经理自身而言,只有了解了整体数据流,才能增强自己对复杂产品设计的把控能力。

二、推荐系统数据流

1. 背景Brief

要了解推荐系统的数据流,首先需要知道,对于一个推荐系统,主要的数据模块。可以将其抽象成3个模块:用户数据、物料数据、用户行为。

2. 推荐系统目标

对于一个推荐系统,它的目标是什么?通过两个case来了解。

1)Case 1:资讯场景

比如资讯场景业务目标是点击率。点击率的计算逻辑 = click / show。

那为了提升点击率,我们需要哪些数据实现目标?

  • 静态数据:用户表、物料表。
  • 用户行为数据:用户行为数据。

聚焦到用户行为数据,如何定义哪些是正样本、哪些是负样本。


需要注意的是,在行为数据定义时候(样本定义时候),经常出现的几个show虚报的问题:

  1. 推荐结果即show。推荐结果即show的意思是,比如一个相关推荐场景,后台服务器一次给出的预测结果是10条数据,客户端只展现了4条。为了图方便,客户的上报show的逻辑是将所有的返回推荐结果都上报为show。
  2. 加载即show。在信息流场景,往往需要预加载。但是很多预加载的item,实际上尚未被展示。客户的埋点逻辑是加载即上报show,因此会导致show虚高。
  3. 信息流上下滑动。在信息流场景,还经常出现的一个问题是,用户经常上下刷动,所以同一物料会有多次曝光,建议上报时候做去重设置。

2)Case 2:小视频场景

比如小视频场景,建模目标是完播率,即视频的播放时长/视频的总时长。

3. 推荐系统如何实现业务目标

将推荐系统实现业务目标拆分成两条数据流来理解,在线数据流和离线数据流。

1)在线数据流

相关推荐