新媒易动态
NEWS CENTER
NEWS CENTER
2021-03-30
其实产品领域的很多指标,都缺少业界通用的定义。并不是没有优秀的定义,只是还没有在业界普及开来。就拿最简单的产品转化率来说,有多少人能分清用户转化率和用户数比值的差异呢?
再比如复购率,A 产品的复购率是 60%,B 产品的复购率只有 40%,并不一定是 A 比 B 好,很可能是 A 在复购率口径的定义上取巧,让复购率显得好看一点,方便拉投资。从这一点来看,可以说我们现在所处的时间段,还是一个方法论初生的时间段。
那么当我们说到留存率时, 到底什么才是留存率?
有人说,今天来了,第2天还来,就是留存,第7天还来,就是7日留存。
这种说法还算符合常见的数据平台的定义, 不过还不够精准.
有人说,今天来了,7天之内又来过,就是7日留存。
别笑, 真的有某明星独角兽高管要求这么定义 n 日留存, 并且还说服了 CTO, 要照此开发相应的报表每日跟踪. 当时亲临其中的我, 只好委曲求全, 整出来两个概念, 一个叫第 n 日留存, 一个叫 n 日内留存.
抱着强势批判性思维, 我们先去看背后的业务目的, 有没有合理性:
想看 n 日内的“留存”,代表着想要看这么一种业务表现:T 日来的人,有多少在之后的 T+1 到 T+n 日还来,这部分还来的人,才能算我留存下来的用户。而觉得不应该看第n日留存的原因,是觉得只看某一日来没来,过于随机了,要是用户 n+1 日或者 n-1 日来怎么办,不都没统计进去吗?
仔细品一品, 问题有两点:
定义留存率的目的,是想要衡量我们从各个渠道那里所获得的流量,最终有多少留下来成为我们的忠实用户。从这个业务背景出发,真正的留存率,一定是针对新用户而言的。对着老用户谈“留存”,实际是在谈另外的业务,比如:
而对于每日所有活跃用户的”次日留存”, 就更没有意义了. 这个虚假的数据指标完全被用户的构成所左右, 一部分是当日的新用户次留, 另一部分是当日的老用户的次日回访 (访问频次) . 当每日活跃用户 90% 以上是新用户的时候, 这个”次日留存”就会很低, 而 90% 以上是新用户的时候, 这个”次日留存”就跟产品形态强相关, 也就是忠实用户的平均使用频次.
所以科学的留存率(日)定义,应该是:T 日新增用户中,在第 n 日(即 T+n 日)再次活跃的用户,占 T 日新增用户的比例。谷歌的官方说法更简洁,叫:Percentage of new users who return each day.
通过上面的定义,我们再去看日留存曲线的时候,一定是一条这样的曲线:
通过这条曲线,我们可以清楚的知道每一天新增的这批用户,随着时间的流逝最终留存下来了多少。并且这条留存曲线一定是可以通过乘幂函数拟合的,把第 n 日的留存率记为 Ret(n),则一定有:Ret(n)=a*n^b
这里说了这么多“一定”,其实是想强调留存曲线几乎是一条标准的客观规律,无论什么样的产品形态,都有这么一条曲线。他们可能有高有低、有急有缓,但是都可以用一条乘幂函数表示。而理解了留存曲线是客观规律这一事实,就能理解为什么我们可以用次日留存、7 日留存等作为产品的重要指标了:因为他们都是对留存曲线一整条曲线的点估计。
说白了,就是把一整条曲线降维成一个点,这样我们就可以每天观察这个点的变化情况,从而得知产品的留存状况是变好了还是变坏了。下图中是次日留存和 7 日留存的变化曲线,X 轴是日期,Y 轴是留存率,业务含义即在 X 日新增的用户,其对应的 n 日留存率是 Y。很明显,如果没有这种降维方法的话,我们就要给每一天画一条留存曲线了,几十条留存曲线摆在一起是看不出来留存随日期的趋势变化的。