Press "Enter" to skip to content

策略PM二三事:推荐系统的算法思路

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

推荐算法已经诞生了20余年,目前已经发展得非常成熟了。作为算法不仅仅是效率提高,很多场景下更是提供了全新的体验。

 

效率提升很容易理解,推荐算法和纯编辑选择相比,无论是电商的销售额还是内容产品的点击率,都可以轻易取得翻倍的提升。今日头条之于传统门户就是全新的体验,有效地解决了不同用户资讯品味不同的问题,阅读体验有了颠覆性提升。

 

但不管时代怎幺发展,推荐面临的问题都是类似的,而围绕不同的推荐场景,解决的思路是有一些差异,今天依旧是避开具体算法,来介绍一些主要的推荐思路。

 

基于内容相似性

 

这是最古老的一种推荐算法了,因为你偏好A,所以就给你推荐A相似的B。大部分算法本质就是这个思路,区别就是怎幺定义偏好,怎幺定义相似。

 

偏好就是从茫茫用户行为中找到哪些用户行为代表了用户的兴趣。电商行业中最直接的就是购买,加入购物车、点击进入详情页也可以算。内容行业中的点击、正面评论、收藏、多次播放、分享、阅读后关注等都可以算。还可以有一些构造出来的指标,比如阅读比例大于X%,这些需要统计分析。

 

偏好的定义是推荐算法的基础,也是少有的产品经理能参与的部分,因为本质上是基于对用户的理解选取特征。但算法的发展,就是在不断排斥这些人工能干扰的因素,现在关于选特征有了很多算法手段,工程师需要做的就是不断把数据扔进算法。

 

基于相似性算法最大的变数就是关于相似的判断上。

 

最直接的就是基于内容是否有共同点,用户消费了一本书,给用户推荐同作者或者同主题的书。这的其实是结构化的标签,需要运营整理。

 

如果维度多一点就是基于标签推荐了,这里甚至可以把用户自定义的标签作为推荐依据。后来有一些算法化的方法做内容的标准化,可以从文章中提取主题标签,也算是基于标签的推荐,适合用在内容量巨大的UGC场景下。

 

基于协同关系

 

协同过滤是一个范围非常广泛的推荐算法,也是一种古老的推荐思路。不是基于内容的相似性,而是更系统化地从整体数据中找到推荐依据。

 

有一种古老的基于用户相似性的算法,就是计算用户之间的相似性,然后给用户推荐其他相似用户偏好的内容。而评估用户的相似性,就是基于用户的行为数据去判定。这种算法在规模很大的时候比较低效,因为要算所有人。

 

另一个协同就是非常常见的,“看过的人还看了”,就是假设用户看的内容之间有一定的关联度(不一定是相似),有推荐价值。这个算法简单高效,而且用户容易理解,目前还是很多算法的补充算法。

 

基于点击率预测

 

推荐算法本质也是对内容点击概率的预测,而基于很多特征去预测点击率,那算法可就太多了。

 

但是需要说明的是,不是说把内容按照点击率排序就是好的推荐算法,排序策略也很重要。显然不可能搞一堆一个类型的内容连在一起,用户会厌烦。但是算法发展了这幺多年了,有场景就有研究,排序的算法也有。

 

这类算法的核心就是找到对推荐效果有价值的特征,或者构造足够多的特征进去。

 

小结:

 

这种分类其实比较粗糙。而且为了简单点,连推荐算法名字都没写。

 

策略产品经理在推荐这个领域,想发挥价值,确实很难。领域太成熟了,看论文然后复现,都能解决大部分问题。但是也有一些算法视角之外的盲点可以参与。大部分算法工程师因为只关注算法而忽视业务细节,导致算法盲点处可以做很多业务调整,影响整体算法效率。

 

不过要理解算法的盲点有哪些,得先了解算法原理是什幺,就不得不深入到算法层面。这也是很多人觉得自己没有发挥空间的原因。

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注