推荐算法是如何推荐出你喜欢的内容？

最近在研究和梳理推荐算法的底层逻辑

其实一些技术原理，说大白话可能不太好理解，毕竟技术逻辑复杂，我试着看看能不能讲的通俗易懂

也希望通过这类输出，倒逼着自己更好的学习输入

推荐系统，说到底其实也不复杂，做的就两件事

召回和排序

召回：召回指从大盘内容池里召回你喜欢消费的内容

排序：排序是指通过数据模型，预测你的喜好程度，将你更可能感兴趣的消费内容优先排前面让你看到

这就是推荐系统的底层逻辑

为了方便大家理解，所以也就先把底层抛出来

现在随着某音的火爆，相信很多朋友也都在研究推荐算法，甚至各种玄学策略求流量，各种不同曝光对应的内容池，一层一层往上滚，但推荐底层是什么呢？

希望这篇文章能帮助你

前面有提到召回和排序，这两者说起来简单，但都少不了数学模型的参与，推荐系统会基于用户历史行为数据和策略产品经理制定的策略规则，把内容从海量内容库中召回出来。

打个比方，短视频推荐为例，一个常见的召回策略，需要经过这三步

第一步召回的可能是用户观看过的视频的向量、用户搜索词向量以及用户的来源渠道/性别/位置/年龄等静态特征（这些特征需要反复ab验证）

第二步而线下模型训练阶段，为用户推荐下一个感兴趣短视频的多分类问题，输出的是所有候选短视频集合上的概率分布

第三步线上预测阶段，首先通过用户id找到相应的用户向量，然后通过算法（比如KNN算法）找到相似度最高的N条候选结果返回

这就是一个召回策略的推荐过程

这个说起来，可能大家感觉比较复杂

常见召回还有一些类似的策略，就是协同过滤推荐算法

比较常见的协同召回是“协同用户”和“协同内容”（有的可能还有协同作者和协同标签，这里就不展开）

协同用户是，比如

a用户喜欢看老虎、狮子

b用户喜欢看老虎、大象

这时系统会基于a和b用户都喜欢看老虎，他们有共同喜好可能是一类人，推荐系统会猜测a也会喜欢看大象，给a推荐大象

而协同内容是，比如

a用户喜欢看老虎内容，推荐系统会拆解老虎内容，比如老虎属于动物，大型猫科类动物，凶猛，食肉动物，有这些细致特征等等。

这时推荐系统识别到这些特征（一般会由人工打标签或机器打标签），大概率也会给你推荐同样命中这些特征的豹子相关内容。

这就是协同内容，也是召回的主要方式

不过大家应该也都看得出来，这些策略基本上很大程度上依赖于你的历史行为

可能大家会觉得这不是废话，推荐算法肯定依赖于你历史行为，你历史行为越丰富，无疑推荐的会越准

但现实中有2种情况，比较特殊，也可能比较头疼。

一个就是新用户的推荐，一个就是新内容的推荐。他们的共同特点就是，历史行为都很少，很难基于他们过去数据进行预测，那怎么办？

先说新用户这块

从互联网推荐系统角度总结，有四个点

1、历史优质内容：研究站内历史优质视频，别管新来的人是谁，我们把产品里历史最优质的内容丢出去，总是可能性比较大的吧。这里的历史优质，可能是历史站内高赞内容，历史高点赞率内容，历史高有效播放率内容，最近站内热点内容

2、用户特征：虽然用户是新用户，但性别、地理位置、渠道、机型、渠道、通讯录（如果拿到授权的话）、系统、applist这些多少还是拿的到的，可以结合这些特征，匹配产品里，历史里有这些特征的人喜欢看什么

3、内容调性：内容平台也是品牌，作为品牌都有自己的一些品牌调性，你的平台调性是什么，你希望让用户觉得你是什么样的平台，你就推荐什么样调性内容，这也是一个思路，一般这个需要运营强干预

4、外界流行：还有一个是外界的热点，一般流行热点都是自带流量的，在每个平台都是相通的，这个也是比较万金油的，推荐外部流行也是被验证过的，大概率也不会差

如果光这样说，大家不知道会不会觉得好像也有点复杂

其实这和咱们实体店做销售很像

比如你是纪梵希销售，你会怎么样打动刚进门的陌生新客户

如果用我上面四点，其实对应的就是

1、推荐纪梵希过去的爆款，经典款，大概率能命中

2、通过观察客户的性别、年龄、穿着、走路姿势，脑海回想过去有这些特征用户比较喜欢什么，猜测他的审美

3、纪梵希毕竟也是有自己的品牌特色，不能推掉价的东西，这个也是推荐的前提。而作为纪梵希销售，面对新客户肯定也要推荐最能体现纪梵希品牌特色的东西

4、现在外面流行什么款式，哪怕纪梵希，该蹭的热点，肯定也需要蹭

上面纪梵希只是随便举得一个例子，希望方便大家理解

在非互联网世界，销售就是最牛逼的推荐，他们的脑子就是人工智能，不知道经过这个线下场景投射，大家有没有更理解一点

而新内容怎么办？其实也是同理

如果你是销售，你会怎么卖新品？不会上来就推荐新客户买新品吧？毕竟新品没被市场验证过，万一不好，砸了招聘，新客户再也不来怎么办？

所以一般会基于新产品特征推荐给相应喜欢这些特征的老用户，先看看忠实用户的反馈，一般忠实用户的行为也比较多，比较好预测准，命中的概率大，并且忠实用户对产品的容错心态也更好。

而如果喜欢这些特征的忠实用户都不喜欢，就没必要推荐给其他人了，防止负反馈变多

然后如果在忠实用户圈子里得到正面反馈后，慢慢的就可以把人群扩大（算法的作用就这样体现了），一般会扩大到某部分人接受无能了，这也就新品的天花板了

而召回后其实也是前面提到的排序，什么内容优先展示？

一般基于目前产品战略方向

如果是短视频平台

重视平台里用户关系？那可能是关注转化高的视频优先推荐

重视平台里用户时长？那可能是消费视频时长高的视频优先推荐

再用一下纪梵希的销售的例子，你推荐纪梵希商品肯定有基于的目标。比如你目前的销售指标是销售量？那你是不是可能优先推荐物美价廉的商品，来冲量

如果你目前目标的销售额？那就优先推荐高价产品

总的来说，如果说召回基于用户喜好，排序则会基于自身目标出发，和你当时目标强相关

这也是我对推荐的一些理解，通过线上模型和映射到线下（纪梵希）例子相结合，有把这些推荐逻辑讲清楚

本文来自作者:展风，不代表小新网立场！

转载请注明：https://www.xiaoxinys.cn/537.html

推荐算法是如何推荐出你喜欢的内容？

相关推荐