推荐算法是如何推荐出你喜欢的内容?

推荐算法是如何推荐出你喜欢的内容?

最近在研究和梳理推荐算法的底层逻辑

其实一些技术原理,说大白话可能不太好理解,毕竟技术逻辑复杂,我试着看看能不能讲的通俗易懂

也希望通过这类输出,倒逼着自己更好的学习输入

推荐系统,说到底其实也不复杂,做的就两件事

召回和排序

召回:召回指从大盘内容池里召回你喜欢消费的内容

排序:排序是指通过数据模型,预测你的喜好程度,将你更可能感兴趣的消费内容优先排前面让你看到

这就是推荐系统的底层逻辑

为了方便大家理解,所以也就先把底层抛出来

现在随着某音的火爆,相信很多朋友也都在研究推荐算法,甚至各种玄学策略求流量,各种不同曝光对应的内容池,一层一层往上滚,但推荐底层是什么呢?

希望这篇文章能帮助你

前面有提到召回和排序,这两者说起来简单,但都少不了数学模型的参与,推荐系统会基于用户历史行为数据和策略产品经理制定的策略规则,把内容从海量内容库中召回出来。

打个比方,短视频推荐为例,一个常见的召回策略,需要经过这三步

第一步召回的可能是用户观看过的视频的向量、用户搜索词向量以及用户的来源渠道/性别/位置/年龄等静态特征(这些特征需要反复ab验证)

第二步而线下模型训练阶段,为用户推荐下一个感兴趣短视频的多分类问题,输出的是所有候选短视频集合上的概率分布

第三步线上预测阶段,首先通过用户id找到相应的用户向量,然后通过算法(比如KNN算法)找到相似度最高的N条候选结果返回

这就是一个召回策略的推荐过程

这个说起来,可能大家感觉比较复杂

常见召回还有一些类似的策略,就是协同过滤推荐算法

比较常见的协同召回是“协同用户”和“协同内容”(有的可能还有协同作者和协同标签,这里就不展开)

协同用户是,比如

a用户喜欢看老虎、狮子

b用户喜欢看老虎、大象

这时系统会基于a和b用户都喜欢看老虎,他们有共同喜好可能是一类人,推荐系统会猜测a也会喜欢看大象,给a推荐大象

而协同内容是,比如

a用户喜欢看老虎内容,推荐系统会拆解老虎内容,比如老虎属于动物,大型猫科类动物,凶猛,食肉动物,有这些细致特征等等。

这时推荐系统识别到这些特征(一般会由人工打标签或机器打标签),大概率也会给你推荐同样命中这些特征的豹子相关内容。

这就是协同内容,也是召回的主要方式

不过大家应该也都看得出来,这些策略基本上很大程度上依赖于你的历史行为

可能大家会觉得这不是废话,推荐算法肯定依赖于你历史行为,你历史行为越丰富,无疑推荐的会越准

但现实中有2种情况,比较特殊,也可能比较头疼。

一个就是新用户的推荐,一个就是新内容的推荐。他们的共同特点就是,历史行为都很少,很难基于他们过去数据进行预测,那怎么办?

先说新用户这块

从互联网推荐系统角度总结,有四个点

1、历史优质内容:研究站内历史优质视频,别管新来的人是谁,我们把产品里历史最优质的内容丢出去,总是可能性比较大的吧。这里的历史优质,可能是历史站内高赞内容,历史高点赞率内容,历史高有效播放率内容,最近站内热点内容

2、用户特征:虽然用户是新用户,但性别、地理位置、渠道、机型、渠道、通讯录(如果拿到授权的话)、系统、applist这些多少还是拿的到的,可以结合这些特征,匹配产品里,历史里有这些特征的人喜欢看什么

3、内容调性:内容平台也是品牌,作为品牌都有自己的一些品牌调性,你的平台调性是什么,你希望让用户觉得你是什么样的平台,你就推荐什么样调性内容,这也是一个思路,一般这个需要运营强干预

4、外界流行:还有一个是外界的热点,一般流行热点都是自带流量的,在每个平台都是相通的,这个也是比较万金油的,推荐外部流行也是被验证过的,大概率也不会差

如果光这样说,大家不知道会不会觉得好像也有点复杂

其实这和咱们实体店做销售很像

比如你是纪梵希销售,你会怎么样打动刚进门的陌生新客户

如果用我上面四点,其实对应的就是

1、推荐纪梵希过去的爆款,经典款,大概率能命中

2、通过观察客户的性别、年龄、穿着、走路姿势,脑海回想过去有这些特征用户比较喜欢什么,猜测他的审美

3、纪梵希毕竟也是有自己的品牌特色,不能推掉价的东西,这个也是推荐的前提。而作为纪梵希销售,面对新客户肯定也要推荐最能体现纪梵希品牌特色的东西

4、现在外面流行什么款式,哪怕纪梵希,该蹭的热点,肯定也需要蹭

上面纪梵希只是随便举得一个例子,希望方便大家理解

在非互联网世界,销售就是最牛逼的推荐,他们的脑子就是人工智能,不知道经过这个线下场景投射,大家有没有更理解一点

而新内容怎么办?其实也是同理

如果你是销售,你会怎么卖新品?不会上来就推荐新客户买新品吧?毕竟新品没被市场验证过,万一不好,砸了招聘,新客户再也不来怎么办?

所以一般会基于新产品特征推荐给相应喜欢这些特征的老用户,先看看忠实用户的反馈,一般忠实用户的行为也比较多,比较好预测准,命中的概率大,并且忠实用户对产品的容错心态也更好。

而如果喜欢这些特征的忠实用户都不喜欢,就没必要推荐给其他人了,防止负反馈变多

然后如果在忠实用户圈子里得到正面反馈后,慢慢的就可以把人群扩大(算法的作用就这样体现了),一般会扩大到某部分人接受无能了,这也就新品的天花板了

而召回后其实也是前面提到的排序,什么内容优先展示?

一般基于目前产品战略方向

如果是短视频平台

重视平台里用户关系?那可能是关注转化高的视频优先推荐

重视平台里用户时长?那可能是消费视频时长高的视频优先推荐

再用一下纪梵希的销售的例子,你推荐纪梵希商品肯定有基于的目标。比如你目前的销售指标是销售量?那你是不是可能优先推荐物美价廉的商品,来冲量

如果你目前目标的销售额?那就优先推荐高价产品

总的来说,如果说召回基于用户喜好,排序则会基于自身目标出发,和你当时目标强相关

这也是我对推荐的一些理解,通过线上模型和映射到线下(纪梵希)例子相结合,有把这些推荐逻辑讲清楚

未经允许不得转载:小新网 » 推荐算法是如何推荐出你喜欢的内容?

赞 (5)

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址