最近在研究和梳理推荐算法的底层逻辑
其实一些技术原理,说大白话可能不太好理解,毕竟技术逻辑复杂,我试着看看能不能讲的通俗易懂
也希望通过这类输出,倒逼着自己更好的学习输入
推荐系统,说到底其实也不复杂,做的就两件事
召回和排序
召回:召回指从大盘内容池里召回你喜欢消费的内容
排序:排序是指通过数据模型,预测你的喜好程度,将你更可能感兴趣的消费内容优先排前面让你看到
这就是推荐系统的底层逻辑
为了方便大家理解,所以也就先把底层抛出来
现在随着某音的火爆,相信很多朋友也都在研究推荐算法,甚至各种玄学策略求流量,各种不同曝光对应的内容池,一层一层往上滚,但推荐底层是什么呢?
希望这篇文章能帮助你
前面有提到召回和排序,这两者说起来简单,但都少不了数学模型的参与,推荐系统会基于用户历史行为数据和策略产品经理制定的策略规则,把内容从海量内容库中召回出来。
打个比方,短视频推荐为例,一个常见的召回策略,需要经过这三步
第一步召回的可能是用户观看过的视频的向量、用户搜索词向量以及用户的来源渠道/性别/位置/年龄等静态特征(这些特征需要反复ab验证)
第二步而线下模型训练阶段,为用户推荐下一个感兴趣短视频的多分类问题,输出的是所有候选短视频集合上的概率分布
第三步线上预测阶段,首先通过用户id找到相应的用户向量,然后通过算法(比如KNN算法)找到相似度最高的N条候选结果返回
这就是一个召回策略的推荐过程
这个说起来,可能大家感觉比较复杂
常见召回还有一些类似的策略,就是协同过滤推荐算法
比较常见的协同召回是“协同用户”和“协同内容”(有的可能还有协同作者和协同标签,这里就不展开)
协同用户是,比如
a用户喜欢看老虎、狮子
b用户喜欢看老虎、大象
这时系统会基于a和b用户都喜欢看老虎,他们有共同喜好可能是一类人,推荐系统会猜测a也会喜欢看大象,给a推荐大象
而协同内容是,比如
a用户喜欢看老虎内容,推荐系统会拆解老虎内容,比如老虎属于动物,大型猫科类动物,凶猛,食肉动物,有这些细致特征等等。
这时推荐系统识别到这些特征(一般会由人工打标签或机器打标签),大概率也会给你推荐同样命中这些特征的豹子相关内容。
这就是协同内容,也是召回的主要方式
不过大家应该也都看得出来,这些策略基本上很大程度上依赖于你的历史行为
可能大家会觉得这不是废话,推荐算法肯定依赖于你历史行为,你历史行为越丰富,无疑推荐的会越准
但现实中有2种情况,比较特殊,也可能比较头疼。
一个就是新用户的推荐,一个就是新内容的推荐。他们的共同特点就是,历史行为都很少,很难基于他们过去数据进行预测,那怎么办?
先说新用户这块
从互联网推荐系统角度总结,有四个点
1、历史优质内容:研究站内历史优质视频,别管新来的人是谁,我们把产品里历史最优质的内容丢出去,总是可能性比较大的吧。这里的历史优质,可能是历史站内高赞内容,历史高点赞率内容,历史高有效播放率内容,最近站内热点内容
2、用户特征:虽然用户是新用户,但性别、地理位置、渠道、机型、渠道、通讯录(如果拿到授权的话)、系统、applist这些多少还是拿的到的,可以结合这些特征,匹配产品里,历史里有这些特征的人喜欢看什么
3、内容调性:内容平台也是品牌,作为品牌都有自己的一些品牌调性,你的平台调性是什么,你希望让用户觉得你是什么样的平台,你就推荐什么样调性内容,这也是一个思路,一般这个需要运营强干预
4、外界流行:还有一个是外界的热点,一般流行热点都是自带流量的,在每个平台都是相通的,这个也是比较万金油的,推荐外部流行也是被验证过的,大概率也不会差
如果光这样说,大家不知道会不会觉得好像也有点复杂
其实这和咱们实体店做销售很像
比如你是纪梵希销售,你会怎么样打动刚进门的陌生新客户
如果用我上面四点,其实对应的就是
1、推荐纪梵希过去的爆款,经典款,大概率能命中
2、通过观察客户的性别、年龄、穿着、走路姿势,脑海回想过去有这些特征用户比较喜欢什么,猜测他的审美
3、纪梵希毕竟也是有自己的品牌特色,不能推掉价的东西,这个也是推荐的前提。而作为纪梵希销售,面对新客户肯定也要推荐最能体现纪梵希品牌特色的东西
4、现在外面流行什么款式,哪怕纪梵希,该蹭的热点,肯定也需要蹭
上面纪梵希只是随便举得一个例子,希望方便大家理解
在非互联网世界,销售就是最牛逼的推荐,他们的脑子就是人工智能,不知道经过这个线下场景投射,大家有没有更理解一点
而新内容怎么办?其实也是同理
如果你是销售,你会怎么卖新品?不会上来就推荐新客户买新品吧?毕竟新品没被市场验证过,万一不好,砸了招聘,新客户再也不来怎么办?
所以一般会基于新产品特征推荐给相应喜欢这些特征的老用户,先看看忠实用户的反馈,一般忠实用户的行为也比较多,比较好预测准,命中的概率大,并且忠实用户对产品的容错心态也更好。
而如果喜欢这些特征的忠实用户都不喜欢,就没必要推荐给其他人了,防止负反馈变多
然后如果在忠实用户圈子里得到正面反馈后,慢慢的就可以把人群扩大(算法的作用就这样体现了),一般会扩大到某部分人接受无能了,这也就新品的天花板了
而召回后其实也是前面提到的排序,什么内容优先展示?
一般基于目前产品战略方向
如果是短视频平台
重视平台里用户关系?那可能是关注转化高的视频优先推荐
重视平台里用户时长?那可能是消费视频时长高的视频优先推荐
再用一下纪梵希的销售的例子,你推荐纪梵希商品肯定有基于的目标。比如你目前的销售指标是销售量?那你是不是可能优先推荐物美价廉的商品,来冲量
如果你目前目标的销售额?那就优先推荐高价产品
总的来说,如果说召回基于用户喜好,排序则会基于自身目标出发,和你当时目标强相关
这也是我对推荐的一些理解,通过线上模型和映射到线下(纪梵希)例子相结合,有把这些推荐逻辑讲清楚
本文来自作者:展风,不代表小新网立场!
转载请注明:https://www.xiaoxinys.cn/537.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。