推荐系统的目标是什么?
推荐系统的目标是建立精品内容池和用户兴趣的最佳匹配。就是在很短的时间内,从一个巨大的内容池里,给当前用户匹配出几篇感兴趣的文章。这个内容池有上百万的内容,涵盖文章、视频、直播、问答等各种各样的体裁。这里的匹配如果做到用户满意度最大化,就说明这次推荐的非常好,这也是我们推荐引擎所追求的最核心的目标。
如何快速给用户推荐TA感兴趣的内容?
这就要提到针对不同用户快速完成匹配依赖的三个因素:用户理解、内容理解、以及用户和内容之间的交互,也就是用户是否对内容感兴趣。
1、首先是用户理解,推荐系统如何理解用户?
推荐系统需要了解用户的画像,以便为不同用户推荐个性化的内容。平台有多种方式来刻画用户的画像,比如性别、年龄、历史看过的作者、历史看过的内容等。
举个例子:如果某个用户经常看娱乐类的内容,后续同类内容会推荐得更多。同时,为了让用户能够看到不同类型的内容,避免信息茧房,也会基于潜在可能感兴趣的内容来进行推荐。
2、其次是内容理解,系统是怎么理解各位创作者的内容呢?
内容的信息除了标题、封面图,也会用不同特征对内容进行刻画。比如通过机器提取内容中的关键词,将内容快速分类。
举个例子:某篇内容从分类看,是娱乐、军事、健康、财经、旅游等不同内容类型中的一类;从标签看,关联了不同的标签,比如北京车展等。
3、系统如何判断用户是否对内容感兴趣呢?
首先新内容发布且通过审核后,由于没有用户行为数据,通常会进行加权推荐,推送给一部分用户,以便收集初步的用户反馈和行为数据,来判断用户对内容是否感兴趣,这个过程被称之为“冷启动”。内容获得冷启动流量后,推荐系统会根据用户对内容感兴趣程度,来判断后续进一步推给多少可能感兴趣的用户。
4、如何判断用户对内容的感兴趣程度?
主要通过用户的行为,比如是否点击、是否观看、看了多长时间、看完是否会点赞、评论、分享给其他人、关注作者等,以上行为都会作为相关因素来判断用户感兴趣程度。
假如内容推出来后用户不点击、点击后看的时间很短、或者没有点赞、评论、分享、关注等行为,甚至收到较多的用户负向反馈,推荐系统会判断用户对内容感兴趣程度不高,在内容流量上会有一定的限制。
5、为什么不同内容的流量有差异?
鉴于平台会根据最匹配的用户兴趣把内容选取出来,那在比较多的内容共同竞争推荐流量的情况下,如果其他同类型内容表现较好,有比较多用户进行点击互动等行为,可能导致你的内容竞争不过其他内容,流量相对较少。
也就是说,每一篇内容的流量,既取决于内容本身的优质程度,也取决于当时整个内容池里面其他内容的表现。所以一篇内容如果有比较吸引人的标题、封面、文章开头或者视频前10秒,以及作者会在评论区和用户互动,都有助于通过推荐系统获得更多流量。