Netflix内容推荐决策“新方法论”:品味社区
流媒体网| 2020-01-14

  【流媒体网】消息:2009年,作为推荐系统领域最标致性的事件,Netflix发起Netflix Prize百万美金竞赛,这次比赛不但吸引了众多专业人士投身于推荐系统领域研究工作,也让这项技术从学术圈真正地进入到了商业界,在引发了热烈讨论的同时逐渐深入到了商业核心腹地。而推荐系统也成为Netflix最受推崇的创新工作。本文引用《Netflix从DVD租赁到硅谷公司的路径》报告内容,介绍Netflix内容推荐决策新方法论——“品味社区”。

  1、内容推荐算法中隐性数据和显性数据

  人们在Netflix上观看的电视节目中,超过80%是通过该平台的推荐系统发现的。Netflix使用机器学习和算法来帮助打破观众的先入之见,找到他们最初可能并不会选择的节目。为了做到这一点,Netflix关注的是内容中微妙的线索,而不是依靠广泛的类型来做出预测。

  Netflix在算法中所运用的数据可以分为两种——隐性数据和显性数据:显性数据就是用户字面上所表达的意思,比如用户给剧集《皇冠》点赞了;隐性数据实际上是用户行为数据,用户没有明确地表明“我喜欢某一部剧”,但花了两个晚上就把这个剧全看完了。而为了完善自己的内容推荐系统,Netflix不止在显性数据方面发力,因为事实上大多数有用的数据都是隐性的。

  2、品味社区及其三大基础

  Netflix做内容和用户推荐的决策,并不是基于广泛的人口统计数据,而是基于“品味社区(Taste Communities)”来决定是否订购一部新剧以及向用户推荐什么样的内容。

  “品味社区”即喜欢看相同内容的用户群体,Netflix目前已识别出2000个这样的用户群。这些品味社区也可能会喜欢看似完全不同的内容,比如,Netflix的算法发现单口喜剧演员Dave Chappelle的粉丝群与霍金传记电影《万物理论》的粉丝群之间存在着令人意想不到的联系。”

图为:Netflix“品味社区”划分

  之前,Netflix根据用户的地理位置进行内容推荐,比如,德国人喜欢看的内容可能与南美人喜欢看的内容有所不同,但Netflix的产品副总裁Yellin去年在接受采访时表示,“我们越来越发现这是无稽之谈。”所以,Netflix转而根据“品味社区”来进行用户推荐。Netflix用于形成“同品味用户群”的三大基础分别是Netflix的用户行为数据、节目内容标签数据和机器学习算法。

  ー 用户行为数据虽然Netflix在全球拥有超过1亿的用户,但如果将每个用户的多个用户配置文件计算在内,那活跃的用户配置文件总数将达到2.5亿左右。“我们从这些资料中看到的是以下类型的数据——人们看了什么,之前看了什么,之后看了什么,一年前看了什么,最近看了什么,每天什么时候看。”这些数据构成了凳子的第一条腿。

  ー 节目内容标签数据旨在理解节目内容的数据。这些数据基础构建由数十名内部员工和自由职业者组成,他们观看Netflix平台上的每一场节目,甚至每一分钟的节目,并将其贴上标签(tag)。从作品的思想性,到演员整容的完整性,标签范围很广。

  ー 机器学习算法“我们把所有这些标签和用户行为数据结合起来,然后使用非常复杂的机器学习算法,找出最重要的、我们应该重视的,”根据Netflix产品副总裁Yellin的说法,他们会沿着用户收看的轨迹去摸清楚用户的品味。

  3、“品味社区”应用

  “品味社区”的应用涉及如下领域。

  第一,“品味社区”可以用于内容评价。Netflix通过分析这些“品味社区”,并根据从这些群体收集的数据开发新的节目。当Netflix高管们在决定是否要订购一部新剧集时,他们会看这个剧集是否能够聚集足够多的这些“品味社区”,以证明一部剧集的成本是否合理。Netflix的内容是为了迎合他们的口味,而不是迎合高管们的口味。

图为:Netflix个性化推荐

  第二最直接的应用是,“品味社区”直接影响用户在登录到Netflix服务平台时看到的内容推荐即首页。事实上,Netflix的内容推荐在用户层面的影响主要分为个性化推荐界面和个性化图片功能,具体可以参考流媒体网的《Netflix大屏交互设计分析系列》文章。

  Netflix通过设置数万种不同的电影属性标签甚至包括对人物的道德评级),创造了与其千万级用户的观影习惯相匹配的“微类型(Alt-Genre)”与“同品味用户群”相互作用,并采用算法为每个用户创建一个个性化首页。根据用户特征以及浏览设备的不同,从用户相关的视频(用户本人或朋友曾看过)以及成千上万个可用候选行(每行拥有可变数量的内容)中,选择最适合该用户的行分组进行分组间及组内显示排序。

  “研究表明,图片不仅是用户决定观看内容时的最大影响因素,而且在用户浏览Netflix时也占了他们82%的注意力。对于Netflix所推荐的每个内容,用户平均花1.8秒进行考虑。”考虑到用户品味和喜好的多样性、不同配图包含着剧情发展中的不同主题,这些信息无法通过任何单独一张图片去呈现。

  一张影片配图的有效性也可能取决于其他对影片的介绍(比如故事梗概、预告片等),每部影片的海报之间也需要有足够大的差异去吸引有着不同喜好兴趣的潜在观众。归根结底,一张配图的有效性和信息量其实取决于看到的不同的人。

图为:根据用户品味喜好结合演员特点生成的《心灵捕手》推荐海报

  关于Netflix更多技术创新和内容运营创新,请参考流媒体网OTT海外大视频报告之二《Netflix从DVD租赁到硅谷公司的路径》

责任编辑:侯亚丽

版权声明:凡本网注明来源“流媒体网”的所有内容,版权均属流媒体网所有,转载需注明出处。凡注明来源非“流媒体网”的所有内容,其目的在于传递更多信息,并不意味着流媒体网赞同其观点或证实其内容的真实性。