Netflix:以数据技术加持内容战略落地
陈俊峰 刘晓| 媒介杂志| 2020-07-10
【流媒体网】摘要:在用数据“解构好莱坞”的过程中,Netflix构建了自己的数据技术优势,并赋能于内容生产、内容分发和内容交付,迅速占据市场领先者地位。

  从美国传统的DVD租赁业务到现在的全球视频流媒体业务,作为流媒体领域的硅谷科技巨头的Netflix,一直秉持以数据技术驱动内容业务的发展模式,落实其内容战略。

  在用数据“解构好莱坞”的过程中,Netflix构建了自己的数据技术优势,并赋能于内容生产、内容分发和内容交付,迅速占据市场领先者地位。一方面Netflix持续增强原创内容生产比例,生产出更满足市场需求的内容;另一方面则不断优化内容分发及交付能力,提升用户平台使用体验。

  完善数据技术能力

  实现解构好莱坞的野心

  早在2006年,Netflix就启动了量子力学计划,期望通过人工与机器算法结合,拆解内容。这是Netflix内容战略里最为关键的部分。因此,Netflix必须建立与之相匹配的数据技术能力,助力其实现所谓“解构好莱坞”的野心。

  外部借势与内部发力

  提升数据处理能力

  据Netflix官方数据显示,Netflix数据仓库每天会产生150PB数据,有300T的数据被写入,5PB的数据被读取分析和使用。在这样庞大的数据基础上,Netflix必须要具备强大的数据处理能力,以应对业务端的需求。为此,Netflix通过外部技术能力的融合以及内部技术团队及平台优化来加持数据处理能力的提升。

  2008年8月,Netflix的数据中心遇到了服务中断的故障,发生了严重的宕机事件。Netflix 意识到,它需要一个没有单点故障的更可靠的基础架构。因此它做出两个重要决定:将 IT 基础架构从自己的数据中心迁移到公共云上,并通过微服务架构,用较小的易管理软件组件替换单体程序。

  这两个决定为今天 Netflix 的成功打下了坚实基础。据了解,微服务鼓励关注点分离来解决单体软件设计存在的问题。在这种架构中,大型程序通过模块化和独立的数据封装被分解为许多较小的软件组件。

  微服务还通过水平扩展和工作负载分区来提升可扩展性。采用微服务后,Netflix 工程师可以轻松更改任何服务,从而加快部署速度。更重要的是,他们能跟踪每个服务的性能水平,并在其出现问题时与其他正在运行的服务快速隔离开来。

  另外,Netflix还使用了众多开源数据技术产品,如数据处理过程引入了EMR、Spark、Teradata等,在线分析引入了Druid、Presto等去加持自身的数据处理能力。在AWS云服务以及多样化的开源数据技术产品支持下,Netflix减轻了自建底层数据基础架构及进行数据处理技术研发的压力。

  在公司内部,Netflix搭建了数据中台Big Data Portal(下文简称BDP)服务于其大数据团队,用一套工具收拢了数据源头,并收拢了分析结果的分发渠道。

  在BDP的支持之下,工程团队、分析团队和业务团队各司其职,充分利用系统数据和各类工具完成自身工作:工程团队采集数据,处理清洗数据,将数据加工成数据集,数据可视化组件,数据模型;分析团队利用数据集加工成不同的数据产品;业务团队利用经过加工后的可视化报表,数据API,多维分析等数据产品去帮助业务决策,编剧,生产视频和内容。为了实现内容数据的高效处理,Netflix又在2018年建设了媒体处理引擎Archer,聚焦图像处理、字幕创作、内容质量控制等多个领域,并推出多样化的数据处理算法和工具,支持Netflix内容业务优化。

  Netflix内部大数据生态

  数据技术支持内容解构,赋能业务运营

  通过外部技术能力的融入以及内部数据处理能力的优化,Netflix实现了数据处理能力的升级,而这种能力将赋能于Netflix对内容数据的处理,以帮助Netflix进一步“解构好莱坞”。

  实际上,我们一直颇为了解的是在Netflix通过人工打标签方式对内容的解构。Netflix通过雇佣并培训工作人员,由他们对内容类型、剧情叙事、角色道德水准等内容属性进行精准的分类和评级,同时在机器算法的帮助下,共识别出超76897种“微标签”,支持Netflix对内容的解构。

  而这么长时间过去了,Netflix“解构”好莱坞的能力又有怎样的提升呢?简单的说,Netflix开始更加重视人工智能技术在内容解构中的使用。在媒体处理引擎Archer等技术平台的支持下,Netflix实现了通过人工智能技术识别内容中物体、人类动作以及文字等各项元素。例如,借助Archer平台上的文本检测算法,Netflix可以清晰识别内容中所包含的文字;同样,借助Archer平台中的图像识别算法,Netflix可以清晰洞察内容中的人员姿势等等。

  基于此,Netflix充分实现了对内容的解构,并将其赋能于内容生产及内容分发业务。其中值得一提的是,为了洞悉内容表现情况,Netflix纳入了用户数据,包括用户的基础数据(性别、年龄、地点)、关系数据(家庭、社交)以及行为数据(观看数据、搜索数据)以及基于“百分比匹配系统”和“Thumb Up系统”支持下的用户内容评分数据等。这为Netflix监测内容运营情况、帮助Netflix发现内容质量问题或者寻找一部影视剧中的优质内容奠定了基础。

  不过,提升数据处理能力,并对内容进行解构仅仅是第一步,下一步便是Netflix在此基础上去搭建自身的整体业务体系,去生产内容、分发内容以及向用户交付内容,支持内容战略的落地。

  数据指导搭建内容生产体系

  提升竞争力

  2019年,《哈佛商业评论》发布了十年来全球最成功的20个商业变革案例,Netflix榜上有名。入选原因在于:从2012年开始投资原创内容制作的业务,经过短短7年的时间,Netflix这部分业务的收入就占据到了它整体收入的44%,而同时它的复合年增长率达到了59%。

  当康卡斯特、NBC、华纳传媒和迪士尼等媒体巨头开始自建流媒体平台、逐渐收回版权之后,Netflix唯有进一步强化自身的内容生产实力。Netflix首席内容官Ted Sarando在2019年底表示,Netflix未来可能将完全依靠自己的原创内容,而不是授权内容。从《纸牌屋》开始, Netflix在数据技术的赋能下搭建起自身的内容生产体系,实现了自身内容层面的战略布局。

  基于数据的内容预测与决策

  Netflix的原创制作目标是将其内容库的一半影视作品都变成原创。自2015年以来,Netflix的内容预算每年都在以接近35%的速度增长,2020年的内容预算更是达到了173亿美元。如何让每一个投资都能够获得最大可能的回报成为Netflix必须考虑的问题,所以Netflix就使用了机器学习来预测爆款,以在一定程度上降低投资风险。

  具体操作来看,Netflix可以基于用户的播放数据,通过机器学习模型去实时地跟踪每个内容的播放情况,形成在众多内容中识别高潜质内容的模型。Netflix可以用这个模型来甄别和监测内容的运营情况,从而预测爆款。

  预测完成之后,Netflix就会通过“品味社区”(Taste Communities)来提供决策依据。品味社区是Netflix通过机器学习算法结合用户数据和节目数据,识别出的具有相同品味的用户群体。目前“品味社区”已经成为Netflix预测爆款内容后,判断用户量级的一种重要方式。具体而言,就是当Netflix在决定是否要购买一部新剧时,会通过“品味社区”来判定此剧集是否能够聚集足够多的“同品味用户群”,确定是否具有相应的经济价值,以进行投资或者进行内容开发。

  创新原创内容形式,延长内容业务链

  除了预测爆款内容,Netflix也不断创新原创内容形式,不断延长自己的内容业务链条,以加速推荐内容战略的落地。所以,Netflix开始着力在互动剧和衍生内容产品方面进行新的探索。

  首先是互动剧。2018年Netflix上线的《黑镜:潘达斯奈基》引爆了互动剧市场,其故事流程为90分钟,剧情的总时长是312分钟,并且具有5个结局、上百个选择项。为了支持互动剧的制作与播放顺利推进,Netflix做了诸多准备。

  Netflix互动剧背后的技术

  内容创作阶段,Netflix开发了剧本创作工具分支管理器(Branch Manager)。创作者可以将剧本元数据比如剧本内容、互动剧的选择点,故事分支时间安排等数据输入到Branch Manager中。Branch Manager会根据剧本的元数据,创建整个互动剧的轮廓与流程,方便创作者进行管理与创作;

  在用户播放阶段,Netflix还专门开发了一套互动视频引擎,以实现“状态追踪” (state tracking)的功能,利用“状态追踪”Netflix能够记录观众在整个剧情中的位置,并自动预加载接下来可能会播放的内容,以实现无缝隙的视频切换。数据技术的支持以及市场反馈的示好,给了Netflix继续投资互动剧极大的信心,目前Netflix至少还有12支互动剧正在制作,在2020年5月还上线了第一部互动式喜剧《Unbreakable Kimmy Schmidt》。

  除了原创内容的互动形式外,Netflix还不断致力于原创内容衍生品开发,拓宽业务链条。其中,Netflix会基于原创内容的市场表现数据,决定是否对其进行衍生产品开发。例如,Netflix基于其原创内容《怪奇物语》亮眼的播放数据,推出改编游戏《Stranger Things 3: The Game》、与环球影城合作推出《怪奇物语》主题公园以及围绕该剧目开发诸如咖啡杯、人物玩具等周边衍生产品。

  基于内容生产能力拓展全球市场

  当然,相比各个媒体巨头,Netflix似乎在业务规模上并不占优势。为了弥补这一点,Netflix开始基于自己的原创内容生产能力去拓展全球市场。在这个过程中,由于Netflix在海外进行原创内容制作必须要考虑到文化的差异以及政策的影响,所以Netflix除了会与当地的制作团队合作,以减少全球化阻力外,还会采用另外的两种方式。

  首先,Netflix继续坚持数据技术的优势。例如,Netflix在海外发展,需要为剧集提供多种语言字幕,因此Netflix上线了HERMES系统(线上字幕翻译测试和索引系统),该系统不仅可以通过翻译人员的翻译数据来估计翻译所需的时间,还可以向特定的字幕组成员推荐适合翻译的内容,以提升翻译效率。

  其次,Netflix继续坚持长期积淀下来的数据挖掘以及洞察的优势。字幕仅仅是全球发展的一小部分,更重要的是能根据当地用户的需求去生产原创的当地内容,所以Netflix在原创当地剧集的制作过程中,会结合本土的用户、市场数据以及文化特征来打造内容。比如在韩国,Netflix结合韩国本土综艺粉丝的数据与综艺市场数据,推出了亚洲首个原创推理综艺《犯人就是你》;同样在阿根廷推出的《PUERTA 7》也是根据阿根廷足球迷数据而打造的故事。

  Netflix利用积累的数据技术以及数据分析优势,从内容预测、决策,创新内容形式以及加大海外原创内容的投资三方面来发展自制的原创内容,向深层的内容产业链延伸,以更好地布局自身的内容战略。

  以技术优化内容分发及交付

  提升用户体验

  谈完内容生产,下一步就是内容分发与交付。当内容巨头进入流媒体市场,强敌环伺的竞争环境让Netflix只能守住用户这个核心,通过提升用户体验来增加粘性与品牌话语权。在这个方面,Netflix提出了“consumer science”的用户运营理念,通过数据技术不断优化内容分发及播放等平台服务,进而吸引用户并为其提供最佳的产品体验。

  多种算法匹配

  精细个性化内容分发服务

  当下,Netflix在基于数据技术能力升级的基础上,优化了个性化推荐系统及服务,将面向用户的个性化内容分发服务持续精细化,不仅仅实现了个性化内容推荐,更是实现了个性化的内容标题图片及剧集排序等。

  Netflix使用的多种推荐算法

  个性化内容推荐方面,Netflix运用了大量的推荐算法支持为用户生成“个性化内容页面”。例如,Netflix基于个性化视频排序算法(Personalized Video Ranker,PVR)根据用户兴趣爱好和影片类型的匹配度,为用户提供符合其偏好的类型影片;为了降低推荐内容的同质性,Netflix还通过 Top-N视频排序算法(Top-N Video Ranker)从所有类型内容目录中找出用户最可能喜欢的内容。另外,Netflix还采用了基于用户短期动态观看趋势的趋势排序算法(Trending Now Ranker)、基于个体用户续播和续集观看习惯的继续观看排序算法(Continue Watching Ranker)和基于观看历史的相似视频推荐算法(Video-Video Smilarity)等等多种算法,最终为用户形成“个性化内容页面”。

  另外,在“个性化内容页面”的基础上,Netflix还实现了对内容标题图片的个性化。Netflix借助媒体处理引擎Archer上的AVA(计算机视觉深度学习工具集)工具,对通过视频元数据(亮度、对比度等)、上下文元数据(人物姿势检测、相机镜头运动识别等)和组成元素(三分法等摄影美学数据)对视频进行帧注释,然后对识别出的标题图片进行排名,根据用户的兴趣自动生成个性化的标题图片。比如AVA根据用户喜欢浪漫还是惊悚为《Riverdale》生成了不同的标题图片,以推荐给不同的用户。

  Netflix图像发现工具AVA具体工作流程

  除此之外,Netflix甚至可以基于用户偏好提供个性化剧集排序。比如,2019年3月,Netflix上线《爱、死亡和机器人》,Netflix通过大数据的精准分析,对每个用户看到剧集顺序进行了个性化分配,最终使每个用户看到了个性化的《爱、死亡和机器人》的剧集安排顺序。

  技术优化画质并提高传输效率

  加持内容交付

  个性化的分发仅仅是第一步,内容交付过程中的体验更加重要,所以在内容交付方面,Netflix通过数据技术致力于解决画质以及画质高质量传输的问题,提供给用户更加优质的内容播放体验。

  在提高画质方面,Netflix为了用更少的带宽打造更完美的画质,在2018年开发了动态优化器,实现了对视频从“段”(Block)到“镜头”(Shot)的更精细化的数据分析。通过动态优化器Netflix能区分镜头内容的不同类型和复杂程度,并根据这些视频镜头的数据选择压缩视频的算法。比如Netflix使用动态优化器之后,会对充满汽车追逐和爆炸场面的动作电影采用更高码率的压缩算法,而一些内容相对简单的场景则会采用较低码率的压缩算法。这项技术在为用户节省带宽的同时,还提高了画面质量。

  解决画质本身的问题后,Netflix必须要以高质量的传输方式输送到用户的设备上,所以Netflix开发了一个名为“Open Connect”的内容交付平台,核心理念是把内容更靠近用户。Netflix可根据用户的网络特征、使用设备和地理位置等数据特征来为用户会自动判定最佳的Open Connect服务器,以便让视频从附近的网路跃点流畅地传出。

  由此可见,Netflix以数据和技术为依托,提供给了用户 更优质的流媒体平台观看体验。


  流媒体网重磅推出《海外大视频系列报告之二:Netflix科技创新与技术运营探索与借鉴》,本报告核心内容包括6个篇章:综合篇、文化篇、技术篇、创新篇、思考篇和建议篇。字数共计7.36万,并有130个图。详情请点击:

  https://lmtw.com/mzw/content/detail/id/181176/keyword_id/-1

责任编辑:李楠

分享到:
版权声明:凡本网注明来源“流媒体网”的所有内容,版权均属流媒体网所有,转载需注明出处。凡注明来源非“流媒体网”的所有内容,其目的在于传递更多信息,并不意味着流媒体网赞同其观点或证实其内容的真实性。