2023是科技闪耀之年,以ChatGPT为代表的生成式人工智能成为全球科技热点,最新的科技之光有没有照到广电大屏这个相对传统的领域?大模型、向量数据库等给大屏尤其是大屏的智能推荐带来哪些新的机遇?流媒体网对话火山引擎智能推荐解决方案高级总监沈文,听听这家入局大屏领域4年的技术公司的所思所感。
抖音“算法”从小屏到大屏
喜欢刷抖音的同学可能会关注到APP打开时底部显示的“火山引擎提供计算服务”,实际上,火山引擎智能推荐中台服务于抖音、今日头条等抖音集团旗下产品矩阵,而2019年,火山引擎进入大屏领域。
是怎样的契机,让火山引擎将目光投向大屏?
沈文表示,首先是抖音的算法当时已经在国内的一些头部手机厂商落地并带来很显著的价值。广电传媒大屏是一个重要的文化宣传阵地,能够作为技术支撑方服务整个行业,其本身的社会价值是非常非常大的,那是不是也能把个性化千人千面推荐能力跟家庭看电视的场景做一些结合?经过试点,发现效果非常不错。是就决定加大投入,做成一个方向、形成一套完整的解决方案。
谈及火山引擎在小屏累积的经验,沈文将其分了几个方面:
第一个,抖音本身用户服务经验是非常丰富的,可以借鉴。
第二个,基于火山引擎的技术,中台沉淀了很多模型结构,在泛内容的场景下可以去做相应的复用和借鉴。
第三个,提升用户体验要强调实时性,而实时性不仅仅是一个算法模型这么简单——你可以把一个很高端的算法模型去做复现,但这个模型是不是在工业上真正能够投产,能够带来真正的价值,得画一个大大的问号、挑战也非常大。“火山引擎的经验在于通过自身业务已经把这套难度系数非常高的系统打磨完善好了,然后再对外去赋能。从而保障在大屏行业落地的这套算法也能实时的做一些特征迭代模型的更新,实时的根据用户的行为反馈给他推想看的内容,更好的把用户体验做上去。”
大屏推荐跟小屏推荐有哪些不同?
沈文说,两者最大的一个不同是“频次”。小屏端碎片时间使用很多,使用过程中操作相对简单、用户行为发生频次是相对比较高的;而大屏更多是在某一个时间段集中观看,看电视的过程中发生的行为数据可能没那么多——因为喜欢的电视剧电影可能一看就是几十分钟甚至一两个小时,“行为数据就会比较稀疏,也会增加建模难度”。第二个不同点也很直观——小屏的场景都是一对一的,但是家庭这个大屏场景是一对多,一个电视可能有两个人,三个人,四个人使用,这就需要更有针对性的模型方案和策略。
谈及大屏领域的千人千面推荐,沈文坦言,此前因为政策、市场、技术等等现实原因,实现起来确实困难重重。横向比较广电传媒行业跟别的行业,比如金融、互联网等等,技术条件确实相对落后一些。他以智能推荐这个典型的应用场景为例,说火山引擎在项目落地的过程当中发现很多大屏客户行为数据埋点包括数据采集是不健全的,包括有些客户自己的数据中台可能各个业务系统之间都没有打通,数据分布在上下游各个环节。“巧妇难为无米之炊——下决心要做算法了,发现数据不支持算法建模。”不过,沈文说四年间亲身经历这种情形的改观——越来越多的省份更加乐于去接受新事物、新技术,正在进行的大屏套娃整改更是让整体界面更加清晰,“方便用户操作的同时,相应的这个界面下的内容也比较容易推给用户”。
沈文认为,智能推荐算法是实现大屏用户个性化运营的核心,并强调火山引擎作为技术服务商,可以提供一站式的推荐能力搭建,满足广电企业多业务场景推荐需求,除了传统媒资内容推荐之外,算法技术还能有效整合线上线下场景,贯穿从用户体验到商业转化的全链路运营过程。
沈文表示,在服务大屏客户的过程中,火山引擎不断对模型方案、产品功能力进行更新迭代。比如在大多数APP的推荐场景,主要以数据驱动为主,模型计算出用户喜欢看什么就推什么,在大屏端则需要充分结合行业情况和业务规则,例如碰到重大节日,重大活动,需要针对一些内容置顶加权,目前这部分产品能力也已经成熟落地,可以直接火山引擎产品里可视化配置。“产品一方面可以支持技术部门用来建模,同时也可以给运营部门直接去做配置,兼顾了各个业务条件的使用诉求,并且整体的使用门槛更低了。”
沈文强调,火山引擎提供的是个性化定制服务。他以IPTV为例,说每个省的业务情况数据情况都不一样,每个省可能有一些主推的东西,比如助农,比如旅游,每个省的特色不一样,“个性化配置才能满足不同省份不同客户的具体诉求”。据他介绍,每个合作火山引擎会提供一套完整的平台,同时配备由算法工程师、实施工程师、数据分析师、产品架构师等等组成的专业技术团队全程端到端的去做推荐系统建设——从数据清洗到特征工程到模型建设最后服务上线。
同时,沈文坦言,火山引擎是在平台的基础上做定制化建模,相当于100%的工作已经把70%左右固化下来,30%做定制化建模,“可以有效地控制成本”。他还强调,火山引擎心态open,会去拥抱一些当地的服务商,取长补短。“我们有技术,他们懂用户,双方强强联合,更好地高效地去服务客户。”
广电领域标杆已立,下一步是规模化落地
进入大屏领域四年,火山引擎一直相对低调。沈文表示,此前是立标杆的时间。“团队包括相应的人前两年可能对大屏业务没有那么了解,在建模的过程中需要去跟客户做非常深入的探讨,两三年服务下来,对大屏业务更深的理解了,也沉淀了专门的大屏行业模板。”
火山引擎与贵州多彩新媒体、河北无线传媒在IPTV领域深度合作,推荐场景的效果非常显著。与贵州多彩新媒已经合作第3年,实现了点击率提升78.25%,订购次数提升58.89%,媒资曝光提升95.87%,播放率提升102.99%,贵州也将自身业务经验沉淀于产品内,进一步完善了方案。而河北无线传媒的合作效果也非常好,实现人均点击提升65%,播荐率提升113%,人均播放时长提升95%,人均订购提升7%。
沈文透露,接下来,火山引擎会针对大屏行业做一些适配的产品方案,以满足大屏行业的不同场景,包括智能剪辑、语音客服、智能助手、影视剧的模糊匹配等等。在智能推荐领域,基于已经落地的标杆案例,实现方案的快速、规模化落地,为行业发展贡献力量。他说火山引擎的技术体系非常多样化,除了智能推荐、数据库,包括视频、语音相关的能力,包括CDN,包括云基础,包括用户埋点等等,都可以跟广电现有阶段去做一个比较好的结合。
新技术新机遇——解大屏痛点在望
谈及及大模型、向量数据库等技术热点,沈文表示“肯定会给大屏带来新的机遇”。
AIGC、大模型等新技术给大屏领域带来的新机遇至少包含四个方面:一,海报的智能生成,提高海报素材丰富度的同时大大降低编辑和运营的工作量;二,视频的智能剪辑,包括剪辑的精彩程度——可以根据每个人的偏好千人千面个性化剪辑、生成精彩片花;三,提升原有的推荐、搜索能力,特征维度将得到极大的丰富,算法所带来的指标效果也将进一步提升;四,新场景的探索创新,比如视频内容的模糊匹配这样的创新应用场景将可能实现。
沈文特别强调了向量数据库的支撑意义。具体到广电领域,原来做一个媒资库非常依赖于人工打标,有了向量数据库“就可以把所有的视频内容都扔到向量数据库里,然后去做模型的embedding——向量特征的提取”,沈文说,人打标的数量是有限的,而模型可以把一个视频分解为成千上万个片段或者向量化特征主题提取,传统的智能推荐场景因为特征维度的丰富,效果也将更加出色。
沈文表示,向量数据库既能服务于大模型,也能服务于传统场景——大屏行业还相对比较传统,大模型应用的场景还相对有限,在这样的背景下,向量数据库是比较好的一个过渡。向量数据库不但可以升级完善广电企业原有的应用(如内部员工知识库),而且如果后面要建大模型,也可以把这些特征存储到向量数据库里,“两边都可以做很好的支持和衔接”。
火山引擎的未来规划,沈文透露:
第一点,智能推荐算法基于现有的标杆案例,2024年要去做规模化的落地。
第二点,在智能推荐算法的基础上做一些产品的横向打通,形成组合拳。在算法应用的基础上做一些上下游,比如往前一步的数据埋点,往后一步的后向数据分析,例如分析每一个省份的业务数据开展情况甚至为省份去建一些用户画像中台分析每省用户特点——因为算法都是给计算机去用的,运营人员肯定也需要一些反向的业务反哺。
第三点,向量数据库包括一些大模型平台也会在大屏这个领域做更深的探索,看后面是不是有一些具体的场景,包括一些客户新提出的场景需求,火山引擎也会去提供响应方案。
第四点,结合抖音的一些生态优势,比如鲜时光、西瓜视频这样的兄弟部门做一些配合,包括利用抖音生态、流量资源打一些组合拳。
沈文最后谈及火山引擎的一个愿景——希望有机会跟大屏行业客户去形成一些通用化方案,形成有广电头部企业和相关权威机构背书的安全、可信的智能推荐云,并达到“数据可用不可见”——各省广电企业的核心业务包括数据还放在各省,应用层上面的能力充分复用,从而服务全国,而不需要每个省份重复建设。
责任编辑:房家辉
24小时热文
流 • 视界
专栏文章更多
- [常话短说] 【解局】2025具体怎么干?多省广电给出答案! 2025-04-14
- [常话短说] 【重要信号】事关一体化电视,广电总局推进9地试点! 2025-04-10
- [周晓静] 见微知著|版权运营方如何应对短剧潮?独家对话捷成华视网聚 2025-04-09
- [常话短说] 【解局】广电要警惕“虚假繁忙”! 2025-04-08
- [常话短说] 【解局】超高清机遇要把握!胜利! 2025-04-06