【技术研究】电视终端智能体的技术体系与应用研究
李继龙| 广电猎酷| 2026-04-13
【流媒体网】摘要:电视终端智能体技术体系与应用研究发布。

  论文阐述了电视终端智能体“感知-决策-执行”能力体系,分析了其能力构建的关键技术路径,并结合华数影音智能体与长虹“沧海智能体”两类典型案例,剖析了广电运营商与终端厂商的差异化落地模式。论文还进一步研究了智能体驱动下的用户体验重构、业务价值提升及行业生态演进,并从标准制定、评测认证、数据互通等方面提出广电智能化发展对策。

  本文作者:

  李继龙

  国家广播电视总局广播电视科学研究院

  第一作者简介:

  李继龙(1976—),男,国家广播电视总局广播电视科学研究院正高级工程师,博士。主要从事大模型监管技术人工智能评测技术、5G应用技术方面的研究。曾参与多项国家、部委重要项目的研究开发工作,取得多项研究成果,多次获得部委奖项。作为主要研究人员曾参与有线无线卫星融合网、卫星直播标准和数字音频广播标准的研究与制定。

  [本文献信息]

  李继龙. 电视终端智能体的技术体系与应用研究[J]. 广播与电视技术, 2026, VoL.53(3).

  电视终端智能体的

  技术体系与应用研究

  电视机终端智能体核心能力

  AI智能体是一个具备自主感知环境、进行分析决策并执行动作以达成特定目标的智能化系统,其核心是具备自主性、主动性和情境感知能力。电视终端智能体将这种高级智能形态与电视终端相结合,其定义可以概括为:一个深度集成于电视终端硬件与操作系统,能够持续感知家庭环境、理解用户意图、自主规划任务、并协同操控内容、应用及其他智能设备的个性化人工智能管家。

  电视终端智能体的核心工作模式是一个完整的“感知-决策-执行”闭环,将用户从繁琐的电视操作中解放出来,提供无缝、主动和个性化的服务体验。电视终端智能体相应要具备感知、决策、执行能力。

  1.1 电视智能终端感知能力

  感知能力是智能体与环境交互、获取信息的基础。对于电视终端而言,其感知的“环境”既包括屏幕内显示内容,也延伸至屏幕外的家庭物理环境。

  1.1.1 感知能力的维度

  电视终端智能体的感知能力主要体现在以下两个维度:

  屏幕内容理解:智能体须能够解析屏幕上显示的信息。识别屏幕上UI组件,并

  理解它们的类型和可交互状态;理解播放的视频内容,从屏幕图像中提取并理解关键信息。

  环境状态感知:通过电视配备的摄像头、麦克风阵列等传感器,智能体可以识别用户的身份、位置、姿态、手势,甚至情绪。

  1.1.2 支撑感知能力的VLM和LLM技术

  电视终端智能体通过视觉语言模型(VLM)与大型语言模型(LLM)相结合,打通像素信息与语言语义之间的鸿沟,实现理解复杂的场景和抽象的视觉概念。多模态融合技术实现感知能力从“单一”走向“整合”,获得比单一模态更准确、更鲁棒的环境理解。

  1.2 电视智能终端决策能力

  决策能力负责整合所有智能体感知到的信息,理解用户的意图,进行逻辑推理和规划,制定出实现用户目标的行动方案。

  1.2.1 LLM/SLM混合能力架构

  大型语言模型(LLM)凭借其在海量数据预训练,具备的自然语言理解、生成、常识推理和复杂任务规划能力。在智能体中,LLM部署在云端,承担信息决策的计算密集型工作。小型语言模型(SLM)是低参数量的轻量化模型,其优势在于其低廉的计算成本和极低的推理延迟,使其非常适合在设备资源受限的电视机或机顶盒等终端设备上本地运行,可承担低延迟的决策工作。

  电视终端智能体在应用中推荐的实现架构是云端大模型+本地化小模型相结合的混合能力架构,该架构不仅能够充分利用小模型在效率与成本上的优势,也能发挥大模型在复杂问题研判上的独特能力,最终实现研判精度与算力资源的最佳平衡。

  1.2.2 决策过程的实现机制

  电视终端智能体的决策过程涉及意图理解、任务拆解、工具选择和动态调整的复杂循环。首先需要准确理解用户的多重意图,LLM/SLM会解析用户发出一个语言指令,更好地理解用户正确意图;对于复杂任务,决策过程将目标分解为一系列可执行的子任务,这个过程可以借助多种先进的提示工程、思维链技术来实现 ;电视终端智能体通过调用外部软件API、设备功能接口等“工具”来扩展其能力边界。

  1.3 电视智能终端执行能力

  执行是智能体将其决策转化为实际行动的环节。执行能力主要依赖两大核心技术:任务规划的落地与UI自动化。

  在决策阶段,LLM生成面向目标的任务计划。执行模块的首要职责是完成任务规划的落地,将抽象任务计划进一步细化和翻译成一系列具体的操作指令。

  在理想情况下,所有电视功能和应用内容都通过标准化的API暴露给智能体,执行将变得简单高效。在智能体无法获得所有应用的API访问权限情况下,智能体须具备UI自动化能力,通过操作图形用户界面(GUI)来完成任务的能力。

  电视终端智能体典型应用分析

  2.1 广电运营商智能体:华数影音智能体

  华数传媒构建了华数影音智能体。该智能体接入DeepSeek等大模型、打造自有的“灵鸿”大模型应用平台和AIGC内容创作平台,以此赋能其核心的影音娱乐服务,其应用实现对内增效和对外服务的双重属性。

  2.1.1 能力分析

  感知能力:华数影音智能体的感知能力不仅感知用户,更要深度感知和理解内容本身。一是用户意图感知:通过语音和遥控器操作,感知用户基本意图,分析用户的观看行为数据,感知用户的潜在兴趣偏好。二是多模态内容感知:智能体可以对海量的视频内容进行深度分析,提取关键信息和数据,实现内容的结构化理解。

  决策能力:华数智能体在内容理解之上构建了智能推荐和内容营销的决策能力。一是智能推荐决策:基于对用户画像和内容标签的深度理解,进行“人-内容”匹配,向用户推荐最可能感兴趣的视频内容。二是场景化服务决策:聚焦智慧家庭中的影音娱乐场景,提供如“智能家庭影院”等场景化解决方案。

  执行能力:紧密围绕“视听”展开,并延伸到内容创作。一是视听执行:提供高质量的视频点播、直播、回看等基础执行能力。二是AIGC内容生成:根据用户的选择生成音视频故事内容,也提供AI创作的工具和体验。

  2.1.2 架构与部署

  华数影音智能体采用“云-端”协同的媒体处理与分发架构,如图1所示。

  云端是其业务的核心,所有内容的存储、处理、分析、转码都在云端完成。其多模态内容感知、AIGC模型训练与推理、大规模推荐系统等计算密集型任务均部署于云端的算力基座之上。

  用户的机顶盒或智能电视是服务的最终呈现端。具备交互与播放功能,负责解码和播放视频流,并作为用户交互的界面。具备轻量级计算能力,在本地运行简单的推荐逻辑或UI渲染。

  2.2 长虹“沧海智能体”AI TV

  长虹在2024年推出搭载“沧海智能体”的AI电视,代表了传统电视厂商向AI化转型的积极探索。

  2.2.1 能力分析

  感知能力:沧海智能体能够进行自然语言交互,理解用户的多轮、跨场景指令。在内容感知上,它能对播放内容进行分析,为用户提供个性化的内容推荐。

  决策能力:其决策核心是长虹自研的“智汇家AI大模型”,构建了“记忆体”和“知识库”,其决策系统采用了长期记忆和RAG架构,通过知识积累实现自我学习和进化,提供个性化服务。

  执行能力:沧海智能体能够根据感知和决策结果,对电视的画质和音质进行实时优化。在外部执行上,它能够作为智能家居的控制中心,联动其他长虹系或生态内的智能设备,还提供“情感陪伴”等服务。

  2.2.2 架构与部署方式

  沧海智能体采用了端云协同的混合部署模式,如图2所示。

  云端部署:“智汇家AI大模型”作为核心大脑,部署在云端,处理需要海量计算和知识的复杂决策任务,端还承载着海量的“知识库”和用户“记忆体”的存储与管理。

  端侧部署:电视终端本地部署了轻量级的AI模型和算法,包括:用于快速唤醒和简单指令识别的语音模型、用于实时人脸/手势识别的视觉模型,以及一个小型化的决策模型或规则引擎,用于处理无需联网的本地控制任务,保证在断网或网络不佳时仍有基本可用的智能体验。

  电视终端智能体时代的广电生态体系

  3.1 电视终端智能体下电视业务重构

  电视终端智能体的部署,从根本上改变电视业务的价值链条,尤其在用户体验、内容分发、增值服务方面产生了深远影响。

  3.1.1 创新用户体验

  智能体的出现,彻底颠覆了传统的人机交互模式,不管是从“人找内容”,还是“内容/服务找人”,都带来了用户体验的质变。

  1. 自然语言交互的深化:通过支持多轮对话、上下文理解和模糊意图识别的自然语言交互,电视终端智能体会理解用户观看意图,提供流畅的交互体验。

  2. 超级个性化内容推荐:智能体能够融合多模态数据,并结合长期记忆中的用户偏好,构建出极其精准和动态的用户画像。通过深度学习和偏好建模,其在基于电视推荐系统的实测中,用户观看时长得到显著提升。

  3. 主动式服务与场景智能:智能体能够基于对时间、环境和用户状态的感知,主动触发服务。

  3.1.2 个性化广告业务模式

  智能体的引入,推动电视广告从粗放投放转向精准、互动与实效的新模式。基于深度用户理解,智能体实现“千人千面”的精准触达与实时优化。互动广告的效果可量化也推动计费模式向按点击(CPC)、按转化(CPA)等效果付费演进。

  3.1.3 提升电视业务价值

  智能体凭借精准推荐增强用户粘性,直接助推视频点播、会员服务等核心业务增长,从而提升每用户平均收入并降低流失率。同时,作为家庭智能中枢,智能体还催生了“边看边买”大屏电商、在线教育、健康管理等新型增值服务。

  3.2 与行业发展结合

  3.2.1 一体化电视发展

  “电视机机顶盒一体化”是治理电视操作复杂的一项基本工作,一体化电视的核心在于实现电视直播和其它视听内容的统一设备承载。一体化电视在硬件层面要求高度集成化,电视解码器、接收器等功能整合至智能电视终端设备,智能电视的处理器需同时支撑操作系统、应用程序、用户界面及传统电视功能的并行运行。

  电视终端智能体与一体化电视在技术架构上可实现相互依托。长远来看,基于智能电视机的智能体是电视终端智能体的必然选择。一体化电视可为电视终端智能体提供的高性能处理器、电视操作系统与API接口;电视终端智能体可以为一体化电视中的视频播放功能和其它功能提供智能化交互入口,并可实现更多功能的拓展。

  3.2.2 终端智能化的发展

  各大主流电视制造商、网络视听平台、电视运营商,均已将AI大模型和智能体技术作为其产品战略的核心,推动电视行业从单纯的“智能电视”迈向“智能体电视”时代。

  全国音频、视频及多媒体系统与设备标准化技术委员会也已提交了《人工智能 终端智能化分级 第5部分:电视》(国标征求意见稿)。在此过程中,电视内容运营商要积极参加电视终端智能化或相关标准的制定,提出电视运营商上对电视终端设备的技术要求。

  3.3 技术演进趋势

  3.3.1 模型轻量化加速

  在有限算力下实现模型性能与效率的平衡,即轻量级模型,是一个重要的发展趋势,其关键是采用模型压缩技术,使其更易于在终端侧进行,这样的技术发展可以为电视智能体提供更强大的本地化推理能力。

  3.3.2 多智能体协作

  单一智能体向多智能体系统(MAS,Multi-Agent Systems)演进。家庭场景中,电视智能体与基于电视终端的其它智能体实现协同,通过任务分解完成复杂需求。

  3.3.3 无缝的跨设备协同

  电视终端智能体可升级为家庭环境中的智能中枢,从而与其它智能设备建立深度互联,从而为用户构建智能的生活体验。

  推动广电终端智能体发展的对策建议

  4.1 行业推进

  1. 制定电视终端智能体技术规范:需要由广电总局和电视机制造主管部门工信部牵头,制定电视终端,尤其是智能电视机终端的软硬件标准,从而明确智能体在软硬件能力基础平台,并进一步制定电视端智能体的性能指标及互联互通等方面的要求,引导技术发展规范化和标准化。

  2. 建立广电智能体评测认证体系:参照现有行业认证框架,建立统一的智能体评测认证体系,应对智能体的意图识别准确率、内容安全合规性及能效比等核心指标进行第三方权威测评,并依据综合性能划分等级。通过标准化认证标识,为消费者提供明确的产品性能参考,形成有效的市场引导与质量监督机制。

  3. 推动数据互通标准:构建统一的数据互通标准体系,推动终端厂商与广电企业分别开放匿名化用户行为数据与内容元数据的标准化接口,实现数据的协同计算,有效打破数据孤岛。

  4.2 产业应对

  面对电视终端智能体技术的发展,广电运营商应依托其一体化电视服务的推广,制定智能化发展战略,通过系统性整合内容、技术与数据资源,实现从传统的“渠道运营商”向“智能服务聚合商”演进。

  1. 内容资产的AI化重构:对历史内容资源进行AI驱动的深度结构化标注与知识图谱构建,将其转化为可智能检索与动态重组的“数字资产库”,提升节目内容的再利用价值与生产效能。

  2. 构建战略入口与生态合作:为实现广电智能服务的规模化,电视运营商应在一体化电视的基础上,或提前布局构建自主的电视智能体,积极与与电视制造商深度合作,将广电电视终端智能体尽早植入主流电视硬件,有效扩大其用户触达范围、夯实流量基础。

  结束语

  电视终端智能体已快步进入规模化落地阶段,通过构建“感知-决策-执行”的智能体工作闭环,可有效提升电视业务的形态与价值,在自然语言交互、内容推荐和个性化场景 化服务等方面展现出优势。广电行业应紧跟模型轻量化技术、跨智能体协作和跨设备协同等智能体技术发展,借力电视终端智能化能力的规范化,推广基于广电的电视终端智能体应用,进一步推动电视机机顶盒一体化演进,夯实治理电视操作复杂任务的基础。

责任编辑:凌美

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!