CCBN2026|媒体融合技术与标准推委会杨崑:AI赋能超高清视听应用发展的思考
| 流媒体网| 2026-04-23
【流媒体网】摘要:探讨AI助力超高清视听发展路径。

  4月23日,第32届中国国际广播电视信息网络展览会(CCBN)专题论坛——「网络视听产业论坛」在北京首钢国际会展中心举行。

  此次论坛由国家广播电视总局网络视听节目管理司指导,广播电视科学研究院、广播影视发展研究中心、流媒体网承办,芒果TV支持,聚焦大屏视听新业务、新技术探索。

  会上,中国通信标准化协会媒体融合技术与标准推委会副主席杨崑发表了《AI赋能超高清视听应用发展的思考》的主题演讲。

  以下为演讲全文:

  一、AI技术在超高清视听领域发展现状

  1、发展现状概述

  1)AI技术渗透超高清视听全场景

  AI技术已逐步深度渗透超高清视听的全场景中,从各类场景的内容制播、分发传输到终端呈现和交互体验等各个环节,均不同程度推进了AI技术的落地,已经形成可复制的推广模式。

  2)AI技术重塑视听服务场景

  AI技术在超高清采集、编码压缩、实时处理、传输分发、终端呈现、内容审核和智能交互等视听服务链路的各个环节中,从画质优化、带宽节省、智能管控和体验升级等多重维度,对广电视听内容播出、XR沉浸、远程医疗和文旅演艺等场景的形态进行了重塑。

  2、产业生态格局优化

  1)广电视听引领发展

  AI赋能超高清应用发展首先在广电视听领域形成示范作用,已在中央总台、各省级广电完成了一批AI +超高清制播分发体系的建设;在春晚、全运会、重大节庆等重点工作中实现了4K/8K全程AI赋能直播,依托AI智能编码、实时画质增强、智能调度等技术,保障了超高清播出的高品质和优化体验。

  2)多领域应用协同普及

  目前有线电视、IPTV、OTT、长短视频平台已经广泛采用AI超分转码与智能分发功能,对推动家庭超高清收视渗透率持续攀升起到积极作用;同时,AI还在驱动超高清视听服务在多个行业领域中的推广加速,拓宽了产业生态的边界。

  AI与超高清、5G、边缘计算、云网协同等技术的深度融合,推动了产业生态的不断优化升级。

  广电运营商、电信运营商、互联网企业、设备厂商、科研机构协同发力,推动AI算法迭代、算力适配与场景创新,边缘轻量化AI模型和智能体的广泛部署,让AI赋能超高清视听的边界不断下沉;AI技术与超高清视频的深度结合,加快了个性化推荐、智能问答、场景交互、多样化呈现等增值服务落地,进一步丰富超高清视听应用的形态。

  产业在“画质提质、带宽节省、效率提升、体验升级”的多方面实现突破。但在规模化普及过程中,受技术瓶颈、标准、资源不均等因素影响,仍存在诸多不足,制约了AI赋能效果的充分释放,亟需针对性优化完善。

  3、技术落地成效明显

  破解核心痛点:AI有效破解了超高清视听“数据量大、带宽压力高、运营成本高、体验要求高”等核心痛点。

  画质优化效果提高:在画质优化领域,边缘AI实时降噪、去抖动、插帧补帧技术,让户外、弱光和高速运动等复杂场景的超高清画面质量显著提升,无需高端采集设备即可满足专业播出需求。

  交互体验明显优化:在交互体验领域,AI姿态识别、视线追踪、数字人交互与超高清画面、空间音频深度融合,向“主动沉浸交互”升级,支撑XR演艺、虚拟演播、VR文旅等新型场景规模化落地。

  编码压缩效率提升:在编码压缩领域,AI内容感知编码替代传统固定码率编码,同等画质下可节省30%—60%带宽,大幅缓解骨干网与边缘网络承载压力。

  内容治理能力增强:在内容治理领域,AI帧级审核、智能拆条、实时字幕生成等技术,大幅替代人工工作,提升超高清内容生产与管控效率。

  二、AI技术对超高清视听业务发展的主要作用

  1、降低传输分发带宽压力

  1)AI智能编码降低超高清带宽压力

  AI智能编码大幅降低超高清带宽压力,AI内容感知编码、深度学习超分编码替代传统固定码率编码,针对4K/8K画面动态复杂度自适应分配码率,在同等画质下带宽节省,解决了超高清数据量大、骨干网承载压力高的行业痛点。

  2)普及智能编码降低网络传输压力

  有线电视、IPTV、央视直播、互联网长短视频等业务已经普及了智能编码技术;边缘节点实时AI转码常态化落地,提升了广电超高清播出内容传输分发的性能,大幅降低固定和5G网络传输压力。

  2、提升画质修复与增强能力

  1)边缘AI实现画质提质

  画质修复与增强:边缘AI助力超高清实时画质提质。AI降噪、去抖动、插帧补帧、明暗矫正和细节重建等技术广泛用于视听直播、赛事转播、老旧片源修复等场景中,能实时帮助提升弱光、远距离或运动场景清晰度,消除画面噪点、拖影和模糊等问题。

  2)边缘AI助力画面输出与帧插值提升观感

  演播室、赛事现场或偏远户外直播中,依靠云边AI协同实时实现画质增强,无需高端采集设备即可稳定输出高质量超高清画面;同时AI帧插值把24/30帧超高清提升至60/120帧高流畅画面,显著提升大屏、VR沉浸式视听体验。

  3、提效云边协同智能分发

  1)云边端一体化调度AI

  通过AI监测和调度,完成有线、5G、卫星多网超高清信号智能切换,实现应急播出的毫秒级响应,保障广电重大活动超高清视听服务零中断安全播出,加快实现城乡和偏远区域的超高清收视体验质量的均衡化。

  2)AI全域调度优化播出体验

  采用AI流量预测、动态路径调度和边缘节点智能负载均衡等功能,有效应对春晚、赛事或节庆等超高清直播的洪峰流量;通过自动就近缓存、智能切换分发节点等措施,大幅降低卡顿、延迟与首屏加载时长等体验劣化的现象。

  4、提高全链路内容智能治理水平

  1)支持超高清视听安全合规

  AI技术实时完成帧级审核、语音字幕同步、违规画面识别、深度伪造检测、版权溯源等功能,将AI能力贯穿超高清视听服务的采、编、播、发全流程中,对超高清直播实现毫秒级违规拦截,大幅提升监播效率。

  2)提升超高清内容生产效率

  AI自动完成超高清实时字幕、多语种翻译和智能拆条剪辑,大幅提升广电新闻、综艺、赛事等超高清内容的生产制作效率。

  3)保障正版内容版权安全

  通过AI水印、溯源技术等措施保障4K/8K超高清视听正版内容的版权安全,符合行业的安全播出和内容管控标准。

  5、实现交互与沉浸升级

  1)AI数字人、虚拟主播实时互动播报

  在超高清视听应用中增加AI数字人和虚拟主播等元素,让智能化实时互动播报成为常态化节目形态组成部分。

  2)大模型结合超高清视频理解

  利用大模型技术结合超高清视频视听服务,实现智能问答、场景交互和个性化内容推荐等功能,让被动观看式超高清视听转向主动式的交互体验,加速平面超高清向3D沉浸视听演进。

  3)AI驱动超高清与3D/XR融合应用

  在超高清视听服务过程中,通过AI姿态识别、视线追踪、空间音频同步等功能,优化用户感受,支撑沉浸式直播、虚拟演播、XR演艺、VR文旅等增值场景的落地。

  三、AI在超高清领域的典型场景

  1、超高清赛事直播场景

  1)编码传输环节技术应用

  在编码传输环节,AI内容感知编码技术可实时分析画面复杂度,对赛事精彩瞬间、运动员特写等特定画面分配更高码率,对空旷场地和静态场景适当降低码率。同时结合边缘AI实时转码,可以实现赛事信号就近分发,将端到端时延控制在要求范围以内,以保障城乡全域用户都能同步流畅观看。

  2)监播环节技术作用

  在监播环节,AI帧级审核技术可实时检测画面中的违规内容、画面异常,毫秒级发出预警,替代人工24小时监播,大幅降低播出风险,以确保重大赛事超高清直播零差错。

  3)采集环节技术应用

  在超高清赛事直播场景中,AI技术实现全链路智能化赋能,如在奥运会和马拉松等大型赛事中,采集环节采用AI智能对焦与曝光调节技术,让摄像头可自动追踪运动主体,实时优化高速运动画面的清晰度,避免出现拖影和模糊;在户外弱光环境下,AI弱光增强模块可自动提升画面亮度与对比度,保障4K/8K直播画质稳定。

  2、超高清文艺演艺场景

  1)舞台采集环节

  在超高清文艺演艺场景中,AI技术实现舞台效果与播出质量的双重提升,如在舞台采集环节,AI光影智能优化技术可根据节目风格和演员动作实时调整灯光渲染效果,同步校准多机位画面的色彩与亮度,从而确保4K超高清画面色彩均匀与细节清晰。

  2)后期制作环节

  在后期制作环节,AI智能抠像与虚实融合技术可快速将演员与虚拟舞台背景融合,无需搭建实景即可呈现沉浸式舞台效果,同时AI自动完成实时字幕生成、歌词同步、多语种翻译、字幕精准匹配语音节奏等功能,从而大幅缩短后期制作周期并提升了节目播出效率。

  3)终端呈现环节

  在终端呈现环节,AI画质自适应技术可根据用户终端(大屏、机顶盒、移动设备)的分辨率和色域参数,自动优化画面细节,确保不同终端呈现一致的超高清观感。

  3、超高清XR沉浸视听场景

  1)AI推动超高清向三维沉浸升级

  在超高清XR沉浸视听场景中,AI技术打破平面视听的局限,推动超高清向三维沉浸升级,以文旅XR场馆和虚拟演播室为例,AI光场三维建模技术可快速将实景景区、文物和演播场景转化为8K级三维模型,结合AI视角追踪技术,实时捕捉用户的视角变化,动态调整三维画面的渲染角度与细节,实现“人动景随”的沉浸式体验;

  2)AI超写实数字人技术的应用

  AI超写实数字人技术可生成与真人无异的虚拟主播、虚拟演员,通过AI语音合成、表情驱动技术,让数字人能够实时播报、与用户互动,数字人面部表情、肢体动作的还原精度达到99%,结合8K超高清画质,实现数字人与真人同台同框、无缝衔接,广泛应用于虚拟演播、文旅沉浸式体验、线上演唱会等场景。

  4、超高清多语种跨屏传播场景

  1)AI打破语言壁垒

  在超高清多语种跨屏传播场景中,AI技术打破语言壁垒,赋能国际赛事、政务直播、文旅宣讲等超高清内容的跨地域传播。

  2)AI实时语音转写

  在4K/8K超高清直播过程中,AI实时语音转写技术可快速识别直播语音,同步完成多语种实时翻译;主流产品能支持中文、英文和法语等十余种语言。

  3)AI字幕叠加

  AI字幕叠加技术可将处理后的文字精准叠加在超高清画面中,自动适配画面布局以避免遮挡关键内容,同时实现音画精准对齐从而确保观众在观看超高清画面同时,实时获取翻译内容,大幅降低人工翻译与编审成本。

  四、AI赋能超高清视听应用的不足和背景分析

  1、算法精度应进一步优化

  1)AI超分及动态场景画质算法

  AI超分和动态场景画质算法精度仍存在不足,如在大运动画面中容易出现失真或细节丢失等情况;超高清画面数据量庞大,高速运动镜头、弱光夜景和复杂纹理场景对AI建模算力要求极高,需要进一步优化算法能力。

  2)模型专业化适配

  当前主流AI模型多基于通用视频数据集训练,缺少面向视听播出、医疗手术或舞台演艺等高动态、高专业度场景的样本,模型垂直化能力有待提高。

  3)边缘节点算力限制

  边缘节点算力有限,目前只能部署轻量化压缩模型而无法运行高精度大模型,导致直播高速运动画面出现模糊、拖影或边缘锯齿;标清升4K的超高清重构画面的层次感、纹理还原度还达不到专业播出标准,难以满足常态化安全播出、医疗精准诊断增值服务等高严苛要求。

  2、编码压缩技术碎片化

  1)AI编码压缩行业碎片化

  AI编码压缩技术行业碎片化,跨设备跨网络兼容水平还需提高,各家广电运营商、电信运营商、设备厂商采用的自研AI编码优化算法、私有码流格式,云-边-端设备编码解码协议需要加强协同。

  2)传输链路技术差异问题

  广电的有线网络、5G移动网络、互联网、IPTV的传输链路技术体系差异大,AI码率适配和帧同步机制不一致,加大画面花屏、音画错位或切换卡顿出现的概率,制约了跨网、跨区域的超高清AI直播能力共享,大幅抬高平台改造与对接成本。

  3、数据集水平有待提升

  1)高质量标注数据集匮乏

  高质量标注数据集匮乏,专业场景AI模型国产化深度不足,超高清视频标注工作量远超普通视频,单条8K视频标注耗时是1080P的十余倍,高清赛事帧、手术细微病灶帧、弱光复杂画面目前标注工作得不到充分响应。

  2)专业场景AI模型供给不足

  国内高端影视级、医用级、广电专用的AI模型有些依赖国外底层框架,自主可控模型在实时性、稳定性和色彩还原准确度上存在一定差距,边缘端轻量化适配能力和智能体的研发还需提速,影响到大规模下沉基层机构和偏远地区的部分场景。

  4、算力供需不均衡

  1)云边端算力供需及布局问题

  云边端算力供需不匹配,边缘AI算力布局不均衡、利用率偏低,超高清AI渲染、AI转码、实时画质增强极度消耗并行算力,但当前算力资源集中在中心大型云数据中心,地市、县域、场馆、医院边缘节点高性能AI算力部署不足。

  2)城乡区域算力分布差距

  城乡区域算力分布差距明显,偏远地区无法就近实现AI实时处理,只能回传中心云端,大幅增加时延与骨干网压力。

  3)算力调度智能化问题

  同时算力调度智能化程度低,高峰拥堵、低谷闲置,整体算力资源浪费严重,无法弹性适配春晚、赛事等突发海量超高清流量。

  5、内容审核与检测能力存在不足

  1)AI内容审核与深度伪造检测

  AI内容审核和深度伪造检测能力需要与时俱进,以应对超高清虚假音视频风险突出,8K超高清AI深度伪造画面清晰度极高和伪装逼真,传统AI鉴伪模型分辨难度大幅上升。

  2)边缘AI

  视听直播、公共视听等场景对内容安全需要零容错,但现有边缘AI审核响应速度和帧级精细化检测能力存在不足,多帧篡改、局部画面替换和语音合成造假难以快速识别。

  3)内容安全与版权保护风险

  跨平台内容流转情况日益频繁,全链路溯源、水印追踪和AI版权管控体系存在不完善之处,内容安全与版权保护风险持续加剧。

  6、终端适配能力参差不齐

  1)终端适配

  终端适配能力参差不齐,通用与专业超高清AI显示标准并不完全保持一致,如家用大屏、专业显示器、VR沉浸终端等设备对分辨率、色域和刷新率要求不一致;在特定场景下,会造成AI画质增强效果在不同终端呈现差异。

  2)基层设备质量控制

  目前由于成本或其它因素影响,大量基层使用的普通显示器替代专业级显示设备,色彩偏差、亮度失真会放大AI算法瑕疵,直接影响诊断判断或节目播出质量,造成AI赋能效果大打折扣。

  五、发展建议

  1、加快标准研发

  加快统一AI超高清视听服务行业标准要求,推委会愿意和各方合作加快研究云网端互通兼容,牵头制定AI智能编码、码流格式、网络传输、边缘处理、终端显示方面的技术标准,规范编码、应用、保障、安全、系统协同的要求。

  2、深耕场景化专用AI模型

  深耕场景化专用AI模型,优化高动态超高清画质算法,面向赛事直播、XR沉浸视听等典型场景构建专项高质量超高清标注数据集,训练行业专属AI超分、插帧、降噪模型。

  3、构建自主底层技术体系

  构建国产化自主AI底层技术体系,建设共享超高清视频数据集,搭建行业共享的超高清视听AI共享数据库,规范数据采集、标注、脱敏流程,补齐专业场景数据资源的供给短板。

  4、统一接口协议与同步机制

  统一云边端接口协议与同步机制,破除厂商私有技术壁垒,实现跨地域、跨平台、跨网络超高清视听信号自由流转。

  5、优化云边分级模型架构

  优化云边分级模型架构,云端运行高精度大模型训练优化,边缘部署轻量化推理模型,兼顾实时性与画质精度,提升高速运动、弱光复杂场景画面还原能力,达到安全播出等行业标准的要求。

  6、加快国产算法与智能体研究

  大力研发国产深度学习框架与轻量化边缘AI算法,推动模型和智能体全面适配行业的系统、MEC边缘节点、5G基站边缘算力,实现全栈技术安全可控。

  7、统筹布局全域云边协同算力网络

  统筹布局全域云边协同算力网络,均衡优化算力资源调度,有序下沉GPU、NPU。

  从电视大屏到智能视听,AI助力下,产业的变革正在进一步加速。值得一提的是,5月28-29日,在由流媒体网主办的“姑苏论道”上,杨崑也将亲临现场,分享更多洞察与思考,敬请关注。

责任编辑:李楠

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!