姑苏论道|中国科学院霍庆哲:超高清音视频算力网络与应用实践
| 流媒体网| 2026-05-28
【流媒体网】摘要:超高清视频是继视频数字化、高清化之后的新一轮重大技术革新,将带动视频采集、制作、传输、呈现、应用等产业发生深刻变革。

  2026年5月28日-29日,流媒体网主办的「姑苏论道暨第31届智能视听与科技创新产业论坛」在苏州隆重举行。

  本届论道以“势聚AI 屏见未来”为主题,围绕产业升级展开积极探讨。5月28日下午的“进化·新物种”技术产品论坛上,中科院计算机网络信息中心 算力网络项目主管 霍庆哲发表了题为《超高清音视频算力网络与应用实践》的主题演讲。

  尊敬的各位领导、各位专家,大家下午好!我是来自中科院网络信息中心的霍庆哲。我分享的主题是《超高清音视频算力网络与应用实践》,介绍我们团队在该领域的最新研究成果。

  政策与技术双驱动,产业迎来新机遇

  超高清音视频是继视频数字化、高清化之后,新一轮重大技术革新,将推动视频采集、制作、传输、呈现、全应用链路产生深刻变革。目前,超高清音视频产业已成为我国数字文化产业的重要组成部分,市场规模庞大,同时持续带动各类新兴技术迭代升级。

  该领域也是文化与科技深度融合的重要方向,对塑造国家文化形象意义深远。国家及地方相继出台多项扶持政策,为超高清音视频产业发展,以及我们所深耕的算力网络建设,开辟了广阔空间。

  当下,AI与超高清音视频加速融合,催生出全新的发展需求。文化领域已是人工智能落地应用最广泛、创新最活跃的场景,广播电视与视听行业更是前沿主战场。

  从顶层设计来看,国家“十五五”规划明确提出培育新质生产力,要求打通超高清产业全链条、整合分散资源、深化AI融合应用,破解算力碎片化难题,搭建全国一体化广电视听技术体系。我们本次项目,正是响应国家战略的重要实践。

  从技术演进来看,视频生成模型快速迭代,AIGC彻底重构了超高清音视频内容生产模式。传统创作高度依赖人工团队,如今AI成为重要辅助,生产效率与创意空间得到极大释放。

  从产业趋势来看,AI工具全面渗透至拍摄、剪辑、渲染、传输、播出等各个环节。以AIGC为核心的智能化转型,不再是行业可选项,而是未来发展的必然方向。

  基于以上背景,我们提出搭建超高清音视频一体化算力网络系统,依托算网协同技术,助力AI+超高清产业实现跨越式发展。

  现存痛点:算力、网络、模型多重瓶颈凸显

  随着产业升级,超高清音视频对算力、网络的需求达到历史新高,传统运行模式已难以支撑业务发展。

  在算力需求方面:高质量视频生成、大模型训练对算力要求极高。主流视频生成模型训练,需要上万张H100显卡,耗时45至70天;单张显卡生成一段视频,推理时长约1小时。处理8K超高清视频,单卡需要近4000个核心资源,算力门槛极高。

  在网络传输方面:单路4K视频传输带宽需50-60Mbps,一档节目通常配备100至200个机位,总传输带宽可达50Gbps,且传输时延必须控制在40-80毫秒以内,否则会严重影响制播协同效率。

  国家广电总局曹局长也明确要求,加快网络升级、完善广电算力基础设施、推进算网协同与算力共享。我们的项目正是紧扣这一要求,打造算-网-模一体化业务支撑体系,实现数据传输、算力调度、模型服务的统一管控与智能协同,全面融入全国一体化算力网络。

  传统视频生产模式串行化、封闭化,各环节排队等待,依赖专用硬件与集中式平台,整体效率偏低。结合实际落地场景,当前产业链主要存在五大堵点:

  1. 算力孤岛问题:超高清内容生产算力需求巨大,万卡级算力成为常态。单一算力中心扩容速度,始终跟不上业务增长,孤岛式算力架构难以为继。

  2. 素材管理难题:以合作方芒果TV为例,湖南广电媒资库存量达6PB,其中大量标清内容亟需升级为超高清。受本地算力限制,仅能优先保障热门节目制作,其余内容无力处理;同时传统标签检索方式落后,语义检索能力不足,且单算力中心可部署的模型数量有限,无法匹配多元化业务需求。

  3. 内容生成复杂:AIGC长视频创作需要联动多款模型、多种工具,模型调用与组合日趋复杂。

  4. 数据传输低效:超高清视频文件体量巨大,跨节点“入算、出算”传输缓慢,目前行业仍普遍采用邮寄硬盘的方式搬运数据,灵活性差、效率低下。

  5. 协同编辑受限:以《披荆斩棘的哥哥》等节目为例,拍摄机位遍布全国,但素材必须统一传回总部处理,分布式就近算力、异地协同剪辑的需求无法满足。

  行业核心痛点三点:一是算力孤岛,无法按需灵活调度;二是网络传输存在瓶颈,传统传输协议制约制播全流程效率;三是模型部署成本高、品类多,难以实现按需调用。

  五层架构+五大模块,构建算网模一体化体系

  针对行业痛点,我们明确了系统定位:以广覆盖、高安全网络为底座,统筹调度全域智能算力、边缘算力,为超高清音视频产业提供低成本、广覆盖、高效安全的一体化算网服务。

  (一)五大建设模块

  我们规划五大模块,形成“资源互联—编排—调度—应用—运维”完整业务闭环:

  1. 资源互联:解决算力与网络的连接问题。依托异构算网互联、SRV6智能编程、安全传输技术,实现跨地域、跨机构算力组网与安全传输。

  2. 资源编排:解决任务拆分与资源匹配问题。将业务拆解为计算任务、传输任务,通过算网编排,为任务匹配最优资源,实现算网深度协同。

  3. 资源调度:解决算力与数据的最优流转问题。基于数模算联合调度、智能路由规划,实现算力、数据分布式调度,做到资源随任务流动、任务随需求匹配,最大化运行效率。

  4. 资源应用:解决传输提速与稳定性问题。依托自研高速传输协议、动态带宽分配与速率调节技术,保障广域网络下超高清内容稳定传输,打通“入算慢、连通难”堵点。

  5. 系统运维:解决平台搭建与综合管理问题。搭建一体化算力网络平台,实现资源纳管、组网传输、算力编排调度、网络安全、可视化运维五大功能。

  (二)五层技术架构

  系统自下而上分为五层,并配套超高清音视频专用组件,打造算网模一体化支撑体系:

  1. 资源接入层:整合通用算力、智能算力、超级算力等异构资源,对接骨干网络,打破算力孤岛,实现统一纳管。

  2. 算力组网与传输层:依托超高清音视频骨干网,覆盖全国终端与边缘节点,实时感知网络、算力状态,为上层调度提供数据支撑,解决大文件传输低效问题。

  3. 算力编排调度层:为整套系统的“大脑”,具备异构资源融合、算力编排、数算联合调度三大核心能力,通过智能路由,让数据、算力跟随任务流转,实现算力按需调度。

  4. 算力服务层+Web系统:对外提供视频采集、编辑、制播等全流程服务,通过管理大屏、标准API接口,简化用户操作,屏蔽底层技术细节。

  5. 算法组件层:统一收纳、管理各类AI模型与算法,支持标准化调度部署,降低多模型部署与使用成本,实现灵活调用。

  整套架构具备三大核心能力:一是全域算力调度,打破孤岛、弹性供给;二是高效数据传输,大带宽、低时延,支撑TB级素材高速流转与异地协同;三是统一模型服务,AI模型集中封装、轻量化跨域调用,降本增效。

  核心技术与模式革新:重构生产流程,三大技术赋能落地

  依托上述架构,我们落地三项核心技术,同时完成传统生产模式的全面升级。

  (一)生产模式革新

  传统生产流程以串行作业为主,环节之间依次等待,依赖本地专用硬件与集中平台,效率低、周期长,无法承载8K、AI等高负载业务。

  我们联合芒果TV、芒果云平台完成架构升级后,实现并行协同+分布式算力新模式:素材上云后,修复、编目、渲染等环节可并行推进;本地算力、模型可优先调用,能力不足时自动跨域调度全网算力与外部模型。

  整体实现三大转变:串行排队变为并行协同、本地硬件依赖变为算力随任务流动、集中平台变为分布式算力支撑,生产效率与业务灵活性大幅提升。

  (二)三大核心技术

  1. 算网协同调度技术

  彻底打破算力孤岛,支持超高清全业务跨云拆分、全局最优匹配。系统将完整生产流程拆解为不同子任务,结合任务对吞吐、时延的差异化要求,统一接入全域算力资源池。支持就近调度、成本优选、分布式调度等多种策略,并采用强化学习编排算法,实时感知节点状态,动态生成最优方案。该技术使整体服务时延降低50%,实现全流程分布式、网络化、智能化生产。

  2. 自适应高速传输技术

  针对性解决超高清素材“入算、出算”传输难题,打造需求驱动的自适应传输与流量控制体系。融合分段传输、多路径传输、拥塞控制等技术,配套流控算法,可快速响应网络波动,保障传输稳定。相比FTP等传统协议,传输效率提升2-20倍,彻底告别硬盘邮寄的原始数据搬运方式,保障异地协同生产。

  3. 一体化模型服务工具集

  工具集分为两大板块:面向业务人员的内容创作工具集,将复杂AI能力封装为可视化界面,提供素材成片、语音转译、AI配音、视频超分等功能,易用性强;面向开发者的通用算法服务,通过标准API对外输出视频拆条、语音识别、声音克隆等十余项能力,支持自由组合调用,免去自主部署、运维模型的高昂成本。

  落地实践与合作展望

  目前我们的技术与平台已落地多个项目,取得阶段性成果:

  第一,芒果TV联合项目:建成全国首个超高清音视频算力网络,与芒果云制作平台全面打通。平台可将高算力任务调度至第三方算力中心执行;本地算力不足时,把标清转超高清等任务调度至西部绿色算力节点;自有模型缺失时,可灵活调用北京、四川等地的外部模型能力。该项目荣获第29届全国发明展览会银奖。

  第二,全国算力网络布局:现已建成覆盖全国的高速算力网络,覆盖全国23个省(直辖市)、122个城市,主干链路以100G、200G为主,对接国内外主流云厂商,搭建跨数据中心、算力中心的可灵活调度网络,兼顾通信与计算需求。

  第三,全链路AI能力落地:平台集成视频拆条、图文编辑、AI配音、智能分析等多款模型,可基于原始素材,结合提示词完成素材检索、智能剪辑、自动成片,实现AIGC全流程应用。

  算力网络属于底层通用基础设施,应用场景不局限于视听行业,可服务全行业各类算力需求。

  今天非常感谢各位同行的分享与交流,也期待未来能与大家携手探索、深化合作,共同推动算力网络与超高清产业持续发展。我的分享到此结束,谢谢大家!

责任编辑:凌美

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!