姑苏论道|互动媒体推委会杨崑:AI赋能视听应用的融合点分析

| 流媒体网| 2026-05-29

【流媒体网】摘要：AI在视听领域正在从探索为主走向价值变现。

　　2026年5月28-29日，由流媒体网主办的「姑苏论道暨第31届智能视听与科技创新产业论坛」在苏州隆重举行。

　　本届论道以“势聚AI 屏见未来”为主题，汇聚产业新势、以AI赋能大屏，共探行业全新发展图景。

　　在5月29日上午举办的主论坛上，互动媒体推委会副主席杨崑做了主题为《AI赋能视听应用的融合点分析》的演讲。

　　以下是演讲全文：

　　十分荣幸，能在姑苏论道和大家共同探讨AI +视听这一话题。

　　一、产业进入与AI技术深度融合的拐点

　　如今，视听产业已然迈入与AI技术深度融合的关键拐点。2023年，我们更多是怀着热情与好奇，探索AI技术带来的无限可能。步入2025年，能明显看到，各种AI产品、服务已经全面开花。短短两年时间，行业已从初步尝试探索，全面迈入务实落地应用的阶段。

　　如今，全行业不仅在普及使用AI，更将其融入视听产业链的各个环节。近期交流中大家讨论的重心，也从 “是否要用AI” 转变为 “如何借助AI实现盈利”，这是十分积极向好的信号。

　　当一项新技术为行业赋能时，想要实现长效发展，就必须落地、构建可持续的正向产业价值循环。2026年，产业链各方也开始集中思考这一问题。目前，国内外视听产业与AI的融合已形成相当规模，我们也具备了探索答案的基础。

　　从AI带来的优势来看，它大幅提升了行业效能与内容品质。一方面打破了传统内容生产模式的局限，实现提效、降本、缩短制作周期；另一方面依托新技术持续优化用户体验，拓宽了视听行业与其他产业跨界融合的路径，也为挖掘全新商业价值创造了空间。

　　昨日主论坛与各分论坛分享的诸多优秀案例，都充分印证了这一点。

　　二、AI技术与视听应用多层衔接

　　我们可以从四个维度，具体分析AI为行业带来的推动作用。

　　1、技术推动视听应用中多模态要素协同水平增强

　　一是系列技术支撑多模态信息升级。

　　如文生视频、图生视频、视频编辑模型等生成式AI技术的进步提升内容生成效率；智能剪辑、图像修复、超分辨率和动作捕捉等计算机视觉技术帮助提升内容质量；剧本生成、智能配音、字幕翻译和情感分析等自然语言处理技术有助打通语言-视听壁垒；语音合成、降噪和空间音频渲染等声学AI技术优化听觉体验。

　　二是关键技术突破加快在各类场景中的落地。

　　如时序一致性的强化解决了长视频生成中角色和场景不稳定的问题；实时渲染能力升级通过神经渲染和光场计算推动8K/16K内容生成时效性；小样本学习降低了行业模型训练数据依赖，能更好适配垂类场景。

　　2、人机协作共同发力内容提效保质

　　一是人机协作实现AI与人的优势结合：由AI负责剪辑、调色、字幕和基础特效等重复性和标准化工作；由人类负责剧本内核、艺术风格、情感表达和价值观把控等核心创意。

　　二是内容质量有效把控：针对影视、动漫和纪录片等场景定制的垂类化模型提升内容专业性；AI生成内容通过AI初审和人工终审结合，更好地防止低俗、侵权和价值观偏差。

　　3、以需求牵引加快垂直领域场景落地

　　一是保障高需求和标准化场景优先落地。

　　微短剧/动漫等制作周期短、成本敏感和迭代快的领域实现了更高的AI渗透率；视听新闻等受众日常较多关注的领域，通过资讯自动化生成、虚拟主播和多语种译制等手段来提升传播效率；文旅/演艺等热点内容采用虚拟景区、数字文博、AI演唱会和沉浸式剧场等形态汇聚用户的流量关注。

　　二是增强AI技术和场景的适配度。

　　通过不断探索根据场景需求选择适合的AI能力（如直播侧重实时性，影视侧重画质）；根据场景数据的反馈优化模型，形成良性闭环。

　　4、利用AI技术构建可信视听环境

　　一是视听应用核心风险。

　　面向视听应用存在核心风险-深度伪造（Deep Fake）、虚假信息和低俗侵权内容泛滥等内容风险；AI生成内容权属模糊，训练数据侵权纠纷频发等版权风险；虚拟人滥用、隐私泄露或算法偏见导致内容歧视等伦理风险。

　　二是AI支持治理措施升级。

　　通过AI内容溯源、深度伪造检测和水印嵌入，实现技术上的“可追溯、可鉴别”；通过制度明确AI内容权属、审核标准和责任划分；2026年广电总局还出台专项管理办法；通过建立AI视听伦理准则等行业自律措施以规范创作边界。

　　三、AI技术与视听应用融合点分析

　　AI技术与视听应用现阶段常见的结合点，大致有12个，分别是：

　　安全审核，如多模态筛查、AI和人工复核；

　　传输优化，如AI编码、注视点渲染和边缘计算；

　　自然交互，如方言语音、情感交互和多模态对话；

　　沉浸体验，如AI超分、空间音频和自由视角；

　　数字人应用，如虚拟主播、陪伴和互动直播；

　　智能运营，如数据看板、AI运维和广告优化；

　　创意策划，如AI生成剧本/分镜和市场预测；

　　虚拟拍摄，如虚拟演播、AI运镜和数字人替身；

　　后期自动化，如智能剪辑、调色、配音、字幕和特效；

　　智能分发，如个性化推荐和多平台适配；

　　IP衍生，如AIGC批量生成多形态内容；

　　安全治理，如AI水印、溯源和深度伪造检测。

　　四、融合推动视听应用多元革新

　　1、内容生产在AI驱动下实现规模化和智能化创作

　　一是实现全流程自动化。

　　创意策划用AI技术生成剧本、分镜和人设，分析市场数据并预测爆款（芒果TV AI导演“爱芒”辅助剧情策划）；拍摄制作中采用虚拟棚实时渲染、AI运镜和数字人替身等手段降低实景拍摄依赖；后期包装通过自动剪辑、AI调色、智能配音/字幕和特效生成等手段降本增效。

　　二是生产范式进行重构。

　　小团队利用AI智能体开展完整创作的模式正在成为主流形态，甚至可以单人完成全流程；依托广电、影视、动漫的垂类大模型（如Seedance 2.0、Vidu Q3）可以实现“生成即成片”。

　　2、内容分发能力革新

　　一是内容分发智能匹配，实现效率与精准度双提升；二是AI基于用户画像实时生成定制化内容流，通过个性化推荐让点击率提升；三是多模态AI帮助识别涉政、低俗和侵权内容，智能审核让效率明显提升的同时，准确率得到提高；四是AI技术帮助视听应用适配长视频/短视频/直播/XR等多平台格式，降低全域分发成本。

　　3、用户体验的形态和界面革新

　　一是升级沉浸式体验。

　　采用边缘AI或AI引擎快速完成8K/16K图像的实时渲染、在体育赛事或直播中提供自由视角切换或2D转3D等功能。通过空间音频和数字虚拟人的结合，以全息虚拟主播、AI互动剧情和数字偶像直播等手段将用户从观众变为虚拟空间的参与者。

　　二是交互模式的变革。

　　更多人机界面实现自然语言交互，通过语音控制视听内容和服务提供的节奏、用AI生成互动剧情分支；增加情感化交互，通过AI识别用户情绪，动态调整内容节奏与风格。

　　4、产业生态革新

　　一是内容层面新业态爆发：在内容层面的微短剧、AI动漫、虚拟直播和互动影视等新业态陆续爆发。

　　二是治理层面体系逐步完善：在治理层面由AI内容审核、版权保护和深度伪造溯源等构建的体系逐步完善。

　　三是技术层面实现突破：在技术层面的国产大模型（Seedance、Vidu）、算力芯片和渲染引擎等实现突破，摆脱对国外依赖。

　　四是应用层面拓宽服务覆盖：在应用层面通过智慧广电、文旅数字化服务、云演艺和云游戏、远程医疗等民生服务拓宽了覆盖深度和广度。

　　5、商业模式革新

　　一是AI制作服务模式创新：AI技术已经向专业服务转化，端到端的AI制作服务，中小团队按需订阅等新模式开始增加。

　　二是个性化与智能适配广告优势：充分发挥AI优势的个性化广告和智能适配广告，可以实时生成匹配内容的广告，从而提升流量的商业转化率。

　　三是IP转化商业价值提升：AI可以缩短将单一IP转化为多形态内容的窗口周期（动漫、短剧、虚拟人、游戏），争取商业价值最大化。

　　五、未来趋势

　　1、技术趋势

　　一是加快完整的视听智能体系部署，强化基础设施，逐步实现全链路自主决策。

　　二是AI智能体加快普及：AI智能体具备任务规划、跨模态理解和自主决策能力，独立完成从创意到成片全流程。

　　三是通用与垂类模型分工：通用大模型负责基础能力的统一提供，广电、影视和动漫等垂类模型深耕专业场景价值挖掘。

　　四是与新兴技术共同演进：AI技术与脑机接口等更多新兴技术共同推动视听体验向“虚实共生”方向演进。

　　2、内容趋势

　　一是AI原生内容占比增加且形态多元。预计2027-2029年，AI生成的视听内容将逐步成为主流，微短剧、动漫和虚拟直播的主要来源；

　　二是AI实现实时动态叙事与交互。AI能实时完成动态叙事与交互内容，用户可自主选择影响故事走向，让互动影视和影游融合成为新的增长点；

　　三是AI支持全矩阵内容生成与分发。AI技术能用矩阵营销为主线支持一键生成短视频、长剧、花絮和海报等全矩阵内容，并快速适配多平台组合分发。

　　3、产业趋势

　　一是组织架构与跨界融合趋势：组织架构扁平化，跨界融合继续深化。

　　二是视听工厂构建与AI渗透：通过“AI智能体+标准化流程”构建视听工厂，中小团队AI渗透率将超过90%。

　　三是视听服务融合与新交互入口：视听服务更深度与元宇宙/数字孪生/智慧教育/智慧医疗/智慧社区/智慧家庭融合，跨界生态推动虚拟人等新的跨场景交互入口出现。

　　四是国产技术自主与生态成熟：国产视频生成模型、算力芯片和渲染引擎实现技术自主，自主生态成熟和完整。

　　4、治理趋势

　　一是平衡创新与安全：新的合规体系能更好平衡创新与安全。

　　二是精细化监管：分级分类管理AI内容，重点管控深度伪造和时政敏感内容，实现精细化监管。

　　三是版权交易成熟：AI生成内容权属明确，训练数据合规化，版权交易市场成熟。

　　四是坚守主流价值观：行业建立统一伦理准则，AI创作坚守主流价值观，减少非合规内容占比。

　　5、落地项目

　　短期落地项目方面，主要面向轻资产、低门槛、刚需落地、ROI最优、无需大额算力基建投入的方向，优先级高并以加快盈利为目标。

　　如AI后期自动化（剪辑/字幕/配音/调色）、AI短剧/漫剧量产、多模态智能审核、智能推荐+ AI广告生成、数字人主播/虚拟直播、AI老片修复/超分升级。

　　中期落地项目方面，核心特征是需轻度技术迭代、业务适配，落地后形成差异化竞争，带来稳定增量收益。如AI创意策划+剧本评估、虚拟演播+ AI无人转播、大屏AI智能体（电视管家）。

　　长期落地项目方面，核心特征是重资产、长周期、短期无明确现金流，为产业长期核心壁垒，适合技术储备布局。如AI智能编码+边缘传输优化、XR沉浸视听（自由视角/空间音频）、AI内容溯源+防伪鉴真。

　　六、总结与展望

　　1、AI赋能视听应用现状

　　AI赋能视听应用已进入“价值爆发”的关键期，核心是以技术革新驱动生产关系重构，以场景落地释放产业价值，以安全合规保障可持续发展。

　　2、业务发展策略

　　短期赚现金流、中期赚增量、长期赚壁垒；优先开发工具类、刚需类和标准化的AI视听应用，暂缓重资产、长周期和低付费意愿项目。

　　3、项目落地规划

　　优先落地低投入、快回本、强刚需项目，稳步布局中期增值业务，长期储备技术壁垒项目，实现AI赋能视听产业从降本到增收，再到生态变现的递进式发展。

　　4、AI推动行业未来发展

　　AI将推动行业迈向智能化、沉浸化、融合化、合规化的新发展阶段；提前布局中需要重点考虑定位、边界、价值。尤其是要重视AI改变原先产业运行架构后，新的盈利机制如何建立的问题；如果不能主动引导新的赢利点建立，预计2027年，行业可能进入由于新技术带来的内卷造成整体利益的收敛，这点尤其需要注意。

责任编辑：凌美

分享到：

24小时热文

流 • 视界

路明玉

知不足而后有进

24小时热文

流 • 视界

灯少

庞梦婕

周晓静

金博士

云中

晴天

简图

君畅

流沙

路明玉

专栏文章更多

欢迎投稿

会员注册

24小时热文

流 • 视界

灯少

庞梦婕

周晓静

金博士

云中

晴天

简图

君畅

流沙

路明玉

专栏文章更多