微软推出人工智能模型 CoDi,可互动和生成多模态内容
故渊|
IT之家 | 2023-07-11
【流媒体网】摘要:微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。
微软近日发布新闻稿,推出了名为可组合扩散模型(CoDi),这是一种独特的、基于可组合扩散的人工智能模型,其设计目标是互动和生成多模态内容。
微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。
CoDi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。
CoDi 由 Microsoft Azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发,也是 Microsoft 项目 i-Code 的一部分,该项目使用人工智能来增强人机交互。
责任编辑:李楠
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!
24小时热文
流 • 视界
专栏文章更多
- [常话短说] 【解局】广电要警惕“虚假繁忙”! 2025-04-08
- [常话短说] 【解局】超高清机遇要把握!胜利! 2025-04-06
- [常话短说] 【重磅】全国广电业务一体化迈出关键一步! 2025-04-03
- OTT月报|2025年2月智能电视大数据报告:月活终端3.06亿台 2025-04-01
- 勾正科技姜岚:跨界,破局——解码大屏如何全域增长 2025-03-31