微软推出人工智能模型 CoDi,可互动和生成多模态内容

故渊| IT之家 | 2023-07-11

【流媒体网】摘要：微软设计 CoDi 的目标，旨在解决传统单一模态 AI 模型的局限性。

　　微软近日发布新闻稿，推出了名为可组合扩散模型（CoDi），这是一种独特的、基于可组合扩散的人工智能模型，其设计目标是互动和生成多模态内容。

　　微软设计 CoDi 的目标，旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例，独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。

　　CoDi 采用了独特的可组合生成策略，在扩散过程中对齐多模态，从而生成相互交织的模式，更重要的是，CoDi 能够处理任意输入模式并生成任意模态的内容。

　　CoDi 由 Microsoft Azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发，也是 Microsoft 项目 i-Code 的一部分，该项目使用人工智能来增强人机交互。

责任编辑：李楠

分享到：

24小时热文

流 • 视界

花城

行而不辍，未来可期

花城

行而不辍，未来可期

专栏文章更多

[常话短说] 【解局】广电要警惕“虚假繁忙”! 2025-04-08
[常话短说] 【解局】超高清机遇要把握!胜利！ 2025-04-06
[常话短说] 【重磅】全国广电业务一体化迈出关键一步! 2025-04-03
OTT月报|2025年2月智能电视大数据报告:月活终端3.06亿台 2025-04-01
勾正科技姜岚:跨界,破局——解码大屏如何全域增长 2025-03-31

24小时热文

流 • 视界

花城

流沙

庞梦婕

云中

路明玉

简图

晴天

史上

君畅

灯少

花城

流沙

庞梦婕

云中

专栏文章更多

欢迎投稿

会员注册

相关文章

24小时热文

流 • 视界

花城

流沙

庞梦婕

云中

路明玉

简图

晴天

史上

君畅

灯少

花城

流沙

庞梦婕

云中

专栏文章更多