阿里宣布开源通义新模型,指定首尾图片可生成变身等特效视频
文猛|
新浪科技| 2025-04-18
阿里开源通义万相首尾帧生视频14B模型,宣布成为业内首个开源的百亿级参数规模首尾帧生视频模型,可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的720p高清视频,满足延时摄影、变身等更可控、更定制化的视频生成需求。用户已可在通义万相官网直接免费体验该模型,或在GitHub、Hugging Face、魔搭社区下载模型本地部署后进行二次开发。
首尾帧生视频比文生视频、单图生视频的可控性更高,是最受AI视频创作者欢迎的功能之一,但这类模型的训练难度较大,对模型的指令遵循、视频内容与首尾帧一致性、视频过渡自然流畅性等均有高要求。
据介绍,基于现有的Wan2.1文生视频基础模型架构,通义万相首尾帧生视频模型进一步引入了额外的条件控制机制,通过该机制可实现流畅且精准的首尾帧变换;在训练阶段,团队还构建了专门用于首尾帧模式的训练数据,同时针对文本与视频编码模块、扩散变换模型模块采用了并行策略,这些策略提升了模型训练和生成效率,也保障了模型具备高分辨率视频生成的效果。
基于该模型,用户可完成更复杂、更个性化的视频生成任务,可以实现同一主体的特效变化、不同场景的运镜控制等视频生成。
责任编辑:凌美
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!
流 • 视界
专栏文章更多
- 见微知著|海南自贸港2025封关,短剧出海新坐标? 2025-04-23
- 短剧榜单|3月美妆短剧竞逐女神节,电商品牌领跑短剧营销 2025-04-18
- [常话短说] 【破局】异业合作、跨界经营,广电自救新招式?! 2025-04-16
- 见微知著|对话张若波:多年芒果系转身微短剧得与失 2025-04-16
- [常话短说] 【解局】2025具体怎么干?多省广电给出答案! 2025-04-14