百度端到端语音语言大模型发布,宣布成本最高降90%,上线文小言
文猛|
新浪科技| 2025-04-01
【流媒体网】摘要:文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。
在百度AI DAY上,百度发布首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,宣布实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%-90%。
当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。接入该模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的3-5秒降低至1秒左右。
更新后的文小言还支持“多模型融合调度”,整合了百度自研的文心X1、文心4.5等顶尖模型,并接入DeepSeek-R1等第三方优质模型,实现了多模型间的智能协同。用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。
同时,文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策。
责任编辑:李楠
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!
24小时热文
流 • 视界
专栏文章更多
- [常话短说] 【解局】超高清机遇要把握!胜利! 2025-04-06
- [常话短说] 【重磅】全国广电业务一体化迈出关键一步! 2025-04-03
- OTT月报|2025年2月智能电视大数据报告:月活终端3.06亿台 2025-04-01
- 勾正科技姜岚:跨界,破局——解码大屏如何全域增长 2025-03-31
- [常话短说] 【解密】全国广电工程公司 2025-03-26