OpenAI上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性
清源| T之家| 2025-04-18
【流媒体网】摘要:OpenAI推出Flex API模式,以响应延迟换取半价优惠,适用于非生产任务。

  为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。

  OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。

  采用 Flex 处理,API 费用将直接减半。以 o3 为例,Flex 模式下的费用为每百万输入 tokens 收取 5 美元(IT之家注:现汇率约合 36.5 元人民币,相当于约合 75 万字),每百万输出 tokens 收取 20 美元(现汇率约合 146 元人民币)。

  作为参考,标准价格分别为 10 美元和 40 美元。对于 o4-mini,Flex 模式的费用则从每百万输入 tokens 收取 1.10 美元、每百万输出 tokens 收取 4.40 美元,降至每百万输入 tokens 收取 0.55 美元(现汇率约合 4 元人民币)和每百万输出 tokens 收取 2.20 美元(现汇率约合 16.1 元人民币)。

  OpenAI 在向客户发送的通知邮件中还表示,按照公司用户的消费层级划分,处于第 1 至第 3 层的开发者必须完成新上线的身份验证流程,方可获取 o3 的访问权限。此外,OpenAI 指出,o3 及其他模型的推理摘要功能和流式 API 服务同样需要完成身份验证后才能启用。

  OpenAI 此前强调,身份验证机制的目的是防止用户违反公司制定的使用政策。

责任编辑:凌美

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!

今日聚焦更多

[CCBN2025] 融媒体与微短剧创新发展论坛成功举办
勾正科技发布《2024中国家庭智能大屏行业发展白皮书》
超高清革命下的技术突围:广电行业如何破解内容缺口困局?
[CCBN2025] 融媒体与微短剧创新发展论坛成功举办
勾正科技发布《2024中国家庭智能大屏行业发展白皮书》