首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

OpenAI 上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性

2025年4月18日 14:29  IT之家  作 者:清源

据外媒 TechCrunch 今日报道,为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。

OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。

采用 Flex 处理,API 费用将直接减半。以 o3 为例,Flex 模式下的费用为每百万输入 tokens 收取 5 美元(IT之家注:现汇率约合 36.5 元人民币,相当于约合 75 万字),每百万输出 tokens 收取 20 美元(现汇率约合 146 元人民币)。

作为参考,标准价格分别为 10 美元和 40 美元。对于 o4-mini,Flex 模式的费用则从每百万输入 tokens 收取 1.10 美元、每百万输出 tokens 收取 4.40 美元,降至每百万输入 tokens 收取 0.55 美元(现汇率约合 4 元人民币)和每百万输出 tokens 收取 2.20 美元(现汇率约合 16.1 元人民币)。

OpenAI 在向客户发送的通知邮件中还表示,按照公司用户的消费层级划分,处于第 1 至第 3 层的开发者必须完成新上线的身份验证流程,方可获取 o3 的访问权限。此外,OpenAI 指出,o3 及其他模型的推理摘要功能和流式 API 服务同样需要完成身份验证后才能启用。

OpenAI 此前强调,身份验证机制的目的是防止用户违反公司制定的使用政策。

编 辑:章芳
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐新闻              
 
人物
高通徐晧:利用6G和AI重塑移动连接的未来
精彩视频
专家谈|中国信通院果敢:生成式AI发展为人工智能终端注入创新动力
全球6G大会|高通展示三大6G原型系统 更好服务智能时代
6G技术新突破!6G全息超表面宽带移动通信系统样机发布
全球6G大会 | 中国通信标准化协会闻库:5G垂直应用痛点值得挖掘,设计6G时要加以考虑
精彩专题
通信产业2024年业绩盘点
3·15权益日 | 共筑满意消费 守护信息通信安全防线
聚焦2025全国两会
2025年世界移动通信大会
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像