全球数字财富领导者

OpenAI被卷到了!上线新推理模型o3 Mini,首次向免费用户推出,Altman“认错”开源

2025-02-01 11:19:26
格隆汇
格隆汇
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:领先优势不如以前

低成本优势,国产大模型震撼华尔街和资本市场,OpenAI有了更强的紧迫感,随即推出更小、性价比更高的新推理模型。

此外,OpenAI CEO Sam Altman在问答中认错开源策略,并称考虑推出开源策略,公司的领先优势不如以前。

更灵活

1月31日,OpenAI正式发布了新的推理模型o3-mini,该模型更加灵活,用户可根据自己的需求选择不同的模式。

OpenAI介绍称,o3-mini是公司的第一个小型推理模型,它支持开发人员一些高要求的功能,使其可以立即投入生产。

在使用时,开发人员可以根据推理工作量选择低、中和高的模式,以针对其特定用例进行优化。

这种灵活性使o3-mini在应对复杂挑战时能够“更加认真地思考”,或在有延迟问题时优先考虑速度。

定位上,前一版本的o1仍然是OpenAI更广泛的常识推理模型,o3-mini为需要精度和速度的技术领域提供了一种专门的替代方案。

能力上,o3-mini的中等推理选项与o1在数学、编码和科学方面的表现相当,同时提供更快的响应。

专家测试人员的评估表明,与o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。测试人员在56%的时间里更喜欢o3-mini的回答,并观察到其主要错误减少了39%。

在2024年美国数学邀请赛(AIME 2024)的测试中,低等模式的o3-mini准确率与o1-mini差不多,中等模式的准确率能提升到79.6%,与o1模型相当,高等模式o3-mini的准确率能进一步提升至87.3%。

在博士级科学问题(GPQA Diamond)方面,三种不同程度o3-mini的准确率分别为70.6%、76.8%和79.7%。


首次向免费用户开放推理模型


据悉,这是OpenAI推理系列中最新、最具成本效益的模型,现已在ChatGPT和API中提供。

ChatGPT Plus、Team和 Pro的订阅用户可以开始访问OpenAI o3-mini,企业订阅用户将于2月推出。

速率限制上,ChatGPT Plus和Team用户从o1-mini的每天50条提升到o3-mini的150条,Pro用户能无限制地访问o3-mini。

值得注意的是,从今天开始,未订阅的用户还可以尝试使用OpenAI o3-mini,只需要点击reason按钮即可。

这意味着,ChatGPT中首次向免费用户提供推理模型。

OpenAI创始人Sam Altman也发文高调官宣o3-mini的推出,并称它可以联网,并显示其思考过程,Plus用户可以使用o3-mini的高端模式。

领先优势不如以前

o3-mini发布后,Sam Altman还带领首席研究员Mark Chen、首席产品官Kevin Weil、工程副总裁Srinivas Narayanan、API 研究主管Michelle Pokrass,和o3-mini团队研究主管Hongyu Ren,在Reddit和网友们来了场互动问答。

在问答中,奥特曼坦诚地表示:“在开源上我们站在了历史的错误一方。”

他透露,内部正在考虑开源策略,继续研发模型,但OpenAI领先优势不会像以前那么大了。

对于特朗普推动的星际之门计划,OpenAI表示,这非常重要。事实表明,计算能力越多,就能建立更好的模型,并制造更有价值的产品。

OpenAI现在同时在两个维度上扩展模型——更大的预训练和更多的强化学习/strawberry训练,这两者都需要计算资源。

此外,为数亿用户提供服务,且随着OpenAI转向更多为您持续工作的智能产品,这些也都需要计算资源。因此可以将Stargate视为工厂,将算力/GPU转化为令人惊叹的产品。

就OpenAI的表态来看,DeepSeek引发的算力需求可能会过剩的争议被证伪了。

OpenAI还透露,预计完整版o3将在超过几周,少于几个月的未来推出。语音模式更新即将到来,会直接叫它GPT-5而不是GPT-5o,目前还没有时间表。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go