OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 行业动态 > OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

新火种 2024-12-06

OpenAI“双十二”第一天，直接抛出重磅炸弹——

最强推理模型o1，正式上线满血版，还有更强的Pro版本一同登台。

ChatGPT也推出了Pro订阅计划，一个月两百美金，直接成为了“世界最贵的大模型”。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

CEO奥特曼与三名员工围坐桌前，一边演示一边介绍着新产品的特性。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

整个发布会仅持续不到15分钟，但包含了巨大的信息量：

相比preview版本，满血o1的数学和代码能力均大幅提升，Pro版则是再上一层楼。满血版推理速度更快，比preview快了60%。网友们期待的多模态推理，满血版o1也安排上了。 OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

如奥特曼所说，满血版已经正式上线ChatGPT，作为预览的preview版从用户界面中消失了。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

至于更强的o1 Pro则是ChatGPT Pro订阅用户的特权，除此之外，这些用户还可以获得o1满血版的不限量访问权限。

o1已支持多模态推理

接下来到了演示环节。

一开始，团队就拿满血版o1（左边）和o1-preview（右边）来了场竞速。

他们问了一个历史问题，回答过程be like：

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

可以看出，满血版o1（14秒）早于o1-preview（33秒）完成了作答。再加上团队成员几次类似的离线测试，最终得出结论：

满血版o1的平均响应速度比o1-preview快了60%。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

值得注意的是，通过一整套人类评估，OpenAI还发现满血版o1在推理时犯重大错误的频率比o1-preview少了34%。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

而满血o1的另一大亮点就是支持多模态输入，具备视觉推理能力，团队也进行了现场展示。

只见他们拿出了一张画着数据中心草图的A4纸，拍照上传后，原始提示词翻译后如下：

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

这边团队成员们还在闲聊，10秒过后，模型就开始唰唰唰给答案了……

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

有意思的是，团队还特意给o1模型挖了个坑——故意省略了其中一个参数，以此来测试模型面对模糊问题的处理能力。

在团队看来，模型能够意识到这是一个重要但被忽略的参数，也是推理能力的体现。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

惊喜的是，满血版o1不仅选择了正确的参数范围，还通过进一步的细致论证最终找出了准确参数。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

（如模型所回答，正确答案是242）

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

最后，团队也展示了“大会员”专用的Pro版的表现。

既然是Pro，那测试的问题当然也要上上难度。

团队成员指出，一些高难度的生化问题，以往o1-preview都搞不定，这下让Pro mode来试试。

比如下面这道o1-preview曾“束手无策”的“猜蛋白质”问题：

只见提问后，Pro mode出现了一个“思考进度条”，大约53秒后模型给出了答案。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

进一步点击回答最上面的小框框，就可以在侧边栏展开推理细节，里面详细记录了模型的思考步骤。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

毕竟按照OpenAI的说法，o1（包括之前的preview版）在博士级科学问答上的表现是超过人类专家的。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

不过有一说一，Pro版200美元一个月的价格也是让网友们挺震惊的。

至于到底值不值这个价格，可能要等先试水的用户用上一段时间之后的反馈了。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

对了，团队这次也提到，后面将以API的形式为大家提供o1模型的一些功能，包括结构化输出、函数调用、图像API等。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

BTW，活动结束前，奥特曼特意cue思维链作者讲了一个笑话。

圣诞老人想用大语言模型来解决数学问题，结果任何提示词都不管用，你知道最后是怎么成功的吗？

好冷……

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

模型更强，也更加安全了

o1满血版发布的同时，技术报告也在OpenAI官网上线。

这份报告当中，Ilya的名字依然位列基础贡献者（Foundational Contributor）之中。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

在宣传页面当中，OpenAI公开展示了o1在数学、代码和博士级科学问答三类任务上的成绩。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

在此基础之上，OpenAI还进行了更加严苛的测试，每个问题会询问四次，模型必须四次全答对才能得分。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

除此之外，技术报告还展示了o1的多语言能力。

在包括中文在内的14种语言的MMLU测试中，o1的表现相比preview版均有程度不等的增强。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

这里插播一句，面对这种带陷阱的弱智吧问题，满血版o1依然是被成功蒙骗（手动狗头）。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

不过这份报告更多围绕着安全性展开讨论，内部及红队测试结果表明，整体上满血版o1在安全性与o1-preview接近。

如果和GPT-4o比，o1对有害内容的检测和拒绝能力也更强，并且在越狱测试中展现出更强的鲁棒性。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

在现实风险上，OpenAI和红队针对网络安全、生化和核威胁等情景对o1进行了测试，结果同样与o1-preview接近。

另外，OpenAI对o1和o1-preview的思维链推理过程进行了欺骗性分析，通过让模型解释其行为背后的思考，了解模型是否有隐瞒信息、操纵数据的倾向。

结果，o1-preview在26%的案例中会故意隐瞒信息操纵数据，而o1的比例降到了19%。

Two More Things

在发布会开始之前，就已经有网友从ChatGPT的JS代码中发现了Pro版的蛛丝马迹。

其中，200美元的价格以及o1 pro模式，还有对满血o1的不限量访问，都和这次发布对得上。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

另外，从这份JS代码中还能看到，在Team版本的相关位置，还出现了“GPT-4.5”。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

再顺便提一句，有网友让马斯克的Grok结合X上的推文预测了一下OpenAI都会发布些什么，其中第二条成功命中了此次发布的满血o1。

OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费1450/月

不知道接下来的11个发布日中，GPT-4.5是否会“如约而至”，Grok又能猜对多少个产品呢？

Tags:

上线

相关推荐

服务器被挤爆！可灵1.5版本正式上线：不加价升级1080P，4段视频一口气生成

2024-09-22

闲鱼将首次用上AI技术：“智能发布”“智能托管”年内上线

2024-09-18

通义将发布视频生成大模型，预约页面悄然上线

2024-09-14

阿里通义将发布视频生成大模型预约页面已上线

2024-09-14

AI助攻开学季，百度文心智能体平台上线2000+教育智能体

2024-09-05

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

百度：在AI赋能的搜索变革中我们占据领先地位

微信的AI搜索野心与腾讯的“双模型”押注

2025-02-18 09:49

钉钉AI企业搜索面向所有用户免费开放

2025-02-21 14:50

谷歌AI大牛吴永辉加盟字节跳动负责AI基础研究探索工作

2025-02-18 18:25

eBay宣布与OpenAI合作将人工智能引入其电子商务平台

2025-02-20 11:31

中国初创公司DeepSeek挑战全球人工智能巨头OpenAI

2025-02-22 11:32

任意舞蹈任意学！宇树机器人又进化了：传Meta将采购

2025-02-18 18:23

吃掉全球77％晶圆！NVIDIAAIGPU恐怖如斯：中国被严重打压

2025-02-20 18:22

百度有史以来最强大模型！李彦宏：文心大模型4.5系列将开源

2025-02-19 18:21

谷歌豪华阵容打造AI科学家，用测试时间计算加速科学发现

2025-02-21 09:46