o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 最新资讯 > o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

新火种 2024-11-04

o1满血版泄露了！

没想到，OpenAI还搁那儿“今年一定”呢，不少网友已经率先上手体验到了（doge）。

事情是酱婶的：有网友发现，OpenAI已经在ChatGPT官网上部署了完整版o1，大家伙儿还都能卡bug直接用！

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

最初发现此事的网友，测试确认泄露模型具有奥特曼所说的图像推理能力。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

△图源：@legit_rumors

而日志也显示该模型就是o1本模。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

于是，赶在OpenAI出手修复之前，网友们抓紧大玩特玩了一波——

满血o1到底有多牛

和已经发布的o1-preview、o1-mini最直观的不同是，泄露出来的o1支持上传附件。

这也就意味着，终于能测测o1的多模态能力了。

网友们也不说废话，直接上强度，普特南数学竞赛的证明题截图一贴，甩给满血o1。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

思考了18秒之后，o1给出答案：18。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

答案正确：

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

再来一道更复杂的，虽然在识图上遇到了一点小问题，但还是稳稳做对了。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

在如此惊艳表现之下，似乎正确识别人类史上首张黑洞照片也不算什么了（doge）。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

不过嘛，也不是没有翻车案例。比如，让大模型数数图里有多少个三角形。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

ID为anagh的网友，给泄露模型和GPT-4o做了个同屏对比。

4o速度很快，给出了错误答案19。

而满血o1花了1分39秒，狂刷一堆token……给出了不同的错误答案：29。

正确答案是24。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

这个bug现在已经修复了。不过，有意思的是，这次模型泄露，持续了整整3个小时。

不小心还是故意的？

有网友犀利地点出，这事儿看上去不是“不小心”，而是“精心策划”：

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

不少网友赞同这样的观点：

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

而由于一切看上去已经部署就绪，甚至有人猜测，o1完整版的正式上线时间就在未来一周之内。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

值得注意的是，就在这次泄露事件之后，奥特曼马上在上开始了自己的表演：

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

好家伙，都已经吹上o2的风了（还假装上错号……）。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

至于为什么是这个时间……

那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛（doge）。

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

参考链接：[1]https://x.com/legit_rumors/status/1852625385801859321[2]https://x.com/koltregaskes/status/1852657291469709626[3]https://x.com/anaghnairr/status/1852668741751919016

— 完 —

Tags:

上线图片

相关推荐

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

2024-11-04

ChatGPT终于变AI搜索引擎了！网页/手机/桌面版同时上线，即将人人可用

2024-11-01

鹅厂版AI笔记悄悄上线，微信公众号优质内容秒变专属知识库，实测在此

2024-10-30

鹅厂版AI笔记悄悄上线秒变专属知识库实测在此

2024-10-29

秒出MG动画|新版秒出全新上线，更丝滑的体验~

2024-10-26

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

豆包灰测深度思考模型，特斯拉FSD功能在华上车|蓝媒GPT

联想AIPC全家桶接入DeepSeek，本地跑70B大模型，离线也能写总结

2025-04-02 11:28

AI剧本风控项目启动天使轮融资

2025-04-03 11:21

AI图像生成平台「LiblibAI」获数亿元融资

2025-04-02 11:27

【VIP机会日报】机器人概念再度走强栏目追踪行业动态提及产业相关公司强势涨停

2025-04-03 13:22

紫光国微：在特种集成电路业务方面强化业务能力、提升发展质量

2025-04-03 11:26

联芸科技：我司已量产的商用产品暂未应用于无人驾驶

2025-04-03 11:27

L3上路倒计时？工信部加快推进智能网联车规划产业基建+商业化迎来关键节点

2025-04-01 11:22

资讯出海，扬帆起航正当时！

2025-04-03 13:23

ChatGPT引爆“吉卜力”风格图像生成浪潮同时激发AI违法争议

2025-03-28 11:21