o3智商高达157？每13333人中才有一个这么高，网友：编码分数无意义

首页 > AI资讯 > 最新资讯 > o3智商高达157？每13333人中才有一个这么高，网友：编码分数无意义

o3智商高达157？每13333人中才有一个这么高，网友：编码分数无意义

新火种 2024-12-25

从韦氏智商测试来看，如果 o3 的 IQ 真这么高，则称得上非常优秀。

OpenAI o3 的智商（IQ）竟然已经这么高了吗今天，Reddit 上一则热帖宣称「OpenAI o3 的 IQ 估计为 157」，并放出了一张数据图。

这意味着什么呢？人类中的 0.0075% 才能达到这个智商水平。更具体地说，每 13,333 个人中才出来一个这么高智商的。对比之下，GPT-4o 的 IQ 为 115、o1 preview 为 123、o1 为 135、o1 pro 为 139、o3 mini 为 141。

同样更具体地讲，GPT-4o 每 6 人中有一个、o1 preview 是每 16 人、o1 是每 93 人、o1 pro 是每 200 人、o3 mini 是每 333 人。

这些 IQ 是如何计算出来的呢？疑似原作者表示，他根据 Codeforces 编码评级来粗略地估计 IQ，并假设报名时竞争程序员排名前 15％，最后得出 GPT-4o、o1 preview、o1、o1 pro、o3 mini 和 o3 的 IQ 以及在人类中的排名。

图源：X@i_dg23此前还有人整理了 GPT-4o 与 o1 preview、o1、o3 在 2024 年 AIME 数学竞赛题目测试（AIME 2024）中的结果，从 13.4 到如今的 96.7，七个月的时间，数学能力实现了飞跃式提升。

图源：X@zbgoodwin仅从以上数据来看，AI 大模型的进步速度着实令人震惊。不过，毕竟开局一张图，o3 的 IQ 真的如表格中那么高吗？有人找到了「Tracking AI」中 o1 在挪威门萨智商测试（Mensa Norway）IQ 测试中的结果（为 133，与上面表格中估计的 135 相差不大），一定程度上验证了 o3 估计智商的可靠性。

图源：X@facundo_fagalde 图源：https://www.trackingai.org/home因此，未来等 o3 正式发布以后，它的挪威门萨智商测试结果将更加值得期待。

图源：X@AILeaksAndNewso3 IQ 如此之高，瞬间引爆了大家伙的评论热情。网友热评有网友直呼：「这张图是我见过最愚蠢的东西之一，这些数据根本不能代表智商。他们用编码表现的 z 分数代表智商。但编码不是智商测试，尤其是对于参加编码测试的 LLM 来说，它们对所有在互联网上分享的代码具有完美的数字记忆。o3 甚至无法解答我 6 岁和 8 岁的孩子可以解答的问题。」

也就是说，如果 LLM 针对编码测试进行训练，那么用编码表现分数代表智商是毫无意义的。但另一位网友表示：「并非如此，这是一种基于相关性的『转换』，但首先相关性有点弱，其次它转化为机器智能的效果尚不明确，即人工智能模型可能擅长编码，但在其他领域却不行。」

网友指出：「IQ 本身就是用来评估人类的指标。它评估与智力相关的特定技能，并理所当然地认为人类应该拥有许多其他特征。而这张图通过考虑人工智能可以擅长的单一指标来假设广义智能，他们甚至没有使用智商测试来得出这个结论，而是根据与智商相关的指标来推断。」

总的来说，人们对于所谓的「o3 智商高达 157」并不认可。或许，这又是一场炒作吧。

参考链接：https://www.reddit.com/r/singularity/comments/1hkxmi6/o3s_estimated_iq_is_157/

Tags:

大模型人中智商

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

o3智商高达157？每13333人中才有一个这么高，网友：编码分数无意义

近1.4万星，腾讯混元大模型开源成绩单公布，多次登顶开源趋势热榜

o3智商高达157？每13333人中才有一个这么高，网友：编码分数无意义

超三万种材料，近百万真实材料合成表征信息，LLM精准构建材料知识图谱MKG，登NeurIPS2024

火山引擎发布豆包视觉理解模型！龙头拿下连续两个20CM涨停，字节跳动旗下两大引擎A股合作商名单一览

华泰证券：豆包通用模型pro升级后全面对标GPT-4o，价格仅为后者1/8

热门文章

我国首个林草行业大模型研发成功

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！

蒙曼谈人工智能冲击：守住人类对于生活的感受

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利

浩物股份：公司暂未本地部署接入DeepSeek大模型

大消费高低切换加速涨价概念正逐步化身市场暗线

两会新华解码丨“强化宏观政策民生导向”透出什么深意？