号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。
按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来编写一个找松鼠的网页游戏。
这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在3秒后找到出现的松鼠。这类游戏的逻辑相对复杂,更考验OpenAI o1的逻辑推理能力。
官方还表示,相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。
比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。
不过,经过实测,OpenAI o1依然无法解决“9.11和9.8哪个大”的经典难题,严重扣分。
因为9.11和9.8哪个大这个问题,之前AI大模型集体失智,所以....
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。