打破美国AI公司霸榜,上交AI数学开源模型阿贝尔排行榜首
以 ChatGPT 为代表的大模型产品引领了一场新的产业革命,激发了国内外各机构积极投入相关技术研究的热情。在过去几个月的技术竞争中,国产大模型在文本理解和知识理解任务方面表现出色,堪称一位优秀的 “文科生”。
然而,在复杂数学推理计算、物理建模、科学发现等 “理科” 领域,大模型的研究尚未达到令人满意的水平,与美国顶尖科技公司(OpenAI、Google、Anthropic)相比,仍存在很大差距。例如,在数学推理方面的权威评测集 GSM8K 和 MATH 上,美国 AI 公司一直占据前几名,突显了其领先地位。
在这样的背景下,上海交大生成式人工智能研究组 (GAIR) 积极攻克难关,研发并开源了数学计算大模型 “阿贝尔(Abel)”,在多个榜单上取得开源第一!是首个海内外高校团队推出的 SOTA 数学开源大模型。
项目主页:https://GAIR-NLP.github.io/abel开源模型:https://github.com/GAIR-NLP/abel“在还未回国前,我和 Meta 非常优秀的科学家合作了一篇叫做 LIMA 的工作,在那篇工作里我们仅使用 1000 个样本就可以训练模型使其在达到接近 GPT4 的水平。但是这种 “少即是多” 的思想并没有在所有的任务场景上都得到了验证,比如数学推理。这也成为当时的遗憾,使得我对如何让大模型学好数学充满了兴趣。”上海交大生成式人工智能研究组负责人同时也是阿贝尔项目的负责人刘鹏飞分享道。“Abel 是为了致敬挪威伟大数学家 尼尔斯・阿贝尔 (Niels Henrik Abel) 在代数和分析方面的开创性工作而创建的,代数也是现在模型相对擅长解决的,不过,我们还有很长的路要走。”
模型表现
表 1:
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。