数学 - 新火种

首页 > 数学

数学

像搭乐高一样做数学定理证明题，GPT-3.5证明成功率达新SOTA

中山大学和华为等机构的研究者提出了 LEGO-Prover，实现了数学定理的生成、整理、储存、检索和复用的全流程闭环。背景作为长链条严格推理的典范，数学推理被认为是衡量语言模型推理能力的重要基准，GSM8K 和 MATH 等数学文字问题（math word problem）数据集被广泛应用于语言模型
2023-11-01 15:16
阿里发布Qwen2-Math：数学推理全球第一，超越GPT-4o和Claude-3.5

阿里发布了Qwen2-Math（1.5B/7B/72B）系列，Qwen2-Math是一系列基于Qwen2 LLM构建的专门用于数学解题的语言模型，数学推理能力全球第一。在Math上的评测结果表明，最大
2024-08-21 10:43
研究论证GPT-4变笨了：数学能力雪崩，代码能力也变差了！

尤其是 GPT-4 求解数学问题的能力，可以说是雪崩式下降 —— 三月版 97.6% 的准确度到六月只剩 2.4%。
2023-09-07 11:48
仅需格式转换提升9%数学推理能力，上交开源新对齐方法ReAlign

大模型对齐新方法，让数学推理能力直接提升9%。上海交通大学生成式人工智能实验室（GAIR Lab）新成果ReAlign，现已开源。
2024-03-14 10:06
第一个国产中文o1来了，直接数学竞赛题伺候！

家人们，o1大模型，最近着实是有点火啊。就在今天，昆仑万维的Skywork o1首发中文逻辑推理能力，并开启了邀测。那一波实测，这不就得安排一下么。类似o1模型最大的特点就是其强悍的推理能力，因此，我们直接上一道AIME数学竞赛题，看看够不够“开门”。
2024-11-28 09:33
2023顶科协奖“智能科学或数学奖”得主：AI时代，人们又开始研究数学了

颁奖仪式现场数学，无疑是一门令许多学生头疼的学科。但2023年世界顶尖科学家协会奖“智能科学或数学奖”得主阿尔卡迪·涅米罗夫斯基和尤里·涅斯捷罗夫却说，“中国学生学数学，有很好的传统与文化。”11月6日，两位来沪领奖的俄裔数学家接受记者专访，畅谈数学学习与研究的现状，展望数学应用的前景。数学学习难？
2023-11-07 12:53
通义千问开源数学模型Qwen2-Math，数学能力超越GPT-4o

8月9日消息，阿里通义团队开源新一代数学模型Qwen2-Math，包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开源大语言模型Qwen2研发，旗舰模型 Q
2024-08-21 10:43
千亿级、数学专用，MathGPT大模型开始公测了

好未来推出数学领域千亿级大模型 MathGPT ，做好 AI 时代数学基础工作。国内大模型市场又迎来了一个新的「选手」，这次是数学专用大模型。
2023-09-07 12:54
刚刚，图灵奖揭晓！史上首位数学和计算机最高奖“双料王”出现了

刚刚，“计算机界最高荣誉”图灵奖揭晓——复杂性理论先驱、普林斯顿高等研究院教授艾维·维格森(Avi Wigderson)摘得。美国计算机协会（ACM）表示，表彰他对计算理论的基础性贡献，包括重塑人类对计算中随机性作用的理解，以及数十年来在理论计算机科学领域的领导地位。
2024-04-11 10:28
微软：两个AI相互纠错，数学再涨5分

奇月发自凹非寺新火种 | 公众号 QbitAI提升LLM数学能力的新方法来了——一个大模型不行，那就两个。让他们彼此合作，纠正对方的错误。这就是来自加州大学和微软研究院的最新研究成果：Flow-DPO。
2024-12-03 09:29