首页 > 数学

数学

  • Kimi数学能力赶上o1后,月之暗面杨植麟分享行业思考

    OpenAI发布GPT5之前,中国大模型公司的下一步怎么走?11月16日,通用人工智能公司月之暗面创始人杨植麟分享了他的观点与思考。  现场,月之暗面旗下Kimi发布新一代数学推理模型 k0-math,是Kimi 推出的首款推理能力强化模型,也是杨植麟技术路线思考的直观体现。在他看来,行业接下来的重

  • 对话晞德求索CTO林锦坤:数学GPT如何击破求解器「围墙」?

    作为一门高度抽象化和具有逻辑推理特性的研究,数学建模似乎离我们很遥远。事实上,日常生活中运用到数学模型解决问题的事例俯拾皆是:打车系统里,算法会匹配距离乘客更近的司机、规划最快到达目的地的行程路线;购物平台上,算法会调配库存充足的出货仓、计算中途的运转站和物流配送车辆......对大部分人来说,使用

  • 首个AI高考全卷评测结果发布:最高分303数学全不及格

    19日讯,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名

  • 像搭乐高一样做数学定理证明题,GPT-3.5证明成功率达新SOTA

    中山大学和华为等机构的研究者提出了 LEGO-Prover,实现了数学定理的生成、整理、储存、检索和复用的全流程闭环。背景作为长链条严格推理的典范,数学推理被认为是衡量语言模型推理能力的重要基准,GSM8K 和 MATH 等数学文字问题(math word problem)数据集被广泛应用于语言模型

  • 第一个国产中文o1来了,直接数学竞赛题伺候!

    家人们,o1大模型,最近着实是有点火啊。就在今天,昆仑万维的Skywork o1首发中文逻辑推理能力,并开启了邀测。那一波实测,这不就得安排一下么。类似o1模型最大的特点就是其强悍的推理能力,因此,我们直接上一道AIME数学竞赛题,看看够不够“开门”。