首页 > AI资讯 > 最新资讯 > 李飞飞实验室2025AI报告出炉:中美AI模型差距近乎持平

李飞飞实验室2025AI报告出炉:中美AI模型差距近乎持平

新火种    2025-04-09

中美AI模型差距正在缩小。

由李飞飞联合领导,斯坦福大学以人为本人工智能研究所(HAI)最新发布了2025 AI Index,用整整456页追踪了2024年全球AI行业的发展趋势,并得出了这样的结论。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

至今,HAI已发布了8份(含本次)AI年度报告,不过今年的这份却尤为特殊。

这是我们迄今为止最全面的版本,人工智能对社会的影响从未如此明显。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

虽然报告信息量爆炸,但手快的网友已经提前为大家划了重点:

AI推理成本降低了280倍开源模型正在迎头赶上AI基准测试成绩飙升……

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

话不多说,下面我们详细展开报告中提到的一些重要结论。

中美AI模型差距正在缩小

从官网消息来看,鉴于报告内容较多,HAI直接为大家挑出了其中最重要的12个结论。

我们先来看与国内最相关的部分。

中美AI模型差距正在缩小

首先就是AI模型方面,中国模型虽然数量不及美国,但质量方面已迅速缩小差距。

报告显示,2024年美国机构一共开发了40个值得关注的AI模型,远高于中国开发的15个和欧洲的3个。

不过,中美模型之间的性能差异正在快速缩小。具体表现为,在MMLU和HumanEval等主要基准测试上,二者的性能差异由2023年的两位数缩小到2024年的接近相等。

同时,从中美模型过去一年在大模型竞技场中的表现也能看出这一追赶趋势:

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

当然,这一性能差距正在缩小的趋势也不局限于中美之间。

报告提到,排名第一和第十的模型之间的得分差距在一年内从11.9%降至5.4%,排名前两位的差距现在仅为 0.7%。

也就是说,顶尖模型之间的竞争越来越激烈。

顺带一提,国内在发表AI论文和推出AI专利方面继续保持领先地位。

中国是对AI最乐观的国家

其次是在对AI的态度方面,中国始终是全球主要国家和地区中最乐观的。

报告显示,2024年中国有83%的人认为AI产品和服务利大于弊,排在后面的是印度尼西亚(80%)和泰国(77%)。

相比之下,美国(39%)、加拿大(40%)等的乐观情绪远低于国内。

不过从整体趋势来看,自2022年以来,几个之前对AI持怀疑态度的国家乐观情绪增长显著,比如美国(+4%)、加拿大(+8%)、法国(+10%)等等。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

除了以上两点,还有一些AI整体趋势变化也值得关注。

AI基准测试成绩飙升,表现逐渐接近人类

一个比较符合大家日常感受的结论是:AI模型在各大基准测试上的得分越来越高了。

报告显示,研究人员在2023年引入了一些如今大家已耳熟能详的基准——MMMU、GPQA和SWE-bench,以此测试更高级AI模型的能力极限。

然而仅仅一年之后,从测试得分来看,其性能呈现大幅提升趋势,分别在MMMU、GPQA和SWE-bench上提高了18.8、48.9和67.3个百分点。

从整体趋势来看,AI各大能力表现逐渐接近人类,甚至在某些场景下,智能体能在限时编程任务中超越人类。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

推理成本下降了280倍,开源模型正在迎头赶上

另一个符合大家印象的趋势是:AI正变得更加高效、经济实惠和易于获取。

过去两年间,追求更具性价比的小模型逐渐成为一股潮流。

比如报告中提到的,在MMLU中得分超过60%的小模型:

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

数据显示,由越来越强大的小模型驱动,对于性能达到GPT-3.5水平的系统的推理成本,在2022年11月到2024年10月间下降了280倍。

遗憾的是,复杂推理仍然面临挑战。

截至目前,AI模型在国际数学奥林匹克竞赛问题等任务中表现出色,但仍无法很好应对PlanBench等复杂推理基准测试。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

不过与此同时,开源模型也在缩小与闭源模型的差距。

报告中特意提到,在某些基准测试中,它们一年内的性能差异就从8%减少到仅1.7%。

另外在硬件层面,成本每年下降30%,而能效每年提高40%。

以上趋势共同降低了人们获取高级AI的门槛。

AI正在融入日常生活,企业投资增长强劲

正是由于AI获取门槛降低,我们的日常生活也逐渐被AI改写。

报告显示,从医疗保健到交通运输,AI正迅速从实验室走向日常生活。

比如2023年,美国FDA批准了223种AI医疗设备,而2015年仅为6种。

另外在自动驾驶方面,美国最大的运营商之一Waymo每周提供超过15万次自动驾驶出行,而百度的经济型“萝卜快跑” (Apollo Go)自动驾驶出租车车队现在已在中国多个城市提供服务。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

整体而言,AI的应用落地正在加速。

2024年,有78%的组织报告自己正在使用AI,这比前一年增长了55%。

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280

当然,以上服务也离不开企业对AI的大力投资。

报告显示,2024年美国对AI的投资为1091亿美元,这几乎是中国(93亿美元)的12倍和英国(45亿美元)的24倍。

其中生成式AI尤其强劲,吸引了全球私营投资339亿美元,这一数字比2023年增长了18.7%。

BTW,除了上述主要结论,报告还提到了:

各国政府正在加强对AI的监管和投资;负责任的AI生态系统正在不断发展,但不均衡;目前有2/3的国家提供或计划提供K-12计算机科学教育(数量是2019年的两倍),其中非洲和拉丁美洲的进步最大;2024年近90%的知名AI模型来自工业界,高于前一年的60%。


相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。