50美元、26分钟！AI模型训练大突破？

首页 > AI资讯 > 最新资讯 > 50美元、26分钟！AI模型训练大突破？

50美元、26分钟！AI模型训练大突破？

上海证券报 2025-02-08

　　近日，DeepSeek通过显著降低AI大模型的训练和推理成本，引起了市场的广泛关注。就在市场各方蜂拥追捧DeepSeek之际，有一个训练成本更低的模型似乎正在浮出水面。

　　2月6日，记者综合外媒报道和李飞飞等学者论文获悉，斯坦福大学和华盛顿大学的人工智能研究人员仅使用了16张英伟达H100 GPU和26分钟就训练出了一个AI推理模型，其云计算费用成本还不到50美元。

　　公开信息显示，这个名为s1的模型在数学和编码能力的测试中表现与 OpenAI的o1和DeepSeek的R1等尖端推理模型相近。目前，s1模型以及用于训练它的数据和代码已在GitHub上发布。

　　s1的研发团队表示，他们从一个现成的基础模型开始，通过蒸馏（distillation）对其进行微调，即通过学习别的AI模型的回答来获取其逻辑推理能力。

　　论文显示，推理模型可以通过相对较小的数据集和一种叫做监督微调（SFT）的过程进行蒸馏。在这一过程中，模型被要求模仿数据集中的某些行为。

　　而SFT往往比DeepSeek用于训练R1模型的大规模强化学习方法更便宜。参与该项目的斯坦福大学研究员Niklas Muennighoff表示，如今，只要约20美元就能租到所需的计算资源。

　　s1模型项目中的李飞飞在业内被称为“AI教母”（godmother of AI），是斯坦福大学计算机科学系首任红杉讲席教授，曾于2013年至2018年担任斯坦福大学人工智能实验室主任。李飞飞还曾在2017年1月至2018年9月担任谷歌副总裁兼谷歌云人工智能、机器学习首席科学家。

　　据悉，李飞飞在2024年创立了World Labs公司，融资金额达2.3亿美元。该公司是一家空间智能AI公司，致力于构建能够感知、生成和与3D世界交互的大世界模型（LWM）。其目标是将AI模型从2D像素平面提升到完整的 3D虚拟和现实世界，赋予AI与人类一样丰富的空间智力。World Labs的估值已超过10亿美元，并预计将在2025年推出首批产品，或将应用于机器人、游戏等行业。

　　作者：郑维汉

（文章来源：上海证券报）

Tags:

深度学习模型美元

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

50美元、26分钟！AI模型训练大突破？

不让视觉语言模型「盲猜」，性能竟直接提升一倍？

天冕科技再获专利—基于深度学习算法和图像分割技术的裸露图片检测方法

汇量科技上半年营收6.38亿美元，机器学习智能产品带来流水贡献超60%

SAS被Forrester评为AI和机器学习平台领域的领导者

【明日主题前瞻】华为（深圳）全球具身智能产业创新中心将启动运营

热门文章

1100公里只需充一次电：全新小鹏G6全系标配5C超充AI电池

国家超算互联网上线阿里开源模型接口服务华为正式组建医疗卫生军团

智元发布智元通用具身基座大模型GO-1人形机器人向通用化、开放化、智能化方向加速迈进

Manus背后的基础大模型首次公布！基于美国Claude和阿里Qwen开发

宇树“人形机器人，机器狗”们正成为展会营销新宠

讯飞输入法致歉：已修订规则，输出内容权利归用户所有

全国政协委员、润泽科技董事长周超男：AI治理+智慧陪护体系，破解“一老一小”难题

巨星科技：我司主营业务不涉及物流机器人

券商加紧“瘦身”，撤并动作密集，13家券商裁撤38家分支机构