“AI教母”团队用不到50美元训练出新模型，蒸馏法加速大模型训练和应用平民化

首页 > AI资讯 > 最新资讯 > “AI教母”团队用不到50美元训练出新模型，蒸馏法加速大模型训练和应用平民化

新火种 2025-02-07

据媒体报道，“AI教母”李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。

s1诞生标志着高效AI模型训练的新时代。研究人员表示，s1是通过蒸馏法由谷歌推理模型Gemini2.0FlashThinkingExperimental提炼出来的。这种方法的核心在于如何有效地传递知识，使得小模型不仅具备大模型的推理能力，而且在资源消耗上表现得极为优越。

李飞飞团队的这一突破，不仅展现了技术的前瞻性，而且为更多科研机构和创业公司提供了借鉴的蓝本。同时，s1所展现出价格优势的背后，其实也反映了未来AI领域的一个重要趋势：大模型的训练和应用将愈发平民化。

此前DeepSeek发布一系列DeepSeek-R1模型，探索了将R1的推理能力蒸馏到更小模型中的潜力，通过知识蒸馏技术，成功将大模型的推理能力传递给小模型，实现了小模型在推理任务上的显著提升，引领了小模型的发展方向。

本文源自：金融界

Tags:

机器学习模型教母

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。