豆包大模型提出稀疏模型架构，推理成本较MoE最高可降83%

首页 > 快讯 > 豆包大模型提出稀疏模型架构，推理成本较MoE最高可降83%

豆包大模型提出稀疏模型架构，推理成本较MoE最高可降83%

新火种 2025-03-12

每经北京2月11日电（记者杨昕怡）豆包大模型团队今日宣布，团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家模型）推理时高额的访存问题，推理速度较MoE架构提升2~6倍，推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law（规模定律），证明其不仅具备优异的Scaling特性，更在性能上超越了MoE。

每日经济新闻

Tags:

大模型模型豆包

科大讯飞申请注册「烟火大模型」商标

2025-02-05

“日日新”融合大模型夺双冠！一年2次成功配售，投资者买账商汤科技综合能力

2025-02-05

大模型时代，人机交互体验将被怎样重塑？

2025-02-05

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUXPro微调API可定制AI模型

2025-02-05

中达安新注册《工程监理行业垂直大模型应用软件V1.0》项目的软件著作权

2025-02-05

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。