节省 - 新火种

首页 > 节省

节省

已节省数百万GPU小时！字节再砍MoE训练成本，核心代码全开源

字节对MoE模型训练成本再砍一刀，成本可节省40%！刚刚，豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。COMET已应用于字节的万卡训练集群，在真实的生产环境中，累计帮助节省了数百万GPU小时。
2025-03-12 09:44
腾讯披露最新大模型训练方法，可节省50%算力成本

21世纪经济报道记者白杨北京报道随着大模型时代到来，模型参数呈指数级增长，已达到万亿级别。与此同时，大模型也逐渐从支持单一模态、单一任务发展为支持多种模态下的多种任务。在这种趋势下，大模型训练所需算力巨大，远超单个芯片的处理速度，而多卡分布式训练通信损耗巨大。如何提高硬件资源利用率，成为影响国产大
2023-11-29 11:33
中国一汽申请神经网络专利，可快速预测节省大量时间成本

据国家知识产权局公告，中国第一汽车股份有限公司申请一项名为“一种基于神经网络的行人头部碰撞伤害预测方法“，公开号CN117131731A，申请日期为2023年8月。专利摘要显示，本发明涉及一种基于神经网络的行人头部碰撞伤害预测方法，
2023-12-01 15:53
生成式AI出版学术图书实验显示：节省时间潜力大人工指导很重要

中新网北京10月18日电施普林格·自然(Springer Nature)10月18日向媒体发布信息称，继2019年出版世界上第一本由机器生成的科研图书之后，施普林格·自然最新又授权作者使用生成式人工智能(AI)预训练模型GPT并将其作为集成工作流程的一部分出版一本学术图书，这项创新实验显示，生成式
2023-10-23 08:30
大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现，这两步都不是必要的？？？新论文指出，预训练完成刚出炉的基础模型已经掌握了遵循指令的能力，只需要提示工程就能引导出来，引起开发社区强烈关注。因为RLHF的成本非常高训练还不
2023-12-07 09:06
10分钟节省数万元，“正确掌握AI，在电商领域，一个人约等于一个战队”

从2019年开始，Anna一直在国内的跨境电商平台兼职做假发模特，在今年3月之前，她一直有着比较稳定的接单量。但在最近，她的接单量开始骤降——跟她抢饭碗的正是在国内外掀起巨浪的ChatGPT。ChatGPT是怎么把模特的饭碗也抢走的？从事美妆、假发等品类的跨境电商资深卖家钱大柱在接受《每日经济新闻》
2023-11-02 12:41
谷歌更新Transformer架构，更节省计算资源！50%性能提升

谷歌终于更新了Transformer架构。最新发布的Mixture-of-Depths（MoD），改变了以往Transformer计算模式。它通过动态分配大模型中的计算资源，跳过一些不必要计算，显著提高训练效率和推理速度。
2024-04-07 11:50
使用AI一年半，IBM为HR部门节省12000小时

不无讽刺意味的是，AI虽然加快了HR部门的效率，最终却有可能让很多HR员工失业。
2023-11-23 12:01
中国联通：针对DeepSeek系列模型进行了优化升级平均节省30%推理计算量

财联社2月26日讯，中国联通近日宣布，继1月开源元景“自适应慢思考”思维链大模型后，又针对DeepSeek系列模型进行了“自适应慢思考”优化升级，平均可节省约30%的推理计算量，现已开源。这也是目前业界首个对DeepSeek系列思维链模型做“自适应慢思考”优化升级的工作。“以我为主，为我所用”的开放
2025-02-28 11:22
腾讯披露最新大模型训练方法可节省50%算力成本

随着大模型时代到来，模型参数呈指数级增长，已达到万亿级别。与此同时，大模型也逐渐从支持单一模态、单一任务发展为支持多种模态下的多种任务。　　在这种趋势下，大模型训练所需算力巨大，远超单个芯片的处理速度，而多卡分布式训练通信损耗巨大。如何提高硬件资源利用率，成为影响国产大模型技术发展和实用性的重要前提
2023-11-24 11:00