年度世界互联网科技大奖公布自研Angel机器学习平台应对模型训练与推理挑战
11月19日,2024年世界互联网大会领先科技奖在乌镇发布,本年度共有20个具有国际代表性的项目获奖,整体入选率仅为7.4%,涵盖类脑计算、具身智能、6G、大数据、高性能芯片、AI机器学习平台等前沿领域。据了解,腾讯Angel机器学习平台获得本年度领先科技奖。
现场,腾讯公司副总裁蒋杰表示,在大模型时代,模型参数超过万亿,训练数据超过十万亿,如此庞大的规模,给模型训练和推理带来巨大挑战,腾讯全链路自研的Angel机器学习平台有效应对这些挑战,实现多个方面的性能效率提升。未来,腾讯也将继续投入底层技术自主研发,并通过开源共享,推动技术创新升级,让智能技术走入千行百业。
(腾讯公司副总裁蒋杰)
记者了解到,腾讯Angel机器学习平台针对万亿规模大模型分布式训练和推理、应用部署难的挑战,在网络互联、框架效率、平台规模三方面实现了突破。在通信方面,从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单节点带宽达到3.2T,相比于同类领先产品,性能提升30%,成本降低70%。
在效率方面,自研了训练/推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升2.6倍,推理速度提升2.3倍。在规模方面, 实现了单任务万卡的线性扩展,GPU集群加速比从50%提升到99%。
腾讯基于Angel机器学习平台全链路自研的混元大模型,在我国头部AI研发企业中率先采用混合专家模型 (MoE)结构,模型规模突破万亿,处于国内大模型“第一梯队”。11月初,腾讯推出业界最大参数规模的开源MoE模型混元Large,总参数量 389B,激活参数量52B ,上下文长度高达256K,其训练和推理均基于腾讯Angel机器学习平台。
(文章来源:广州日报)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。