有望替代谷歌成全球新范式!阿里云重磅论文提出新一代AI网络架构
5月14日消息,在网络通信领域的国际顶会SIGCOMM2024上,阿里云6篇论文被收录。
其中最引人注目的是介绍其最新一代智算集群网络架构HPN 7.0的论文,该论文也是SIGCOMM历史上首篇关于AI智算集群网络架构的论文。
据介绍,HPN 7.0架构是为满足AI时代对网络高性能需求而研发的,它创新性地设计了“双上联+多轨+双平面”的网络架构。
同时还配备了51.2Tbps单芯片以太网交换机和400G高性能网卡,以及自研的Solar-RDMA和ACCL通信库。
这些技术的应用使得HPN 7.0能够实现单层千卡、两层万卡的高性能和高稳定互联。
自2023年9月起,HPN 7.0已在阿里云进行大规模部署,显著提升了大模型训练性能,并大幅提高了智算网络的整体稳定性。
基于HPN 7.0架构训练的通义千问2.5版本大模型,在理解能力、逻辑推理、指令遵循、代码能力等方面均有显著提升,中文性能全面赶超GPT-4 Turbo。
阿里云基础设施网络负责人蔡德忠表示,HPN 7.0的推出是阿里云自2017年以来在端网融合可预期网络技术体系探索上的又一里程碑。
这一全新的网络集群架构创新,有望成为下一代AI高性能网络架构的新范式,与谷歌的Jupiter网络相媲美,后者曾被SIGCOMM收录并成为业界经典。
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。