面向大模型训练,腾讯发布高性能计算集群:整体性能提升3倍

在百度、阿里之后,腾讯(0700.HK)高调宣布入局大模型“混战”,发布号称国内性能最强的大模型计算集群。
4月14日,腾讯云发布新一代HCC(High-Performance Computing Cluster)高性能计算集群。该集群采用腾讯云星星海自研服务器,搭载英伟达最新代次H800 GPU,服务器之间采用3.2T互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。
实测显示,腾讯云新一代集群的算力性能较前代提升高达3倍。去年10月,腾讯完成首个万亿参数的AI大模型:混元NLP大模型训练。在同等数据集下,将训练时间由50天缩短到11天,如果基于新一代集群,训练时间将进一步缩短至4天。
一位接近腾讯人士告诉澎湃新闻记者,此次发布的高性能计算集群的亮点有两方面,第一在于搭载H800 GPU。公开资料显示,H800为英伟达旗下最先进的芯片之一,对人工智能研发极为重要,其算力超过旗舰芯片A100三倍,这也是国内首次发布搭载H800的大模型产品。

第二在于网络层面,腾讯发布自研的星脉网络能提供3.2T通信带宽,为业内最高数据。腾讯表示,搭载同样的GPU卡,3.2T星脉网络相较前代网络,能让集群整体算力提升20%,使得超大算力集群仍然能保持通信开销比和吞吐性能。并提供单集群高达十万卡级别的组网规模,支持更大规模的大模型训练及推理。

存储层面,几千台计算节点同时读取一批数据集,需要尽可能缩短加载时长。腾讯云自研的文件存储、对象存储架构,具备TB级吞吐能力和千万级IOPS,满足大模型训练的大数据量存储要求。
算力的突破无疑是此次腾讯发布大模型的亮点。腾讯云异构计算产品总监宋丹丹在接受澎湃新闻采访时曾透露,目前大模型处于训练需求的爆发期,行业需要的是可扩缩容的高性能算力,并且对算力的稳定性要求很高,必须能够稳定交付、稳定计算。
在生成式AI的布局方面,去年4月,腾讯已对外披露“混元”AI大模型的研发进展。据了解,混元AI大模型完整覆盖了NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业模型,目前,腾讯混元AI大模型,已经覆盖自然语言处理、计算机视觉、多模态等基础模型和众多行业、领域模型。
此前,腾讯多款自研芯片已经量产。其中,用于AI推理的紫霄芯片、用于视频转码的沧海芯片已在腾讯内部交付使用,性能指标和综合性价比显著优于业界。其中,紫霄采用自研存算架构,增加片上内存容量并使用更先进的内存技术,消除访存能力不足制约芯片性能的问题,同时内置集成腾讯自研加速模块,减少CPU等待时间。目前,紫霄已经在腾讯头部业务规模部署,提供高达3倍的计算加速性能,和超过45%的整体成本节省。
目前,腾讯云的分布式云原生调度总规模超过1.5亿核,并提供16 EFLOPS(每秒1600亿亿次浮点运算)的智算算力。未来,新一代集群不仅能服务于大模型训练,还将在自动驾驶、科学计算、自然语言处理等场景中充分应用。
值得注意的是,腾讯高管曾多次在公开场合谈到对生成式人工智能的布局。
此前在博鳌亚洲论坛2023年年会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生告诉澎湃新闻记者,腾讯正在研发类ChatGPT聊天机器人。
今年3月,腾讯总裁刘炽平在财报电话会上曾表示,希望沿着正确的路线踏实前进,不急于求成,先打好基础,再追求新进展,“腾讯推出的第一款大模型产品会经过多次迭代,对于我们来说最重要的一件事情,还是保证我们在开发大模型的时候,把这个模型做对做好,以及进行长线布局。”他提到,腾讯在人工智能方面要保证长线布局,不断优化混元大模型,希望未来推向市场的产品得到充分打磨,基础模型可以用来加强跨越所有产品线所提供服务。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。