英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 行业动态 > 英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

新火种 2024-03-19

AI春晚GTC开幕，皮衣老黄再次燃爆全场。

时隔两年，英伟达官宣新一代Blackwell架构，定位直指“新工业革命的引擎” ，“把AI扩展到万亿参数”。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

作为架构更新大年，本次大会亮点颇多：

宣布GPU新核弹B200，超级芯片GB200Blackwell架构新服务器，一个机柜顶一个超算推出AI推理微服务NIM，要做世界AI的入口新光刻技术cuLitho进驻台积电，改进产能。……

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

8年时间，AI算力已增长1000倍。

老黄断言“加速计算到达了临界点，通用计算已经过时了”。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

老黄这次主题演讲题目为《见证AI的变革时刻》，但不得不说，英伟达才是最大的变革本革。

GPU的形态已彻底改变

Blackwell新架构硬件产品线都围绕这一句话展开。

通过芯片，与芯片间的连接技术，一步步构建出大型AI超算集群。

4nm制程达到瓶颈，就把两个芯片合在一起，以10TB每秒的满血带宽互联，组成B200 GPU，总计包含2080亿晶体管。

没错，B100型号被跳过了，直接发布的首个GPU就是B200。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

两个B200 GPU与Grace CPU结合就成为GB200超级芯片，通过900GB/s的超低功耗NVLink芯片间互连技术连接在一起。

两个超级芯片装到主板上，成为一个Blackwell计算节点。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

18个这样的计算节点共有36CPU+72GPU，组成更大的“虚拟GPU”。

它们之间由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum™-X800以太网平台连接，可提供速度高达800Gb/s的网络。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

在NVLink Switch支持下，最终成为“新一代计算单元”GB200 NVL72。

一个像这样的“计算单元”机柜，FP8精度的训练算力就高达720PFlops，直逼H100时代一个DGX SuperPod超级计算机集群（1000 PFlops）。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

与相同数量的72个H100相比，GB200 NVL72对于大模型推理性能提升高达30倍，成本和能耗降低高达25倍。

把GB200 NVL72当做单个GPU使用，具有1.4EFlops的AI推理算力和30TB高速内存。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

再用Quantum InfiniBand交换机连接，配合散热系统组成新一代DGX SuperPod集群。

DGX GB200 SuperPod采用新型高效液冷机架规模架构，标准配置可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。

此外还支持增加额外的机架扩展性能。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

最终成为包含32000 GPU的分布式超算集群。

老黄直言，“英伟达DGX AI超级计算机，就是AI工业革命的工厂”。

将提供无与伦比的规模、可靠性，具有智能管理和全栈弹性，以确保不断的使用。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

在演讲中，老黄还特别提到2016年赠送OpenAI的DGX-1，那也是史上第一次8块GPU连在一起组成一个超级计算机。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

从此之后便开启了训练最大模型所需算力每6个月翻一倍的增长之路。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

GPU新核弹GB200

过去，在90天内训练一个1.8万亿参数的MoE架构GPT模型，需要8000个Hopper架构GPU，15兆瓦功率。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

如今，同样给90天时间，在Blackwell架构下只需要2000个GPU，以及1/4的能源消耗。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

在标准的1750亿参数GPT-3基准测试中，GB200的性能是H100的7倍，提供的训练算力是H100的4倍。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

Blackwell架构除了芯片本身外，还包含多项重大革新：

第二代Transformer引擎

动态为神经网络中的每个神经元启用FP6和FP4精度支持。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

第五代NVLink高速互联

为每个GPU 提供了1.8TB/s双向吞吐量，确保多达576个GPU之间的无缝高速通信。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

Ras Engine（可靠性、可用性和可维护性引擎）

基于AI的预防性维护来运行诊断和预测可靠性问题。

Secure AI

先进的加密计算功能，在不影响性能的情况下保护AI模型和客户数据，对于医疗保健和金融服务等隐私敏感行业至关重要。

专用解压缩引擎

支持最新格式，加速数据库查询，以提供数据分析和数据科学的最高性能。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

在这些技术支持下，一个GB200 NVL72就最高支持27万亿参数的模型。

而GPT-4根据泄露数据，也不过只有1.7万亿参数。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

英伟达要做世界AI的入口

老黄官宣ai.nvidia页面，要做世界AI的入口。

任何人都可以通过易于使用的用户界面体验各种AI模型和应用。

同时，企业使用这些服务在自己的平台上创建和部署自定义应用，同时保留对其知识产权的完全所有权和控制权。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

这上面的应用都由英伟达全新推出的AI推理微服务NIM支持，可对来自英伟达及合作伙伴的数十个AI模型进行优化推理。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

此外，英伟达自己的开发套件、软件库和工具包都可以作为NVIDIA CUDA-X™微服务访问，用于检索增强生成 (RAG)、护栏、数据处理、HPC 等。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

比如通过这些微服务，可以轻松构建基于大模型和向量数据库的ChatPDF产品，甚至智能体Agent应用。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

NIM微服务定价非常直观，“一个GPU一小时一美元”，或年付打五折，一个GPU一年4500美元。

从此，英伟达NIM和CUDA做为中间枢纽，连接了百万开发者与上亿GPU芯片。

什么概念？

老黄晒出AI界“最强朋友圈”，包括亚马逊、迪士尼、三星等大型企业，都已成为英伟达合作伙伴。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

最后总结一下，与往年相比英伟达2024年战略更聚焦AI，而且产品更有针对性。

比如第五代NVLink还特意为MoE架构大模型优化通讯瓶颈。

新的芯片和软件服务，都在不断的强调推理算力，要进一步打开AI应用部署市场。

当然作为算力之王，AI并不是英伟达的全部。

这次大会上，还特别宣布了与苹果在Vision Pro方面的合作，让开发者在工业元宇宙里搞空间计算。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

此前推出的新光刻技术cuLitho软件库也有了新进展，被台积电和新思科技采用，把触手伸向更上游的芯片制造商。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

当然也少不了生物医疗、工业元宇宙、机器人汽车的新成果。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

以及布局下一轮计算变革的前沿领域，英伟达推出云量子计算机模拟微服务，让全球科学家都能充分利用量子计算的力量，将自己的想法变成现。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

One More Thing

去年GTC大会上，老黄与OpenAI首席科学家Ilya Sutskever的炉边对谈，仍为人津津乐道。

当时世界还没完全从ChatGPT的震撼中清醒过来，OpenAI是整个行业绝对的主角。

如今Ilya不知踪影，OpenAI的市场统治力也开始松动。在这个节骨眼上，有资格与老黄对谈的人换成了8位——

Transformer八子，开山论文《Attention is all you need》的八位作者。

他们陆陆续续已经悉数离开谷歌，其中7位投身AI创业，有模型层也有应用层，有toB也有toC。

这八位传奇人物既象征着大模型技术真正的起源，又代表着现在百花齐放的AI产业图景。在这样的格局中，OpenAI不过是其中一位玩家。

而就在两天后，老黄将把他们聚齐，在自己的主场。

英伟达新核弹B200发布，一台服务器顶一个超算，AI推理30倍加速

要论在整个AI界的影响力、号召力，在这一刻，无论是“钢铁侠”马斯克还是“奥特曼”Sam Altman，恐怕都比不过眼前这位“皮衣客”黄仁勋。

……

Tags:

英伟核弹

相关推荐

G42与英伟达合作开发气候技术

2024-09-20

关注o1必备GitHub仓库，上线3天狂揽1.5k星！英伟达工程师出品！

2024-09-20

“AI教母”李飞飞公司获2.3亿刀融资，AMD英特尔英伟达旗下公司参投

2024-09-19

黄仁勋：必要时英伟达会弃用台积电

2024-09-19

人工智能概念股涨跌各异，英特尔涨超6.3%，特斯拉、英伟达、苹果则至多跌约3%

2024-09-17

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

百度：在AI赋能的搜索变革中我们占据领先地位

微信的AI搜索野心与腾讯的“双模型”押注

2025-02-18 09:49

钉钉AI企业搜索面向所有用户免费开放

2025-02-21 14:50

谷歌AI大牛吴永辉加盟字节跳动负责AI基础研究探索工作

2025-02-18 18:25

eBay宣布与OpenAI合作将人工智能引入其电子商务平台

2025-02-20 11:31

中国初创公司DeepSeek挑战全球人工智能巨头OpenAI

2025-02-22 11:32

任意舞蹈任意学！宇树机器人又进化了：传Meta将采购

2025-02-18 18:23

吃掉全球77％晶圆！NVIDIAAIGPU恐怖如斯：中国被严重打压

2025-02-20 18:22

百度有史以来最强大模型！李彦宏：文心大模型4.5系列将开源

2025-02-19 18:21

谷歌豪华阵容打造AI科学家，用测试时间计算加速科学发现

2025-02-21 09:46