英伟达发布最强AI芯片H200较H100性能提升近一倍
英伟达在2023年全球超算大会(SC23)上推出了一款最新的AI芯片H200,用于AI大模型的训练,相比于其前一代产品H100,H200的性能提升了约60%到90%。
H200是英伟达H100的升级版,与H100同样基于Hopper架构,主要升级包括141GB的HBM3e显存,显存带宽从H100的3.35TB/s增加到了4.8TB/s。
在大模型推理表现上,H200在700亿参数的Llama2大模型上的推理速度比H100快了一倍,而且在推理能耗上H200相比H100直接降低了一半。对于显存密集型HPC(高性能计算)应用,H200更高的显存带宽能够确保高效地访问数据,与CPU相比,获得结果的时间最多可提升110倍。
由于架构相同,H200将与H100在软件上相兼容,这意味着H200将具有H100的所有功能。英伟达宣称,H200在大模型Llama 2、GPT-3.5的输出速度上分别是H100的1.9倍和1.6倍。
英伟达加速计算总经理兼副总裁伊恩·巴克 (Ian Buck)称:“想要通过生成式AI和HPC应用创造智能,就必须使用大型、快速的GPU显存来高速、高效地处理海量数据。借助H200,业界领先的端到端AI超级计算平台的速度将会变得更快,一些世界上最重要的挑战,都可以被解决。”
过去,英伟达数据中心AI芯片通常两年更新一次芯片架构,最新芯片架构是Hopper。不过英伟达曾于上个月向投资人披露,由于市场对其AI芯片需求旺盛,公司将从每两年发布一次新架构转向每一年发布一次。 英伟达还向投资人称,其将于2024年发布基于Blackwell架构的B100芯片。
H200将于2024年第二季度出货。英伟达称,从明年开始,亚马逊云科技、谷歌云、微软Azure 和甲骨文云将成为首批部署基于H200实例的云服务提供商。
英伟达股价在周一美股交易时段上涨,且已连续第九个交易日上涨,创出2016年12月27日以来的最长连涨走势。今年以来,英伟达股价累计涨幅超过230%。
(文章来源:界面新闻)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。