从阿里到Meta,为何AMD才是英伟达最强追赶者?【AI大师课2.2】
本期内容
本期课程我们来关注整个算力成本的构建。我们拆分了Meta24000张H100,其中托管成本为2.39亿美元,集群建设成本为9.1亿美元,电力成本为1.37亿美元。
在集群建设中,计算部分大约占65-70%,主要是购买GPU芯片,约占70%,还有一些1-2%用于控制的CPU。互联交换机占7-8%,以及其他配套设施,包括以太网、DPU、线缆等。此外,还有3%的存储和能源等其他费用,以及3%的其他业务费用,包括温控等。
当前,国内市场对液冷技术的关注度并不高,尽管液冷非常适合中国,因为巨头们不太愿意自己投入去做。下面这张图是我最早提出的,现在很多企业融资时都在使用这张图。这张图展示了AI芯片与传统芯片产业的区别。
AI芯片与传统的CPU或GPU完全不同,它根据用途天然分为四个象限,即四个场景,分别是云端或终端,训练或推理。英伟达在云端训练领域是绝对的领导者,这也是目前市场最大的部分,但其他领域也存在机会。
云端训练由于标准化程度高,最终可能会形成1-2个巨头垄断的局面,如果没有非市场化因素如制裁等,本质上最后可能会是一家垄断90%的份额,类似于CPU市场。
云端推理方面,所有巨头如亚马逊、微软,尤其是谷歌等公司都会自主研发推理芯片,用于自己应用。因为对于这些巨头来说,推理芯片的技术门槛没有训练芯片那么高,而且成本会降低很多。从2025年开始,我们会看到像Meta这样的公司,它们的自研推理芯片将正式推出,并在自己的数据中心大规模使用。
以上内容为「寻找下一个“英伟达”」课程第2章第2节的部分内容,吕伟老师将在本节课程后续内容中,梳理AI硬件的投资机会。对本期课程感兴趣的朋友,欢迎点击此处加入,学习本课程的完整内容。
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。