300亿!亚马逊祭出AI赛道最大规模投资
导读
THECAPITAL
角逐 AI 军备赛,巨头们纷纷下场。
本文 4170 字,约 6 分钟
作者 | 郑伟 编辑 | 吾人
来源 | 融中财经
(ID:thecapital)
ChatGPT 一夜爆火,掀起了产业界对于 AI 大模型的追逐,也吹响了 " 百模大战 " 的号角。为了与 OpenAI 的 ChatGPT 抗衡,各方纷纷下注。电商巨头亚马逊近期也开始在 AI 领域频频发力,并向 OpenAI 的头号对手 Anthropic 豪掷了 40 亿美元(约合 292.34 亿元人民币)。而这项投资被认为是迄今为止亚马逊在生成式 AI 领域中最大的一项投资。
不过就在亚马逊宣布上述投资几天后,Anthropic 再次传出了融资动向。10 月 4 日,有消息称 Anthropic 尝试找谷歌以及其他投资人谈判,计划再募集 20 亿美元(约合 146.17 亿元人民币)的新资金,投后估值或预计达 200-300 亿美元之间。该公司的新估值将是今年 3 月 40 亿美元的 5 倍以上。让这家成立不到两年的 AI 初创公司风头一时无两。
01
Anthropic 什么来头
受到谷歌、亚马逊青睐的 Anthropic 究竟有何背景?先来参考一下中文通用大模型综合性评测基准 SuperCLUE 发布的 9 月榜单。测试结果显示,Anthropic 推出的 Claude 2 总分仅次于 OpenAI 的 GPT-4 和 GPT-3.5,位列第三。
9 月 SuperCLUE 总排行榜上 Claude 2 位列第三
(图片来自于 cluebenchmarks.com)
除了在社区榜单上的优势排名外,Anthropic 的创始团队也不一般。创始人 Dario Amodei 和 Daniela Amodei 兄妹俩,在创业前均来自 OpenAI,并在其中担任重要职位:Dario 是研究副总裁,Daniela 是安全政策副总裁。其中,Dario 早在 OpenAI 创立之初便加入了,堪称其元老级人物之一。另外几位如 Jared Kaplan、Sam McCandlish、Tom Brown 等核心研究员也都来自 OpenAI,并且均参与过 GPT-2 与 GPT-3 的开发。这些 GPT 系列产品的早期开发者在 2021 年成立了 Anthropic。
随着 ChatGPT 的发布,Anthropic 也不甘示弱,仅用两个月时间便推出了可与之对标的类 ChatGPT 产品—— Claude,又在 7 月初完成了 Claude 2 的升级,速度惊人。有业内测评显示,在综合性能上,Claude 2 与 GPT-3.5 相当,但与 GPT-4 仍存在差距。在文件上传、长文本处理上,Claude 2 优势明显,可将上下文处理的 token 数量扩展到 10 万个,相当于 7.5 万个英文单词。Claude 是 GPT-4 容纳 token 量的 3 倍,Claude 2 更可处理数百页技术文档,甚至是一本书。在逻辑与计算上,Claude 2 与 GPT-4 性能已不相上下,但代码生成和问题推理方面较弱。凭借着文本处理数量上的巨大优势,Claude 可与现阶段商用的大模型进行差异化竞争。
Anthropic 在技术圈认可度也很高,被认为是 OpenAI 的强劲对手,其致力于解决大语言模型现有的难点,并在 AI 安全技术、大模型的潜在危害性、大模型的可解释性等方面进行了大量研究。对此,Anthropic 提出了宪法式 AI 方法,为 AI 系统设定宪法原则,以区别于人类反馈强化学习 RLHF 方法,利于实现更精确、更自动化的 AI 行为监督和控制。宪法式 AI 方法将避免未来 AI 过于智能,危及人类的情况,为人类监督和管理 AI 提供了方案。
基于上述在 AI 合规领域的独特优势,Anthropic 将 AI 安全技术视作其产品和解决方案的核心卖点之一。而这一商业定位与 OpenAI 等竞争对手有着显著区别,有可能在 AI 安全市场上抢到先机。
大模型是个吞金兽。为了持续迭代升级,Anthropic 希望未来两年能够再筹集 50 亿美元以训练更为复杂的模型,而此次亚马逊提供的 40 亿美元则将用于训练 Claude-Next —— Anthropic 的新一代大模型。新的大模型生成能力预计是当前最强 AI 的 10 倍。在应用上,Claude-Next 将以行业落地为主,目标是切入到十几个主要行业里。
此前 Anthropic 的年营收大约为 1 亿美元,随着与亚马逊的合作展开与深入,预计 2023 年的全年营收有望翻倍,增长至 2 亿美元,月营收约至 1700 万美元。到 2024 年底,Anthropic 年营收将有望达到 5 亿美元,是其估值的 1/200 倍,远远超出 OpenAI 的营收能力。
纵观业内,Anthropic 已成为当前硅谷最受资本欢迎的 AI 公司之一,整体估值接近 50 亿美元,仅次于 OpenAI,位列第二。
02
科技巨头间的 AI 角力
AI 大模型生成能力的每一次跃迁,对于算力的需求来说,都会呈现指数级增长。这势必引发对底层算力基础设施以及大量资金的追逐,也注定了这是一场科技巨头之间的惨烈大战。在这波 AI 浪潮下,美国科技巨头各逞其能,早已从单纯比拼大模型产品,延展至大模型结合算力的核心基础能力较量。对于亚马逊、微软、谷歌作为全球云服务的三大巨头而言,则是对云端计算与服务的实力新考验。另外,以特斯拉为代表的产业新势力,同样跃跃欲试,正在快速杀入战局。此时的竞争焦点逐步变为抢人(开发者和使用者)、抢资本和抢生态上。
从 AI 大模型迭代,到算力消耗,再到资本投入,吸引更多的开发者和使用者,形成 AI 云服务生态,最终收获商业回报。这是科技巨头们期待看到的良性循环。互联网时代,亚马逊在云服务领域处于领先地位,但在 AI 时代,由于在 AI 大模型和算力方面的滞后,其云服务市场份额面临着微软、谷歌的蚕食。微软与 OpenAI、谷歌与 DeepMind 的结合,使微软云 Azure、谷歌云 GCP 相比亚马逊 AWS,不只有了 AI 附加值,还有固定的业务出口,具备明显的竞争优势。这也成为亚马逊砸钱 Anthropic 的重要原因。
微软:2019 年投资了 OpenAI,2023 年初加码投资 100 亿美元,对 OpenAI 持股比重 49%,藉由 ChatGPT 热潮,微软完成了从最初的软件提供商到云服务商再到 AI 领导者的角色转换。同时,微软也试图将投资 OpenAI 的成功复制到其他 AI 初创企业,遂又战略性投了 Inflection AI、人工智能独角兽 Adep。同时与开源 AI 大模型 Meta/Facebook LlaMA 2 合作,在开源与闭源 AI 大模型两边下注,以提升微软云 Azure 竞争力。
谷歌:尽管有 DeepMind 与谷歌大脑合并,但仍然不影响谷歌对 Anthropic 持续下注。OpenAI 的强势崛起,令谷歌 " 鸭梨山大 ",今年 2 月便投了 Anthropic 4 亿美元,获得其 10% 股份;10 月初,传 Anthropic 与谷歌等投资方沟通,准备新一轮至少 20 亿美元融资。另外,谷歌继推出 LLM 聊天机器人 Bard 后,又宣布推出新版 AI 模型 Gemini,曾被认为是当前 GPT-4 最强劲的挑战者,但具体表现仍有待验证。
亚马逊:属于 AI 后发跟进者,5 年前错失了与 OpenAI 的合作机会,让微软成为这轮 AI 时代 " 尝鲜人 ";在对 Anthropic 投资中,又比谷歌晚了半年左右时间,今年 9 月下旬才向 Anthropic 初步投资 12.5 亿美元,之后最多可增投至 40 亿美元。目前,亚马逊持有 Anthropic 少数股权,Anthropic 估值尚未确定。如果亚马逊这笔投资顺利完成,将是其在 AI 相关领域里的最大一笔投资。
Meta:同样是 AI 后发者。Meta 从最初的投入元宇宙,转而布局 AI,宣布推出大型语言模型 LLM 的第一个版本 LLaMA。为扭转后发局势,Meta 抛出了 " 开源免费 " 的大招。与微软、谷歌先通过大模型优化现有产品(例如,微软将 OpenAI 接入 BING、Office 和 Azure,谷歌将 AI 技术应用在搜索、Workspace、地图等)不同,Meta 期待通过 AI 构建出更具前瞻性的元宇宙,野心不容小觑。
特斯拉 /xAI:马斯克曾是 OpenAI 创办人之一,但现在已退出并成立了新的 AI 公司 xAI,目标是了解宇宙真正的本质,试图要打造一个 " 好的通用型人工智能(AGI)"。2023 年 8 月 28 日,已上线 1 万块英伟达 H100 GPU 组成的超级计算机集群,将用于训练特斯拉自动驾驶系统 FSD 与其他各种 AI 应用。另外,特斯拉 Dojo 超级计算机将于 2023 年 7 月正式开始量产,进一步强化算力基础设施。特斯拉自研芯片 D1 作为 Dojo 核心,基于台积电 7nm 制程与先进封装技术打造,2023 年特斯拉在台积电投片量约 5000 片 12 寸晶圆,预计 2024 年将翻倍至 1 万片;未来,特斯拉有可能像亚马逊 AWS 云服务一样,将 Dojo 对外开放。
苹果:凭借着庞大的 Siri 群体,似乎对此次 ChatGPT 风潮较为不屑,在公开发言场合也比较不爱用 "AI" 一词,而是较常用机器学习(Machine Learning)。整体来看,苹果的 AI 技术倾向用来优化现有产品的基本功能。不过,库克近日也表示:"AI 在我们产品中几乎无处不在,公司正在进行的生成式 AI 研究,我们有很多工作要做。"
03
亚马逊的必然选择
具体再来看看亚马逊,其业务重点原本来自 AWS 的云计算业务,今年第二季度的收入增长了 12.16%,达到了 221.4 亿美元,但利润却下降了 6.12%,为 53.65 亿美元,经营利润率也下降了 4.72 个百分点,至 24.23%。尽管 AWS 的收入贡献不算太高,但利润贡献仍占到整体的大头。显然,亚马逊凭借着全球知名云计算服务供应商的身份,其云计算贡献的利润勉强弥补了其零售业务的微薄利润甚至亏损情况。
不过,随着 OpenAI 与微软的深度捆绑,带动了微软云计算业务 Azure 的市场占有率,对亚马逊形成了极大地威胁。在近期亚马逊业绩发布会上,CEO Andy Jassy 强调云计算业务在近几个季度的利润率大幅下滑,其规模效益似乎正逐渐减弱。但 AWS 仍是无可置疑的云基建领导者,且在客户数量、合作伙伴生态规模以及功能广度方面均处于领先位置,同时实现了最为强劲的经营表现。人们已经对生成式 AI 产生了极大的兴趣,但大多数人讨论最多的是应用层,特别是 OpenAI 通过 ChatGPT 所做的事情。而亚马逊在底层基座上的能力优势,显然可以成为新的发力点。
一般来说,对于希望应用大模型的企业,自研大模型需要数十亿美元以及多年的训练,这就需要大量资金和设备的支持才行。更为实惠的解决方案是,对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。据预测,到 2026 年,仅在企业技术方面,这种希望与 AI 结合的市场规模就将从 2023 年的近 430 亿美元上升到 980 亿美元(约合 7168.5 亿元人民币),市场空间巨大。
对此,今年 4 月亚马逊 AWS 发布了全托管基础模型服务 "Amazon Bedrock",以 " 关键基础设施提供商 " 的角色加入了大模型之战,希望从与微软云、谷歌云手中抢回更多市场份额。另外,亚马逊投资 Anthropic 的更深层次战略目标,包括 Anthropic 承诺使用 AWS 自研的 AI 专用芯片 Trainium 和 AI 加速器芯片 Inferentia 来构建平台,训练和部署未来的 AI 基础模型。事实上,AWS 和 Anthropic 均表示,他们将在未来的 Trainium 和 Inferentia 技术上进行合作。
Anthropic 还做出了长期承诺,计划通过 Bedrock 为 AWS 客户提供其未来几代 AI 基础模型的访问权限。相比于其他的一站式的大模型服务平台,Amazon Bedrock 的优势在于,用户可将其与亚马逊 AWS 平台的其余部分集成在一起,更轻松地访问存储在 Amazon S3 对象存储服务中的数据,并能够从亚马逊 AWS 访问控制和治理策略中受益。而 Amazon Bedrock 的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的 AI 算力和工具,再结合自己的数据开始构建生成式 AI 应用。
可以说,生成式 AI 改变了云计算服务的竞争格局,使得模型、框架和应用层面的能力提供变得更加重要,同时也促进了 " 模型即服务 " 新商业模式的出现。如 Amazon Bedrock 平台就将大模型变成了一项可直接使用的服务,利于推动各行各业用户方便地接入和应用生成式 AI。而商汤科技副总裁唐臻怡也曾向融中财经表示,未来企业可能无需自研大模型和训练,基于通用大模型的基模型底座,再结合自身行业数据,就能生出不同的参天大树。
目前,我国的 AI 大模型也再加速发展,百度的 " 文心一言 "、腾讯的 " 混元 "、科大讯飞的 " 星火 " ……数据显示,国内已至少 130 家公司研究大模型产品,其中通用大模型有 78 家。
随着大模型之战愈演愈烈,对亚马逊来说,投资 Anthropic 的钱已不可再省,甚至必须花出去,才能用来以小博大。而像谷歌、微软、亚马逊、英伟达这样的大厂投资者来说,为当红的 AI 企业支付高溢价,除了看重这些初创公司的技术前景和潜在市场外,如能顺便拓展下自身业务,增加云端服务器或自家芯片的使用,似乎就会达成一个双赢的局面。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。