首页 > AI资讯 > 最新资讯 > 黄仁勋「看中」的14款人形机器人,国产机器人胜算几何?

黄仁勋「看中」的14款人形机器人,国产机器人胜算几何?

新火种    2025-02-07

近日,英伟达 CEO 黄仁勋在 CES 2025 的一场主题演讲中提到,「机器人技术领域,特别是人形机器人和通用机器人技术,即将迎来 ChatGPT 时刻般的突破。」在演讲中,黄仁勋公布了英伟达新推出的世界基础模型开发平台 Cosmos,并展示了加入 Cosmos 平台的 14 款人形机器人,其中近一半来自国内机器人公司。

本篇解读详细地盘点了 14 款人形机器人的基础参数信息、主要适用场景、核心亮点(相较于其他人形机器人不同的地方)、商业化情况以及背后的核心技术路线等情况。

目录

01. 为何实现「通用人形机器人」如此重要?机器人的 ChatGPT 时刻真的来了吗?

机器人技术一旦实现通用性意味着什么?最适合通用具身智能的形态会是人形吗?要想迎来通用机器人领域的「GPT」时刻,哪些因素才是核心关键?

02. 老黄选中的 14 款人形机器人:国产机器人梯队的胜算如何?海外机器人梯队情况如何?

黄仁勋展示的 14 款人形机器人都是什么「来头」?国产机器人厂商「突飞猛进」,占据近一半?国内外的各家机器人在技术路线上有何差异?

03. 老黄没带上台的机器人种子选手还有哪些?

在 CES 2025 展会上,还有哪些值得关注的机器人?

01 为何实现「通用人形机器人」如此重要?

1、黄仁勋认为通用机器人技术的重要性在于,能够创造出无需特殊环境即能适应「棕色地带」的机器人。同时,黄仁勋还在演讲中指出了未来对世界产生重要影响的三类机器人,分别为自主机器人、自动驾驶汽车和人形机器人。

2、实现机器人的「通用」非常重要。深度学习强化领域的大牛 Pieter Abbeel 曾表达机器人通用性的重要,「当机器人能够适应不同环境时,就会发生重大变革。」

① 传统的机器人需要针对特定的环境、任务,用某种固定的动作序列对机器人进行编程,只针对于结构化的环境有效。而当下,业内追求的通用机器人,能够在一个未设定具体规则、一切皆可变化的开放环境中解决问题。

3、同时,基于人形是否是最适合实现通用具身智能的形态,仍存在一些争议。清华大学交叉信息研究院院长姚期智认为,人形是最适合实现通用具身智能的形态。目前只有人类本身达到了真正的通用具身智能,因此人形机器人被视为最好的通用具身智能体。

4、据麦肯锡近期发布的一份报告预测,机器人行业的收入到 2040 年将增长至 1900 - 9100 亿美元,年均增长率高达 13%至 23%。机器人领域的潜力不言而喻。

5、同样,黄仁勋在其近 1 个半小时的 CES 2025 主题演讲上,重点讲到了对于「Physical AI」的看法。在此期间,黄仁勋公布了英伟达新推出的世界基础模型开发平台 Cosmos,并展示了加入 Cosmos 平台的 14 款人形机器人,其中有 6 款来自国内的机器人公司,8 款来自国外的机器人公司。

14 款人形机器人的基础情况一览:

02 机器人的 ChatGPT 时刻真的来了吗?

黄仁勋在演讲中提到,「机器人正在进入 ChatGPT 时刻」。但距离通用机器人领域的「GPT」时刻真的来临,还面临着几点需要克服的「关键难题」。

1、首先,是机器人的「大小脑」的大模型的架构还没有统一,各家仍在探索中,如大语言模型的技术路径、模仿学习与深度强化学习的技术路径以及空间模型的技术路径等。目前,尚没有哪条技术路径表现出明显的优势性。

① 具体而言,目前较为常见的架构主要有两种。一是将大语言多模态模型直接应用于机器人,并在此基础上增加一部分机器人底层的操作运动集等,使大语言模型能够进行调用,以完成相应任务,这已成为目前最为普遍的架构形式;二是如特斯拉等公司追求的更为端到端的解决方案,采用模仿学习的方式,通过人为采集大量的动作数据来训练机器人。但该方法的「scling law」还没有得到验证。

2、其次是,目前机器人的泛化性较差 ......

03 老黄选中的 14 款人形机器人,国产机器人梯队的胜算如何?

此次在 CES 2025 主题演讲上,出现在黄仁勋身边的 14 款人形机器人中,有 6 款机器人来自国内的机器人厂商。

远征 A2(智元机器人)

1、「远征 A2」是由智元机器人于 2024 年 8 月推出的一款智能交互服务机器人,主要场景适用于营销客服、展厅讲解、商超导览、前台接待、业务咨询等。8 月,与「远征 A2」同时发布的远征系列机器人还有「远征 A2-W」和「远征 A2-Max」两款,适用于柔性智造、重载特种作业等场景。

2、「远征 A2」全身具备超过 40 个主动自由度的关节和仿人的灵巧双手,能够模拟出丰富和复杂的人类工作。同时拥有一个可以持续学习的大脑,由大语言模型加持。此外,还具备多模态的感知,输入系统,可以通过视觉感知交互者的情绪。

① 在语音交互方面,远征 A2 机器人采用了语言大模型+RAG 构建企业定制业务知识库......

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。