首页 > AI资讯 > 最新资讯 > 人形机器人发展应该回归“常识”,建立“共识”

人形机器人发展应该回归“常识”,建立“共识”

新火种    2025-03-05

毋庸置疑,人形机器人是目前最火的产业和技术话题,人们期望着人形机器人能尽快走进千家万户,帮助人类进行危险或重复的工作,满足家政服务、养老陪伴等需求。人形机器人企业也受到了各地政府和产业界的密集关注,产业政策纷纷出台、资本市场风涌云动,产业链上下游整装待发,整个行业迎来了飓风。作为一个在机器人行业从业了近十年的老兵,也不得不提出一些担忧和看法,供诸君参考。

不管人形机器人有多火,不可否认的是人形机器人在国内的发展周期也就是两三年时间。一个几乎是一夜爆火的高技术产业,即便有一些泛AI或机器人的技术体系可以复用与融合,但能够立刻带来人类文明颠覆性的变化本质上并不符合事物的发展客观规律。无论DS、GPT的智能水平多么让人惊喜,目前依旧只是LLM(大语言)模型,离完全理解物理世界还有很大距离。无论马斯克多么激进地宣称要快速实现人形机器人量产,Optimus的近几次公开秀依旧离不开遥操作,技术的不确定性引起特斯拉的股价动荡下跌。因此,在笔者看来,人形机器人的技术和产业发展,依旧需要拥有常识和建立共识,这不是对行业的唱衰和技术保守,反而是希望行业能够健康长期的快速发展。

AGI的物理终极形态未必是足式人形,泛人形更有价值

国内头部的人形机器人公司,发布的产品按形态大致可分为两类。一类是对标Optimus的双足式的企业,如宇树、云深处、众擎等,这类机器人公司基本由原先的四足类机器人公司迭代升级,具有很好的技术继承和成熟的开发体系,迭代很快,尤其在下肢的运动控制能力进展惊人。另一类则是以轮式作为机器人的底座,着重开发大脑和双臂这些上半身软硬件能力的企业,以院校和海归类技术团队为主,如银河通用、星海图(智元机器人足式、轮式皆有)。很明显当前第一类企业更出圈,其表现出越来越强的能跑能跳的姿态运动控制能力,很显性,很让人看着兴奋。

人形机器人发展的最大底层逻辑是其是实现AGI(通用人工智能)的最佳载体,人形机器人概念的提出,让整个机器人行业看到了一套硬件打天下的可能。但这里需要讨论的是,足式的下半身到底是不是最优解?AGI的实现到底更需要上半身能力还是下半身?我想这在行业内远未形成共识。

就稳定性、能效、行走速度、静谧性而言,轮式结构的优越性显而易见,人类的进化未能形成轮结构,但轮式的确是比足式更优的行走几何结构,是实现AGI的物理最优解。以目前大家需求的应用场景思考,轮式、轮足式、履带式底座的泛人形的更具通用性。反而纯足式行走,只适合特殊的且对连续作业及静谧性要求不高的场景,比如需要低成本上下楼梯或跨越台阶且没有电梯、坡道辅助的场景。

位姿运动控制很重要,但更重要的是空间智能和决策智能

目前刷屏的人形机器人跑步、跳舞、打拳动作丝滑流畅,机器人本体结构运动能力进化很快。但需要理性认识的是,机器人本体的位姿协调控制,和机器人决策、执行人类工作任务是两个层面的智能要求。简单来说,双腿运动控制和双臂作业控制是小脑能力和大脑能力的区别,是低等生物和高等智能生物的区别,猎豹可以跑地很快,但不可能被训练完成人类的复杂工作,马戏团里的娱乐表演有动物就行,但目前进工厂工作和家政服务的还必须是人。

大模型未来的能力被寄期望于帮助人形机器人实现具身智能,但目前看来还在早期阶段,甚至目前基于scaling law的LLM大模型开发是否是实现AI智能体的终极技术路径,也是不确定的。人类的智能水平是一种生物智能的表现,其有当下算力智能远不及的端侧效率、多模态感知和实时建模能力、自学习推理和感性意识决策能力,而目前语言大模型的不可解释性和幻觉,对物理空间的弱理解,以及对能耗、算力的要求,都远达不到支撑端侧人形机器人的作业泛化能力。

空间智能应该是人形机器人泛化应用的基础,人形机器人很难在不理解物理世界的情况下能够准确掌握人类意图并完成作业任务。24年AI教母李飞飞教授创业的空间智能方向让人惊喜,这或许是未来AI+机器人发展的元要素。

即便如此,在空间智能的基础上,人形机器人应用的终极还面临决策智能的挑战,这是更高维度的任务层处理机制,无人驾驶这样的单任务系统都还未实现,人形机器人可能面对的是广域的多任务复杂系统,具身智能实现又谈何容易?

人形机器人的硬件没有颠覆性创新,人形机器人厂家首先应该是一家AI公司

人形机器人从底层硬件架构看,实际并没有颠覆性突破,也是驱控、电机、传感器、电池、算力等模块的匹配选型和重新组合,因此人形机器人在硬件上实质上也是一种类集成,当然,也有部分人形厂家在底层自研电机、驱控和传感器等,但人形机器人可以说是当今技术下的最精密的复杂系统,不可能由企业一家包打天下,就像中国的新能源汽车赛道一样,短短十年可以弯道超车,首先得益于中国汽车供应链的完善。当下人形赛道异常火爆,也带动了产业链上下游企业的关注和配套研发投入,这一点非常关键,甚至是未来人形机器人产业能否在全球市场持续领先的基础。

未来的产业分工,人形机器人的整机厂家更应该是一家AI驱动和场景驱动的公司,按照产业发展规律,在供应链趋于同质化的背景下,强AI能力才是人形机器人企业的定位和未来竞争的核心点。

ToC看似容错性高容易落地,但实则技术泛化能力要求更高

人形机器人规模化落地场景的顺序,to C一定是晚于to B落地的。就像新材料的应用,很多是在航天、军工等特种行业成熟应用后,才逐渐民用化。先不说上一节讨论的成本问题,就机器人AI能力的训练和适配来看,B端的一些场景也要比C端更容易实现。以控制理论看,C端场景是一个完全无约束的系统,而且存在大量的扰动量和未知关联变量,被控对象的重复性和一致性也很弱,这无疑是最难的问题,即便现在的AI大模型端到端训练具有黑箱化的特点,可以忽略传统控制理论的内在逻辑,但越是这种不可解释性,其与机器人物理结构耦合后的执行结果越不可预测。

反之,工业场景内,无论是物理空间还是被操作对象,都相对标准化,需要完成的任务作业也都有流程体系支撑(例如标准程序文件、作业指导书等),这是对人形机器人的任务决策能力是一种降维要求。就像交通法规很大程度上支撑了无人驾驶的rule-base。因此,如果现在的人形机器人研发目标直接锚定在家政服务、养老服务这些C端场景,短期内落地的可能性极小,当然如果只是片段化作业能力的要求,也未尝不可,比如扫地这件事,目前机器人就可以基本实现,但问题是,如果这样定义场景需求,人形这样的通用形态还有意义吗?

现阶段的竞争不应该是成本,还应该all in场景功能的实现

不是人形机器人的成本控制不重要,但拿着国内供应链的集成优势,在全球市场现阶段希望靠低价取得人形机器人产业的未来胜利,显然是违背产业规律的。现阶段的人形机器人竞争依旧还在高技术层级的竞争,如前述,大规模量产阶段还远未到来,还有诸多的核心技术门槛有待攻克。

所以与其现阶段追求人形机器人的极致降本,不如先全力拓展人形的落地场景,把最先进的材料、最高性能的芯片、最高阶的驱控和电机、最前沿的传感器、最强的算法都应用上去,先验证技术场景落地的可行性,先做加法,再做减法,把降本这件事留到真正规模化之后再去做。按照中国的硬件制造能力,高阶通用人形机器人(宇树H1是65万元)未来的售价绝对不会比一辆家用轿车贵,一旦机器人作业能力的拐点实现,走进千家万户是迟早的事。

所谓的规模量产的标准是成功交付,而不是生产出来

目前人形机器人厂家动辄宣布千台级别的量产,实在是让人笑而不语,这种带节奏的说法点动了上下游产业链和资本市场的热情,但有多少是真正交付到用户手里的应用现场,可能只有这些厂家冷暖自知了。反观近日网传的术分级和落地阶段的判断,高盛发布的一篇行研,才算是人间清醒。目前,人形机器人真正的落地场景依旧主要是科研教育和娱乐表演,但这个阶段似乎和某国内人形上市的先驱企业数年前的主战场并没有太大区别,只是换成形态更像人和更大的plus版,24年该企业红红火火的宣布其人形机器人进入某头部新能源汽车品牌的生产线打螺丝,时至今日,即便是特斯拉,其Optimus也只是在局部工艺流程测试。

可以说,目前的人形机器人厂家基本还在本体开发和场景验证阶段,虽然现在的科研教育和娱乐表演市场的需求也足够个别人形头部企业吃饱,但和现在国内过百家的人形机器人企业的研发和融资体量比,真的是杯水车薪,当下谈“量产”的拐点还为时尚早,整个行业都要更耐心、更理性、更扎扎实实地蹚出应用场景和规模量产的路。

结束语

人形机器人的发展绝不会像当前大家期望的一样一路顺风,甚至要准备迎接技术瓶颈期和冰河期,人形机器人需要长期主义,需要资本、生态、人才等诸多发展要素共同作用,甚至需要个别天才带来的技术拐点,但过早透支了人形机器人的发展预期,导致行业资源大量的浪费,在目前技术底座还不完善的情况下,难免让人担心不会是空中楼阁,大量的低水平、同质化的人形机器人企业,甚至是花费大量财政资金支持的集成创新而非具有底层研发或者产业化能力的企业,导致整个行业被反噬。

希望人形机器人这个行业越来越好,可以尽快造福人类,再一次地解放生产力,但这样一个集当代技术大成的智慧产业,应该是科学大家和技术极客们的长期专注耕耘,而不应该成为像现在一样被过度娱乐化、情绪化。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。