对话冠军天工CTO唐剑:具身智能的ChatGPT时刻还没有到
4月19日,雨后的北京分外清凉,人形机器人半程马拉松吸引众多目光。当天10时11分左右,首个人形机器人半程马拉松迎来首位撞线“选手”——天工Ultra,用时2小时40分42秒。
天工Ultra身高180cm,体重55kg,具备开源开放性和兼容扩展性,可以灵活扩展软、硬件等功能模块,已具备带有视觉感知的泛化移动能力,能轻松应对沟壑、大高度差等复杂地形。
天工Ultra由北京人形机器人创新中心研发。北京人形机器人创新中心首席技术官(CTO)唐剑谈及天工夺冠表示,“天工整体表现是非常符合预期的,主要是指它的整体速度以及完成时间。也不用避讳,大家都看到天工中途有一次摔跤,那是因为电池失效,这也是偶尔会出现的故障”。
唐剑介绍,这次比赛主要是对机器人的硬件以及软件的运动算法,或者说机器人的“小脑” 稳定性、可靠性的一次极限的测试。天工机器人的“小脑”也是国地共建具身智能机器人创新中心“慧思开物”平台的一部分,测试是一个长期的过程。
唐剑认为,目前具身智能的ChatGPT时刻还没有到,需要对机器人模型的架构能力升级,进行颠覆式的升级。年中机器人自主导航将有突破,明年人形机器人马拉松将不需要领跑员。希望人形机器人走入工业、商业、生活场景,能够7X24小时不间断稳定地工作。
4月19日,首个人形机器人半程马拉松,天工Ultra首个冲线。新京报记者李木易摄
表现符合预期
新京报贝壳财经:本次天工Ultra的表现是否符合预期?
唐剑:天工整体表现还是非常不错的,主要是指它的整体速度以及完成时间。大家看到天工中途有一次摔跤,那是因为电池没电了,换电后很快便恢复了奔跑状态。本次全程只用了同一台机器人便完成了整个半程马拉松比赛。
新京报贝壳财经:电池更换次数能更少?
唐剑:我们特别希望一台机器人完成全程,电池换了三次,一块电池大概能跑六七公里。我们对电池容量、电量的选择斟酌再三,做了很多测试,现在用的是15安的电池,如果加大加倍,更换电次数会减少一倍,但会增加机器人的重量,可能影响速度以及步态。目前是平衡各方面因素最终做一个最优的选择。
新京报贝壳财经:赛场上天工Ultra如何完成比赛?
唐剑:我们的机器人前面是有一位领跑者,这是无线跟随技术,是一种半自主的,不用遥控器方式。领跑者是一位运动员,身上有UWB标签,机器人身上有无线的发射器,负责发射无线信号并且回收,然后利用算法与领跑者保持相对固定的距离和角度,实现运动。然后后面两个人员主要是起到保护作用。
新京报贝壳财经:为完成本次比赛做了哪些准备?
唐剑:天工在备赛过程中做了大量训练和测试,还要去做极限测试,并针对各种复杂地形进行测试,以及还有跟随算法的测试。
为了夺冠软硬兼施
新京报贝壳财经:天工夺冠主要原因是什么?优势有哪些?
唐剑:在硬件方面,首先为天工的“本体”做了轻量化和低惯量的设计,尽量减重,同时把踝关节以及膝关节尽量往上提升,让腿部的惯量比较低,腿部跑起来比较轻盈;其次,对一些关节模组的导热设计做了优化,让它能很快达到热平衡,而不是让关节的温度持续上升,因为上升到一定温度,这个关节会失效,这样机器人会摔倒;第三,在脚底做了一些缓冲的设计,尽可能减少对关节膜、对脚底板以及关节模组的磨损。更重要的是,天工的腿比其他赛队的机器人要长,跑得比较快。
在软件方面,运控算法做了很多优化。一是要在步频、步幅、步态上做非常平衡的最优选择。二是奔跑的算法用了最先进的强化模拟学习。强化模拟学习是要模仿人类,试采人类运动员跑步的数据,让它尽可能接近运动员。因为人类进化了千年,跑步跑得快一定是有它的道理,我们把采集到的人的数据导入到强化学习的架构中。
新京报贝壳财经:本次比赛展现了哪些技术优势?
唐剑:这次比赛主要是对机器人的硬件以及软件的运动算法,或者说机器人的“小脑” 稳定性、可靠性的一次极限的测试。天工机器人的“小脑”也是北京人形机器人创新中心“慧思开物”平台的一部分,测试是一个长期的过程。
今年3月12日,我们发布“慧思开物”的平台,这是一个一脑多能、一脑多机的通用具身智能平台,这个软件平台最主要功能是支持其他机器人应用开发商以及系统集成商基于该平台开发应用,平台上有非常强大的AI的能力。
AI的强化学习属于实战派,算法开始可能是个小白,放到实际环境中不断试错,起初可能会摔倒,跑得很慢,跌跌撞撞。然后它在训练过程中不断地试错,越来越强。强化学习的最大优势是泛化能力比较强。实战派遇到什么情况都可以应付。在奔跑过程中,可能会遇到转弯、上坡、下坡以及坑洼地滑等等,都有比较好的应对。
具身智能的ChatGPT时刻还没有到
新京报贝壳财经:机器人如何泛化?
唐剑:泛化能力与大模型的泛化能力有类似的地方,一是数据,但数据的增多也不一定能完全解决。现在大模型已经展现出比较强大的泛化能力了,但是机器人的操作和语言,与语言大模型不同。目前具身智能很大程度上照搬了语言大模型。机器人模型的结构和架构,可能也需要比较颠覆式的突破和进展,可能不只是数据的堆叠和积累。可以认为是目前具身智能的ChatGPT时刻还没有到。
新京报贝壳财经:机器人对物理世界的认知还是有限?
唐剑:是的。泛化能力有两方面,一是大脑的规划能力,这有非常大的难点,要学习物理的规律。看到物品后需要大脑规划如何操作,这个比较难,要比较强大的泛化能力。
还有手部操作也要比较强大的泛化能力,进入家庭生活场景,光照、桌子、窗帘等纹理都不一样,如何操作是难点,比方杯子类型丰富多样,是否有模型可无差别拿起杯子,可能不单单是数据的积累,可能需要对模型的架构能力升级,甚至是颠覆式的升级,这可能比较重要。
希望机器人能够7X24小时不间断稳定地工作
新京报贝壳财经:后续技术如何迭代?
唐剑:我们会非常关注产业化的落地,第一阶段先开始在工业和泛工业场景做一些巡检类及简单的操作类的工作。第二阶段会在商业的场景提供商业服务,完成打包、扫码等相对比较复杂的操作。第三阶段会走入生活和家庭,去扮演像保姆、管家等角色。
最终希望人形机器人走入工业、商业、生活场景,能够7X24小时不间断稳定地工作,这是参加这次比赛的重要目的,我们会持续迭代不断提升。同时也有一系列的研发计划,会去占领具身智能技术制高点。
新京报贝壳财经:具体有哪些技术需要迭代?
唐剑:比如像这次马拉松比赛,大家可能觉得自主导航是很成熟的技术,但也不尽然。自主导航在自动驾驶上是开发了非常多年,相对比较成熟。但人形机器人全身的关节很多,控制完全不是一个层次,控制复杂度是几何级数的增长。
人形机器人的自主导航在产业界没有比较标准的参考性设计,自动驾驶的算法也绝对不可能直接应用到机器人上。比如路径规划的算法,可能可以借鉴自动驾驶的算法,但机器人能非常完美遵循规划轨迹其实极其难,这个是非常大的难点。我们目前正在攻关这个难点。
已小批量生产很快会具备自主导航能力
新京报贝壳财经:这个机器人已经实现量产了吗?
唐剑:我们会有天工2.0机器人很快实现小批量生产,并且开始逐步投入一些场景的应用。
新京报贝壳财经:2.0是Ultra版本吗?
唐剑:不是的,Ultra版本是运动型的机器人,最明显特征腿比较长,主要是为提升运动性能。天工2.0也有不同的版本,有七轴机械臂带五指灵巧手的,能更好支持上肢具身智能相关的操作。
新京报贝壳财经:明年是否还会参加机器人马拉松?是否还需要领跑员与陪护员?
唐剑:我们很快会具备自主导航能力,现在已经在研发,很快就能展示出全自主的导航。这样天工将不再需要人类引导参加马拉松,明年的机器人马拉松有望看到无人引导的天工在奔跑。
(文章来源:新京报)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。