首页 > AI资讯 > 最新资讯 > 大模型“神仙打架”,实现无人驾驶或可换个新思路

大模型“神仙打架”,实现无人驾驶或可换个新思路

新火种    2024-01-02

走入“死胡同”的自动驾驶

工业和信息化部数据显示,今年上半年,我国搭载辅助自动驾驶系统的智能网联乘用车市场渗透率已达42.4%,预计到2025年乘用车L2及以上智能驾驶渗透率将达70%。辅助驾驶系统不断普及,何小鹏却发出“无人驾驶尚无完整逻辑”的感叹。实际上,何小鹏并非第一个对无人驾驶发出质疑的车企高管。比亚迪董事长王传福也曾表示:“无人驾驶都是扯淡,它就是一场皇帝的新装。自动驾驶最终就是一个高级的辅助驾驶而已。”

回顾过往十余年的发展历程,自动驾驶主要沿着两大技术路线向无人驾驶迈进。一种是直奔高级别自动驾驶的跃进式路线,一种是从辅助驾驶不断迭代的渐进式路线。如今,随着L2辅助驾驶的不断普及,以及国内外L3自动驾驶相关政策和测试牌照的相继落地,渐进式路线取得较大进展。然而,以Robotaxi为主要落地形式的跃进式路线却进展受阻。尽管国内百度、小马智行、享道出行等自动驾驶企业不断扩大Robotaxi的运营范围和数量,但近段时间以来国外出现的Robotaxi相关事故迫使这一路线被“打入冷宫”。今年8月刚刚获得旧金山全天候商业运营许可的Cruise,在不到3个月之内便接连发生多起熄火、拖拽行人等事故,被迫停止运营,重新引发公众对自动驾驶的信任危机。

对此,中国生产力促进中心协会常务副理事长兼秘书长、研究员王羽认为,当下辅助驾驶系统的大规模量产看似形势一片大好,但高级别自动驾驶由于技术仍在探索、产品成熟度不高,实则深陷困局。“渐进式路线上,更高级别自动驾驶还未经过足够的验证,量产还需时日。跃进式路线上,百度、小马智行这些企业都还处在探索阶段,大规模应用还不够成熟。”王羽表示,自动驾驶必须在确保安全性的基础上推广和应用,由于技术上的不成熟,当下两条路线都不得不陷入停滞期。

除却技术上的限制,中国科学院雄安创新研究院研究员黄武陵称,无人驾驶的普及还需放到行业角度进行全局考察。“无人驾驶的落地应用诚然存在技术问题,但场景问题也不能忽视。”他认为,技术的缺陷使得当前自动驾驶企业无法生产符合部分场景功能需求的车辆,场景的缺陷则导致自动驾驶车辆无法在更大范围得到普及应用。

黄武陵表示,无人驾驶的应用不仅仅关乎汽车行业本身,在聚焦于制造车辆方的同时,还需

此外,在黄武陵看来,行业对自动驾驶技术的期望是通用的、可靠的自动驾驶系统,但实际应用场景需求则是多样化、开放性的,这就导致技术发展与商业应用之间存在无法逾越的鸿沟,使得当前自动驾驶发展陷入困境。

百家争鸣的AI大模型

如何跨越鸿沟,让虚幻的自动驾驶更加具象?AI大模型的出现无疑让自动驾驶行业重新看到曙光。毫末智行相关负责人在接受《中国汽车报》记者采访时表示,自动驾驶经历了以硬件驱动的1.0时代和以软件驱动的2.0时代,现在正在迈向以数据驱动的3.0时代。在这一阶段,只有以大模型、大数据、大算力为特点构建全新的自动驾驶技术范式,才有可能达成完全无人驾驶。

今年以来,毫末智行、商汤科技、科大讯飞等企业相继发布汽车领域垂直大模型。今年4月,毫末智行发布行业首个自动驾驶生成式大模型DriveGPT“雪湖·海若”。毫末智行相关负责人称,DriveGPT主要采用了海量的驾驶场景的感知数据和驾驶行为作为训练数据,采用RLHF技术来引入人类司机的接管数据,来对自动驾驶决策进行持续优化。

商汤科技则开发了业内首个感知决策一体化的端到端自动驾驶解决方案——UniAD,在多目标跟踪准确率、车道线预测准确率等多项关键技术指标上超越SOTA方法,整体系统和性能得到大幅提升。商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚此前表示,摆脱对高精地图的依赖,用一个模型完成整个自动驾驶各个模块,实现完整的数据驱动是未来的发展趋势,商汤绝影将基于UniAD实现端到端自动驾驶模型的量产。

科大讯飞在10月的智能汽车发布会上围绕“大模型上车”接连发布“智能驾驶”、“智能音效”、“智能座舱”三大产品。其中,在智能驾驶方面,基于讯飞星火认知大模型,科大讯飞带来两款行泊一体智驾解决方案——智驾STD和智驾PRO,配备了增强型高速NOA、记忆行车和记忆泊车等功能。

自动驾驶公司Wayve推出了首个自动驾驶的视觉语言动作模型(VLAM)——LINGO-1。该系统融合了大语言模型和自动驾驶技术,使其能够以自然语言对驾驶行为进行解释和描述,能够显著增强Wayve人工智能驱动程序的可解释性。

自动驾驶公司max近日也上线了max大模型。max首席科学家成二康认为,大模型有三个支柱:生成式、基础模型+提示学习、人类反馈强化学习。生成式,是指大模型创造并提供了比现实世界驾驶数据更丰富更极端更难以获得的数据用来训练自动驾驶模型;基础模型+提示学习,是指大模型通过输入提示,进行概念的理解及自我监督学习,从而解决自动驾驶各项任务,并提高了软件性能和安全;人类反馈强化学习,是指大模型利用人类的反馈,可以让人工智能驾驶员通过通用推理,在没有经验的情况下,在任何场景都能更好的安全驾驶,解决自动驾驶长尾问题。

不久前,谷歌Gemini大模型的问世还给自动驾驶大模型带来更多可能性。据悉,Gemini是一种原生多模态AI大模型,在大规模多任务语言理解(MMLU)测试中,首次超过人类专家。近日,华中科技大学软件学院教授白翔领衔的VLRLab团队也发布了多模态大模型“Monkey”,能够实现对世界的“观察”,对图片进行精确描述。天风证券研报指出,随着ChatGPT通过升级迭代,拥有了多模态能力,以及Gemini所展现出的原生多模态能力,AI大模型浪潮已经进入了一个全新的阶段,即从大语言模型转向多模态模型。多模态大模型的发展必将推动汽车具有更全面、智能的感知和理解能力,推动完全自动驾驶的落地。

大模型是新出路?

“AI大模型的应用还只是初期阶段,如今面临的阶段性难题无法依靠大模型解决,正所谓‘远水解不了近渴’。”王羽表示,AI大模型发展尚不成熟,真正在自动驾驶上落地应用还需等待2~3年时间。天风证券研报也指出,当前大模型在智能汽车中的应用仍存在多模态数据融合、云端算力需求大、车端部署以及安全性和一致性等问题。

在黄武陵看来,采用跨模态模型和大语言模型等复杂算法,结合成本可控的高算力平台参与计算,能够在系统侧逐步使得自动驾驶长尾问题得到收敛和解决,让自动驾驶更方便地集成到交通、运输的综合解决方案之中。然而,他直言,现阶段出现的各类汽车行业AI大模型都还是仅具备通用语言能力的模型,真正能够在车载系统上应用的自动驾驶大模型还有待于进一步研发。对此,毫末智行相关负责人表示认可,他认为当前汽车行业大模型主要还是采用类似ChatGPT的方式,进行人机对话交互,实现自动驾驶还是需要单独的功能模块。

尽管尚处于初期发展阶段,但大模型的诞生无疑为自动驾驶带来了无限想象空间。max创始人徐雷称:“无人驾驶的本质就是一个机器人帮人去开车。大模型的出现让汽车拥有了一个大脑,具备了人类的常识,会加速智能驾驶的研发和验证。”今年9月,韩国科学技术院(KAIST)研究人员便采用人工智能和大语言模型技术,开发了世界上首个人形机器人飞行员。KAIST研究团队表示:“它们具有很强的适用性和实用性。我们希望它们未来还能够应用于传统汽车和军用卡车等各种其他车辆,因为它们可以控制广泛的设备。”

“在智能汽车领域,未来三年会是最残酷的三年,也是最有机会的三年。核心不光要建立几个长板,还要无任何短板。”与其在此猜测未来,不如像何小鹏所言,抓住时间补短板、锻长板,也许关于自动驾驶未来的答案,即将揭晓。

文:张奕雯

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。