说话就能控制左右快慢!理想汽车MindVLA大模型实测视频发布
3月21日消息,今天下午,理想汽车详细介绍了MindVLA大模型与现有端到端+VLM大模型的区别,并公布了相关实测视频。
按能力表现来看,MindVLA 模型加持下的汽车就像一个助手,能与用户沟通、理解用户意图,帮用户做更多事情。
比如,它可以在陌生车库漫游找车位直至自主完成泊车;
可以按照驾驶员的“开快点、开慢点、左拐、右拐”等语音指令进行行动;
可以在你发给它地标照片后,按图索骥找到你等等。
理想汽车还表示,MindVLA是理想汽车下一代自动驾驶核心架构,使用了MindGPT作为语言基座,demo中的语音通过座舱的ASR后变成文字,输入给 MindVLA。
这一设计继承自 MindGPT 在语言理解与交互领域的优势能力(如语义解析、逻辑推理等),并针对自动驾驶场景进行了专项优化。
这体现了智舱与智驾在功能层的协同创新,而非系统层的完全融合。
未来,我们将持续探索多模态交互与驾驶决策的深度耦合,为用户提供更自然的“人车共驾”体验。
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。