理想汽车发布下一代自动驾驶架构 MindVLA，李想将其比作 iPhone 4

xxn 阅读：4785 2025-03-18 12:00:49 评论：0

IT之家 3 月 18 日报道，NVIDIA GTC 2025 会议上，理想汽车发布了最新一代自动驾驶架构 MindVLA。

据理想汽车自动驾驶技术研发负责人贾鹏表示，该公司自主研发的 VLA 模型 - MindVLA 将使汽车实现从简单的运输工具转变为“贴心的专职司机”，具备听觉、视觉和定位功能。“我们希望通过 MindVLA 为汽车赋予类似人类的认知和适应能力，转变为一种具有思考能力的智能体。”

理想汽车 CEO 李想介绍称：“MindVLA 是一个涵盖视觉、语言和行为的大型模型，我们更倾向于将其称作‘机器人大模型’，它将整合空间智能、语言理解和行为决策于一体，从而使自动驾驶系统具备感知、思考和环境适应能力，这是我们迈向 L4 级自动驾驶的重要一步。”

李想还指出：“MindVLA 将赋予自动驾驶类似于人类驾驶员的能力，就如同 iPhone 4 改变了手机，MindVLA 也将重新定义自动驾驶。”

根据理想汽车的官方介绍，MindVLA 将为用户带来崭新的产品形态和使用体验，搭载 MindVLA 的汽车将变身为具备听觉、视觉、定位功能的专职司机。

“听得懂”表示用户可以通过语音指令控制车辆的路线和行为，例如在陌生区域寻找超市时，只需告诉车辆：“带我去超市”，车辆将自主导航至目的地；在行驶过程中，用户可告诉车辆：“开得太快了”、“左侧那条道路更好”，MindVLA 能理解并执行这些指令。
“看得见”意味着 MindVLA 具备辨识不同商店的能力，例如星巴克、肯德基等商店招牌，若用户在陌生环境下无法找到车辆，只需拍照发送给车辆，搭载 MindVLA 的车辆将识别照片中的环境并准确定位。
“找得到”意味着车辆可在地下停车场、园区和公共道路上自主导航，特别适用于用户在商场地下停车找不到车位时，可告诉车辆：“找个车位停好”，车辆将凭借强大的空间推理能力自主寻找车位，即使遇到死胡同，车辆也能倒车寻找适合的车位停放，全程无需地图或导航信息，完全依赖 MindVLA 的空间理解和逻辑推理。

除了合作伙伴的演讲，北京时间 3 月 19 日凌晨 1:00，英伟达 CEO 黄仁勋将发表主题演讲，涵盖代理式人工智能、机器人、加速计算等领域的发展趋势，IT之家随时跟进最新消息。

英伟达 GTC 2025 大会专题

广告声明：本文包含的外部链接仅用于传递更多信息，仅供参考，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。