理想汽车发布下一代自动驾驶架构 MindVLA,李想将其比作 iPhone 4

xxn 阅读:4686 2025-03-18 12:00:49 评论:0

IT之家 3 月 18 日报道,NVIDIA GTC 2025 会议上,理想汽车发布了最新一代自动驾驶架构 MindVLA

据理想汽车自动驾驶技术研发负责人贾鹏表示,该公司自主研发的 VLA 模型 - MindVLA 将使汽车实现从简单的运输工具转变为“贴心的专职司机”,具备听觉、视觉和定位功能。“我们希望通过 MindVLA 为汽车赋予类似人类的认知和适应能力,转变为一种具有思考能力的智能体。”

理想汽车 CEO 李想介绍称:“MindVLA 是一个涵盖视觉、语言和行为的大型模型,我们更倾向于将其称作‘机器人大模型’,它将整合空间智能、语言理解和行为决策于一体,从而使自动驾驶系统具备感知、思考和环境适应能力,这是我们迈向 L4 级自动驾驶的重要一步。”

李想还指出:“MindVLA 将赋予自动驾驶类似于人类驾驶员的能力,就如同 iPhone 4 改变了手机,MindVLA 也将重新定义自动驾驶。”

根据理想汽车的官方介绍,MindVLA 将为用户带来崭新的产品形态和使用体验,搭载 MindVLA 的汽车将变身为具备听觉、视觉、定位功能的专职司机

“听得懂”表示用户可以通过语音指令控制车辆的路线和行为,例如在陌生区域寻找超市时,只需告诉车辆:“带我去超市”,车辆将自主导航至目的地;在行驶过程中,用户可告诉车辆:“开得太快了”、“左侧那条道路更好”,MindVLA 能理解并执行这些指令。

“看得见”意味着 MindVLA 具备辨识不同商店的能力,例如星巴克、肯德基等商店招牌,若用户在陌生环境下无法找到车辆,只需拍照发送给车辆,搭载 MindVLA 的车辆将识别照片中的环境并准确定位。

“找得到”意味着车辆可在地下停车场、园区和公共道路上自主导航,特别适用于用户在商场地下停车找不到车位时,可告诉车辆:“找个车位停好”,车辆将凭借强大的空间推理能力自主寻找车位,即使遇到死胡同,车辆也能倒车寻找适合的车位停放,全程无需地图或导航信息,完全依赖 MindVLA 的空间理解和逻辑推理。

除了合作伙伴的演讲,北京时间 3 月 19 日凌晨 1:00,英伟达 CEO 黄仁勋将发表主题演讲,涵盖代理式人工智能、机器人、加速计算等领域的发展趋势,IT之家随时跟进最新消息。

英伟达 GTC 2025 大会专题

广告声明:本文包含的外部链接仅用于传递更多信息,仅供参考,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容