苹果造车项目被曝搁浅后再整大活,无需真实数据就能训练自动驾驶

xxn 阅读:90848 2025-02-18 12:21:32 评论:0

苹果自动驾驶领域取得领先技术成果,使用自博弈实现SOTA。

苹果造车项目停滞一年后,项目团队重新集结,结合2017年的端到端技术以及CVPR 2023技术主席的支持,开展一项重大活动:

引入自博弈强化学习到自动驾驶领域,仅需10天便生成16亿公里模拟数据,无需真实数据即可训练算法。

利用海量模拟数据,却以极低成本实现SOTA效果。

苹果引入自博弈技术,实现自动驾驶SOTA成果

苹果最近成功将自博弈(Self-play)应用于自动驾驶领域,增强了系统的稳健性。

自博弈类似自对抗生成网络(GAN)思想,智能体通过与自身副本或历史版本进行对抗学习进化,这是强化学习领域的关键策略。

苹果不仅在游戏领域、机器人和生物工程领域落地该技术,同时还将其引入自动驾驶领域,通过设计简单的奖励函数,生成规模庞大的模拟数据,而非依赖真实数据,让多个智能体在地图上进行复杂交互,从而推动算法的进化。

每个实例最多生成150个智能体(Agent),包括轿车、卡车、自行车和行人等,模拟的环境涵盖停车线和交通信号等信息。

这种训练方式的优势在于速度快、成本低廉

这种训练方法让苹果每小时能模拟并学习440亿次状态转移,相当于720万公里的驾驶经验,比使用真实数据快了360,000倍。

仅需10天的训练,就能学到16亿公里的驾驶里程,相当于从太阳到土星的距离。

而每百万公里的成本不到5美元,约合人民币1万公里3毛6。

这种成本和速度是否有些夸张?性能如何?

苹果将这项成果在CARLA、nuPlan和Waymo的开放数据集上进行了零样本独立测试,均取得SOTA表现。

这些测试覆盖了不同地图、驾驶场景、交通密度和评分标准,验证了苹果工作的泛化性和稳健性。

苹果还指出,以往的SOTA成果往往针对特定数据集、特定基准进行训练。

通过GIGAFLOW模拟器,苹果取得这一成果,速度快、成本低。

奖励函数构成

简单的奖励函数如何持续推进算法进化?

苹果团队认为,通过大规模数据模拟可以弥补奖励函数简单的不足,从海量自博弈中涌现出复杂、类似人类的驾驶行为

具体实施中,GIGAFLOW同时生成3.84万个GIGAFLOW World,每个World模拟了多种交通情况和互动场景,如拥堵的环岛、无信号的十字路口和并车的车道。

一个“World”最多容纳150个智能体,包括8种随机地图变动,进行了翻转、缩放、剪切等处理。

地图总里程长136公里,路上会随机生成1到N个智能体,系统要求智能体在自博弈中驶向各自目的地。

智能体的驾驶策略通过参数化实现,可定义智能体类型和驾驶风格为激进或谨慎。这些参数测试时可修改,无需重新训练。

智能体通过观察周围环境,如其他车辆的大小、位置和速度,优化驾驶策略,学会并道、无信号灯左转和绕过事故现场等行为。

尽管智能体模拟训练会导致交通事故,但苹果介绍称频率大约在300万公里1次

相比之下,现实世界内,司机事故率大约是3.5万公里1次。苹果还通过多种方式优化了GIGAFLOW模拟器的整体效率。

苹果表示,除了技术方面还存在一些挑战需要克服,主要是面向实际应用的现实迁移问题。

同时,现有奖励函数在处理复杂场景时可能显得简单,需要更灵活的奖励函数来适应更多样的现实世界情况。

最后工程上也有一些问题,团队认为大规模使用自博弈进行训练需要高昂资源支持,需评估成本效益。

苹果希望这项技术在其他领域有更广泛的应用,如消费级和工业机器人,以及网络游戏等。

这一成果是多位领域专家集体智慧的体现,其中包括许多苹果造车团队成员。

作者团队介绍

论文的12位作者中,首席作者David Hafner担任CVPR 2023技术主席。

公开资料显示,其中三分之一作者是苹果造车项目的特别项目组(SPG)成员:

Stuart Bowers曾是特斯拉工程副总裁,负责AutoPilot自动驾驶系统的研发。

于2020年加入苹果,据报道他负责SPG项目的自动驾驶算法。

Brody Huval是自动驾驶初创公司drive.ai的联合创始人,随后于2019年被苹果收购,加入SPG团队担任资深机器学习研究员。

Aleksei Petrenko也是苹果SPG成员,曾在英伟达做机器人实习生,于2023年3月加入苹果担任高级科学家。

Eugene Viningtsky于2016年至2022年在伯克利攻读机器学习,并研究自动驾驶。

2022年9月,他加入苹果并于两年后离职。

在他离职时,距苹果放弃造车仅过去4个月。

长达10年的经历,加上不愿透露的工作性质,可能也使他成为SPG的成员。

其他作者也都具备相关行业背景。

Vladlen Koltun在2017年10月提出将端到端模式应用于自动驾驶,同年11月推出自动驾驶测试基准CARLA。

2024年2月底,苹果停止造车,Cruise陷入困境,Waymo商业化进展缓慢,马斯克计划推出Robotaxi,文远和小马大力发展,百度Apollo寻求国际化。

在造车项目搁浅的这一年,自动驾驶领域变化巨大,再度迎来高潮。

Waymo接过硅谷自动驾驶大旗,计划今年实现10多个城市的商业化普及。

马斯克计划Robotaxi于6月上线,文远和小马先后宣布计划,百度Apollo则向海外扩张。

全球范围的Robotaxi商业化如火如荼。

苹果发布这一SOTA成果,提出新技术途径,可能预示着更多……

查看论文:

https://arxiv.org/pdf/2502.03349

本文来源:智能车参考(ID:AI4Auto),作者:一凡,原标题《啊?苹果自动驾驶新研究 SOTA 了,造车不是停了吗》

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

标签:苹果
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容