苹果造车项目被曝搁浅后再整大活,无需真实数据就能训练自动驾驶
苹果自动驾驶领域取得领先技术成果,使用自博弈实现SOTA。
苹果造车项目停滞一年后,项目团队重新集结,结合2017年的端到端技术以及CVPR 2023技术主席的支持,开展一项重大活动:
引入自博弈强化学习到自动驾驶领域,仅需10天便生成16亿公里模拟数据,无需真实数据即可训练算法。
利用海量模拟数据,却以极低成本实现SOTA效果。
苹果引入自博弈技术,实现自动驾驶SOTA成果
苹果最近成功将自博弈(Self-play)应用于自动驾驶领域,增强了系统的稳健性。
自博弈类似自对抗生成网络(GAN)思想,智能体通过与自身副本或历史版本进行对抗学习进化,这是强化学习领域的关键策略。
苹果不仅在游戏领域、机器人和生物工程领域落地该技术,同时还将其引入自动驾驶领域,通过设计简单的奖励函数,生成规模庞大的模拟数据,而非依赖真实数据,让多个智能体在地图上进行复杂交互,从而推动算法的进化。
每个实例最多生成150个智能体(Agent),包括轿车、卡车、自行车和行人等,模拟的环境涵盖停车线和交通信号等信息。
这种训练方式的优势在于速度快、成本低廉。
这种训练方法让苹果每小时能模拟并学习440亿次状态转移,相当于720万公里的驾驶经验,比使用真实数据快了360,000倍。
仅需10天的训练,就能学到16亿公里的驾驶里程,相当于从太阳到土星的距离。
而每百万公里的成本不到5美元,约合人民币1万公里3毛6。
这种成本和速度是否有些夸张?性能如何?
苹果将这项成果在CARLA、nuPlan和Waymo的开放数据集上进行了零样本独立测试,均取得SOTA表现。
这些测试覆盖了不同地图、驾驶场景、交通密度和评分标准,验证了苹果工作的泛化性和稳健性。
苹果还指出,以往的SOTA成果往往针对特定数据集、特定基准进行训练。
通过GIGAFLOW模拟器,苹果取得这一成果,速度快、成本低。
简单的奖励函数如何持续推进算法进化?
苹果团队认为,通过大规模数据模拟可以弥补奖励函数简单的不足,从海量自博弈中涌现出复杂、类似人类的驾驶行为。
具体实施中,GIGAFLOW同时生成3.84万个GIGAFLOW World,每个World模拟了多种交通情况和互动场景,如拥堵的环岛、无信号的十字路口和并车的车道。
一个“World”最多容纳150个智能体,包括8种随机地图变动,进行了翻转、缩放、剪切等处理。
地图总里程长136公里,路上会随机生成1到N个智能体,系统要求智能体在自博弈中驶向各自目的地。
智能体的驾驶策略通过参数化实现,可定义智能体类型和驾驶风格为激进或谨慎。这些参数测试时可修改,无需重新训练。
智能体通过观察周围环境,如其他车辆的大小、位置和速度,优化驾驶策略,学会并道、无信号灯左转和绕过事故现场等行为。
尽管智能体模拟训练会导致交通事故,但苹果介绍称频率大约在300万公里1次。
相比之下,现实世界内,司机事故率大约是3.5万公里1次。苹果还通过多种方式优化了GIGAFLOW模拟器的整体效率。
苹果表示,除了技术方面还存在一些挑战需要克服,主要是面向实际应用的现实迁移问题。
同时,现有奖励函数在处理复杂场景时可能显得简单,需要更灵活的奖励函数来适应更多样的现实世界情况。
最后工程上也有一些问题,团队认为大规模使用自博弈进行训练需要高昂资源支持,需评估成本效益。
苹果希望这项技术在其他领域有更广泛的应用,如消费级和工业机器人,以及网络游戏等。
这一成果是多位领域专家集体智慧的体现,其中包括许多苹果造车团队成员。
作者团队介绍
论文的12位作者中,首席作者David Hafner担任CVPR 2023技术主席。
公开资料显示,其中三分之一作者是苹果造车项目的特别项目组(SPG)成员:
Stuart Bowers曾是特斯拉工程副总裁,负责AutoPilot自动驾驶系统的研发。
于2020年加入苹果,据报道他负责SPG项目的自动驾驶算法。
Brody Huval是自动驾驶初创公司drive.ai的联合创始人,随后于2019年被苹果收购,加入SPG团队担任资深机器学习研究员。
Aleksei Petrenko也是苹果SPG成员,曾在英伟达做机器人实习生,于2023年3月加入苹果担任高级科学家。
Eugene Viningtsky于2016年至2022年在伯克利攻读机器学习,并研究自动驾驶。
2022年9月,他加入苹果并于两年后离职。
在他离职时,距苹果放弃造车仅过去4个月。
长达10年的经历,加上不愿透露的工作性质,可能也使他成为SPG的成员。
其他作者也都具备相关行业背景。
Vladlen Koltun在2017年10月提出将端到端模式应用于自动驾驶,同年11月推出自动驾驶测试基准CARLA。
2024年2月底,苹果停止造车,Cruise陷入困境,Waymo商业化进展缓慢,马斯克计划推出Robotaxi,文远和小马大力发展,百度Apollo寻求国际化。
在造车项目搁浅的这一年,自动驾驶领域变化巨大,再度迎来高潮。
Waymo接过硅谷自动驾驶大旗,计划今年实现10多个城市的商业化普及。
马斯克计划Robotaxi于6月上线,文远和小马先后宣布计划,百度Apollo则向海外扩张。
全球范围的Robotaxi商业化如火如荼。
苹果发布这一SOTA成果,提出新技术途径,可能预示着更多……
查看论文:
https://arxiv.org/pdf/2502.03349
本文来源:智能车参考(ID:AI4Auto),作者:一凡,原标题《啊?苹果自动驾驶新研究 SOTA 了,造车不是停了吗》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。