李飞飞团队具身智能新作:500 美元,一切家务机器人帮你干
如今,机器人已经能够进行跑步和翻转,那么究竟何时才能够承担起家庭事务,为人类提供帮助呢?
为了解决这一挑战,李飞飞及其团队推出了最新的具身智能研究成果——𝗕𝗘𝗛𝗔𝗩𝗜𝗢𝗥 𝗥𝗼𝗯𝗼𝘁 𝗦𝘂𝗶𝘁𝗲 (𝗕𝗥𝗦),这是一个全面解决家庭任务中机器人全身操作问题的框架。
而且,这个系统的核心组件成本仅在 500 美元以内。
在机器人学习的领域中,一个被广泛追求的目标是使机器人能够完成各种日常家庭活动。借助一款新型双臂移动机器人,我们的研究成果——BRS 正在努力攻克这一复杂且未解的难题。
例如,开启门把手,早上倒垃圾:
等家人出门后,再帮忙整理货架:
顺便清理起居室,把脏碗放入洗碗机:
并且认真负责,再把马桶刷干净:
这样,一台机器人就能轻松完成所有这些家务活。
研究团队还发现,即使在工作过程中出现些许问题,机器人也能够自行纠正错误。
(起初手臂无法触及马桶盖,机器人采取了前倾的动作进行调整)
网友们积极反馈,认为通用家庭机器人的实现又向前迈出了一步。
那么,李飞飞的团队到底是如何实现这一目标的呢?
聚焦三项全身控制能力
团队通过对 BEHAVIOR-1K(包含 1000 项家庭活动的机器人测试基准)的详细分析,确定了机器人成功完成家庭活动所需的三种全身控制能力:
双臂间的协同工作能力;
稳定且准确的导航能力;
末端执行器具备广泛的操作范围和触及能力。
尤其最后一点,很多人可能未曾重视末端执行器的控制能力。
在家庭环境中,日常物品往往分布在不同高度和位址,所以机器人必须灵活调整其伸展能力。
基于此,团队认为,为家务机器人配置双臂、移动底座和灵活的躯干是实现全身操作的关键。
具体来说,他们选择了 Galaxea R1 机器人(由国内星海图出品)作为硬件基础,拥有两个自如的 6 自由度手臂、4 自由度躯干和全向移动底座,满足家庭任务的需求。
然而,复杂的设计也给策略学习带来了挑战,尤其是在数据的规模化采集和全身协作方面。
为此,BRS 通过两项核心创新实现了软硬件的协同:
推出了一种低成本的全身遥操作接口——JoyLo;
提出新型学习算法WB-VIMA。
更具体地,JoyLo(低成本运动学双臂的操控系统)通过操纵木偶的理念,结合运动学双臂与任天堂 Joy-Con 控制器,达成高效的全身控制。
同时,还提供了丰富的用户反馈,提升了数据质量。
在总成本控制在 500 美元以内的条件下,团队在 R1 机器人上实现了 JoyLo 的设计目标:
高效的全身协调控制系统,实现复杂动作的流畅配合;
丰富的用户反馈机制,提升用户的远程操作体验;
确保高质量的示范动作,提升策略学习效果;
低成本方案,大大提高了系统的可及性;
实时便捷的控制器设计,保障操作的顺畅无缝。
另一方面,WB-VIMA(全身视觉-运动注意力)学习算法旨在利用机器人的固有运动学结构来建模全身动作。
它运用 Transformer 架构,通过自回归方式去噪全身动作,并整合多模态观察注意力,可以使机器人有效学习协调的全身动作。
在训练和部署过程中,通过特定优化器和调度器,利用工作站推理实现低延迟控制。
值得注意的是,WB-VIMA解决了一个重要问题:
在类人机器人中,基座或躯干的微小误差会在执行器末端显著放大。
针对这一点,WB-VIMA在预测下游组件动作时,并不孤立地考虑,而是先分析上游组件的状态和位置等信息,作为条件推导下游组件应进行的动作,从而实现整体协同运动。
BRS 可应用于多种家庭任务
研究团队对五类具有代表性的家庭任务进行了BRS评估,包括清洁房间、卫生间、垃圾处理、物品摆放和晾衣服等。
结果表明,BRS 可以有效地完成多样化的家庭任务。
同时,实验还验证了两项创新方法的有效性。
总体上,JoyLo在数据收集效率、适应性和用户体验方面都有杰出表现,而WB-VIMA则在性能上超过了基线方法。
在JoyLo的用户研究中,团队对10名参与者进行了深度评估,以测试JoyLo的效果和收集数据对策略学习的影响。
从结果来看,JoyLo在所有接口中表现最佳,任务成功率高且完成时间短,其任务平均成功率是VR控制器的5倍,而Apple Vision Pro几乎无人完成所有任务。
此外,WB-VIMA在所有任务中均超越了基准方法,成功率和表现大幅提升,且错误发生率显著减少。与环境物体的碰撞次数很少,且减少了电机因施加过大力量而失去动力的风险。
最后,关于 BRS 框架的所有研究成果均已开源,有兴趣的读者可以深入探索。
项目主页:
https://behavior-robot-suite.github.io/
论文:
https://arxiv.org/abs/2503.05652
算法代码:
https://github.com/behavior-robot-suite/brs-algo
机器人代码:
https://github.com/behavior-robot-suite/brs-ctrl
训练数据:
https://huggingface.co/datasets/behavior-robot-suite/data
参考链接:
https://x.com/drfeifei/status/1899127976979226835
本文来自微信公众号:量子位(ID:QbitAI),作者:一水
广告声明:文内包含的跳转链接(如超链接、二维码等)旨在提供更多信息,节省时间,仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。