科学家研发出了一种基于模仿学习的方法,它可使机器人最少只需一次演示就能学会并泛化技能。该研究的作者证明,通过这种方法,机器人可在不到 24 小时内学会 1000 个不同的任务,每项任务都只需极少的人类演示即可——其中包括折叠衣物、开门和将面包放入烘烤机中等日常工作。尽管人类和动物都可以通过模仿而快速掌握技能,但机器人则可能需要数百至数千次演示才能完成极少数的任务。因此,将学习扩展到包含多个任务可能颇具挑战性且耗费资源。鉴此阙漏,Kamil Dreczkowski 和同事设计了一种基于模仿学习的方法并将其命名为“多任务轨迹迁移”(Multi-Task Trajectory Transfer, MT3)。该方法采用两种策略;第一种策略:将机器人定位于目标物附近;第二种策略:从先前的演示中检索数据;机器人接着可以将这些数据泛化以完成手头工作。为评估 MT3 的功能,Dreczkowski 等人训练了一个配备有夹具和头戴式摄像头的 Sawyer 机器人;他们让其执行一系列涉及不同复杂程度的任务,例如将一枚硬币投入存钱罐及将马克杯叠放在盘子上。他们接着证明,在不到 24 小时的人工训练时间内,该机器人可以从单次演示中学会操作 1000 项不同的任务。总体而言,MT3 在完成“已见过”任务(即先前通过模仿学过的操作)时的平均成功率略高于 78%,在完成“未见过”任务(即需要通过技能泛化完成的不熟悉的操作)时的平均成功率为 68%。作者提出,未来的研究或可将他们的方法进行扩展,旨在协调双臂以完成更复杂的操做任务。