在机器人世界中,您第一次面对的是简单任务的复杂性。对于人类来说,这些任务看起来很简单,但实际上却涉及着潜在的无限变量,这是我们通常所忽视的。然而,机器人并不具备我们这种奢侈品。
因此,大部分行业都致力于处理结构化环境下可重复的任务。然而,近年来,机器人学习的领域取得了一些突破性进展,使得该行业能够创建和部署更具适应性的系统。
去年,Google DeepMind的机器人团队展示了名为Robotics Transformer——RT-1的系统,它通过训练使日常机器人能够执行拣选、放置和打开抽屉等任务。据该团队称,该系统基于包含130,000次演示的数据库,使得700%以上的任务成功率成为可能。
今天,我们正在拆开RT-2的包装。DeepMind的杰出科学家兼机器人负责人Vincent Vanhoucke在一篇博客文章中指出,该系统使机器人能够有效地将在相对较小的数据集上学习到的概念迁移到不同的场景中。
谷歌解释说:“RT-2表现出了改进的泛化能力、语义理解和视觉理解,超越了其所接触到的机器人数据。”该系统能够解释新的指令,并通过执行基本的推理来回应用户的命令,例如对对象类别或高级描述进行推理。因此,该系统有效地展示了在基于现有上下文信息的情况下,确定特定新任务的最佳工具等功能的能力。
Vanhoucke举了一个场景作为例子,其中机器人被要求扔掉垃圾。在许多模型中,用户必须教机器人识别什么是垃圾,然后训练它捡起垃圾并将其扔掉。这种方法涉及太多细节,对于预期执行多样化任务的系统来说并不特别可扩展。
由于RT-2可以从大量网络数据中转移知识,它已经知道垃圾是什么,并且可以在没有明确训练的情况下识别垃圾,”Vanhoucke写道。“它甚至知道如何处理垃圾,尽管从未接受过针对这种行为的训练。想象一下垃圾的抽象本质——一袋薯条或香蕉皮在你吃完后就变成了垃圾。RT-2能够从视觉和语言训练数据中理解这一点并完成相关任务。
该团队表示,在从RT-32升级到RT-62的过程中,执行新任务的效率从1%提高到2%。
暂无评论内容