OpenAI机械手成精了 无需训练能自行掌握人类行为

腾讯科技讯 7月31日消息,据外媒报道,用手抓东西是婴儿学会做的第一件事,但这绝不是一件简单的事情,它会随着人的成长而变得更加复杂多变,这种复杂性使得机器很难掌握人类的行为能力。

不过,美国连续创业家伊隆·马斯克(Elon Musk)和萨姆·艾尔特曼(Sam Altman)支持的OpenAI公司研究人员,已经创造出一套系统,它不仅能像人类一样抓握和操纵物体,而且还是自行领悟出这些行为能力的,根本无需人类教导。

 

许多机器人和机械手已经精通某些抓握或其他动作,比如工厂里的机器人可以比人类更灵巧地挥舞螺栓枪。但是帮助机器人完成这项任务的软件很可能是手写的,而且非常复杂。即使是在同一条生产线上,比如焊接,也需要一个全新的系统。

对于人类来说,拿起苹果和拿起杯子似乎没什么区别。不过,差异是确实存在的,只是我们的大脑会自动填补空白,让我们可以随机应变,安全地握住不熟悉的物体。这是机器人远远落后于人类的领域。

此外,你不能仅仅通过训练机器人去做人类能做的事,你必须提供数以百万计的例子来充分展示,人类如何操控成千上万个给定的物体。

OpenAI的研究人员认为,解决方案就是根本不使用人类数据。取而代之的是,他们让计算机在模拟中反复尝试和失败,慢慢地学习如何移动手指,以便它所掌握的对象能够按照需要移动。

研究人员称这套系统为Dactyl,他们只为其提供手指的位置和三种手持对象的摄像头视角。但在训练时,所有这些数据都是在虚拟环境中进行模拟的。

在这种环境中,计算机不需要实时工作。它可以在几秒钟内尝试上千种不同的方法去抓住一个对象,分析结果并将数据转发到下一次尝试中。这只机械手本身就像影子般灵巧的手,也比大多数机械手复杂。

 

除了需要了解的不同物体和姿势之外,还有其他随机参数,比如指尖的摩擦力、场景的颜色和灯光等等。你不能模拟现实中的每个方面,但是你可以确保系统不只是在一个蓝色的房间里工作,或在带有特殊标记的立方体上工作。

研究人员在这个问题上投入了大量的精力:6144个CPU和8个GPU,在50个小时内收集了大约100年的经验。然后他们将这个系统首次应用到现实世界中,它展示了许多令人惊讶的类人行为。

我们在不经意间用手做的事情,比如把一个苹果转过来看看有没有擦伤,或者把一杯咖啡递给朋友时,需要用很多小技巧来稳定或移动物体。Dactyl重新创建了其中的几个过程,例如用拇指和中指握住物体,而用剩下的手指将其旋转到想要的方向。

这个系统的伟大之处在于它的运动的自然性,以及它们是通过反复试验而独立完成的,它与任何特定的形状或物体类型无关。就像人类一样,Dactyl的确可以控制和操纵被放在它手里的任何东西。

这种灵活性被称为泛化,对于必须与现实世界交互的机器人来说,这一点很重要。对于世界上的每个物体和每种情况来说,手工编码行为模式是不可能的,但是机器人能够在依赖核心理解能力的前提下适应并填补这些空白。 

相关产品

评论