OK-Robot是一种新的人工智能系统,它使机器人能够收拾新的家。系统可以识别物体并将它们放置在正确的位置。OK-Robot在非常混乱的房间里仍然表现不佳,但Meta的项目在不太混乱的房间里要成功得多。
新的OK-Robot人工智能系统旨在让各种机器人能够清理对它们来说全新的房间。例如,他们可以从地板上捡起衣物或玩具并将其放在其他地方。其他机器人系统通常设计为在熟悉的环境中运行。
OK-Robot与VLM(视觉语言模型)配合使用,VLM是一种人工智能系统,能够同时处理和理解文本或直接语音和图像中的信息。有趣的是,OK-Robot可与各种开源人工智能模型配合使用,并已使用公开的大型数据集进行了预训练。
从积极的一面来看,您不必在环境中为机器人提供任何额外的训练数据,它就可以正常工作。不利的一面是,它只能拾起一个物体并将其扔到其他地方。你不能要求它打开抽屉,因为它只知道如何做这两件事。
该系统由纽约大学和Meta的研究人员使用HelloRobot的商用机器人Stretch进行了测试。在不同的家庭中进行了171次拾放实验。在实验过程中,机器人使用Record3DiPhone应用程序扫描环境以创建3D视频。然后,OKRobot系统在视频的每一帧上运行人工智能对象识别模型。
这使得机器人能够识别其环境中的所有物体,例如桌子、沙发、眼镜、鞋子和灯。然后它被指示捡起某些物品,只要房间不是太杂乱,它在82.2%的情况下都会这样做。然而,在更加混乱的房间中,成功率明显较低。
我想说,完全依赖现成的模型是很不寻常的,而且让它们发挥作用是相当令人印象深刻的。我们已经看到了机器学习的一场革命,它使得创建不仅可以在实验室工作而且可以在开放世界中工作的模型成为可能。看到这实际上在真实的物理环境中起作用是非常有用的信息。