英格丽德·法德利 , 科技探索
人工智能(AI)工具的性能,包括用于自然语言处理(NLP)和计算机视觉算法的大型计算模型,在过去几十年中一直在迅速提高。原因之一是用于训练这些算法的数据集呈指数级增长,收集了通常从互联网收集的数十万张图像和文本。
另一方面,机器人控制和规划算法的训练数据仍然不够丰富,部分原因是获取数据并不那么简单。因此,一些计算机科学家一直在尝试创建更大的数据集和平台,用于训练各种机器人应用的计算模型。
在最近的一篇论文中,预先发布在服务器上 arXiv 德克萨斯大学奥斯汀分校和 NVIDIA Research 的研究人员将在机器人技术:科学与系统 2024 年会议上展示其中一款平台,名为 RoboCasa。
RoboCasa 是一个大型仿真框架,可用于训练多面手机器人完成日常环境中的各种任务。
该论文的主要作者 Yuke Zhu 告诉 Tech Xplore:“人工智能领域的最新进展在很大程度上是通过在海量数据源上训练大型模型来推动的。”
“受到这些进步的启发,我们寻求为能够执行各种日常任务的通用机器人开发基础模型。RoboCasa 旨在提供训练此类机器人基础模型所需的高质量仿真数据。”
Zhu、Soroush Nasiriany、Abhiram Maddukuri、Lance Zhu、Adeet Parikh、Aaron Lo、Abhishek Joshi 和 Ajay Mandlekar 最近工作的主要目标是开发一个新的开源仿真平台,以促进机器人算法的训练。
他们的努力最终促成了 RoboCasa 的开发,这是他们几年前推出的模拟框架 RoboSuite 的扩展。 RoboSuite 用作团队用来创建 RoboCasa 模拟环境的模拟基础设施。
“我们利用生成式人工智能工具来创建不同的对象资产、场景和任务,”朱解释道。 “这些人工智能工具显着提高了模拟世界的多样性和真实性。此外,RoboCasa 支持各种机器人硬件平台,并提供超过 10 万条轨迹的大型数据集用于模型训练。”
RoboCasa 平台包括数千个 3D 场景,其中包含 150 多种不同类型的日常物品以及数十种家具和电器。 RoboCasa 具有高度真实的模拟功能,并通过生成式 AI 工具进行了丰富。
Zhu 和他的同事设计了 100 个可以训练机器人算法的任务,并为这些任务编写了高质量的人类演示。他们的平台还包括生成有效轨迹和运动的方法,使机器人能够完成这些任务。
“有两个重要的发现最让我兴奋,”朱说。 “首先,我们展示了一种扩展趋势:随着我们增加(机器生成的)训练数据集的大小,模型的性能稳步增长。其次,通过将模拟数据与真实数据相结合,我们发现增强的数据集增强了机器人在现实世界任务中的表现。”
更多信息: Soroush Nasiriany 等人,RoboCasa:多面手机器人日常任务的大规模模拟, arXiv (2024)。作者:10.48550/archiv.2406.02523
期刊信息: arXiv
© 2024 科学 X 网络