DeepMind新模型RT-2 ，泛化性能提升3倍

2023-07-31 09:22:51来源：热度:

日前，DeepMind在官方博客网站发布新模型Robotic Transformer 2 (RT-2)。据介绍，该模型为新的视觉语言动作（VLA）模型，可以从网页和机器人数据中学习并将这些知识转化为机器人控制的通用指令。模型在在网络规模的数据集上进行训练，使这些系统非常擅长识别视觉或语言模式并跨不同语言进行操作。该模型突出了泛化和突发技能的提升，相比RT-1，泛化性能提升了3倍以上，执行新任务的效率从 32% 提高到 62%。