日前,DeepMind在官方博客网站发布新模型Robotic Transformer 2 (RT-2)。据介绍,该模型为新的视觉语言动作(VLA)模型,可以从网页和机器人数据中学习并将这些知识转化为机器人控制的通用指令。模型在在网络规模的数据集上进行训练,使这些系统非常擅长识别视觉或语言模式并跨不同语言进行操作。该模型突出了泛化和突发技能的提升,相比RT-1,泛化性能提升了3倍以上,执行新任务的效率从 32% 提高到 62%。
责任编辑:众视数字
为您推荐
马斯克揭秘“宇宙级”AI:特斯拉搞硬件、xAI搞模型
两天前马斯克高调宣布成立xAI公司之后,很多人都对这个全新的、似乎不走寻常路的AI公司充满了好奇。