从谷歌看机器人大模型进展『附报告下载』 - 热点洞察

今天，为大家分享的报告是《从谷歌看机器人大模型进展》，报告共26页，更多重要内容、核心观点，请参考报告原文。

报告核心内容解读

本报告主要探讨了人形机器人、大模型在机器人领域的应用以及机器人产业未来的发展趋势。报告指出，大模型是实现人形机器人通用性和泛化能力的关键要素，具有庞大的先验知识库与强大的通识理解能力，可以满足人形机器人通用性的场景要求和技能要求。此外，报告还介绍了谷歌在机器人大模型上的研究进展，并指出机器人产业仍处于较为早期阶段，未来产业机会主要有算力、数据和细分场景的模型搭建。

1. 大模型在人形机器人中的应用

* 人形机器人的特点在于通用性和泛化能力，远期可以替代人类完成多项任务。

* 大模型具有庞大的先验知识库与强大的通识理解能力，可以满足人形机器人通用性的场景要求和技能要求。

* 大模型可以帮助机器人拆分与分解一件事件如何完成，先解码出计划的步骤，再解码需要完成任务需要输出的动作。

2. 谷歌在机器人大模型上的研究进展

* 从Saycan到RT-X，谷歌持续高速迭代模型，逐步向底层运动控制方面发展。

* RT-1使用传统神经网络的方法来执行SayCan的任务。

* RT-2将VLM大模型与RT-1的机器人执行数据集一起微调训练。

* 创建OpenX数据集训练出模型RT-X。

3. 机器人产业的发展趋势和机会

* 目前大部分机器人大模型仍然以单机械臂抓取为主，且模型的框架仍然在持续变化。

* 大模型现在对底层的控制仍然偏弱。