智元机器人推出通用基座大模型GO-1，期待新人形机器人的精彩亮相！

来源：星火智游网责编：网络时间：2025-04-03 01:16:01

在机器人技术的前沿探索中，一款名为智元启元大模型Genie Operator-1（简称GO-1）的创新成果于近日震撼发布，标志着通用具身智能基座模型迈出了重要一步。这款由智元机器人精心打造的模型，凭借其独特的Vision-Language-Latent-Action（ViLLA）框架，正引领着具身智能向更加通用化、开放化与智能化的方向加速前进。

智元机器人推出通用基座大模型GO_1，期待新人形机器人的精彩亮相！

GO-1的核心竞争力在于其ViLLA框架，该框架巧妙融合了VLM（多模态大模型）与MoE（混合专家）技术。VLM作为主干网络，基于开源多模态大模型的权重，并通过互联网大规模纯文本和图文数据的训练，赋予了GO-1强大的场景感知与理解能力。而MoE则通过隐动作专家模型和动作专家模型的协同工作，利用互联网上的大规模人类操作和跨本体操作视频，以及高质量的仿真数据和真机数据，使GO-1具备了动作的理解与精细执行能力。

GO-1的五大特点尤为引人注目：采训推一体化设计，实现了数据采集、模型训练与模型推理的无缝对接；小样本快速泛化能力，让GO-1能够在极少数据甚至零样本的情况下快速适应新场景与新任务；一脑多形特性，使其能够轻松迁移至不同机器人形态，快速适配各种本体；持续进化机制，借助智元的数据回流系统，GO-1能够不断从实际执行中遇到的问题数据中学习进化；人类视频学习能力，则让GO-1能够结合互联网视频和真实人类示范，进一步增强对人类行为的理解。

智元机器人推出通用基座大模型GO_1，期待新人形机器人的精彩亮相！

在构建过程中，GO-1采用了具身领域的数字金字塔结构。底层是互联网的大规模纯文本与图文数据，为机器人提供通用知识与场景理解的基础。往上是人类操作/跨本体视频数据，帮助机器人学习动作操作模式。再往上则是仿真数据，用于增强泛化性。而金字塔的顶层，则是高质量的真机示教数据，确保机器人能够精准执行动作。这一结构使得GO-1能够全面适应新场景，轻松面对多样化的环境和物体，快速学习新的操作。

智元机器人推出通用基座大模型GO_1，期待新人形机器人的精彩亮相！

在实际应用中，GO-1展现出了惊人的表现。用户只需通过简单的语言指令，如“挂衣服”，GO-1便能根据视觉信号和语言指令，直接输出并执行相应的动作。这一过程中，GO-1能够准确理解指令含义，预测并规划出执行步骤，最终精准完成任务。无论是家庭场景中的准备餐食、收拾桌面，还是办公和商业场景中的接待访客、发放物品，GO-1都能游刃有余地应对。

智元机器人推出通用基座大模型GO_1，期待新人形机器人的精彩亮相！