智元机器人发布通用具身基座大模型GO-1,可利用人类视频学习
新浪科技讯 3月10日上午消息,由原华为天才少年稚晖君(彭志辉)创立的智元机器人今日发布,首个通用具身基座大模型GO-1。
据悉,该模型开创性地提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构由VLM(多模态大模型) + MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力,三者环环相扣,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。(文猛)
文章来源于网络,若侵犯了您的合法权益,请来信通知我们,我们会及时删除,给您带来的不便,我们深表歉意。 相关股票
机器人(300024)
|