2025年4月8日  星期二
首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

智元发布首个通用具身基座大模型:完成小样本快速泛化,降低具身智能门槛

2025年3月10日 13:21  每日经济新闻  

3月10日,智元发布首个通用具身基座大模型——智元启元大模型(GO-1)。据了解,该架构由VLM(多模态大模型)+MoE(混合专家)组成。其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。三者环环相扣,可以利用人类视频学习、完成小样本快速泛化并且降低具身智能门槛。其已成功部署到智元多款机器人(21.120, 1.59, 8.14%)本体,而且还会持续进化,将具身智能推上一个新台阶。

对于多模态大模型与混合专家大模型的具体分工,智元具身研究中心常务主任任广辉回复《每日经济新闻》记者问题时表示:“我们多模态大模型本身,自带了一个专家。Latent Planner负责我们互联网规模的图文录像训练,它来理解视频中的动作,比如倒水这个动作,肯定需要手腕旋转。而Action Expert(动作专家),则是在看了很多理论,看了很多视频动作后,负责在机器人本体(上的)执行。”

任广辉补充表示:“各个模型分工明确,各司其职,并且是分层的。就如人类学东西一样,先学理论,再看别人如何操作,再自己操作。这样分层次(学习),也令整个学习、训练相对而言更容易一点。”

编 辑:章芳
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
vivo胡柏山:手机行业是最典型的新质生产力代表
精彩专题
聚焦2025全国两会
2025年世界移动通信大会
低空经济2025:助力中国经济腾飞,成就高质量发展
2024通信业年终盘点
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像