AGIBOT WORLD CHALLENGE@ICRA 2026 WM赛道放榜：中科院自动化所×高德联合团队斩获冠军，超百支队伍超越baseline

来源：智元机器人

作者：智元机器人 2026-05-07

2026年4月30日，由智元机器人主办、在全球机器人领域顶级学术盛会ICRA 2026框架下举办的AGIBOT WORLD CHALLENGE@ICRA 2026正式完成线上初赛评选。

2026年4月30日，由智元机器人主办、在全球机器人领域顶级学术盛会ICRA 2026框架下举办的AGIBOT WORLD CHALLENGE@ICRA 2026正式完成线上初赛评选。在World Model（WM）赛道中，来自全球多个国家及地区的336支顶尖团队经过两个月角逐，最终决出10支优胜战队。中科院自动化所模式识别实验室与高德地图CV Lab（视觉技术中心）的联合团队NeoVerse-Abot登顶榜首，赢得本届World Model赛道冠军。
ICRA（国际机器人与自动化大会）自1984年创办以来，始终引领机器人技术创新，每届吸引超5000名全球顶尖学者、工程师及企业领袖参与。本届大赛依托ICRA 2026与智元业界领先的全栈开发生态举办，是具身智能领域兼具学术公信力、产业标杆意义与全球影响力的顶级赛事。
本次大赛的World Model赛道采用线上竞赛形式，依托智元自研的EWMBench（Embodied World Model Benchmark）评测基准，参赛者基于AGIBOT WORLD开源数据集训练模型，在给定机器人动作序列与初始传感器图像的条件下，预测其在任务执行过程中视觉视角的演变。相比主流视频生成基准，EWMBench更关注物理世界的具身交互理解，在与人类主观判断一致性上表现更优。评测聚焦Action-conditioned World Model细分赛道，从图像质量、场景一致性、轨迹遵循度三个维度提供稳定可靠的性能反馈。赛制采用无人工全自动评测、实时榜单更新、指标盲盒与每日提测限制，构建严苛防hack的公平环境。区别于依赖仿真数据的基准，赛道依托AGIBOT WORLD百万真机数据集构建训练集，测试集中包含空抓、掉落等不完美轨迹，考察模型在分布外场景下对动作信号的跟随能力及物理属性模拟能力，更贴近世界模型的真实使用场景。
本届World Model赛道竞争激烈程度空前。评测数据显示，共有超过100支队伍的成绩超越基线模型，参赛队伍成绩分差极小，充分体现了全球研究团队在具身世界模型领域的整体技术水准已跃升至新高度。最终，来自中科院自动化所模式识别实验室与高德地图CV Lab（视觉技术中心）的联合团队NeoVerse-Abot登顶榜首，赢得本届AGIBOT WORLD CHALLENGE World Model赛道的冠军。NeoVerse-Abot团队成员长期聚焦世界模型、视觉感知、空间理解与场景建模，通过前沿学术研究与真实场景工程能力的结合，探索世界模型在机器人开放环境理解、任务泛化和智能决策中的应用潜力。在视觉质量以外，团队重点关注如何使生成模型绝对精准地跟随动作条件控制，克服概率模型天然的随机性，同时保持在failure/novel action条件下的生成效果。参赛过程中，团队克服了将智能体的动作指令空间与视觉感知空间精准对齐和视频世界模型训练成本两大核心挑战，在真实机器人任务导向的基准上检验了自身的World Model方案，也帮助团队建立了更完整的实验和工程体系。“我们认为这次比赛非常有价值”，NeoVerse-Abot团队负责人表示，“首先，这次比赛的数据来自于主办方之前发布的AgiBot World超大规模数据集，参赛队伍能够在足量的数据条件下去验证和推进当前世界模型方法的真正性能边界，拿到足够可靠的结论，排除很多非本质因素对科学结论的干扰。同时，比赛把 World Model 放在具身智能和机器人任务的真实环境下进行评测，推动大家思考世界模型如何服务于机器人理解、预测和决策，是一项对领域发展很有推动意义的挑战。”
WM赛道榜单还汇聚了来自中科院工业人工智能研究所、中科院计算技术研究所、中科大、重庆大学等顶尖科研机构与高校的强劲团队。各支队伍在生成质量、动作跟随、物理模拟与长程推理等核心维度上各具突破，共同推动了具身世界模型从视觉生成向智能决策的技术跃迁。亚军物理智能团队（PAI@IAII）由中科院工业人工智能研究所徐凯研究员领衔，徐凯深耕计算机图形学、三维视觉与工业具身智能、数字孪生领域，主持多项国家级重点基金，担任图形领域顶级国际期刊编委，连续多年入选全球前2%顶尖科学家榜单，是兼具深厚学术影响力与工程应用实力的工业人工智能领域权威大咖。第五名VIPL-GENUN来自中科院计算技术研究所视觉信息处理与学习（VIPL）研究组，在计算机视觉、机器学习和人工智能领域享有盛誉。参赛团队主要围绕视频生成世界模型开展研究，关注如何利用生成式视频模型对环境动态、物体交互、物理规律和智能体行为结果进行建模。团队负责人表示，当前世界模型从“能生成”到“能预测、能交互、能辅助决策”之间仍存在不少关键问题，此次比赛对他们的后续研究有着重要启发：“未来的视频生成世界模型需要更强的记忆能力、更可靠的交互建模，以及更稳定的长时一致性。这是我们通过此次比赛确认的后续（研究）方向。”
本次AGIBOT WORLD CHALLENGE@ICRA 2026 World Model赛道的优胜方案将为行业提供宝贵的技术参考，加速具身世界模型从开发研究到部署落地的进程。智元将继续携手全球开发者，共筑具身智能新高度，见证具身智能从“开发态”向“部署态”跃迁的宏大时代浪潮。

责任编辑：小羊