12月18日,北京人形机器人创新中心(简称“北京人形”)开源了国内首个通过具身智能国标测试、面向具身小脑能力的VLA模型——XR-1。同时发布的还有为XR-1等模型提供数据训练支持的RoboMIND 2.0和ArtVIP两款工具。
XR-1具备跨数据源学习、跨模态对齐和跨本体控制三大核心能力。今年,该模型已在世界机器人大会上正式亮相。
通过跨数据源学习,机器人能够利用海量人类视频进行训练,从而有效降低训练成本并提升训练效率;依靠跨模态对齐技术,XR-1打破视觉与动作之间的障碍,实现真正的知行合一;借助跨本体控制,XR-1能快速适配不同类型和品牌的机器人本体。
据介绍,北京人形采用UVMC(多模态视动统一表征)技术,构建了视觉与动作之间的映射桥梁,使机器人能够将所见画面瞬间转化为本能反应,自然作出正确应对动作。此外,多构型预训练能力赋予天工2.0全身多关节拟人控制,实现大幅弯腰下蹲并精准抓取随机摆放的物料箱。

(澎湃新闻记者 秦盛)
https://finance.sina.com.cn/jjxw/2025-12-20/doc-inhcmnmm6764557.shtml