人形机器人通用大模型Helix发布:实现陌生物品识别与多机器人协作
Figure AI近日发布了名为Helix的端到端人形机器人VLA(视觉-语言-动作)通用大模型,标志着机器人技术在家庭应用领域取得了重大突破。Helix不仅能够对机器人上半身进行高速率连续控制,还可以在两台机器人之间共享运行,完成复杂的长距离操作任务。更重要的是,它能根据自然语言提示,轻松拾取从未见过的小型家用物品。
创新的双系统架构
Helix采用了一种独特的“双系统”方法来控制人形机器人的上半身。系统1(S1)是一个快速反应视觉运动策略,能够将系统2(S2)生成的潜在语义表征转化为精确的连续机器人动作。S2则基于一个70亿参数的视觉语言模型,专注于高层次的目标规划。这样的设计使得每个系统都可以在其最优的时间尺度内运行,既保证了速度又兼顾了通用性。
高效的数据训练与优化
为了确保Helix的有效性和适应性,Figure AI收集了一个包含约500小时的高质量、多机器人、多操作员的多样化遥操作行为数据集。这些数据用于生成自然语言条件下的训练对,确保了模型在实际应用中的广泛适用性和灵活性。此外,所有训练期间处理过的物品都被排除在评估之外,以避免数据污染,确保测试结果的真实性和可靠性。
商业部署与未来展望
Helix能够在嵌入式低功耗GPU上运行,这意味着它可以立即投入商业部署。Figure AI创始人布雷特·阿德科克表示,计划将Helix的规模扩大1000倍,并预计2025年将成为关键的一年,届时将开始生产并出货更多机器人,致力于解决家用机器人面临的问题。尽管前方道路漫长,但阿德科克坚信这一目标是可以实现的。
行业动态与竞争态势
值得注意的是,在Figure AI发布Helix的前一天,深圳市优必选科技股份有限公司也宣布了其在人形机器人领域的最新进展。优必选基于DeepSeek-R1开发的多模态具身推理大模型展现了强大的零样本推理能力。与此同时,OpenAI投资的另一家机器人初创公司1X即将推出新产品,而OpenAI自身也在积极重组机器人部门。国内的宇树科技同样在加速人形机器人的算法升级,显示出AI驱动的机器人正在快速发展。
结语
随着Helix和其他相关技术的进步,人形机器人正逐渐走向成熟,预计在未来几年内将有更多创新成果涌现。这不仅是技术上的突破,更是对未来智能家居和自动化社会的美好愿景。