中国AI六小龙之阶跃星辰:多模态与推理能力驱动智能终端革新
最低调的“AI六小龙”之一阶跃星辰,在当前的DeepSeek浪潮中,率先提交了2025年的首份答卷。面对Scaling Law是否可持续、开源还是闭源以及AI落地路径是否可行等问题,阶跃星辰在首届Step UP生态开放日上展示了其探索通用人工智能(AGI)的新方法。公司不仅开启了多模态推理的研究,还将重点放在智能终端的应用上,涵盖汽车、手机、具身智能和物联网(IoT)等领域。
阶跃星辰的创始人兼CEO姜大昕认为,智能终端将成为智能体(Agent)技术广泛应用的重要载体。智能体的发展依赖于两个核心要素:一是多模态能力,使智能体能够更好地感知和理解周围环境;二是推理能力,这使得智能体具备长时间思考、规划、尝试和反思的能力,从而提供更精准的服务。阶跃星辰在六小龙中以多模态技术著称,已推出11款涵盖多种能力的多模态大模型。
多模态与推理能力的结合
阶跃星辰近期开源了Step-Video-T2V视频生成模型和Step-Audio语音模型,成为六小龙中最先拥抱开源的一员。此外,公司还与清华大学合作开发了开源推理模型Open-Reasoner-Zero,该模型在预训练阶段就进行了大规模强化学习,效率是DeepSeek-R1-Zero的25倍。姜大昕透露,公司正在研发视觉推理模型,进一步提升智能体的理解能力。
智能终端应用场景
在汽车领域,阶跃星辰与吉利合作推出了智能座舱Agent,通过语音和视觉的多模态交互实现了“可见即可说”的功能。在手机方面,阶跃星辰与OPPO合作开发了一键问屏功能,用户可以通过拍照或截图直接获取信息,无需手动切换应用程序。在IoT领域,阶跃星辰与TCL等厂商合作,实现了设备间的智能化联动。此外,阶跃星辰还与智元机器人合作,探索AI在具身智能领域的应用。
未来展望
姜大昕提出了AGI发展的三个阶段:模拟世界、探索世界和归纳世界。模拟世界阶段通过模仿学习训练多模态模型;探索世界阶段引入强化学习,赋予模型逻辑推理和问题解决能力;归纳世界阶段则致力于让AI自主发现物理规律,最终实现与科学家的协同创新。阶跃星辰选择了一条与众不同的道路,将智能终端作为智能体的载体,这可能预示着下一次人机交互革命的到来。