中国AI六小龙之阶跃星辰：多模态与推理能力驱动智能终端革新

5.4K 0

最低调的“AI六小龙”之一阶跃星辰，在当前的DeepSeek浪潮中，率先提交了2025年的首份答卷。面对Scaling Law是否可持续、开源还是闭源以及AI落地路径是否可行等问题，阶跃星辰在首届Step UP生态开放日上展示了其探索通用人工智能（AGI）的新方法。公司不仅开启了多模态推理的研究，还将重点放在智能终端的应用上，涵盖汽车、手机、具身智能和物联网（IoT）等领域。

阶跃星辰的创始人兼CEO姜大昕认为，智能终端将成为智能体（Agent）技术广泛应用的重要载体。智能体的发展依赖于两个核心要素：一是多模态能力，使智能体能够更好地感知和理解周围环境；二是推理能力，这使得智能体具备长时间思考、规划、尝试和反思的能力，从而提供更精准的服务。阶跃星辰在六小龙中以多模态技术著称，已推出11款涵盖多种能力的多模态大模型。

多模态与推理能力的结合

阶跃星辰近期开源了Step-Video-T2V视频生成模型和Step-Audio语音模型，成为六小龙中最先拥抱开源的一员。此外，公司还与清华大学合作开发了开源推理模型Open-Reasoner-Zero，该模型在预训练阶段就进行了大规模强化学习，效率是DeepSeek-R1-Zero的25倍。姜大昕透露，公司正在研发视觉推理模型，进一步提升智能体的理解能力。

智能终端应用场景

在汽车领域，阶跃星辰与吉利合作推出了智能座舱Agent，通过语音和视觉的多模态交互实现了“可见即可说”的功能。在手机方面，阶跃星辰与OPPO合作开发了一键问屏功能，用户可以通过拍照或截图直接获取信息，无需手动切换应用程序。在IoT领域，阶跃星辰与TCL等厂商合作，实现了设备间的智能化联动。此外，阶跃星辰还与智元机器人合作，探索AI在具身智能领域的应用。

未来展望

姜大昕提出了AGI发展的三个阶段：模拟世界、探索世界和归纳世界。模拟世界阶段通过模仿学习训练多模态模型；探索世界阶段引入强化学习，赋予模型逻辑推理和问题解决能力；归纳世界阶段则致力于让AI自主发现物理规律，最终实现与科学家的协同创新。阶跃星辰选择了一条与众不同的道路，将智能终端作为智能体的载体，这可能预示着下一次人机交互革命的到来。