Grok 3：马斯克的新一代AI模型能否超越DeepSeek？

8.4K 0

2月18日，马斯克旗下的人工智能公司xAI正式发布了其最新大语言模型Grok 3，并进行了直播演示。马斯克在社交平台X上同步开启了这场备受瞩目的直播活动。直播中，马斯克宣称Grok 3已经超越了当前市场上所有已发布的人工智能模型，特别是在数学推理、科学逻辑推理及代码编写方面表现出色。

Grok系列模型由马斯克的xAI公司开发，其命名灵感来源于美国科幻作家罗伯特·海因莱因的小说《异乡异客》。首款模型Grok 1于2023年11月首次亮相，随后在2024年扩展至3140亿参数，远超GPT-3.5的1750亿参数。2024年8月，Grok 2发布并在X平台上免费提供给用户使用。此次发布的Grok 3，据工程师透露，其训练量是Grok 2的十倍，已在xAI内部运行两周。

Grok 3的强大算力支持

Grok 3的训练使用了总计20万个GPU，分为两个阶段完成。第一阶段使用10万个GPU历时144天，第二阶段则扩展至20万个GPU，耗时92天。相比之下，印度国家级公共计算设施仅配备了1.8万个GPU，用于支持国内AI发展及模型训练。显然，xAI的Grok 3在算力规模上占据了绝对优势，这也为其迅速推出提供了坚实保障。

Grok 3的实际应用展示

在直播活动中，xAI工程师展示了Grok 3的多项功能，包括生成一段太空发射的3D动画代码和制作一款结合“宝石迷阵”与“俄罗斯方块”的游戏。这些演示表明Grok 3对复杂知识的理解能力非常出色。马斯克表示，Grok 3比Grok 2强大一个数量级，多位知名人士如Alexandr Wang、Amjad Masad和Lex Fridman也对这款新模型给予了高度评价。

Grok 3与竞争对手的对比

在Grok 3发布之前，DeepSeek凭借其低成本训练路线在全球范围内引起了广泛关注。然而，在最新的AIME 2025性能测试中，Grok 3 Reasoning Beta版本分别获得了93、85和79分，均高于DeepSeek-R1的80、71和65分。前特斯拉AI总监Andrej Karpathy提前体验后指出，Grok 3确实能够实现一些DeepSeek-R1无法完成的任务。尽管如此，也有分析认为Grok 3在某些特定任务上的表现并未显示出明显优势。

Grok 3的未来发展

马斯克表示，Grok 3仍处于早期训练阶段，未来将不断优化。从今天起，X平台Premium Plus订阅用户将率先获得Grok 3的访问权限。此外，xAI还推出了一项名为Super Grok的独立订阅服务，具体价格尚未公布。马斯克还提到，工程师团队正在训练Grok 3的迷你版本，有时表现甚至优于完整的推理模型。