Grok 3:马斯克的新一代AI模型能否超越DeepSeek?
2月18日,马斯克旗下的人工智能公司xAI正式发布了其最新大语言模型Grok 3,并进行了直播演示。马斯克在社交平台X上同步开启了这场备受瞩目的直播活动。直播中,马斯克宣称Grok 3已经超越了当前市场上所有已发布的人工智能模型,特别是在数学推理、科学逻辑推理及代码编写方面表现出色。
Grok系列模型由马斯克的xAI公司开发,其命名灵感来源于美国科幻作家罗伯特·海因莱因的小说《异乡异客》。首款模型Grok 1于2023年11月首次亮相,随后在2024年扩展至3140亿参数,远超GPT-3.5的1750亿参数。2024年8月,Grok 2发布并在X平台上免费提供给用户使用。此次发布的Grok 3,据工程师透露,其训练量是Grok 2的十倍,已在xAI内部运行两周。
Grok 3的强大算力支持
Grok 3的训练使用了总计20万个GPU,分为两个阶段完成。第一阶段使用10万个GPU历时144天,第二阶段则扩展至20万个GPU,耗时92天。相比之下,印度国家级公共计算设施仅配备了1.8万个GPU,用于支持国内AI发展及模型训练。显然,xAI的Grok 3在算力规模上占据了绝对优势,这也为其迅速推出提供了坚实保障。
Grok 3的实际应用展示
在直播活动中,xAI工程师展示了Grok 3的多项功能,包括生成一段太空发射的3D动画代码和制作一款结合“宝石迷阵”与“俄罗斯方块”的游戏。这些演示表明Grok 3对复杂知识的理解能力非常出色。马斯克表示,Grok 3比Grok 2强大一个数量级,多位知名人士如Alexandr Wang、Amjad Masad和Lex Fridman也对这款新模型给予了高度评价。
Grok 3与竞争对手的对比
在Grok 3发布之前,DeepSeek凭借其低成本训练路线在全球范围内引起了广泛关注。然而,在最新的AIME 2025性能测试中,Grok 3 Reasoning Beta版本分别获得了93、85和79分,均高于DeepSeek-R1的80、71和65分。前特斯拉AI总监Andrej Karpathy提前体验后指出,Grok 3确实能够实现一些DeepSeek-R1无法完成的任务。尽管如此,也有分析认为Grok 3在某些特定任务上的表现并未显示出明显优势。
Grok 3的未来发展
马斯克表示,Grok 3仍处于早期训练阶段,未来将不断优化。从今天起,X平台Premium Plus订阅用户将率先获得Grok 3的访问权限。此外,xAI还推出了一项名为Super Grok的独立订阅服务,具体价格尚未公布。马斯克还提到,工程师团队正在训练Grok 3的迷你版本,有时表现甚至优于完整的推理模型。
总结
虽然AI领域的竞争异常激烈,但Grok 3的出现无疑为马斯克赢得了一席之地。随着技术的进步和市场的变化,究竟哪款AI模型能够最终胜出,还有待时间的检验。但可以肯定的是,马斯克的xAI公司在人工智能领域已经迈出了坚实的一步。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...