Grok 3 发布：马斯克的 AI 新宠如何颠覆行业格局

5.2K 0

发布以来备受瞩目的 Grok 3 终于在北京时间2025年2月18日中午正式亮相，马斯克携 xAI 团队进行了首发直播。这款被誉为“地球上最聪明的 AI”的模型，展示了其在多个方面的卓越性能。Grok 3 不仅在计算资源上远超前代，还在多项基准测试中超越了当前市场上的主流模型。

马斯克在发布会上提到，Grok 3 的性能相比 Grok 2 提升了一个数量级，这得益于 Colossus 超级计算机的强大支持。该计算机配备了10万颗英伟达 H100 GPU，提供了超过2亿 GPU 小时的计算资源，是 Grok 2 的10倍。xAI 团队在短短八个月内完成了这一超级计算机的建设，并在后续的几个月内进一步扩展至20万 GPU 集群，显著提升了计算效率。

Grok 3 的技术突破

Grok 3 的强大不仅体现在硬件上，其软件性能同样令人瞩目。xAI 团队展示了 Grok 3 在数学、科学和编程基准测试中的出色表现，超越了包括 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro 在内的多个竞争对手。特别是 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 版本，凭借其强大的推理能力，成功超越了 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。

现场演示：Grok 3 的实际应用

在直播中，xAI 团队还展示了 Grok 3 的实际应用能力。首先是生成一段关于太空发射的3D动画代码，Grok 3 仅用两分钟就生成了可直接运行的 Python 代码，并成功展示了3D动画。接着，团队要求 Grok-3 制作一款结合俄罗斯方块和宝石迷阵的游戏，Grok 3 同样在短时间内给出了满意的答案。最后，团队推出了基于 Grok 3 的全新搜索引擎 DeepSearch，该引擎不仅能搜索网页，还能推测用户的真实意图，确保返回最准确的答案。

用户反馈与未来展望

直播结束后，Grok 3 引发了广泛讨论。AI 专家卡帕西对其“思考”功能给予了高度评价，认为它能够出色地解决复杂问题。然而，也有用户指出 Grok 3 在某些方面仍存在不足，比如在编程方面表现不如预期。尽管如此，总体来看，Grok 3 的表现接近甚至超过了 OpenAI 的 o1-pro 模型，略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。Imarena.ai 测试后更是表示，Grok-3 是首个突破1400分的模型，在所有类别中排名第一。

目前，Grok 3 的首批访问权限将优先给予 X 上的 Premium+ 订阅者，普通用户的访问时间尚未确定。随着更多用户体验和反馈的积累，Grok 3 是否能继续保持其领先地位，还需时间验证。无论如何，Grok 3 的发布无疑为 AI 行业带来了新的变革，未来值得期待。