Grok 3 发布：马斯克的超级 AI 如何超越 DeepSeek 和 ChatGPT

4.7K 0

2025年2月18日，马斯克带领 xAI 团队正式发布了 Grok 3，这款被誉为“地球上最聪明的 AI”在发布会上吸引了众多关注。Grok 3 的发布不仅标志着 xAI 在人工智能领域的新里程碑，还预示着 AI 技术即将迎来新一轮的变革。马斯克在 X 上提前预告了这一重磅消息，并表示 Grok 3 的性能将比前一代强大一个数量级。

Grok 3 的训练依赖于一台名为 Colossus 的超级计算机，该计算机仅用八个月就建成，配备了10万颗英伟达 H100 GPU，提供了超过2亿 GPU 小时的计算资源。相较 Grok 2，Grok 3 的计算资源增加了10倍，显著提升了其处理庞大数据集的能力，缩短了训练时间。xAI 团队透露，他们最初搭建10万 GPU 集群耗时122天，而扩展至20万 GPU 仅用了92天。

Grok 3 的卓越性能

发布会上，xAI 展示了 Grok 3 在多个基准测试中的出色表现。特别是在数学、科学和编程领域，Grok 3 和 Grok-3 mini 超越了所有主流模型，如 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro。尤其在推理能力方面，Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 版本的表现尤为突出，超越了 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。

实际应用展示

为了展示 Grok 3 的实际应用能力，xAI 团队现场演示了几个任务。首先是要求 Grok 3 生成一段关于太空发射的3D动画代码。Grok 3 在大约两分钟后生成了可直接运行的 Python 代码，并成功展示了可以运行的 3D 动画。接下来，团队要求 Grok 3 制作一款结合俄罗斯方块和宝石迷阵的游戏，Grok 3 也在几分钟内给出了答案。

全新的搜索功能：DeepSearch

除了强大的推理和生成能力，Grok 3 还推出了基于其技术的全新搜索引擎——DeepSearch。DeepSearch 不仅能够搜索网页并查找现有资料，还能“推测用户的真实意图”，并通过交叉对比多个信息源确保“返回最准确的答案”。这种搜索功能使得 DeepSearch 在处理复杂问题时表现出色，例如回答 Apple 新品发布、Palantir 股价上涨等问题。

用户的初步反馈

直播结束后，不少用户分享了自己的使用体验。AI 大牛卡帕西指出，Grok 3 在解决复杂问题方面表现出色，例如创建《卡坦岛》风格的棋盘游戏网页。相比其他顶级模型，Grok 3 更加灵活和高效。然而，Grok 3 在幽默和道德问题上的表现仍需改进，有时会生成重复笑话或对复杂伦理问题过于敏感。尽管如此，总体而言，Grok 3 的表现接近 OpenAI 的 o1-pro 模型，并略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。