Grok 3 发布:马斯克的超级 AI 如何超越 DeepSeek 和 ChatGPT
2025年2月18日,马斯克带领 xAI 团队正式发布了 Grok 3,这款被誉为“地球上最聪明的 AI”在发布会上吸引了众多关注。Grok 3 的发布不仅标志着 xAI 在人工智能领域的新里程碑,还预示着 AI 技术即将迎来新一轮的变革。马斯克在 X 上提前预告了这一重磅消息,并表示 Grok 3 的性能将比前一代强大一个数量级。
Grok 3 的训练依赖于一台名为 Colossus 的超级计算机,该计算机仅用八个月就建成,配备了10万颗英伟达 H100 GPU,提供了超过2亿 GPU 小时的计算资源。相较 Grok 2,Grok 3 的计算资源增加了10倍,显著提升了其处理庞大数据集的能力,缩短了训练时间。xAI 团队透露,他们最初搭建10万 GPU 集群耗时122天,而扩展至20万 GPU 仅用了92天。
Grok 3 的卓越性能
发布会上,xAI 展示了 Grok 3 在多个基准测试中的出色表现。特别是在数学、科学和编程领域,Grok 3 和 Grok-3 mini 超越了所有主流模型,如 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro。尤其在推理能力方面,Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 版本的表现尤为突出,超越了 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。
实际应用展示
为了展示 Grok 3 的实际应用能力,xAI 团队现场演示了几个任务。首先是要求 Grok 3 生成一段关于太空发射的3D动画代码。Grok 3 在大约两分钟后生成了可直接运行的 Python 代码,并成功展示了可以运行的 3D 动画。接下来,团队要求 Grok 3 制作一款结合俄罗斯方块和宝石迷阵的游戏,Grok 3 也在几分钟内给出了答案。
全新的搜索功能:DeepSearch
除了强大的推理和生成能力,Grok 3 还推出了基于其技术的全新搜索引擎——DeepSearch。DeepSearch 不仅能够搜索网页并查找现有资料,还能“推测用户的真实意图”,并通过交叉对比多个信息源确保“返回最准确的答案”。这种搜索功能使得 DeepSearch 在处理复杂问题时表现出色,例如回答 Apple 新品发布、Palantir 股价上涨等问题。
用户的初步反馈
直播结束后,不少用户分享了自己的使用体验。AI 大牛卡帕西指出,Grok 3 在解决复杂问题方面表现出色,例如创建《卡坦岛》风格的棋盘游戏网页。相比其他顶级模型,Grok 3 更加灵活和高效。然而,Grok 3 在幽默和道德问题上的表现仍需改进,有时会生成重复笑话或对复杂伦理问题过于敏感。尽管如此,总体而言,Grok 3 的表现接近 OpenAI 的 o1-pro 模型,并略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。
未来展望
Grok 3 的发布无疑为 AI 领域带来了新的活力,但其最终表现如何还需更多用户的验证。第一批获得访问权限的用户将是 X 上的 Premium+ 订阅者,而普通用户何时能体验到这一强大的 AI 工具,目前尚不清楚。无论如何,Grok 3 的出现已经引发了广泛的关注和讨论,未来的发展值得期待。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...