Grok 3 发布:马斯克的 AI 新宠如何颠覆行业格局

AI资讯2个月前发布 WriteRanger
5.2K 0

发布以来备受瞩目的 Grok 3 终于在北京时间2025年2月18日中午正式亮相,马斯克携 xAI 团队进行了首发直播。这款被誉为“地球上最聪明的 AI”的模型,展示了其在多个方面的卓越性能。Grok 3 不仅在计算资源上远超前代,还在多项基准测试中超越了当前市场上的主流模型。

马斯克在发布会上提到,Grok 3 的性能相比 Grok 2 提升了一个数量级,这得益于 Colossus 超级计算机的强大支持。该计算机配备了10万颗英伟达 H100 GPU,提供了超过2亿 GPU 小时的计算资源,是 Grok 2 的10倍。xAI 团队在短短八个月内完成了这一超级计算机的建设,并在后续的几个月内进一步扩展至20万 GPU 集群,显著提升了计算效率。

Grok 3 的技术突破

Grok 3 的强大不仅体现在硬件上,其软件性能同样令人瞩目。xAI 团队展示了 Grok 3 在数学、科学和编程基准测试中的出色表现,超越了包括 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro 在内的多个竞争对手。特别是 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 版本,凭借其强大的推理能力,成功超越了 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。

现场演示:Grok 3 的实际应用

在直播中,xAI 团队还展示了 Grok 3 的实际应用能力。首先是生成一段关于太空发射的3D动画代码,Grok 3 仅用两分钟就生成了可直接运行的 Python 代码,并成功展示了3D动画。接着,团队要求 Grok-3 制作一款结合俄罗斯方块和宝石迷阵的游戏,Grok 3 同样在短时间内给出了满意的答案。最后,团队推出了基于 Grok 3 的全新搜索引擎 DeepSearch,该引擎不仅能搜索网页,还能推测用户的真实意图,确保返回最准确的答案。

用户反馈与未来展望

直播结束后,Grok 3 引发了广泛讨论。AI 专家卡帕西对其“思考”功能给予了高度评价,认为它能够出色地解决复杂问题。然而,也有用户指出 Grok 3 在某些方面仍存在不足,比如在编程方面表现不如预期。尽管如此,总体来看,Grok 3 的表现接近甚至超过了 OpenAI 的 o1-pro 模型,略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。Imarena.ai 测试后更是表示,Grok-3 是首个突破1400分的模型,在所有类别中排名第一。

目前,Grok 3 的首批访问权限将优先给予 X 上的 Premium+ 订阅者,普通用户的访问时间尚未确定。随着更多用户体验和反馈的积累,Grok 3 是否能继续保持其领先地位,还需时间验证。无论如何,Grok 3 的发布无疑为 AI 行业带来了新的变革,未来值得期待。

© 版权声明

相关文章

暂无评论

none
暂无评论...