Grok 3 AI 模型发布:性能提升十倍,多项基准测试领先

AI资讯2个月前发布 Teller
9.8K 0

备受期待的“最强AIGrok 3终于在2月18日正式亮相。由特斯拉创始人埃隆·马斯克旗下的xAI公司推出的这款最新大模型,在直播中展示了其卓越的功能。马斯克表示,Grok 3的能力比前一代强大十倍,xAI和Grok的使命是揭示宇宙的本质。

逐步开放访问权限

Grok 3测试版现已向马斯克旗下X平台的X Premium订阅用户开放。马斯克提到:“我们将从X Premium Plus订阅者开始,他们是首批体验Grok 3的人群。请确保更新您的X应用程序以探索所有高级功能。”此外,xAI还推出了名为Super Grok的新订阅服务,旨在为忠实用户提供最先进的功能和早期访问权。

功能全面升级

马斯克透露,预计一周后Grok 3的所有功能将正式上线。他表示:“如果你想要更完善的版本,可能值得等待一周,但每天都会有改进。我们正在开发语音交互功能,让用户可以像与人交谈一样与其互动。”他还补充道,计划在每次发布新版本时对旧版本进行开源,这意味着几个月后Grok 2将会开源。

性能超越竞争对手

xAI工程师介绍,尽管Grok起步较晚,但在MMLU(大规模多任务语言理解基准测试)得分上迅速追上了ChatGPT。Grok 3及其轻量化版本Grok 3 mini在多个性能指标上均超过了Gemini、DeepSeek和GPT-4等竞争对手。具体来说,Grok 3在数学推理、科学逻辑推理和代码写作等项目的基准测试中表现出色,分别获得了52、75和57的高分。

盲测成绩优异

在加州大学伯克利分校的Chatbot Arena盲测中,早期版本的Grok 3以“巧克力”的名义参评,成为唯一一个得分超过1400的模型,在代码编写和指令响应等方面均排名第一。值得注意的是,Grok 3在最近的AIME2025竞赛中也表现出色,证明了其强大的泛化能力。

强大的计算资源支持

xAI旗下的超算中心算力已经翻倍,目前拥有20万块英伟达GPU。马斯克曾在去年4月指出,自建数据中心是打造最佳AI的唯一途径。经过122天的努力,团队成功启动了第一批10万个GPU,并在短短92天内再次实现算力翻倍。未来,xAI计划进一步扩展其计算能力,目标是将功率提高至约1.2千兆瓦。

展示多样应用场景

在发布会上,马斯克和工程师们展示了Grok 3的多种应用,包括为太空发射生成3D动画和开发一款结合俄罗斯方块和宝石迷阵的游戏。此外,xAI还宣布成立一个人工智能游戏工作室,邀请有兴趣的开发者加入,共同开发AI驱动的游戏。

© 版权声明

相关文章

暂无评论

none
暂无评论...