AI大模型竞赛加速：应用场景不断深化与扩展

4.5K 0

近期，AI大模型的迭代速度持续加快。北京时间2月18日，企业家埃隆·马斯克与xAI团队在X平台上直播发布了最新的大模型Grok 3，被誉为“地球上最聪明的AI”。为了训练Grok 3，xAI团队将其数据中心的GPU从10万张扩充至20万张。与此同时，中国初创企业DeepSeek也推出了新版大模型DeepSeek-R1，以低成本和高效能引起广泛关注。谷歌、xAI、OpenAI、Anthropic等公司紧随其后，纷纷宣布即将发布新版大模型。大模型的开源趋势显著降低了应用成本，为AI应用带来了新的机遇。

Grok 3：性能大幅提升

Grok 3相比前代产品Grok 2性能提升了数个档次，马斯克在直播中提到：“与Grok 3交流会让人觉得非常有趣。” 自2023年7月成立以来，xAI公司迅速崛起。2023年11月发布的Grok 1拥有3140亿参数，成为当时参数量最大的开源大语言模型。2024年8月，xAI推出了Grok 2，该模型在性能上与ChatGPT的新版本相当。为了打造更强大的Grok 3，xAI团队在训练过程中克服了诸多技术难题，如散热和电力问题。经过214天的努力，团队成功将GPU数量从10万张增加到20万张。

市场激烈竞争

马斯克的xAI已成为大模型领域的强劲竞争者，与DeepSeek、OpenAI、谷歌等企业共同角逐。DeepSeek推出的开源推理大模型DeepSeek-R1，以极低的成本实现了高性能表现，超越了部分对标模型。DeepSeek-V3仅用了2048张英伟达H800 GPU训练了两个月，成本为557.6万美元，仅为GPT-4的十分之一。DeepSeek的发布搅动了市场格局。谷歌发布了Gemini2.0系列模型，增强了编码和推理能力。OpenAI宣布将在未来几个月内推出GPT-5和GPT-4.5，整合多项核心技术。Anthropic计划发布新的混合型大模型Claude 4，用户可控制推理成本。

开源革命与广泛应用

DeepSeek的开源策略推动了大模型领域的革命，使其成为各行业的基础设施。2月18日，阶跃星辰与吉利汽车联合开源了两款多模态大模型——Step-Video-T2V和Step-Audio。百度宣布其大模型产品文心一言将从4月1日起全面免费。微信也开始灰度测试DeepSeek-R1，增强其搜索功能。百度搜索也将全面接入DeepSeek和文心大模型的深度搜索功能。AI技术的成熟正在改变商业模式，DeepSeek等开源模型的崛起正在重构行业生态。

行业应用广泛

大模型的应用已经渗透到多个领域，如内容创作、金融、电信和自动驾驶等。阅文集团的“作家助手”已集成DeepSeek-R1，提高了创作效率。中文在线也在内部AI网文创作中部署了DeepSeek-R1。一汽丰田借助腾讯云的大模型知识引擎接入DeepSeek模型，提升了智能客服等业务场景的服务效率。国金证券计划将DeepSeek应用于信息检索、文档处理、行业研究及市场分析等多个场景，未来还将拓展至智能服务、风险管理、投资分析等核心业务领域。

未来展望

清华大学教授梁正表示，AI未来将向终端化和轻量化发展，多模态和强化学习技术的进步将使服务机器人、无人驾驶车辆和无人机的规模化部署成为可能。交银国际看好垂类大模型在办公、零售、客服、金融、营销、教育、文娱等领域的应用前景，以及BAT（百度、阿里巴巴、腾讯）的价值重估机会。摩根资产管理关注以人工智能为驱动力的科技产业、新能源产业、高端制造业和医疗健康产业。