AI大模型竞赛加速:应用场景不断深化与扩展

AI头条1周前发布 Teller
4K 0

近期,AI大模型的迭代速度持续加快。北京时间2月18日,企业家埃隆·马斯克与xAI团队在X平台上直播发布了最新的大模型Grok 3,被誉为“地球上最聪明的AI”。为了训练Grok 3,xAI团队将其数据中心的GPU从10万张扩充至20万张。与此同时,中国初创企业DeepSeek也推出了新版大模型DeepSeek-R1,以低成本和高效能引起广泛关注。谷歌、xAI、OpenAI、Anthropic等公司紧随其后,纷纷宣布即将发布新版大模型。大模型的开源趋势显著降低了应用成本,为AI应用带来了新的机遇。

Grok 3:性能大幅提升

Grok 3相比前代产品Grok 2性能提升了数个档次,马斯克在直播中提到:“与Grok 3交流会让人觉得非常有趣。” 自2023年7月成立以来,xAI公司迅速崛起。2023年11月发布的Grok 1拥有3140亿参数,成为当时参数量最大的开源大语言模型。2024年8月,xAI推出了Grok 2,该模型在性能上与ChatGPT的新版本相当。为了打造更强大的Grok 3,xAI团队在训练过程中克服了诸多技术难题,如散热和电力问题。经过214天的努力,团队成功将GPU数量从10万张增加到20万张。

市场激烈竞争

马斯克的xAI已成为大模型领域的强劲竞争者,与DeepSeek、OpenAI、谷歌等企业共同角逐。DeepSeek推出的开源推理大模型DeepSeek-R1,以极低的成本实现了高性能表现,超越了部分对标模型。DeepSeek-V3仅用了2048张英伟达H800 GPU训练了两个月,成本为557.6万美元,仅为GPT-4的十分之一。DeepSeek的发布搅动了市场格局。谷歌发布了Gemini2.0系列模型,增强了编码和推理能力。OpenAI宣布将在未来几个月内推出GPT-5和GPT-4.5,整合多项核心技术。Anthropic计划发布新的混合型大模型Claude 4,用户可控制推理成本。

开源革命与广泛应用

DeepSeek的开源策略推动了大模型领域的革命,使其成为各行业的基础设施。2月18日,阶跃星辰与吉利汽车联合开源了两款多模态大模型——Step-Video-T2V和Step-Audio。百度宣布其大模型产品文心一言将从4月1日起全面免费。微信也开始灰度测试DeepSeek-R1,增强其搜索功能。百度搜索也将全面接入DeepSeek和文心大模型的深度搜索功能。AI技术的成熟正在改变商业模式,DeepSeek等开源模型的崛起正在重构行业生态。

行业应用广泛

大模型的应用已经渗透到多个领域,如内容创作、金融、电信和自动驾驶等。阅文集团的“作家助手”已集成DeepSeek-R1,提高了创作效率。中文在线也在内部AI网文创作中部署了DeepSeek-R1。一汽丰田借助腾讯云的大模型知识引擎接入DeepSeek模型,提升了智能客服等业务场景的服务效率。国金证券计划将DeepSeek应用于信息检索、文档处理、行业研究及市场分析等多个场景,未来还将拓展至智能服务、风险管理、投资分析等核心业务领域。

未来展望

清华大学教授梁正表示,AI未来将向终端化和轻量化发展,多模态和强化学习技术的进步将使服务机器人、无人驾驶车辆和无人机的规模化部署成为可能。交银国际看好垂类大模型在办公、零售、客服、金融、营销、教育、文娱等领域的应用前景,以及BAT(百度、阿里巴巴、腾讯)的价值重估机会。摩根资产管理关注以人工智能为驱动力的科技产业、新能源产业、高端制造业和医疗健康产业。

© 版权声明

相关文章