2025年,AI大模型的发展路径出现了明显的分化,形成了“大力出奇迹”和“四两拨千斤”两条截然不同的路线。一边是以美国xAI为代表的厂商,不断投入巨额资金和算力资源,追求模型的极致性能;另一边则是以中国DeepSeek为代表的厂商,致力于通过技术创新实现低成本、高性价比的AI解决方案。
不同路径的代表案例
今年2月,xAI发布了Grok 3推理模型,其性能超越了多个现有模型,被誉为“地球上最聪明的AI”。然而,Grok 3的成功离不开其背后强大的“Colossus”超级计算集群,该集群在训练过程中消耗了高达20万张英伟达GPU。相比之下,中国的DeepSeek则于今年1月推出了开源推理模型DeepSeek-R1,尽管其成本仅为类似模型的三十分之一,但在多个基准测试中表现出色,迅速赢得了全球开发者的好评。
路径分化的背后原因
在田丰看来,这种路径分化主要源于“Scaling Laws”(尺度定律)性价比的下降。过去几年,国内外AI厂商纷纷遵循“Scaling Laws”,通过不断增加算力、算法和数据的投入,实现了模型性能的大幅提升。然而,随着模型参数数量的指数级增长,进一步提升性能的成本变得越来越高。例如,Grok 3的计算量几乎是DeepSeek的几十倍,但性能却没有相应地提升几十倍。
预训练与推理阶段的挑战
中国信息通信研究院云计算与大数据研究所所长何宝宏指出,2024年全球训练大语言模型的效果普遍不如预期,OpenAI的产品迭代速度也明显放缓。这表明,预训练阶段的“Scaling Laws”已经遇到瓶颈,但在推理阶段仍有很大机会。DeepSeek正是在模型推理阶段找到了新的突破点,通过优化算法和架构,大幅降低了推理成本,提升了模型的实用性和普及性。
不同路径的未来展望
对于未来的AI发展路径,业内专家意见不一。清华大学计算机科学与技术系长聘副教授刘知远认为,AI发展应走一条极致高效、善用现有资源的可持续路线。而天使投资人郭涛则认为,走向AGI(通用人工智能),“大力出奇迹”的优势更大,因为它可以通过大规模数据和超强算力充分学习海量知识,挖掘深层次语义和逻辑关系,更接近人类的全面智能。
开源开放成为新趋势
除了路径分化,大模型领域还呈现出一个统一趋势:开源开放。越来越多的AI厂商开始拥抱开源,如百度宣布文心大模型4.5系列将于6月30日正式开源,xAI也计划对Grok 2开源。开源不仅可以吸引更多开发者参与,还能激发开源社区的创新活力,推动技术快速发展。此外,开源有助于降低企业的研发成本,促进各企业在生态竞争中脱颖而出。
DeepSeek的开源战略
DeepSeek宣布将陆续开源5个代码库,以完全透明的方式分享其进展。这一举措不仅展示了DeepSeek的技术实力,也为全球开发者提供了一个开放的平台。通过开源,DeepSeek吸引了大量开发者的关注和参与,形成了稳定的开源生态。开发者可以在DeepSeek的平台上看到每一天的技术进展,共同推动AI技术的进步。
开源与闭源的平衡
对于AI的发展路径,开源与闭源并非对立关系。刘知远认为,开源不仅是一种技术选择,更是一种信任机制。当一个项目开源时,意味着它向全世界证明自身的可信度,任何人都可以去验证。这种机制将极大地提升现代社会的运作效率。同时,企业应在开源的基础上,构建更深层次的技术优势,确保高效、稳定、可持续地生产更先进的模型,从而保持领先地位。