中国AI初创企业深度求索开源技术创新赢得赞誉

2025年2月27日，据香港《南华早报》报道，中国人工智能初创企业深度求索近日公开了其低成本、高性能模型的技术细节，不仅驳斥了关于其虚报成本的质疑，还赢得了开源社区的一致好评。本周，该公司计划逐步开源五个AI基础设施项目，旨在为用户提供更经济高效的模型训练和推理解决方案。

开源项目获得广泛认可

2月24日和25日，深度求索分别开源了名为FlashMLA和DeepEP的项目，这两个项目专注于优化芯片性能，以实现更高效的模型训练和推理任务。美国旧金山AI行业解决方案提供商龙鳞工业公司的首席技术官斯蒂芬·皮门特尔在社交平台X上表示，深度求索将这些技术及其在模型训练方面的成果开源，有效回应了外界对其成本透明度的质疑。开源社区的开发者们也对深度求索的项目表示高度赞赏，认为该公司正在不断推动AI基础设施的发展。

挑战与突破

尽管预算有限，深度求索依然取得了显著成就，发布了两个开创性的开源AI模型：V3大语言模型和R1推理模型。这些模型在性能上可以与美国顶尖AI公司如微软支持的OpenAI和亚马逊支持的Anthropic公司相媲美。然而，由于其相对较小的规模和有限的资金，深度求索曾面临一些质疑。例如，虚拟现实公司Oculus的创始人帕尔默·勒基曾在社交媒体上质疑该公司的预算真实性，但他也承认其技术表现优异。

技术创新的秘诀

深度求索在其技术报告中解释了如何通过一系列创新技术实现高效且低成本的模型训练，包括混合专家模型和多头潜在注意力机制等。本周发布的FlashMLA和DeepEP开源项目进一步展示了该公司在提升内存带宽、计算速度和芯片间通信速度方面的努力，证明了其能够利用性能相对较弱的芯片和较低的成本，拓展AI模型训练的边界。