DeepSeek公司及其AI技术创新解析

2.4K 0

DeepSeek，即杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，法定代表人为裴某。公司由宁波程恩企业管理咨询合伙企业（持股99%）和梁文锋（持股1%）共同创立。其经营范围涵盖工程和技术研究、技术服务、技术开发和技术咨询等多个方面。

自成立以来，DeepSeek迅速崛起并在多个领域取得了显著进展。以下是其发展历程中的几个重要里程碑：

2024年1月5日，DeepSeek发布了首个大型语言模型DeepSeek LLM。同年5月，开源了第二代MoE大模型DeepSeek – V2。随后在9月5日，推出了升级版DeepSeek V2.5新模型。11月20日，发布了轻量级推理模型DeepSeek – R1 – Lite预览版。紧接着，12月26日，DeepSeek – V3首个版本上线并开源。

进入2025年，DeepSeek继续加速发展。1月20日，正式发布了DeepSeek – R1模型。仅仅一周后，DeepSeek应用就登顶了15个国家和地区的苹果应用商店免费APP下载排行榜。1月31日，DeepSeek R1 671b作为英伟达NVIDIA微服务预览版在build.nvidia.com上发布。2月2日，DeepSeek进一步攀升至140个国家的苹果App Store下载排行榜首位，并在美国的Android Play Store中占据榜首位置。

主要产品

DeepSeek的产品线涵盖了多个方面，其中最引人注目的是其大型语言模型和专业领域模型。

DeepSeek LLM是公司发布的首个大型语言模型，包含670亿参数，尤其擅长推理和编码任务。DeepSeek Coder是一系列代码语言模型，能够在多种编程语言和基准测试中表现出色。DeepSeekMath基于DeepSeek – Coder – v1.5 7B，在竞赛级MATH基准测试中取得了优异的成绩。此外，DeepSeek还推出了开源视觉-语言模型DeepSeek – VL，该模型在各种视觉任务中能够捕捉到关键语义和细节信息。

随着技术的进步，DeepSeek – VL2作为先进的大型混合专家视觉-语言模型，展示了卓越的能力。DeepSeek – V2则拥有2360亿参数，具备强大的中文处理能力和高效的训练效率。最后，DeepSeek – Coder – V2是一款开源混合专家代码语言模型，其在代码特定任务中的性能与GPT4 – Turbo相当。