DeepSeek,即杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,法定代表人为裴某。公司由宁波程恩企业管理咨询合伙企业(持股99%)和梁文锋(持股1%)共同创立。其经营范围涵盖工程和技术研究、技术服务、技术开发和技术咨询等多个方面。
自成立以来,DeepSeek迅速崛起并在多个领域取得了显著进展。以下是其发展历程中的几个重要里程碑:
2024年1月5日,DeepSeek发布了首个大型语言模型DeepSeek LLM。同年5月,开源了第二代MoE大模型DeepSeek – V2。随后在9月5日,推出了升级版DeepSeek V2.5新模型。11月20日,发布了轻量级推理模型DeepSeek – R1 – Lite预览版。紧接着,12月26日,DeepSeek – V3首个版本上线并开源。
进入2025年,DeepSeek继续加速发展。1月20日,正式发布了DeepSeek – R1模型。仅仅一周后,DeepSeek应用就登顶了15个国家和地区的苹果应用商店免费APP下载排行榜。1月31日,DeepSeek R1 671b作为英伟达NVIDIA微服务预览版在build.nvidia.com上发布。2月2日,DeepSeek进一步攀升至140个国家的苹果App Store下载排行榜首位,并在美国的Android Play Store中占据榜首位置。
主要产品
DeepSeek的产品线涵盖了多个方面,其中最引人注目的是其大型语言模型和专业领域模型。
DeepSeek LLM是公司发布的首个大型语言模型,包含670亿参数,尤其擅长推理和编码任务。DeepSeek Coder是一系列代码语言模型,能够在多种编程语言和基准测试中表现出色。DeepSeekMath基于DeepSeek – Coder – v1.5 7B,在竞赛级MATH基准测试中取得了优异的成绩。此外,DeepSeek还推出了开源视觉-语言模型DeepSeek – VL,该模型在各种视觉任务中能够捕捉到关键语义和细节信息。
随着技术的进步,DeepSeek – VL2作为先进的大型混合专家视觉-语言模型,展示了卓越的能力。DeepSeek – V2则拥有2360亿参数,具备强大的中文处理能力和高效的训练效率。最后,DeepSeek – Coder – V2是一款开源混合专家代码语言模型,其在代码特定任务中的性能与GPT4 – Turbo相当。
未来展望
凭借其不断创新的技术和广泛的应用场景,DeepSeek正逐步成为全球人工智能领域的领军者之一。未来,DeepSeek将继续致力于技术研发和服务优化,为用户提供更加智能、便捷的解决方案。