DeepSeek 开源大模型解析：深度剖析其开放范围与使用限制

3.2K 0

开源大模型 DeepSeek 引发了全球广泛关注，被誉为“开源的胜利”。本文将详细探讨 DeepSeek 的开源策略，分析其开放的具体内容及其使用限制。

DeepSeek 是一款能够与闭源大模型媲美的开源大模型，其许可证是负责任的人工智能许可证。根据 Linux 基金会的模型开放架构，DeepSeek 尚未完全达到第三级开放标准。使用或分发 DeepSeek 大模型需遵循其许可证，包括对使用场景的限制。

DeepSeek 的性能与版本演进

DeepSeek 经历了多个版本的迭代，如 V2、V2.5、V3、R1-Zero 和 R1。V3 版本通过多种基准测试（如 MMLU、C-Eval、Codeforces 等）表现出色，成为性能最佳的开源模型之一，甚至在某些方面超越了前沿闭源模型。R1 版本则通过强化学习而非监督微调显著提升了模型能力，尤其在某些测试项上优于 OpenAI 的模型。

DeepSeek 的开源许可证

DeepSeek 在 Hugging Face 上发布了 68 个模型和一个数据集。R1 和 R1-Zero 模型采用 MIT 许可证，其余模型采用 DeepSeek 许可证，代码则统一采用 MIT 许可证。蒸馏自 Qwen 和 Llama 的 6 个模型使用 MIT 许可证，而 Qwen 和 Llama 基础模型分别采用 Apache 2.0 和 Llama 许可证。

DeepSeek 的开放层级

根据 LF AI&Data 基金会的模型开放框架，大模型的开放分为三个层次。以 DeepSeek-R1 和 DeepSeek-V3 为例，DeepSeek 开放了模型架构、模型卡、模型参数、技术报告和评估结果，达到了第二级开放标准，但尚未开放训练代码、推理代码、评估代码和数据集。

使用及分发 DeepSeek 模型的限制

除了 R1 系列模型外，其他 DeepSeek 模型采用 DeepSeek 许可证，该许可证基于负责任的人工智能许可证（RAIL）。RAIL 包含多项使用限制，如禁止军事用途、生成虚假信息、侵犯个人隐私等。MIT 许可证没有这些限制。此外，DeepSeek 授予用户永久、全球、非排他、免费、免版税的版权和专利许可，但用户必须遵守相应的使用和分发条件。

分发和再分发的条件

如果要将 DeepSeek 模型托管、复制和分发给第三方，分发者必须将使用限制纳入法律协议中，并向第三方提供 DeepSeek 许可证副本。分发者还需在修改后的文件中声明更改，并保留所有版权、专利、商标和归属声明。如果分发者未能满足这些条件，可能会构成违约或侵权，面临法律责任。

蒸馏模型的进一步限制

DeepSeek 基于 Qwen 和 Llama 模型蒸馏了 6 个模型。使用或分发这些蒸馏模型时，除了满足 MIT 许可证的要求外，还需遵守 Qwen 和 Llama 模型的基础许可证。例如，Llama 许可证要求分发者提供许可证副本、突出显示“使用 Llama 构建”，并在模型名称前加上“Llama”。

DeepSeek 是否完全遵守开源许可证

尽管 DeepSeek 表现优异，但在某些方面并未完全遵守开源许可证。例如，DeepSeek 没有在分发材料中附随许可证副本，也没有在相关页面上突出显示“使用 Llama 构建”。此外，DeepSeek 未保留 Llama 模型的署名声明。这表明 DeepSeek 在遵守开源许可证方面仍有改进空间。