解读 DeepSeek 开源大模型：开放程度、许可证及使用限制

8.4K 0

开源大模型 DeepSeek 引起了全球范围内的广泛关注，被誉为“开源的胜利”。本文将详细解析 DeepSeek 的开源策略及其开放程度，探讨其许可证的具体内容，并分析使用和分发 DeepSeek 模型时需要注意的事项。

DeepSeek 是一款能够与闭源大模型相媲美的开源大模型，其许可证是负责任的人工智能许可证。根据 Linux 基金会的模型开放架构，DeepSeek 的开放层级尚未完全达到第三级。使用或分发 DeepSeek 大模型时，必须遵循 DeepSeek 许可证，包括对使用场景的限制。

DeepSeek 的性能评估

DeepSeek 的演进包括多个版本，如 V2、V2.5、V3、R1-Zero 和 R1。其中，V3 模型的基准测试涵盖了多个领域，包括 MMLU、C-Eval、CMMLU、IFEval、FRAMES、GPQA Diamond、SimpleQA、SWE-Bench Verified、LiveCodeBench、Codeforces、中国全国中学生数学奥林匹克竞赛（CMO），以及美国数学邀请赛（AIME）。测试结果显示，V3 是性能最佳的开源模型，并且在某些方面表现出与前沿闭源模型相当的竞争力。

R1 里程碑式贡献

R1 版本的主要贡献在于其采用了强化学习（Reinforcement Learning，RL）而非监督微调（Supervised Fine-Tuning，SFT）来提升模型能力。R1 的测试结果在某些测试项上甚至优于 OpenAI 的模型。R1 的出现打破了看似闭源的 OpenAI 遥遥领先的局面，为开源大模型带来了新的不确定性。

DeepSeek 的许可证类型

DeepSeek 在 Hugging Face 上共发布了 68 个模型及一个数据集。DeepSeek-R1 和 DeepSeek-R1-Zero 模型的代码和模型权重采用 MIT 许可证，其余模型则采用 DeepSeek 许可证，但代码仍使用 MIT 许可证。对于从 Qwen 和 Llama 蒸馏的 6 个模型，许可证为 MIT，而 Qwen 和 Llama 基础模型分别采用 Apache 2.0 和 Llama 许可证。

DeepSeek 的开放层级

根据 LF AI&Data 基金会引入的模型开放框架（Model Openness Framework，MOF），大模型的开放分为三个层次。以 DeepSeek-R1 和 DeepSeek-V3 为例，DeepSeek 开放了模型架构、模型卡、模型参数、技术报告和评估结果，因此其开放层次至多属于第三级。然而，DeepSeek 并未开放训练代码、推理代码、评估代码和数据集等重要组件。

使用及分发 DeepSeek 模型的限制

除 R1 系列模型外，其他 DeepSeek 模型采用 DeepSeek 许可证。DeepSeek 几乎没有开放任何数据，因此许可证中明确规定数据未获得许可。DeepSeek 许可证的原型是负责任的人工智能许可证（Responsible AI License，RAIL），后者基于 Apache 2.0 许可证。

RAIL 许可证包含多项使用限制，如禁止用于军事用途、生成虚假信息、侵犯第三方权益等。这些限制条款确保 DeepSeek 不会被用于有害或不负责任的应用程序。此外，DeepSeek 授予用户永久、全球、非排他的版权和专利许可，允许用户复制、准备、展示、表演、再授权和分发模型及其衍生品。

分发和再分发的条件

如果想将 DeepSeek 模型托管、复制和分发给第三方，分发者必须遵守以下条件：将使用限制作为可执行条款纳入法律协议中；向第三方接收者提供 DeepSeek 许可证副本；在修改过的文件上注明更改；保留所有版权、专利、商标和归属声明；并在分发时遵守 DeepSeek 许可证中的条件。

蒸馏模型的进一步限制

DeepSeek 分别基于 Qwen 和 Llama 模型得出了蒸馏模型。使用或分发这些蒸馏模型时，除了满足蒸馏模型本身的 MIT 许可证要求外，还需满足基础模型的许可证要求。例如，Llama 许可证要求分发者必须附带许可证副本，并在相关网站、用户界面、博客文章或产品文档上突出显示“使用 Llama 构建”。此外，蒸馏模型名称应以“Llama”开头，并保留相应的归属声明。