解读 DeepSeek 开源大模型:开放程度、许可证及使用限制
开源大模型 DeepSeek 引起了全球范围内的广泛关注,被誉为“开源的胜利”。本文将详细解析 DeepSeek 的开源策略及其开放程度,探讨其许可证的具体内容,并分析使用和分发 DeepSeek 模型时需要注意的事项。
DeepSeek 是一款能够与闭源大模型相媲美的开源大模型,其许可证是负责任的人工智能许可证。根据 Linux 基金会的模型开放架构,DeepSeek 的开放层级尚未完全达到第三级。使用或分发 DeepSeek 大模型时,必须遵循 DeepSeek 许可证,包括对使用场景的限制。
DeepSeek 的性能评估
DeepSeek 的演进包括多个版本,如 V2、V2.5、V3、R1-Zero 和 R1。其中,V3 模型的基准测试涵盖了多个领域,包括 MMLU、C-Eval、CMMLU、IFEval、FRAMES、GPQA Diamond、SimpleQA、SWE-Bench Verified、LiveCodeBench、Codeforces、中国全国中学生数学奥林匹克竞赛(CMO),以及美国数学邀请赛(AIME)。测试结果显示,V3 是性能最佳的开源模型,并且在某些方面表现出与前沿闭源模型相当的竞争力。
R1 里程碑式贡献
R1 版本的主要贡献在于其采用了强化学习(Reinforcement Learning,RL)而非监督微调(Supervised Fine-Tuning,SFT)来提升模型能力。R1 的测试结果在某些测试项上甚至优于 OpenAI 的模型。R1 的出现打破了看似闭源的 OpenAI 遥遥领先的局面,为开源大模型带来了新的不确定性。
DeepSeek 的许可证类型
DeepSeek 在 Hugging Face 上共发布了 68 个模型及一个数据集。DeepSeek-R1 和 DeepSeek-R1-Zero 模型的代码和模型权重采用 MIT 许可证,其余模型则采用 DeepSeek 许可证,但代码仍使用 MIT 许可证。对于从 Qwen 和 Llama 蒸馏的 6 个模型,许可证为 MIT,而 Qwen 和 Llama 基础模型分别采用 Apache 2.0 和 Llama 许可证。
DeepSeek 的开放层级
根据 LF AI&Data 基金会引入的模型开放框架(Model Openness Framework,MOF),大模型的开放分为三个层次。以 DeepSeek-R1 和 DeepSeek-V3 为例,DeepSeek 开放了模型架构、模型卡、模型参数、技术报告和评估结果,因此其开放层次至多属于第三级。然而,DeepSeek 并未开放训练代码、推理代码、评估代码和数据集等重要组件。
使用及分发 DeepSeek 模型的限制
除 R1 系列模型外,其他 DeepSeek 模型采用 DeepSeek 许可证。DeepSeek 几乎没有开放任何数据,因此许可证中明确规定数据未获得许可。DeepSeek 许可证的原型是负责任的人工智能许可证(Responsible AI License,RAIL),后者基于 Apache 2.0 许可证。
RAIL 许可证包含多项使用限制,如禁止用于军事用途、生成虚假信息、侵犯第三方权益等。这些限制条款确保 DeepSeek 不会被用于有害或不负责任的应用程序。此外,DeepSeek 授予用户永久、全球、非排他的版权和专利许可,允许用户复制、准备、展示、表演、再授权和分发模型及其衍生品。
分发和再分发的条件
如果想将 DeepSeek 模型托管、复制和分发给第三方,分发者必须遵守以下条件:将使用限制作为可执行条款纳入法律协议中;向第三方接收者提供 DeepSeek 许可证副本;在修改过的文件上注明更改;保留所有版权、专利、商标和归属声明;并在分发时遵守 DeepSeek 许可证中的条件。
蒸馏模型的进一步限制
DeepSeek 分别基于 Qwen 和 Llama 模型得出了蒸馏模型。使用或分发这些蒸馏模型时,除了满足蒸馏模型本身的 MIT 许可证要求外,还需满足基础模型的许可证要求。例如,Llama 许可证要求分发者必须附带许可证副本,并在相关网站、用户界面、博客文章或产品文档上突出显示“使用 Llama 构建”。此外,蒸馏模型名称应以“Llama”开头,并保留相应的归属声明。
DeepSeek 是否完全遵守开源许可证
尽管 DeepSeek 表现出色,但其并未完全遵守开源许可证。例如,DeepSeek 未能在分发材料中附带许可证副本,未突出显示“使用 Llama 构建”,也未保留署名声明。这表明 DeepSeek 在某些方面未能严格遵循开源许可证的规定。
总结
尽管 DeepSeek 存在一些不足,但其惊人的表现仍然让人们对开源大模型充满了期待。DeepSeek 的成功提醒我们,使用和分发开源模型时应严格遵守许可证规定,构建负责任的人工智能世界。