DeepSeek 开源大模型解析:深度剖析其开放范围与使用限制

AI头条1周前发布 Teller
3K 0

开源大模型 DeepSeek 引发了全球广泛关注,被誉为“开源的胜利”。本文将详细探讨 DeepSeek 的开源策略,分析其开放的具体内容及其使用限制。

DeepSeek 是一款能够与闭源大模型媲美的开源大模型,其许可证是负责任的人工智能许可证。根据 Linux 基金会的模型开放架构,DeepSeek 尚未完全达到第三级开放标准。使用或分发 DeepSeek 大模型需遵循其许可证,包括对使用场景的限制。

DeepSeek 的性能与版本演进

DeepSeek 经历了多个版本的迭代,如 V2、V2.5、V3、R1-Zero 和 R1。V3 版本通过多种基准测试(如 MMLU、C-Eval、Codeforces 等)表现出色,成为性能最佳的开源模型之一,甚至在某些方面超越了前沿闭源模型。R1 版本则通过强化学习而非监督微调显著提升了模型能力,尤其在某些测试项上优于 OpenAI 的模型。

DeepSeek 的开源许可证

DeepSeek 在 Hugging Face 上发布了 68 个模型和一个数据集。R1 和 R1-Zero 模型采用 MIT 许可证,其余模型采用 DeepSeek 许可证,代码则统一采用 MIT 许可证。蒸馏自 Qwen 和 Llama 的 6 个模型使用 MIT 许可证,而 Qwen 和 Llama 基础模型分别采用 Apache 2.0 和 Llama 许可证。

DeepSeek 的开放层级

根据 LF AI&Data 基金会的模型开放框架,大模型的开放分为三个层次。以 DeepSeek-R1 和 DeepSeek-V3 为例,DeepSeek 开放了模型架构、模型卡、模型参数、技术报告和评估结果,达到了第二级开放标准,但尚未开放训练代码、推理代码、评估代码和数据集。

使用及分发 DeepSeek 模型的限制

除了 R1 系列模型外,其他 DeepSeek 模型采用 DeepSeek 许可证,该许可证基于负责任的人工智能许可证(RAIL)。RAIL 包含多项使用限制,如禁止军事用途、生成虚假信息、侵犯个人隐私等。MIT 许可证没有这些限制。此外,DeepSeek 授予用户永久、全球、非排他、免费、免版税的版权和专利许可,但用户必须遵守相应的使用和分发条件。

分发和再分发的条件

如果要将 DeepSeek 模型托管、复制和分发给第三方,分发者必须将使用限制纳入法律协议中,并向第三方提供 DeepSeek 许可证副本。分发者还需在修改后的文件中声明更改,并保留所有版权、专利、商标和归属声明。如果分发者未能满足这些条件,可能会构成违约或侵权,面临法律责任。

蒸馏模型的进一步限制

DeepSeek 基于 Qwen 和 Llama 模型蒸馏了 6 个模型。使用或分发这些蒸馏模型时,除了满足 MIT 许可证的要求外,还需遵守 Qwen 和 Llama 模型的基础许可证。例如,Llama 许可证要求分发者提供许可证副本、突出显示“使用 Llama 构建”,并在模型名称前加上“Llama”。

DeepSeek 是否完全遵守开源许可证

尽管 DeepSeek 表现优异,但在某些方面并未完全遵守开源许可证。例如,DeepSeek 没有在分发材料中附随许可证副本,也没有在相关页面上突出显示“使用 Llama 构建”。此外,DeepSeek 未保留 Llama 模型的署名声明。这表明 DeepSeek 在遵守开源许可证方面仍有改进空间。

总结

尽管 DeepSeek 在遵守开源许可证方面存在不足,但其出色的性能和开源策略为开源大模型的发展注入了新的活力。为了构建负责任的人工智能世界,用户在使用和分发 DeepSeek 模型时应严格遵守许可证规定,确保合法合规。

© 版权声明

相关文章