新年伊始,DeepSeek 的出现犹如平地一声雷,打破了沉寂已久的 AI 圈。作为一款低成本、高性能且真正开源的国产大模型,DeepSeek 不仅与 OpenAI 正面交锋,还引发了关于 AI 未来走向的深刻思考。本文将围绕十大关键问题,深入探讨 DeepSeek 的技术革新及其对 AI 行业的深远影响。
Scaling Law 是否过时?
DeepSeek 的出现使得人们开始重新审视 Scaling Law 的有效性。李建忠认为,尽管预训练模型的 Scaling Law 可能在数据瓶颈和模型集中化的压力下放缓,但在推理计算领域,Scaling Law 仍然具有广阔的应用前景。随着推理需求的增加,未来推理侧的算力需求将远超预训练阶段,这为多种算力方案提供了发展机遇,不再局限于英伟达 GPU。
数据的重要性是否改变?
邓侃强调,数据始终至关重要,但其定义正在发生变化。对于大模型研发机构来说,全网数据仍然是基础,但高质量、专业化的数据更为关键。AI 生成的数据正逐渐成为新的宝贵资源,而 IoT 数据则被视为未来的金矿。李建忠补充道,数据竞争将集中在过程数据和数据质量上,高质量的数据是推动 AI 发展的核心动力。
DeepSeek 是国运级创新吗?
李建忠和邓侃一致认为,DeepSeek 的出现不仅仅是技术创新,更是一次生态级乃至国运级的突破。DeepSeek 引领了从预训练到推理计算的范式转移,加速了强化学习技术的普及。其开源战略推动了整个大模型生态的建设,增强了中国 AI 行业的国际影响力。邓侃指出,DeepSeek 的成功是对美国技术霸权的有力回应,促进了全球开发者社区的团结,推动了中国 AI 产业链的快速发展。
DeepSeek 的开源生态如何构建?
邓侃认为,DeepSeek 的架构设计类似于 Android,具备强大的跨平台能力和灵活的可扩展性。MoE 架构赋予了系统伸缩自如的能力,MLA 机制则提高了效率。他预测,DeepSeek 有望成为 AI 时代的“鸿蒙”,构建一个跨设备、跨平台的开放生态。李建忠进一步提出,DeepSeek 有可能在算力层实现“软件定义硬件”,从而在算力市场上占据一席之地。
闭源模型还有机会吗?
李建忠对大部分闭源模型的前景持悲观态度,但他认为少数与超级应用深度融合的闭源模型仍有生存空间。这类模型应通过“应用 + 模型”的策略,打造应用平台的护城河,并借助数据飞轮效应优化用户体验。邓侃则认为,闭源模式并非长久之计,开放、充满活力的生态更能孕育优质内容。
大模型的护城河在哪里?
邓侃认为,大模型的护城河应从技术壁垒、用户粘性和内容壁垒三个方面构建。DeepSeek 可以通过持续的技术迭代、个性化服务和优质内容来增强竞争力。李建忠则认为,大模型难以建立像操作系统那样的坚固护城河,但在开发平台、分发渠道和交易环节等方面仍有机会。他强调,大模型应关注用户需求和优质内容,这是不变的铁律。
DeepSeek 会颠覆哪些行业?
邓侃从开源与闭源、产品形态相似度两个维度分析,认为闭源模型和与大模型核心功能相近的行业最容易受到影响。李建忠提出了一个“危险——安全”光谱,指出信息服务行业、内容行业和电商行业将受到较大冲击,而服务行业和社交行业则相对安全。他认为,社交需求是人类的底层需求,难以被 AI 完全替代。
AGI 时代互联网逻辑的变化与不变
在 AGI 时代,互联网的逻辑将发生显著变化。李建忠和邓侃指出,传统流量、数据和技术壁垒不再是主要护城河,用户交互入口、Agent 生态和场景深度融合将成为新的竞争焦点。同时,内容生产和电商模式也将发生重大变革。然而,用户需求至上、优质内容为王和社交刚需永恒的原则不会改变。
DeepSeek 对职业的影响
邓侃认为,AI 时代每个行业和职业都有机遇和挑战,关键在于是否主动拥抱 AI。以程序员为例,善用 AI 辅助编程工具可以大幅提升效率,未来全栈工程师将成为稀缺人才。李建忠表示,AI 不会导致程序员大规模失业,而是促使程序员从“代码工人”转变为“软件构建师”,专注于更高层次的任务。他强调,未来每个人都有机会成为开发者,掌握 AI 工具将使这一愿景成为现实。
总结与展望
李建忠和邓侃两位专家通过前瞻性视角和犀利观点,深入探讨了 DeepSeek 的技术逻辑和产业影响,并对 AGI 时代的 AI 发展趋势进行了大胆预测。他们认为,DeepSeek 的出现不仅是一次技术突破,更是中国 AI 行业迈向全球舞台的重要一步。未来,AI 将继续推动各行业的变革,为人类带来更多可能性。