DeepSeek加速推进R2模型发布,AI行业竞争加剧
2月25日,路透社报道指出,AI初创公司DeepSeek(深度求索)在推出R1推理模型后,正积极筹备全新R2模型的发布,旨在巩固其在行业内的领先地位。最初计划在5月初发布的R2模型,现在由于公司决策层的推动,预计将提前面世。尽管具体发布时间尚未公布,但这一消息已引发业内广泛关注与期待。
行业竞争激烈,各大公司纷纷加快步伐
随着马斯克推出号称“地球上最聪明的人工智能”的Grok 3,并上线语音版;Anthropic也在北京时间2月25日2:30推出了业界首个混合推理模型Claude 3.7 Sonnet,该模型能够同时提供快速回答和深度思考后的答案。此外,阿里巴巴集团CEO吴泳铭在财报会上宣布,阿里将于近期发布基于千问Qwen2.5-MAX的深度推理模型,进一步加剧了AI行业的竞争态势。
梁文锋的工作风格及团队文化
梁文锋在北京设立了办公室,位置优越,步行即可到达清华大学和北京大学这两所顶尖学府。前员工透露,梁文锋喜欢与年轻的技术人员合作,尤其是Z世代的实习生和应届毕业生,他们构成了公司的重要力量。公司内部形成了良好的协作氛围,员工每天工作8小时,注重工作效率和技术细节的研究。
DeepSeek的薪酬策略与竞争优势
DeepSeek以其慷慨的薪酬政策著称,尤其是在吸引高级数据科学家方面,年薪可达150万元。相比之下,其他竞争对手提供的薪资虽然也很高,但DeepSeek仍然具有明显的优势。这种高薪策略不仅帮助公司吸引了大量优秀人才,也提升了员工的工作积极性和创造力。
长期投资助力技术突破
DeepSeek的成功离不开幻方在研究和计算能力上的长期投入。过去十年间,幻方将70%的收入再投资于人工智能研究,并在2020年和2021年分别投资12亿元建设了两个超级计算AI集群。特别是第二个集群Fire-Flyer II,配备了约10000个Nvidia A100芯片,极大地增强了AI模型的训练能力。
低调行事,专注技术研发
为了减少外界干扰,梁文锋选择保持低调,自2024年7月以来未接受任何媒体采访。这种低调的态度有助于公司集中精力进行技术研发,避免因过度曝光而分散注意力。
价格优势改变市场格局
Bernstein经纪公司的分析师指出,DeepSeek的定价策略相比OpenAI更具竞争力,成本仅为后者同类产品的1/20至1/40。这迫使OpenAI本月降价,并推出计算需求较低的O3-Mini模型。DeepSeek的R1和早期V3模型的成功,也促使谷歌等国际巨头调整策略,推出折扣访问层,显示出DeepSeek在AI领域的影响力正在逐渐扩大。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...