豆包AI助手深度思考模式评测：能否挑战DeepSeek？

8.3K 0

最新发布的深度思考模式，正在改变AI助手的交互方式。字节跳动旗下的AI助手豆包正在进行小规模测试，旨在提升其推理能力和用户体验。据豆包相关负责人透露，此次测试涉及多个实验版本，基于豆包1.5基座模型研发。早在1月中旬，豆包大模型团队发布豆包1.5Pro时，便已宣布推出Doubao-1.5-pro-AS1-Preview深度推理模型，强调通过RL算法突破和工程优化，实现Test Time Scaling的算力优势。

极客公园的实测结果显示，与豆包对话时，用户可以观察到生成答案中的推理过程，但这一功能并不总是稳定出现。目前，豆包对话页面尚未提供“深度思考”功能的入口。自2月22日起，豆包在中国区苹果应用商店免费APP下载排行榜上位列第三，落后于腾讯的“腾讯元宝”和DeepSeek。

豆包的深度思考模式进展

最早的深度思考模型由OpenAI于2023年12月推出，但仅限付费用户使用。相比之下，DeepSeek通过开源策略和低成本优势，迅速普及了这一功能。2024年11月20日，DeepSeek发布了R1-Lite-Preview，成为国内首个对标OpenAI的推理模型，并在2025年1月20日开源了R1模型。R1模型的特点在于透明化的思维链，展示完整的推理过程，包括自我质疑、假设验证等拟人化思考路径，降低了推理成本。

深度思考模式的核心技术是思维链（Chain of Thought, CoT），它使用户能够直观看到模型的思考过程。例如，在解决数学题时，模型会展示从问题拆解、多方法验证到最终结论的全过程。结合实时联网功能，模型还可以抓取最新信息并进行逻辑整合。最近，Anthropic发布了Claude 3.7 Sonnet混合推理模型，阿里云也推出了Qwen推理模型“QwQ-Max预览版”。豆包对这两款模型进行了评估，展示了其思考过程。

豆包与DeepSeek的对比

由于仍处于测试阶段，豆包的“深度思考”功能并未完全开放，用户在提问时可能会触发该功能。通过几个经典问题的对比，我们可以看出两者在深度思考模式上的差异。以“9.11和9.9谁大”为例，豆包的思考过程较为体贴，考虑到用户可能的误解，提供了详细的解释。而DeepSeek则更注重自我质疑和反复验证，思考过程更为复杂。

对于哲学问题如“意识的本质是什么？AI会获得自我意识吗？”豆包的回答更偏向哲学理论分类，讨论了物理主义、二元论等观点，而DeepSeek的回答则更技术导向，涉及神经科学、量子理论等内容。两者都承认意识本质尚无共识，但在技术细节和深度上有所不同。