豆包AI助手深度思考模式评测:能否挑战DeepSeek?
最新发布的深度思考模式,正在改变AI助手的交互方式。字节跳动旗下的AI助手豆包正在进行小规模测试,旨在提升其推理能力和用户体验。据豆包相关负责人透露,此次测试涉及多个实验版本,基于豆包1.5基座模型研发。早在1月中旬,豆包大模型团队发布豆包1.5Pro时,便已宣布推出Doubao-1.5-pro-AS1-Preview深度推理模型,强调通过RL算法突破和工程优化,实现Test Time Scaling的算力优势。
极客公园的实测结果显示,与豆包对话时,用户可以观察到生成答案中的推理过程,但这一功能并不总是稳定出现。目前,豆包对话页面尚未提供“深度思考”功能的入口。自2月22日起,豆包在中国区苹果应用商店免费APP下载排行榜上位列第三,落后于腾讯的“腾讯元宝”和DeepSeek。
豆包的深度思考模式进展
最早的深度思考模型由OpenAI于2023年12月推出,但仅限付费用户使用。相比之下,DeepSeek通过开源策略和低成本优势,迅速普及了这一功能。2024年11月20日,DeepSeek发布了R1-Lite-Preview,成为国内首个对标OpenAI的推理模型,并在2025年1月20日开源了R1模型。R1模型的特点在于透明化的思维链,展示完整的推理过程,包括自我质疑、假设验证等拟人化思考路径,降低了推理成本。
深度思考模式的核心技术是思维链(Chain of Thought, CoT),它使用户能够直观看到模型的思考过程。例如,在解决数学题时,模型会展示从问题拆解、多方法验证到最终结论的全过程。结合实时联网功能,模型还可以抓取最新信息并进行逻辑整合。最近,Anthropic发布了Claude 3.7 Sonnet混合推理模型,阿里云也推出了Qwen推理模型“QwQ-Max预览版”。豆包对这两款模型进行了评估,展示了其思考过程。
豆包与DeepSeek的对比
由于仍处于测试阶段,豆包的“深度思考”功能并未完全开放,用户在提问时可能会触发该功能。通过几个经典问题的对比,我们可以看出两者在深度思考模式上的差异。以“9.11和9.9谁大”为例,豆包的思考过程较为体贴,考虑到用户可能的误解,提供了详细的解释。而DeepSeek则更注重自我质疑和反复验证,思考过程更为复杂。
对于哲学问题如“意识的本质是什么?AI会获得自我意识吗?”豆包的回答更偏向哲学理论分类,讨论了物理主义、二元论等观点,而DeepSeek的回答则更技术导向,涉及神经科学、量子理论等内容。两者都承认意识本质尚无共识,但在技术细节和深度上有所不同。
总结
尽管豆包的深度思考模式仍在测试中,功能的稳定性和入口尚未完全开放,但其初步展示的推理过程已为用户带来了更直观的理解路径。未来,随着测试的推进,豆包有望在这一领域取得更大突破,与DeepSeek展开更加激烈的竞争。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...