OpenAI Deep Research全面开放，网络安全风险评估首达中等

1.5K 0

2月26日凌晨，OpenAI宣布其强大的智能体Deep Research已全面向ChatGPT Plus、Team、Edu和Enterprise用户推出。这一决策标志着Deep Research自本月初发布以来，经历了从仅对Pro用户开放到更广泛用户群体的跨越。同时，OpenAI还发布了Deep Research系统卡，详细阐述了该智能体的构建过程、能力、风险及安全性提升措施。

　Deep Research作为OpenAI推出的新型智能体能力，专注于复杂任务的多步骤在线研究。它基于为网页浏览优化的OpenAI o3早期版本，能够利用推理能力在互联网上搜索、解读和分析大量文本、图像和PDF，并根据信息做出必要调整。此外，Deep Research还能读取用户文件，并通过编写和执行Python代码来分析数据，为用户提供深入、复杂的信息查询与分析支持。

在Deep Research推出后的二十余天里，OpenAI对其进行了多项升级，并发布了系统卡报告，介绍了发布前的安全工作。报告涵盖了外部红队评估、基于准备度框架的风险评估，以及为应对关键风险领域采取的缓解措施。这些措施包括加强个人信息隐私保护，以及训练模型以抵御在搜索互联网时可能遇到的恶意指令。

值得注意的是，OpenAI与外部红队成员团队合作，对Deep Research进行了严格的安全测试。评估的风险领域包括个人信息和隐私、不允许的内容、受监管的建议、危险建议和风险建议等。红队成员通过有针对性的越狱和对抗策略来规避模型的安全措施，为OpenAI提供了宝贵的测试数据和改进方向。

在风险评估方面，OpenAI使用了其标准的不允许内容和安全评估，并为个人信息和隐私等领域开发了新的评估方法。同时，根据准备度框架对Deep Research进行了评估，该框架涵盖了网络安全、CBRN（化学、生物、放射、核）、说服和模型自主性四个风险类别。评估结果显示，Deep Research在网络安全方面的风险评级为中等，这是模型首次在该领域获得此评级。

Deep Research的表现也备受瞩目。在SWE-Lancer Diamond测试上，缓解后的Deep Research模型表现最佳，解决了大约46-49%的IC SWE任务和47-51%的SWE Manager任务。这一成绩充分展示了Deep Research在处理复杂任务方面的强大能力。

随着Deep Research的全面开放，更多用户将能够体验到这一智能体带来的便捷与高效。同时，OpenAI也将继续对Deep Research进行升级和优化，以提升其安全性和性能，为用户提供更加优质的服务。

OpenAI表示，他们将继续致力于推动人工智能技术的发展和应用，为用户提供更加智能、便捷和安全的解决方案。Deep Research的全面开放，无疑是OpenAI在实现这一目标过程中的又一重要里程碑。