OpenAI Deep Research全面开放,网络安全风险评估首达中等

AI头条6小时前发布 zhuge
1.1K 0

2月26日凌晨,OpenAI宣布其强大的智能体Deep Research已全面向ChatGPT Plus、Team、Edu和Enterprise用户推出。这一决策标志着Deep Research自本月初发布以来,经历了从仅对Pro用户开放到更广泛用户群体的跨越。同时,OpenAI还发布了Deep Research系统卡,详细阐述了该智能体的构建过程、能力、风险及安全性提升措施。

OpenAI Deep Research全面开放,网络安全风险评估首达中等

 Deep Research作为OpenAI推出的新型智能体能力,专注于复杂任务的多步骤在线研究。它基于为网页浏览优化的OpenAI o3早期版本,能够利用推理能力在互联网上搜索、解读和分析大量文本、图像和PDF,并根据信息做出必要调整。此外,Deep Research还能读取用户文件,并通过编写和执行Python代码来分析数据,为用户提供深入、复杂的信息查询与分析支持。

在Deep Research推出后的二十余天里,OpenAI对其进行了多项升级,并发布了系统卡报告,介绍了发布前的安全工作。报告涵盖了外部红队评估、基于准备度框架的风险评估,以及为应对关键风险领域采取的缓解措施。这些措施包括加强个人信息隐私保护,以及训练模型以抵御在搜索互联网时可能遇到的恶意指令。

OpenAI Deep Research全面开放,网络安全风险评估首达中等

值得注意的是,OpenAI与外部红队成员团队合作,对Deep Research进行了严格的安全测试。评估的风险领域包括个人信息和隐私、不允许的内容、受监管的建议、危险建议和风险建议等。红队成员通过有针对性的越狱和对抗策略来规避模型的安全措施,为OpenAI提供了宝贵的测试数据和改进方向。

在风险评估方面,OpenAI使用了其标准的不允许内容和安全评估,并为个人信息和隐私等领域开发了新的评估方法。同时,根据准备度框架对Deep Research进行了评估,该框架涵盖了网络安全、CBRN(化学、生物、放射、核)、说服和模型自主性四个风险类别。评估结果显示,Deep Research在网络安全方面的风险评级为中等,这是模型首次在该领域获得此评级。

Deep Research的表现也备受瞩目。在SWE-Lancer Diamond测试上,缓解后的Deep Research模型表现最佳,解决了大约46-49%的IC SWE任务和47-51%的SWE Manager任务。这一成绩充分展示了Deep Research在处理复杂任务方面的强大能力。

随着Deep Research的全面开放,更多用户将能够体验到这一智能体带来的便捷与高效。同时,OpenAI也将继续对Deep Research进行升级和优化,以提升其安全性和性能,为用户提供更加优质的服务。

OpenAI表示,他们将继续致力于推动人工智能技术的发展和应用,为用户提供更加智能、便捷和安全的解决方案。Deep Research的全面开放,无疑是OpenAI在实现这一目标过程中的又一重要里程碑。

© 版权声明

相关文章