时事快闻

OpenAI发布新工具：助力企业打造自主AI代理，能否跨越技术挑战？

时间：2025-03-12 08:03 来源：ITBEAR作者：陆辰风

在科技界万众瞩目的瞩目下，OpenAI于本周二震撼发布了全新工具套件，旨在赋能开发者与企业，利用OpenAI的尖端AI模型和框架，打造能够自主执行任务的智能代理系统。这些创新工具作为OpenAI新推出的Responses API的核心组成部分，预示着AI代理技术迈入了一个全新的发展阶段。

Responses API的推出，标志着OpenAI正逐步取代其原有的Assistants API，计划在2026年上半年全面完成这一过渡。通过该API，企业得以开发定制化的AI代理，这些代理能够执行诸如网络搜索、公司内部文档检索以及网页浏览等复杂任务，其功能与OpenAI的Operator产品不相上下。

尽管近年来科技界对于AI代理的炒作声浪此起彼伏，但真正能够清晰定义并展示AI代理实际应用价值的案例却寥寥无几。例如，中国初创公司Butterfly Effect近期推出的Manus AI代理平台，虽然在网络上引发了广泛关注，但很快便因未能兑现诸多承诺而遭到用户的质疑。

面对这一挑战，OpenAI深知让AI代理稳定运行并广泛应用的难度之大。OpenAI的API产品负责人Olivier Godement在接受采访时坦言：“展示AI代理的功能或许轻而易举，但要想将其规模化应用，并让用户频繁使用，却是难上加难。”

为了破解这一难题，OpenAI在今年早些时候通过ChatGPT引入了Operator和Deep Research两款AI代理工具，它们分别能够代表用户浏览网页和编制研究报告。尽管这两款工具初步展示了AI代理的潜力，但在自主性方面仍有待提升。如今，借助Responses API，OpenAI希望向开发者开放构建自主AI代理所需的组件，推动开发者创造出比现有应用更加智能的代理程序。

Responses API还内置了文件搜索工具，能够迅速扫描公司数据库中的文件以检索信息，同时保证不会在这些文件上训练模型。更重要的是，开发者可以利用OpenAI的计算机使用代理（CUA）模型，该模型为Operator提供了强大的支持，能够生成鼠标和键盘操作，自动化执行数据输入、应用程序工作流等任务。

然而，值得注意的是，Responses API并不能一蹴而就地解决当前AI代理面临的所有技术难题。尽管AI搜索工具在准确性方面相较于传统AI模型有所提升，但仍存在10%的事实问题错误率。同时，AI搜索工具在处理简短导航查询时也面临挑战，且ChatGPT的引用可靠性也备受争议。

OpenAI在官方博客中指出，CUA模型在操作系统上自动执行任务时仍不够可靠，且容易犯下“无意”错误。尽管如此，OpenAI强调这些仅是代理工具的早期版本，并承诺将持续努力进行改进。

除了Responses API外，OpenAI还推出了名为Agents SDK的开源工具包，为开发者提供了将模型与内部系统集成、实施保护措施以及监控AI代理活动所需的免费工具。这一工具包是OpenAI Swarm的升级版，后者是该公司去年年底发布的多代理编排框架。

Godement表示，他期望OpenAI能够在今年内缩小AI代理演示与实际产品之间的差距，并坚信代理将成为未来最具影响力的AI应用之一。这一观点与OpenAI首席执行官Sam Altman一月份的宣言不谋而合，Altman曾预言2025年将是AI代理进入劳动力市场的一年。

无论2025年是否真正迎来AI代理的爆发之年，OpenAI的最新发布都彰显了其从华而不实的演示转向打造具有实际影响力的工具的决心。随着技术的不断进步和应用场景的不断拓展，AI代理或将逐步成为推动社会进步的重要力量。

更多>同类内容