OpenAI推出构建智能体的新工具这是你需要了解的一切

OpenAI推出构建智能体的新工具这是你需要了解的一切-2

随着Manus的爆火点燃了AI Agent市场的热潮,AI代理技术正迅速成为科技产业的新焦点。 当全球企业竞相将生成式AI投入实际业务时,一个关键瓶颈浮出水面: 如何让AI系统真正像人类员工一样,独立完成多步骤复杂任务? OpenAI周二推出了一套新工具,旨在简化企业构建"代理"——能够独立完成任务的AI系统——的过程。

▍ 从「对话式AI」到「代理革命」的技术跨越

过去18个月,GPT系列模型在文本生成、代码编写等场景展现惊人能力,但企业客户反馈显示,将模型转化为能处理税务申报、供应链优化等实际业务的「数字员工」,仍面临三大障碍:

1. 工具调用与多轮交互的复杂编排

2. 缺乏连接现实世界的「感官系统」

3. 生产环境中的监控与调试难题

我们正见证AI从『工具』向『代理』的范式转变。这要求基础设施提供商提供完整的神经系统——不仅是大脑皮层,还要有连接现实的手眼协调能力。

OpenAI 已经推出了两个大型代理解决方案,如DeepResearch和 Operator。 现在正转向 API,为开发者构建自己的代理提供支持。

▍三大核心组件解密:OpenAI的「代理操作系统」

此次发布的开发者套件被业内视为构建AI代理的「操作系统级解决方案」,其核心架构包括:

▍ 1. Responses API:工具协同的神经中枢

Responses API是OpenAI新推出的核心组件,融合了Chat Completions API的简洁性和Assistants API的工具使用能力。 该API允许开发者 通过单个调用使用多种工具和多轮模型交互来解决复杂任务。

与传统 Chat Completions API API 不同,这个新 API 足够灵活,能够更原生地支持多个回合和工具。Responses API 是 Chat Completion API 支持的子集的超集。

▍2. 内置工具:连接AI与现实世界

内置实时网络搜索、文档检索、计算机操作三大工具链。

网络搜索功能

这是驱动 ChatGPT 搜索的同款工具,在Responses API中,开发者使用GPT-4o和GPT-4o-mini时只需要几行代码即可启用网络搜索工具,获取实时网络信息及清晰相关引用。这项功能已应用于购物助手 、研究代理和旅行预订代理等场景。

OpenAI推出构建智能体的新工具这是你需要了解的一切-3

据OpenAI透露,在SimpleQA评估基准上, GPT-4o 搜索预览在 SimpleQA 基准测试中达到 90%。这就是 SoTA!该功能的定价从GPT-4o搜索每千次查询30美元和GPT-4o-mini搜索每千次查询25美元起。

OpenAI推出构建智能体的新工具这是你需要了解的一切-4

文件搜索功能

这对于与 RAG 相关的代理用例很有用。它现在支持元数据过滤和直接搜索端点,可启用直接搜索到您的向量数据库。

OpenAI推出构建智能体的新工具这是你需要了解的一切-5

该工具在Responses API中向所有开发者开放,定价为每千次查询2.50美元,文件存储费用为0.10美元/GB/天,首个GB免费。

计算机使用功能

这个工具允许你控制你的计算机。 计算机使用工具允许代理执行复杂的计算机任务,由支持Operator的计算机使用代理(CUA)模型提供支持。该研究预览版模型在OSWorld完整计算机使用任务中达到38.1%的成功率,在WebArena中达到58.1%,在WebVoyager基于网络的交互中达到87%的成功率。 OpenAI推出构建智能体的新工具这是你需要了解的一切-6

该工具可捕获模型生成的鼠标和键盘操作,开发者能够将这些操作转换为环境中的可执行命令,实现计算机任务自动化。

OpenAI推出构建智能体的新工具这是你需要了解的一切-7

"我们在几天内就实现了应用程序处理和用户注册流程的自动化——这是传统机器人流程自动化经过数月努力仍难以实现的成果,"Luminai的一位代表表示。

计算机使用工具目前仅向特定开发者开放,定价为每百万输入Token 3美元和每百万输出Token 12美元。

这些内置工具都可以和 Responses API 结合使用, 它可以同时调用多个工具,并在一个请求中给出最终响应。 Response s API 将扩展更多,并支持 Assistants API(计划于 2026 年删除)所能做的一切。

OpenAI推出构建智能体的新工具这是你需要了解的一切-8

OpenAI推出构建智能体的新工具这是你需要了解的一切-9

▍3. Agents SDK:多智能体协作的指挥中心

OpenAI 还决定将他们的代理编排框架 Swarm 升级为更适合生产环境的版本。该框架已重新命名为 Agents SDK。你可以在这个框架中继续使用相同的工具。该 SDK 在底层使用 Responses API,并且还支持其他供应商的模型。

Agents SDK 作为一个开源框架,原生支持构建多代理系统。分类代理能够将任务连同相关上下文一起交接给其他代理执行。

OpenAI推出构建智能体的新工具这是你需要了解的一切-10

Agents SDK 支持开箱即用的监控和追踪。 这可以用于调试您的代理。 一个跟踪用户界面也可用于跟踪您的代理工作流的跟踪信息。 其他功能包括安全栏和生命周期事件。

OpenAI推出构建智能体的新工具这是你需要了解的一切-11

▍ 未来展望

OpenAI 将这些新发布的功能视为构建 AI 代理综合平台的第一步。该公司计划在未来几个月推出更多工具和集成,帮助开发者更有效地部署、评估和扩展代理应用。

"我们认为未来几个月对于大规模部署更多代理至关重要,"Godement 表示。"我们已经通过 Deep Research 等自家代理实现了这一点,但 OpenAI 不可能构建所有代理——这正是我们提供开发者平台的原因。"

OpenAI 还表示将继续改进代理应用的安全特性,包括加强对提示注入和未授权数据访问的防护措施。

有兴趣使用这些新工具进行开发的开发者可以即刻探索 OpenAI 的文档和 API 游乐场开始尝试。

THE END
分享
二维码
< <上一篇
下一篇>>