2025年6月3日,OpenAI发布博文,宣布对旗下AI智能体开发工具进行重大升级,在平台兼容性、语音界面支持和可观测性等方面实现突破,为开发者带来了一系列实用更新。
扩展开发者生态,新增TypeScript支持
OpenAI宣布其Agents SDK新增TypeScript支持,在继Python版本后,进一步覆盖JavaScript和Node.js环境开发者。此版本与Python版功能对齐,包含Handoffs(任务转交机制)、Guardrails(运行时行为约束)和Tracing(执行追踪)等核心组件。此外,MCP(模型上下文协议)确保智能体步骤间上下文传递顺畅。TypeScript SDK适配现代Web和云原生应用栈,开发者可在前端浏览器和后端Node.js环境中统一构建智能体。
助力语音应用与人工干预,推出RealtimeAgent
为支持低延迟语音应用,OpenAI推出RealtimeAgent新功能,扩展Agents SDK,集成音频输入输出、状态交互及中断处理。该功能亮点在于“人机回路”(HITL)审批机制,支持开发者在Runtime暂停智能体执行,检查状态并手动确认后继续,这对需要监管、合规检查或领域验证的应用尤为重要。开发者还可完整保留上下文并恢复执行。
实现语音会话追踪,升级Traces仪表盘
OpenAI升级了Traces仪表盘,支持Realtime API会话追踪,覆盖音频输入输出、工具调用及用户中断等环节,提供统一的审计记录,可简化调试与性能优化过程。
提升性能,改进语音对语音模型
OpenAI改进语音对语音模型,重点降低延迟、提升对话自然性及中断处理能力,包括更快的流式响应、更具表现力的音频生成及对重叠输入的稳健应对,这些更新有助于构建动态多模态对话智能体。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...