近日,有消息指出OpenAI即将推出一款名为Operator的AI工具,该工具能够协助用户执行电脑上的各种任务。这一信息由知名软件工程师Tibor Blaho提供,他因多次准确预测即将发布的AI产品而备受关注。
Blaho透露,他发现了多个关于Operator的证据。此前,彭博社等媒体也报道过这款被称为“代理型”的系统,它能够自主完成编程、旅行预订等多种任务。
据知情人士称,OpenAI计划在今年一月发布Operator。Blaho周末发现的相关代码进一步证实了这一点。
Blaho表示,在OpenAI为macOS设计的ChatGPT客户端中,已经添加了用于切换和强制退出Operator的隐藏快捷键选项。此外,OpenAI官网也已包含对Operator的引用,尽管这些信息尚未公开。
Blaho还提到,OpenAI网站上有一些未公开的表格,对比了Operator与其他AI系统的性能表现。尽管这些表格可能只是占位符,但如果数据准确,则表明Operator在某些任务上并非完全可靠。
在OSWorld基准测试中,一个可能是Operator依赖的AI模型——“OpenAI电脑使用代理(CUA)”得分为38.1%,超过了Anthropic的同类模型,但远低于人类的72.4%得分。在WebVoyager测试中,OpenAI CUA的表现超越了人类,但在WebArena测试中,其得分则低于人类水平。
如果泄露的信息属实,Operator在处理一些看似简单的任务时也会遇到挑战。例如,在一项要求Operator注册云服务并启动虚拟机的测试中,其成功率仅为60%;而在创建比特币钱包的任务中,成功率更是低至10%。
OpenAI对此消息暂无回应。
随着Anthropic、谷歌等公司纷纷进入AI代理市场,OpenAI的这一动向引起了广泛关注。尽管AI代理技术仍处于初级阶段且存在风险,但各大科技公司视其为AI领域的下一个重大突破。市场分析机构预测,到2030年,AI代理市场的规模可能达到471亿美元。
值得注意的是,一些专家对AI代理技术的安全性表示担忧,尤其是在技术迅速发展的背景下。据泄露的信息显示,Operator在特定安全评估中的表现良好,包括防止非法活动和保护敏感个人信息的测试。据报道,安全性是导致Operator开发周期较长的原因之一。OpenAI联合创始人Wojciech Zaremba近期批评Anthropic发布了一款缺乏安全措施的代理,并警告称若OpenAI发布类似产品可能会引发负面反应。