AI 时代新利器:OpenAI Operator 自动化浏览器任务,革新网页交互体验

OpenAI 公司昨日(1 月 23 日)发布博文,宣布推出名为“Operator”的 AI 智能体,使用自己的浏览器为用户执行任务,现阶段仅向美国 Pro 订阅用户开放。

OpenAI 公司昨日(1 月 23 日)发布博文,宣布推出名为“Operator”的 AI 智能体,使用自己的浏览器为用户执行任务,现阶段仅向美国 Pro 订阅用户开放。

AI在线援引博文介绍,Operator 使用自家浏览器,可以执行填写表单、订购杂货,甚至创建表情包等各种重复的浏览器任务。

AI 时代新利器:OpenAI Operator 自动化浏览器任务,革新网页交互体验

Operator 向美国的 Pro 版订阅用户开放,网址为 operator.chatgpt.com,后续将扩展到  Plus、Team 和 Enterprise 用户,并在未来将这些功能集成到 ChatGPT 中。

Operator 由名为 Computer-Using Agent(CUA)的新型模型驱动。CUA 结合了 GPT-4 的视觉功能和通过强化学习获得的高级推理能力,经过训练可以与图形用户界面(GUI,即人们在屏幕上看到的按钮、菜单和文本字段)进行交互。

Operator 可以通过屏幕截图“看到”浏览器内容,并使用鼠标和键盘允许的所有操作进行“交互”,从而能够在无需自定义 API 集成的情况下在网络上采取行动。

相关资讯

OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版

OpenAI  终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Windows 版本。”OpenAI 还称,ChatGPT 还将拥有经过优化的用户界面。OpenAI 的演示显示,用户可以将处于最小化窗口的 ChatGPT 桌面应用与其他程序并排打开。用户可以通过输入或语音的方式向 ChatGPT 提问屏幕上显示的内容,ChatGPT 则能根据其“所见” 进行回答。Op

OpenAI 的 ChatGPT Mac 版应用已向所有用户开放,支持语音对话

OpenAI 公司宣布,其首款适用于 Mac 的 ChatGPT 聊天机器人应用正式面向所有用户开放下载。此前一个月,该应用一直处于测试阶段,仅 Plus 付费订阅用户可以使用。OpenAI 称,ChatGPT 的 Mac 应用旨在与用户日常操作无缝集成,其原生支持 Mac 系统,并提供方便的快捷键 (Option  空格键) 允许用户随时随地启动应用。用户可以轻松与聊天机器人进行交互,并可选择将文件、照片和屏幕截图等附加到您的信息中,供 ChatGPT 使用这些素材进行理解和创作。IT之家注意到,该应用还支持“

OpenAI 推出 Windows 版 ChatGPT 客户端:支持热键调用、暂仅限付费用户测试

感谢继苹果 macOS 版后,OpenAI 目前已为微软 Windows 用户推出 ChatGPT 应用桌面客户端,目前这款应用正进行测试,订阅了 ChatGPT Plus / Enterprise / Team / Edu 版本的付费用户可以在微软应用商店中下载使用应用。这款应用本质上是网页版 ChatGPT 套上了外壳,用户可以在窗口中询问 AI 各种功能、上传各种照片文档、访问 OpenAI o1 模型,同时支持通过“Alt  空格”热键快速调出应用,不过AI在线注意到目前“高级语音模式”功能暂时缺席。▲ 图源 OpenAIOpenAI 表示,这款应用将在测试完成后向所有用户开放,预计今年晚些时候完成测试。