Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

继Anthropic之后,OpenAI也要接管人类电脑了? ! 就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。

继Anthropic之后,OpenAI也要接管人类电脑了?!

就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员),为用户自动执行任务。

图片图片

配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、订餐,做攻略等等。

好嘛,一看大家就明白,这是要和老对手Anthropic打起来了!

这将与Anthropic的computer use API进行竞争(Anthropic之前发布了computer use功能,号称接管人类电脑)

图片图片

事实上,在前一阵Reddit举办的有问必答活动上,CEO奥特曼曾信誓旦旦表示:

Agent将成为下一个重大突破。

同时,OpenAI首席产品官Kevin Weil进一步表示,让ChatGPT自主执行任务将是明年一大重点。

图片

不过,除了“遥遥领先”的Anthropic,OpenAI另一对手谷歌早已曝出将于12月发布自己的AI Agent版本。

国内百度智谱等模型厂商也推出了类似智能体和解决方案,甚至手机厂商荣耀、小米等还发布了自己的AI操作系统。

如此一来,压力也是来到了OpenAI这边。

虽说紧赶慢赶才有可能在明年1月推出,但还是有网友犀利吐槽太晚了!

图片图片

网友:1月太晚了

据彭博社消息,OpenAI计划于明年1月推出代号为“Operator”的智能体(Agent)。

其功能和10月份Anthropic发布的computer use类似,号称解放人类双手,代替用户操控电脑。

比如让它做旅游攻略,一段命令发布后,Agent就能自动打开谷歌搜索位置、天气,并结合用户的日程表给出切实可行的规划。

图片图片

另外,据OpenAI内部知情人士透露,在周三的员工会议上,有领导宣布:

届时该功能将以早期预览的形式发布(最初设计用于在网页浏览器中执行任务),且最初仅面向开发者提供API接口

甚至根据爆料,OpenAI内部其实一直在同时推进很多Agent项目,而Operator可能是最接近成功的一个。

对于上述传闻,OpenAI截至发稿前并未有所回应。

不过,一直关注OpenAI动态的光头哥还是发现了Operator的踪迹。

图片图片

然而,即便消息属实,OpenAI的动作还是有点晚了~

毕竟环顾四周,一众竞争对手貌似都跑在前头

最强劲敌Anthropic自不必说,人家早在10月份就推出了相关功能,一举惊艳AI圈。

而总是暗戳戳较劲的谷歌,也很有可能在12月推出代号为“Jarvis” (贾维斯)的Agent,按照双方时间表,这波谷歌没准获胜。

更不用说目前关系尴尬的微软,人家更是早Anthropic一天,一口气发布了10个Agent。

图片图片

抛开这些不谈,我们国内也有相当一部分选手开始在Agent上有所动作。

比如,百度在今年9月的百度云智大会就展示了Agent操作手机的一幕:

同样只需一段话,Agent就能帮我们制定行程,还能在不同APP间自行跳转。

制定一个国庆节去山西旅行3天的计划路线,要参考《黑神话:悟空》中涉及的山西经典,且希望住在品质好、性价比高的酒店,好评优先、500元以内,而且想要规划自驾路线。

图片图片

图片图片

另外,就在Anthropic之后,智谱也发布了AutoGLM,让AI像人一样使用手机;而且还不像Claude需要打字提需求,AutoGLM实现了光靠嘴说来执行很多操作。

甚至,在AI PC和AI手机圈子里,各大玩家也是把眼光都聚焦到了这种新范式。

10月23日,华为发布荣耀MagicOS 9.0,定位为C端用户的“类人助理”,通过大模型底座打通app正式开启AI Agent阶段,实现系统级AI操作。

而且就在昨天,荣耀官方宣布, MagicOS 9.0首批产品开始公测,覆盖了荣耀Magic Vs3、V2系列、Magic6系列、Magic5系列。

另外,小米也发布了澎湃OS 2.0系统,搭载基于AI大模型重构的操作系统,将设备转化为智能的“个人助手”。

……

以上可以看出,一直作为领先者的OpenAI,在Agent方面已经开始落后于人了。

2025年,属于Agent

不过另一方面也说明,明年Agent大概率成为厮杀重点。

毕竟,大模型Scaling Law后继乏力已成热议焦点。

有消息称,OpenAI、谷歌、Anthropic都在推出更大、更强模型产品方面遭遇瓶颈

具体来说,OpenAI代号“猎户座”(Orion)的下一代旗舰模型被曝提升不如预期,它相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。

这也侧面和奥特曼的说法相印证,他表示可能不会把新模型命名为GPT-5。

另外,谷歌Gemini 2虽然计划很快发布,但也被曝性能提升也未达到DeepMind创始人的预期。

同时,面对网友一直呼唤的大杯Claude 3.5 Opus,Anthropic也悄悄从官网删除了相关描述。

而Agent,目前很明显已经成为大家新的方向。

这盛世或将如网友所愿:2025年,属于Agent!

图片图片

参考链接:[1]https://www.bloomberg.com/news/articles/2024-11-13/openai-nears-launch-of-ai-agents-to-automate-tasks-for-users

[2]https://www.reddit.com/r/singularity/comments/1gqn099/openai_nears_launch_of_ai_agent_tool_to_automate/

[3]https://x.com/omarsar0/status/1856802883112767541

相关资讯

独角兽也卷不动了:AI Agent初创Adept被爆考虑出售

机器之能报道编辑:Sia越来越多的生成AI公司考虑加入出售的行列。据 Theinformation 消息,近几个月,AI 独角兽 Adept 领导层与科技巨头公司就出售或战略合作可能性进行了谈判。Adept 是一家由前 OpenAI 和谷歌 AI 开发人员创立的 AI 公司,专注于 AI Agent ,成立仅两年。Adept 去年 3 月完成新一轮融资后,估值已超 10 亿美元。消息人士称,Adept 曾与 Meta 接触,尽管收购的可能性不大。越来越多的生成 AI 公司在考虑出售可能性。AI 硬件公司 Human

OpenAI 朝 AI 第 3 阶段迈进,正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后,下一步会怎么走?该公司研究员诺姆・布朗(Noam Brown)在 X 平台给出了答案,组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表,最新推出的 o1 模型处于第二阶段,即所谓的“推理者”(reasoners),而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下:第一级:聊天机器人,具有会话语言的人工智能第二级:推理者,解决人类水平问题的人工智能第三级:智能体,能够代表用户采取行动的人工智能第四级:创新

OpenAI发布新年目标,Agent智能体或将迎来百模大战

2025年1月1日,OpenAI CEO 奥特曼公布了公司的新年目标,涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。 图片关于智能体,有网友爆料,OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent,这个 Agent 将具备直接控制电脑的能力。 图片其实24年10月份的时候,Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型,可操作电脑的智能体。