硬科技观察之智能体:2025年会是AI智能体爆发之年

OpenAI CEO奥特曼不久前曾说:“我们会拥有越来越好的模型,但我认为下一个巨大突破来自智能体。 ”所谓AI智能体,实际上就是由AI驱动的软件工具,只需要给出最小的监督,它就可以执行多步骤任务。 除了自然语言处理,AI智能体还可以做决策、解决问题、执行任务时与环境互动。

硬科技观察之智能体:2025年会是AI智能体爆发之年

OpenAI CEO奥特曼不久前曾说:“我们会拥有越来越好的模型,但我认为下一个巨大突破来自智能体。”

所谓AI智能体,实际上就是由AI驱动的软件工具,只需要给出最小的监督,它就可以执行多步骤任务。除了自然语言处理,AI智能体还可以做决策、解决问题、执行任务时与环境互动。

实际上,OpenAI也正准备推出新AI智能体(AI Agent),它可以代表用户执行PC任务,应该是与微软合作的成果。

在OpenAI内部,新智能体的代号为Operator,它可以执行一些自动任务,比如编写代码、安排旅行计划。报道称,OpenAI的新AI智能体明年一月就会推出预览版本,开发者可以通过API访问。

并且,据悉目前OpenAI正在开发多个AI智能体,最先推出的会是通用工具,它可以通过浏览器执行自动化任务。

上个月有媒体报道称,谷歌也在开发新模型,它可以代表用户在浏览器内执行任务。谷歌项目的代号为“Project Jarvis”,它会运行于未来的谷歌Gemini模型之上,可以将浏览器任务自动化,可以解释截图、点击按钮、输入文本。

2025年AI智能体会成为关键词

随着越来越多企业都在关注AI智能体,未来的AI智能体可能会很光明,有人甚至认为,明年会是“AI智能体年”。

平台整合公司Boomi的CEO Steve Lucas说,由于生成式AI和模型在多个领域突飞猛进,今年关于AI智能体的讨论多了起来。

Steve Lucas说:“我相信在历史进程中总会有一些趋同的时刻,也就是各种要素会突然融合,创造出我们未曾预料的结果。你拥有接近无限的算力,有超强的GPU处理能力,有很多但不是接近无限的数据,它们突然以全新的方式处理输入和输出,这些输入和输出在同一时间交融。”

当组织和AI企业谈论智能体的未来时,实际上意味着企业内的许多任务已经实现自动化。用户给出提示或者做一些简单动作,AI智能体就会满足用户的需求。

在过去几个月,一些大型服务提供商已经开始向客户开放智能体。例如,Salesforce推出了名叫Agentforce的软件。Salesforce CEO Marc Benioff认为,AI智能体是AI产业的第三波浪潮。

还有,Slack已经允许客户整合来自Salesforce、Asana、 Workday、Cohere、Writer和Adobe的智能体。ServiceNow已经更新Now Assist平台,加入许多智能体。AWS推出面向Bedrock的智能体,让客户以更快的速度开发定制智能体。

智能体的普及速度正在加快

来自Forum Ventures的报告指出,它们调查了100位资深AI领导者,48%已经准备好将AI智能体投入运营,33%已经准备充分。

许多企业都在实验、探索,看看如何让AI智能体落地,明年企业可能会在一些小任务中测试AI智能体的性能。

德勤高管Jim Rowan认为,一些客户已经对AI智能体进行有限测试,它们发现智能体的潜力很大,这些智能体有可能会成为能够理解个人偏好的高技能合作者。

Steve Lucas指出,目前已经有约2000个客户使用它们的智能体,明年可能会涨10倍。

明年AI智能体可能会迎来爆发,但成本问题仍然是企业不得不考虑的因素。投资公司Prosus的AI副总裁Paul van der Boor说,智能体的使用量会越来越多,但企业应该记住,这门技术是有成本的。

Paul van der Boor称:“方向很明确,大趋势不会变,但是要注意,当中有很多的实际考虑,因为智能体要对许多不同的元素进行多次调用,需要更多的Tokens,所以它们会更贵。”

AI智能体会不断进化

Steve Lucas认为,你以前可能是单独的工作者,现在变了,你成了数字员工,要与他人一起完成任务,此时AI智能体的作用就凸显出来了,这是AI智能体最实用的应用场景之一。但在2025年,多智能体协同不会流行起来(多智能体就是多个智能体一起执行任务),最开始流行的还是所谓“智能体岛”(agent island),即孤立的智能体。

Steve Lucas说:“你会有很多的智能体岛,比如Salesforce 岛、Boomi岛、甲骨文岛。随着时间的推移,岛之间会进行沟通联系,形成多智能体协同。”

未来几年,智能体将在企业中扮演更积极更主动的角色。

德勤高管Rowan认为,AI智能体有可能演变成可以预测用户需求的多目的智能体。例如,它们可以自动扫描用户的邮件箱,对发送过来的邮件进行分类,可以优化回复信息。

Rowan称:“随着时间的推移,智能体将根据他们正在执行的任务的认知性质进行升级,现在的智能体还达不到这种水平,现在还只是按照员工的要求执行。”

未来的AI智能体会进化成指挥或编曲智能体。比如Meta智能体走的就是这条路,它的AI智能体可以指挥其它智能体。

咨询机构Amplyfi的CEO Paul Tether认为,Meta Agents是企业AI智能体的终极下一步。他预测:“明年年底之前,我们会看到更多类似Meta的智能体出现。”

相关资讯

吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

下一步是智能体?随着 ChatGPT、GPT-4、Sora 的陆续问世,人工智能的发展趋势引起了广泛关注,特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问:人工智能领域下一个突破方向将会是什么?今天,人工智能著名学者、斯坦福大学教授吴恩达指出:AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。他呼吁所有从事人工智能工作的人都关注 AI 智能体工作流,并撰写一篇博客简单阐述了原因。我们对博客内容进行了不改变原意的编译、整理,以下是博客内容:当前,我们主要在零样

吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果

智能体的潜力被低估了?AI 智能体是去年很火的一个话题,但是 AI 智能体到底有多大的潜力,很多人可能没有概念。最近,斯坦福大学教授吴恩达在演讲中提到,他们发现,基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然,基于 GPT-4 构建的智能体工作流效果更好。由此看来,AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。这是一个值得所有人关注的趋势。这个关于智能体的演讲在社交媒体上引发了广泛关注。有人表示,这代表着 AI 发展中的范式转变,体现了从静态输出到动

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B RAG 方案快 36 倍。不少网友感叹:设备端 AI 智能体的时代到来了!论文:Octopus v2: On-device language mod