AI在线 AI在线

智能体的五大商业用例

作者:Maria
2025-04-25 01:10
AI的下一代已经到来,它具有自主性。 智能体与聊天机器人由相同的AI系统提供支持,但可以独立行动、协作以实现更大的目标,并接管整个业务流程,这项技术相对较新,但所有主要参与者都已经加入。 去年10月,微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot .

智能体的五大商业用例

AI的下一代已经到来,它具有自主性。智能体与聊天机器人由相同的AI系统提供支持,但可以独立行动、协作以实现更大的目标,并接管整个业务流程,这项技术相对较新,但所有主要参与者都已经加入。

去年10月,微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot Studio,这一数字是几个月前的两倍。Copilot Studio能够使企业构建自主智能体,以及其他将CRM系统、HR系统和其他企业平台连接到Copilot的智能体。

在整个2024年底,微软继续有目的地扩展其智能体产品,推出了针对特定用例的定制智能体,然后在11月,该公司推出了Azure AI Agent Service,这是一项完全托管的服务,可让企业快速构建、部署和扩展智能体。而在AWS上,自2023年以来,Amazon Bedrock Agents就已可用,但在12月,亚马逊添加了多智能体协作功能。

主要的企业软件供应商也在进入智能体领域。Salesforce在10月推出了Agentforce,随后几个月推出了Agentforce 2.0。该升级包括一个预建技能和工作流程集成的库、对Slack的支持以及更强的推理能力。

在此之前,ServiceNow于9月宣布了其AI Agents产品,11月推出了针对客户服务管理和IT服务管理的首批用例。

还有一些纯粹的智能体AI平台提供商,如CrewAI,以及智能自动化提供商,如UiPath,而这仅仅是开始,在1月初发布的一份报告中,Accenture预测,到2030年,智能体将取代人类,成为大多数企业系统的主要用户。在1月KPMG对100家大型企业高管的调查中,12%的公司已经部署了智能体,37%的公司处于试点阶段,另有51%的公司正在探索其使用,但并非一切顺利,因为通用AI本身还远非完美。

“存在幻觉和偏见的风险,”Accenture的首席负责AI官Arnab Chakraborty说,“因此,这不仅仅关乎用例,还关乎设置防护栏。”智能体也很难构建,且大规模部署成本高昂。

尽管如此,企业已经在报告部署智能体用于多个用例的成功案例。

1. 软件开发和IT

去年3月,Cognition发布了Devin,号称是世界上第一个AI软件工程师。当时,最好的AI在SWE-bench(一个旨在测试AI解决真实世界编码问题能力的挑战性基准测试)上的得分不能超过5%。Devin的得分接近14%。到了8月,智能体AI系统的得分接近40%,而今天,它们已经突破了60%的里程碑。

与此同时,去年12月,OpenAI的新O3模型(一个尚未向公众公开的智能体模型)在同一测试上得了72%。根据Capgemini于2024年中发布的一项调查,60%的大型公司高管表示,智能体将在三到五年内处理企业中的大部分编码工作。

但已经有一些特定于软件开发生命周期的工作岗位准备好借助智能体。

“我们开发了自己的自主式AI用于代码管理,”Mitre的首席技术官Charles Clancy说,“似乎效果最好的最佳用例是在存储库管理中,在那里,它将遍历并进行代码存储库的错误修复。”

例如,他说,10年前的源代码可能无法在现代计算机上正确编译。

“智能体将下载它,尝试构建它,如果它无法运行,它将在必要时修复构建脚本和代码,将代码检查回存储库,并标记它是由智能体完成的。”他说。

Clancy补充说,Mitre不得不创建自己的系统,因为大多数现有工具使用供应商管理的云基础设施进行AI推理部分。“出于安全原因,我们不能这样做。”他说。

他还说,还有一个单独的研究项目正在研究50年前的主机代码,并使用AI提取业务逻辑,并为其重写云原生框架。

“我们的目标是在所有政府组织中现代化复杂且关键的任务旧版IT系统。”他说。

这些系统中有数百万行代码,是用COBOL、MUMPS,甚至是与原始硬件绑定的汇编语言编写的。“我们正在开发自己的AI模型,以定制改进稀有平台上的代码理解。”他补充道。

Mitre还在一个安全的、由Mitre管理的云环境中使用AWS Bedrock测试了数十个商业AI模型。到目前为止,已经处理了50多万行代码,但由于幻觉和其他质量问题,仍然需要人工监督。

“我们还发现,自主式AI可以与为软件工程师开发的工具一起工作,从而显著提高验证和编译代码的成功率,”Clancy说。这提供了潜在途径来训练新的AI,以减少对监督的需求。“即使考虑到必要的人工监督,这个过程也在每天都在加快。”

去年12月,Langbase发布了一份智能体状态报告,基于来自高管和技术专业人士的3400多份回复。智能体的首要用例是软件开发,有87%的受访者表示正在使用。此外,48%的人表示他们正在IT和运营中使用大型语言模型(LLM)。

2. 自动化和生产率

由于智能体可以接触许多系统,工作流程自动化和生产率成为企业的首要用例。根据KPMG的报告,行政职责是智能体的主要用例,有60%的受访者表示正在使用。以全球律所Avantia为例,该律所使用商业和开源通用AI为其智能体提供支持。“我们领域的关键挑战是,有数百项任务可能无法很好地自动化,”首席技术官Paul Gaskell说,“而且它们不太适合SaaS解决方案。有太多的单独任务分散在太多的地方。”

现在,有了微软,智能体可以作为伴侣坐在Word或Outlook中,随时准备执行任务。

“如果客户要求我们执行交易或工作流程,并且Outlook或Word是打开的,智能体可以访问所有公司数据,”他说。“而且,因为这些是我们的律师正在处理的文档,我们有他们通常做什么的历史记录。”

从业务角度来看,律师可以更快地完成合同签订流程、更快地回应客户、并以比其他人更快的速度进行交易。

Gaskell预计,到2025年中,利润率将提高多达45%。“我们已经对已经完成的工作进行了时间和动作研究,”他说,“我很难想象这不会成为专业服务业的未来。”

Gaskell说,他的公司对LLM持不可知论态度,这意味着智能体可以根据哪个最适合,由不同的LLM提供支持。这包括一些主要的开源模型,他说,因为它们提供了隐私、成本优势和更低的延迟。智能体目前运行在超大规模云服务商的服务器上,但该公司正在考虑投资自己的GPU,并在托管设施中租用空间,以进一步降低成本。

另一家使用智能体来自动化业务流程的公司是SS&C,一家金融服务和医疗技术公司。

“我们从2万名客户那里收到各种格式的文档,”该公司自动化高级常务董事Brian Halpin说。这些可能是PDF、数字表格、电子邮件,关键信息可能位于任何位置,并以不同的方式呈现。这加起来每月需要处理数百万份文档。“理解文档的上下文是至关重要的,”他补充道,而过去,这一直是阻碍自动化的最大障碍,而通用AI可以提供帮助。

“因此,今天,我们有20个围绕文档使用智能体的生产用例,”Halpin说,“这很有用,也很强大。”数据保存在私有云中以确保安全,LLM也在内部托管。SS&C使用Meta的Llama以及其他模型,Halpin说。

该系统于2024年中投入生产,并在去年11月处理了5万份文档。“我们将继续增加这一数量。”他说。

他说,在传统自动化中,人类几乎需要查看每份文档。有了AI,这个比例被颠倒了。例如,在贷款文件类型中,自动化的比例达到90%左右,只有少数文件需要人工审查。

3. 客户服务和支持

在邓白氏,智能体帮助客户与该公司收集的关于世界上5000万家企业的信息互动。

“我们为95%的财富500强企业提供服务,他们使用我们的数据来做出一些最重要的决策,”该公司的首席数据和分析官Gary Kotovets说。这包括信贷决策和供应链决策,他说。数据还用于销售和营销。

“对我们来说,智能体对于与我们的数据互动至关重要,”他说。“它们允许客户提出与公司相关的问题,智能体将确保数据是与该公司最相关的准确信息。”这并不总是那么容易,因为许多公司的名称和地址相似。“这就是智能体发挥作用的地方。我们的智能体说,‘让我确保这家公司是他们正在询问的实际公司。’它们能够理解所提出的问题。”

4. 内容创作

撰写文本和创建图像是通用AI最早的两个流行用例。现在,智能体可以加速内容创作过程。根据Langbase的调查,文本生成和摘要是第二受欢迎的用例,有59%的受访者表示正在使用,其次是营销和传播,有50%的受访者表示正在使用。安永在其第三方风险管理服务中使用智能体。

安永的负责人辛克莱·舒勒表示:“你们聘请我们来评估你们引入的一些供应商。”“我们的风险评估人员会完成这项工作,在一个供应商身上花费多达 50 个小时,仔细研究合同和其他文件,以制作出一份报告,指出我们观察到的风险。”

过去通常都是这样做的,直到GenAI的出现。

“现在我们可以把所有合同和公开文件输入给人工智能,它可以在几分钟内就生成一份报告,而不是过去需要的几天,并且报告内容极为准确详细。”他表示。然后人类专家会对这些报告进行完善。“人工智能加上人类专业知识,在质量上是一个巨大的提升。”他说。

现在,随着自主式AI的出现,这个过程又在发生变化。

“我们将发布这个过程的智能体驱动版本,实现对供应商的持续监控,这在以前是不可能的。”他说。

这是公司在考虑 AI 智能体时经常忽视的一点,他表示。“很多人把关注点放在了优化用例上,”他说。“但真正的价值在于市场的拓展,以及收入机会的增加。”

5. 人力资源和员工支持

智能体的另一个相对低风险、高价值的应用场景是回答员工问题,并代为处理简单任务。事实上,IBM 在 2024 年 1 月进行的一项关于通用人工智能发展的调查中得出结论,43% 的公司使用 AI 智能体来进行人力资源管理。

例如,全球数据服务公司 Indicium 从 2024 年年中开始部署智能体,当时这项技术开始成熟。

“你会开始看到现成的应用程序——既有开源的,也有专有的——这让构建智能体变得更加容易。”该公司的首席数据官丹尼尔·阿万奇尼表示。

他表示,这些智能体被用来让 HR 的工作更加轻松,包括内部知识检索、标记、记录以及其他业务流程。每个智能体就像一个微服务,专门负责一件事情。“它们在一个多智能体系统中相互通信,”他说。这些基于提示的对话可能会变得很奇怪。棘手的是,通用人工智能可能会产生幻觉等问题。“因此,我们需要对模型进行大量调整,以防止它们做出错误行为或访问错误信息。”他说。

从积极的一面来看,AI 智能体可以自主处理很多问题,因此在这方面具有商业价值。“我们还发现了未正确记录的内容,这有助于我们改进流程。”他补充道。

信任但要验证

安全性是智能体开发自始至终的基石。事实上,最早的智能体框架之一是 BabyAGI,于 2023 年年初发布,它将 ChatGPT 与 Pinecone 向量数据库(用于记忆)和 LangChain(用于编排)相结合。创建它的开发者开玩笑地要求它制造尽可能多的回形针——这是对一种假设的由失控 AI 引发的回形针末日的引用——该系统立即认识到了潜在问题,并首先为自己生成了一个安全协议,但大多数智能体型 AI 开发者并不愿意对 AI 如此信任。

在 LangChain 2023 年 11 月对 1300 多名专业人士进行的调查中,55% 的受访者表示,追踪和可观察性工具是智能体不可或缺的控件,有助于他们了解智能体的行为和性能。此外,44% 的受访者设置了防护栏,40% 使用了离线评估。

“AI 模型存在风险,会犯各种各样的错误,”瑞典乌默奥大学计算机科学系和技术政策理事会主席弗吉尼亚·迪格努姆表示。

但她表示,可以创建系统来捕捉错误,因此,如果智能体无法完成任务,它会承认失败,而不是尝试编造内容。

“这一领域有很多研究,并且理论上已经有了成果,”她说。“但据我所知,目前还没有合适的智能体界面,而且,一旦开始开发这些系统,就必须应对由此产生的后果,以及如果其中一个系统出错会发生什么。”

这意味着需要制定治理和监管措施。智能体框架不仅需要处理 AI 可能犯错的实际和业务影响,还需要处理法律影响。

“如果这些问题得不到解决,我认为企业智能体就不会有多大用处。”她说。

然后,企业在部署 AI 智能体时还需要应对另一个风险:智能体实现的 AI 驱动自动化的大规模可能带来的颠覆和负面结果。Wipro 的副总裁兼全球 AI 主管普什帕·拉马钱德兰表示,在部署这些系统时,变革管理过程非常重要。“这是我认为很多客户需要花费更多时间的地方,”他说。而前期多花些时间意味着公司从长远来看能走得更远。“那些认真考虑变革管理过程的公司能够更快地实现规模扩张。”他说。

相关标签:

相关资讯

OpenAI计划推2万美元包月的博士级智能体,你愿意买单吗?

近日,OpenAI计划推出一款“博士级研究智能体”,每月收费高达2万美元(约合人民币14.5万元),引发了科技界的广泛关注。 这款智能体旨在处理学术研究和软件开发中的复杂任务,其强大的处理能力和深度学习算法,将为用户提供前所未有的服务体验。 OpenAI试水高端智能体OpenAI此次推出的博士级智能体并非单一产品,而是其AI智能体产品线中的高端版本。
3/6/2025 10:47:02 AM
小菲

Manus是智能体的"DeepSeek时刻"?DeepSeek本尊怎么看?

Manus从一夜爆火到一码难求,市场开始出现不同的声音。 支持者认为,Manus是智能体的"DeepSeek时刻";反对者认为,Manus是一场精心策划的“炒作”。 Manus成色究竟如何,不妨来听听作为对标对象的DeepSeek的回答。
3/10/2025 12:00:00 AM
极客AI

如何将智能体与营销自动化技术相结合

在数字化营销日益盛行的今天,智能体与营销自动化的结合已成为推动营销效率与客户体验升级的关键。 本文将深入探讨两者如何协同工作,以及这一组合如何为企业带来诸多益处。 要点概述:• AI提高效率。
2/27/2025 12:07:46 PM
Tom Ryan