现在的AI Agent还是这么差!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)背景是这样的。 前几天,我发现我的XX激光雷达出了问题。 本来我靠它来为电影摄像机增加自动对焦和自动跟踪功能,如果没有这项功能,我会很难拍摄到我需要的画面。

编辑 | 言征

出品 | 51CTO技术栈(微信号:blog51cto)

背景是这样的。

前几天,我发现我的XX激光雷达出了问题。本来我靠它来为电影摄像机增加自动对焦和自动跟踪功能,如果没有这项功能,我会很难拍摄到我需要的画面。

这个激光雷达大概用了一年左右,但我不知道它是否还在保修期内。但不管怎样,它都需要修理。

于是,我登录了XX官网,前往支持页面,正如我所猜想的,果然有一个智能客服来迎接我。

我与智能客服进行了交流,输入了类似“我的激光雷达无法自动对焦”的内容。智能客服的回答毫无帮助,于是我继续追问。

然而,智能客服再次让我失望,于是我换了一种方式提问:“我该如何将我的激光雷达退回维修?”

客服还是帮不上忙。

在尝试了 30 分钟后,我决定还是要找一个真正的人工客服。大约 60 分钟后,我终于拿到了激光雷达的退货标签,可以将其打包寄回。

鉴于许多企业都在依赖智能客服来处理几乎所有事务,这种情况本不该发生。

与智能客服的对话本应简单,可能像这样:

我:我的激光雷达无法自动对焦了。

智能客服:您能提供序列号吗?这样我可以更好地为您提供帮助。

我:当然可以。<输入序列号>

智能客服:谢谢。请稍等片刻。<片刻后> 您的设备仍在保修期内。请提供您的电子邮箱地址,我会发送一个退货标签,并将优先处理您的请求。

我:谢谢。

智能客服:还有其他需要我帮忙的吗?

我:没有了,谢谢。

智能客服:祝您一天愉快,别忘了查收邮箱中的退货标签。

这才是对话应有的样子,但遗憾的是并非如此,我在安排退货和维修上花费了太多时间。

目前,只有企业享受到了效率提升的好处。我每次尝试通过智能客服解决问题的经历都与我试图退回激光雷达时的经历非常相似,所以这不是XX公司的问题。

问题出在人工智能本身。

1.人工智能本应让一切更加高效

我其实之前开发过聊天机器人,也了解它们是如何工作的。智能客服在构建方式和与用户互动方式上与聊天机器人非常相似。

问题是,大多数智能客服是基于检索增强生成(RAG)模型构建的,这种模型既便宜又低效。这种基于 RAG 的系统在全球范围内被广泛使用,这正是问题所在。为什么呢?因为这些公司正在使用这些系统来处理客户支持这一极其复杂的任务。

想一想。

许多大公司可能没有意识到,客户支持是一个极其复杂的过程。每个用户都有不同的问题,对所使用或尝试做的事情有不同的理解水平,使用不同的语言,并且处于不同程度的沮丧状态。

当基于 RAG 的系统被用于此目的时,它们无法处理沟通的细微差别,往往无法解决问题。

为什么呢?基于 RAG 的人工智能与 Mistral、Ollama 或 ChatGPT 这样的人工智能系统不同,它没有语言处理、推理或决策能力。当你使用基于 RAG 的系统时,你会明显感觉到这种差异,因为互动远非人类化的。基于 RAG 的智能客服只有在你问到正确的问题时才会起作用。如果你问到离题或复杂的问题,你就会立即明白我的意思,因为客服要么不知道如何回答,要么会重复自己的话,要么会重置(我经历过好几次这种情况)。

基于 RAG 的系统被用于医疗保健、法律咨询、房地产代理、电子商务助手、企业检索型聊天机器人、会议记录和总结生成器、预约预订和日程安排、数据分析助手等领域。

2.如何解决这个问题?

你可能使用过谷歌的 Gemini Live,并与人工智能进行了完整的对话。我使用过,它令人印象深刻。我还会定期通过 Msty 使用 Ollama 进行研究,很少让我失望。

现在,想象一下如果一家公司使用像 Gemini Live 这样的智能客服,事情将以前所未有的准确性和效率完成。

问题是,大多数公司不会愿意花钱购买变革性智能客服。什么是变革性智能客服?我很高兴你问了。

变革性智能客服具有以下特点:

- 自主性

- 学习与适应能力

- 决策能力

- 任务执行能力

- 协作能力

这类智能客服被认为是人工智能发展的“第三波”(继预测性和生成式人工智能之后),很容易就能革新许多行业。

然而,公司需要愿意花钱让它们发挥作用,而这并不便宜也不容易。考虑一下:一家公司可以创建一个变革性智能客服,并将其提供给各地的企业使用。一旦企业决定采用该客服,他们必须针对自身需求(针对产品、服务等)对其进行专门培训。

这种培训需要企业为其产品和流程准备大量文档。除此之外,为了真正让这些客服发挥作用,它们必须与企业内部的其他系统(例如用于提交工单的系统)进行集成;否则,它们不会非常有效。

为了好玩,我向 Gemini 提出了一个问题:

为什么智能客服在处理支持事务上表现得如此糟糕?

Gemini 的回答很有启发性:

尽管智能客服取得了显著进展,但它们仍然在处理细微差别、适应性、数据偏差和客户信任方面存在困难。克服这些限制需要持续的研究、更好的数据、改进的算法以及一种更以人类为中心的人工智能在客户支持中的实施方式。关键是要将人工智能视为增强人类客服的工具,而不是完全取代他们。最佳的客户支持体验很可能是那些无缝融合人工智能和人类智能优势的体验。

Gemini 的回答一针见血,尤其是提到人工智能是增强人类客服的工具,而不是完全取代他们。除非公司明白基于 RAG 的客服无法取代人类从事支持工作,否则客户将继续经历令人沮丧的体验,甚至可能因为支持服务太差而对一个喜爱的品牌产生反感。

这个问题是真实存在的,而且我不认为它会很快消失。

3.变革性AI客服要花费多少钱?

为什么?很简单。我向由 Perplexity AI 驱动的搜索引擎提出了以下问题:

一家公司部署一个变革性智能客服需要花费多少钱?

答案应该能说明问题:

部署一个变革性智能客服的成本因项目的复杂性和范围而异。截至 2025 年,以下是潜在成本的概览:

- 对于小规模或基础的智能客服开发,公司预计需要花费 5 万到 8 万美元。

- 中等规模的智能客服开发通常在 8 万到 15 万美元之间。

- 大规模或先进的智能客服开发成本可能超过 15 万美元。

- 对于具有深度学习、实时决策和持续学习等高级功能的高度专业化、智能客服,成本可能超过 30 万美元。

因此,部署一个变革性智能客服的成本可能在 5 万到 30 万美元之间。这是一笔不小的开支,尤其是与基于 RAG 的系统相比,根据 Perplexity 的说法,基于 RAG 的系统起价为 7,000 美元,随着复杂性的增加而增加。

最终,基于 RAG 的人工智能客服比变革性人工智能便宜得多,所以你可以打赌,大多数企业会选择前者。除非他们最终愿意为变革性选项投入更多资金,否则大多数客户和客户在体验后都会感到不满。

相关资讯

企业实施RAG过程中:常见误解与澄清,内含项目升级预告

春节之后的一个月的时间内,微信和小红书上数了下大概有 150 多个过来咨询 RAG 在企业落地的网友,一路聊下来按照对方的诉求大概分为三类,第一种是最多的就是年后返工公司领导让落地 RAG,但是一时没有头绪的过来咨询的;第二种是看过我公众号上的相关案例后,想外包给我来做具体实施的;第三种有点出乎意料的是,相关的媒体来交流行业观察的。 第一种类型也是最开始比较多的,最初我也是问啥答啥,但是大概聊了五六个之后发现情况有点不对,大部分其实是比较基础的问题,或者我认为问大模型能比问我更快扫盲的,再加上后来确实肉眼可见的人在变多,我索性和每个人说如果是咨询的话 200 块每小时(现在涨到了 500),这样就大部分人就索性不问了,虽说前后也是有十几个人很干脆的问完问题后直接发了红包,不过不得不说收费确实是个很好的互相筛选。 以上是碎碎念,言归正传,这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。

FastRAG:半结构化数据的检索增强生成

本文介绍了FastRAG,一种针对半结构化数据的新型RAG方法。 FastRAG采用模式学习和脚本学习来提取和结构化数据,而无需将整个数据源提交给LLM。 它将文本搜索与知识图谱(KG)查询相结合,以提高在问答任务中检索上下文丰富信息的准确性。

Meta-Chunking: 通过逻辑感知学习高效的文本分段

本文是由人大提出的,旨在解决在检索增强生成(RAG)系统中,文本分段这一关键方面被忽视的问题。 具体来说,传统文本分段方法(如基于规则或语义相似性)在捕捉句子间深层语言逻辑联系方面存在不足,导致在知识密集型任务(如开放域问答)中的性能受到影响。 本文通过引入Meta-Chunking的概念及其两种实现策略(边际采样分段和困惑度分段),解决了以下几个关键问题:逻辑连贯性问题:问题:传统文本分段方法往往基于规则或语义相似性,难以捕捉句子间的深层逻辑联系(如因果、过渡、并行和渐进关系)。