Story|AI 的故事,大家深信不疑
ChatGPT 和 Copilot 构建了人们对大语言模型 AI 产品的基本认知。
到目前为止,似乎没有人有信心可以在原有的业务模式中做出来一个 AI native 的产品,退而求其次,大家觉得能在原来的产品中做一个“+AI”的功能就很好了。
从 2023 年开始,很多人对大模型产品化的认知是要在 AI 产品的的某个地方添加一个聊天窗口,或者这个 AI 产品就是一个聊天窗口。GPTs 也让大家自然的认为 CUI 形式的对话框就是 AI 产品的终极形态。
但,真的是这样吗?
Issue|一个聊天窗口可以装下多少东西
在具体的实践过程中,我们不能不看到目前这种看似更“先进”的对话形式的缺点:
1. AI 对话的使用门槛
在进行 AI 会话时,如果不加以引导,用户并不知道如何开始,以及如何更自然的组织跟 AI 说话时的语言。——这就像每个人都会用搜索框搜索东西,但不是每个人都能很好的把自己的需求转化为搜索关键词,这有一定的技巧门槛。而AI对话框的形式,放大了这种人机交互门槛。
2. 用户意图非常发散
用户是可以“自由”地跟 AI 对话,这种“自由”的代价非常高。想要 AI 合理回复用户的消息,就需要更加准确进行用户意图识别。但用户在聊天时的意图往往发散而又跳跃,不会老老实实围绕一个话题从开始到结束,然后再开始另一个话题。同时,对话框这种产品形态,又进一步放大了意图识别的难度。
3. IM 容器超负荷
如果把各种各样的服务都塞进 IM 对话框,那么 AI 交付给用户的信息和结果是多种多样的。有时 AI 需要给用户发送表单,有时则是一段结构化的信息。设想一下如果你需要在对话框里通过 AI 点外卖,那么就需要在 IM 对话框中呈现餐馆列表、菜品列表、订单信息确认、支付流程、订单状态查询等功能。用户需要在 IM 聊天窗口中面对各式各样的小卡片,这对于业务复杂的产品来讲,是一个莫大的考验。
4. 不高效,也没必要
上述三点带来的整体使用体验,会给人一种“脱了裤子放屁”的感觉。没必要啊,我用传统 GUI 界面不是更快吗?
Reflection|进一步思考
1. 更先进的,不一定是当下最适合的
以 Notion AI 和 character.ai 这两个产品为代表,单轮指令式交互与多轮会话式交互,已经成为现在比较典型的大模型 AI 产品的两种交互形式,呈现出截然不同的产品形态。
截止现在,我们并不能说“对话式”AI 就比“指令式”AI 更先进,更智能,也不能说对话式的 CUI 会逐渐席卷而来,最终替换掉所有的 GUI,更不能说对话式的 CUI 是更先进的,我们要尽早采用。
很多 AI 功能大可不必用对话式 CUI 来承载,指令式 AI 也很高级、很智能。
2. AI Agent 尚不具备提供完整专业服务的能力
现在大家所讲的 AI Agent 更多的还是一个概念,如果你用过 c.ai、豆包和 Spicychat 提供的聊天机器人提供的陪聊天服务,那么会明白这类产品目前最大的价值还是只能打发一下好奇者的时间,并不能提供真正的情感陪护服务。
至于更完整的专业服务就更难以实现了。
也许 AI Agent 现在就可以帮你进行 1 个小时的英语学习训练、完成一次心理咨询、规划某个城市的旅行路线、进行一次模拟面试,但他不能帮你点一份合胃口的外卖、找到一份适合你的工作机会、完成你家小孩的课内作业辅导、给出一份真正可用的五天四晚出游建议。
这里面的差距挺大,最大的差距不是对话的上下文语义理解和意图识别,而是 AI Agent 底层还没有做到与其他系统和服务进行有机整合和集成。从而也就无法完整提供用户真正需要的服务,提供不了真正的用户价值。