会话是AI产品的理想交互形式吗?听听总监的分析!

Story|AI 的故事,大家深信不疑 ChatGPT 和 Copilot 构建了人们对大语言模型 AI 产品的基本认知。 到目前为止,似乎没有人有信心可以在原有的业务模式中做出来一个 AI native 的产品,退而求其次,大家觉得能在原来的产品中做一个“ AI”的功能就很好了。 从 2023 年开始,很多人对大模型产品化的认知是要在 AI 产品的的某个地方添加一个聊天窗口,或者这个 AI 产品就是一个聊天窗口。GPTs 也让大家自然的认为 CUI 形式的对话框就是 AI 产品的终极形态。 但,真的是这样吗?Is

会话是AI产品的理想交互形式吗?听听总监的分析!

Story|AI 的故事,大家深信不疑

ChatGPT 和 Copilot 构建了人们对大语言模型 AI 产品的基本认知。

到目前为止,似乎没有人有信心可以在原有的业务模式中做出来一个 AI native 的产品,退而求其次,大家觉得能在原来的产品中做一个“+AI”的功能就很好了。

从 2023 年开始,很多人对大模型产品化的认知是要在 AI 产品的的某个地方添加一个聊天窗口,或者这个 AI 产品就是一个聊天窗口。GPTs 也让大家自然的认为 CUI 形式的对话框就是 AI 产品的终极形态。

但,真的是这样吗?

Issue|一个聊天窗口可以装下多少东西

在具体的实践过程中,我们不能不看到目前这种看似更“先进”的对话形式的缺点:

1. AI 对话的使用门槛

在进行 AI 会话时,如果不加以引导,用户并不知道如何开始,以及如何更自然的组织跟 AI 说话时的语言。——这就像每个人都会用搜索框搜索东西,但不是每个人都能很好的把自己的需求转化为搜索关键词,这有一定的技巧门槛。而AI对话框的形式,放大了这种人机交互门槛。

2. 用户意图非常发散

用户是可以“自由”地跟 AI 对话,这种“自由”的代价非常高。想要 AI 合理回复用户的消息,就需要更加准确进行用户意图识别。但用户在聊天时的意图往往发散而又跳跃,不会老老实实围绕一个话题从开始到结束,然后再开始另一个话题。同时,对话框这种产品形态,又进一步放大了意图识别的难度。

3. IM 容器超负荷

如果把各种各样的服务都塞进 IM 对话框,那么 AI 交付给用户的信息和结果是多种多样的。有时 AI 需要给用户发送表单,有时则是一段结构化的信息。设想一下如果你需要在对话框里通过 AI 点外卖,那么就需要在 IM 对话框中呈现餐馆列表、菜品列表、订单信息确认、支付流程、订单状态查询等功能。用户需要在 IM 聊天窗口中面对各式各样的小卡片,这对于业务复杂的产品来讲,是一个莫大的考验。

4. 不高效,也没必要

上述三点带来的整体使用体验,会给人一种“脱了裤子放屁”的感觉。没必要啊,我用传统 GUI 界面不是更快吗?

Reflection|进一步思考

1. 更先进的,不一定是当下最适合的

以 Notion AI 和 character.ai 这两个产品为代表,单轮指令式交互与多轮会话式交互,已经成为现在比较典型的大模型 AI 产品的两种交互形式,呈现出截然不同的产品形态。

会话是AI产品的理想交互形式吗?听听总监的分析!

截止现在,我们并不能说“对话式”AI 就比“指令式”AI 更先进,更智能,也不能说对话式的 CUI 会逐渐席卷而来,最终替换掉所有的 GUI,更不能说对话式的 CUI 是更先进的,我们要尽早采用。

很多 AI 功能大可不必用对话式 CUI 来承载,指令式 AI 也很高级、很智能。

2. AI Agent 尚不具备提供完整专业服务的能力

现在大家所讲的 AI Agent 更多的还是一个概念,如果你用过 c.ai、豆包和 Spicychat 提供的聊天机器人提供的陪聊天服务,那么会明白这类产品目前最大的价值还是只能打发一下好奇者的时间,并不能提供真正的情感陪护服务。

至于更完整的专业服务就更难以实现了。

也许 AI Agent 现在就可以帮你进行 1 个小时的英语学习训练、完成一次心理咨询、规划某个城市的旅行路线、进行一次模拟面试,但他不能帮你点一份合胃口的外卖、找到一份适合你的工作机会、完成你家小孩的课内作业辅导、给出一份真正可用的五天四晚出游建议。

这里面的差距挺大,最大的差距不是对话的上下文语义理解和意图识别,而是 AI Agent 底层还没有做到与其他系统和服务进行有机整合和集成。从而也就无法完整提供用户真正需要的服务,提供不了真正的用户价值。

相关资讯

如何用AI生成设计稿?实战案例演示来了!(上)

从 3 月 ChatGPT 火热以来,发现它能够通过文字生成代码,并进一步渲染成页面,展现出了解决部分 UI、UX、测试和前端工作的能力。所以零零散散地进行了一些关于 Design To Code、AI 生成页面、动效等方面的学习与尝试。在本文中,我将在工作业务脱敏的基础上,梳理这些想法。目的之一是进行总结,其二是遇到一些疑问点,希望有机会与大家相互沟通学习。 本篇内容主要讨论如何用 AI 生成设计稿,以及如何在实际项目开发流程中运用,同时设计、开发组件在其中扮演很重要的角色。(全文预计 6 分钟) 更多AI实战案

比 ChatGPT4 还强?深度测评最新AI神器 Claude3

Claude3,正式上线。 这个由 OpenAI 分裂出去的兄弟公司 Anthropic,在悄然无息之间,就这么默默地把 Claude3 发了。 没有所谓的发布会,没有什么华丽的舆论,就仅仅在 X 上发了个帖子。我发现现在的这些 AI 公司真挺有意思,都把 X 当成发布主阵地了。。。 字很少,但是事挺大。一口气发了 3 个模型,Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。 这个名字就取的...很有故事。 Opus 大概意思就是史诗级乐章,牛逼上天那种。 Sonnet

从人机交互角度,聊聊最近爆火的ChatGPT-4o

近日 ChatGPT-4o 的发布会应该是未来几天 AI 圈子最有热度的话题了,其中几条更新其实可以从人机交互的角度解读一下。首先我们还是先来看看 GPT-4o 更新的主要内容(只关注交互角度解读可跳过):多模态交互能力:ChatGPT 4.0 支持图像和文本输入,并能输出文本,具备多模态交互的能力。这意味着它可以理解图像内容,并生成字幕、分类和分析等操作。 自然语言理解能力提升:在自然语言理解方面有显著提升,这使得 ChatGPT 4.0 能够更好地理解用户的输入,并根据用户的语境提供更准确的回答。 上下文长度增