一、前言
当我们一次次被 AI 技术带来的变革所惊艳,当 ChatGPT 一次次宣布其能力已经突破了人类的想象,你是否注意到现有产品与 AI 融合的新趋势?值得注意的是,新技术的出现也一定带来了新的交互体验。本文将以多种产品场景为例,梳理 PC 端多种主流的 AI 融合形态,希望能给大家带来启发。
二、多元场景下的主流 AI 形态
目前主流 AI 产品有如下 3 种主要形态,分别为沉浸式的 AI 智能体(Agent)、伴随式的 AI 副驾驶(Co-pilot)、嵌入式的 AI 场景化嵌入(Embedding)。这 3 种形态在能力、界面、操作体验和适用场景都上存在显著差异。
1. 沉浸式形态
AI 智能体(Agent)—功能强大的AI伙伴
一个富有主动性的独立伙伴,输出的结果不完全依赖用户的输入,启动 AI 问询后有 2 种主流的形态:
「对话智能体」 以对话流的形式展示信息,用户通过在当前语境下进行追问获取最终结果; 「目标智能体」用户输入指令后,一次性给予用户“靠谱”的结果,配有侧边栏可进行多种辅助操作。① 对话智能体示例—Gemini
以谷歌 Gemini 产品为例,其作为对话流的智能体,为满足搜索场景,具有以下特征:
冷启页 Prompt 形象化
相较于 2023 年初 Gemini 冷启时的样式,最近改版中冷启的 Prompt 卡片变得形象化,当然我们也在其他 Agent 产品中观察到了这一变化。
多模态内容
理解用户的文字意图,依据要求自主生成多模态卡片是对话智能体的主要特征之一,该功能可以极大地丰富 AI 反馈的多样性,并能提高信息传达的效率。
信息索引的显示
信息索引的展示是提升 AI 回答权威性和透明度的关键因素。然而,直接在阅读内容中嵌入索引标签,可能在某些情况下影响用户的阅读连贯性。以 Gemini 为例,当前的设计允许用户在卡片下方手动启用索引信息,这种灵活性平衡了信息的可信度和阅读体验,适合多数日常场景。
当然,从设计角度考虑,某些情况下默认收起索引并非最佳选择。在用户高度依赖信息准确性的场景中,如金融或医学领域,索引的可见性将会直接影响信任感。对于深入研究或延展阅读需求较高的用户,即时查看索引能更高效地获取信息来源。
与之类似,在涉及多方信息传播的业务分发场景,清晰可见的索引有助于减少误解,提高效率。在这些情况下,索引的默认展开不仅强化了内容的可靠性,也更好地支持了用户的深入需求。
② 目标智能体示例—Perplexity
Perplexity 作为最近广受好评的 AI 搜索工具,相较于 Gemini,它更注重给予用户最精准的答案。基于 RAG 技术的 Perplexity 为用户提供了一种新的“确定性”,而鉴于这种特征,Perplexity 拥有双面板的形态,可以对当前确定性的信息进行深化处理。
输入即结果
相较于 Gemini 等对话智能体产品,AI Agent 用户需要反复追问结果,而在体验 Perplexity 时的无对话场景感,更倾向于一次性给予用户“靠谱”的答案。
侧分栏—信息补充
因为 Perplexity 一次就可以给予用户最“准确”的信息,用户可能没有追问的必要,但可能会有对于当前问答进行深度搜索的需求,这时会有右侧 GUI 分栏的出现,以便用户进行辅助搜索。
③ 思考:给予用户最佳答案的 AI 形态
在使用体验上,Gemini 与 Perplexity 虽然走向两个不同的流派,但目的都是为了给用户呈现最佳的搜索结果。Gemini 就像一位富有想象力的对话者,用户在对话中通过不断地追问来获得最佳的结果,而 Perplexity 更像一个 AI 版的知乎,它坚持“用户不会犯错”原则,冷静客观地为用户提供最精准的答案。
2. 伴随式形态
AI 副驾驶(Copilot)—被动性的AI助手
这种形态下的 AI 更多扮演“副驾驶”的角色,为用户提供建议和帮助,依赖用户精准的指令对当前内容窗口进行操作,一般以侧边栏形式展示,目前的 Office 文档类产品多采用此类形态。
① AI 副驾驶产品示例-Office
在近年的开发者大会中,微软提到最多的词就是“Copilot”,力推将 AI 技术快速融入到旗下应用中。其中,Office 软件就融入了 AI 副驾驶的理念,该形态下的 AI 主要为用户提供产品的创作辅助、信息的查询总结等功能。
当前场景下的 AI 助手
AI 的能力默认被限定在当前场景下,满足用户问询、信息检索、创作辅助等操作。
被动性 AI 助手
Copilot 无法自动执行操作去修改当前页面内容,需要用户确认后才可执行,用户执行操作后会在侧边栏内显示操作记录与撤销操作的入口。
辅助 Prompt
由于 AI 副驾驶的特性,常常需要准确的 Prompt 才能执行符合预期的操作,这对大部分用户来说门槛较高,因此在使用时需要及时给予用户合理的联想 Prompt,辅助用户决策。
② 思考:提高用户工作效率的 AI 助手
作为被动性 AI 助手,用户即使不使用也不会影响其在整体页面中的操作,AI 更多承担的是提升用户工作效率过程中的辅助角色。
3. 嵌入式形态
AI 场景化嵌入(Embedding)
嵌入式 AI 主要聚焦特定场景的 AI 辅助,如 AI 即时性地生成对当前评论的回复,此类交互无固定形态,AI 会在用户进行高频重要操作时即时触发。
在多元化场景中,嵌入式 AI 的设计相较于前两类更加灵活和轻量,通常以 LGUI(轻量化用户界面)为核心,强调用户与 AI 之间的无缝衔接与高效互动。
与对话式或结构化阿拉丁模式相比,嵌入式 AI 的设计思路更加通畅,摒弃了复杂的交互流程,更注重场景中的引导性和即时反馈,帮助用户在合适的时机获取所需信息。
① 嵌入式 AI 示例—One Drive
以微软 One Drive 为例,嵌入式 AI 不仅会在用户整理文件时提供智能建议,还能在用户分享文件时根据历史记录和内容精准推荐分享对象。这种场景化的嵌入,展现了如何通过 LGUI 设计最大化提高效率,而非依赖传统对话或复杂交互。
场景一: 文件整理 AI 建议
在 AI 为相关文件创建新文件夹的情境中,执行完成后,它会主动询问用户是否需要将其他可能相关的文件一并移入到新建的文件夹中,以帮助用户进一步整理文件。AI 能够基于文件内容的上下文,敏锐地判断出哪些文件可能属于同一类别,进而为用户提供便捷的一键整理服务。
场景二: 智能分享建议
当用户准备在 One Drive 中分享文件时,AI 助手会根据文件内容和用户的历史分享记录,预测出最可能需要分享的对象名单,为用户精准推荐受众人员。智能分享建议可以极大地节省用户挑选分享对象的时间。
基于上述 2 个例子,我们可以对嵌入式 AI 有进一步的思考:
合理的嵌入式 AI 操作只在用户进行重要操作时被“激活”,能够在当前场景下即时给予用户建议;
嵌入式 AI 一般情况下点击大于录入,方便用户快速做出决定;
设计此类交互时,需要深度理解用户使用场景,AI 的唤起不应干扰用户对于主流程的操作体验。
② 思考:效率导向的 AI 嵌入设计
对于普通设计师来说,容易在纯对话交互和结构化设计两端摇摆,可能忽视了效率也是设计的重要原则。嵌入式 AI 的设计启示在于“什么合适用什么”,既不过度依赖复杂的对话式设计,也不拘泥于结构化方案。关键在于聚焦场景需求,以最简便和有效的方式帮助用户完成任务。
因此,在嵌入式 AI 的设计中,保持界面的简洁与流畅,同时结合轻量化的 LGUI 原则,才是提升用户体验的关键。最终目标始终是“效率”,无论采用何种形式,选择最适合当前场景的交互模式才是设计的核心。
三、未来的 AI 设计
多样化形态下的平衡与共生
随着 AI 技术的迅速发展,各种 AI 形态在不同场景中不断涌现,如上述讨论的沉浸式、伴随式、嵌入式等设计形态。无论是主动性强的智能体、辅助型的副驾驶,还是轻量化的嵌入式方案,每一种设计都展现出其独特的价值。
然而,在这些多样化的形态背后,我们仍需回归一个核心问题:什么样的 AI 设计才是理想的?
首先,没有一种 AI 形态能够完美适用所有场景,真正成功的 AI 设计应始终围绕需求展开。在效率为先的原则下,设计师需要深刻理解用户在不同情境下的核心需求,并选择最适合的交互形态。复杂的对话式和高度结构化的设计并非万能,嵌入式 AI 的灵活性和轻量化设计则为平衡提供了启发—服务于效率与体验,简化不必要的交互,专注于解决用户的实际问题。 其次,AI 设计的多样性并不意味着割裂,而是指向共生与融合。未来,AI 技术将进一步打破不同形态之间的界限,形成更加灵活、动态的交互模式。这种融合不仅依赖更智能的技术,还要求设计师在实际应用中敏锐捕捉用户需求,提供真正有价值的解决方案。 最后,设计的核心原则是以用户为中心,强调合适性,而非追求炫技。无论是大型智能体的复杂场景处理,还是嵌入式 AI 的场景化介入,优秀的设计应始终聚焦用户需求,在不同场景中找到最优平衡点。随着技术的进化,设计师需要更加专注于如何将 AI 技术自然、无缝地融入用户的工作与生活,使每一次交互都变得更加高效和愉快。在未来,AI 的形态将会更加多元,但不变的仍是设计师对效率、用户价值和场景适配的持续探索。希望设计师在面对 AI 设计时,始终寻求既符合用户需求又能提升效率的最佳方案。