超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

编者按：Luke Wroblewski 是前谷歌产品总监，曾参与到 Google 的全公司指标分析、Blogger、Social Good、Location Sharing 等关键产品的设想，如今他是 IxDA 的创始人，有自己的设想公司，并且在伊利诺伊州大学为研究生教授 UX 设想。随着 AI 技术大规模普及，他也在自己的网站上用上了类 GPT 的对话式 AI，而在创建 AI 对话式 UI 的过程中，他注意到现在常见 AI 交互界面中的课题，并且在自己的 Ask LukeW 中探索了这类界面形式的优化方案。下面是

人工智能技术的发展，对人机交互提出了新的需求，新的交互逻辑之下，我们需要有对应的 UI 界面来支持它们。目前许多大型的语言模型（LLM）在交互上都是采用的「对话式UI」，而我们也可以在聊天对话式的交互基础上，来扩张它们的实用性。

首先，什么是对话式 UI？我们每天都会在即时通讯类的工具核心沉浸几个小时，所以绝大多数的人都认识这类形式。对话的参与者所发送的实质通常会包裹在一个视觉元素核心（一个气泡对话框）中，而这些实质会按照特定的顺序排列（通常是按照时间排序，自上而下），每个实质大小则决定了它在屏幕上所占据的空间。

为了说明这一点，我这里有一个非常简单的聊天界面，有2个参与者，最新发送的实质会在最底部消失，复原实质的输入框在最下方。很认识对吧？这类交互方式有一个显而易见的优势：作为用户我们对于这类交互形式极度认识，上手非常简单。

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

折叠和开展

在对话界面核心，如果双方（或者多方）所发送的实质较短的时候，简单的堆叠式的对话框还是很好用的。但是，如果我提出的课题文本较短，但是所获得的复原是长篇大论的文本的时候，会发生什么？在和 Ask LukeW 这样的大型语言模型（LLM）AI工具交互的时候，这类情况就非常常见。

这类情况下，我们可能会在视觉上对课题和谜底进行分组（将对应的课题和谜底分为一组），甚至会试图折叠更早的问答组，以方便视觉聚焦于当下的谜底，这样更易于快速扫读。这会让当前的课题和谜底拥有更高的优先级，你可以看看下方的问答界面，来对比双方的优劣：

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

以下是 Ask LukeW 上的问答界面的设想。之前的课题和谜底会折叠起来，折叠后的控件尺寸接近，在视觉上干扰更少，而且具有辨识度，视觉也更加聚焦于当前的问答。

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

如果你想查看更早的问答，只需要点击对应的条目，它就会开展，而其他的条目会自动折叠。不过可能有用户会需要同时开展多个问答，这个需要根据实际情况来讨论。

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

融合交互

当我们在手机和电脑上使用即时通讯软件交互的时候，我们不仅会发送文本，还会发送图片，视频，甚至会转账，发送游戏链接等等。它们大都会以一个对话框的形式消失，嵌入到整个信息流核心。

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

随着大型语言模型（LLM）的支持范围逐渐扩张，AI 的对话式 UI 所承载的媒体形态和交互类型也应该增加，不仅仅停留在文本的消失，还会包含图片、视频、表单、代码甚至 APP。为了在 Ask LukeW 上解决这些课题，我们添加了一种一致的方式来消失这些对象，用户可以选择每个不同的对象，来单独交互。

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

下面的案例展示了 AI 以文章或者音频的格式来复原用户需求时候的视觉效果，用户点击特定的问答组，对应的文章控件、播放器控件会消失出对应的开展视图，用户看到的是重新格式化消失的富文本，或者是可供播放音频实质的播放器界面，而用户可以在这些复原的实质的基础上提出新的需求。

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

在你阅读完文章、听完音频实质之后，再提出后续课题的时候，这些实质就会自动折叠收纳起来，不过这类情况也有例外。通常的图片、图文、文本类的实质在被折叠之后，会在折叠后的控件右侧有一个缩略图。而包含功能性控件（比如播放器、阅读器、第三方 APP 等）的时候，折叠后的控件左侧会有个明显的缩略图标识，通过空间和缩略图标识，用户可以快速定位到之前的问答。

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

折叠，扩张，控件对象细节处理，这核心所有的事情，都是围绕着对话式 UI 的优化来进行的，从根本上来说，它是基于我们认识的对话界面，针对 AI 生成实质进行针对性的优化。在 Ask LukeW 核心，这些调整都算不得大范围的重设想。

结语

那么这些设想是否适用于所有的 LLM 类的大模型呢？我相信我们很快能够看到结果，据我所知，现在每家科技公司都在试图将 AI 添加到他们的产品核心，在这个过程中，他们会遭遇到和我们同样的用户体验和界面形式的课题，很大概率大家都会面对相同的限制，选择类似的解决方案。

{{userData.name}}已认证

超多案例！前谷歌产品总监是怎样优化 AI 对话式UI的？

折叠和开展

融合交互

结语

如何用Midjourney生成B端产品页面？收下这份AI关键词总结！

Dora AI ！一句话生成可交互、可编纂网站的 AI 神器

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

2024年AI 编程现在可以做到什么程度？

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩