4400字干货！如何做好生成式 AI 安排的体验安排？

编者按：虽然这是一篇大概 1 年前的旧文，但是 AI 在用户体验层面的发展并没有如同我们预期一样发生快速的、根本性的发展，所以这篇来自 Tony Jin 的文章，价值还在提升。值得一提是，Tony Jin 供职于 Google Assistant 团队，在用户体验、语音交互、AI 领域有足够深入的了解和经验。现如今，有关生成 AI 的新闻到处都是。用户谈论 ChatGPT 如何在创纪录的 5 天内达到 100 万用户，高盛如何预测 AI 将影响 3 亿个工作岗位，以及新版必应的 "失控"...... 抛开所有的热搜

编者按：虽然这是一篇大概 1 年前的旧文，但是 AI 在用户体验层面的发展并没有如同我们预期一样发生快速的、根本性的发展，所以这篇来自 Tony Jin 的文章，价值还在提升。值得一提是，Tony Jin 供职于 Google Assistant 团队，在用户体验、语音交互、AI 领域有足够深入的了解和经验。

4400字干货！如何做好生成式 AI 安排的体验安排？

现如今，有关生成 AI 的新闻到处都是。用户谈论 ChatGPT 如何在创纪录的 5 天内达到 100 万用户，高盛如何预测 AI 将影响 3 亿个工作岗位，以及新版必应的 “失控”……

抛开所有的热搜话题不谈，作为一个安排数字助理、拥有人机交互背景并热衷于为新兴技术举行安排的安排师，这对我个人来说是一个激动人心的时刻。

生成式 AI 的突破，就像我们发现电的那一刻一样重要——虽然整个技术能够还须要几年的时间才能真正成熟（虽然速度正在加快），但我们知道，我们能够刚刚踏上了一块重要的基石，开启了许多能够性，业内的每个人都在努力探索着这些能够性。

事实上，到底有哪些能够性？我们又该如何更好地哄骗生成式 AI 的特性，并回避其缺点呢？

在这篇文章中，我将尝试解读我作为一名安排师，在使用了数十种生成式 AI 对象之后的心得体会。我将讨论良好的输入方式，对于生成式 AI 的重要性，以及言语作为输入介质的局限性，以及我们如何哄骗最佳实践，来弥补这些局限性，并使生成式 AI 对用户的日常使用真正产出价值。

虚假的承诺

我们已经看到了人工智能的爆炸式发展，它们可以生成言语、艺术作品、音乐、完整的演示文稿、代码，甚至是公众人物的播客访谈（也可以试试史蒂夫-乔布斯式的气概？）

看着这些几个月前还让人匪夷所思的新功能，我们能够很容易产生这样的错觉：不久之后，我们只需说几句话，生成式 AI 就会施展魔法，创造出无懈可击的解决方案，完全符合我们的设法。

然而，事实并非如此。

是的，如果你想为自己的企业创造一个 LOGO，又不想聘请专业的 LOGO 安排师，你也许可以通过 Midjourney 中的一些提醒和迭代，来创造一个还凑合的 LOGO。但它只适用于你想潦草完成的情况。

但是，如果你对 LOGO 的外观和气概有具体要求，那么你能够须要对提醒词举行多次润色，才能使其接近你想要的感觉。

这相反须要大量的人工测试和来回编辑，不是三言两语就能完成的。

输入品质的重要性

这是因为在我看来，使用生成式 AI 的最重要规则之一是：输入品质决定输入品质。下面的例子是我给 ChatGPT 的一个通用提醒：

4400字干货！如何做好生成式 AI 安排的体验安排？

由 ChatGPT 生成的邮件，提醒词是“告知我的团队我正在做事情”

ChatGPT 天马行空地发挥想象力，竭力把事情具体化，却只输入了一封充满陈词滥调空话的邮件，这其实很有趣。这让我想起了我在 reddit 上看到的一个帖子：

4400字干货！如何做好生成式 AI 安排的体验安排？

AI 成为我们的空话生成器和空话解码器，这真是一个辛辣的讽刺。

“AI 将我这个简短的总结转化成一份超长邮件，并且假装是我写的。”
“AI 可以将这份超长的邮件总结为一句话，这一我可以假装看过了。”

这不能怪 ChatGPT，因为我给出的提醒词确实很糟糕，其中没有包含太多的信息。我没有说明邮件的气概、长度、我和团队之间的关系，我也没有提到和现有项目相关的任何细节，等等。我脑子里能够有这些背景和信息，但如果我不说出来，ChatGPT 永远也不会知道。

而这正是具有挑战性的部分——用户须要知道如何传达足够的上下文信息，以便 AI 能哄骗好这些信息，这才能节省我的时间，并供应我须要的输入实质。

来自言语本身的挑战

要知道如何 “安排 “提醒词，向 AI 模型准确传达我们的设法，其实是一件很难的事情。我们自己的言语，比如英语，天生就不擅长给出精确的指令。这也是我们创造具有严格语法的编程言语的初衷之一，以便将我们的设法明确、高效地传达给计算机。

“代码是我们安排的界面，用来给计算机编程。这是我们所须要的。它客观、清晰、明确、（相对）静态、内部一致且稳健。

英语不具备这些特性——它是主观的，意义往往是隐晦、模棱两可的，它总是在变化，甚至自相矛盾矛盾，文本的结构经不起推敲”。

——道森-埃利亚森：”英语是一种糟糕的编程言语”

因此，即使是人类，每天也会误解对方。我们能够须要多次解释自己的设法，如此反复，才能让别人完全理解。很多时候，我们还须要借助外部对象，如白板图或者非常详细的文件，来解释我们的整个思维过程，以达到同频一致的目的。

我们须要对 AI 举行同样的处理。

通往终极合作者和副驾驶员之路

我们可以通过一些方法来安排和微调 AI 对象，避免出现问题。与其让用户误以为 AI 对象可以 “读懂你的设法”，我们不如把它视作为一个强大的合作者，或者像微软所说的那样，一个可以辅助你完成工作的 “副驾驶”。安排和构建 AI 对象的人也应该供应手段，帮助用户在日常使用中，精确而高效地与他们的 “副驾驶 “沟通。

在为生成式 AI 举行安排时，须要注意以下几点。

1.提醒词工程

提醒词工程可以很有趣，甚至提醒词工程师已经成为一份年薪可以达到 33.5 万美元的工作。不过，我认为，这些工作的存在，只是为了让“专业”的提醒词工程师，能够替代普通用户完成艰苦的提醒词创造地工作，从而避免普通用户须要专门学习一门“AI言语”。

相反，我们可以让普通用户通过预设地问题/类别，来输入和描述他们正在寻找的实质和答案。有了这些信息，系统就能代表他们生成更完善的提醒，从而最大限度地提高 AI 产出有效结果的几率。

这对专注于垂直领域的产品，尤其有帮助，我们可以建立一套预设地问题，这在大多数情况下都很有帮助。

例如，HomeByte 可帮用户生成待售房屋的装修效果图，让用户构思新家具和新气概装饰下的硬装和软装地效果。它让用户使用预设的 UI 元素来选择气概、房间类型和色彩主题，然后生成生成 AI 模型的最终提醒词。它还会向用户公开提醒词细节，以便进阶用户自己举行微调。

4400字干货！如何做好生成式 AI 安排的体验安排？

来自 HomeByte

2.供应框架和制约因素

这是第一点的延伸。供应限制是唐-诺曼（Don Norman）提出的七大安排原则之一。这听起来能够有违直觉，但很多时候，限制用户的选择，而不是给他们一个空白页（让用户从零开始撰写他们自己的提醒词）能够会更有效。

Story AI 就是一个很好的例子，它在为用户生成小说创意之前，会询问用户一些输入地信息。其中包括小说气概、主角信息、小说背景、主要冲突以及对小说的其他特殊要求。

4400字干货！如何做好生成式 AI 安排的体验安排？

摘自 Story AI

这些选项促使用户考虑输入实质地方方面面，以确保输入提醒词足够全面，从而确保 AI 能够高品质地输入。

3.哄骗现有实质作为输入的基础

供应详细、高品质输入的另一种方法，是哄骗现有的实质作为输入，然后让 AI 对其举行细化、格式化和气概化。

Google Workspace 和 Microsoft Office 最近发布的视频都强调了这种情况。

例如，你可以在手机上写一封邮件的草稿，无需考虑格式，让 Gmail 为你正式处理。

4400字干货！如何做好生成式 AI 安排的体验安排？

基于几个要点，撰写正式的电子邮件 – Google Workspace 中的 Gmail

或者把昨天的原始会议记录（记录了团队的所有设法）用 Microsoft Word 转换成提案。

4400字干货！如何做好生成式 AI 安排的体验安排？

根据会议记录起草提案 – Microsoft Office 365 中的 Word

在我看来，这是人类与 AI 之间的一次伟大合作，但是人类仍然负责实质。毕竟，生成式 AI 是一个推理引擎，而不是一个知识库。如果没有实质作为基础，它所能做的只是幻觉和编造。但是，有了人类供应的实质，即使是原始形式的实质，AI也能将其气概化，使其变得更棒。

4.数量重于品质

即使有约束条件和良好的实质输入，AI 能够仍然很难一次就完全准确捕捉到用户的意图。因此，在安排 AI 对象时，最好能供应几个选项，让用户挑选自己喜欢的来进一步完善。

4400字干货！如何做好生成式 AI 安排的体验安排？

“没有想象力的世界 “由 Midjourney 生成

4400字干货！如何做好生成式 AI 安排的体验安排？

谷歌 Bard 生成的多个草稿

“数量重于品质 “也是头脑风暴的原则之一。因此，”生成式 AI “的妙用之一就是供应各种选项，激发用户的灵感，而不是一蹴而就地创造出最终解决方案。AI 生成的实质应该被视为灵感参考，而非必须遵循的神谕。

这也是我们可以哄骗 AI 模型的 “缺点” 又价值的地方：由于言语的局限性，我们很难期望 AI 完美无瑕地执行我们的设法，相反，我们可以哄骗 AI 模型生成所带来的随机性。AI 模型对信息的 “误读 “能够会带来偶然的创造，不完美的产出会拓展我们的视野，鼓励我们探索未知的新道路。

5.允许用户控制和微调

即使可以生成多个结果，AI的生成通常仍是一个起点。最终，用户具备控制和微调的能力（控制也是 Jakob Nielsen 提出的 10 个可用性启发式之一）。

在 ChatGPT 中，你可以要求它使用新的约束条件重新生成回覆。不过，由于 AI 模型生成实质的概率属性，以及言语缺乏精确性的问题，导致这能够是一个挑战。

4400字干货！如何做好生成式 AI 安排的体验安排？

由 ChatGPT 生成

在上面的例子中，ChatGPT 能够没有理解我所说的 “保留隐喻 “的意思（我说得也很含糊）。在我第二次提醒后，它重新生成了整个实质，而我只是稍微改动一下措辞。

仅通过提醒词很难让模型一次又一次地生成令人满意的实质，这能够会导致用户在 21 次迭代后最终放弃，这个体验是极度令人沮丧的。

但另一方面，我们也可以安排一个对象，让用户自己编辑回覆，或选择部分回覆，通过直接操作，来隔离须要修改的实质，甚至在 AI 的帮助下进一步完善回覆。

4400字干货！如何做好生成式 AI 安排的体验安排？

Notion 允许用户对生成的小说举行微调

这对生成文本来说很容易，因为它们可以随时编辑。不过，Adobe Firefly 的早期预览显示，它也可以隔离图像的某些部分，让用户根据自己的须要对结果举行微调。

4400字干货！如何做好生成式 AI 安排的体验安排？

Adobe Firefly 的早期效果图

6.从用户习惯和偏好中学习

即使是在与其他人合作时，这些来来回回的修改也很常见，尤其是在合作的早期阶段。随着时间的推移，我们会逐渐了解对方的工作气概和喜好，更容易建立共识。

安排精良的 AI 系统也应如此，通过隐式和显式输入了解用户的习惯和偏好。

目前的 AI 对象通常只允许用户就输入的实质品质举行评价，目的是改进模型本身，而不是为用户的需求，进一步个性化和提升大模型。

4400字干货！如何做好生成式 AI 安排的体验安排？

Bard 的用户反馈选项

目前，为每个用户创造个人模型的成本能够相当高，但在未来，我们能够会逐渐看到这样的模型：它们从与用户之前的互动中学习，并随着时间的推移学习用户的偏好和气概，从而生成更加个性化的回覆，更少尝试的次数，更好满足用户的需求。

结语

生成式 AI 是热门话题，媒体的狂热吹捧能够会让用户对它的功能，产生不切实际的期望。然而，重要的是要记住这几点：

{{userData.name}}已认证

4400字干货！如何做好生成式 AI 安排的体验安排？

虚假的承诺

输入品质的重要性

来自言语本身的挑战

通往终极合作者和副驾驶员之路

1.提醒词工程

2.供应框架和制约因素

3.哄骗现有实质作为输入的基础

4.数量重于品质

5.允许用户控制和微调

6.从用户习惯和偏好中学习

结语

AIGC大厂实战！baidu二十四骨气卡设想升级完整复盘

AIGC 热点整理！不得不知的 4 个重磅 AIGC 大事件（二）

最强文生图 AI 模型 Flux 再进化：出图速度快 6 倍，Elo 评分冲上 1153 傲视群雄

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1/47

最新 AI 生图模型 Flux1.1 隐藏玩法，添加单反相机文件名获得超写实图像

快手可灵 AI 新增“对口型”功能：生成人物口型与上传音频同步

Meta 用 AI 生成北极光图片，遭网友怒喷

奥特曼赢家通吃！OpenAI再揽66亿美元新融资，还不忘「狙击」一把老同事Ilya

Meta 发布 AI 视频生成器 Movie Gen：可自动生成含声音的高清视频

OpenAI 升级 Whisper 语音转录 AI 模型，不牺牲质量速度快 8 倍