编者按:虽然这是一篇大概 1 年前的旧文,但是 AI 在用户体验层面的发展并没有如同我们预期一样发生快速的、根本性的发展,所以这篇来自 Tony Jin 的文章,价值还在提升。值得一提是,Tony Jin 供职于 Google Assistant 团队,在用户体验、语音交互、AI 领域有足够深入的了解和经验。
现如今,有关生成 AI 的新闻到处都是。用户谈论 ChatGPT 如何在创纪录的 5 天内达到 100 万用户,高盛如何预测 AI 将影响 3 亿个工作岗位,以及新版必应的 “失控”……
抛开所有的热搜话题不谈,作为一个安排数字助理、拥有人机交互背景并热衷于为新兴技术举行安排的安排师,这对我个人来说是一个激动人心的时刻。
生成式 AI 的突破,就像我们发现电的那一刻一样重要——虽然整个技术能够还须要几年的时间才能真正成熟(虽然速度正在加快),但我们知道,我们能够刚刚踏上了一块重要的基石,开启了许多能够性,业内的每个人都在努力探索着这些能够性。
事实上,到底有哪些能够性?我们又该如何更好地哄骗生成式 AI 的特性,并回避其缺点呢?
在这篇文章中,我将尝试解读我作为一名安排师,在使用了数十种生成式 AI 对象之后的心得体会。我将讨论良好的输入方式,对于生成式 AI 的重要性,以及言语作为输入介质的局限性,以及我们如何哄骗最佳实践,来弥补这些局限性,并使生成式 AI 对用户的日常使用真正产出价值。
虚假的承诺
我们已经看到了人工智能的爆炸式发展,它们可以生成言语、艺术作品、音乐、完整的演示文稿、代码,甚至是公众人物的播客访谈(也可以试试史蒂夫-乔布斯式的气概?)
看着这些几个月前还让人匪夷所思的新功能,我们能够很容易产生这样的错觉:不久之后,我们只需说几句话,生成式 AI 就会施展魔法,创造出无懈可击的解决方案,完全符合我们的设法。
然而,事实并非如此。
是的,如果你想为自己的企业创造一个 LOGO,又不想聘请专业的 LOGO 安排师,你也许可以通过 Midjourney 中的一些提醒和迭代,来创造一个还凑合的 LOGO。但它只适用于你想潦草完成的情况。
但是,如果你对 LOGO 的外观和气概有具体要求,那么你能够须要对提醒词举行多次润色,才能使其接近你想要的感觉。
这相反须要大量的人工测试和来回编辑,不是三言两语就能完成的。
输入品质的重要性
这是因为在我看来,使用生成式 AI 的最重要规则之一是:输入品质决定输入品质。下面的例子是我给 ChatGPT 的一个通用提醒:
由 ChatGPT 生成的邮件,提醒词是“告知我的团队我正在做事情”
ChatGPT 天马行空地发挥想象力,竭力把事情具体化,却只输入了一封充满陈词滥调空话的邮件,这其实很有趣。这让我想起了我在 reddit 上看到的一个帖子:
AI 成为我们的空话生成器和空话解码器,这真是一个辛辣的讽刺。
“AI 将我这个简短的总结转化成一份超长邮件,并且假装是我写的。”
“AI 可以将这份超长的邮件总结为一句话,这一我可以假装看过了。”
这不能怪 ChatGPT,因为我给出的提醒词确实很糟糕,其中没有包含太多的信息。我没有说明邮件的气概、长度、我和团队之间的关系,我也没有提到和现有项目相关的任何细节,等等。我脑子里能够有这些背景和信息,但如果我不说出来,ChatGPT 永远也不会知道。
而这正是具有挑战性的部分——用户须要知道如何传达足够的上下文信息,以便 AI 能哄骗好这些信息,这才能节省我的时间,并供应我须要的输入实质。
来自言语本身的挑战
要知道如何 “安排 “提醒词,向 AI 模型准确传达我们的设法,其实是一件很难的事情。我们自己的言语,比如英语,天生就不擅长给出精确的指令。这也是我们创造具有严格语法的编程言语的初衷之一,以便将我们的设法明确、高效地传达给计算机。
“代码是我们安排的界面,用来给计算机编程。这是我们所须要的。它客观、清晰、明确、(相对)静态、内部一致且稳健。
英语不具备这些特性——它是主观的,意义往往是隐晦、模棱两可的,它总是在变化,甚至自相矛盾矛盾,文本的结构经不起推敲”。
——道森-埃利亚森:”英语是一种糟糕的编程言语”
因此,即使是人类,每天也会误解对方。我们能够须要多次解释自己的设法,如此反复,才能让别人完全理解。很多时候,我们还须要借助外部对象,如白板图或者非常详细的文件,来解释我们的整个思维过程,以达到同频一致的目的。
我们须要对 AI 举行同样的处理。
通往终极合作者和副驾驶员之路
我们可以通过一些方法来安排和微调 AI 对象,避免出现问题。与其让用户误以为 AI 对象可以 “读懂你的设法”,我们不如把它视作为一个强大的合作者,或者像微软所说的那样,一个可以辅助你完成工作的 “副驾驶”。安排和构建 AI 对象的人也应该供应手段,帮助用户在日常使用中,精确而高效地与他们的 “副驾驶 “沟通。
在为生成式 AI 举行安排时,须要注意以下几点。
1.提醒词工程
提醒词工程可以很有趣,甚至提醒词工程师已经成为一份年薪可以达到 33.5 万美元的工作。不过,我认为,这些工作的存在,只是为了让“专业”的提醒词工程师,能够替代普通用户完成艰苦的提醒词创造地工作,从而避免普通用户须要专门学习一门“AI言语”。
相反,我们可以让普通用户通过预设地问题/类别,来输入和描述他们正在寻找的实质和答案。有了这些信息,系统就能代表他们生成更完善的提醒,从而最大限度地提高 AI 产出有效结果的几率。
这对专注于垂直领域的产品,尤其有帮助,我们可以建立一套预设地问题,这在大多数情况下都很有帮助。
例如,HomeByte 可帮用户生成待售房屋的装修效果图,让用户构思新家具和新气概装饰下的硬装和软装地效果。它让用户使用预设的 UI 元素来选择气概、房间类型和色彩主题,然后生成生成 AI 模型的最终提醒词。它还会向用户公开提醒词细节,以便进阶用户自己举行微调。
来自 HomeByte
2.供应框架和制约因素
这是第一点的延伸。供应限制是唐-诺曼(Don Norman)提出的七大安排原则之一。这听起来能够有违直觉,但很多时候,限制用户的选择,而不是给他们一个空白页(让用户从零开始撰写他们自己的提醒词)能够会更有效。
Story AI 就是一个很好的例子,它在为用户生成小说创意之前,会询问用户一些输入地信息。其中包括小说气概、主角信息、小说背景、主要冲突以及对小说的其他特殊要求。
摘自 Story AI
这些选项促使用户考虑输入实质地方方面面,以确保输入提醒词足够全面,从而确保 AI 能够高品质地输入。
3.哄骗现有实质作为输入的基础
供应详细、高品质输入的另一种方法,是哄骗现有的实质作为输入,然后让 AI 对其举行细化、格式化和气概化。
Google Workspace 和 Microsoft Office 最近发布的视频都强调了这种情况。
例如,你可以在手机上写一封邮件的草稿,无需考虑格式,让 Gmail 为你正式处理。
基于几个要点,撰写正式的电子邮件 – Google Workspace 中的 Gmail
或者把昨天的原始会议记录(记录了团队的所有设法)用 Microsoft Word 转换成提案。
根据会议记录起草提案 – Microsoft Office 365 中的 Word
在我看来,这是人类与 AI 之间的一次伟大合作,但是人类仍然负责实质。毕竟,生成式 AI 是一个推理引擎,而不是一个知识库。如果没有实质作为基础,它所能做的只是幻觉和编造。但是,有了人类供应的实质,即使是原始形式的实质,AI也能将其气概化,使其变得更棒。
4.数量重于品质
即使有约束条件和良好的实质输入,AI 能够仍然很难一次就完全准确捕捉到用户的意图。因此,在安排 AI 对象时,最好能供应几个选项,让用户挑选自己喜欢的来进一步完善。
“没有想象力的世界 “由 Midjourney 生成
谷歌 Bard 生成的多个草稿
“数量重于品质 “也是头脑风暴的原则之一。因此,”生成式 AI “的妙用之一就是供应各种选项,激发用户的灵感,而不是一蹴而就地创造出最终解决方案。AI 生成的实质应该被视为灵感参考,而非必须遵循的神谕。
这也是我们可以哄骗 AI 模型的 “缺点” 又价值的地方:由于言语的局限性,我们很难期望 AI 完美无瑕地执行我们的设法,相反,我们可以哄骗 AI 模型生成所带来的随机性。AI 模型对信息的 “误读 “能够会带来偶然的创造,不完美的产出会拓展我们的视野,鼓励我们探索未知的新道路。
5.允许用户控制和微调
即使可以生成多个结果,AI的生成通常仍是一个起点。最终,用户具备控制和微调的能力(控制也是 Jakob Nielsen 提出的 10 个可用性启发式之一)。
在 ChatGPT 中,你可以要求它使用新的约束条件重新生成回覆。不过,由于 AI 模型生成实质的概率属性,以及言语缺乏精确性的问题,导致这能够是一个挑战。
由 ChatGPT 生成
在上面的例子中,ChatGPT 能够没有理解我所说的 “保留隐喻 “的意思(我说得也很含糊)。在我第二次提醒后,它重新生成了整个实质,而我只是稍微改动一下措辞。
仅通过提醒词很难让模型一次又一次地生成令人满意的实质,这能够会导致用户在 21 次迭代后最终放弃,这个体验是极度令人沮丧的。
但另一方面,我们也可以安排一个对象,让用户自己编辑回覆,或选择部分回覆,通过直接操作,来隔离须要修改的实质,甚至在 AI 的帮助下进一步完善回覆。
Notion 允许用户对生成的小说举行微调
这对生成文本来说很容易,因为它们可以随时编辑。不过,Adobe Firefly 的早期预览显示,它也可以隔离图像的某些部分,让用户根据自己的须要对结果举行微调。
Adobe Firefly 的早期效果图
6.从用户习惯和偏好中学习
即使是在与其他人合作时,这些来来回回的修改也很常见,尤其是在合作的早期阶段。随着时间的推移,我们会逐渐了解对方的工作气概和喜好,更容易建立共识。
安排精良的 AI 系统也应如此,通过隐式和显式输入了解用户的习惯和偏好。
目前的 AI 对象通常只允许用户就输入的实质品质举行评价,目的是改进模型本身,而不是为用户的需求,进一步个性化和提升大模型。
Bard 的用户反馈选项
目前,为每个用户创造个人模型的成本能够相当高,但在未来,我们能够会逐渐看到这样的模型:它们从与用户之前的互动中学习,并随着时间的推移学习用户的偏好和气概,从而生成更加个性化的回覆,更少尝试的次数,更好满足用户的需求。
结语
生成式 AI 是热门话题,媒体的狂热吹捧能够会让用户对它的功能,产生不切实际的期望。然而,重要的是要记住这几点: