人工智能,这个曾经常常出现在科幻作品里的词汇,如今已经成为我们日常生活的一部分,相信大家从我们最近的文章中也能看出端倪。但随着人工智能范畴的演进,一些之前还潜伏着的挑战也慢慢浮出水面——那就是如何处理好人工智能与人的关系,如何明白该范畴存在的偏见(当然也包括技术层面上的人为偏见造成的样例训练偏见)造成的影响力,以及如何在新的技术时代遵循以人为本的计划方针,是至关重要的。
△ 作者:Reena Jana & Mahima Pushkarna;插画:Matthew Hollister
正如我们在《Google Design 2018总结》中提到的,People + AI Research(PAIR)团队正是为应对这个挑战而生,这个 Google 团队专注于提供深度文章、资源以及框架,从而确保我们在打造人工智能产物时始终不会偏离「人」这个核心。本文算是 PAIR 专栏文章的热身。
作为 UX 团队的一部分,计划师有责任知道我们的应用和网站的内部运作方式。然而,在我们以人工智能为重点开始构建产物和服务时,这项工作就可能会更具挑战性了——虽然在计算机科学范畴里,人工智能并不是什么新课题(人工智能滥觞于上世纪50年代*),但对于我们这些从事消费产物用户体验计划和内容策略的人来说,「人工智能」依然是一个全新的计划原点,包括其运行逻辑和美学。
*包括大家经常提到的「图灵测试」也出自该时期。
在 Google,我们致力于向用户以及更广义上的公众提供一个简洁的解释:AI 系统是如何运作的——这个范畴越是透明,人们对其知道越是透彻,其接受度和发展助力也会越大。我们面对的对象有很多种:新手、专家、研究人员、开发者、计划师、内容策略制定者或政策倡导者——这些人对如何使用或应用同一个 AI 术语,以及对这个术语的期望也许会非常不同。如果这些人的认知都可以同步的话,我们就可以对 ML 和 AI 从业者使用的某些关键术语形成一个共同的、一定的明白*,从而协助 UX 团队更好地沟通,不仅限于探讨如何满足用户需求,还可以通过简单清晰地解释这些系统的工作方式,来更进一步建立用户对 AI 系统的信任。
*在任何行业,统一的术语都是高效且准确进行沟通的重要基础。
计划师需要知道哪些术语?
为了确定 UX 计划师们会接触到的基础术语,我们回顾了 People + AI Research 专栏中的首批文章,看看哪些 AI 术语的出现次数最多。我们还询问了 Google 的数十位计划师:ML 对他们意味着什么,他们如何用自己的语言定义 ML。之后,我们编写了一个基本的 AI 词汇表,我们从中找出了 UX 计划师、研究人员和内容策略师常用的(并经常被误解的)六个术语。在这里,我们用简单清晰的方式来阐述它们,作为之后文章的「术语基础」。
1. 人工智能—Artificial Intelligence(AI)
使机械智能化的科学,使它们能够识别不同的模式,并提高机械协助人们解决一定问题或完成多种挑战的能力。
当计算机程序根据展望的内容作出应对的决策时,我们就说它具有人工智能——这个过程可能是通过简单的基于规则的或启发式的逻辑方法来实现的,例如「如果下雨,那么就带上雨伞」。但是在机械进修(见下文)中,这个决策不是通过固定的逻辑,而是通过进修来作出的。
2. 机械进修—Machine Learning(ML)
人工智能的一个子范畴,其中包括开发人工智能的技术和方法。旨在让计算机程序能完成一定的义务,但人们无需逐步编写完成该义务的详细逻辑。
有很多方法可以让计算机程序进修东西。PAIR 专栏中经常提到的是监督式机械进修(supervised learning),程序会进修如何通过成千上万的例子进行展望,比如展望您的通勤时间。其他流行的方法还包括非监督、半监督和强化进修(unsupervised,semi-supervised,reinforcement learning),这些内容我们之后有机会再为大家详述。
如果您已经迫不及待想要知道更多机械进修术语,请访问:https://developers.google.cn/machine-learning/glossary/
3. 机械进修(ML)模型—ML Model
一组专门的、互相关联的数学函数。它们共同组成了智能机械为达成决策所需采取的步骤。
假定您遵循相同的行进路线,通过识别交通状况、模式以及加上对一定路况的明白,ML 模型就能够估测您到达目的地的时间。有时 ML 模型这个术语会和算法或神经网络混淆。算法这个说法更广义一些*,可以明白为像是食谱那样的逐步执行逻辑;而神经网络只是 ML 模型的一种。另外补充一个小知识,「神经网络」这个称谓的来由,是因为它模仿的是人类大脑中的神经元。大量的神经元交织在一起传递神经脉冲,从而让人类拥有了进修能力、创造能力和高超的抽象能力。
*从定义上讲,算法意味着「用有限的步骤,将输出计算为输出」。机械进修研究和计划的正是一些一定的算法,这些算法可以让计算机「进修」到如何根据输出计算出结果。
4. 分类—Classification
模型展望新的输出属于哪个或哪些一定的已知组的过程。
举个详细的例子:为了协助保持 Gmail 收件箱的清洁和数据安全,ML 模型在后台运行,不断将每封电子邮件分类为垃圾邮件或非垃圾邮件(在这个过程中如果出现了任何疑问,Gmail 会要求您验证未知发件人的电子邮件地址)。在这个例子里,「垃圾邮件」是一个组,「非垃圾邮件」是另一个组,这样的分类被称为「二元分类(binary classification)」。二元展望非常适合解决「是或否」 问题,但分类模型可以做的比这还要多得多。这些模型可以展望给定输出的多个类别。这样的模型不仅可以将电子邮件分类为「非垃圾邮件」或「垃圾邮件」,还可以把它分类为「重要」,并加上「财务」和「后续」等标签。
如果您想要知道分类的运作原理以及有关其多样性的信息,请试试我们的 What-If 工具。What-If 是一个交互式数据的可视化工具,可以协助团队明白 ML 模型的结果,而无需编写任何代码。
What-If 工具:https://pair-code.github.io/what-if-tool/uci.html
5. 返回—Regression
模型根据输出展望对应的输出数值的过程。
举个详细的例子:当您想查看两周后的机票价格范围时,模型就需要执行「返回」义务。和分类不同,ML 模型这时不是给出离散的展望结果(比如「是和否」或者「高和低」),而是需要给出一个详细的数字价格。所以模型会基于历史机票数据,给出一个数学上连续的「价格曲线」。
再打个比方,比如您的义务是在商店中计划一个冬季配饰展览活动。分类义务就简单粗暴一些,例如将帽子分为一类,将领巾分为另一类。想完成义务,您需要搜集各个配饰的形状、结构等数据,从而判断它是「帽子」还是「领巾」即可。
而返回义务就更「精细」一些。比如根据每一个橱窗所在的位置、温度等在里面展示出更混合精准的「配装」——比如配装里可以有领巾和帽子,但也可以根据一些细节环境的不同加上耳罩、袜子,羊毛衬垫和外套等,详细的调整依据包括当前的天气,你过去对客户在这个季节的愿望和需求的知道,以及今年的时尚潮流等等。
返回展望的使用方法充满了多样性和创造性,它可以创造出极其复杂的用户体验,足以展望币值变化,为歌曲排名并创建个性化播放列表,甚至可以判断一个图像的质量。在确定返回模型是否适合您的用户时,不妨先知道一下最终产物或服务中所需的细微差别和复杂程度,再决定是否真的需要打造返回模型。
6. 置信度—Confidence Level
用于展示确定性的百分比数字。
当人类试图猜测某人的年龄时,会说「我想这个人可能已经35岁了。」我们知道这只是一个猜测,因为像「我想」和「可能」这样的短语表示猜测者缺乏信心或确定性。同样,我们也可以将模型所做的展望视为有根据的猜想,其中包含有一定的不确定性。模型的确定性水平以百分比形式表示,如 「我有73.3%的把握断定这个人今年35岁。」产物团队可以使用置信度来决定何种回应是可以接受的——如果一个模型有70%的把握说今天会下雨,那么我们就有必要建议用户出门时准备好雨伞。
希望本次的文章能协助您知道一些人工智能范畴的基础概念,以及一些我们日常使用到的技术产物(如Gmail)功能背后的技术术语。更重要的是,我们希望本文能启发您去更多地知道人工智能这个范畴,从而让计划师与开发者们能更好地沟通,从而打造出以人为本的好产物。