战胜柯洁的深度进修,有大概取代设想师吗?

最近看到在「Baidu Create 2019」的百度 AI 交互设想论坛上,设想师分享了他们的最新成果:百度人工智能交互设想院与百度研究院商业智能实验室合作,鉴于百度自主研发、开源开放的深度进修框架飞桨(PaddlePaddle),让系统在每个模块组合形成的不同界面中找到最优解,在模型框架内给出任何一种设想,机器都能快速预测用户的偏好结果,设想师将以此为基础给出符合用户喜好与使用习惯的最佳解决方案。 设想存在的问题 现在的深度进修能用于界面设想吗?能鉴于深度进修给出符合用户喜好与使用习惯的最佳解决方案吗?这是 A

战胜柯洁的深度进修,有大概取代设想师吗?

最近看到在「Baidu Create 2019」的百度 AI 交互设想论坛上,设想师分享了他们的最新成果:百度人工智能交互设想院与百度研究院商业智能实验室合作,鉴于百度自主研发、开源开放的深度进修框架飞桨(PaddlePaddle),让系统在每个模块组合形成的不同界面中找到最优解,在模型框架内给出任何一种设想,机器都能快速预测用户的偏好结果,设想师将以此为基础给出符合用户喜好与使用习惯的最佳解决方案。

设想存在的问题

现在的深度进修能用于界面设想吗?能鉴于深度进修给出符合用户喜好与使用习惯的最佳解决方案吗?这是 AI 设想的重点方向之一,今天聊一下我的个人看法,首先总结一下我们现在设想存在的问题:

1. 受限于营业方

虽然我们一直讲以用户为中心的设想,但是大部分的设想需求都是由营业方或者老板决定的,如果需求不合理,它会严重影响你的设想方案。

2. 出了错误大概自己都不知道

有些设想师大概会因为缺乏时间、实践或者经验等原因把自己局限在舒适区,也有大概因为不知道更先进的设想方法和设想规范导致自己的设想方案出现错误。

3. 强调竞品分析,但不知道竞品为什么要这样做

改版时我们会参考做得好的竞品,很多时候我们只停留在表面的界面改版上,但我们并不知道他们背后的数据是怎样的,也不知道他们的长远规划,究竟是什么原因才会设想成这样。

4. 设想维护成本高

一般一个项目有多个设想师参与,设想师的加入或者离开会对整个项目产生影响;加上项目不断的更新迭代和上述三个原因会导致正确的设想方案维护成本较高,所以在很多产品上都能看到不同的设想错误,包括结构违规、资源违规、文本违规,这些违规的背后很有大概是因为没有人力或者忘记去维护。

5. 不懂得面向编程的思维方式

简单点说,现在大部分的设想师就是营业方和程序员之间的桥梁,他们的任务就是将营业方的需求翻译成界面设想然后交给程序员。有些时候设想师设想的界面大概和程序员理解的界面结构不一样,导致程序员开发时会引入与 GUI 相关的错误。背后的原因是设想师缺乏编程领域的知识,不知道界面模型和代码之间存在相当大的抽象差距,导致程序员看到的界面大概是「乱码」。

如果将深度进修用于界面设想,会对上述问题产生影响吗?首先,什么是深度进修?我们可以把深度进修理解为一个黑盒子,通过输入大量的训练数据后,它能找到数据之间的关联和特征,然后自我构建一个模型,最后研究人员把测试数据放到模型里进行测试。如果测试结果准确率很高,那么我们可以认为这个深度进修模型是有效的,否则是无效的。简单理解的话:深度进修就是找规律,但是需要鉴于大量数据才能找到正确的规律。这属于数据驱动设想的范围。

战胜柯洁的深度进修,有大概取代设想师吗?

如何正确获取大量的界面数据?当然不是在 Dribbble 和 Behance 下载各种图片。2017 年美国一些研究人员发表了一篇论文,名叫《Rico:移动运用数据集,用于构建数据驱动的设想运用程序》。在论文中,作者从 Google Play 商店下载了 9,772 个免费运用程序,涵盖 27 个类别。作者还在 UpWork 上招募了 13 名工作人员,花费了 2,450 个小时在不同运用上产生了 10,811 个用户交互跟踪。最后整个数据集包括了 72k 个 UI 界面的视觉、文本、结构和交互式设想属性。Rico 还公开了 Google Play 商店中的商店元数据,包括运用类别、平均评分、评分数量和下载次数。

可以说,Rico 这篇论文的作者做了一件非常伟大的事情。

深度进修对界面设想的影响

我整理了一下现有技术和论文,深度进修对界面设想的影响主要有以下五个方面。

1. 设想搜索

Rico 最主要的功能是设想搜索,它能根据关键词或者截图找到类似的结构,还可以通过运用名字找到相关的运用截图,不仅能为设想师提供灵感,还能大幅度提升设想师的工作效率。以下是作者在 ACM SIGCHI 2017 上的发表视频:

战胜柯洁的深度进修,有大概取代设想师吗?

2. 组件类型和结构推荐

Rico 公开了 Android 视图层次结构中包含的所有元素的属性(例如位置,维度)以及它们之间的结构关系。通过 Rico 提供的视图层次结构,研究人员有机会训练出 UI 结构的模型。和 Sublime 等编程工具一样,当我们在画交互图的时候,设想工具可以实时给予我们结构上的建议,我们选择某个结构推荐后,它会主动帮我们补全剩余的结构设想,大幅度提升交互设想师的工作效率。

3. 用户交互建模

在《鉴于深度进修的主动Android运用程序测试方法》论文中提到名为 Humanoid 的技术, Humanoid 的核心是一个深度神经网络模型,它能预测用户更大概与哪些 UI 元素进行交互以及如何与其进行交互。同时,Humanoid 还可以根据 GUI 页面的重要性对 GUI 页面上的大概交互进行优先级排序。Humanoid 能帮助我们完成用户交互的建模和测试,更好地实现设想目标。

4. 主动检测GUI中的错误

在《主动报告移动运用程序的GUI设想违规》论文中,作者提出了一种名为 GVT(Gui Verification)的方法,它能通过计算机视觉技术和启发式检查来识别 GUI 实现中的常见错误,包括像素的差异大小、结构违规、文本违规和资源违规,然后构建一份报告,其中包含了屏幕截图、代码信息以及设想违规的精确描述。论文最后表示,这项技术已经被华为的一千多名设想师和工程师使用,满意度较高。

5. UI代码主动生成

2017 年 UIzard 开源了一款名叫 pix2code 的神经网络工具,它能将界面截图翻译成界面代码;2018 年 Airbnb 和微软相继发布了自己的最新研究成果,设想师可以通过草图直接生成界面代码,减少视觉稿设想、前端开发的工作量。鉴于草稿的界面生成主要原理是找到手绘控件和系统控件样式之间的规律,然后寻找草稿中控件的结构关系,最后翻译成界面结构和页面代码。微软开源了相应的代码 Sketch2Code(详细介绍:https://www.uisdc.com/sketch2code-design-sketches-become-the-code),看起来很美好,但体验过后发现 Sketch2Code 的效果并不理想,主要有以下几点:

能识别部分控件,但准确率较低;
无法识别控件的高度;
结构识别效果并不好;
对中文识别效果并不友好。

战胜柯洁的深度进修,有大概取代设想师吗?

△ 大家可以上 https://sketch2code.azurewebsites.net/ 尝试体验

既然已经有草稿主动生成界面的人工智能,那么深度进修能不能脱离草稿自主生成界面设想?是有大概的,可以通过 GAN(Generative Adversarial Networks,生成式对抗网络)主动生成,简单理解的话,GAN 就是通过找出不同图片的风格后进行拼接。目前已经有人在研究和利用 GAN 主动生成建筑室内设想,下面的视频就是宾夕法尼亚大学建筑学的郑豪博士给出的案例。但是个人认为,GAN 主动生成界面只具备大概性,其实没有任何实质意义。因为界面设想和室内不一样,室内设想生成的是一张结构图,但界面设想里需要考虑营业目标,同时还要考虑不同界面之间的关系,每一个界面的结构和流程都会影响下一个界面的设想,因此它要比室内设想复杂得多。

△ 鉴于GAN的室内设想主动生成

机器能不能直接获取设想经验?这是具备可行性的,最近和 Mixlab 的朋友们探讨了以上问题,以下是我们的讨论内容:

战胜柯洁的深度进修,有大概取代设想师吗?

战胜柯洁的深度进修,有大概取代设想师吗?

战胜柯洁的深度进修,有大概取代设想师吗?

最后和郑豪博士聊了一下公式内容,按照郑豪博士的说法「暴力数学拟合」,看完他给的公式后简直无力反驳。但过后我陷入了沉思:既然这条公式这么简单粗暴,为什么要花费如此大精力要计算机自己进修人类的经验呢?为什么不直接把已有的经验传授给机器?目前大部分设想都和几何设想学有关,那么我们是不是可以把几何设想等相关经验输入进去就好了?基本上所有小屏设想的规律都是有规律所寻的,那就是各平台的设想规范。如果我们把大量的鉴于 Android 和 iOS 规范的设想截图输入到神经网络里进行深度进修,最后得到的结论大概就是每一个控件的样式和设想规范类似,那么我们为什么不直接把现有的 Android 和 iOS 设想规范梳理成规则告诉计算机呢?以下是郑豪博士的见解:

战胜柯洁的深度进修,有大概取代设想师吗?

战胜柯洁的深度进修,有大概取代设想师吗?

简单点,如果为了让机器自主学会设想规范,那么可以通过神经网络的方式进行训练,但是最终的效果跟教会机器设想规范是基本一致的,而且后者的成本低很多,以及成功率相对高一点。

最后一个问题,那么深度进修能不能绕开营业方完全凭借经验主动生成整个界面和流程设想?这里可以给一个明确的回应,现在的人工智能还不具备这样的思考和创造能力,理由如下:

界面和流程的优化并不只是 Bug 的修补,还需考虑增添、删减和修改功能,便于整个产品的长远发展,但人工智能还不具备这样的能力。

深度进修最终看收集的数据是什么。如果我们收集到的数据是普遍性的,那么产出物一定是具有普遍性的结论,例如大部分用户对于相同控件但不同样式的认知是怎样的?相同结构下用户的操作行为是怎样的?能不能通过不同产品的界面设想知道最佳设想是什么?不能,不同的商业目标会有不一样的设想目标,因此会产生不一样的设想,这不具备普适性。那么,能不能通过竞品的界面设想知道相同营业的最佳设想是什么?个人认为做不到,因为其他运用的营业数据和流程分析都属于商业机密,无法得到,因此无法建模。

如果想根据每个人的习惯爱好主动生成千人千面的界面设想,那么收集的数据一定是每个人的隐私数据,而且是这个用户的全部隐私数据,这样才能知道这位用户的习惯爱好是什么,但目前无论是 iOS 还是 Android 系统都不允许运用过分收集用户的隐私数据,所以这个想法的大概性几乎为零。

上述全部内容更多是研究层面的结论和可行性探索,但全部都没达到可商业化落地的阶段,包括以上的技术和论文。最近和研究 AI 设想的小伙伴们聊了一下,都有一个明确的共识:研究 AI 设想需要投入大量的人力和物力,最终的结果真的可以商业化吗?即使可以,能把之前投入的钱给拿回来吗?目前看起来很难,大概只有 Adobe、Sketch 等设想工具供应商才会持续投入资源研究,例如 Adobe 在 2016 年开发了 Adobe Sensei 深度进修平台,我们可以共同期待一下他们未来几年为我们提供的 AI 设想工具。

文献

Automated Reporting of GUI Design Violations for Mobile Apps.
Machine Learning-Based Prototyping of Graphical User Interfaces for Mobile Apps.
Rico: A Mobile App Dataset for Building Data-Driven Design Applications.
A Deep Learning based Approach to Automated Android App Testing.

给TA打赏
共{{data.count}}人
人已打赏
应用

优设访谈!人工智能时代来临,设想师如何才能不被淘汰?

2019-6-20 23:32:30

应用

收藏这个网站,零基础也能成为人工智能设计实际高手

2019-8-29 10:06:39

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索