从景观到 AI 产品,这个设想师自己开发了一个「招行版鹿班」!

最近在采访一些跨范围的设想师,这是第一期的采访嘉宾 Shadow,一名有十年工作经验、全栈开发、从景观设想跨界到 AI 产品经理的设想师。 志荣:Hi Shadow,要不你先简要介绍一下自己吧。 Shadow:我是池志炜,也是 Shadow,典型斜杠青年。08年毕业于上海交通设想学院景观设想专业,同济大学硕士。现在的身份是跨界设想师,从事过景观设想、旅游规划、房地产设想管理、参数化设想、用户体验设想、数据可视化设想等等。同时我也是一名全栈开发者,这几年我自学了深度进修相关的 keras、后端 node.js 和 p

从景观到 AI 产品,这个设想师自己开发了一个「招行版鹿班」!

最近在采访一些跨范围的设想师,这是第一期的采访嘉宾 Shadow,一名有十年工作经验、全栈开发、从景观设想跨界到 AI 产品经理的设想师。

志荣:Hi Shadow,要不你先简要介绍一下自己吧。

Shadow:我是池志炜,也是 Shadow,典型斜杠青年。08年毕业于上海交通设想学院景观设想专业,同济大学硕士。现在的身份是跨界设想师,从事过景观设想、旅游规划、房地产设想管理、参数化设想、用户体验设想、数据可视化设想等等。同时我也是一名全栈开发者,这几年我自学了深度进修相关的 keras、后端 node.js 和 python。现在在设想圈比较有名的 ARKIE 主担任产品经理/机器进修研究员,同时兼职上海交通大学景观设想课程的老师以及一些朋友的创业团队技术顾问。这几年也在做自媒体,公众号叫 Mixlab,知乎专栏《人工智能设想修炼指南》,目前已经形成500人+的设想师&程序员跨界社群。

志荣:你是什么时候开始自学开发的?为什么想学开发?在我的理解里,自学开发对设想师来说不是一件容易的事情。

Shadow:08年我一毕业就在自学 Python 和可视化编程,在得多景观项目中我会通过编程的方式来调整 CAD、Sketchup 里的三维设想。在13年的时候我开始进修前端开发,后来跳槽到中兴担任高级软件开发工程师,主要通过 Node.js 来进行 Hybrid APP 的开发,2016年顺手进修了 React Native。到了17年我换了一份工作,在招商银行做用户体验设想,从景观设想到编程开发再到用户体验设想跨度还是蛮大的。在招行做设想的同时我也在做研发的工作,我想帮招行完成一个阿里的鲁班系统,它能自动生成各种 Banner、海报,所以我又自学了深度进修相关的学问。反正有新东西我就会尝试去接触和进修。

志荣:惭愧惭愧,我一名计算机背景出身的设想师掌握的编程技能都没有你多。 你为什么想做一个鲁班系统出来?

Shadow:我希望能通过智能的方式去完成设想。我在08年做景观设想的时候已经在做参数化设想了。在2017年,我花了得多时间和精力来研究智能化设想这个方向。在我今年离开招商银行的时候,我开发的系统已经有一个可用的版本,可以直接看到具体的效果,而且生成一张 Banner 是没有课题的。

志荣:17年上半年我当时看过 ARKIE 的产品,我感到改善空间还是蛮大的,你感到你在招商银行做的自动化生成设想系统比他们做的好吗?

Shadow:好不好更多是主观意识,主要看你用了哪一种步骤。ARKIE 希望做到一句话生成一张海报,他们当时用的步骤需要很有经验的设想师来给出不同的模板和规则,例如配色、排版、字体等等。当时我把2017年 ARKIE 的主要做法给研究出来了,也是差不多的原理,通过把模板动态化和参数化,就可以做到一个模板生成100种设想。只要提供的模板质量够高,每张 Banner 的效果都是能保证的。但鲁班的做法不一样,它是基于阿里所有的 Banner 数据来进行机器进修,抽象出相应的规则。

志荣:听说你在业余时间独立开发了挺多 APP,能大概跟我们分享一下么?

Shadow:没课题。几年前我做了一个基于 LBS 的明信片应用,名叫 Spyfari,这是我第一次用 React Native 来开发的,整个开发花了很长时间,大概三个月左右。只要你拍了一张照片,它可以根据你地理位置自动生成一句话,合成一张明信片。这句话是怎么自动生成呢?通过 GPS 定位我就能确定用户的地理位置在哪,然后将预置的语料显示出来,包括各种诗词歌赋,它们都是通过爬虫的方式找来的。我还尝试做过一个在本地运行的抓图应用,把整个网站的图片都合成一张长图,最后自动加些字成为一张海报。对了,我还做聊天机器人 ACE Land,它是一个根据用户时间推荐内容的人工智能助手 App。这 APP 主要调用了图灵机器人的接口,但最后发现这不是我想做的主要方向。在其他业余时间里我也做过一些小程序的开发。我很喜欢做一些「图+文字」 的结合,还有我比较注重通过自动化的方式减少用户的输入,用户主需要输入一张图片或者打几个字就行了,这样用户的操作成本能降到最低。

从景观到 AI 产品,这个设想师自己开发了一个「招行版鹿班」!

△ Spyfari相关截图

志荣:其实一个人开发一个应用花了三个月不是很久,我之前开发一个应用也差不多这个节奏。(当时听到「三个月开发时间是很长的」 ,心有点痛。)做了这么久设想,你感到设想是什么?

Shadow:先插个题外话,我感到设想有两种状态,一种甲方是自己,这时候你会很享受设想和思考的过程,你可以从不同的角度去看待课题,不用考虑太多商业化课题,这样的设想比较纯粹。另外一种甲方是其他人,这时候我就要思考甲方是怎么想的,设想起来比较受限。回到正题,设想是什么?我感到是应用一些你掌握的设想「原材料」 去巧妙地解决课题。这个设想「原材料」 包括你掌握的技能、景观设想时采用的材料、用户体验设想用的心理学、交互的流程甚至是开发的代码。就像在菜市场买不同的食物,通过各种烹饪方式做出一道道菜来。这十年我做了各种不同的设想,我感到原材料可以不一样,但步骤和本质是一样的,设想思维是一致的。

志荣:我非常认同你的观点,我感到设想师应该拥有一技多能,「一技」 是指设想思维,「多能」 跟你说的原材料差不多,广泛的技能和学问,这样你做设想时思考才会更全面,并且通过设想思维从不同方面把这个课题解决掉。下一个课题,你在 AI&Design 范围深耕这么久,你感到现在的 AI 是什么?

Shadow:这个课题其实挺宽泛的。怎么说呢,现在的人工智能要看你智能到哪个程度。它可以很弱智但也属于人工智能的一种。所谓的「很弱智」 是指通过很简单的规则和方式去解决这个课题,但其中的一些数据处理我可能用了深度进修,这样也属于人工智能,但听起来没那么高端。现在行业里得多人喜欢说自己解决课题时用了对抗生成网络或者深度进修,无论你用了什么步骤,你解决的课题都是同一个课题,只是最后评估效果时看哪个步骤更好一点。所以我感到 AI 是什么,我感到它只是一种技术手段,它跟设想是平行的。

志荣:嗯,有道理。我之前感到 AI 就是一种设想步骤。设想是用来解决课题的,深度进修也是解决课题的其中一种步骤、一种技术。下一个话题,要不我们深入聊一下 AI 和设想结合的案例?

Shadow:好的。有没有听说过一个叫小库科技的公司?它通过人工智能来做建筑设想,但它背后的原理、完成的方式就跟 ARKIE 用人工智能生成海报的原理很不一样。建筑方向的人工智能更多是把精力放在学问图谱的构建还有 CNN 的分类上。

志荣:为什么建筑设想要做学问图谱?

Shadow:因为建筑里有得多规范。例如一个小区,它的层高应该是多少,容积率是多少,每一个套房的户型和面积是多少,每一户拥有几房间,每一个房间的面积也是根据总体面积来定义的。这一些的背后都有很强的规范和要求。

志荣:所以 ARKIE 是没有做这些规范和学问图谱的,因为设想涵括了主观因素,比较抽象,很难用规范来构建美学的学问图谱。

Shadow:对,我之前在招行的时候就想过做一个美学的学问图谱出来,但很难做学问的分类。例如「对称」 这个词,它到底是算在布局还是视觉的平衡力?我很难定义每个学问的节点和它们的关系。但建筑范围不是纯设想方向的,它在得多方面都有自己的规范和要求,它们都是强制型的,所以是有可能做成学问图谱的。

志荣:之前看过一篇关于通过机器进修改造汽车底盘的案例,这家名叫 Hack rod 先3D打印了一个汽车底盘,然后在赛车时通过各种传感器获取不同的真实数据,然后让机器在虚拟环境中不断进修、不断自动地改变底盘的结构。我想了解一下,建筑设想能用类似的步骤以及结合学问图谱来完成设想么?

Shadow:建筑设想用这种步骤不太现实,因为这么做必须要先把建筑建起来,成本非常高。你说的步骤更多是数据驱动的形式,现在景观设想和建筑设想有类似的思维,例如参数化设想。但这时候已经设想好模型,并不会去改进。如果要完成改进,就需要一个仿真器来完成,这是难点之一。按我的认知,结构设想是有仿真器的,因为力学的仿真系统已经非常成熟的,比如桥梁的设想,可以通过不断地仿真、不断地调节参数使桥梁设想达到最好的状态。但是建筑设想考虑的因素得多,例如它能容纳多少人,每个时间段的人流分布是怎样的,还有各种主观因素,包括设想感、商业化、甲方的个人喜好,建筑设想不是一个纯理性的设想,所以很难把这些因素结合在一起进行模拟。

Shadow:我再举一个关于珠宝设想的例子。现在用户数据的获取越来越简单,加上3D打印、纳米微雕等技术的成熟,结合人工智能的个性化定制珠宝有了更多的可能性。传统的珠宝设想流程比较长,设想师需要客户或自己的创意灵感手绘出设想草图,并以这个为蓝本不断修改,然后根据珠宝设想图制作珠宝模板,再用手工雕蜡起版或者用电脑 CAD 起版,然后倒模、执模、镶嵌、抛光和表面处理,最后品质检验和出具证书。人工智能珠宝设想师在给出最终的珠宝设想图前可以做得多事情,例如让机器获取用户的个人数据,包括声音、身高、体重、心率还有个人喜好,以及用户选择的材质、符号、重量等珠宝参数,然后将这些数据可视化,结合相关的算法生成不一样的设想,最后让用户寻找最喜欢的3D珠宝模型。人工智能珠宝设想师甚至能让用户自行对珠宝进行造型,用户只需要画出大概的造型,利用 RNN 把最匹配用户的3D珠宝模型显示出来。

志荣:明白了。要不我们换一个话题吧。有些时候我真心感到不懂技术做起设想会很局限,就跟盲人摸象差不多。你很难看清楚你的产品本质是什么,框架是什么。你感到编程开发能力对你的设想来说有什么帮助?

Shadow:哈哈,简单点就是懂开发能让你的设想更有技术含量。我举一个聊天机器人的例子,如果你不懂得开发,你是不会知道聊天机器人的效果如何评估,你也不知道用什么手段来提高这个效果。如果你是一名普通的设想师,你可能认为全部的聊天机器人都跟网上宣传的那么高端、那么好用,然后把你家的产品设想得一样智能,但其实一点意义都没有,因为做不到。但普通的设想师会感到,这肯定能做到,因为这样的闲聊人类是能理解的,而且别人家竞品也是这样做的。当你的产品理念脱离了实际可完成的方案,那么会永远达不到你的产品目的。 再举一个滤镜的例子。如果是设想师的话,他可能感到用 Photoshop 对这张图片加个很酷炫的滤镜就行了,然后交给程序员让他们完成出来。

志荣:滤镜这个案例讲得太对了。我之前在公司在做过相机相关的产品,基本上大家的滤镜都是用开源代码完成的,自己重新写一个滤镜不太现实,因为很少工程师懂得图像处理技术。虽然说滤镜的表现跟设想师非常相关,但其实跟设想师也没有太多关系,因为你考虑的东西工程师很可能做不出来。

Shadow:我们沿着滤镜这个话题继续往下聊,我最近在看滤镜的完成,比较好的滤镜效果都是通过 GPU 着色器去写的。如果是常规的图片处理,用像素的处理方式来做滤镜效率会太低,而且款式少。但是用 GPU 着色器去写滤镜的话,这对得多工程师来说真的很难,并不是所有的工程师都懂得着色器开发。而且着色器功能很强大,它能做到怎样的酷炫程度连设想师都不知道。

志荣:嗯,是的。我之前写过前端相关的代码,我相信得多工程师能写页面的代码,但很棒的动效的代码并不是所有的前端工程师都能写出来,因为他们没有去学这种学问。而且一个特别棒的动效更多是设想和开发的结合,这是跨范围的。还有得多工程师是没有学过 SVG 的,SVG 我也只是看过一些,它虽然只是一个文件格式,其实能做到得多东西,包括各种复杂的动画。我两年前写自己官网的时候也用了 SVG 动画来做,真的很复杂,我只能看着别人的源代码慢慢去改成我想要的效果,但要让我自己从0到1开始进修和开发 SVG,对我来说很不现实,因为真的没时间。

Shadow:对的,这个涉及到你要专注某个范围还是所有范围你都要去了解。

志荣:上一年鲁班的出现导致网上得多设想师都在担心自己会被淘汰,你怎么看待 AI 和设想师的关系?

Shadow:我感到 AI 和设想师的关系主要有几种。一种是纯劳动力的设想师,就只懂得复制粘贴和改改图,这种设想师是很有可能被取代掉的。还有一类是深耕自己专业范围的设想师,这样的设想师 AI 可能跟他关系不是很大。

志荣:这个我不太同意你的看法。就好像临摹一幅画,有些人花了很长时间来临摹,我感到这个更多像深耕而不是纯劳动力,但 AI 可能用风格迁移的手段一下子把临摹处理得很好。

Shadow:嗯,但这个更多是艺术,艺术不是一件工业品,工业品才会讲求效率,你要的艺术是想让机器生产还是人去创作,这是值得深思的。我最近还有其他的想法,在某个范围深耕的设想师能很快速地在这个范围树立自己的品牌,他占据了先天优势,就算 AI 再强,都很难跟他竞争。

志荣:说的对。我感到对设想师来说,技法可能到达了天花板,但你的想法和影响力这才是最重要的。这里我是挺有感触的,我12年开始自学交互的时候,把14年前市面上的交互书籍都看完了,但15年后我发现很难再找到新的交互书籍,因为当时交互设想大家都探索得差不多了,所以写书的都变少了。当每个人的交互设想技法水平都差不多的时候,更重要的是思考如何提高自己的其他能力,例如对业务的理解、如何扩充自己其他范围的想法和技法。

Shadow:是的,所以说 AI 跟设想师的关系蛮难定义的,最终要看这个设想师是怎么定位的,他是跨界的还是只懂一点点。AI 对跨界设想师来说只是一个工具。但这种跨界人才已经很难用设想师这个职业来定义了,我感到他比设想师要更高一个层面。

志荣:是的,我们聊一聊最后一个课题吧。你感到设想师要怎么拓宽自己的视野?

Shadow:最重要是心态,心态一定要开放。不管是哪个范围或者内容,你都要以开放的心态接触它们,接触完你再给反馈。你不能一上来就特别反感别人提出的观点或者其他范围积累的经验。你不要感到自己的就是一定对的。你要这么想,对方讲的可能是对的,我要先听进去,然后再综合考虑。平等地考虑每一个观点,我感到这样就能很容易拓展自己的视野和能力,但其实很难做到。还有就是多跟其他行业的人一起交流,并且跟不同经验的人群交流,例如是很年轻的大学生或者五六十岁的长辈,聊天的时候就是在拓展自己的视野。我创建的 Mixlab 社区也是为了这个目的,让不同行业的人相互勾搭,相互进修,共同进步。

志荣:非常感谢 Shadow 今天的分享,希望有机会来上海参与你们 Mixlab 的聚会。

给TA打赏
共{{data.count}}人
人已打赏
应用

实战案例!阿里巴巴如何用人工智能做Banner 计划?

2018-5-18 21:00:25

应用

我邀请了小米探索实验室的计划总监,和你聊聊智能音箱

2018-8-4 2:28:06

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索