做过10亿次设想的人工智能「鹿班」,原来是他负责的!

这期节目我们请到了阿里巴巴智能设想实验室的负责人乐乘。这个智能设想实验室有个最著名的项目叫鲁班(现更名为鹿班),大家可以简单的把鹿班明白为一个人工智能设想师,去年这个名叫鹿班的智能设想师在双11期间为阿里绘制了4.1亿张各不相同的个性化告白图,而今年鹿班甚至开始学会设想网页了。人工智能会对设想这个行业造成怎样的影响,它会判断美丑吗?鹿班会像 AlphaGo 超越人类围棋手一样,在现在超越人类设想师的水平吗?所有这些成绩,我们会在这期节目里和乐乘一一讨论。△ 乐乘在阿里巴巴 UCAN 上介绍鹿班 一、双11的4.1亿

做过10亿次设想的人工智能「鹿班」,原来是他负责的!

这期节目我们请到了阿里巴巴智能设想实验室的负责人乐乘。这个智能设想实验室有个最著名的项目叫鲁班(现更名为鹿班),大家可以简单的把鹿班明白为一个人工智能设想师,去年这个名叫鹿班的智能设想师在双11期间为阿里绘制了4.1亿张各不相同的个性化告白图,而今年鹿班甚至开始学会设想网页了。人工智能会对设想这个行业造成怎样的影响,它会判断美丑吗?鹿班会像 AlphaGo 超越人类围棋手一样,在现在超越人类设想师的水平吗?所有这些成绩,我们会在这期节目里和乐乘一一讨论。

做过10亿次设想的人工智能「鹿班」,原来是他负责的!

△ 乐乘在阿里巴巴 UCAN 上介绍鹿班

一、双11的4.1亿个告白 banner,全都出自「他」之手

UX COFFEE:鹿班这个项目的由来是什么?

乐乘:阿里在2015年的双11第一次尝试了个性化推送,不同的用户在会场的界面中会看到不同的商品和内容。这次的转型十分成功,很大地提升了流量的分发效率。但那时的个性化推送还是很有限的,我们只能在搜索的结果,或者说推送的商品上做到个性化。2016年初,我们和算法团队就开始思考,能不能再往前迈一步,从设想的角度出发,让用户不仅看到的商品不同,而且看到的告白图也是千人千面的。我们感触这会是一个十分大的突破,所以就起步做了这个项目。

UX COFFEE:在鹿班之前,商品告白推送的设想流程是什么样的?

乐乘:在鹿班之前,靠的都是人力。比如说,我们有十张告白的轮播,大家可以去申请,然后根据业务的重要程度排优先级,批复以后再找设想师画图,到了时间点上线图片,时间过了再下线,这一切都是靠人力完成的。有了鹿班之后,就算有十几万个商品参加申请告白轮播,鹿班也可以把所有商品进行抠图、自动生成告白,然后再投放,全部过程都是由系统来实现的。

UX COFFEE:你们是怎么在阿里这么大体量的公司里自下而上推动这个项目的?

乐乘:最早发起的时候,我们只是自己感触这个想法挺靠谱的,就抽出时间尝试这个想法。我们最早是在手机淘宝的告白 banner 上做了尝试,把用机械生成的几万张图和人力生成的图片进行对比。我们发现机械生成的图片加上精准的个性化投放,能让同一位置的点击率翻一倍。有了这样直观的验证,我们就把鹿班接入了整个产品,鹿班的价值越来越高,团队也从早期三个人开始慢慢扩大。

有一个十分关键的节点,就是我们意识到如果设想的产能不能快速升级,鹿班是满足不了千人千面的海量图片需求的。所以我们当时对鹿班的定位做一次升级,我们要把鹿班从一个个性化告白的推荐系统,变成一个人工智能设想师。

UX COFFEE:你们对这个「人工智能设想师」有更详细的定义吗?

乐乘:准确地来说,现阶段我们想要做的是人工智能的平面视觉设想师。

UX COFFEE:2016年我在网上看到一个数据,之前你接受采访的时候说,阿里用鹿班设想了1.7亿个告白图。你们有没有计算过,这些告白图如果要人力来做,需要多少人力和时间?

乐乘:我们去年其实投放了4.1亿张告白图,我们大概算了一下,相当于是200个设想师不吃不喝做200年。但是话说回来,纯粹站在产能的角度去评判这件事情的意义并不大,因为机械本身擅长的就是批量生产,这并有没什么可炫耀的。我们也很少站在节省成本的角度去评价这个系统的价值。当机械做到了人做不到的事情,产生了过去产生不了的价值,打开了业务新的边界,这个才有意义。

做过10亿次设想的人工智能「鹿班」,原来是他负责的!

△ 2017年,鹿班在双11期间投放4.1亿张告白图

二、人工智能是如何进修设想的?

UX COFFEE:鹿班具体是怎么运作的呢?你们生成千人千面的告白图片的机制是什么?

乐乘:鹿班的整体架构有三个核心单元。第一就是我们从过去海量的设想稿中利用深度进修提炼出设想经验。深度进修就是从得多高维的、海量的数据中提取隐含的特征。举例来说,一张告白设想图中,有一件碎花连衣裙、花朵和蓝天的背景。这张图片是含有得多维的信息,比如背景的纹理、字体的大小、色彩的搭配、还有设想元素之间的位置关系等等。通过深度进修,我们就能把这些高维的像素图片抽象为了一个蕴含这些多维信息的量化图。通俗来说,这张量化图就是这张设想图中蕴含的设想知识。当数据量足够大时,鹿班就能总结出一个通用的设想的知识模型。

当我们总结了许多设想知识后,面对一个设想需求,鹿班要怎么去根据量化图反向生成一张像素图片呢?这就要说到第二个核心单元——行动器。举例来说,通过进修那张碎花连衣裙的告白图,再遇到类似的需求时,鹿班就会在这张设想的基础上,从一个海量的设想素材库里索引,匹配和替换其中的元素,然后经过大量的计算跟迭代,最后生成一张新的图片。这其实就是强化进修的过程,就是在一个受限的空间和范围内去不断尝试,通过内部或外部会提供的反馈,得出一个最优的结果。

第三个核心单元就是评估。因为鹿班会得到十分多的结果,需要一个评判的机制来鉴定这些结果是否符合设想的要求和标准。这个部分的进展没有前两个单元那么快,因为这是一个十分宏大的命题。我们也在和得多高校合作,研究如何让机械来评判美、丑,设想的好、坏。我们现在离让机械懂得审美这么高级的阶段还很远。我们能够做到的是制定一些规则约束。比如当一个设想明显不合理时,就可以作为一个约束条件放进去。另一方面,我们会人工给过去的设想成品进行打分,来让鹿班进修给任意一张图片打分。这个模块现在还在早期的阶段,还有很长的路要走。

UX COFFEE: 评估这个模块很有意思。你们想让机械学会审美,但是听起来我们距离这一天还很遥远,因为目前大部分判断美、丑的工作还是有人工介入的。这和 Google AlphaGo 的机械进修就很不一样,因为下围棋有一个十分特定的条件,就是获胜。但是设想这件事情并没有获胜的概念,美丑的概念是相对的,甚至是非客观的。听起来鹿班这套系统并不会设想出人还没有设想出来的东西,就是不会超出人类设想师的水平,是这样吗?

乐乘:这个成绩问得很好,我感触不能用一个是或者不是来回答。我更想分享一下我对这个事情背后的想法。还是回到和 AlphaGo 的对比来看,正是因为围棋是一个规则评判标准十分清晰的游戏,它的量化的评估方式十分确定,所以 AlphaGo Zero 才能够脱离人的输入自己进修,甚至通过进修发现人下围棋的方式能够都错了。AlphaGo Zero 的成功是这个场景的特性决定的。但是人类社会里面有多少成绩,能像围棋规则这么确定呢?其实大部分都不是。设想就是十分典型的,有着无穷无尽的计算空间,历史的进化的过程中有不同的趋势。它是个人文成绩,也是个社会成绩,而不是一个纯粹的数学成绩。当我们做到比较深的一个阶段之后,这个命题背后的复杂度和对算法技术的挑战,远比我们早期想的要复杂得多。

现阶段鹿班确实不能生成超出人类能力太远的设想来。现在的几年我们还会继续深入这个命题。现在有一天,机械有能够果然会做出我们都没有见过的设想。

做过10亿次设想的人工智能「鹿班」,原来是他负责的!

△ 人工智能进修设想 (图片来源:微信公众号「阿里巴巴UED」)

三、让商家有自己的小鹿班

UX COFFEE:在淘宝上卖货的得多品牌商家,他们对于自己的品牌形象、设想风格,应该也是有要求的,鹿班要如何去满足他们的要求呢?

乐乘:对于这个成绩,我们的解决方案就是向品牌商家开放我们的训练体系。阿里作为平台方,我们只能知道这个品牌过去做过什么设想,却没法知道他们对现在的需求,所以我们决定开放鹿班这个平台,让企业主也都能使用自己的小鹿班来做设想。

UX COFFEE:那鹿班生成的这个设想的结果如何?会不会有设想程式化的、模板化的成绩?

乐乘:其实这个模型里的多样性和确定性的参数成绩。多样性高了,机械就会产生得多新的变化,但有能够结果就会过度发散。但如果把确定性做到极致,在算法里面就有一个过拟的成绩,机械学出来东西跟原来一模一样,这就失去了进修的意义。所以我们尽量要在多样性和确定性之间有一个平衡。

UX COFFEE:你们下一步的计划和目标是什么?

乐乘:除了刚刚提到的向商家开放平台,另一方面就是内容设想。因为告白图还只是一个单张图片的设想,但平面设想师还有很大一部分的工作是在做网页、易拉宝、宣传单,这种内容复杂度高于告白图的设想。这类的设想在技术原理上其实是相通的,只是我们会更侧重对复杂内容的表达。这样鹿班能够覆盖的平面设想的工作就更广了。

UX COFFEE:那国内的路边摊告白公司能够要感受到很大的威胁。因为我以前在大学的时候就会去做得多讲座的海报、易拉宝,确实都是很模板化的,我可以想见鹿班的这套人工智能系统会更快,甚至更好地完成这些工作。我也知道阿里是一家十分重运营的公司,你们几乎每天都有运营活动,如果运营活动的页面能够全都使用人工智能来做设想的话,对公司运营的规模化也能起到很大的帮助。

做过10亿次设想的人工智能「鹿班」,原来是他负责的!

△ 阿里推出了驯鹿计划,让商家可以训练自己的鹿班

四、设想师们果然会失业吗?

UX COFFEE:如果人工智能可以做设想师的工作,那设想师以后的饭碗会不会受到威胁。你会不会思考做这件事情是不是搬石头砸自己的脚?

乐乘:这个成绩很有意思。我感触不同角色会有不同的视角看待这个产品。我作为这个项目的牵头人,我想的是如果这事能够做成,它会对设想行业有巨大的颠覆。就算有一天我果然被这个智能设想师淘汰,我也是很开心的。因为这件事即使我们不做,现在也一定会有人做。历史潮流或技术趋势对专业领域(的改变),是不以任何人的意志而改变的。

而我的设想同事,他们的态度比较中立。他们感触「鹿班想淘汰我还早得很」,鹿班还不具备设想复杂系统的能力。所以他们对鹿班是一个开放的态度。他们会感触「如果鹿班能帮我做一些我不想做的事,也不错」。

但和我们合作的外包供应商的设想师是有些心慌的。因为他们本来的工作是很容易被取代的。他们会开始想办法转型跟升级。

UX COFFEE: 人类和机械这对关系,能够是现在100年我们都会一直讨论的成绩。对于鹿班来讲,这个命题更小一些,它是人类设想师和机械设想师之间的这样一个关系。你感触人工智能设想现在会变成什么样?

乐乘:之前我听过一个很有意思的比喻——如果说真正的人工智能相当于人类登月,那现在的人工智能就只是人类爬到了树上。所以这果然是一个很宏大的命题。我们现在也只是走出了一小步。现阶段主流的算法技术是数据驱动的智能——有多少数据就有多少智能,没有数据就没有智能。但真正的设想智能,我感触他应该不是纯粹数据驱动的。像刚刚提到的审美,光靠数据能够果然搞不定。当然现在也许像神经网络这类学科会有突破性的发展,等我们果然搞清楚了人类是怎么明白、认知成绩的,到那个时候能够机械才能到「登月」的阶段吧。阿里现在也在和顶尖的研究所合作,做一些像美学评估这类面向现在的研究。

做过10亿次设想的人工智能「鹿班」,原来是他负责的!

△ 乐乘在2017年 UCAN上关于人工智能的演讲

五、人工智能离能够「思考」还有多远?

UX COFFEE: 在你看来,机械具备设想智能的下一个节点会是什么?

乐乘:如果站在数据智能的这个边界内去思考的话,我感触当数据规模到达一个临界点之后会有一次跨越。直白的说,就是当今天人类做过的设想,机械都做过,人类看过的东西,机械都看过的时候,我感触他能够就果然成为了一个大而全的数据智能机械。另一个能够的突破就是脑神经领域。如果果然能把脑神经的知识与人工智能结合,能够会带来一次比深度进修更大的革命。

UX COFFEE:你认为人类设想师和机械设想师相比,彼此的优势和劣势是什么?

乐乘:我感触人类设想师在灵感、创造、人文、社会成绩的明白是机械哪怕到了现在阶段也不一定能做到的。现在机械的一个很明确的短板是它的认知能力是有限的,它不是真正地懂得内容。比如各国的文化禁忌,你感触机械能明白吗?我感触很难。

UX COFFEE:为什么会很难?

乐乘:比如说,在欧洲某个国家黑色的猫是不吉利的,所以天猫进入那个国家的时候,不能用黑猫的形象。今天你可以用一个指令告诉人工智能你不能做什么,但是它并不是智能,像这类的文化禁忌,今天机械是不会明白这背后的文化内涵的。

UX COFFEE:它需要去明白吗?我感触 AlphaGo 给我的一个很大的冲击就是我感触它其实并没有像人类那样去明白围棋这件事情,我们对围棋总结出了得多的规则,甚至上升到了哲学高度。但机械没有,它就是自我博弈,就习得了围棋的技巧。在它眼里,没有那些哲学概念,但它依然可以下到最好。

乐乘:对,人工智能把围棋当作一个数学成绩在解,而人类把围棋当成了一种文化或者是艺术。但我也听到过一个反面观点,就是正因为今天人类没法去解这个宏大的数学成绩,所以才用文化来解释它,其实也是因为人拿它没办法。也许我们下了那么多年的围棋,可我们并没有下对。

UX COFFEE:会不会有一天我们发现我们做了这么多年的 UI 都没做对,我们对界面的明白还是太浅薄。

乐乘:对,也就说有能够机械会做出比人更懂人的一些设想出来,或者让人更喜欢的设想出来,我感触这个脑洞果然有能够。

UX COFFEE:作为人工智能设想师的设想者,你会给现在设想师什么样的建议?

乐乘:因为鹿班是从大规模的数据里抽象出的一种设想能力跟设想执行的产品,这就决定了它的上限——它的最好水平和人类的最好水平是有差距的。但是机械的下限或它最差水平却要比人类的设想要好得多。所以我判断人工智能设想会在中上游的水平,它到达不了顶尖,但是它会比得多刚入行的设想师要做的好。这能够是从设想院校刚毕业的同学必须要面临的成绩,对于他们来说,刚走出社会的第一启动阶段的压力会比前辈们要高得多,你将不能在低阶上停留太久,自己的设想执行力要赶紧补上。对于高阶的设想师,我倒感触不用担心,因为如果你知道它的原理,你就会知道哪些东西是可以给机械干的,哪些东西要自己专注去干,我感触现在高级设想师永远是稀缺的。

参考链接

鹿班官网:https://luban.aliyun.com
Alpha Go: https://deepmind.com/research/alphago/

给TA打赏
共{{data.count}}人
人已打赏
应用

如何抓住AI 领域的高薪机会?阿里设想师总结了这份进阶手册!

2018-9-16 21:35:29

应用

Adobe新增逆天黑科技,90%的安排都看哭了…

2018-10-26 23:25:43

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索