亚马逊资深首席科学家李沐:工作这五年

自CMU机器学习博士毕业至今,亚马逊资深首席科学家李沐的业界之路已经走过了五年时光。期间,李沐博士对技能、产物、管理、升职加薪等工作中的方方面面都有了更深的感悟。「专一于最有代价的事件」是他对过往五年工作历程的最好总结。

五年前的今天我飞往西雅图参加亚马逊的面试。面试完后连夜做红眼航班飞往波士顿赶去参加老婆在 MIT 的博士答辩。答辩一半的时候电话响了,对方说恭喜你面试通过,想聊下薪水。我说其实就面了你们一家,直接给就是,先挂了。

答辩完第二天跟老婆去市政局登记结婚。在宣誓厅门口排队的时候,老板打电话过来,很兴奋的说你来了后可以做这个做那个。我说是挺好的,但先要结婚去了。老板一愣,道了一声恭喜,继续往下说。我不得不打断:得先走了,轮到我们进去宣誓了。

五年一眨眼就过去了。外面来看最大的变化是多了两个娃。但最大的变化来自认知,是人生观、世界观、代价观的改变。博士毕业的时候曾写过我的体会博士这五年。

博士这五年:https://zhuanlan.zhihu.com/p/25099638

很多同学留言说深受鼓舞。现在我想同样给大伙儿分享这五年工作中的经验和感悟。更确切说是失败的教训,因为每一点就是付出了学费后获得的教训。希望这些同样能对大伙儿有所扶助和启发。

事件的代价是对社会的代价

读书的时候,你会有明确的目标,例如考试的分数、深造的学校、或找到好工作。工作后的最大分歧是你有太多可以最求的目标。这个带来的改变是你必要决定哪些事件现在做,哪些以后做,哪些可以不去做。

决定优先级应该是根据事件的代价。我现在评估一件事的代价是它对社会的代价,用公式来写就是 

得益人数 x 人均时光 x 单位时光代价差

这里能从一件事件得益的人数,和得益的人均时光是这件事本身属性。第三项取决于你对这件事完成的好坏,就是你做得比他人做的类似的事件要好,从而得益人从你这里得益比从他人那里多。

这个公式可以用在各种分歧的事件上,接下来我们会不断使用它。这里先举几个例子。例如伟大的产物一般具有极高的代价。拿微信来说,它是手机通讯软件,面向几十亿手机用户,每人每天会使用数小时,所以它代价的前两项非常大。因为微信用户体验很好,它比其它替代品的用户体验好给用户带来的代价就是代价差。所以微信是一个非常有代价的产物。

举个小点的例子,例如你带人写一篇论文。论文影响的人数就是这个研究领域的大小;作用时光是他人做一个跟你工作相关的研究所花的时光,能够一辈子就几个月;代价差则是你的研究相在前人工作之上的进献。这样看来,你必要做热门领域和跨时代论文才能取到高代价。但我们知道一篇论文一般进献不大、也就几个人会读,所以算下来基本没什么代价,为什么大伙儿还是会积极 “灌水” 呢?

这里我们还要细看两个代价:一是你通过这个研究熟悉了一个新领域或者新方法,对你个人有学习代价。二是你带人做研究能晋升他们在想方法、做实验、和写论文上能力,对他们代价很大。所以即使是知名研究者,名字也会出现在很多新手习作一样的论文上面。

再举一个更小的例子。过去四年里我花在带娃上的时光比工作多。在相当一段时光内都觉得事业被娃耽搁了。直到后来我用这个公式来算:虽然人数只是两个人,但得益时光相当高,一周五十小时以上。而且父亲就一个,有我陪和没我陪对小孩来说区别巨大(自我感觉),所以代价公式的后两项很高。此外,带娃对我个人也有代价,包括如何去理解思维方式完全不一样的他人,以及时刻跟自己想暴怒的冲动做斗争,最终达到佛性的状态。这样算下来心里就顺了

服务社会最后也是服务自己

上面这个代价公式强调的是事件对他人的进献。在用它之前,我的代价公式更关注自己。例如我常用一件事件的好玩程度,或者里面的技能含量来划分优先度。问题是虽然享受做事件这个过程,但之后的成就感不高。有点类似打完游戏后的空虚。因为做完后经常发现,这个虽然酷炫但没什么用,没多少人理睬。原因是对个人的有直接高代价的事件,对他人代价不一定大。很有能够这件事件本身只对很小群人有意义,能够每个人得益时光短,或者其实是重复造轮子,市面上已经有了差不多的替代品。

如果优化对社会的代价,你会得到对自己的延后回报。这个回报包括了你知道做这个事件对他人有用时带来的更高层次的内心满足,以及他人从你这里得益时给与的馈赠(给你点赞、或者老板给你升职加薪)。当然,这两者不一定同时出现。很多时候你创造的代价不一定被他人关注(数十年维护那些大伙儿用起来习以为常的开源工具包),也有时候大伙儿会夸大吹捧你的进献。你应该积极寻求他人的肯定,这会给你更多的资本做更大事件。但你应该更关怀内心的满足,因为更可控、不容易别他人误导。更多是它会给你内在动力去把事件做得更好,这是你能不断成长的根基。

技能最终是为产物服务

技能专业的同学刚进入公司平日会继续做技能。刚毕业那会儿我觉得进入大公司就是做技能,成为世界上最好的技能专家之一。而且不要做产物,因为如果做产物的话我为什么不自己创业呢,赚的钱还是自己的。后半句没什么问题,但前半句忽略了技能最终是为产物服务这一事实。虽然因为公司的分歧,对技能进入产物的预期时光会分歧,但平日在半年到五年之间。预期是超过五年的公司屈指可数,而且大多已经作古。所以就算你在公司的研究部门,也应该知道公司对于技能落地时光的预期。否则时光一到就会面临公司削减不达预期的技能的投资。最坏情况是你们上新闻了:某某公司研究院院长离职,部门成员各奔东西。

那么什么样的技能能进产物?平日你会根据公司现有的产物有个大致的想法。接下来你要知道这个产物的主要代价是什么(套用之前的公式)。然后你必要去琢磨你做的技能对这个产物的代价。如果你的技能能晋升产物的核心功能,哪怕是一点点,也会得到资本来落地技能。例如晋升微信的视频压缩技能、今日头条的推荐算法、苹果的外壳材料。反过来,如果没有抓住主干,例如微信装皮肤、今日头条网页版加速,苹果操作系统兼容其他硬件。就算你可以做到比现有技能晋升很多,产物团队也能够没动力帮你,甚至一开始就告诉你别做这个。

所以不管你是在产物团队做技能,还是在公司研究院,都应该对产物的代价有所了解。例如深入理解产物经理的口头禅:市场、刚需、痛点、高频。同时也应该知道你手上的技能对产物的代价,用它来指导你对技能路线的规划。

不想当将军的士兵不是好士兵

人的满足感来自于对比,不管是对比他人还是对比自己过去。这个欲望驱动你去追求有更大代价的事件。这意味着你必要更多资本去做大做强。最起码的是你必要一个团队。你能够是这个团队的管理者、领导者、或者兼任两者。

也许你更喜欢一个人做技能,至少我一开始是这么想的。但随着你的能力的增长,他人对你的责任的期望也越大,你不可避免得去带一个团队。否则你得去其他地方找满足感。与其别动的被推到了这个位置,不如一开始就做好准备。

这里有大量的职场书籍可以参考。我自己的经验很简单:领导者是带路者,必要有好眼光。管理者是后勤官,让团队执行高效。下面分别解释这两点。

放眼在三年以后

领导者最重要的是在带着团队探索未知领域时找出正确的方向。也就是说保证你们做的产物或技能是有代价的。因为做一件事必要时光,所以你得预判事件在未来的代价。如果判断不准,大伙儿辛苦做了很久,做完后发现效果一般,那么团队士气就会低下。各种问题就会接踵而来。

你去想一件事件未来的代价时,时光不要太短也不要太长,三年比较合适。假设你想继续沿着现在的方向走,那么必要考虑三年后你关注的用户群和使用时光是不是会发生变化。变多是好事,不变表示你做不了太大,但如果会变少,你得考虑要转向了。你还必要警惕新技能的出现,很能够新的技能会短短几年就完全推翻旧技能(深度学习、智能手机、电动车)。分析那些失败的例子,当事人其实很早就察觉到了新技能,但低估了它的能量。他们只看到了新技能比现有成熟技能的不足,然后套用成熟技能的发展速度在新技能上,低估了三年后新技能能到达的高度,和用户喜新厌旧的程度。

如果你要做一个新的方向,那你能够不再有技能积累优势,就是跟他人比你给用户带来的代价差能够不明显,甚至更低。那么你必要找到好赛道(投资人口头禅),平日是颠覆性的新技能,以及随之带来产物和用户的变化。只有在快速变化的赛道上,新入局者才更容易通过更准确的预测未来的代价来弯道超车。也就是乱世出英雄。

好的眼光必要一个长期的训练。你必要不断的去做深入思考,获得自己独特的观点,而不是靠朋友圈里大伙儿的高见。所以你必要时不时放下手头的事件,给自己空出时光做深入思考。例如我会时不时去家附近的 Bay Trail 走上几个小时,边走边想。

亚马逊资深首席科学家李沐:工作这五年

管理的核心是诚心待人

如果你有一个明确的团队目标,和一个高质量的团队,高效执行是水到渠成的事件。所以管理者有三个核心事件:招人、留住厉害的成员、和扶助落后的。招人最理想是招比自己厉害的人。另外是每次招的人都比同级别的一半人厉害,这样能保证团队扩张时能不断晋升团队质量。

能力突出的成员在哪里都会受欢迎。你的一个任务是让他们能尽能够长的留在团队里(虽然最终是要走的)。一个办法是把自己放在他们的位置,想象你想你的领导如何待你。例如我自己最希望的是不断做有更大代价的事件(成就感),并从中学到新东西(个人晋升)。在我困难时候老板能给与支持(经常发生)。其他的都可以换算成当前待遇,例如可以多少时光做不喜欢的事件(不赞同一件事的代价,但又没能说服他人不做)、上下班路上很堵、食堂没中餐。所以大方向上是创造轻松的环境、每年能新立项有代价的项目、和尽量给大伙儿争取待遇。

对于绩效不理想的队员,你必要经常性的指出问题并给予建议,如果一段时光没改进则必要讨论是不是当前项目不合适。如果仍然无进展的话,那只能扶助他们换组,或者要求他们离开。同样,你必要把自己代入对方的位置,明白想得到什么样的扶助和尊重。绝大部分时候,不是他们人不行,只是你们不合适。愉快的分手能让前成员更快的找到更合适的地位(从而避免他们给你寄刀片)。

专一!专一!

有人说创业公司一个常见死因是在有了一定成绩后盲目扩张。这个在哪里都成立。不管你是一个人,带一个团队,还是领导一家公司,资本总是有限。集中资本在最有代价的事件才能保证成功。例如苹果好几十万人,但对于产物线的扩张上非常谨慎。从而能保证每一款产物都砸上足够多资本来颠覆市场。在初期你也许可以广撒网多捕鱼,一旦事件的代价慢慢清晰,我们必要逐步集中资本。因为同时把做几件类似的事件最好,不如只把一件事件做到极致、做到市面上最好。这样你总是可以得到正的代价差。一个第一比十个第二好,第三平日都活不长。同样的道理也可以用在生活、社交、和学习上。

只要投入力气,短板可以变成优势 

以前每次发布 MXNet 的新特性时,知乎同学都是吐槽:回去写好文档先。大伙儿都知道程序员不喜欢写文档。我从小语文和英语都是在及格线徘徊,更是心有抵触。17 年的时候痛下决心来写文档,我把我所有留下做技能的时光都花在上面,最后跟大伙儿一起写出了《动手学深度学习》这本教科书,现在被全世界近 200 所大学采用做教材。所以,你的不足能成为你的机会。只要你直面它,狠下心来花力气,不断去改进,你的短板会变成优势。

扬长避短

所有命运的馈赠,都在暗中标好了价格。当我把精力都花在文档上时,便忽略了 MXNet 本身。没能组织投入大量资本去持续晋升它的性能和易用性,导致它没能做到前二。从代价上来说,《动手学深度学习》和 MXNet 在用户数和用户代价上差不多,但用户使用深度学习框架时光多于读教材,所以 MXNet 代价更大。在不擅长的领域花费了大力气打赢一仗,但在优势领域失去了代价更大一个,很难说是划得来。所以,在扬长和补短上面,一定是要根据代价来判断,而不是面子。

分布式系统里通讯开销才是大头

当一台机器算力不够时,我们用多台机器协同工作来共同完成任务。虽然分布式系统是很多家互联网公司的基础架构,但晋升性能仍然是很难。因为每台机器实际算力会有分歧,时不时还会罢工。而且一台完成自己的小任务时,经常必要等其他机器任务的结果,导致频繁数据通讯和等待。所以大伙儿都知道晋升性能的关键是减少通讯开销。

当你必要一个大团队来协同做一件事时,同样通讯开销是大头,优化起来比分布式系统能难,因为人的差异性和不稳定性比机器大多了。人的能力分歧,做事效率分歧。每个人分工的分歧,导致做事方式也不样,甚至优化的目标都不一样。大部分人只关怀自己的事件,不想也不愿操心他人的事件。如果不能有效把所有人拧在一起,就是一盘散沙,做不成大事。如果你刚进职场,最关键的一点是你必要意识到:你必要预留足够多的时光和精力来沟通。不要抱怨这是你们公司的制度问题,这是大团队作战时的固有现象。

升职

我因为运气不错升到了一个比较高的地位,从而有机会经常参加公司的从高级工程师、科学家到总监的升职评定。虽然公司、地位、级别分歧带来差异性,但总体来说,一个人能否升职成功取决于她做的最大项目对公司的代价是不是达到这个地位的要求。这里有三个要点:一是项目对公司的代价。意味着针对的人群和代价差都是公司关怀的,而不是你个人或者社会关怀的。这里代价平日就是给公司赚了多少钱,或者 3-5 年后能够会赚多少钱。二是看的是你最大的项目要够 “档次”。累积很多项目,想通过不看功劳看苦劳升职能够是行不通的。三是你在项目中的进献,例如你负责多大一块,是进献了代码、团队协调、宣传、制定计划、还是申请到了资本。一个常见误解是跟人合作会降低我的进献。如果你和合作者配合不好,导致 1+1 远小于 2,那么你的进献确实降低了。但如果通过合作把项目代价做大了,那么你分到的进献是不会少的。特别是如果项目代价上了一个档次,那就更好了。

升职有一个经常被忽略的“潜规则” 是影响力。随着地位的升高,公司对你的影响力的期望也越高。从能影响一个小团队,包括制定技能路线、扶助队员上手、解答疑惑、甚至是扶助他人来完成工作,到影响隔壁组(经理),影响隔壁部门(高级经理),影响隔壁集团(总监),最后到影响整个公司战略(副总裁)。

除非你是天生的领导者,不然你得花力气去培养自己的影响力。简单来说是在管好自己的事件外,积极的去扶助他人。当他人信你、咨询你意见、愿意找你合作时,那你就有了对他们的影响力。你能够会觉得帮他人会耽误自己的活。但从公司角度来看,是必要鼓励这种奉献精神,而且要予以奖励。此外,你从中赢下的信任给你带来名声和人脉,长远来看是很有用的。

加薪

大公司里薪酬相对透明,每个级别对应的薪酬平日可以在网上找到。一个级别内薪酬有浮动,一般有个最小值和最大值。80% 在中值附近,两头各 10%,分别是刚升到这个级别的人和快要到下一个级别的人。可以简单的认为,随着能力的晋升,你的薪酬会从最小值逐步跳到最大值,然后升职到下一个级别对应的区间。

分歧级别的薪酬中值平日是个等比序列,而不是等差。例如比你高一级的人能够工资比你多一半,但高三级的人不是比你多 150%,而是多 238%。在这个模型里,你必要优化你的五年后,或者十年后能到达的高度。所以在比较 offer 时,你不要太关怀它们之间的数字差价,而是关怀去你去了之后的发展(你说我现在多拿点去买币,说不定马上就财富自由了,那也是一个思路🤣)。

总结:专一于最有代价的事件

如果把这五年的感悟精炼成一句话的话,会是很平淡的一句:专一于最有代价的事件。首先,你必要对代价有清晰的认识。接着,对一件事件,不仅是要认识当下的代价,更多的是对未来代价的预测。其次,当你通过不断的快速试错对未来有了把握的时候,你必要逐步的把你能调用的资本专一到最有代价的那一件事件上,尽你能够的做好。如果一生中能做好几件有着极大代价的事,那也就值了。写此文的时候惊闻袁隆平老师逝世。谨以此文纪念他伟大的一生:专一于杂交水稻,创造了人类历史上最伟大的代价之一。我辈楷模。

知乎原文链接:https://www.zhihu.com/people/mli65

给TA打赏
共{{data.count}}人
人已打赏
AI

鉴于会话保举体系最新长文综述,163篇参考文献,已被ACM Computing Surveys接收

2021-5-23 12:37:00

AI

姚班、智班之后,清华建立量子信息班,网友:简称「期(QI)班」?

2021-5-25 14:42:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索