被google收买后,我终于知道为什么大模型竞争落后于OpenAI了

机器之能报道编辑:sia俨然一部寒门生存指南。2018 年 3 月,一家科技教育始创 Socratic 被google收买。当时这家仅 10 人的小公司打造了一款家庭作业助手(也被国内媒体称为海外「作业帮」)——学生拍下家庭作业的题目,助手就能帮助解答。除了数学,Socratic 还可以办理科学、文学、社会研讨等学科的题目。「一入寒门深似海」,成为google旗下一款产物后,Socratic 历经了一系列变化,并以google的方式重建自身。如今,Socratic 在寒门争斗中活了下来,每年处理大约 50 亿次查询,但距离创业团队愿景中的

机器之能报道

编辑:sia

俨然一部寒门生存指南。

2018 年 3 月,一家科技教育始创 Socratic 被google收买。当时这家仅 10 人的小公司打造了一款家庭作业助手(也被国内媒体称为海外「作业帮」)——学生拍下家庭作业的题目,助手就能帮助解答。除了数学,Socratic 还可以办理科学、文学、社会研讨等学科的题目。

「一入寒门深似海」,成为google旗下一款产物后,Socratic 历经了一系列变化,并以google的方式重建自身。如今,Socratic 在寒门争斗中活了下来,每年处理大约 50 亿次查询,但距离创业团队愿景中的 AI 导师还很远。两位创始人也相继离开google。

最近,Socratic 创始人之一 Shryans Bhansali 在一篇博客中回顾了这段「寒门岁月」。「提供了一个罕见窥见google内部运作的视角,也解释了尽管大多数基础技术都起源于google,为什么领导 LLM 革命的却是 OpenAI 。」英伟达 AI 科学家 Jim Fan 在推文上转发了这篇文章并评论说。

被google收买后,我终于知道为什么大模型竞争落后于OpenAI了

其实更早之前,被google收买的 Nest 创始人 Tony Fadell 为宣传新书接受媒体专访时就谈到过google的大公司病。他指出「恋爱和婚姻是两码事」,google正在扼杀创新。比如,强势业务对创新的影响。广告业务收入就像印钞机,以至于他们更多的从财务角度看待创新( 谁会积极推进蚕食搜寻份额的创新?),而不是出自一种生死攸关的紧迫感。公司福利文化也导致很难做到以客户为中心,造就伟大作品。「(我)看不到团队合作,没有看到人们试图改善公司。他们在互相改进,改进自己,但在当时这些不一定是在为客户做正确的事。」不过,就像 Jim Fan 所言,「责怪任何人都不公平。官僚主义是google规模的公司的自然产物。10 年后,如果 OpenAI 和 Anthropic 增长到这个数量级,能够也会遭受同样的痛苦。」许多收买以失败告终,有抱负的人相继离开google。但对于还在或者想要进入寒门的人来说,有所作为仍然有迹可循,尽管要为此付出巨大的努力,Socratic 活了下来并且有所壮大就是一个例证。

以下是这篇博文全文,我们做了不变更原意的编译。

被google收买后,我终于知道为什么大模型竞争落后于OpenAI了

google应用商店里的 Socratic 产物介绍

2017 年, Socrates 开始 B 轮融资时,我们很快意识到通过牺牲收入来获取用户的做法会造成很多负面影响。成功迈出了第一步,但每个风投都要我们制定盈利计划,制定计划过程中我们创造,用户群是没有信用卡的高中生的应用做不成大生意。

大约在同一时间,我们被介绍给 Snapchat CEO Evan Spiegel。他建议大家合作,将作业助手整合到他们的应用程序中。但我们的一位顾问认为,如果他把你介绍给他们的企业发展主管,最终能够会建议收买,如果是这样,我们应该引入竞争。于是,我们联系了微软、Chegg、Byju’s 还有google。

另一位联合创始人 Chris Pedregal 曾在google处事过,他和以前经理取得了联系并从对方那里知道google的一款摄像头应用 Lens。不过,当时我们并不知道这位前经理已经和可汗学院和安卓联合创始人一同创业,也是面向教育领域。见面后,大家创造彼此对 AI 导师的前景都很看好。这或许也帮助我们赢得google 2017 年「最佳应用」,那次会面后不久,我们启动相关过程,google在 2018 年 3 月收买了 Socrates。

我们与一个同样规模团队合并,该团队由多位长期供职的google员工组成。Chris 和我成为了产物和工程负责人,任务是打造一个 AI 导师并把它带到google最大的产物中。

接下来的三年里,我们重建 Socratic,并以「Socratic by  google」的名字重新颁布了它——搜寻、Lens 都具备 Socratic 功能,我们还颁布了一个数学求解器,并原型化了一个数学导师,并把这些能力带到更多产物中。

这一路上,我也学到了一些东西:

在google处事如同怀揣第二本护照:去世界上任何一个大城市,凭借徽章(google徽章有些分级意味。白色徽章适用于全职员工。实习生佩戴绿色徽章。红色徽章适用于临时工、供应商和承包商。不同徽章的福利和访问权限不同——译者注)都可以解锁一间漂亮的办公室,里面有美味的食物、办公桌,还能高速连接google 20 多万人中的每一个。

令人惊讶的是,你可以立即接触到他们庞大的 monorepo,其中包含几乎所有产物的数十亿行代码;覆盖全球的数据中心的实时状态;横跨二十年的战略文件还有一些传奇人物(比如 Jeff Dean)。

google用google的方式做事。google使用的所有软件和基础设施几乎都是自己建造的,这也是因为他们比大多数公司更早面临艰巨的工程挑战。

身处google这座巨大堡垒,外部世界变得不再存在,只有少数外部世界的东西被允许进入堡垒,而且还得小心翼翼。

这意味着我们没有机会保留现有的代码库,要从头开始,与新团队重新创造产物,再在google堆栈上重建它。我们已经办理的题目,比如利用机器学习系统对作业主题进行分类,必须使用搜寻技术和标准来办理。不用说,这些标准比我们的要高。

我们能够打破google模式的一个地方是应用的吉祥物「 Ceebo 」。google的应用程序图标包含四种颜色和简单形状。这种设计对他们有用,但对我们来说,很无聊。可是我们太小了,无足轻重,他们施压,我们反击直到最后获胜。

图标继续沿用 Ceebo ,如今它在google中已经有了几十个变体,也会在google文档和网站中突然闪现。

被google收买后,我终于知道为什么大模型竞争落后于OpenAI了携带google家族基因的图标

被google收买后,我终于知道为什么大模型竞争落后于OpenAI了「Ceebo」看起来确实「血统不纯」

简单的事件重复做,很神奇。与搜寻老手一起重新构建我们的查询分类系统,也让我们有机会窥视如何构建搜寻。一方面,信息检索工具的深度难以置信,计算并在互联网上的每个页面添加新信号的能力也令人难以置信。

另一方面,我们创造大多数搜寻改进都是由工程师通过「并排」比较新旧结果来手动检查的……而且,是在电子表格上!

人们能够预期的是google工程主要由实现博士水平的算法组成,有时这是真的,但搜寻或 AI 工程师的大部分处事包括查看示例,创造模式,手动标记数据以及其他不可扩展、非常琐碎的分析。这大概就是世界顶尖 AI 团队的真实情况。

我注意到一个模式,优秀的AI研讨人员愿意手工检查大量数据。更重要的是,他们建立了基础设施,使他们能够快速手动检查数据。尽管并不光鲜亮丽,但手工检查数据可以让我们对题目产生很有价值的直觉。

OpenAI研讨人员 JasonWei

大多数题目都不值得你浪费时间,但令人惊讶的题目却值得。大多数牵涉 1000 万到 5000 万用户的题目不值得google花时间,也不适合他们的策略。但他们会花大量精力办理那些符合他们天性、策略和某人晋升方向的题目。

比如,Socratic 界面的重要组成部分是计算机视觉,因为需要靠它来拍照、识别图像里的文本。作为一家始创,我们采用了第三方工具,结果创造要在google中继续使用它太难了——从暴露敏感数据到复杂的供应商审核过程。有时,直接收买一家公司把它们的技术带进来反而更容易。在我们这个案例中,正好有一个 AI 研讨团队对这个题目感兴趣,就雇了一个顶尖博士人才来研讨,并在 6 个月内提供了一个世界级的数学题目识别 API。

当然,如果你读过 Steve Yegge(程序员,曾在亚马逊和google处事——译者注)那篇比较google和亚马逊平台的经典博文,就会知道这种世界级服务还没有被google外部化。

google是一个不断变化的方向和努力的网络。令人惊奇的事件也不是不能够发生,如果有合适的人物关心这个题目。比如一个能理解它的副总裁、一个有相关章程的研讨团队,或者它与组织方向兼容。产物经理一半的处事都是在驾驭这些错综复杂的关系,然后你还要得到诸如隐私、信任、安全和基础设施容量等批准方的认可。要想知道一个想法是否可行,需要进行几十次对话,而要把它变成现实,需要进行数百次对话。

这是一条幸福之路,如果有合适的人持续关注,神奇的事件还是能够的。团队方向可以在任何特定季度发生变化,整个团队能够会在「重组」面前消失,这种现象非常普遍,以至于google员工可以透过悲剧看到喜剧。

即使躲过这些暗箭,你还有能够创造自己和一个相距遥远的团队「撞车」,对方也在做同样的事,是时候进行斗争了,因为只有一个团队可以继续。丢失项目的内部用户会创造,他们所依赖的 API 现在已经被「弃用」,但是替代品还没有完全准备好。

google人想要颁布伟大作品,但往往做不到。毫无疑问,有些人来这里是为了吃,每天处事 3 小时,提前享受退休生活,但我遇到的所有人都是认真努力处事,想要把处事做好。

打败他们的是检查、频繁的重组、过去失败留下的制度性伤疤,还有一个世界级平台把简单的事件也搞复杂了。始创公司可以忽略很多题目,但google人很少能做到这些。

阻碍我们前进的还有员工本身——那些聪明的人可以反对任何事件,却不支持任何事件;缺乏勇气说出令人不安的真相的领导;还有那些被聘用时没有明确处事计划,必须通过捏造处事留下的人。

头重脚轻,不好驾驭。另一个阻碍进步的因素是顶级团队导致的失衡(头重脚轻)。拥有多名成功的联合创始人和 10-20 年从业经验的团队,听起来能够是创造伟大事物的秘诀,但也能够导致僵局。

如果是在多个探索领域,方向清晰,需要强大的自主权力去试错抵到方向的不同路径,这种结构能够适合。但如果是做一个统一的产物,它要的是一个明确的领导者、方向还有一群实干家而不是思想家。与直觉相反,项目早期阶段增加过多的人并不会让进度变得更快。

技术债真实存在。繁冗过程债也存在。工程师们习惯于谈论技术债:今天为了节省时间颁布一个功能而削减一个角落,等于欠下一笔债,要么及时还,要么就等着这笔债越滚越大。优秀的团队通常会闷声清理这些题目,偿还欠债。

但是,繁冗过程导致的债务也真实存在。因为颁布瑕疵而增加一道检查关口、为了防止法律争议又增设一道法律检查,层层积累,准备好的新功能被卡在过程中,几个月后都无法颁布,生死未卜。

在一些罕见情况下,过程才会被压缩——google最近改变了他们繁重的绩效评估程序,比如从一年两次改为一次,从一份长问卷改为一份短问卷。

有时,变化迫于外部竞争,有时压力也会加速公司衰落。google发明了 ChatGPT 背后的技术,但并不是颁布该产物的人。现在,它必须办理一对日益紧张的关系:一边是想要夺回google AI 领先地位的建造者,另一头是想要防范对所有能够出现麻烦的检查者。

在google,如果你玩对了游戏,神奇的事件就有能够发生。google曾经有一套内部价值观,他们称之为「三尊重」:尊重用户,尊重彼此,尊重机会。前两个比较容易理解,但第三个让大多数人感到困惑。我的理解是:你在google,一个利润丰厚、人才济济的企业。收入丰厚,吃得好,生活在硅谷天堂。有了这么好的运气,你能做的最好的事件是什么?

我对这个题目的回答与  Richard Hamming 在《你和你的研讨》(Richard Hamming 是著名美国计算机学家,图灵奖得主,这是他二十多年前在贝尔通信研讨中心给200多名科学家们做的一次演讲。——译者注)中所说的相呼应——你必须找到所在领域中最重要的题目,然后想尽办法办理它。

这意味着首先要做好交给你的处事。一旦尽在掌握,就可以借由google网络去了解正被计划或者研发的事物,从中整合出你对未来的一个判断,并用文档、 demo 等方式将它清晰展示出来,找到与你的愿景契合的领导,持之以恒地「兜售」它。

我在某种程度上做到了这点。我最喜欢的例子之一就是我们花了三个月在新的数学求解器上做了一个 AI 数学导师的 demo,它可以循序渐进地讲解数学。这个 demo 具象化了我们的 AI 导师愿景——它会有一个链接,可以使用,可以共享。它以对话为基础,为用户提供一些反馈,然后获得「生命」,被用户传递、讨论并最终构成闭环。

同时,我也看到了题目。一位领导清楚地看到了我们的发展方向,让设计师做出了很棒的 demo 并随时与我们分享。但他被困在一个错误的部门,而他的老板将方向指向了别处。最终,他转投了一支更和谐的团队,现在他的梦想有机会成为现实。

许多收买都以失败告终。Socratic 的故事是复杂的。一方面,我们成功融合了两种截然不同的文化,我们的产物活了下来,每年处理大约 50 亿次查询,而且整个 Socratic 团队的职业生涯也有了发展。

另一方面, Chris 和我都离开google去创业了,而且无论是 Socratic 团队还是google,都还没有生产出一个配得上google能力的 AI 导师。但一些苏格拉底式的google人能够会实现这一方向,除非他们进行重组。

参考链接

https://shreyans.org/google

给TA打赏
共{{data.count}}人
人已打赏
应用

Copilot 在吞噬世界,与 ChatGPT 一起

2023-11-16 21:45:00

应用

OpenAI CEO:GPT-5在开发中,拟进一步向微软寻求资金支持

2023-11-16 21:51:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索