在 AI 最火热的时候,AI 大牛田渊栋写了本小说《破晓之钟》

“在 AI 最火热的时候,我写了本小说。”这话不是别人说的,这话是 AI 大牛田渊栋说的。这个名字可能不彰显于大众媒体,但在计算机和 AI 领域,几乎是判别式一样的存在。至少在华人科学家面孔中,盘点谷歌无人车时绕不过他,盘点围棋 AI 时绕不过他,梳理巨头 Meta 的 AI 人才时也遗漏不了他。田渊栋现在是 Meta AI Research(FAIR)研究科学家总监,正在带队研究,如何让 AI 在推理和规划问题上,产生现有的大模型产生不了的能力。他是上海交大校友,在计算机系获得了本科和硕士学位,其后又进一步到了

“在 AI 最火热的时候,我写了本小说。”

这话不是别人说的,这话是 AI 大牛田渊栋说的。这个名字可能不彰显于大众媒体,但在计算机和 AI 领域,几乎是判别式一样的存在。

至少在华人科学家面孔中,盘点谷歌无人车时绕不过他,盘点围棋 AI 时绕不过他,梳理巨头 Meta 的 AI 人才时也遗漏不了他。

田渊栋现在是 Meta AI Research(FAIR)研究科学家总监,正在带队研究,如何让 AI 在推理和规划问题上,产生现有的大模型产生不了的能力。

在 AI 最火热的时候,AI 大牛田渊栋写了本小说《破晓之钟》

他是上海交大校友,在计算机系获得了本科和硕士学位,其后又进一步到了 AI 重镇卡内基梅隆大学(CMU)获得了机器人研究所的博士学位。

2013 年博士毕业后,他就加入到了谷歌无人汽车项目组,是最早一批投身无人车的中国面孔,但在后来自动驾驶风口热潮中,他选择了离开,加入了 Facebook(现 Meta),在 AI 三巨头之一的 Yann LeCun 掌舵的 FAIR 担任研究员,带队在深度学习、强化学习等基础理论和应用方向攻坚。

自动驾驶的长尾场景问题,让他意识到需要有更本质的研究需要展开。

在 DeepMind 秘密推进围棋 AI 研究时,田渊栋同样以围棋 AI 研究而知名,并且一度被扎克伯格对外剧透过,后来 AlphaGo 横空出世后,田渊栋又进一步基于 AlphaGo Zero 和 AlphaZero 算法完成开源复现成果 ELF OpenGo,而且仅依靠单 GPU 进行搜索就能战胜一众韩国棋院的专业棋手,包括目前世界排名第一的申真谞。

在学术领域,田渊栋不仅多篇论文入选 ICML、NeurIPS、ICLR、AAAI、SIGCOMM 等全球顶会,担任相关领域的审稿人和主席。

还曾以一作身份荣获 2021 年国际机器学习大会(ICML)的杰出论文荣誉提名,及 2013 年国际计算机视觉大会(ICCV)的马尔奖提名。最近的一些高引用大模型长文推理及训练的科研工作中也有他的关键贡献。

在 AI 最火热的时候,AI 大牛田渊栋写了本小说《破晓之钟》

作为 AI 领域的研究者,特别还是领域中的杰出科学家,身处这个时代,很难不与火热风口一次次结缘。

自动驾驶是,围棋 AI 是,甚至现如今的大模型,田渊栋也有机会直接跳进风口和“火热”中。然而追逐最火的方向,并非他的目标,他的终极研究目标是理解神经网络模型的工作原理。

更直白来说就是打开 AI 黑箱 —— 在 Scaling law 被不断颂扬的当前,这显得“人间清醒”,也显得“特立独行”

用他的话来说,要做一个“独一无二”的人。

这样的一个人,会写出一本什么样的小说呢?

写了一本怎样的小说?

一本名叫《破晓之钟》的科幻小说。

更准确来说,科学科幻小说,甚至可以视为对 AI、智能体、数字人、元宇宙、基因、纳米机器人等最前沿的技术的大型科普

《破晓之钟》讲述了一个《三体》相似大背景的故事,讲述了以几个初出茅庐的科学家们为主角,如何面对来自外太空的挑战,如何处理人类危机的故事。

但区别于《三体》,《破晓之钟》讲述的技术背景,离我们当前所处的时代更近,甚至都是我们这几年人人都在谈论、全球火热的技术风口。

一个有着数亿人口 24 小时沉浸其中的元宇宙,将如何改变人类的日常生活和处事观念?纳米机器人又会对整个地球产生什么样的影响?面对远超自身的文明,人类社会会有什么样的走向?如果真存在全方位超过人类的智能,‘它’会以什么样的形态出现,对待人类有着什么样的态度?人类的存在意义是什么?

更重要的是,如果我们已经恍惚听见了第四次工业革命的号角,模糊望见了科技发展的全新轨迹,那我们是否会对地外文明来到地球的目的和意义,有一个与经典科幻的套路完全不同的解构和判断呢?

科学家田渊栋通过小说,完成了深入浅出的科普和描述。同时,他也展示出了戏剧性结构和细腻文笔的那一面,在长达 30 万字的小说中,跌宕起伏、惊心动魄,光通过文字就能让人身临其境,感同身受。

对于这本刚上市的小说,不少看完的圈外读者,感叹科幻领域竟然藏着这样一位低调新星,作品一鸣惊人。

而对作者稍有了解的 AI 圈内人,又都感叹一个“理工博士”,竟然还能在写作上有如此水平的一手,一度让人忘了他本身是 AI 科学家

最关键的是,因为田渊栋本身的科研背景、科学素养、技术视野水平,即便是一本科幻小说,但这些技术被很好地控制在科学规律之下,是畅想,但没有妄想。或许在不远的将来,这些技术还会在现实中落地和实现。

在 AI 最火热的时候,AI 大牛田渊栋写了本小说《破晓之钟》

虽然小说探讨的主题很深刻,然而作者的初心,却是非常朴实的。

田渊栋说,写小说只是为了不浪费突然冒出的奇思妙想,也能帮助自己对世界作进一步的思考。

“坚实且有用的想法拿来做论文,有趣又不着边际的想法可以拿来写小说。“

“技术人往往喜欢钻进手头的问题里埋头苦干,却不一定记得抬头望远;乐于挑战恒常不变的自然界,却对与周围人的交流提不起兴趣。写小说可以令我去关注遥远的将来,同时思考人与人之间的关系,从多个角度去欣赏和体验这个世界。”

“从 2006 年我接触网络小说开始,我就一直觉得写作是个很好玩的事情。这部小说 2013 年就有些思路了,但是一直写写停停,一直到 2020 年,我终于选择在知乎上每日连载,才发现读者催更是完本的原动力。”

至于写作动因,他还专门写了一篇说明。题目就叫《在 AI 最火热的时候我写了本小说》。

我们直接传送一下全文。

田渊栋:在 AI 最火热的时候我写了本小说

曾有人哀叹“我们要的是星辰大海,得到的却是社交网络”,这一方面是科技逐利的例子,另一方面,也确实说明,科技发展的轨迹,未必和人们预先设想的相同。

在传统的科幻作家脑中,人工智能冰冷而刻板,可以拥有庞大的计算能力,却无法理解人类的情感,直觉和灵光一现。然而,等到 AI 真的飞速发展到如今,我们却发现,纯粹神经网络构造的人工智能就像一个神经搭错的白痴天才,感性有余,理性却不足,充满疯狂诡异的想像力却无法连成情节连贯逻辑严密的故事,能绘制出天马行空的照片和视频却难以做到精细控制,博览群书学富五车却经常在简单推理中犯傻出错。一些人类视若珍宝的玄奥概念,到头来却发现 AI 经过训练后可以轻易超越;而处理枯燥无聊单调机械的日常生活,AI 却屡屡翻车。

沿着这样的风格路线走下去,人工智能将会产生一个什么样的新世界呢?在想象的大前提被现实巨幅校正之后,对将来的预测,又将会作何等修改呢?

回顾历史,我们会发现,新世界的逻辑,往往和旧世界完全不同。最直接了当的例子莫过于农业文明在面对新生工业文明时的兴叹。在一切都固化为体系和惯例,刻入万世不移的经典,体系内的每个人都下意识地遵循先哲的训令,不再作深入的思考之后,倏忽之间,一个突如其来的“三千年未有之大变局”,搅乱三纲,倒转阴阳,将整个世界观的逻辑体系,从根子上崩裂掉,而本来弃如敝履的奇技淫巧,最终却汇成裹挟一切向前奔腾的汪洋大海。

在智能大爆发的前夜,我们又是否会犯同样的错误而不自知?

我们熟悉阿西莫夫的《基地》,熟悉大刘的《三体》,在那些世界里,人类掌握更高级的科技,涉足更广阔的世界,但人类还是最有智慧的,人类和外星文明的互动方式和逻辑,还是与历史长河中的某个时刻似曾相识。然而,一个高等文明,一个高等智能集合体,在超脱了基本的生存需要之后,还会不会重复过去的历史?在一个所思即所得,予取予求的世界里,稀缺的资源又会是什么?价值的衡量标准何在?在几万光年的尺度下,文明之间有否交流的需求?黑暗森林只是一个假说,也许还有另一个呢。

也许未来的世界,不会是像你我想像的那样;支配它运行的底层规则,也可能完全不同。

在大模型火热的今天,在每个人都埋头读论文、弄数据、跑实验,忙得热火朝天的时候,偶尔我们也需要抬起头来,想一想这一切狂飙突进之后,我们用双手创造的一切,会在百年千年之后,孕育一个什么样的未来。

技术的进步如奔腾野马,但思考还没有跟上。

也许这样的思考,仍然会囿于自身的刻板印象,和真正的未来南辕北辙。但至少,它会有产出一些有趣好玩的故事,在无穷可能的高维空间中,激起一点点不同寻常的涟漪。

本书,就是一次初步的尝试。

好了,如果你希望感知一下顶尖 AI 科学家如何预测未来,那现在最好的方式,或许就是直接阅读这本《破晓之钟》,enjoy~

本文来自微信公众号:量子位(ID:QbitAI),作者:叨乐

相关资讯

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

只用 24G 显存,消费级 GPU 就能搞定大模型了。上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10 亿以下参数小模型,主打在移动设备上运行 LLM。3 月 6 日,田渊栋又一项研究出炉,这次,他们主攻 LLM 内存效率。除了田渊栋本人,还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。他们合

田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

一个非常简单的更改,就能提高 LLM 推理能力。 在认知科学领域,关于语言是用于思考还是用于交流的辩论一直持续。 随着 LLM 和 CoT 的兴起,语言已经成为机器推理的默认媒介 —— 但它真的是最佳方法吗?

除了缺少点创意,GPT-3写出了及格的大学毕业论文,只需20分钟

GPT-3 写的论文及格了吗?教育资源网站 EduRef 对此进行了一项测试,效果还行,及格水平。