150页在线书「多少深度进修」上线:利用对称性和不变性解决机械进修问题

CNN、GNN、LSTM、Transformer 等深度进修模型之间的共通之处是什么?在这本书里问题得到了解答。

近十年来,数据科学和机械进修领域取得了巨大的进展。借助深度进修方法,许多高维进修任务(例如计算机视觉、蛋白质折叠)在适当的计算规模下也能够完成。虽然在高维空间中,进修通用函数是一个非常困难的问题,但大多数任务上方法不是通用的,并且物理世界的基础低维和结构存在一些必要的预定义规律。

图神经网络和多少深度进修近期的一系列进展,有希望帮助机械进修解决更加深入复杂的问题。

多少深度进修,是从对称性和不变性的角度对广义机械进修问题进行多少统一的尝试。这些原理不仅是卷积神经网络的突破性性能和图神经网络的近期成功的基础,而且还为建立新型的、面向特定问题的归纳偏差提供了一种有原则的方法。

近日,一本名为《多少深度进修》的新书通过可在各种应用程序中应用的多少统一原理来揭示其中的规律性。这种「多少统一」具有两方面的意义:一方面,它提供了一个通用的数学框架来钻研一些神经网络架构,例如 CNN,RNN,GNN 和 Transformer。另一方面,它提供了一个建设性的程序,可以将先验物理常识整合到神经架构中,并提供原则性的方法来建立一些新的架构。

教你如何组建机械进修架构

《多少深度进修》(Geometric Deep Learning,  Grids, Groups, Graphs, Geodesics, and Gauges)是深度进修多少统一项目的第一版在线书,作家们表示该书自 2020 年 2 月起开始写起,目前版本的页数已超过了 150 页。

该钻研的四位作家 Michael M. Bronstein、Joan Bruna、Taco Cohen、Petar Veličković来自帝国理工、纽约大学、DeepMind 等钻研机构。

150页在线书「多少深度进修」上线:利用对称性和不变性解决机械进修问题

链接:https://geometricdeeplearning.com/

arXiv 论文:https://arxiv.org/abs/2104.13478

在这本书中,钻研者从对称性,不变性和群论的角度出发,试图提炼出「建立任何常用神经架构所需的常识」。涵盖了诸如 CNN、GNN、Transformer 和 LSTM 之类的常用模型,同时还包括球面卷积神经网络(Spherical CNN)、SO(3)-Transformer 和 Gauge Equivariant Mesh CNN 等新模型。

全书包括实质简介、高位空间中的进修、多少先验常识、多少域、多少深度进修模型、存在的问题与应用、历史观点共 7 章实质。以下是该书目录:150页在线书「多少深度进修」上线:利用对称性和不变性解决机械进修问题

150页在线书「多少深度进修」上线:利用对称性和不变性解决机械进修问题

预备常识

该书作家之一,DeepMind 资深钻研科学家 Petar Veličković表示:「如果你此前尚未接触过群论常识,则我们建立的一些概念看起来会有些不太真实。

为此,你可以事先观看一些作家之间视频分享的实质作为前置,也许这可以使某些无法以文字准确描述的实质变得更加「生动」。

Petar Veličković在剑桥大学的分享——图神经网络的理论基础:https://www.youtube.com/watch?v=uF53xsT7mjc

Michael Bronstein 在 ICLR 2021 上的 Keynote:https://iclr-conf.medium.com/announcing-the-iclr-2021-invited-speakers-db4aba84038a

此外,书中实质包括如下一些概念:

域:定义数据的任何「点」的荟萃。例如,对于图象来说,域是任何像素的荟萃;对于图来说,域是任何节点和边的荟萃。注意,该荟萃可能是无限的或者连续的,但是将其想象为有限的可能会让一些数学运算变得容易。

对称群:荟萃Ω到Ω自身双射的荟萃(g: Ω → Ω)。例如,通过将图象上每个像素向右移动一个 slot,并不会改变图象上的东西。

由于要求东西在进行对称变换时保持不变,因此引入了如下属性:

对称操纵必需是可组合的。例如,如果将球体绕 x 轴扭转 30 度,然后绕 y 轴扭转 60 度,并假设每次扭转不会改变球体上的东西,那么连续使用多次变换,那么球体上的东西也没有发生改变,即绕 x 轴扭转 30 度,然后绕 y 轴扭转 60 度也是一种对称操纵。通常,如果 g 和 h 是对称操纵,那么 g o h 也是对称操纵。

对称操纵必需是可逆的——如果我没有更改底层东西,那么我必需能够返回自己的来源(否则意味着丢失信息)。因此如果将球体顺时针扭转 30 度,那么是可以通过逆时针扭转 30 度来「撤消」原动作的。如果 g 是对称的,则 g ^-1 必需存在(并且也是对称的),这就使得 g o g ^-1 = id (恒等)。

保持域不变的恒等函数(id)也必需是对称的。

任何这些属性相加,你就会发现任何对称集与组合运算符(o)一起组成了一个 group,这是在书中广泛使用的数学结构。

150页在线书「多少深度进修」上线:利用对称性和不变性解决机械进修问题

在机械进修社区中,对称性的重要性早已被人们认可,尤其是在模式识别和计算机视觉应用中,有关等变特征检测的早期工作可以追溯到 Shun’ichi Amari 和 Reiner Lenz 在上个世纪的钻研。在神经网络的领域中,Marvin Minsky 和 Seymour Papert 提出的感知器的群不变性定理对(单层)感知器进修不变性的能力进行了基本界定。这是其后多层架构钻研的起点,最终引向了深度进修。

参考实质:

https://towardsdatascience.com/geometric-foundations-of-deep-learning-94cdd45b451d

给TA打赏
共{{data.count}}人
人已打赏
AI

告别网课:赴美禁令解除,8月1日起,持F/M签证中国留先生可直飞美国

2021-4-28 19:28:00

AI

现在入行CV还有前途吗?AI青年学者这样看「未来五年的计算机视觉」

2021-4-30 12:43:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索