本文为华为昇腾开源生态总监黄之鹏于「驱动未来的AI技术」系列主题,「AI for Science」专场的分享内容节选。点击进入「机器之心Pro」,查看更多优质内容。
ScienceAI发展前瞻–AI与科学较量争论的双向作用
黄之鹏先从工程角度分享了AI与科学较量争论或者神经科学发展双向作用。他表示,随着AI+科学较量争论的紧密结合,不少典型应用领域取得了突破,随之涌现出AlphaFold2、Google MetNet、DeepLabV3等关键词。
从工程实现的角度来看,为什么会出现 AI 与科学较量争论结合呢?我们发觉,在传统的科学较量争论数值方法中,有一定的瓶颈,比如我们会遇到不少的高维微分方程求解,较量争论量大;复杂度无比高,而且它的边界条件无比复杂。AI出现后,用AI可以突破之前的不少瓶颈,比如非线性拟合,不需要求解高维方程;我们用神经网络模仿,也不需要处理边界条件。但是,AI对科学较量争论也带来了不少挑战,如:
• 高阶微分:编程表达困难;较量争论量大(较量争论量随阶数指数增长)
• 分布式较量争论:超大集群分布式较量争论,编程难度大,问题定位困难
• 高精度较量争论:传统深度进修较量争论中的FP16较量争论导致数值溢出,需要撑持FP32/64
为什么AlphaFold2破解蛋白质分子折叠取得超过 90 分的成绩如此重要?黄之鹏谈道,蛋白质布局的猜测长期以来是一个无比困难的问题。蛋白质主要有由氨基酸构成,氨基酸是所有的生物最基础的一个组成部分。蛋白质实际上就是一个氨基酸链。它折叠成的3D 布局,表征了某一类的蛋白质。之前,我们能做的蛋白质折叠猜测,数量级无比无比小。做蛋白质折叠,从整体上来说,是一个从序列到3D 布局的猜测。从序列到 3D 布局撑持有一个唯一性存假说。通常来说,一定的蛋白质的序列能够映射到一定的3D 布局上面。科学家发觉,通过猜测一个氨基酸序列形成的3D 布局,可以猜测出来不少的相关蛋白质特性,尤其是误折叠,就是我们说的疾病。
AlphaFold2主要针对的是同源的蛋白质数量,如果蛋白质数量足够多的话,基于晶体衍射形成的数据集所进行处理的结果无比好。当然,我们在相关的研究中也会发觉,比如说我们通过核磁共振或者说通过冷冻电镜,我们可以发觉氨基酸序列并不是总是 1 比 1 很严格的能映射到3D布局上。所以说AlphaFold2也是在一定的限制条件下的产物。但即便如此,它仍然是我们 AI 和科技较量争论结合的一个无比历史性的突破。
谈及对科学较量争论的作用,黄之鹏表示,实在AlphaFold2的作用实在是无比大的。比如 state of AI 的报告里面提到,除了 DeepMind团队之外,Baker lab 基本上也达到了AlphaFold2能够猜测的这个精度。我也是从一篇论文里面看到 AlphaForl2 带来的启示,它彰显的是一个对深度进修或者说深度进修里面更核心的深度进修框架的能力的一个需求。比如attention机制带来的是对 launange dependency 的能力;另外,端到端也是我们现在发觉所有的 AI +科学较量争论,实际在工程落地的时候,不少专家都会提到一个能力。
随后,黄之鹏分享了MindSpore的一系列进展。他表示,MindSpore是华为在去年开源的全新全场景 AI 框架。我们也在去年的 1.5 版本发布了无比多的科学较量争论套件,包括电磁仿真、分子模仿套件,MindSpore同我们的前辈,像 tensorflow PyTorch 这些相比,MindSpore一个最大的特点就是它强调大规模集群的自动化并行能力,全场景的接送,而且撑持科学较量争论。同时,我们在短短的两年时间内成为了国内热度无比高的一个社区。我们与科研结合,产出了不少无比有特色的案例,包括鹏程盘古的大模型,以及我们跟深圳湾实验室合作分子动力学的相关的研究。
当谈到“Transformer是否会成为以后深度进修的统一架构”这一近期比较火热的话题。黄之鹏表示:对于这个问题,撑持的一方,会提出这样的观点:language或者说语言表征会最终成为整个神经网络的统一的一种表达形式。但是我们也看到也有一种可能:随着我们对哺乳动物和人类的神经系统本身的深入研究,也有可能给我们带来一些颠覆现有神经网络架构的 AI 未来发展的可能。因为我们现有的神经网络实在还是基于几十年,数十年前我们尝试对人类的神经网络模仿进行较量争论模仿。但实在最近不少对神经系统研究,都发觉人类的神经系统实在并不是一个大一统的架构。神经科学的进一步发展有可能反过来作用AI 对于神经网络的构造,并且有可能会给AI带来一些新的发展。所以我认为 AI 和科学较量争论是一个双向作用的过程。