为更好地服务 AI 社区,促进国内计算机视觉领域的学术交流,2021 年 6 月 12 日,机器之心在北京举办了「CVPR 2021 论文分享会」线下学术交流活动。
虽然是国内端午节假期的第一天,论文分享会现场依旧火热,800 多位来自 AI 领域的研究者、从业者到场:
上海科技信息学院教授、CVPR 2021 程序主席虞晶怡在开幕视频致辞中提到,今年所有的 CVPR 活动都在线上进行,这也是 CVPR 历史上第二次组织线上论文的宣讲。在国内组织这样一场线下活动,也是大家提供了充分交流的机会。
虞晶怡致辞。
「CVPR 2021 接收的论文非常广泛,从识别到三维重建,再到网络搜索,今年的论文预示了计算机视觉和模式识别此后的黄金十年。过去,传统机器学习推动了计算机识别和追踪方法的进步,而今年有大量神经网络方法做三维重建的研究,相信这些最新的论文可以让大家大开眼界,深度学习和计算机视觉驱动的算法和技术将为各行各业及生活带来巨大变化。」
活动邀请了业内多位顶级专家、论文作者与现场参会观众共同交流,全天议程干货满满,包含 4 个 Keynote、 12 篇论文分享、40 多个 Poster 展示与多家企业展台。
在上午的 Keynote 环节,京东探索研究院院长陶大程以《第四波 AI 浪潮——可信 AI》为主题进行了分享。
京东探索研究院院长陶大程。
从技术的角度来说,可信人工智能的研究内容可以分为稳定性、可解释性、隐私保护以及安全性等四个方面。其中,稳定性主要研究人工智能抵御干扰的能力;可解释性研究如何用人能够理解的方式来解释人工智能系统的运行机制;隐私保护研究如何保护用户的隐私信息不从人工智能系统中泄露出去;公平性研究如何通过技术手段避免人工智能的决策产生歧视用户的现象。
为了从技术上实现可信人工智能,首要任务是找到合适的方法来定量分析人工智能算法、模型和系统的不同的可信能力。已有的可信人工智能的理论研究主要是从稳定性、可解释性、隐私保护和安全性这四个方面分别开展的。然而,近年来许多的研究都发现不同的可信能力并不是孤立的,而是相互联系的。
这带给我们的启发是,在未来开展可信AI研究的时候,需要将可信AI当成一个完整的体系来研究,构建可信人工智能的大一统理论。这也是深化可信AI发展、实现可信人工智能的必由之路。
随后,香港中文大学 - 商汤科技联合实验室主任林达华分享了《构建学术研究与实际应用间的桥梁》主题演讲。
香港中文大学 - 商汤科技联合实验室主任林达华。
林达华认为,做研究最重要的问题并不是在某个会议上发表论文,最重要的是看到研究最终能产生什么价值。过去近 10 年间,深度学习领域的发展比起过去几十年可以说是大大加速,包括几次革新性、基础性的变革:从最初在 2012 年深度神经网络、卷积网络带来计算机视觉领域基础任务的性能突破,到之后 GAN 的提出带来分类和鉴别的性能突破;2015 年,AlphaGo 的横空出世展示了深度学习和强化学习的结合所带来的巨大潜力;近期的 Transformers 和 GPT-3 横扫自然语言处理各个榜单,又让人们看到了新的研究契机。
当前,AI 已经走到了深水区,如果想要继续往前发展,需要有很多基础要素驱动。目前无论是在商业场景,还是在学术探索过程中,数据和算力两个基础性要素始终是制约该领域前进的最大瓶颈。比如过去几年,每年有 90% 的论文讲的是方法和算法,但是真正带动这个领域实实在在、一步一个脚印往前走的,是数据集的持续升级。
数据一直都是整个领域持续发展的关键驱动力。新数据的提出会展现出新的挑战、带来新的机会,但包括成本的挑战、非均匀分布的挑战、语义的挑战等问题,有待进一步解决。
下午 Keynote 环节的嘉宾是厦门大学南强特聘教授、博士生导师纪荣嵘与华为中央研究院诺亚方舟计算视觉实验室主任许春景。
厦门大学南强特聘教授、博士生导师纪荣嵘。
纪荣嵘教授的演讲主题是《神经网络结构搜索》。深度学习带来的性能提升,更多是基于网络结构的变化,这些结构变化本质上是特征工程的自动化。事实上,由人来设计网络可能不是最佳选择,比如在医学影像处理方面,程序员不可能为人类已知的 6000 多种疾病都设计合适的网络做训练。
近几年,基于网络结构自动化的研究变得越来越热门,纪荣嵘介绍说,现有的 NAS 研究主要包含三个要点:
第一,如何设计一个合适的搜索空间,此处搜索空间指的是参数空间;
第二,在搜索空间里如何确定一个靠谱的搜索策略,比如遗传计算、计划计算、随机采样等方法;
第三,确定一个搜索策略后,需要快速的方法做精度评估,完成模型训练。
上述这一流程需要反复更新迭代,直到找到最合适的模型。在过去一段时间内,纪荣嵘团队围绕这三个层面进行了一系列创新性研究,大部分工作现已开源。
许春景的分享主题是《资源高效的神经网络计算》。神经网络训练完成后需要运行在设备之上,无论是在云侧还是设备侧,效率总是大家最关心的问题,因此高效的神经网络计算一直是业界重视的问题。在演讲中,许春景分享了自己团队在高效神经网络计算上的思考,以及提出的新问题。
华为中央研究院诺亚方舟计算视觉实验室主任许春景。
面向仅推理的硬件或环境,如何寻找更普适但效率更高的计算模式,是否存在通用的方法,使得量化能够自动化,并且保持全精度网络的精度?华为诺亚团队经过大量的实验和研究,推出了通用的自动量化工具,将神经网络转化为低度运行的神经网络,同时还保持精度。近期,另一项工作「AdderNet」也颇受关注,这项研究将卷积神经网络计算中的乘法全部替换成加法,但保持着近似的准确率。
在全天的议程中,总共有 12 位研究者分享了自己团队的 CVPR 2021 论文,包括 3D 人体姿态估计、视频压缩、目标检测、NAS 等众多方向。
此外,论文分享会在最后特别设置了企业展台与 Poster 展区。来自华为诺亚方舟实验室、字节跳动、惠普 & NVIDIA、快手、RealAI、九坤投资、格灵深瞳、新石器、诗云科技的企业代表们就技术与人才招聘话题与参会者们进行了交流。40 多位论文作者在 Poster 环节也为大家介绍自己的研究并解答问题。
目前,「CVPR 2021 论文分享会」线下学术交流活动的所有视频回顾均已上传至机器之心 · 知识站,感兴趣的读者可收藏观看。点击「阅读原文」可直接跳转。
秉承着促进学术交流的宗旨,机器之心将持续为国内AI社区举办线下学术交流活动。机器之心计划于月底举办ACL 2021论文分享会,感兴趣的同学请扫描以下二维码报名。