本文为墨芯人工智能创始人暨CEO王维于「重塑产业的AI科技」系列主题,「企业数字化转型」专场的分享内容节选。点击进入「机器之心Pro」,查看更多优质内容。
AI芯片业的挑战亦是企业智能化转型的降本增效机遇
在AI2.0时代,王维表示,其方向在于硬件、软件和算法的协同设计、协同创新,比如说创新的数据类型、稀疏化等创新技术。
王维介绍道,创新的数据类型是指,在传统的CPU、GPU计算中,使用的大多为浮点64位、32位的双精度、单精度类型等,但其实对于AI计算来说,并不需要这么高精度的数值,可以是浮点的16位,甚至是整形的8位和14位等。因此,我们需要在新的处理器、AI处理器上引入新的数据类型。
而稀疏化是所有AI算法一个具有潜力和空间的发展方向。总体来说,大家的共识是未来的算法的颠覆性结合硬件的创新将决定了AI的走向和命运。王维在介绍稀疏化对于AI计算或AI模型带来的效果和意义时,引入了谷歌和Deepmind的一篇很著名的论文。
如上图所示,横轴是每一个模型计算量,纵轴是精度,使用EfficientNets作为一个benchmark的模型,可以看到在EfficientNets越来越深,加大模型的情况下,计算量和精度均增加。通过稀疏化技术对模型进行优化后,在相同的精度上,可以把计算量降低一个数量级,如果是在相同的计算量情况下,稀疏化技术可以将精度提升几个百分点。因此,稀疏化技术其实是帮助AI朝更高效、更高精度发展的一个非常有潜力的算法的创新。
谈到稀疏化技术在芯片架构上的意义,王维使用下图解释,图中代表一个没有被稀疏化的稠密的神经网络,点代表每一个激活层,连线代表训练出来的模型每一层之间的连接关系。在计算中去计算神经网络的过程,根本上是用两个矩阵来进行一些线性的运算,左边的矩阵代表了神经元层,右边的矩阵代表它的连接层,两个矩阵经过线性运算以及非线性的处理后,得出了下一层的神经网络。以此类推,不断迭代重复,去完成一个非常深的计算,这个过程中的计算量是非常大的。
王维介绍道,在这个计算的空间中,其实很多的神经元是不需要被激活的,而且很多神经元之间的连接关系是非常弱的连接关系,甚至这个连接关系是可以趋于零的。这也就意味着在这些矩阵中,存在着非常多的优化空间。因此,通过稀疏化技术,在计算这种巨型的矩阵的时,我们只需要把它的非零的元素,以及它在矩阵空间的位置存储在一个更小的存储空间里面,而后利用更小的计算单元来完成同样的事情。简而言之,就是说做同样一件任务,但将计算量降低到两个数量级,从而提高计算的效率与速度。王维表示,这就是为什么我们需要通过软件在稀疏化算法上的创新,结合硬件架构的细化架构来提升我们的算力。
王维表示,墨芯科技将稀疏化技术应用于ANTOUM芯片中,这是业界第一个支持高达32倍稀疏率的神经网络的计算平台,也是业界唯一一颗支持双稀疏达到32倍的稀疏率的芯片。同时软硬件结合的吸收计算方式,使得墨芯科技单芯片的算力,相较于目前业界的旗舰产品,从ResNet这些网络来说,等效算力可以提升五到十倍。并且芯片的功耗是GPU的一半不到,但对于单一个网络的这个运算效率,能效提升了10倍到20倍。目前,墨芯科技注重软硬结合,从算法的创新角度出发,设计一整套编译器和硬件架构,已实现90+个AI算子,已编译通过200+个AI算法模型,将来会帮助客户无缝的、简单的去部署和实时计算。
最后,王维总结道,墨芯科技致力于AI计算,这是一个非常前沿的技术,充满挑战的同时,未来也有着无穷的机遇和空间,AI正像电力一样,在渗入和改变每一个行业和领域。墨芯科技将本着以人为本、科技向善的理念,为我们、我们下一代开拓更多的机遇和可能性。