本文为星云Clustar工程副总裁孙军欢于「驱动未来的AI技术」系列主题,「可信AI」专场的分享内容节选。点击进入「机器之心Pro」,查看更多优质内容。
可信AI的驱动力——隐私计算
隐私计算,字面意思指在确保数据隐私的情况下进行计算。其定义为在保护数据本身不对外泄露的前提下,实现对数据分析计算的技术集合,从而达到对数据的可用不可见的目的。
自 1979 年开始,隐私计算的技术发展到现在已经超过40年,主要经历了四个阶段:多方安全计算阶段、差分隐私阶段、集中加密计算阶段,到现在的联邦学习阶段。
对于为什么经历了40多年,联邦学习到近些年才被大家重点关注,孙军欢总结了三点原因:
第一点是隐私计算技术的底座得到了强有力的支撑。实时计算、密码学以及一些高并发技术的发展,为隐私计算提供了技术方面的支持。
第二点是隐私计算领域的新技术框架,在计算性能上有了比较大的突破,具备一些工业落地的条件。
第三点,近两三年隐私保护相关的法律法规的出台,加速了隐私计算技术落地的迫切性。
孙军欢表示,隐私计算技术是实现数据安全流通的最佳技术路径。解锁数据价值有三大前提:跨界流通、合法合规、高保真度。
数据脱敏的方式虽然合法合规且能跨界流通,但脱敏后会隐去部分数据数据,导致数据缺失,无法保证数据的高保真度。对比之下,数据的灰色交易既不合法合规,又无法保证高保真度。
而隐私计算可通过一些安全的技术来保证数据在计算过程中不被泄露,能很好地满足这三个前提,解锁数据价值。
孙军欢表示,联邦学习可以理解为在两方或者多方间,在保证数据不动的情况下做一个联合的计算。但在联邦学习过程中,为了支持参数和数据可以在密态下进行无损的计算,需使用同态加密技术(加密后的数据为2048bit大整数),而同态加密技术会带来计算量和传输量的剧增。
针对上述问题,孙军欢介绍了星云Clustar的相关工作,即两种硬件异构加速技术方案——GPU和FPGA,并着重讲解了FPGA的加速方案。
FPGA加速卡具有四点特性:
全定制 - 可以根据场景和算法定制架构和计算引擎,计算效率高;
高并行 - 可以在算法、多引擎、pipeline处理等多个层面优化并行度;
低延迟 - 高带宽传输,纯硬件电路,无指令执行概念;
低部署 - 可以在云或本地切换部署解决方案并根据应用需求扩展。
所谓异构加速是指将复杂运算转移至硬件设备执行,借助高并发、低延迟的硬件设备,大幅提升并行处理效率。而星云Clustar的异构加速联邦学习系统使用的是软硬件结合的系统框架,分为FPGA算力加速卡、中间层SDK、隐私计算框架层和业务层,能够降低能耗比的同时,提升各类算子性能以及端到端性能。
最后,孙军欢总结道,星云Clustar作为一家以算力为核心的隐私计算技术提供商,致力于高性能隐私计算算力产品研发与技术创新,目前已经形成了数据、平台和算力三层全栈式产品。基于高性能算力,星云Clustar将不断与更多行业合作伙伴、云厂商,共同推动高性能隐私计算的产业落地,为更多行业提供隐私与效率兼顾的产品与方案,实现数据价值的高效应用与挖掘与业务创新。同时,星云Clustar作为全球最大的联邦学习开源社区——FATE社区的TSC Board成员单位,也会持续助力开源生态建设,积极参与行业共建。