FATE(Federated AI Technology Enabler)是微众银行AI团队研发的全球首个联邦进修工业级开源框架,旨在提供安全的算计框架来支撑联邦 AI 生态。FATE 实现了基于同态加密和多方算计(MPC)的安全算计协议,它支撑联邦进修架构和多种机器进修算法的联邦进修实现,包括逻辑回归、基于树的算法、深度进修和迁移进修等等。
3月31日,FATE推出 v1.6版本更新。在1.6版本中,优化了功能效率及稳定性,在使用体验方面,根据社区的反馈也有多方面的优化,将带来更流畅的使用体验。
此外,新版本对其他FederatedML、System Architecture、FATE-Test、FATE-Board、KubeFate等多个模块都进行了更新及改进,五大模块更新如下:
FederatedML
1、纵向SecureBoost 算计机制优化,支撑GOSS、直方图相减、密文压缩等机制,功能提拔2-4倍;
2、纵向SecureBoost支撑L1、min_child_weight,缓解过拟合问题;
3、纵向SBT增加deterministic选项,解决因为浮点误差带来的直方图算计不稳定性问题;
4、新增特点工程组件SecureBoost Transformer,使用SecureBoost的叶子结点进行样本编码;
5、隐私交集模块支撑随机数复用和分组算计均衡机制,功能提拔30%;
6、隐私保护交集支撑国密SM3杂凑算法;
7、纵向GLM优化算计通信流程,支撑低精度加密运算,功能提拔可达2倍;
8、纵向神经网络支撑低精度加密运算,支撑SelectiveBackPropagation、交互层的dropOut,功能提拔2倍;
9、纵向特点分箱优化算计逻辑,减少数据拷贝和内存消耗,支撑密文压缩,功能提拔2倍;
10、纵向Pearson模块支撑本地VIF的算计;
11、联邦特点选择新增Pearson相关性和VIF共线性过滤器;
12、横向神经网络支撑直接输入图像数据进行训练和预测;
13、横向神经网络torch后端重构和语法优化;
14、新增横向联邦分箱,支撑virtual和迭代式2种横向联邦分箱机制;
15、新增样本加权模块,支撑列加权和标签加权机制,纵向GLM、纵向SecureBoost支撑加权训练;
16、新增组件data_transformer,支撑输入数据schema大小写不敏感;
17、LocalBaseline组件支撑离线预测;
18、CrossValidation支撑输出数据切分明细;
19、Evaluation模块支撑多分类评估指标的one-vs-rest展开成二分类指标功能。
System Architecture
1、新增本地文件系统目录路径虚拟存储引擎,以支撑图像输入数据;
2、新增消息队列Pulsar跨站点传输引擎,可搭配Spark算计引擎使用,并可加入Exchange角色支撑星型站点组网模式。
FATE-Test
1、FATE-Test新增算法效率比较,支撑自动化数据的生成;
2、FATE-Test支撑flow接口的自动化回归和正确性测试,覆盖rest\cli\sdk三类接口;
3、FATE-Test支撑flow流程自动化回归训练、预测、在线推模型的全流程;
4、FATE-Test算法效果对比功能增强,支撑验证集指标一致性对比。
FATE-Board
1、SBT Transformer:新增sbt transformer组件,支撑利用hetero_sbt模型对样本特点进行重新编码;
2、Sample Weight:新增sample weight组件,可为样本进行加权,当前支撑根据标签指定权重或根据特点列自动提取权重;
3、Homo Feature Binning:新增homo feature binning组件,用于横向联邦场景下的分箱,当前支撑观察各特点的分箱数及分箱区间;
4、Data Transformer:新增data transformer组件,该组件继承data IO组件的功能,同时支撑大小写不敏感等新特性;
5、Reader:支撑读入图像文件;
6、Hetero Feature Binning:支撑根据woe筛选观察分箱;
7、Pearson:支撑算计特点VIF值;
8、Feature Selection:支撑使用pearson进行特点选择;
9、SecureBoost:支撑同时观察模型的gain和split两类特点重要性,二分类情形下Performance Score支撑观察汇总图表;
10、CV组件:支撑观察和下载每一折的训练集样本及其训练结果;
11、Evaluation:支撑观察one_vs_rest各子模型的二分类指标及汇总可视化图表;
12、可在Board上导出当前任务的dsl和conf文件;
13、可根据合作成员的party_id条件搜索job;
14、优化组件数据/模型下载功能;
15、优化迭代次数过多/cv折数过多情况下Performance Score的图表展示。
KubeFate
1、支撑FATE v1.6.0部署,方便配置切换不同的算计引擎、存储引擎、传输引擎;
2、支撑最新的Pulsar传输引擎配置,以及Pulsar exchange模式配置;
3、改进Spark作为算计引擎的配置;
4、新增Kubernetes日志聚合,提高错误追踪能力;
5、新增集群部署任务的停止功能。
了解更多联邦进修相关资讯,可参考官网(https://www.fedai.org)或者扫描下方二维码,添加小助手。