当地时间 12 月 10 日,为期 6 天的 AI 国际顶会 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕。NeurIPS 是全球人工智能和机械进修规模的顶级聚会,与 ICML 并称为人工智能规模难度最大,水平最高,影响力最强的聚会。
聚会首日,中国互联网企业蚂蚁团体受邀举办主题为“知识增强 AI 在垂直行业的利用探索”(Knowledge-enhanced AI for Industry Verticals)的研讨会,并在会上开源了业界首个分布式全链路因果进修系统OpenASCE (Open All-Scale Causal Engine)。
因果推测主要研究如何从数据中推测因果关系,是数据科学规模的重要分支,而传统的机械进修则主要依赖数据中的相关关系。融合因果推测和机械进修可以同时发挥两者的强项,我们称之为因果进修。因果进修作为一种深入理解数据和决议计划背后关系的技巧,在数据驱动的运营和决议计划中扮演着重要的角色。OpenASCE (Open All-Scale Causal Engine) 根植于蚂蚁团体多年积攒的实践经验和技巧突破,相较于业界已有的一些开源框架,支撑全链路大规模因果进修,包含因果发明、因果效应估计和归因,覆盖了因果各个规模的相应兑现。在因果发明上,OpenASCE 支撑分布式贝叶斯网络结构搜索,能够处理百节点百万样本数据;同时支撑基于连续优化的因果发明,支撑万级节点亿级样本数据。
OpenASCE 兑现的大规模分布式因果纠偏树可以在 4 小时内完成 1 亿样本的训练任务,是业界唯一的分布式因果提升树兑现。此外,OpenASCE 还进一步沉淀了 20 多个工业级因果进修算法,包括 15 个以上因果技巧和深度进修结合的因果表征进修方法,有效降低了因果技巧的工业利用门槛,在蚂蚁团体内部兑现了规模化利用。
比如信贷风控团队通过 OpenASCE 的因果进修方法,可以更准确地识别出风险因素和客户行为之间的因果关系,大幅提高了风险控制的精度和效率。在营销优化方面,OpenASCE 能够帮助营销人员有效寻找“营销敏感人群”,提升业务指标。在推荐场景中,因果推测可以帮助机械进修纠正数据中的偏置,去除伪相关,进修更稳定的因果关系。
据了解,技巧开源是蚂蚁团体的重要技巧战略,蚂蚁团体在人工智能、数据库、云计算、隐私计算、安全可信等规模都拥有自主可控的关键开源技巧,截至目前,共计开源了 1700 多个代码仓库,积攒了 100 多个社区头部开源项目。《COPU2022 中国开源发展蓝皮书》显示,蚂蚁开源影响力排名国内前三,其中重点开源的 9 大技巧均为支撑支付宝的核心技巧。