助力AI技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”

当地时间 12 月 10 日,为期 6 天的 AI 国际顶会 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕。NeurIPS 是全球人工智能和机器学习领域的顶级会议,与 ICML 并称为人工智能领域难度最大,水平最高,影响力最强的会议。会议首日,中国互联网企业蚂蚁集团受邀举办主题为“知识增强 AI 在垂直行业的应用探索”(Knowledge-enhanced AI for Industry Verticals)的研讨会,并在会上开源了

当地时间 12 月 10 日,为期 6 天的 AI 国际顶会 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕。NeurIPS 是全球人工智能和机器学习领域的顶级会议,与 ICML 并称为人工智能领域难度最大,水平最高,影响力最强的会议。

会议首日,中国互联网企业蚂蚁集团受邀举办主题为“知识增强 AI 在垂直行业的应用探索”(Knowledge-enhanced AI for Industry Verticals)的研讨会,并在会上开源了业界首个分布式全链路因果学习系统OpenASCE (Open All-Scale Causal Engine)。

因果推断主要研究如何从数据中推断因果关系,是数据科学领域的重要分支,而传统的机器学习则主要依赖数据中的相关关系。融合因果推断和机器学习可以同时发挥两者的强项,我们称之为因果学习。因果学习作为一种深入理解数据和决策背后关系的技术,在数据驱动的运营和决策中扮演着重要的角色。OpenASCE (Open All-Scale Causal Engine) 根植于蚂蚁集团多年积累的实践经验和技术突破,相较于业界已有的一些开源框架,支持全链路大规模因果学习,包含因果发现、因果效应估计和归因,覆盖了因果各个领域的相应实现。在因果发现上,OpenASCE 支持分布式贝叶斯网络结构搜索,能够处理百节点百万样本数据;同时支持基于连续优化的因果发现,支持万级节点亿级样本数据。

OpenASCE 实现的大规模分布式因果纠偏树可以在 4 小时内完成 1 亿样本的训练任务,是业界唯一的分布式因果提升树实现。此外,OpenASCE 还进一步沉淀了 20 多个工业级因果学习算法,包括 15 个以上因果技术和深度学习结合的因果表征学习方法,有效降低了因果技术的工业应用门槛,在蚂蚁集团内部实现了规模化应用。

比如信贷风控团队通过 OpenASCE 的因果学习方法,可以更准确地识别出风险因素和客户行为之间的因果关系,大幅提高了风险控制的精度和效率。在营销优化方面,OpenASCE 能够帮助营销人员有效寻找“营销敏感人群”,提升业务指标。在推荐场景中,因果推断可以帮助机器学习纠正数据中的偏置,去除伪相关,学习更稳定的因果关系。

据了解,技术开源是蚂蚁集团的重要技术战略,蚂蚁集团在人工智能、数据库、云计算、隐私计算、安全可信等领域都拥有自主可控的关键开源技术,截至目前,共计开源了 1700 多个代码仓库,积累了 100 多个社区头部开源项目。《COPU2022 中国开源发展蓝皮书》显示,蚂蚁开源影响力排名国内前三,其中重点开源的 9 大技术均为支撑支付宝的核心技术。

相关资讯

Judea Pearl推荐,UC伯克利研究者合著机器学习新书,可当研究生教材

前段时间,加州大学伯克利分校 Moritz Hardt 和 Benjamin Recht 合著的新书受到了广泛关注。这本书主要阐述了机器学习的模式、预测以及实现,并面向研究生使用。

AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊

作者 | 陈旭鹏 编辑 | ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。近年来,深度学习和脑机接口(BCI)技术的飞速发展为开发能够帮助失语者沟通的神经语音假肢提供了可行性。然而,神经信号的语音解码面临挑战。近日,纽约大学 VideoLab 和 Flinker Lab 的研究者开发了一个新型的可微分语音合成器,可以利用一个轻型的卷积神经网络将语音编码为一系列可解释的语音参数(如音高,响度,共振峰频率等)并通过可微分语音合成器重新合成语音。通过将神经信号映射到

NeurIPS 2024 | 用LLM探寻隐秘的因果世界

因果发现的现实挑战:稀缺的高级变量寻找并分析因果关系是科学研究中的重要一环,而现有的因果发现算法依赖由专家预先定义的高级变量。 现实场景中的原始数据往往是图片、文本等高维非结构化数据, 结构化的高级变量是十分稀缺的,导致现有的因果发现和学习算法难以用于至更广泛的数据。 因此,香港浸会大学与MBZUAI、卡内基梅隆大学、香港中文大学、悉尼大学以及墨尔本大学合作发表论文《Discovery of the Hidden World with Large Language Models》,提出了一个名为 COAT 的新型框架,旨在利用大型语言模型和因果发现方法的优势,突破传统因果发现方法的局限性,更有效地在现实世界中定义高级变量、理解因果关系。