阿里云贾扬清:用4S标准带领团队锻造大数据+AI产品体系「阿里灵杰」

10 月 20 日,在 2021 云栖大会上,阿里巴巴集团副总裁、阿里云计算平台事业部负责人、达摩院 AI 平台负责人贾扬清发布大数据 AI 产品体系“阿里灵杰”。“时至今日,我们可以越来越清晰的看到算力、算法、数据和场景的融合,尤其是 AI 和数据。没有数据,AI 是留在实验室里的火花;而没有 AI,数据就是堆在那里的一堆成本”,贾扬清提到,“阿里灵杰是我们在过去几年思考实践的过程中所沉淀下来的基于 Scale、Speed、Simplicity 和 Scenario 这样的 4S 标准的产品的体系。它不是一个

10 月 20 日,在 2021 云栖大会上,阿里巴巴集团副总裁、阿里云计算平台事业部负责人、达摩院 AI 平台负责人贾扬清发布大数据 + AI 产品体系“阿里灵杰”。

“时至今日,我们可以越来越清晰的看到算力、算法、数据和场景的融合,尤其是 AI 和数据。没有数据,AI 是留在实验室里的火花;而没有 AI,数据就是堆在那里的一堆成本”,贾扬清提到,“阿里灵杰是我们在过去几年思考实践的过程中所沉淀下来的基于 Scale、Speed、Simplicity 和 Scenario 这样的 4S 标准的产品的体系。它不是一个为了创新而创新的过程,而是在我们希望 AI 能更加简易落地的时候不断生根的一个结果。我们希望阿里灵杰帮助我们和各行各业开发者一起,能够在云上画出人工智能增长的第二曲线。”

阿里云贾扬清:用4S标准带领团队锻造大数据+AI产品体系「阿里灵杰」

据悉,“阿里灵杰”是中国最大的大数据+AI 一体化平台。“阿里灵杰”包含机器学习平台 PAI、云原生大数据计算服务 MaxCompute、实时计算 Flink 版、大数据开发治理平台 DataWorks、实时数仓 Hologres 等产品,可调动规模高达 10 万台以上计算集群,拥有云边端一体的高性能训练和推理引擎,能提供毫秒级延迟的实时数据分析能力等,也提供开箱即用的视觉、语音、决策、NLP、业务增长引擎等开放服务。

在过去一年,贾扬清介绍,他带领的团队在 4S 标准下也在不断提升产品能力,主要体现在四点:

Scale:灵活扩缩的大数据、大模型、大应用

贾扬清向大家分享了几个数字:1. 云原生大数据平台 Max Compute 已经以 10 万台集群,支持 2000 万表和千万级的调度。但同时也可以从一张表,一个 GB,一个任务开始,用零启动成本来使用近乎无限的弹性。2. 在 AI 领域,阿里云发布了大规模分布式训练框架 Whale,提供分布式 comp graph 建模和自动优化,达摩院的科学家们用 Whale 训练了十万亿级参数的预训练模 AliceMind 和 M6。

Speed:极致的运行、开发、运维效率

今天性能已经不是刀耕火种的手工优化。基于 AI for Systems 的逻辑,通过自动优化,阿里云的成熟产品 MaxCompute 和实时计算 Flink 版持续提升自己性能,MaxCompute 已经是第五年拿到 TPCx-BB 的性能第一名。

贾扬清介绍,“人力成本是最大的成本,开发效率越来越重要。我们的 AI 平台在前面一年完全实现云原生化,使我们可以一键式地完成从建模 / 训练 / 服务全链路的搭建过程。”

Simplicity:标准、像调用函数般易用

AI 先驱 Richard Sutton 说过一句话:70 年研究得出的最大经验,最有效也最显著的技术,就是找到通用的方法来利用大量计算。

今年,阿里云 MaxCompute 和 DataWorks 提供了丰富的生态和数据建模治理工具。阿里云 AI 工程团队与达摩院算法的合作,在十多个 AI 场景下提供了上百个标准化的算法模型服务,解决 AI 落地应用最后一公里的问题。使用 OCR、NLP 等,应该像下一个 App 那么简单。

Scenario:向场景而生

没有场景化的 AI 能力是没有用处的。谁都需要算力,但是不一定管得好算力。阿里的云原生化的 PAI 软件层和 Eflops 高性能集群的结合,提供开箱即用的算力解决方案,支持从学术研究、工业制造场景的落地。

在金融领域,阿里云湖仓一体架构、离线实时一体化数仓,将各种形态的数据汇聚在一起,从传统的反欺诈到创新的用户营销,提升多个场景的应用效果。

和之前基于运营的增长黑客相比,今天的增长引擎很多都是基于数据和算法的。PAI 将这些场景算法标准化,可以实现 RTA、用户触达、智能搜索等多个客户应用中的明显的业务提升。

阿里云贾扬清:用4S标准带领团队锻造大数据+AI产品体系「阿里灵杰」

在过去一年,阿里灵杰也跟犀牛制造、北京大学化学与分子工程学院来鲁华教授组(靶向药物研究)、老视频修复 B 站 Up 主 AI 开发者大谷 Spitzer,在一起探索各种业务场景,为企业和开发者提供 “开箱即用” 的大数据 + AI 一体化能力。

阿里云贾扬清:用4S标准带领团队锻造大数据+AI产品体系「阿里灵杰」

相关资讯

快手基于 Flink 构建实时数仓场景化实践

一、快手实时计算场景快手业务中的实时计算场景主要分为四块:公司级别的核心数据:包括公司经营大盘,实时核心日报,以及移动版数据。相当于团队会有公司的大盘指标,以及各个业务线,比如视频相关、直播相关,都会有一个核心的实时看板;大型活动实时指标:其中最核心的内容是实时大屏。例如快手的春晚活动,我们会有一个总体的大屏去看总体活动现状。一个大型的活动会分为 N 个不同的模块,我们对每一个模块不同的玩法会有不同的实时数据看板;运营部分的数据:运营数据主要包括两方面,一个是创作者,另一个是内容。对于创作者和内容,在运营侧,比如上

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

知识图谱(Knowledge Graphs)是一种结构化的,用于展示和管理信息,组织现实世界知识的形式。 其通常被表达为三元组形式(头实体,关系,尾实体)。 KGs 为问答系统、推荐系统和搜索引擎等各种实际应用提供了极其重要支持。

2023云栖大会开幕,阿里巴巴蔡崇信:打造AI时代最开放的云

10 月 31 日上午,2023 云栖大会在杭州云栖小镇开幕。阿里巴巴集团董事会主席蔡崇信在开幕式上致辞,他提出,阿里巴巴 “要打造 AI 时代最开放的云”。