业界首例,中国联通 AI 大模型存算分离技术实现突破

据中国联通官方,近日,在集团公司指导下,中国联通研究院与浙江联通、联通服装制造军团协同攻关,针对 AI 敏感数据的本地存储异地训练需求提出了创新的业务模式,并成功在杭州与金华两地间实施了业界首次 30TB 样本数据的跨 200 公里存算分离拉远训练,经过实际测算,训练效率高达 97% 以上。

据中国联通官方,近日,中国联通研究院与浙江联通、联通服装制造军团协同攻关,针对 AI 敏感数据的本地存储异地训练需求提出了创新的业务模式,并成功在杭州与金华两地间实施了业界首次 30TB 样本数据的跨 200 公里存算分离拉远训练,经过实际测算,训练效率高达 97% 以上

AI在线从官方介绍获悉,通过本次测试充分验证了存算分离技术的安全性、可行性和高效性,为未来 AI 技术的发展提供了新的思路和方向。

存算分离技术是指将存储数据的仓库和对数据进行计算的加工厂独立开来,在训练时直接将数据从远端存储设备中拉过来进行计算,而不需要先存储到本地的磁盘再进行处理,可以有效保证用户数据的安全性和一致性。

中国联通称,海量样本数据处理过程中存在两大挑战:一是数据多存储于企业端,部分安全性要求较高的数据不便外迁;二是样本数据量激增,AI 智算中心在具备强大算力的同时,还需额外配备存储资源,显著提升了建设成本。在此背景下,业内对实现“存算分离拉远、样本随训随拉”需求迫切。

业界首例,中国联通 AI 大模型存算分离技术实现突破

▲ 图源中国联通公众号

本次存算拉远测试验证的主要特色包括:

第一,以跨地市 AI 大模型训练能力创新重构智算训练模式。传统的智算集中训练模式,需要用户将样本上传到智算中心进行落盘训练,但是部分用户对隐私样本落盘存在安全顾虑。浙江联通通过 IP 广域无损方案,实现了杭州存、金华训的“数据不落盘”拉远训练,以算网协同的能力,为企业用户隐私样本训练探索出了一条新路。

第二,样本数据总量达 30TB,传输距离超 200 公里,计算拉远效率大于 97%。通过联通服装制造军团“衣瞳行业模型”的 AI 训练存算分离现网测试。充分验证了针对 AI 训练业务存算拉远的技术可行性,未来有相关数据敏感业务需求的用户可通过运营商算力服务,完成隐私样本不出园区的拉远训练,实现成本与安全的最佳平衡。

相关资讯

中国联通成立澳门公司,启动粤港澳大湾区人工智能合作计划

中国联通澳门公司与澳门电讯、澳门科技大学、香港科技大学等 10 余家产业链合作伙伴共同启动了粤港澳大湾区人工智能合作计划 UP AI(Union for Partners AI)。该计划通过构建“粤港澳联合运营机制”,深化算力网络、人工智能等领域的产学研用合作。

「机器学习之父」Mitchell 撰文:AI 如何加速科学发展,美国如何抓住机遇

编辑 | ScienceAI近日,卡内基梅隆大学(Carnegie Mellon University)教授,有着「机器学习之父」之称的 Tom M. Mitchell 撰写了新的 AI for Science 白皮书,重点讨论了「人工智能如何加速科学发展?美国政府如何帮助实现这一目标?」这一主题。ScienceAI 对白皮书原文进行了不改变原意的全文编译,内容如下。人工智能领域最近取得了显著进展,包括 GPT、Claude 和 Gemini 等大型语言模型,因此提出了这样一种可能性:人工智能的一个非常积极的影响,

.ai 域名卖爆,小岛安圭拉 2023 年意外躺赚 3200 万美元

感谢随着人工智能产业的火热,AI 域名也成为了新的热门,包括 .ai 后缀等自然是交易重点。据美联社 10 月 16 日报道,.ai 域名卖爆也为加勒比海的一个小岛 —— 安圭拉带来了一笔横财。AI在线查询公开资料获悉,安圭拉(英语:Anguilla)是英国 14 个海外领土之一,位于加勒比海小安的列斯群岛北部,面积 91 平方公里,在 1650 年成为英国殖民地,后续经历一系列波折,于 1980 年成为单独的英国属地。