腾讯Angel机器学习框架升级,支持单任务万卡级别超大规模训练,超300个腾讯产品及场景接入内测

腾讯披露最新大模型训练方法,可节省50%算力成本。

在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本,成为业界关注的焦点。

11 月 23 日,腾讯披露,腾讯混元大模型背后的自研机器学习框架 Angel 再次升级,大模型训练效率提升至主流开源框架的 2.6 倍,千亿级大模型训练可节省 50% 算力成本。升级后的 Angel 支持单任务万卡级别超大规模训练,进一步提升腾讯云 HCC 大模型专属算力集群的性能和效率。

同时,Angel 还提供了从模型研发到应用落地的一站式平台,支持用户通过 API 接口或精调等方式快速调用腾讯混元大模型能力,加速大模型应用构建,腾讯会议、腾讯新闻、腾讯视频等超过 300 个腾讯产品及场景均已接入腾讯混元内测。

目前,相关能力已通过腾讯云对外开放。基于升级后的 Angel 机器学习框架,腾讯云 TI 平台可提供更优的训练和推理加速能力,并支持客户用自己的数据一站式训练精调,基于腾讯混元大模型打造专属智能应用。

自研机器学习框架升级,大模型训练推理效率再提升

随着大模型时代到来,模型参数呈指数级增长,达到万亿级别。大模型逐渐从支持单一模态和任务发展为支持多种模态下的多种任务。在这种趋势下,大模型训练所需算力巨大,远超单个芯片的处理速度,而多卡分布式训练通信损耗巨大。如何提高硬件资源利用率,成为影响国产大模型技术发展和实用性的重要前提。

面向大模型训练,腾讯自研了机器学习训练框架 AngelPTM,针对预训练、模型精调和强化学习等全流程进行加速和优化。AngelPTM 采用最新的 FP8 混合精度训练技术,结合深度优化后的 4D 并行和 ZeROCache 机制优化存储,可兼容适配多款国产化硬件,能够以更少的资源和更快的速度训练更大的模型。

2023 年 4 月,腾讯云面向大模型而生的新一代 HCC 高性能计算集群正式发布,性能较前代提升 3 倍。除了硬件的升级,针对大模型训练场景,HCC 对网络协议、通信策略、AI 框架、模型编译等进行系统级优化,大幅节约训练调优和算力成本。此前 AngelPTM 就已经通过 HCC 对外提供服务,本次 Angel 机器学习框架升级,也将进一步提升 HCC 大模型专属算力集群的性能,助力企业加速大模型落地。

模型参数的增大不仅给训练带来了挑战,还导致了推理成本的不断上升。为解决这一问题,腾讯自研的大模型推理框架 AngelHCF 通过扩展并行能力、采用多种 Attention 优化策略等方式对性能进行了提升。同时,框架还适配了多种压缩算法,以提高吞吐能力,从而实现更快的推理性能和更低的成本,支持大型模型推理服务。

相较于业界主流框架,AngelHCF 的推理速度提高了 1.3 倍。在腾讯混元大模型文生图的应用中,推理耗时从原本的 10 秒缩短至 3 至 4 秒。此外,AngelHCF 还支持多种灵活的大模型压缩和量化策略,支持自动压缩。

一站式应用构建,让大模型 “开箱即用”

作为实用级大模型,腾讯混元大模型从研发之初就面向应用场景而生,在实践中解决大模型落地难点。腾讯产品及应用种类多、流量大,让模型真正 “用起来” 挑战很大。基于 Angel,腾讯构建了大模型接入和应用开发的一站式平台,包含数据处理、精调、模型评估、一键部署以及提示词调优等服务,让大模型的 “开箱即用” 成为可能。

模型接入层面,腾讯混元大模型提供千亿、百亿、十亿多个尺寸的模型,充分适配各类应用场景的需求,只需要经过简单微调就能达到满足业务需求的效果,同时降低模型训练和推理服务的资源成本,在问答、内容分类等常见应用场景中具有更高的性价比。

应用开发层面,腾讯内部已有超过 300 项业务和应用场景接入腾讯混元大模型内测,相比上个月数量翻了一倍,覆盖文本总结、摘要、创作、翻译、代码等多个领域。

2023 年 9 月,腾讯自研的实用级大模型腾讯混元正式亮相并通过腾讯云开放。腾讯混元拥有超千亿参数规模,预训练语料超 2 万亿 tokens,聚合了腾讯在预训练算法、机器学习平台和底层算力资源多个层面的自研技术积累,并在应用中持续迭代,不断优化大模型能力。目前,已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户,通过腾讯云接入腾讯混元大模型。

相关资讯

腾讯将推 C 端助手 App 腾讯元宝:基于混元大模型,支持 AI 搜索、文档总结、口语陪练

感谢在今日举办的腾讯云生成式 AI 产业应用峰会上,腾讯预告将在 5 月 30 日发布基于混元大模型的面向 C 端(消费者端)的助手 App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合腾讯的内容生态,为用户提供多种生活功能。腾讯元宝将支持以下功能:AI 搜索:参考多个信息来源并总结,让信息获取更加准确、可靠文档总结:支持多格式多文档总结超能翻译官:直译意译均可翻译,用户可以提供论文链接,App 给出翻译口语陪练:练习口语对话,对用户语法与发音作出评价腾讯混元大模型,作为腾讯全链路

最新中文大模型测评出炉,腾讯混元居卓越领导者象限

5月6日 记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的第三方中文语言理解测评基准CLUE(The Chinese Language Understanding Evaluation)。SuperCLUE基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准,由十

腾讯副总裁蒋杰:混元大模型正部署从多模态到全模态的技术,很快即可体验

据界面新闻报道,在今天的 2024 世界人工智能大会(WAIC 2024)上,腾讯集团副总裁、腾讯混元大模型负责人蒋杰谈及大模型多模态相关问题。蒋杰表示,大模型行业正从最初的单模态向多模态过渡。其认为对于腾讯混元大模型来说,多模态是一道“必答题”,目前混元大模型正在积极部署从多模态到全模态的技术,用户将很快可在腾讯元宝 App、腾讯内部业务及场景中体验,同时会通过腾讯云向外部应用开放。而在 5 月 17 日,蒋杰曾在腾讯生成式 AI 产业应用峰会上透露,今年三季度将开源混元“最核心”的文生文模型。腾讯内部已开始对三