30 亿参数“从 0 到 1”,摩尔线程 / 无问芯穹“千卡集群”行业内首次实现国产 GPU 端到端 AI 大模型实训

摩尔线程、无问芯穹今天联合宣布,双方已经正式完成基于国产全功能 GPU 千卡集群的 3B 规模大模型“MT-infini-3B”实训,该模型基于摩尔线程国产全功能 GPU MTT S4000 组成的千卡集群,以及无问芯穹的 AIStudio PaaS 平台打造。据悉,这次的 MT-infini-3B 模型训练总共用时 13.2 天,全程稳定无中断,集群训练稳定性达到 100%,千卡训练和单机相比扩展效率超过 90%,号称“充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与

摩尔线程、无问芯穹今天联合宣布,双方已经正式完成基于国产全功能 GPU 千卡集群的 3B 规模大模型“MT-infini-3B”实训,该模型基于摩尔线程国产全功能 GPU MTT S4000 组成的千卡集群,以及无问芯穹的 AIStudio PaaS 平台打造。

据悉,这次的 MT-infini-3B 模型训练总共用时 13.2 天,全程稳定无中断,集群训练稳定性达到 100%,千卡训练和单机相比扩展效率超过 90%,号称“充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产 GPU 千卡智算集群深度合作的新范式”。

30 亿参数“从 0 到 1”,摩尔线程 / 无问芯穹“千卡集群”行业内首次实现国产 GPU 端到端 AI 大模型实训

IT之家获悉,实训出来的 MT-infini-3B 性能在同规模模型中跻身前列,相比在国际主流硬件上训练而成的其他模型,在 C-Eval、MMLU、CMMLU 等 3 个测试集上均实现性能领先。

无问芯穹联合创始人兼 CEO 夏立雪表示,当前无问芯穹正在打造“M 种模型”和“N 种芯片”之间的“M x N”中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署,已与摩尔线程达成深度战略合作,而目前“MT-infini-3B”这一训练成果是行业内首次实现基于国产 GPU 芯片从 0 到 1 的端到端大模型实训案例。

相关资讯

算力利用率达 97.6%,无问芯穹发布全球首个单任务千卡异构芯片混合训练平台

无问芯穹联合创始人兼 CEO 夏立雪昨日在世界人工智能大会 AI 基础设施论坛上发布了无问芯穹大规模模型的异构分布式混合训练系统,称千卡异构混合训练集群算力利用率最高达到了 97.6%。夏立雪还宣布无问芯穹 Infini-AI 云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性,支持包括 AMD、华为昇腾、天数智芯、沐曦、摩尔线程、英伟达六种异构芯片在内的大模型混合训练。无问芯穹表示:打开水龙头前,我们不需要知道水是从哪条河里来的。同理,未来我们用各种 AI 应

清华电子系明星公司亮相:发布国产AI算力平台,公测免费送百亿Token

3月31日,由清华大学电子系主任汪玉作为发起人的AI infra公司无问芯穹在上海召开第一次产品发布会。机器之心此前独家介绍过,无问芯穹团队的目标是利用自己加速计算的核心产品优势,降低算力成本,与算力中心合作,整合算力资源,为算力市场提供增量,最终向B 端和 C 端开发者提供可以直接调度的低成本算力。在这次发布上,无问芯穹团队正式发布“无穹Infini-AI”大模型开发与服务平台,并宣布自3月31日起正式开放全量注册,给所有实名注册的个人和企业用户提供百亿tokens免费配额。开发者可以在这个平台上体验、对比各种模

无问芯穹获近 10 亿元累计融资,致力于成为大模型时代首选的“算力运营商”

2024 年 9 月 2 日,无问芯穹(Infinigence AI)宣布完成近 5 亿元 A 轮融资,至此,在成立短短 1 年 4 个月内,无问芯穹累计已完成近 10 亿元融资。无问芯穹本轮融资联合领投方为社保基金中关村自主创新专项基金(君联资本担任管理人)、启明创投和洪泰基金,跟投方包括联想创投、小米、软通高科等战略投资方,国开科创、上海人工智能产业投资基金(临港科创投担任管理人)、徐汇科创投等国资基金,以及顺为资本、达晨财智、德同资本、尚势资本、森若玉坤、申万宏源、正景资本等财务机构。无问芯穹的过往投资方还包