彻底开源,免费商用,上海AI实验室把大模型门槛打下来

大模型规模,有人探索前沿技术,有人在加速落地,也有人正在推动整个社区进步。

就在近日,AI 社区迎来首个统一的全链条贯穿的大模型开源系统。

虽然社区有LLaMA等影响力较大的开源模型,但由于许可证限制无法商用。InternLM-7B 除了向学术研究完全绽放之外,也支持免费商用授权,是国内首个可免费商用的具备完整东西链的多谈话大模型,通过开源绽放惠及更多开发者和企业,赋能产业发展。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

WAIC 上墨客・浦语的发布。

今年世界人工智能大会 WAIC 上,上个月初「高考成绩」超越 ChatGPT 的「墨客」大模型来了次重大升级。

在 7 月 6 日的活动中,上海 AI 实验室与商汤联合香港中文大学、复旦大学、上海交通大学及清华大学共同发布了全新升级的「墨客通用大模型系统」,包括墨客・多模态、墨客・浦语和墨客・天际三大根本模型。其中面向 NLP 规模的墨客・浦语谈话大模型迎来了 104B 的高功能版和 7B 的轻量级版

相较初始模型,104B 的墨客・浦语周全升级,高质量语料从 1.6 万亿 token 增至了 1.8 万亿,语境窗口长度从 2K 增至了 8K,支持谈话达 20 多种,35 个评测集上超越 ChatGPT。这使得墨客・浦语成为国内首个支持 8K 语境长度的千亿参数多语种大模型。

而在周全升级的同时,更值得关注的是墨客・浦语在开源上的一系列动作。

此次墨客・浦语将 7B 的轻量级版 InternLM-7B 正式开源,并推出首个面向大模型研发与应用的全链条开源系统,贯穿数据、预训练、微调、部署和评测五大关节。其中 InternLM-7B 是此次开源系统的核心和基座模型,五大关节紧紧围绕大模型开发展开。

上海 AI 实验室绽放其整套根本模型和开发系统。大模型的研究,第一次有了一套开源的、靠谱的全链条东西。

模型 + 全套东西,开源真正完成「彻底」

此前,AWS 等国内外公司纷纷推出了根本大模型技术平台。基于大厂的本领,人们可以建立起生成式 AI 应用。相比之下,基于上海 AI 实验室的基座模型和全链条开源系统,企业、研究机构/团队既可以建立先进的应用,也可以深入开发打造各自垂直规模的大模型。

在上海 AI 实验室看来,根本大模型是进一步翻新的良好开端。「墨客」提供的并非单个的大模型,而是一整套基座模型系统,在全链条开源系统加持下,为学界和业界提供了坚实的底座和成长的土壤,从底层支撑起 AI 社区的成长,并且与更多的探索者共同建设「枝繁叶茂」的生态。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

因此,就此次墨客・浦语的开源而言,它是一套系统性工程,旨在推动行业进步,让一线开发者更快获取先进理念和东西。用「全方位开源绽放」来形容可以说名副其实,模型、数据、东西和评测应有尽有。相比业界类似大模型平台,墨客・浦语首个完成了从数据到预训练、微调,再到部署和评测全链条开源。

轻量化模型,功能业界最强

墨客・浦语的 7B 轻量级版 InternLM-7B 不仅正式开源,还免费提供商用。作为墨客・浦语开源系统中的基座模型,它为上海 AI 实验室未来开源更大参数的模型做了一次探索性尝试。

我们了解到,InternLM-7B 为实用场景量身定制,使用上万亿高质量语料来训练,建立起了超强知识系统。另外提供多功能东西集,使用户可以灵活自主地搭建流程。目前 GitHub star 量已经达到了 1.5K。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

开源地址:https://github.com/InternLM

InternLM-7B 的功能表现如何呢?上海 AI 实验室给出的答案是:在同等参数量级的情况下周全领先国内外现有开源模型

我们用数据来说话。对 InternLM-7B 的周全评测从学科综合本领、谈话本领、知识储备本领、理解本领和推理本领五大维度展开,结果在包含 40 个评测集的评测中展现出卓越和均衡的功能,并完成周全超越。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

下图展示了在几个重点评测集上,InternLM-7B 与国内外代表性 7B 开源模型(如 LLaMA-7B)的比较。可以看到,InternLM-7B 周全胜出,在 CEval、MMLU 这两个评价谈话模型的广泛基准上分别取得了 53.25 和 50.8 的高分,大幅领先目前业内最优的开源模型。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

InternLM-7B 在绽放评测平台 OpenCompass 的比较结果。

墨客是如何做到的?在接受机器之心专访时,上海 AI 实验室林达华教授向我们介绍了致胜之道

与以往在单项或数项基准上达到高水平的模型不同,InternLM-7B 是一个基座模型,它不是针对某个特定任务或规模,而是面向广泛的规模提供比较强大和均衡的根本本领。因而强调各方面本领的均衡是它的一大特点。

为了完成均衡且强大的本领,InternLM-7B 在训练和评估过程中使用了翻新的动态调整模式:在每训练一个短的阶段之后,便对整个模型周全评估,并根据评估结果及时调整下一阶段训练数据分布。通过这套敏捷的闭环方式,模型在成长过程中始终保持本领均衡,不会因数据配比不合理而导致偏科。

同时,InternLM-7B 在微调系统上也有明显升级,使用了更有效的微调手段,保证模型的行为更加可靠。

除了以上模型技术层面的升级,InternLM-7B 还具备可编程的通用东西挪用本领。以 ChatGPT 为例,大模型可在解方程、信息查询等简单任务上挪用东西来完成更准确有效的结果,但在复杂任务上需要挪用更多机制才能解决问题。

InternLM-7B 具备了这种通用东西挪用本领,使模型在需要东西的时候自动编写一段 Python 程序,以综合挪用多种本领,将得到的结果糅合到回答过程,大幅拓展模型本领。

正是在训练 – 评估 – 训练数据分布调整闭环、微调以及东西挪用等多个方面的技术翻新,才让 InternLM-7B 领跑所有同量级开源模型变成了可能。

大模型开源,就需要全链条

在墨客・浦语全链条开源系统中,不仅囊括了丰富多元的训练数据、功能先进的训练与推理框架、灵活易用的微调与部署东西链,还有从非商业机构的更纯粹学术和中立视角出发建立的 OpenCompass 绽放评测系统。

与同类型开源系统相比,墨客・浦语的最大特点体现在链条的「长」。竞品东西链可能会覆盖从微调到部署等少量关节,但墨客・浦语将数据、预训练框架、整个评测系统开源了出来。而且链条中一个关节到另一个关节,所有格式全部对齐,无缝衔接。

上海 AI 实验室围绕墨客・浦语大模型打造了五位一体的技术内核。除了大模型本身,值得关注的还有预训练关节开源的面向轻量级谈话大模型训练的训练框架 InternLM-Train 以及评测关节的绽放评测平台 OpenCompass

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

墨客・浦语全链条东西系统。图源:https://intern-ai.org.cn/home

我们知道,在现有 AI 大模型开发范式中,预训练 + 微调是主流。可见预训练对于大模型的重要性,很大程度上决定了模型任务效果。而其中底层的预训练框架要在能耗、效率、成本等方面尽可能做到节能、高效、低成本,因此框架的翻新势在必行。

墨客・浦语开源了训练框架 InternLM-Train。一方面深度整合了 Transformer 模型算子,使得训练效率得到提升。一方面提出了独特的 Hybrid Zero 技术,完成了计算和通信的高效重叠,训练过程中的跨节点通信流量大大降低。

得益于极致的功能优化,这套开源的系统完成了千卡并行计算的高效率。InternLM-Train 支持从 8 卡到 1024 卡的计算环境中高效训练 InternLM-7B 或者量级相仿的模型,训练功能达到了行业领先水平。千卡规模下的加速效率更是高达 90 %,训练吞吐超过 180Tflop,平均单卡每秒处理 token 也超过 3600。

如果说预训练决定了大模型的「成色」,评测则是校验大模型成色的关键一环。当前由于谈话大模型的本领边界极广,很难形成周全、整体的评价,因而需要在绽放环境中逐渐迭代和沉淀。

墨客・浦语开源系统上线了 OpenCompass 绽放评测系统,更纯粹学术和中立视角之外,它的另一大特点是基准「全」。除了自己的一套评测基准,OpenCompass 还整合了社区主流的几十套基准,未来还将接纳更多,从而让开源模型更充分地彼此较量。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

图源:https://opencompass.org.cn/

具体地,OpenCompass 具有六大核心亮点。从模型评测框架来看,它开源可复现;从模型种类来看,它支持 Hugging Face 模型、API 模型和自定义开源模型等各类模型的一站式测评,比如 LLaMA、Vicuna、MPT、ChatGPT 等。InternLM-7B 正是在该平台上完成评测。

从本领维度来看,它提供了学科综合、谈话本领、知识本领、理解本领、推理本领和安全性六大维度。同时提供这些本领维度下的 40+ 数据集、30 万道题目,评估更周全。

林达华教授认为,本领维度的广度和复杂度是模型评测面对的最大挑战。一方面要充分考虑如何从不同的维度进行评价,一方面当要评测的指标变多的时候,还要兼顾如何以负担得起的方式去评测。

此外,OpenCompass 非常高效,一行命令完成任务分割和分布式评测,数小时内完成千亿模型全量评测;评测范式多样化,支持零样本、小样本及思维链评测,结合标准型或对话型提示词模板轻松激发各种模型最大功能;拓展性极强,轻松增加新模型或数据集、甚至可以接入新的集群管理系统。

目前,OpenCompass 上线了 NLP 模型的评测,也即将支持多模态模型的评测。

随着 OpenCompass 平台的影响力增加,上海 AI 实验室希望对于大模型基准的评测也会对整个规模起到带动作用。与此同时,在建立 AI 标准化的大模型专题组中,上海 AI 实验室也与很多厂商形成了良好的合作关系。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

在大模型快速演进的关键时期,标准制定与实施是推动产业进步的现实需求,也将为产业的可持续发展指明方向。

林达华教授表示:「翻新是人工智能技术进步的源动力,而基座模型和相关的东西系统则是大模型翻新的技术基石。通过此次墨客・浦语的高质量全方位开源绽放,我们希望可以助力大模型的翻新和应用,让更多的规模和行业可以受惠于大模型变革的浪潮。」

做真正有影响力的工作

值得一提的是,上海AI 实验室成立的时间并不长——成立于 2020 年 7 月。作为一个新型研发机构,其主要开展重要根本理论和关键核心技术。得益于其原创性、前瞻性的科研布局,以及强大的科研团队,实验室近期在多个关键规模完成重大突破。

「我们坚持上下游协同,做出的大模型第一时间在团队中进行分享,在应用中得到反馈,进而持续迭代,」林达华介绍称。

上海 AI 实验室的技术领先,还在于做好三个方面的事:不设定发表论文或盈利的 KPI,做真正前沿有影响力的工作;绽放翻新空间,鼓励团队间积极交流,勇于尝试不同的方向与想法;最后,实验室为研究团队提供了海量数据和算力作为支持。

此次墨客・浦语的开源系统降低了大模型技术探索和落地的门槛,对于学界和业界而言意义重大,帮助更多研究结构和企业省去了根本模型建立的步骤,他们可以在已有的强大模型与东西系统的根本上继续演进,完成翻新。

未来,上海 AI 实验室还将基于「墨客・浦语」,在根本模型和应用拓展方面进行探索,努力建立适用于关键规模落地的根本模型。

墨客开源系统可以大幅降低大模型技术探索和落地的门槛,如果你感兴趣,欢迎来试试。

墨客官网链接:https://intern-ai.org.cn/home

给TA打赏
共{{data.count}}人
人已打赏
AI

苹果、俄勒冈州立提出AutoFocusFormer: 摆脱传统栅格,采用自顺应下采样的图象分隔

2023-7-10 14:41:00

AI

Keras 3.0预览版迎来重大更新:合用于TensorFlow、JAX和PyTorch

2023-7-12 18:54:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索