Databricks 推出 1320 亿参数大言语模型 DBRX,号称“现阶段最强开源 AI”

Databricks 近日在推出了一款通用大言语模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准尝试中都逾越了“市面上所有的开源模型”。IT之家从民间新闻稿中得知,DBRX 是一个基于 Transformer 的大言语模型,采用 MoE(Mixture of Experts)架构,具备 1320 亿个参数,并在 12T Token 的源数据上进行预训练。研究人员对这款模型进行尝试,相较于市场上已有的 LLaMA2-70B、Mixtral、Grok-1 等开源模型,DBRX 在言语理解(MMLU)、程式设

Databricks 近日在推出了一款通用大言语模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准尝试中都逾越了“市面上所有的开源模型”。

Databricks 推出 1320 亿参数大言语模型 DBRX,号称“现阶段最强开源 AI”

IT之家从民间新闻稿中得知,DBRX 是一个基于 Transformer 的大言语模型,采用 MoE(Mixture of Experts)架构,具备 1320 亿个参数,并在 12T Token 的源数据上进行预训练。

研究人员对这款模型进行尝试,相较于市场上已有的 LLaMA2-70B、Mixtral、Grok-1 等开源模型,DBRX 在言语理解(MMLU)、程式设计(HumanEval)及数学逻辑(GSM8K)等基准尝试上的表现较为突出。民间同时提到,DBRX 在上述 3 项基准尝试中也逾越了 OpenAI 的 GPT-3.5。

Databricks 推出 1320 亿参数大言语模型 DBRX,号称“现阶段最强开源 AI”

Databricks AI 部分副总裁 Naveen Rao 向外媒 TechCrunch 透露,该公司花了两个月及 1000 万美元的成本来训练 DBRX,虽然目前 DBRX 在整体成绩方面发挥较好,不过目前该模型需要使用 4 块英伟达 H100 GPU 运行,因此还有待优化空间。

给TA打赏
共{{data.count}}人
人已打赏
AI

google:手机运转人工智能模型将占用大量内存

2024-3-31 12:08:38

AI

防止谈天机器人“造谣”,google Deepmind、斯坦福大学钻研人员推出 AI 究竟核对工具

2024-3-31 17:09:33

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索