Databricks 推出 1320 亿参数大言语模型 DBRX，号称“现阶段最强开源 AI”

Databricks 近日在推出了一款通用大言语模型 DBRX，号称是“目前最强开源 AI”，据称在各种基准尝试中都逾越了“市面上所有的开源模型”。IT之家从民间新闻稿中得知，DBRX 是一个基于 Transformer 的大言语模型，采用 MoE（Mixture of Experts）架构，具备 1320 亿个参数，并在 12T Token 的源数据上进行预训练。研究人员对这款模型进行尝试，相较于市场上已有的 LLaMA2-70B、Mixtral、Grok-1 等开源模型，DBRX 在言语理解（MMLU）、程式设

Databricks 近日在推出了一款通用大言语模型 DBRX，号称是“目前最强开源 AI”，据称在各种基准尝试中都逾越了“市面上所有的开源模型”。

IT之家从民间新闻稿中得知，DBRX 是一个基于 Transformer 的大言语模型，采用 MoE（Mixture of Experts）架构，具备 1320 亿个参数，并在 12T Token 的源数据上进行预训练。

研究人员对这款模型进行尝试，相较于市场上已有的 LLaMA2-70B、Mixtral、Grok-1 等开源模型，DBRX 在言语理解（MMLU）、程式设计（HumanEval）及数学逻辑（GSM8K）等基准尝试上的表现较为突出。民间同时提到，DBRX 在上述 3 项基准尝试中也逾越了 OpenAI 的 GPT-3.5。

Databricks 推出 1320 亿参数大言语模型 DBRX，号称“现阶段最强开源 AI”

Databricks AI 部分副总裁 Naveen Rao 向外媒 TechCrunch 透露，该公司花了两个月及 1000 万美元的成本来训练 DBRX，虽然目前 DBRX 在整体成绩方面发挥较好，不过目前该模型需要使用 4 块英伟达 H100 GPU 运行，因此还有待优化空间。

{{userData.name}}已认证

Databricks 推出 1320 亿参数大言语模型 DBRX，号称“现阶段最强开源 AI”

google：手机运转人工智能模型将占用大量内存

防止谈天机器人“造谣”，google Deepmind、斯坦福大学钻研人员推出 AI 究竟核对工具

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！