Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

作者：故渊

2024-09-12 07:32

感谢科技媒体 TechCrunch 昨日（9 月 11 日）报道，法国 AI 初创公司 Mistral 发布 Pixtral 12B，是该公司首款能够同时处理图像和文本的多模态 AI 大语音模型。Pixtral 12B 模型拥有 120 亿参数，大小约为 24GB，参数大致对应于模型的解题能力，拥有更多参数的模型通常比参数较少的模型表现更优。Pixtral 12B 模型基于文本模型 Nemo 12B 构建，能够回答关于任意数量、任意尺寸图像的问题。与 Anthropic 的 Claude 系列和 OpenAI 的

感谢科技媒体 TechCrunch 昨日（9 月 11 日）报道，法国 AI 初创公司 Mistral 发布 Pixtral 12B，是该公司首款能够同时处理图像和文本的多模态 AI 大语音模型。

Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

Pixtral 12B 模型拥有 120 亿参数，大小约为 24GB，参数大致对应于模型的解题能力，拥有更多参数的模型通常比参数较少的模型表现更优。

Pixtral 12B 模型基于文本模型 Nemo 12B 构建，能够回答关于任意数量、任意尺寸图像的问题。

与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等其他多模态模型类似，Pixtral 12B 理论上应能执行诸如为图像添加描述和统计照片中物体数量等任务。

用户可以下载、微调 Pixtral 12B 模型，并能依据 Apache 2.0 许可证使用。

Mistral 开发者关系负责人 Sophia Yang 在 X 平台的一篇帖子中表示，Pixtral 12B 很快将在 Mistral 的聊天机器人和 API 服务平台 Le Chat 及 Le Plateforme 上开放测试。

Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

AI在线附上相关跑分情况如下：

Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小

参考

Mistral releases Pixtral 12B, its first multimodal model

Hugging Face

GitHub

相关标签：

AI 模型 Mistral 12B Pixtral

相关资讯

Mistral首个多模态模型Pixtral 12B来了！还是直接放出24GB磁力链接

Mistral首个多模态模型Pixtral 12B来了！还是直接放出24GB磁力链接

训练完就直接上模型。我们都知道，Mistral 团队向来「人狠话不多」。昨天下午，他们又又又丢出了一个不带任何注解的磁力链接。解析一下这个链接，可以看到大小共 23.64 GB，其中包含 4 个文件，其中最大的文件是一个封装的多模态大模型。动作快的非官方 Mistral 社区已经将该模型上传到了 Hugging Face。磁力链接：magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910Hugging Fac

发力了，Mistral对标ChatGPT全面升级le Chat，还祭出超大杯多模态模型

发力了，Mistral对标ChatGPT全面升级le Chat，还祭出超大杯多模态模型

一觉醒来，Mistral AI 又发力了。就在今天，Mistral AI 多模态家族迎来了第二位成员：一个名为 Pixtral Large 的超大杯基础模型。这是一个基于 Mistral Large 2 构建、124B 开放权重的多模态模型，具备顶尖的图像理解能力 —— 能够看懂文档、图表和自然图像，同时保持 Mistral Large 2 领先的纯文本理解能力。

中国电信开源 TeleChat-12B 星辰语义大模型，年内开源千亿级参数大模型

中国电信开源 TeleChat-12B 星辰语义大模型，年内开源千亿级参数大模型

感谢中国电信已开源 120 亿参数 TeleChat-12B 星辰语义大模型，还表示将于年内开源千亿级参数大模型。相较 1 月开源的 7B 版本，12 版版本在内容、性能和应用等方面整体效果提升 30%，其中多轮推理、安全问题等领域提升超 40%。据介绍，TeleChat-12B 将 7B 版本 1.5T 训练数据提升至 3T，优化数据清洗、标注策略，持续构建专项任务 SFT (监督微调) 数据，优化数据构建规范，大大提升数据质量；同时，基于电信星辰大模型用户真实回流数据，优化奖励模型和强化学习模型，有效提升模型问

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手从DeepSeek-V3发布谈大模型的技术突破与未来机遇别再将LLM当成数据库了 3 到 5 秒即可同声传译 40 余种语言，时空壶推出 W4 Pro 实时翻译耳机

标签云