70B

英伟达开源模型 Nemotron-70B 超越 GPT-4o 和 Claude 3.5，仅次于 OpenAI o1
刚刚，英伟达开源了超强模型 Nemotron-70B，后者一经发布就超越了 GPT-4o 和 Claude 3.5 Sonnet，仅次于 OpenAI o1！AI 社区惊呼：新的开源王者又来了？业内直呼：用 Llama 3.1 训出小模型吊打 GPT-4o，简直是神来之笔！
应用
- 5
- 0
问舟10月17日
Reflection 70B AI 模型“塌房”：第三方基准测试结果不佳，不如 LLaMA-3.1-70B
科技媒体 The Decoder 昨日（9 月 10 日）报道，对比平台 Artificial Analysis 相关数据表明，Reflection 70B AI 模型在基准测试中的表现，实际上不及 Meta 的 LLaMA-3.1-70B。针对 AI 模型基准测试结果不佳，Reflection 公司首席执行官马特・舒默（Matt Shumer）表示，上传模型权重至 Hugging Face 时遇…
应用
- 11
- 0
故渊9月11日
开源大模型新王 Reflection 70B 超越 GPT-4o：新技术可纠正自己幻觉，数学 99.2 分刷爆测试集
开源大模型王座突然易主，居然来自一家小创业团队，瞬间引爆业界。新模型名为 Reflection 70B，使用一种全新训练技术，让 AI 学会在推理过程中纠正自己的错误和幻觉。比如最近流行的数 r 测试中，一开始它犯了和大多数模型一样的错误，但主动在反思标签中纠正了自己。在官方评测中，70B 模型全面超越最强开源 Llama 3.1 405B、GPT-4o、Claude 3 Opus、Gemin…
应用
- 35
- 0
清源9月6日
220 亿参数，Mistral AI 发布编程大模型 Codestral：支持 Python 等 80 多种言语
法国 AI 初创公司 Mistral AI 今天发布 Codestral，是该公司首个专为编程而设计的大言语模型（LLM）。Codestral 可以熟练使用 80 多种编程言语，包括 Python、Java、C、C 、JavaScript、Bash、Swift，甚至还有 1957 年问世的 Fortran。和其它编程 LLM 类似，Codestral 可以帮助开发者完成各种功能，包括完成函数、编写…
AI
- 7
- 0
故渊5月30日
阿里巴巴通义千问开源 1100 亿参数 Qwen1.5-110B 模型，与 Meta Llama3-70B 相媲美
感谢阿里巴巴日前宣布，开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B，该模型在根蒂根基能力评价中与 Meta-Llama3-70B 相媲美，在 Chat 评价中表现出色，包括 MT-Bench 和 AlpacaEval 2.0。IT之家汇总主要内容：据介绍，Qwen1.5-110B 与其他 Qwen1.5 模型相似，采用了相同的 Transformer 解码器架构。它包含了分…
AI
- 3
- 0
浩渺4月27日
号称全球最强开源 AI 模型，DBRX 登场：1320 亿参数，说话理解、编程能力等均超 GPT-3.5
初创公司 Databricks 近日发布公告，推出了开源 AI 模型 DBRX，声称是迄今为止全球最强大的开源大型说话模型，比 Meta 的 Llama 2 更为强大。DBRX 采用 transformer 架构，包含 1320 亿参数，共 16 个专家网络组成，每次推理使用其中的 4 个专家网络，激活 360 亿参数。Databricks 在公司博客文章中介绍，在说话理解、编程、数学和逻辑方面，…
AI
- 7
- 0
故渊3月28日