面壁智能发布 Eurux-8x22B 开源大模型：代码性能超越 Llama3-70B

2024-05-03 11:53

感谢面壁智能发布开源大模型 Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。官方测试中，Eurux-8x22B 在 LeetCode（180 道 LeetCode 编程真题）与 TheoremQA （IT之家注：美国大学水准的 STEM 题目）测试上超越了 Llama3-70B，在 LeetCode 测试上超越闭源的 GPT-3.5-Turbo。▲ 官方测试结果据介绍，Eurux-8x22B 模型激活参数 39B，支持 64k 上下文，是由 Mixtr

感谢面壁智能发布开源大模型 Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。

官方测试中，Eurux-8x22B 在 LeetCode（180 道 LeetCode 编程真题）与 TheoremQA （IT之家注：美国大学水准的 STEM 题目）测试上超越了 Llama3-70B，在 LeetCode 测试上超越闭源的 GPT-3.5-Turbo。

官方测试结果

▲ 官方测试结果

据介绍，Eurux-8x22B 模型激活参数 39B，支持 64k 上下文，是由 Mixtral-8x22B 模型对齐而来，在 UltraInteract 对齐数据集上训练而成。

官方测试数据

▲ 官方测试数据

UltraInteract 是专门设计用于提升大模型推理能力的大规模、高质量的对齐数据集，包含了覆盖数学、代码和逻辑推理问题的 12 个开源数据集的 86K 条指令和 220K 偏好对，共有五十万条左右数据。

UltraInteract 过程

UltraInteract 示例

280页PDF，全方位评估OpenAI o1，Leetcode刷题准确率竟这么高

OpenAI 的 o1-preview 模型已经发布两周了，网上也有了很多零星的测评。不过，大部分测评都侧重于某一个方面，对于 o1-preview 的系统评估目前还比较匮乏。在一篇长达 280 页的论文中，来自加拿大阿尔伯塔大学等机构的研究者报告了他们对 o1-preview 的系统评估结果，非常具有参考价值。论文标题：Evaluation of OpenAI o1: Opportunities and Challenges of AGI论文链接：，这项综合研究评估了 o1-preview 在各种复杂推理任务中的

10/1/2024 2:23:00 PM

机器之心

1760 亿参数、大小 281GB，Mixtral 8x22B 开源模型登场：可 Torrent 下载

感谢Mistral AI 公司近日推出了 Mixtral 8x22B 开源模型，共有 1760 亿个参数，Context 长度（上下文文本）为 6.5 万个 token，可以通过 Torrent 下载。Mistral AI 公司自成立以来一直备受外界关注，“6 人团队，7 页 PPT，8 亿融资”不断缔造传奇，而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的 Mixtral 8x22B 是个开源模型，官方目前放出了 Torrent 种子链接，文件大小为 281GB。用户可以通过磁性链接直接下载，或者通过

4/11/2024 6:06:10 AM

故渊

Mistral开源8X22B大模型，OpenAI更新GPT-4 Turbo视觉，都在欺负谷歌

真有围剿 Google 的态势啊！在谷歌昨晚 Cloud Next 大会进行一系列重大发布时，你们都来抢热度：前有 OpenAI 更新 GPT-4 Turbo，后有 Mistral 开源 8X22B 的超大模型。谷歌内心：南村群童欺我老无力。第二大开源模型：Mixtral 8X22B今年 1 月，Mistral AI 公布了 Mixtral 8x7B 的技术细节，并推出了 Mixtral 8x7B – Instruct 聊天模型。该模型的性能在人类评估基准上明显超过了 GPT-3.5 Turbo、Claude-2.

4/10/2024 2:43:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

面壁智能发布 Eurux-8x22B 开源大模型：代码性能超越 Llama3-70B

相关资讯

280页PDF，全方位评估OpenAI o1，Leetcode刷题准确率竟这么高

1760 亿参数、大小 281GB，Mixtral 8x22B 开源模型登场：可 Torrent 下载

Mistral开源8X22B大模型，OpenAI更新GPT-4 Turbo视觉，都在欺负谷歌