Meta 高管澄清：新 AI 模型 Llama 4 训练“作弊”传言不属实

2025-04-08 09:12

Meta高管否认Llama 4模型通过测试集训练作弊的传言，称指控“根本不属实”。但承认不同云服务商提供的模型存在质量差异，正进行错误修复。#AI伦理##MetaAI#

Meta 公司的一位高管出面澄清了一则关于公司新 AI 模型的不实传言。该传言声称 Meta 在其新推出的 Llama 4 Maverick 和 Llama 4 Scout 模型上存在不当行为，即通过在特定基准测试的“测试集”上进行训练来提升模型的测试表现，同时隐藏模型的不足之处。

Meta 公司生成式人工智能副总裁艾哈迈德・阿尔・达赫勒（Ahmad Al-Dahle）在社交平台 X 上发表声明称，这种说法“根本不属实”。

在人工智能领域，测试集是用于在模型训练完成后评估其性能的数据集合。如果在测试集上进行训练，可能会人为地提高模型的基准测试分数，从而使模型看起来比实际更强大。

Meta 高管澄清：新 AI 模型 Llama 4 训练“作弊”传言不属实

值得一提的是，Maverick 和 Scout 在某些任务上的表现不佳，以及 Meta 选择使用未发布的实验版本 Maverick 来在基准测试平台 LM Arena 上获得更好成绩的决定，都为这一谣言提供了“燃料”。研究人员观察到，可公开下载的 Maverick 与在 LM Arena 上托管的模型在行为上存在显著差异。

阿尔・达赫勒承认，部分用户在使用不同云服务提供商提供的 Maverick 和 Scout 模型时，确实遇到了“质量参差不齐”的情况。他解释道：“由于我们在模型准备好后就立即发布了，我们预计需要几天时间才能让所有公开的实现版本都调整到位。我们将继续进行错误修复并与合作伙伴进行对接。”

硅基流动:下线部分未备案模型，用户请注意迁移

近日，硅基流动在其更新公告中宣布，为了进一步优化资源配置，提供更先进、优质、合规的技术服务，将于2025年3月6日对部分模型进行下线处理。此次下线的模型主要为未经审查的国外模型，特别是生图模型，仅保留KColor。请用户注意，如果之前接入了公告中提及的模型，务必在3月6日前完成迁移。

3/5/2025 10:00:25 AM

AI在线

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

Meta推出Llama 4系列AI模型，含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick，性能各有亮点。#Meta #Llama4系列AI模型#

4/6/2025 5:34:53 AM

漾仔

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本

今天凌晨，大新闻不断。一边是 OpenAI 的高层又又又动荡了，另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可将多个 API 提供商打包在一起以便模型方便地调用各种工具或外部模型。此外，他们还发布了最新的安全保障措施。真・Open AI

9/26/2024 2:33:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

Meta 高管澄清：新 AI 模型 Llama 4 训练“作弊”传言不属实

相关资讯

硅基流动:下线部分未备案模型，用户请注意迁移

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本