Shumer
“最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱
小型创业团队打造的“最强开源模型”,发布才一周就被质疑造假 ——不仅官方宣称的成绩在第三方测试中大打折扣,模型还被质疑套壳 Claude。面对浩大的声浪,厂商 CEO 终于发文道歉,但并未承认造假,表示在调查有关原因。被指控造假的,就是宣称“干翻 GPT-4o”的 70B 开源大模型 Reflection。一开始的质疑主要关于测试成绩,官方找了上传版本有误等借口试图“蒙混过关”。但后来又出现了套壳 Claude 这一更重磅的指控,让 Reflection 更加百口莫辩。表现不如宣传,还被质疑套壳Reflection
9/13/2024 6:38:35 PM
清源
- 1
资讯热榜
这样在本地搭建DeepSeek可以直接封神:本地部署+避坑指南(升级版)
基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统
OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源)
OpenAI发布34页智能体实践指南:从网络搜索到代码编写
Manus开源平替!Kortix-AI正式发布开源通用AI智能体平台Suna
Trae v1.3.0重磅更新,新增MCP与.rules支持引领AI开发新体验
Figma 推 AI 革命:开发智能应用制作器与网站创建工具
Midjourney图像编辑器迎来重大更新:全新UI、图层功能与智能工具上线
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
机器人
模型
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
3D
Anthropic
AI for Science
AI设计
机器学习
GPU
开发者
AI视频
场景
华为
预测
人形机器人
伟达
Transformer
百度
苹果
深度学习
模态
xAI
字节跳动
Claude
搜索
驾驶
文本
大语言模型
神器推荐
具身智能
Copilot
LLaMA
算力
视频生成
安全
干货合集
应用
视觉
大型语言模型
科技
亚马逊
特斯拉
2024
AGI
训练