谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

据 TechCrunch 获得的内部通信内容显示，参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。

AI在线注意到，在科技公司竞相开发更优秀 AI 模型的当下，模型性能的评估通常通过行业基准测试进行，而非由承包商耗费大量精力评估竞争对手的 AI 回复。然而，Gemini 的承包商需要根据多个标准（例如真实性和冗长性）对看到的每个回复进行评分。根据 TechCrunch 获得的通信内容，承包商最多有 30 分钟的时间来判断 Gemini 或 Claude 的答案哪个更好。

内部聊天记录显示，承包商注意到 Claude 的回复似乎比 Gemini 更强调安全性。一位承包商写道：“在所有 AI 模型中，Claude 的安全设置是最严格的。”在某些情况下，Claude 不会回应其认为不安全的提示词（prompt），例如扮演不同的 AI 助手。在另一次测试中，Claude 避免回答某个提示词，而 Gemini 的回复则因包含“裸体和束缚”而被标记为“严重的安全违规”。

Anthropic 的商业服务条款禁止客户未经 Anthropic 批准访问 Claude“以构建竞争产品或服务”或“训练竞争 AI 模型”。谷歌是 Anthropic 的主要投资者。

对此，谷歌 DeepMind（负责 Gemini）发言人 McNamara 表示，DeepMind 确实会“比较模型输出”以进行评估，但并未在 Anthropic 模型上训练 Gemini。“当然，按照行业惯例，在某些情况下，我们会比较模型输出作为评估过程的一部分，”McNamara 说，“然而，任何关于我们使用 Anthropic 模型训练 Gemini 的说法都是不准确的。”

{{userData.name}}已认证

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

消息称谷歌正为 Chrome 浏览器引入“Glic”AI 功能，基于 Gemini Live 大模型打造

机器人端侧模型的十字路口

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

2024年AI 编程现在可以做到什么程度？

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩