OpenAI：有证据表明 DeepSeek 使用了我们的模型进行训练

2025-01-29 07:07

OpenAI 向《金融时报》表示，他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段，开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本，高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中，但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。

感谢近期中国人工智能公司 DeepSeek 因推出价格低廉且性能媲美 OpenAI 旗舰产品的 AI 模型，在全球引发巨大震动。然而，OpenAI 怀疑这些模型是基于其数据开发的。

据彭博社报道，OpenAI 和微软正在调查 DeepSeek 是否通过 OpenAI 的 API 将 OpenAI 的 AI 模型整合到 DeepSeek 自有的模型中。消息人士称，微软的安全研究人员在 2024 年底发现，大量数据通过 OpenAI 开发者账户被导出，而这些账户被认为与 DeepSeek 有关联。

OpenAI 向《金融时报》表示，他们发现了 DeepSeek 使用“蒸馏”技术的证据。据AI在线了解，“蒸馏”是一种常见的开发手段，开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本，高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中，但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。不过，OpenAI 并未透露其发现的具体证据细节。

OpenAI：有证据表明 DeepSeek 使用了我们的模型进行训练

TheVerge 称，这充满了讽刺意味，毕竟 OpenAI 自身也曾通过大规模抓取网络上的文字信息（未经许可）来推动其 GPT 模型的发展。

OpenAI 在一份声明中表示：“我们深知，中国等国家的公司以及其他一些企业一直在试图蒸馏美国领先 AI 公司的模型。作为 AI 领域的领军者，我们采取了反制措施来保护我们的知识产权，这包括在发布模型时谨慎选择哪些前沿功能可以包含在内。我们相信，未来与美国政府密切合作，以防止对手和竞争对手窃取美国技术，保护最先进的模型，是至关重要的。”