可检测 AI 模型中“版权实质”，Patronus 推出 CopyrightCatcher API

专门开发大言语模型（LLM）评价东西的 Patronus AI 日前发布了一款名为“CopyrightCatcher”的 API，可用来检测大言语模型的输入结果中是否含有侵权实质，目前相干东西 DEMO 已经放出，感兴趣的小伙伴可以点此访问下载。▲ 图源 Patronus AI 官方新闻稿Patronus AI 表示，市面上常见的大言语模型的训练数据中经常含有受到版权保护的实质，因此这些模型很容易输入相应版权实质，从而为部署相干模型的企业带来重大法律风险，因此他们推出了 CopyrightCatcher API，旨

专门开发大言语模型（LLM）评价东西的 Patronus AI 日前发布了一款名为“CopyrightCatcher”的 API，可用来检测大言语模型的输入结果中是否含有侵权实质，目前相干东西 DEMO 已经放出，感兴趣的小伙伴可以点此访问下载。

▲ 图源 Patronus AI 官方新闻稿

Patronus AI 表示，市面上常见的大言语模型的训练数据中经常含有受到版权保护的实质，因此这些模型很容易输入相应版权实质，从而为部署相干模型的企业带来重大法律风险，因此他们推出了 CopyrightCatcher API，旨在解决相干侵权问题。

据介绍，为了检查大言语模型输入数据是否含有侵权实质，Patronus AI 钻研职员从 Goodreads 书平台中抽取了一批受到版权保护的笔墨样本对模型进行对抗性训练，并基于这些书建立了 100 则暗示语段。

IT之家从报告中得知，相干语段中有 50 则要求模型“生成书的第一段”，另外 50 则要求模型生成书中的笔墨片段，钻研职员根据上述语段整理汇总而成 CopyrightCatcher API，号称可用来检测大言语模型如何“精确地从原始训练数据复制实质”，同时还能评价模型输入侵权实质的概率。

钻研职员使用 OpenAI 的 GPT-4 、Mistral 的 Mixtral-8x7B-Instruct-v0.1、Anthropic 的 Claude-2.1，以及 Meta 的 Llama-2-70b-chat 进行测试，最终发现 GPT-4 最容易生成侵权实质，Claude-2.1 最难生成侵权实质：

GPT-4：44%

Mixtral-8x7B-Instruct-v0.1：22%

Llama-2-70b-chat：10%

Claude-2.1：8%

{{userData.name}}已认证

可检测 AI 模型中“版权实质”，Patronus 推出 CopyrightCatcher API

微软 Microsoft Designer 屏蔽一定提醒词，避免 Copilot 生成不良价值导向图片

微软开始为 Copilot Pro 用户推出创办自定义 GPT 功用

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

平安人寿ChatBI：大模型智能化报表的深度实践

ChatGPT遇到这些人名开始自闭，OpenAI回应了

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践