清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

工程
6月18日
编辑

机器之心

AIxiv专栏是机器之心发布学术、技能内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，接待投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文由清华大学、上海交通大学、悉尼大学、UCSB、香港中文大学、香港科技大学、香港科技大学（广州）联合完成。主要作家包括：潘乐怡（第一作家），清华大学本科生，钻研方位为大模型水印等；刘瑷玮

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

AIxiv专栏是机器之心发布学术、技能内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，接待投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

本文由清华大学、上海交通大学、悉尼大学、UCSB、香港中文大学、香港科技大学、香港科技大学（广州）联合完成。主要作家包括：潘乐怡（第一作家），清华大学本科生，钻研方位为大模型水印等；刘瑷玮，清华大学博士生，钻研方位为安全可托大模型等；何志威，上海交通大学博士生，钻研方位为大模型水印、大模型智能体等;高梓添，悉尼大学本科生，钻研方位为大模型水印；赵宣栋，UCSB博士生，钻研方位为可托生成式AI等；胡旭明，香港科技大学/香港科技大学（广州）助理教授，钻研方位为安全可托大模型、信息抽取等；闻立杰，清华大学长聘副教授，钻研方位为流程挖掘，自然语言处理。

本⽂介绍由清华等⾼校联合推出的⾸个开源的⼤模型⽔印⼯具包 MarkLLM。MarkLLM 提供了统⼀的⼤模型⽔印算法兑现框架、直观的⽔印算法体制可视化⽅案以及系统性的评价模块，旨在⽀持钻研⼈员⽅便地实验、了解和评价最新的⽔印技能进展。通过 MarkLLM，作家期望在给钻研者提供便利的同时加深公众对⼤模型⽔印技能的认知，推动该领域的共识形成，进⽽促进相关钻研的发展和推⼴应⽤。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

论⽂名称：MarkLLM: An Open-Source Toolkit for LLM Watermarking

论⽂链接：https://arxiv.org/abs/2405.10051

代码仓库：https://github.com/THU- BPM/MarkLLM

⼤模型⽔印技能的发展现状 & 仍然⾯临的问题

⼤模型⽔印是近期新兴的⼀项技能，通过在模型⽣成⽂本过程中植⼊特定的特征，来兑现机⽣⽂本的辨别和来源追溯。它可⽤于虚假新闻检测、维护学术诚信、数据和模型版权保护等场景。

⽬前主流的⼤模型⽔印算法是在⼤模型推理阶段植⼊⽔印，这类⽅法主要分为两⼤算法家属：

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

KGW 家属：通过⼲预打分向量增加⽔印，将词表分为红绿列表，给绿⾊词加偏置，使输出偏好绿⾊词汇；

Christ 家属：在打分向量⽣成后，⽤伪随机数⼲预采样过程，使⽔印⽂本与该随机数更相关，以此植⼊⽔印。

然⽽，就像所有新兴技能⼀样，⼤语⾔模型⽔印技能在使⽤和了解上也⾯临⼀些挑战。

1. 如何便捷地使⽤各个⼤模型⽔印算法进⾏⽔印增加和检测？

各类⼤模型⽔印算法不断涌现。然⽽它们的兑现⼤都基于作家⾃⾝的需求，缺乏统⼀的类和调⽤接⼝设计，使得钻研⼈员和⼤众需要投⼊⼤量精⼒去使⽤和复现这些算法。

2. 如何直观地了解各个⼤模型⽔印算法的内部体制？

⼤模型⽔印算法的底层体制相对复杂，涉及对⼤模型⽣成⽂本过程中打分向量⽣成以及采样过程的⼲预，不便于钻研者和⼤众了解。

3. 如何便捷、全⾯的评价各个⼤模型⽔印算法？

评价⻆度和指标多样（包含可检测性、鲁棒性、对⽂本质量的影响等），且⼀次评价涉及多步骤，全⾯快速评价算法性能极具挑战。

MarkLLM：⾸个开源⼤模型⽔印多功能⼯具包

针对刚才提到的 3 个问题，作家设计并兑现了⾯向⼤语⾔模型⽔印技能的⼯具包 MarkLLM。

MarkLLM 的主要奉献可总结如下：

1. 功能⻆度

统⼀的⼤模型⽔印算法兑现框架：⽀持两个关键⽔印算法家属（KGW 家属和 Christ 家属）的 9 种具体算法。

⼀致、⽤⼾友好的顶层调⽤接⼝：1 ⾏代码兑现增加⽔印、检测⽔印等各类操作。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

定制化的⼤模型⽔印算法体制可视化解决⽅案：使⽤⼾能够在各种配置下可视化不同⼤模型⽔印算法的内部体制。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

全⾯、系统的⼤模型⽔印算法评价模块：包含覆盖 3 个评价⻆度的共 12 个评价⼯具，以及两类⾃动化评价流⽔线。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

2. 设计⻆度：模块化、松耦合架构设计，具有极⾼的可扩展性和灵活性。

3. 实验⻆度：作家⽤ MarkLLM 作为钻研⼯具，对⽀持的 9 种算法做了 3 个评价⻆度的全⾯实验，在证明 MarkLLM 的实⽤性的同时，为后续钻研提供了宝贵的数据参考。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

4. 对开源社区的影响⼒：MarkLLM 在 GitHub 上线以来已经获得了较多关注，⽬前已有 140+ stars，并吸引了同⾏通过 Pull Request 进⾏代码奉献，以及在 issue 栏⽬进⾏交流讨论。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

作家衷⼼希望 MarkLLM ⼯具包在为钻研⼈员提供便利的同时，提⾼⼤众对⼤语⾔模型⽔印技能的了解和参与度，促进学术界和公众之间就该技能达成共识，推动⼤语⾔模型⽔印钻研和应⽤的进⼀步发展，为⼤语⾔模型使⽤安全奉献⼒量。

作家真诚接待⼤家提出宝贵意⻅、相互交流学习，也⼗分接待通过 pull request 奉献代码，通过⼤家的共同努⼒维护更好的⼤模型⽔印技能⽣态！

给TA打赏

共{{data.count}}人

人已打赏

MarkLLM ⼤模型⽔印

大模型+蒙特卡洛树搜寻，一招让LLaMa-3 8B奥数水平直逼GPT-4

2024-6-17 15:10:00

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评价：多模型、多参数、多维度

2024-6-18 15:24:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果
12月19日
TOP2

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物
12月19日
TOP3

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
2024年AI 编程现在可以做到什么程度？
12月18日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日
抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩
12月12日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部