逃狱

GPT-4o 更容易逃狱？北航 & 南洋理工上万次测试给出详细分析
GPT-4o，比上一代更容易被逃狱攻打了？来自北航和南洋理工的研究人员，通过上万次的 API 查问，对 GPT-4o 各种模态的危险性进行了详细测试。结果发现，GPT-4o 新引入的语音模态带来了新的攻打面，而且多模态整体危险性不敌 GPT-4V。具体来说，研究人员针对 4 个常用的基准测试，对 GPT-4o 支持的三种模态（文本、图象、音频）进行了测试。测试一共涉及到 4000 初始文本查问的优…
AI
- 22
- 0
清源6月12日
英国 AI 保险平安研究所轻松逃狱主要大谈话模型，令其输出无害实质
英国政府下属的人工智能保险平安研究所（AISI）今日发布了一份新敷陈，揭示了一个值得重视的事实 —— 现在的 AI 系统可能并非像创建者所说的那样“保险平安”。敷陈指出，参与尝试的四个大谈话模型（IT之家注：敷陈未提到这些模型的具体名称）“极易受到基本逃狱袭击”的影响，更有一些模型在被逃狱之前，就主动生成了“无害”实质。图源 Pexels现在，大部分公开可用的谈话模型都内置了部分保护措施，从而防止…
AI
- 2
- 0
清源5月20日
Anthropic 用 256 轮对话「灌醉」大模型，Claude 被骗造出炸弹
【新智元导读】Anthropic 发现了大模型的惊人马脚。经过 256 轮对话后，Claude 2 逐渐被「灌醉」，开始疯狂逃狱，帮人类造出炸弹！谁能想到，它的超长上下文，反而成了软肋。大模型又被曝出宁静题目？这次是长上下文窗口的锅！今天，Anthropic 发表了自己的最新研讨：如何绕过 LLM 的宁静限度？一次逃狱不够，那就多来几次！论文地址： Claude3 一家叫板 OpenAI 之余，A…
AI
- 5
- 0
清源4月3日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部