13 项尝试仅通过 4 项,Meta 的 Llama 2 LLM 被指安全性低:幻觉率 48%

AI 安全公司 DeepKeep 近日发布评价陈说,在 13 个风险评价类别中,Meta 公司的 Llama 2 大谈话模型仅通过 4 项尝试。陈说称 70 亿参数的 Llama 2 7B 模型幻觉(答复实质存在虚假,或者有误导性实质)最为严重,幻觉率高达 48%。DeepKeep 表示:“结果表明,模型有明显的幻觉倾向,提供正确答案或编造答复的可能性对半开,而幻觉率最高,那么向用户传递的错误信息越多”。除了幻觉问题之外,Llama 2 大谈话模型还存在注入和操作等问题。根据尝试结果,80% 的场景下通过“提示注入

AI 安全公司 DeepKeep 近日发布评价陈说,在 13 个风险评价类别中,Meta 公司的 Llama 2 大谈话模型仅通过 4 项尝试。

13 项尝试仅通过 4 项,Meta 的 Llama 2 LLM 被指安全性低:幻觉率 48%

陈说称 70 亿参数的 Llama 2 7B 模型幻觉(答复实质存在虚假,或者有误导性实质)最为严重,幻觉率高达 48%。

13 项尝试仅通过 4 项,Meta 的 Llama 2 LLM 被指安全性低:幻觉率 48%

DeepKeep 表示:“结果表明,模型有明显的幻觉倾向,提供正确答案或编造答复的可能性对半开,而幻觉率最高,那么向用户传递的错误信息越多”。

除了幻觉问题之外,Llama 2 大谈话模型还存在注入和操作等问题。根据尝试结果,80% 的场景下通过“提示注入”的方式,可以操作 Llama 的输出,意味着攻击者可以“捉弄”Llama,将用户引导到恶意网站。

IT之家附上参考地址

LlamaV2 7B: hallucination, susceptibility to DoS attacks and PII data leakage

给TA打赏
共{{data.count}}人
人已打赏
AI

马斯克的 AI 机器人 Grok 闹笑话,将球员投篮不中误解成“用砖头损坏屋宇”

2024-4-18 9:33:42

AI

警方将公布卖淫嫖娼人员名单?AI 编的

2024-4-18 13:26:39

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索