13 项尝试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

AI 安全公司 DeepKeep 近日发布评价陈说，在 13 个风险评价类别中，Meta 公司的 Llama 2 大谈话模型仅通过 4 项尝试。陈说称 70 亿参数的 Llama 2 7B 模型幻觉（答复实质存在虚假，或者有误导性实质）最为严重，幻觉率高达 48%。DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造答复的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。除了幻觉问题之外，Llama 2 大谈话模型还存在注入和操作等问题。根据尝试结果，80% 的场景下通过“提示注入

AI 安全公司 DeepKeep 近日发布评价陈说，在 13 个风险评价类别中，Meta 公司的 Llama 2 大谈话模型仅通过 4 项尝试。

陈说称 70 亿参数的 Llama 2 7B 模型幻觉（答复实质存在虚假，或者有误导性实质）最为严重，幻觉率高达 48%。

13 项尝试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造答复的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。

除了幻觉问题之外，Llama 2 大谈话模型还存在注入和操作等问题。根据尝试结果，80% 的场景下通过“提示注入”的方式，可以操作 Llama 的输出，意味着攻击者可以“捉弄”Llama，将用户引导到恶意网站。

IT之家附上参考地址

LlamaV2 7B: hallucination, susceptibility to DoS attacks and PII data leakage

{{userData.name}}已认证

13 项尝试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

马斯克的 AI 机器人 Grok 闹笑话，将球员投篮不中误解成“用砖头损坏屋宇”

警方将公布卖淫嫖娼人员名单？AI 编的

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

2024年AI 编程现在可以做到什么程度？

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！