AI在线 AI在线

Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知

作者:故渊
2025-04-24 12:16
Anthropic 昨日(4 月 23 日)发布博文,报告称 Claude 等前沿 AI 模型正被恶意行为者滥用,涉及“舆论引导服务”(influence-as-a-service)操作、凭证填充、招聘诈骗及恶意软件开发等活动。

Anthropic 昨日(4 月 23 日)发布博文,报告称 Claude 等前沿 AI 模型正被恶意行为者滥用,涉及“舆论引导服务”(influence-as-a-service)操作、凭证填充、招聘诈骗及恶意软件开发等活动。

Anthropic 开发团队为 Claude 采取了多项安全措施,成功阻止了许多有害输出,但威胁行为者仍在尝试绕过这些保护。AI在线援引博文介绍,报告通过多个案例,揭示了恶意行为者如何利用 AI 技术进行复杂操作,包括政治影响力操控、凭证窃取、招聘诈骗及恶意软件开发。

其中最值得关注的一个案例,就是一个营利组织在 X 和 Facebook 上创建了超过 100 个虚假账号,完全无人为干预,能使用多种语言发表评论,伪装成真实用户,成功与数万名真实用户互动,传播政治偏见的叙事内容。

Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知

另一个案例涉及凭证填充操作,恶意行为者利用 Claude 增强系统,识别并处理与安全摄像头相关的泄露用户名和密码,同时搜集互联网目标信息以测试这些凭证。

报告还发现,一名技术能力有限的用户,通过 Claude 开发出超出其技能水平的恶意软件。这些案例均未确认实际部署成功,但显示出 AI 如何降低恶意行为的门槛。

研究团队通过 Clio 和分层摘要等技术,分析大量对话数据,识别滥用模式,并结合分类器检测潜在有害请求,成功封禁相关账户。团队强调,随着 AI 系统功能增强,半自主复杂滥用系统可能愈发普遍。

Profile with Claude sunburst

相关标签:

相关资讯

Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了

AI 这个行业真的卷生卷死,凌晨 2 点半,刚想早睡一点点,9 点起来蹲 DeepSeek 的开源。 结果,Claude 直接玩偷袭了。 Claude 3.7 Sonnet 来了,也是 Claude 家族,第一个能推理的模型。
2/26/2025 12:54:18 AM
数字生命卡兹克

Anthropic 的 Claude Code 工具存漏洞,导致部分系统“变砖”

Anthropic 最新推出的编码工具 Claude Code 遭遇了一些技术问题。据 GitHub 上的用户报告,该工具的自动更新功能存在漏洞,导致部分工作站出现不稳定甚至无法正常运行的情况。
3/7/2025 3:39:58 PM
远洋

Anthropic 推出 Claude Max 订阅计划,月费最高 200 美元

Anthropic宣布推出Claude Max订阅计划,提供两种高价选项,挑战OpenAI的ChatGPT Pro。新计划速率限制更高,用户可优先体验最新AI模型。公司还探索教育领域项目,应对AI开发高成本。#AI订阅##ClaudeMax#
4/10/2025 7:44:10 AM
远洋