google DeepMind 推出 AI 安全框架 Frontier Safety Framework，可检测优化降低大模型危急性

google DeepMind 日前推出了一款名为“Frontier Safety Framework”的 AI 安全框架，主要用于检测 AI 模型的危急情况，号称能够主动鉴别“将来能够形成严重危急的 AI 威力”，向研究人员指出相干模型“究竟在哪些层面能够会被黑客利用”。据介绍，DeepMind 当前公布的 Frontier Safety Framework 1.0 版本主要包含三个关键组件，即“鉴别模型是否具有形成严重危急的威力”，“预估模型会在什么阶段具有安全隐患”、“智能优化模型防止其形成危急”。▲ 图源 google官方

google DeepMind 日前推出了一款名为“Frontier Safety Framework”的 AI 安全框架，主要用于检测 AI 模型的危急情况，号称能够主动鉴别“将来能够形成严重危急的 AI 威力”，向研究人员指出相干模型“究竟在哪些层面能够会被黑客利用”。

据介绍，DeepMind 当前公布的 Frontier Safety Framework 1.0 版本主要包含三个关键组件，即“鉴别模型是否具有形成严重危急的威力”，“预估模型会在什么阶段具有安全隐患”、“智能优化模型防止其形成危急”。

google DeepMind 推出 AI 安全框架 Frontier Safety Framework，可检测优化降低大模型危急性

▲ 图源 google官方新闻稿

DeepMind 表示，该公司“一直在突破 AI 的边界”，所开发的模型已改变了他们对 AI 能够性的认知，虽然公司相信将来的 AI 技能将为社会带来珍贵的工具。但他们也意识到相干 AI 技能的危急性有能够对社会造成毁灭性的影响，因此他们正在逐步增强模型的安全性与可控性。

IT之家注意到，当前 DeepMind 仍在开发 Frontier Safety Framework，计划通过产业、学术及有关部门的合作来改善相干框架。

{{userData.name}}已认证

google DeepMind 推出 AI 安全框架 Frontier Safety Framework，可检测优化降低大模型危急性

面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型：8B 参数、高效部署手机

IBM 宣布开源其“最先辈”Granite 代码模型：116 种编程语言训练，号称优于其他竞品

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

2024年AI 编程现在可以做到什么程度？

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！