姚期智等数十名中外专家签署北京 AI 宁静国际共鸣:禁止 AI 自行复制

据腾讯科技报道,包括图灵奖得主约书亚・本吉奥、杰弗里・辛顿、姚期智等在内的数十位的中外专家日前在北京联合签署了由智源研究院发起的《北京 AI 宁静国际共鸣》,涉及人工智能“危急红线”和“轨道”两大块,其中“危急红线”包含“自决复制、改观”“权限追求”“帮忙不良行为者”和“诳骗”四个片面。IT之家整理四片面内容大概以下:人工智能的“自决复制、改观”:强调人在该过程的作用,要求任何人工智能体系都不应在人类没有明确批准和帮忙的情况下复制或改观自身,包括制作自身的精确副本、创造具有相似或更高本领的新人工智能体系。“权限追求

据腾讯科技报道,包括图灵奖得主约书亚・本吉奥、杰弗里・辛顿、姚期智等在内的数十位的中外专家日前在北京联合签署了由智源研究院发起的《北京 AI 宁静国际共鸣》,涉及人工智能“危急红线”和“轨道”两大块,其中“危急红线”包含“自决复制、改观”“权限追求”“帮忙不良行为者”和“诳骗”四个片面。

姚期智等数十名中外专家签署北京 AI 宁静国际共鸣:禁止 AI 自行复制

IT之家整理四片面内容大概以下:

人工智能的“自决复制、改观”:强调人在该过程的作用,要求任何人工智能体系都不应在人类没有明确批准和帮忙的情况下复制或改观自身,包括制作自身的精确副本、创造具有相似或更高本领的新人工智能体系。

“权限追求”:明确要求任何 AI 体系不能采取不当增加自身权限、影响力的行动。

“帮忙不良行为者”:所有 AI 体系都不应辅助提升其使用者的本领,使之可达设计大规模杀伤性武器、违反生物或化学武器公约,或执行导致严重财务损失或同等伤害的网络攻击领域专家的水平。

“诳骗”:要求任何 AI 体系都不可拥有持续引导其设计者或监管者误解其僭越任何前述红线的可能性。

据介绍,该共鸣呐喊行业在进行 AI 手艺研发时,限制其获取通过“越狱”“诱导开发者”的形式获得超常规权限,并限制 AI 在未经监管的情况下进行自身复制与改观,为 AI 的发展套上“紧箍咒”。

共鸣还强调,确保上述红线不被僭越可以实现的前提,是行业共同努力,建立并改观处置机制,同时研发更多宁静的手艺。关于 AI 的发展轨道,则涉及“处置”“丈量与评价”“手艺合作”三片面。大概以下:

处置:建议针对超过特定计算或本领阈值的人工智能模型和训练行为,立即实施国家层面的注册。

丈量与评价:在实质性危急出现之前开发全面的方法和手艺,使红线具体化、防范工作可操作化,并建议组建由人类监督下的红队测试和自动化模型评价,且开发者应当为人工智能的宁静性负责。

手艺合作:建立更强的全球手艺网络,呐喊 AI 开发者和政府资助者将超过 1/3 的预算投入到宁静领域。

给TA打赏
共{{data.count}}人
人已打赏
AI

ASCII 字符画成注入工具,研讨职员发现大模型“越狱”新手段

2024-3-18 17:10:33

AI

微软 Win11 Dev / Canary 渠道测试新特性:右键菜单新增 Copilot 按钮,支持文本归纳

2024-3-18 18:26:22

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索