OpenAI、微软、智谱AI等全世界16家公司共同签订前沿人工智能宁静答应

人工智能(AI)的宁静课题,正以前所未有的关注度在全世界范围内被讨论。日前,OpenAI 联合创始人、首席科学家 Ilya Sutskever 与 OpenAI 超等对齐团队共同领导人 Jan Leike 相继离开 OpenAI,Leike 甚至在 X 发布了一系列帖子,称 OpenAI 及其领导层忽视宁静而偏爱光鲜亮丽的产品。这在业界引起了广泛关注,在一定程度上凸显了当前 AI 宁静课题的严峻性。5 月 21 日,图灵奖得主 Yoshua Bengio、Geoffrey Hinton 和姚期智联合国内外数十位业内专

人工智能(AI)的宁静课题,正以前所未有的关注度在全世界范围内被讨论。

日前,OpenAI 联合创始人、首席科学家 Ilya Sutskever 与 OpenAI 超等对齐团队共同领导人 Jan Leike 相继离开 OpenAI,Leike 甚至在 X 发布了一系列帖子,称 OpenAI 及其领导层忽视宁静而偏爱光鲜亮丽的产品。这在业界引起了广泛关注,在一定程度上凸显了当前 AI 宁静课题的严峻性

5 月 21 日,图灵奖得主 Yoshua Bengio、Geoffrey Hinton 和姚期智联合国内外数十位业内专家和学者,在权威科学期刊 Science 上刊文,呼吁世界各国领导人针对 AI 危害采取更有力的行动,并警告说,“近六个月所取得的进展还不够”

OpenAI、微软、智谱AI等全世界16家公司共同签订前沿人工智能宁静答应

他们认为,AI 的无节制发展很有可能最终导致生命和生物圈的大规模损失,以及人类的边缘化或灭绝

在他们看来,AI 模型的宁静课题,已经上升到足够威胁人类未来生存的水平。

同样,AI 模型的宁静课题,也已经是可以影响每一个人、每一个人都有必要关心的话题。

5 月 22 日,注定是人工智能史上的一个重大时刻:OpenAI、谷歌、微软和智谱AI 等来自不同国家和地区的公司共同签订了前沿人工智能宁静答应(Frontier AI Safety Commitments);欧盟理事会正式批准了《人工智能法案》(AI Act),全世界首部 AI 全面监管律例即将生效。

再一次,AI 的宁静课题在政策层面被提及。

人工智能首尔峰会“宣言”

在以“宁静、创新、包容”为议题的“人工智能首尔峰会”(AI Seoul Summit)上,来自北美、亚洲、欧洲和中东地区的 16 家公司就 AI 开发的宁静答应达成一致,共同签订了前沿人工智能宁静答应,包括以下要点:

确保前沿 AI 宁静的负责任治理结构和透明度;

基于人工智能宁静框架,负责任地说明将如何衡量前沿 AI 模型的危害;

建立前沿 AI 宁静模型危害缓解机制的明确流程。

图灵奖得主 Yoshua Bengio 认为,前沿人工智能宁静答应的签订“标志着在建立国际治理制度以促进人工智能宁静方面迈出了重要一步”。

作为来自中国的大模型公司,智谱 AI 也签订了这一新的前沿人工智能宁静答应,完整签订方名单如下:

OpenAI、微软、智谱AI等全世界16家公司共同签订前沿人工智能宁静答应

对此,OpenAI 全世界事务副总裁 Anna Makanju 表示,“前沿人工智能宁静答应是促进更广泛地实施先进 AI 系统宁静实践的重要一步。” Google DeepMind 总法律顾问兼治理主管 Tom Lue 说道,“这些答应将有助于在领先开发者之间建立重要的前沿 AI 宁静最佳实践。” 智谱AI 首席执行官张鹏表示,“伴随着先进技巧而来的是确保 AI 宁静的重要责任。”

日前,智谱AI 也受邀亮相 AI 顶会 ICLR 2024,并在题为“The ChatGLM's Road to AGI”的主旨演讲中分享了他们针对 AI 宁静的具体做法。

他们认为,超等对齐(Superalignment)技巧将协助提升大模型的宁静性,并已经启动了类似 OpenAI 的 Superalignment 计划,希望让机器学会自己学习、自己判断,从而实现学习宁静的内容。

OpenAI、微软、智谱AI等全世界16家公司共同签订前沿人工智能宁静答应

他们透露,GLM-4V 即内置了这些宁静措施,以防止产生有害或不道德的行为,同时保护用户隐私和数据宁静;而 GLM-4 的后续升级版本即 GLM-4.5 及其升级模型,也应当基于超等智能(Superintelligence)和超等对齐技巧。

我们也发现,在一篇近期发表的论文中,智谱AI、清华团队介绍了一种通过利用大量自生成的否定词而实现的无反馈(feedback-free)大型语言模型对齐方法——Self-Contrast。

据论文描述,在只有监督微调(SFT)目标的情况下,Self-Contrast 就可以利用 LLM 本身生成大量不同的候选词,并利用预先训练的嵌入模型根据文本相似性过滤多个否定词。

OpenAI、微软、智谱AI等全世界16家公司共同签订前沿人工智能宁静答应

论文链接:https://arxiv.org/abs/2404.00604

在三个数据集上进行的直接偏好优化(DPO)实验表明,Self-Contrast 可以持续大幅超越 SFT 和标准 DPO 训练。而且,随着自生成的负样本数量增加,Self-Contrast 的表现也在不断提高。

OpenAI、微软、智谱AI等全世界16家公司共同签订前沿人工智能宁静答应

总的来说,这一研究为偏好数据缺失情况下的对齐(如 RLHF 方法)提供了一种新的方法。在偏好数据标注代价昂贵且难以获得的情况下,可以利用未标注的 SFT 数据构建语法偏好数据,通过增加负样本的数量来弥补因正样本不足造成的性能损失。

欧盟理事会正式批准《人工智能法案》

同日,欧盟理事会也于同日正式批准了《人工智能法案》(AI Act),这是全世界首部 AI 全面监管律例,这一具有里程碑意义的人工智能律例将于下月生效,目前仅适用于欧盟法律范围内的领域,或将为商业和日常生活中使用的技巧设定一个潜在的全世界基准。

“这部具有里程碑意义的律例是世界上第一部此类律例,它解决了一个全世界性的技巧挑战,同时也为我们的社会和经济创造了机遇,” 比利时数字化大臣 Mathieu Michel 在一份声明中说。

这一综合性的 AI 立法采用“基于危害”的方法,意味着对社会造成伤害的危害越高,规则就越严格。例如,不构成系统性危害的通用目的 AI 模型将承担一些有限的要求,但那些具有系统性危害的则需要遵守更严格的规定。

 

对违反《人工智能法案》中行为的罚款,该法案设定为违规公司前一个财年全世界年营业额的百分比或预定的金额,以较高者为准。

如今,无论是小到科技公司,还是大到政府机构,都已经将预防、解决 AI 宁静课题提上日程。正如牛津大学工程科学系教授 Philip Torr 所言:

“在上一次人工智能峰会上,全世界一致认为我们需要采取行动,但现在是时候从模糊的建议转变为具体的答应了。”

给TA打赏
共{{data.count}}人
人已打赏
应用

全国模型也散布!训练出的智能体竟然不错

2024-5-24 14:24:00

应用

腾讯PCG自研高功能大语言模型推理引擎「一念LLM」正式开源

2024-5-24 14:56:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索