资讯列表

人大&港科大揭示大模型重要安全风险漏洞:利用概念激活向量破解大模型的安全对齐|NeurIPS 2024

利用概念激活向量破解大模型的安全对齐,揭示LLM重要安全风险漏洞。 来自人大&港科大的研究人员提出安全概念激活向量(SCAV)框架,通过精确解读大模型的安全机制来指导攻击。 基于SCAV的攻击方法能够生成嵌入级和提示级的攻击,自动调整扰动参数,并显著提升了攻击成功率和响应质量。

量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了,SU哈佛亚马逊最新研究引热议

4-bit量化,能让现有反学习/机器遗忘技术失灵! 也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等),但有手段能让它重新“回忆”起来。 最近,来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新研究在reddit、Hacker News上引起热议。

昆仑万维:国内首款具备中文逻辑推理能力 o1 模型“天工大模型 4.0 O1 版”11 月 27 日启动邀测

据昆仑万维官方介绍,天工大模型 4.0 O1 版是国内第一款具有中文逻辑推理能力的 o1 模型,其在模型输出上支持思考、计划、反思等能力。

14天速成LLM高手!大佬开源学习笔记,GitHub狂揽700星

无论是面试找工作、还是自学创业,甚至想要在圈子内讨论一下AGI的潜力,但凡想要深度参与到AI浪潮中,不可避免的就是学习大型语言模型(LLM)的底层原理。 但AI发展这么多年,论文、学习资料多如牛毛,并且更新换代极快,如何快速入门,学习到那些真正的基础知识,对于新手来说都是一个难题。 最近,一位AI从业者在网上分享了自己的学习过程,仅用14天就学完了LLM所需要的核心知识,学习笔记在GitHub上斩获了675 星星,并且还在持续上涨。

对标o1,Kimi放出了最能打的国产模型

AI 领域正在经历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。 两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。 从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时间,o1 将大模型的能力又往前推了一步。

Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈

就连「量化」也不管用,scaling law真的要终结了吗? 一提scaling law,人们重点关注的是参数规模、数据量等因素,却忽视了「精度」这一关键变量。 哈佛斯坦福MIT等机构研究人员竟发现,低精度训练会降低模型的「有效参数量」!

知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”

11月15日,知乎于北京举办了一场别开生面的学术酒吧活动—AI上头俱乐部。 零一万物 CEO、创新工场董事长李开复,清华大学副教授刘知远,上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩等数十位AI领域领军人物,共同探讨了人工智能的最新发展和未来趋势。 此外,知乎直答产品负责人马奎及多位知乎答主登上现场开放麦,在轻松的氛围中交流AI行业背后的故事。

Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具

LLM究竟是否拥有类似人类的符合理解和推理能力呢? 许多认知科学家和机器学习研究人员,都会认为,LLM表现出类人(或「接近类人」)的语言能力。 然而,来自帕维亚大学、柏林洪堡大学、得克萨斯大学休斯顿健康科学中心、纽约大学、巴塞罗那自治大学的研究者却提供了一些最全面的证据,表明目前它们基本没有!

「谍战」开启!基建狂魔马斯克122天交付10万卡超算,对手大恐慌派间谍飞机侦查

122天交付10万卡超算,神奇的「马斯克速度」,直接把竞争对手们整崩溃了! 消息传出,整个行业都震惊不已。 就在今天,The Information甚至曝出内幕大瓜:有人甚至直接租飞机,直接飞到马斯克的数据中心上空侦查。

大模型时代下的私有数据安全与利用

一、大模型时代下的数据安全与利用问题众所周知,大模型是当前研究的热点之一,且已成为当前发展的主流趋势。 我们团队最近的研究方向从传统的联邦学习转变为探索这一范式在大模型时代的新拓展,即基于知识迁移的联邦学习。 我们认为在大模型时代,这种新的联邦学习模式非常适用。

提高深度学习模型效率的三种模型压缩方法

译者 | 李睿审校 | 重楼近年来,深度学习模型在自然语言处理(NLP)和计算机视觉基准测试中的性能稳步提高。 虽然这些收益的一部分来自架构和学习算法的改进,但数据集大小和模型参数的增长是重要的驱动因素。 下图显示了top-1 ImageNet分类精度作为GFLOPS的函数,GFLOPS可以用作模型复杂性的指标。

英伟达新一代 Blackwell GPU 被曝存在过热问题,导致交付延迟

据《The Information》报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中存在严重的过热问题。这些问题导致设计调整与项目延期,使谷歌、 Meta 和微软等主要客户对能否按计划部署 Blackwell 服务器感到担忧。

前谷歌 AI 研究员:ChatGPT 原本可以更早出现的

在今年 10 月的 TED AI 大会上,被称为“谷歌八子”之一的雅各布・乌斯克尔特(Jakob Uszkoreit)接受了媒体的采访。在访谈中,他分享了 Transformer 的发展历程、谷歌在大语言模型领域的早期探索,以及他目前在生物计算领域的新冒险。

AI 可“听”出电池起火征兆,准确率达 94%

锂电池火灾一直是电动汽车和电子设备的一大安全隐患,为了预防这类事故,科学家们一直在探索各种方法。

怎样保证你不是AGI独裁者?马斯克为何退出OpenAI?早期邮件公开了

今年,OpenAI 可以说是大事不断:内斗、离职等等一系列事件吸引着大家的眼球。 其中,OpenAI 与马斯克的诉讼、纠纷也一直备受大家关注。 今年 3 月份,马斯克这位前 OpenAI 联合创始人在一份长达 46 页、总字数超过 1.4 万字的诉讼文件中,指控 OpenAI 不计后果地开发人类级别的人工智能。

从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷

如今,机器人学习最大的瓶颈是缺乏数据。 与图片和文字相比,机器人的学习数据非常稀少。 目前机器人学科的主流方向是通过扩大真实世界中的数据收集来尝试实现通用具身智能,但是和其他的基础模型,比如初版的 StableDiffusion 相比,即使是 pi 的数据都会少七八个数量级。

突破无规则稀疏计算边界,编译框架CROSS数倍提升模型性能

AIxiv专栏是机器之心发布学术、技术内容的栏目。 过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

超 12000 公里,国产腔镜手术机器人完成远程手术、加速出海

微创机器人集团总裁何超博士透露,本次手术甚至都不用 5G 网络,患者端用的就是医院的网络,“只需要我们的工程师在对方所在地做好网络设置,普通的网络就能满足我们的机器人手术需求。”