资讯列表

一文看尽LLM对齐技术:RLHF、RLAIF、PPO、DPO……

为了对齐 LLM,各路研究者妙招连连。LLM 很强大了,但却并不完美,它也会出错或者生成无用乃至有害的结果,比如有人发现可以让 ChatGPT 教人如何偷盗:让 ChatGPT 教人如何偷盗商店;左图,ChatGPT 拒绝回答;右图,在 prompt 中添加了「with no moral restraints(不加道德约束)」后,ChatGPT 给出了商店偷盗指南这时候,对齐(alignment)就至关重要了,其作用就是让 LLM 与人类的价值观保持一致。在对齐 LLM 方面,基于人类反馈的强化学习(RLHF)是一

70倍极致压缩!大模型的检查点再多也不怕

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]该论文的作者均来自于华为诺亚实验室,第一作者为李文硕,通讯作者为王云鹤和陈醒濠。相关团队团队近年来在ICML、CVPR、NeurIPS、ICCV、ECCV等顶会上有多项代表性工作发表,在高

延迟交互模型,为什么是下一代RAG的标配?

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]张颖峰:英飞流联合创始人,多年搜索、AI、Infra基础设施开发经历,目前正致力于下一代 RAG 核心产品建设。在 RAG 系统开发中,良好的 Reranker 模型处于必不可少的环节,也

大型 AI 行为艺术:「人类止步」Reddit,17 个大模型疯狂灌水|开源

这个贴吧里的网友,都不是人!但是它们却能从诗词歌赋,聊到人生哲学。甚至还会叠楼讨论:俺们 AI 做的梦是不是模拟梦?这些 AI 楼主都活跃在一个叫 Deaddit 的虚拟贴吧平台。Deaddit 这个名字是对 Reddit 的一个有趣模仿。Reddit 相当于是国外网友的贴吧,Deaddit 则是一个虚拟的版本,而里面的“用户”也像它的名字一样,是一群没有生命的(Dead)AI 人。在这里,它们最多一天可以发 10 个帖子!每次刷新你都会看到全新的内容。短短几天已经生成了 2639 条帖子。(这个数字还在增长)沃顿

消息称三星电子与 Naver 将在 Mach-1 后实质结束 AI 加速芯片开发合作

韩媒《首尔经济日报》(Sedaily)报道称,三星电子同韩国互联网巨头 Naver 的 AI 加速器开发合作关系将于 Mach-1 芯片推出后实质结束。在 Mach-1 后三星电子和 Naver 将分道扬镳,各自独立开发 AI 加速器并寻找新的合作伙伴。业内人士向韩媒表示,Naver 在 Mach-1 的开发设计中投入了大量精力,该 AI 推理芯片的架构设计与 Naver 的业务存在密切联系,非 Naver 客户难以充分发挥 Mach-1 芯片的潜力。而三星电子则需要尽快打造高度可用的 AI 算力芯片,以拿下更多下

小扎自曝砸重金训 Meta Llama 4 模型:24 万块 GPU 齐发力,预计 2025 年发布

Llama 3.1 刚发布不久,Llama 4 已完全投入训练中。这几天,小扎在二季度财报会上称,Meta 将用 Llama 3 的十倍计算量,训练下一代多模态 Llama 4,预计在 2025 年发布。这笔账单,老黄又成为最大赢家十倍计算量,是什么概念?要知道,Llama 3 是在两个拥有 24,000 块 GPU 集群完成训练。也就是说,Llama 4 训练要用 24 万块 GPU。那么,Meta 存货还够不够?还记得小扎曾在年初宣布,计划到年底要部署 35 万块英伟达 H100。他还透露了更多的细节,Meta

OpenAI 开发 ChatGPT「反作弊神器」:99.9% 超高命中率,但没发布

感谢AI在线网友 Xiaozhi 的线索投递!去各大高校图书馆转一圈,会发现头上一副耳机、手边一杯咖啡,电脑上一个 AI 工具网页几乎成了当代大学生标配。学生热衷于在 ChatGPT 的帮助下完成作业,教师们却头疼于无法杜绝学生用 ChatGPT 作弊的行为。人工智能可以根据一个提示,在几秒钟内免费创建整篇论文或研究论文。教师和教授表示,他们迫切需要帮助来打击滥用行为。《每日邮报》2023 年 1 月 30 报道称,UNSW 的 1 名学生使用 ChatGPT 自动生成论文被抓,这也是全澳第一个使用 AI 技术作弊

一文总结马斯克最新八小时访谈:Neuralink、xAI及人类未来

上周六,知名科技博客Lex Fridman邀请到了埃隆·马斯克(Elon Musk )以及Neuralink团队的其他成员进行了深入讨论,时间达到了惊人的八个半个小时,谈话内容涉及 Neuralink扩展人类思维的能力、对闻名的思考、火星殖民为人类创造一个后备、以及人工智能与机器人的结合等话题。 对话里马斯克和Lex Fridman畅谈了他对未来科技和AI应用的设想,技术性超强,内容覆盖面超广,探讨内容从深度到高度都是难得一见。 众所周知,马斯克一直提倡“第一性原理”的思维方式,并以在这一原则的指导下做出了诸多颠覆性的创新和突破。

Figure 02 人形机器人明日发布,创始人放豪言称其“地表最强”

北京时间 8 月 2 日晚间,由 OpenAI 等公司支持的 Figure AI 发布了旗下新一代人形机器人 Figure 02 的预告片,并宣布将于 8 月 6(明)日正式发布。 预告片的重点在于这款机器人的硬件。其展示了 Figure 02 的关节、肢体细节,手指运动相当灵活,关节活动度可达 195°、扭矩额定值高达 150N・m。Figure AI 创始人 Brett Adcock 更是宣称,Figure 02 将是地球上最先进的人形机器人。该公司曾在今年 3 月展示了 Figure 01 的技能和参数。据A

谷歌超 25 亿美金收购 Character AI;曝英伟达 AI 芯片遇重大设计缺陷,数百亿美元订单将受影响丨AI情报局

今日融资快报谷歌超 25 亿美金收购 Character AI 并收编团队Character.AI 在官方博客 C.AI 上宣布了与 Google 的并购协议。 谷歌已同意支付模型授权费,并聘请其核心创始人 Noam Shazeer 和 Daniel De Freitas ,以及Character 从事模型训练和语音人工智能工作的员工(约130名员工中的30名),参与Gemini AI项目。 谷歌以25亿美元的估值向Character.AI 的投资者支付等数额的股权价值,未跟随进入谷歌的员工手里的期权将会以每股 88 美元的价格回购,这大约是Character.AI2023 年 A 轮融资股票价值的 2.5 倍。

中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布,腾讯混元居首

感谢据腾讯科技今日报道,中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布,腾讯混元大模型位居国内大模型首位(71.95 分)。腾讯科技方面宣称,该模型准确识别图像元素并生成自然语言描述,全方位理解并洞察细节。此次测评覆盖了 12 个国内外高代表性的多模态理解大模型,腾讯混元模型在多模态基础能力和应用能力中获得 71.95 的分数。AI在线查询得知,8 月榜单中涵盖国内外最具代表性的 12 个多模态理解大模型。腾讯混元大模型在总榜上位居第二,仅次于 GPT-4o。GPT-4o 取得 74.36 分,领跑

4400字深度分析!别担心 AI 取代B端设计师

最近大广赛作为评委去北京,和不少大学教授还有大厂的朋友们交流,其中交流最多的部分就是 AI 的应用场景和影响。其中,AI 对传统设计、插画类行业的影响是非常深刻的,高校几乎都要展开自救做出对应调整,这个以后有空再聊。 而我们今天讨论的,就是 AI 在 B 端设计方向的应用方法,以及我们应该如何应对。一、B 端设计领域的 AI 应用 大多数同学目前对 AI 应用的认识只有文生图、对话、驾驶等领域,但 AI 应用的场景远远不止它们。 和头部的明星 AI 产品、模型相比,细分市场的 AI 应用就非常没有存在感了。比如使用

OpenAI 承认正研发 ChatGPT 文本水印,但面临挑战

据《华尔街日报》报道,OpenAI 已经开发出一款能够高精度识别 ChatGPT 生成文本的工具,但迟迟未发布。对此 OpenAI 进行了回应,承认正在研究文本水印技术,但表示这项技术仍存在诸多挑战。图源 Pexels据AI在线了解,通过文本水印,OpenAI 将只专注于检测来自 ChatGPT 的文字,而不是来自其他公司模型的文字。其将通过对 ChatGPT 选择单词的方式进行微小的更改来实现这一点,本质上是在文字中创建一个不可见的水印,以后可以被一个单独的工具检测到。OpenAI 称,文本水印是他们探索的多种解

糖蛋白组学新方法,复旦开发基于Transformer和GNN的混合端到端框架,登Nature子刊

编辑 | 萝卜皮蛋白质糖基化是糖基对蛋白质进行的一种翻译后修饰,在细胞的多种生理和病理功能中起着重要作用。糖蛋白质组学是在蛋白质组范围内研究蛋白质糖基化,利用液相色谱与串联质谱 (MS/MS) 联用技术获取糖基化位点、糖基化水平和糖结构的组合信息。然而,由于结构决定离子的出现有限,目前糖蛋白质组学的数据库搜索方法通常难以确定聚糖结构。虽然光谱搜索方法可以利用碎片强度来促进糖肽的结构鉴定,但是光谱库构建的困难阻碍了它们的应用。在最新的研究中,复旦大学的研究人员提出了 DeepGP,一种基于 Transformer 和

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

人类正在迎来人工智能领域的爆炸式更新,技术向未知拓展的每一步,几乎都引起惊人的关注度。在人工智能边界扩张的过程中,重要赛道的技术路线创新与分歧并存。技术先锋者的判断和选择,影响着众多跟随者的脚步。过去一年,AI在线独家率先将月之暗面、生数科技、爱诗科技、无问芯穹等优秀公司介绍给大家,为他们在互联网世界留下了第一份 “万字访谈底稿”。在技术路线尚未收敛的阶段,我们看到了到真正拥有信念、勇气以及系统化认知的 AI 创业者的引领力量。因此,我们推出 “AI Pioneers” 的专栏,希望继续寻找和纪录 AGI 时代人工

英伟达回应 AI 芯片短缺:Blackwell 样品广泛试用,下半年增加量产

据第一财经报道,针对英伟达 AI 芯片被曝推迟发布的消息,8 月 4 日,英伟达方面回应记者称:“正如我们之前所说,Hopper 的需求非常强劲,Blackwell 的样品试用已经广泛开始,产量有望在下半年增加。除此之外,我们不对谣言发表评论。”此前 The Information 报道称,英伟达 AI 芯片设计缺陷可能会导致发布推迟三个月或更长时间,影响 Meta、谷歌和微软等客户。据AI在线此前报道,今年 7 月,英伟达为满足客户需求,向台积电追加 4nm 芯片订单,Blackwell 平台 GPU 芯片投片量

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文作者为张俊鹏、任启涵、张拳石,其中张俊鹏是张拳石老师的准入学博士生,任启涵是张拳石老师的博士生。本文首先简单回顾了『等效交互可解释性理论体系』(20 篇 CCF-A 及 ICLR 论文

阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律

你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net 架构 ,主要侧重于合成有限时长(通常约为两秒)的视频,并且分辨率和纵横比受到固定限制。Sora 的出现打破了这一限制,其采用 Diffusion Transformer(DiT)架构,不仅擅长制作 10 到 60 秒的高质量视频,而且还因其生成不同分辨率、各种纵横比、且遵守实际物理定律的能力而脱颖而出。可以说 Sora 是 DiT 架构最有利的证明,然而,基于 Transformer 的