AI资讯列表 - AI在线

一文看尽LLM对齐技术：RLHF、RLAIF、PPO、DPO……

为了对齐 LLM，各路研究者妙招连连。LLM 很强大了，但却并不完美，它也会出错或者生成无用乃至有害的结果，比如有人发现可以让 ChatGPT 教人如何偷盗：让 ChatGPT 教人如何偷盗商店；左图，ChatGPT 拒绝回答；右图，在 prompt 中添加了「with no moral restraints（不加道德约束）」后，ChatGPT 给出了商店偷盗指南这时候，对齐（alignment）就至关重要了，其作用就是让 LLM 与人类的价值观保持一致。在对齐 LLM 方面，基于人类反馈的强化学习（RLHF）是一

70倍极致压缩！大模型的检查点再多也不怕

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]该论文的作者均来自于华为诺亚实验室，第一作者为李文硕，通讯作者为王云鹤和陈醒濠。相关团队团队近年来在ICML、CVPR、NeurIPS、ICCV、ECCV等顶会上有多项代表性工作发表，在高

延迟交互模型，为什么是下一代RAG的标配？

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]张颖峰：英飞流联合创始人，多年搜索、AI、Infra基础设施开发经历，目前正致力于下一代 RAG 核心产品建设。在 RAG 系统开发中，良好的 Reranker 模型处于必不可少的环节，也

大型 AI 行为艺术：「人类止步」Reddit，17 个大模型疯狂灌水｜开源

这个贴吧里的网友，都不是人！但是它们却能从诗词歌赋，聊到人生哲学。甚至还会叠楼讨论：俺们 AI 做的梦是不是模拟梦？这些 AI 楼主都活跃在一个叫 Deaddit 的虚拟贴吧平台。Deaddit 这个名字是对 Reddit 的一个有趣模仿。Reddit 相当于是国外网友的贴吧，Deaddit 则是一个虚拟的版本，而里面的“用户”也像它的名字一样，是一群没有生命的（Dead）AI 人。在这里，它们最多一天可以发 10 个帖子！每次刷新你都会看到全新的内容。短短几天已经生成了 2639 条帖子。（这个数字还在增长）沃顿

消息称三星电子与 Naver 将在 Mach-1 后实质结束 AI 加速芯片开发合作

韩媒《首尔经济日报》（Sedaily）报道称，三星电子同韩国互联网巨头 Naver 的 AI 加速器开发合作关系将于 Mach-1 芯片推出后实质结束。在 Mach-1 后三星电子和 Naver 将分道扬镳，各自独立开发 AI 加速器并寻找新的合作伙伴。业内人士向韩媒表示，Naver 在 Mach-1 的开发设计中投入了大量精力，该 AI 推理芯片的架构设计与 Naver 的业务存在密切联系，非 Naver 客户难以充分发挥 Mach-1 芯片的潜力。而三星电子则需要尽快打造高度可用的 AI 算力芯片，以拿下更多下

小扎自曝砸重金训 Meta Llama 4 模型：24 万块 GPU 齐发力，预计 2025 年发布

Llama 3.1 刚发布不久，Llama 4 已完全投入训练中。这几天，小扎在二季度财报会上称，Meta 将用 Llama 3 的十倍计算量，训练下一代多模态 Llama 4，预计在 2025 年发布。这笔账单，老黄又成为最大赢家十倍计算量，是什么概念？要知道，Llama 3 是在两个拥有 24,000 块 GPU 集群完成训练。也就是说，Llama 4 训练要用 24 万块 GPU。那么，Meta 存货还够不够？还记得小扎曾在年初宣布，计划到年底要部署 35 万块英伟达 H100。他还透露了更多的细节，Meta

OpenAI 开发 ChatGPT「反作弊神器」：99.9% 超高命中率，但没发布

感谢AI在线网友 Xiaozhi 的线索投递！去各大高校图书馆转一圈，会发现头上一副耳机、手边一杯咖啡，电脑上一个 AI 工具网页几乎成了当代大学生标配。学生热衷于在 ChatGPT 的帮助下完成作业，教师们却头疼于无法杜绝学生用 ChatGPT 作弊的行为。人工智能可以根据一个提示，在几秒钟内免费创建整篇论文或研究论文。教师和教授表示，他们迫切需要帮助来打击滥用行为。《每日邮报》2023 年 1 月 30 报道称，UNSW 的 1 名学生使用 ChatGPT 自动生成论文被抓，这也是全澳第一个使用 AI 技术作弊

一文总结马斯克最新八小时访谈：Neuralink、xAI及人类未来

上周六，知名科技博客Lex Fridman邀请到了埃隆·马斯克（Elon Musk ）以及Neuralink团队的其他成员进行了深入讨论，时间达到了惊人的八个半个小时，谈话内容涉及 Neuralink扩展人类思维的能力、对闻名的思考、火星殖民为人类创造一个后备、以及人工智能与机器人的结合等话题。对话里马斯克和Lex Fridman畅谈了他对未来科技和AI应用的设想，技术性超强，内容覆盖面超广，探讨内容从深度到高度都是难得一见。众所周知，马斯克一直提倡“第一性原理”的思维方式，并以在这一原则的指导下做出了诸多颠覆性的创新和突破。

Figure 02 人形机器人明日发布，创始人放豪言称其“地表最强”

北京时间 8 月 2 日晚间，由 OpenAI 等公司支持的 Figure AI 发布了旗下新一代人形机器人 Figure 02 的预告片，并宣布将于 8 月 6（明）日正式发布。预告片的重点在于这款机器人的硬件。其展示了 Figure 02 的关节、肢体细节，手指运动相当灵活，关节活动度可达 195°、扭矩额定值高达 150N・m。Figure AI 创始人 Brett Adcock 更是宣称，Figure 02 将是地球上最先进的人形机器人。该公司曾在今年 3 月展示了 Figure 01 的技能和参数。据A

谷歌超 25 亿美金收购 Character AI；曝英伟达 AI 芯片遇重大设计缺陷，数百亿美元订单将受影响丨AI情报局

今日融资快报谷歌超 25 亿美金收购 Character AI 并收编团队Character.AI 在官方博客 C.AI 上宣布了与 Google 的并购协议。谷歌已同意支付模型授权费，并聘请其核心创始人 Noam Shazeer 和 Daniel De Freitas ，以及Character 从事模型训练和语音人工智能工作的员工（约130名员工中的30名），参与Gemini AI项目。谷歌以25亿美元的估值向Character.AI 的投资者支付等数额的股权价值，未跟随进入谷歌的员工手里的期权将会以每股 88 美元的价格回购，这大约是Character.AI2023 年 A 轮融资股票价值的 2.5 倍。

中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元居首

感谢据腾讯科技今日报道，中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元大模型位居国内大模型首位（71.95 分）。腾讯科技方面宣称，该模型准确识别图像元素并生成自然语言描述，全方位理解并洞察细节。此次测评覆盖了 12 个国内外高代表性的多模态理解大模型，腾讯混元模型在多模态基础能力和应用能力中获得 71.95 的分数。AI在线查询得知，8 月榜单中涵盖国内外最具代表性的 12 个多模态理解大模型。腾讯混元大模型在总榜上位居第二，仅次于 GPT-4o。GPT-4o 取得 74.36 分，领跑

4400字深度分析！别担心 AI 取代B端设计师

最近大广赛作为评委去北京，和不少大学教授还有大厂的朋友们交流，其中交流最多的部分就是 AI 的应用场景和影响。其中，AI 对传统设计、插画类行业的影响是非常深刻的，高校几乎都要展开自救做出对应调整，这个以后有空再聊。而我们今天讨论的，就是 AI 在 B 端设计方向的应用方法，以及我们应该如何应对。一、B 端设计领域的 AI 应用大多数同学目前对 AI 应用的认识只有文生图、对话、驾驶等领域，但 AI 应用的场景远远不止它们。和头部的明星 AI 产品、模型相比，细分市场的 AI 应用就非常没有存在感了。比如使用

OpenAI 承认正研发 ChatGPT 文本水印，但面临挑战

据《华尔街日报》报道，OpenAI 已经开发出一款能够高精度识别 ChatGPT 生成文本的工具，但迟迟未发布。对此 OpenAI 进行了回应，承认正在研究文本水印技术，但表示这项技术仍存在诸多挑战。图源 Pexels据AI在线了解，通过文本水印，OpenAI 将只专注于检测来自 ChatGPT 的文字，而不是来自其他公司模型的文字。其将通过对 ChatGPT 选择单词的方式进行微小的更改来实现这一点，本质上是在文字中创建一个不可见的水印，以后可以被一个单独的工具检测到。OpenAI 称，文本水印是他们探索的多种解

糖蛋白组学新方法，复旦开发基于Transformer和GNN的混合端到端框架，登Nature子刊

编辑 | 萝卜皮蛋白质糖基化是糖基对蛋白质进行的一种翻译后修饰，在细胞的多种生理和病理功能中起着重要作用。糖蛋白质组学是在蛋白质组范围内研究蛋白质糖基化，利用液相色谱与串联质谱 (MS/MS) 联用技术获取糖基化位点、糖基化水平和糖结构的组合信息。然而，由于结构决定离子的出现有限，目前糖蛋白质组学的数据库搜索方法通常难以确定聚糖结构。虽然光谱搜索方法可以利用碎片强度来促进糖肽的结构鉴定，但是光谱库构建的困难阻碍了它们的应用。在最新的研究中，复旦大学的研究人员提出了 DeepGP，一种基于 Transformer 和

00后CEO杨丰瑜：耶鲁博士回国创业，五个月造出首款「可量产」人形机器人｜AI Pioneer

人类正在迎来人工智能领域的爆炸式更新，技术向未知拓展的每一步，几乎都引起惊人的关注度。在人工智能边界扩张的过程中，重要赛道的技术路线创新与分歧并存。技术先锋者的判断和选择，影响着众多跟随者的脚步。过去一年，AI在线独家率先将月之暗面、生数科技、爱诗科技、无问芯穹等优秀公司介绍给大家，为他们在互联网世界留下了第一份 “万字访谈底稿”。在技术路线尚未收敛的阶段，我们看到了到真正拥有信念、勇气以及系统化认知的 AI 创业者的引领力量。因此，我们推出 “AI Pioneers” 的专栏，希望继续寻找和纪录 AGI 时代人工

英伟达回应 AI 芯片短缺：Blackwell 样品广泛试用，下半年增加量产

据第一财经报道，针对英伟达 AI 芯片被曝推迟发布的消息，8 月 4 日，英伟达方面回应记者称：“正如我们之前所说，Hopper 的需求非常强劲，Blackwell 的样品试用已经广泛开始，产量有望在下半年增加。除此之外，我们不对谣言发表评论。”此前 The Information 报道称，英伟达 AI 芯片设计缺陷可能会导致发布推迟三个月或更长时间，影响 Meta、谷歌和微软等客户。据AI在线此前报道，今年 7 月，英伟达为满足客户需求，向台积电追加 4nm 芯片订单，Blackwell 平台 GPU 芯片投片量

可解释性终极追问，什么才是第一性解释？20篇CCF-A+ICLR论文给你答案

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者为张俊鹏、任启涵、张拳石，其中张俊鹏是张拳石老师的准入学博士生，任启涵是张拳石老师的博士生。本文首先简单回顾了『等效交互可解释性理论体系』（20 篇 CCF-A 及 ICLR 论文

阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

你规定路线，Tora 来生成相应轨迹的视频。目前，扩散模型能够生成多样化且高质量的图像或视频。此前，视频扩散模型采用 U-Net 架构，主要侧重于合成有限时长（通常约为两秒）的视频，并且分辨率和纵横比受到固定限制。Sora 的出现打破了这一限制，其采用 Diffusion Transformer（DiT）架构，不仅擅长制作 10 到 60 秒的高质量视频，而且还因其生成不同分辨率、各种纵横比、且遵守实际物理定律的能力而脱颖而出。可以说 Sora 是 DiT 架构最有利的证明，然而，基于 Transformer 的