AI资讯列表 - AI在线

世界首个1000亿AI智能体文明诞生！北大校友打造真实版「西部世界」，技术细节全公开

世界首个「AI智能体文明」，终于揭秘了！ 2个月前，1000 多个智能体在虚拟世界中，一同协作构建起自己的经济、文化、宗教和政府......网友纷纷惊呼，堪称现实版「西部世界」。如今，这个文明再次进化了，1000亿AI智能体文明的世界又是怎样的？

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

一群大模型玩你画我猜，人类一旁围观超起劲儿。就像下面这张图展示的，由Grok画长颈鹿，一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。

大模型压缩KV缓存新突破，中科大提出自适应预算分配，工业界已落地vLLM框架

改进KV缓存压缩，大模型推理显存瓶颈迎来新突破——中科大研究团队提出Ada-KV，通过自适应预算分配算法来优化KV缓存的驱逐过程，以提高推理效率。打破KV Cache压缩将所有注意力头分配相同压缩预算的常规做法，针对不同的注意力头进行适配性压缩预算分配展开来说，由于大模型在自回归生成过程中，每生成一个新token都需要将对应的KV矩阵存储下来，这导致缓存随着生成序列长度的增加而急剧膨胀，引发内存和I/O延迟问题，尤其在长序列推理中尤为突出。因此，KV缓存压缩成为了一项必要的优化。

基于关系型深度学习的自助机器学习

译者 | 朱先忠审校 | 重楼本文将探讨直接在关系数据库上执行机器学习的新方法——关系型深度学习。本文示例项目数据集的关系模式（作者提供图片）在本文中，我们将深入探讨一种有趣的深度学习（DL）新方法，称为关系型深度学习（RDL）。我们还将通过在一家电子商务公司的真实数据库（不是数据集！

3B模型打通机器人任督二脉！冲咖啡叠衣服都能干，7种形态适配，OpenAI也投了

只要一个3B参数的大模型，就能控制机器人，帮你搞定各种家务。叠衣服冲咖啡都能轻松拿捏，而且全都是由模型自主控制，不需要遥控。关键是，这还是个通用型的机器人控制模型，不同种类的机器人都能“通吃”。

2mm芯片植入视网膜，盲人重获阅读能力还能打牌，马斯克老部下创业成果来了

把一块2mm大小的芯片植入视网膜，搭配一幅带摄像头的眼镜，就能成功让盲人恢复视力！不仅重拾阅读能力，甚至还能打牌。这是来自美国加州的脑机接口公司Science的最新进展。

GPT-5 要等到明年？OpenAI CEO：今年无法同时发布那么多东西

美国时间周四，OpenAI 首席执行官萨姆・奥特曼（Sam Altman）透露，该公司的下一个大型人工智能模型可能不会在今年面世，原因是其正“优先开发”当前专注于推理与难题解决的模型。在参与 Reddit 网站的网友问答活动时，奥特曼指出：“所有模型都变得越来越复杂，我们无法像我们希望的那样同时发布那么多东西。 ”他还解释称，在为“众多卓越创意”分配计算资源时，公司面临着“诸多限制和艰难抉择”。

AI 生成游戏引争议：Oasis 模型涉嫌抄袭《我的世界》，且质量堪忧

AI 公司 DecartAI 联合 Etched 推出了名为 Oasis 的世界模型，可以在“没有游戏引擎、没有逻辑、没有代码”的情况下运行一个大致近似于《我的世界》的游戏。然而，这款 AI 生成的“游戏”却引发了广泛的批评和争议。然而，Oasis 的画面质量令人失望，分辨率和帧率分别为 360p 和以 20 FPS，甚至不如任天堂 64 时代的游戏。

提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。官方宣称，HybridFlow（开源项目名：veRL）是一个灵活且高效的大模型 RL 训练框架，兼容多种训练和推理框架，支持灵活的模型部署和多种 RL 算法实现。该框架采用混合编程模型，融合单控制器（Single-Controller）的灵活性和多控制器（Multi-Controller）的高效性，可更好实现和执行多种 RL 算法，显著提升训练吞吐量，降低开发和维护复杂度。

RAG新突破：块状注意力机制实现超低延迟检索增强

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

LLM 比之前预想的更像人类，竟也能「三省吾身」

子曾经曰过：「见贤思齐焉，见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界，对 AI 来说也同样如此吗？近日，一个多机构联合团队证实了这一点。

刚刚，阿里全球数学竞赛决赛结果公布，姜萍违反预选赛规则未获奖

刚刚，2024 阿里巴巴全球数学竞赛决赛结果正式公布！共有86名选手获奖，其中金奖5名，银奖10名，铜奖20名，优秀奖51名。与初赛不分方向不同，决赛设有代数与数论、几何与拓扑、分析与方程、组合与概率、计算与应用数学五个赛道，每个赛道评出金奖 1 名、银奖 2 名、铜奖 4 名以及优秀奖 10 名，先前备受关注的江苏17岁中专生姜萍无缘奖项。

普渡发布 11 自由度五指灵巧手 PUDU DH11：单手最大提拉负载 40kg

继今年 9 月发布旗下首款类人形机器人 PUDU D7 后，普渡机器人于 10 月 31 日发布 11 自由度五指灵巧手 PUDU DH11。 AI在线获悉，基于仿人五指设计，PUDU DH11 拥有 11 自由度，搭载 12 个触觉传感器区域；内置 1018 个感应矩阵点数；单手最大提拉重量 40kg。 PUDU DH11 采用仿人手结构的绳驱方案及欠驱动机构，降低自身重量及空间占用，相比传统方案具备更高的灵活性和柔顺度。

支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级

中国电信人工智能研究院（TeleAI）在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。时隔不到半年，TeleAI 星辰语音大模型的多方言能力再次升级，攻克了湛江话、宜宾话、洛阳话、烟台话等方言，将方言种类从 30 种提升至 40 种，并引入对英文的识别。与传统的有标注训练方法相比，TeleAI 通过预训练语音识别模型，利用海量无标注数据进行预训练，再通过少量有标注数据进行微调。

马斯克老部下创业成果：2mm 芯片植入视网膜，盲人重获阅读能力还能打牌

把一块 2mm 大小的芯片植入视网膜，搭配一副带摄像头的眼镜，就能成功让盲人恢复视力！不仅重拾阅读能力，甚至还能打牌。这是来自美国加州的脑机接口公司 Science 的最新进展。

每帧都是AI实时生成的，全球首款AI游戏问世了！

欢迎来到 Transformer 的世界。两个月前，我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破，从此不再需要游戏引擎，AI 能基于扩散模型，为玩家生成实时可玩的游戏。

理所当然也能错，数学界震动：「上下铺猜想」被证伪

现代数学，开始对你的直觉开刀了。数学的很大一部分是由直觉驱动的，但有时想当然会让人误入歧途。早期的证据可能并不代表大局，一个陈述可能看起来很明显，但一些隐藏的微妙之处会自行显露出来。