资讯列表

世界首个1000亿AI智能体文明诞生!北大校友打造真实版「西部世界」,技术细节全公开

世界首个「AI智能体文明」,终于揭秘了! 2个月前,1000 多个智能体在虚拟世界中,一同协作构建起自己的经济、文化、宗教和政府......网友纷纷惊呼,堪称现实版「西部世界」。 如今,这个文明再次进化了,1000亿AI智能体文明的世界又是怎样的?

大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑

一群大模型玩你画我猜,人类一旁围观超起劲儿。 就像下面这张图展示的,由Grok画长颈鹿,一堆大模型根据生成内容猜答案。 参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。

大模型压缩KV缓存新突破,中科大提出自适应预算分配,工业界已落地vLLM框架

改进KV缓存压缩,大模型推理显存瓶颈迎来新突破——中科大研究团队提出Ada-KV,通过自适应预算分配算法来优化KV缓存的驱逐过程,以提高推理效率。 打破KV Cache压缩将所有注意力头分配相同压缩预算的常规做法,针对不同的注意力头进行适配性压缩预算分配展开来说,由于大模型在自回归生成过程中,每生成一个新token都需要将对应的KV矩阵存储下来,这导致缓存随着生成序列长度的增加而急剧膨胀,引发内存和I/O延迟问题,尤其在长序列推理中尤为突出。 因此,KV缓存压缩成为了一项必要的优化。

基于关系型深度学习的自助机器学习

译者 | 朱先忠审校 | 重楼本文将探讨直接在关系数据库上执行机器学习的新方法——关系型深度学习。 本文示例项目数据集的关系模式(作者提供图片)在本文中,我们将深入探讨一种有趣的深度学习(DL)新方法,称为关系型深度学习(RDL)。 我们还将通过在一家电子商务公司的真实数据库(不是数据集!

3B模型打通机器人任督二脉!冲咖啡叠衣服都能干,7种形态适配,OpenAI也投了

只要一个3B参数的大模型,就能控制机器人,帮你搞定各种家务。 叠衣服冲咖啡都能轻松拿捏,而且全都是由模型自主控制,不需要遥控。 关键是,这还是个通用型的机器人控制模型,不同种类的机器人都能“通吃”。

2mm芯片植入视网膜,盲人重获阅读能力还能打牌,马斯克老部下创业成果来了

把一块2mm大小的芯片植入视网膜,搭配一幅带摄像头的眼镜,就能成功让盲人恢复视力! 不仅重拾阅读能力,甚至还能打牌。 这是来自美国加州的脑机接口公司Science的最新进展。

GPT-5 要等到明年?OpenAI CEO:今年无法同时发布那么多东西

美国时间周四,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)透露,该公司的下一个大型人工智能模型可能不会在今年面世,原因是其正“优先开发”当前专注于推理与难题解决的模型。 在参与 Reddit 网站的网友问答活动时,奥特曼指出:“所有模型都变得越来越复杂,我们无法像我们希望的那样同时发布那么多东西。 ”他还解释称,在为“众多卓越创意”分配计算资源时,公司面临着“诸多限制和艰难抉择”。

AI 生成游戏引争议:Oasis 模型涉嫌抄袭《我的世界》,且质量堪忧

AI 公司 DecartAI 联合 Etched 推出了名为 Oasis 的世界模型,可以在“没有游戏引擎、没有逻辑、没有代码”的情况下运行一个大致近似于《我的世界》的游戏。 然而,这款 AI 生成的“游戏”却引发了广泛的批评和争议。 然而,Oasis 的画面质量令人失望,分辨率和帧率分别为 360p 和以 20 FPS,甚至不如任天堂 64 时代的游戏。

提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。

RAG新突破:块状注意力机制实现超低延迟检索增强

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]

幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]

LLM 比之前预想的更像人类,竟也能「三省吾身」

子曾经曰过:「见贤思齐焉,见不贤而内自省也。 」自省可以帮助我们更好地认识自身和反思世界,对 AI 来说也同样如此吗? 近日,一个多机构联合团队证实了这一点。

刚刚,阿里全球数学竞赛决赛结果公布,姜萍违反预选赛规则未获奖

刚刚,2024 阿里巴巴全球数学竞赛决赛结果正式公布! 共有86名选手获奖,其中金奖5名,银奖10名,铜奖20名,优秀奖51名。 与初赛不分方向不同,决赛设有代数与数论、几何与拓扑、分析与方程、组合与概率、计算与应用数学五个赛道,每个赛道评出金奖 1 名、银奖 2 名、铜奖 4 名以及优秀奖 10 名,先前备受关注的江苏17岁中专生姜萍无缘奖项。

普渡发布 11 自由度五指灵巧手 PUDU DH11:单手最大提拉负载 40kg

继今年 9 月发布旗下首款类人形机器人 PUDU D7 后,普渡机器人于 10 月 31 日发布 11 自由度五指灵巧手 PUDU DH11。 AI在线获悉,基于仿人五指设计,PUDU DH11 拥有 11 自由度,搭载 12 个触觉传感器区域;内置 1018 个感应矩阵点数;单手最大提拉重量 40kg。 PUDU DH11 采用仿人手结构的绳驱方案及欠驱动机构,降低自身重量及空间占用,相比传统方案具备更高的灵活性和柔顺度。

支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级

中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。 时隔不到半年,TeleAI 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。 与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。

马斯克老部下创业成果:2mm 芯片植入视网膜,盲人重获阅读能力还能打牌

把一块 2mm 大小的芯片植入视网膜,搭配一副带摄像头的眼镜,就能成功让盲人恢复视力! 不仅重拾阅读能力,甚至还能打牌。 这是来自美国加州的脑机接口公司 Science 的最新进展。

每帧都是AI实时生成的,全球首款AI游戏问世了!

欢迎来到 Transformer 的世界。 两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。 他们实现了历史性的突破,从此不再需要游戏引擎,AI 能基于扩散模型,为玩家生成实时可玩的游戏。

理所当然也能错,数学界震动:「上下铺猜想」被证伪

现代数学,开始对你的直觉开刀了。 数学的很大一部分是由直觉驱动的,但有时想当然会让人误入歧途。 早期的证据可能并不代表大局,一个陈述可能看起来很明显,但一些隐藏的微妙之处会自行显露出来。