AI资讯列表 - AI在线

GPT-5 要等到明年？OpenAI CEO：今年无法同时发布那么多东西

美国时间周四，OpenAI 首席执行官萨姆・奥特曼（Sam Altman）透露，该公司的下一个大型人工智能模型可能不会在今年面世，原因是其正“优先开发”当前专注于推理与难题解决的模型。在参与 Reddit 网站的网友问答活动时，奥特曼指出：“所有模型都变得越来越复杂，我们无法像我们希望的那样同时发布那么多东西。 ”他还解释称，在为“众多卓越创意”分配计算资源时，公司面临着“诸多限制和艰难抉择”。

AI 生成游戏引争议：Oasis 模型涉嫌抄袭《我的世界》，且质量堪忧

AI 公司 DecartAI 联合 Etched 推出了名为 Oasis 的世界模型，可以在“没有游戏引擎、没有逻辑、没有代码”的情况下运行一个大致近似于《我的世界》的游戏。然而，这款 AI 生成的“游戏”却引发了广泛的批评和争议。然而，Oasis 的画面质量令人失望，分辨率和帧率分别为 360p 和以 20 FPS，甚至不如任天堂 64 时代的游戏。

提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。官方宣称，HybridFlow（开源项目名：veRL）是一个灵活且高效的大模型 RL 训练框架，兼容多种训练和推理框架，支持灵活的模型部署和多种 RL 算法实现。该框架采用混合编程模型，融合单控制器（Single-Controller）的灵活性和多控制器（Multi-Controller）的高效性，可更好实现和执行多种 RL 算法，显著提升训练吞吐量，降低开发和维护复杂度。

RAG新突破：块状注意力机制实现超低延迟检索增强

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

LLM 比之前预想的更像人类，竟也能「三省吾身」

子曾经曰过：「见贤思齐焉，见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界，对 AI 来说也同样如此吗？近日，一个多机构联合团队证实了这一点。

刚刚，阿里全球数学竞赛决赛结果公布，姜萍违反预选赛规则未获奖

刚刚，2024 阿里巴巴全球数学竞赛决赛结果正式公布！共有86名选手获奖，其中金奖5名，银奖10名，铜奖20名，优秀奖51名。与初赛不分方向不同，决赛设有代数与数论、几何与拓扑、分析与方程、组合与概率、计算与应用数学五个赛道，每个赛道评出金奖 1 名、银奖 2 名、铜奖 4 名以及优秀奖 10 名，先前备受关注的江苏17岁中专生姜萍无缘奖项。

普渡发布 11 自由度五指灵巧手 PUDU DH11：单手最大提拉负载 40kg

继今年 9 月发布旗下首款类人形机器人 PUDU D7 后，普渡机器人于 10 月 31 日发布 11 自由度五指灵巧手 PUDU DH11。 AI在线获悉，基于仿人五指设计，PUDU DH11 拥有 11 自由度，搭载 12 个触觉传感器区域；内置 1018 个感应矩阵点数；单手最大提拉重量 40kg。 PUDU DH11 采用仿人手结构的绳驱方案及欠驱动机构，降低自身重量及空间占用，相比传统方案具备更高的灵活性和柔顺度。

支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级

中国电信人工智能研究院（TeleAI）在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。时隔不到半年，TeleAI 星辰语音大模型的多方言能力再次升级，攻克了湛江话、宜宾话、洛阳话、烟台话等方言，将方言种类从 30 种提升至 40 种，并引入对英文的识别。与传统的有标注训练方法相比，TeleAI 通过预训练语音识别模型，利用海量无标注数据进行预训练，再通过少量有标注数据进行微调。

马斯克老部下创业成果：2mm 芯片植入视网膜，盲人重获阅读能力还能打牌

把一块 2mm 大小的芯片植入视网膜，搭配一副带摄像头的眼镜，就能成功让盲人恢复视力！不仅重拾阅读能力，甚至还能打牌。这是来自美国加州的脑机接口公司 Science 的最新进展。

每帧都是AI实时生成的，全球首款AI游戏问世了！

欢迎来到 Transformer 的世界。两个月前，我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破，从此不再需要游戏引擎，AI 能基于扩散模型，为玩家生成实时可玩的游戏。

理所当然也能错，数学界震动：「上下铺猜想」被证伪

现代数学，开始对你的直觉开刀了。数学的很大一部分是由直觉驱动的，但有时想当然会让人误入歧途。早期的证据可能并不代表大局，一个陈述可能看起来很明显，但一些隐藏的微妙之处会自行显露出来。

谷歌内部项目：大模型AI智能体发现了代码漏洞

开源数据库引擎 SQLite 有 bug，还是智能体检测出来的！通常，软件开发团队会在软件发布之前发现软件中的漏洞，让攻击者没有破坏的余地。模糊测试（Fuzzing）是一种常见的软件测试方法，其核心思想是将自动或半自动生成的随机数据输入到一个程序中，并监视程序异常。

MetaGPT开源SELA，用AI设计AI，效果超越OpenAI使用的AIDE

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

NeurIPS 2024｜浙大 & 微信 & 清华：彻底解决扩散模型反演问题

谷歌 Agent 首次发现真实世界代码漏洞：抢救全球数亿设备，有望挽回数十亿美元损失

AI 首次发现真实世界中的重大安全漏洞？ SQLite 中的一个漏洞，幸运地被谷歌研究者的 AI Agent 发现了，修复后并未造成任何损失。莫非 AI 再进化一番，微软的全球蓝屏事故就可以永久避免了？

迪士尼成立新 AI 部门，探索人工智能、混合现实等新型技术的潜力

据路透社报道，华特迪士尼正在组建一个新的小组，以协调公司对人工智能和混合现实等新兴技术的使用，这家媒体巨头正积极探索 AI 等技术在电影、电视和主题公园等业务中的潜力。根据路透社当地时间周五获取的电子邮件，新成立的“技术赋能办公室”（Office of Technology Enablement）将由杰米・沃里斯（Jamie Voris）领导，他是迪士尼电影制片厂的首席技术官，此前主导了迪士尼为苹果 Vision Pro 混合现实设备开发应用的工作。迪士尼娱乐联合主席艾伦・伯格曼（Alan Bergman）在邮件中写道：“人工智能和 XR（扩展现实）技术发展迅速，将对未来的消费者体验、创意项目以及我们的业务产生深远影响。

苹果 AI 研究：“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型

《洛杉矶时报》昨日（11 月 1 日）发布博文，报道称苹果研究团队测试了 20 个最先进的 AI 模型，发现在有干扰项存在的情况下，它们处理简单的算术问题时表现不佳，甚至不如小学生。苹果公司用以下这道简单的算术题测试 20 多个最先进的 AI 模型，AI在线附上题目如下：Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃，星期日采摘的数量是星期五的两倍，不过其中有 5 个猕猴桃的块头要比平均值要小，请问 Oliver 这三天共摘了多少个猕猴桃？正确答案是 190 个，计算公式为 44（星期五） 58（星期六） 88（44*2，星期日）。