资讯列表
GPT-5 要等到明年?OpenAI CEO:今年无法同时发布那么多东西
美国时间周四,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)透露,该公司的下一个大型人工智能模型可能不会在今年面世,原因是其正“优先开发”当前专注于推理与难题解决的模型。 在参与 Reddit 网站的网友问答活动时,奥特曼指出:“所有模型都变得越来越复杂,我们无法像我们希望的那样同时发布那么多东西。 ”他还解释称,在为“众多卓越创意”分配计算资源时,公司面临着“诸多限制和艰难抉择”。
AI 生成游戏引争议:Oasis 模型涉嫌抄袭《我的世界》,且质量堪忧
AI 公司 DecartAI 联合 Etched 推出了名为 Oasis 的世界模型,可以在“没有游戏引擎、没有逻辑、没有代码”的情况下运行一个大致近似于《我的世界》的游戏。 然而,这款 AI 生成的“游戏”却引发了广泛的批评和争议。 然而,Oasis 的画面质量令人失望,分辨率和帧率分别为 360p 和以 20 FPS,甚至不如任天堂 64 时代的游戏。
提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。
RAG新突破:块状注意力机制实现超低延迟检索增强
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
LLM 比之前预想的更像人类,竟也能「三省吾身」
子曾经曰过:「见贤思齐焉,见不贤而内自省也。 」自省可以帮助我们更好地认识自身和反思世界,对 AI 来说也同样如此吗? 近日,一个多机构联合团队证实了这一点。
刚刚,阿里全球数学竞赛决赛结果公布,姜萍违反预选赛规则未获奖
刚刚,2024 阿里巴巴全球数学竞赛决赛结果正式公布! 共有86名选手获奖,其中金奖5名,银奖10名,铜奖20名,优秀奖51名。 与初赛不分方向不同,决赛设有代数与数论、几何与拓扑、分析与方程、组合与概率、计算与应用数学五个赛道,每个赛道评出金奖 1 名、银奖 2 名、铜奖 4 名以及优秀奖 10 名,先前备受关注的江苏17岁中专生姜萍无缘奖项。
普渡发布 11 自由度五指灵巧手 PUDU DH11:单手最大提拉负载 40kg
继今年 9 月发布旗下首款类人形机器人 PUDU D7 后,普渡机器人于 10 月 31 日发布 11 自由度五指灵巧手 PUDU DH11。 AI在线获悉,基于仿人五指设计,PUDU DH11 拥有 11 自由度,搭载 12 个触觉传感器区域;内置 1018 个感应矩阵点数;单手最大提拉重量 40kg。 PUDU DH11 采用仿人手结构的绳驱方案及欠驱动机构,降低自身重量及空间占用,相比传统方案具备更高的灵活性和柔顺度。
支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级
中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。 时隔不到半年,TeleAI 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。 与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。
马斯克老部下创业成果:2mm 芯片植入视网膜,盲人重获阅读能力还能打牌
把一块 2mm 大小的芯片植入视网膜,搭配一副带摄像头的眼镜,就能成功让盲人恢复视力! 不仅重拾阅读能力,甚至还能打牌。 这是来自美国加州的脑机接口公司 Science 的最新进展。
每帧都是AI实时生成的,全球首款AI游戏问世了!
欢迎来到 Transformer 的世界。 两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。 他们实现了历史性的突破,从此不再需要游戏引擎,AI 能基于扩散模型,为玩家生成实时可玩的游戏。
理所当然也能错,数学界震动:「上下铺猜想」被证伪
现代数学,开始对你的直觉开刀了。 数学的很大一部分是由直觉驱动的,但有时想当然会让人误入歧途。 早期的证据可能并不代表大局,一个陈述可能看起来很明显,但一些隐藏的微妙之处会自行显露出来。
谷歌内部项目:大模型AI智能体发现了代码漏洞
开源数据库引擎 SQLite 有 bug,还是智能体检测出来的! 通常,软件开发团队会在软件发布之前发现软件中的漏洞,让攻击者没有破坏的余地。 模糊测试 (Fuzzing)是一种常见的软件测试方法,其核心思想是将自动或半自动生成的随机数据输入到一个程序中,并监视程序异常。
MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
谷歌 Agent 首次发现真实世界代码漏洞:抢救全球数亿设备,有望挽回数十亿美元损失
AI 首次发现真实世界中的重大安全漏洞? SQLite 中的一个漏洞,幸运地被谷歌研究者的 AI Agent 发现了,修复后并未造成任何损失。 莫非 AI 再进化一番,微软的全球蓝屏事故就可以永久避免了?
迪士尼成立新 AI 部门,探索人工智能、混合现实等新型技术的潜力
据路透社报道,华特迪士尼正在组建一个新的小组,以协调公司对人工智能和混合现实等新兴技术的使用,这家媒体巨头正积极探索 AI 等技术在电影、电视和主题公园等业务中的潜力。 根据路透社当地时间周五获取的电子邮件,新成立的“技术赋能办公室”(Office of Technology Enablement)将由杰米・沃里斯(Jamie Voris)领导,他是迪士尼电影制片厂的首席技术官,此前主导了迪士尼为苹果 Vision Pro 混合现实设备开发应用的工作。 迪士尼娱乐联合主席艾伦・伯格曼(Alan Bergman)在邮件中写道:“人工智能和 XR(扩展现实)技术发展迅速,将对未来的消费者体验、创意项目以及我们的业务产生深远影响。
苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型
《洛杉矶时报》昨日(11 月 1 日)发布博文,报道称苹果研究团队测试了 20 个最先进的 AI 模型,发现在有干扰项存在的情况下,它们处理简单的算术问题时表现不佳,甚至不如小学生。 苹果公司用以下这道简单的算术题测试 20 多个最先进的 AI 模型,AI在线附上题目如下:Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃,星期日采摘的数量是星期五的两倍,不过其中有 5 个猕猴桃的块头要比平均值要小,请问 Oliver 这三天共摘了多少个猕猴桃? 正确答案是 190 个,计算公式为 44(星期五) 58(星期六) 88(44*2,星期日)。