AI资讯列表 - AI在线

李飞飞亲自撰文：大模型不存在主观感觉能力，多少亿参数都不行

归根结底，大模型的方向还是走错了？「空间智能是人工智能拼图中的关键一环。」知名「AI 教母」李飞飞曾这样表示。近段时间，李飞飞开始把目光瞄准到这一领域，并为此创建了一家初创公司。她曾表示，「大自然创造了一个以空间智能为动力的观察和行动的良性循环。」她所在的斯坦福大学实验室正在尝试教计算机「如何在三维世界中行动」，例如，使用大型语言模型让一个机械臂根据口头指令执行开门、做三明治等任务。我们不难看出，李飞飞口中的空间智能也有大模型的参与。如今，随着技术的发展，LLM 在多个方面表现出超人类智能。然而关于 LLM 的争议

通用世界模型问世：不学习就能生成新领域视频，可实时控制

这才是 AI 视频生成的未来？随着 OpenAI 今年 2 月发布 Sora，世界模型（World Model）再次成为了 AI 领域的热门。世界模型，即通过预测未来的范式对数字世界和物理世界进行理解，一直以来被认为是通往通用人工智能（AGI）的关键路径之一，与当前大模型推崇的智能体（Agent）方向互相区分。世界模型的研究促进了交互式内容的创建，并为有根据的、长期的推理提供了基础。当前的基础模型并不能完全满足通用世界模型的功能——大型语言模型（LLM）受到对语言模态的依赖以及对物理世界有限理解的限制，而视频模型（

OpenAI 陷史上最大危机：阿尔特曼否认霸王条款急推背锅侠，网友称其撒谎成性

【新智元导读】这几天的 OpenAI，已经是乱成一锅粥了！GPT-4o「偷」寡姐声音的事儿还没完，外媒又曝出了 OpenAI 的内部信，证明员工确实面临失去股权的风险。不可思议的是，文件上明明有 Altman 的签名，他却矢口否认：我完全不知道有这事啊。OpenAI 的宫斗后续，还没完。之前的说法是，未签署离职文件的前员工，会面临失去股权的风险。就在刚刚，外媒 Vox 曝出，OpenAI 领导层表示，自己完全不知道这回事啊！然而，OpenAI 的相关文件上，却赫然出现了他们的签名。深入调查下去，整件事都是重重迷雾。

从80个模型中构建Scaling Law：华人博士生新作，思维链提出者力荐

在 AI 领域，扩展定律（Scaling laws）是理解 LM 扩展趋势的强大工具，其为广大研究者提供了一个准则，该定律在理解语言模型的性能如何随规模变化提供了一个重要指导。但不幸的是，扩展分析在许多基准测试和后训练研究中并不常见，因为大多数研究人员没有计算资源来从头开始构建扩展法则，并且开放模型的训练尺度太少，无法进行可靠的扩展预测。来自斯坦福大学、多伦多大学等机构的研究者提出了一种替代观察法：可观察的扩展定律（Observational Scaling Laws），其将语言模型 (LM) 的功能与跨多个模型系

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者袁镱博士是腾讯公司专家工程师，负责无量系统和一念LLM等机器学习训练和推理框架研发。以 OpenAI 的 GPT 系列模型为代表的大语言模型（LLM）掀起了新一轮 AI 应用浪潮，

OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺

人工智能（AI）的安全问题，正以前所未有的关注度在全球范围内被讨论。日前，OpenAI 联合创始人、首席科学家 Ilya Sutskever 与 OpenAI 超级对齐团队共同领导人 Jan Leike 相继离开 OpenAI，Leike 甚至在 X 发布了一系列帖子，称 OpenAI 及其领导层忽视安全而偏爱光鲜亮丽的产品。这在业界引起了广泛关注，在一定程度上凸显了当前 AI 安全问题的严峻性。5 月 21 日，图灵奖得主 Yoshua Bengio、Geoffrey Hinton 和姚期智联合国内外数十位业内专

世界模型也扩散！训练出的智能体竟然不错

在图像生成领域占据主导地位的扩散模型，开始挑战强化学习智能体。世界模型提供了一种以安全且样本高效的方式训练强化学习智能体的方法。近期，世界模型主要对离散潜在变量序列进行操作来模拟环境动态。然而，这种压缩为紧凑离散表征的方式可能会忽略对强化学习很重要的视觉细节。另一方面，扩散模型已成为图像生成的主要方法，对离散潜在模型提出了挑战。受这种范式转变的推动，来自日内瓦大学、爱丁堡大学、微软研究院的研究者联合提出一种在扩散世界模型中训练的强化学习智能体 —— DIAMOND（DIffusion As a Model Of e

估值有望超 240 亿美元，消息称马斯克 xAI 公司下月完成一轮融资

感谢据彭博社援引知情人士透露，马斯克的人工智能公司 xAI 将于 6 月完成一轮融资，融资后估值可能超过 240 亿美元（IT之家备注：当前约 1740 亿元人民币）。报道称，该公司原定于本月早些时候完成约 60 亿美元（当前约 435 亿元人民币）的融资，但自去年以来一直在进行的交易尚未最终完成。这位要求匿名的人士表示，xAI 最近一直在寻求高达 65 亿美元（当前约 471.25 亿元人民币）的资金，并计划在未来几周内更接近这一目标。xAI 于 2023 年 7 月成立，去年 11 月推出首款产品 Grok 聊

WAIC · 云帆奖五周年：AI 青年，执掌未来十年的钥匙

哪些前沿研究将定义未来十年的 AI 发展？如何推动人工智能技术实现进一步的重大突破？谁又是引领这些变革的关键人物？这是一场关于未来的竞赛，一场关乎人类智慧极限的探索。WAIC · 云帆奖于 2020 年发起设立，由机器之心、上海人工智能实验室、全球高校人工智能学术联盟和 AI 青年科学家联盟负责评选和运营，旨在表彰那些在 AI 领域乘风破浪、勇立潮头的杰出青年人才。2024 年 WAIC・云帆奖以「超越与联结」为主题，继续发掘和表彰 AI 青年先锋。截至目前，2024 WAIC · 云帆奖征集已进入 24 小时倒计

时隔一天，百川大模型拿下国产第一，AI助手「百小应」上线

目标大模型「超级应用」。最近几天，国内 AI 创业公司正在连续刷新大模型的能力上限。5 月 22 日，百川智能发布最新一代基座大模型 Baichuan 4，同时推出了首款 AI 助手「百小应」。相较 1 月份发布的 Baichuan 3，新一代模型在各项能力上均有大幅提升，其中通用能力提升超过 10%，数学和代码能力分别提升 14% 和 9%，在国内权威大模型评测机构 SuperCLUE 的评测中，Baichuan-4 大模型能力排名国内第一，超越了 SenseChat V5。「在通往 AGI 的路上，我们需要超级

具身智能体三维感知新链条，TeleAI &上海AI Lab提出多视角融合具身模型「SAM-E」

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]当我们拿起一个机械手表时，从正面会看到表盘和指针，从侧面会看到表冠和表链，打开手表背面会看到复杂的齿轮和机芯。每个视角都提供了不同的信息，将这些信息综合起来才能理解操作对象的整体三维。想让

大模型与具身智能的火花，ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

Workshop主页：，多模态基础模型（MFM），例如 CLIP、ImageBind、DALL・E 3、GPT-4V、Gemini 和 Sora，已成为人工智能领域最引人注目且发展迅速的领域之一。同时，MFM 的开源社区也涌现出了诸如 LLaVA、LAMM、MiniGPT-4、Stable Diffusion 和 OpenSora 等具有代表性的开源项目。不同于传统计算机视觉和自然语言处理模型，这类 MFM 正在积极探索通用问题解决方案。通过引入 MFM，具身智能（EAI）能够在模拟器和现实世界环境中更好地处理各种

阿里投资 Kimi AI 开发商月之暗面：8 亿美元购入约 36% 股权

据阿里巴巴财报披露，该公司于 2024 财年向人工智能初创公司月之暗面（Moonshot AI）投资合共约 8 亿美元（IT之家备注：当前约 59 亿元人民币），购入约 36% 股权，为于月之暗面的优先股投资。阿里巴巴集团主席蔡崇信和首席执行官吴泳铭在股东信中写道，该公司“将 AI 作为改变和加速业务增长的最强大变量”。这封致股东信表示，在过去的 25 年内，阿里经历了不断成长，也出现了一些“大公司病”的症状。接下来，公司将积极对“大公司病”开刀，并保持创业精神。“在接下来的 10 年里，我们将再次视自己为一家初创

微软 Start 天气预测模型再进化，可预测何时出现云层和降水

微软 Start 团队今天通过必应官方博客发布博文，宣布 AI 天气预测模型又有重大改进，能更准确预报未来 30 天天气情况之外，现在预测何时可能出现云层和降水。博文中微软 Start 团队表示已经于 2021 年年底开始，着手改进全球范围内的“降水预报”系统。该模型不仅会调用雷达装置收集的数据，还会结合卫星数据，通过 AI 算法分析，能更准确地预测降水情况。不过微软 Start 团队也坦言该预测模型存在不足，卫星天气数据每日的接收时间比例为 85% 至 95%，但取决于数据的来源和可接受的延迟时间。微软表示：有证

秒杀 Canny ! 一文详解2款 ControlNet 新模型 Anyline ＆ Mistoline

大家好，这里是和你们一起探索 AI 的花生~ 最新 ControlNet 有两款新模型非常热门，一个是用于提取图像线稿的预处理模型 Anyline，一个是 SDXL 线条类控制模型 Mistoline。它们不仅单独的功能强于目前的 canny、lineart、softedge 等模型，组合在一起更是可以快速准确地处理超复杂的图像，今天就为大家详细介绍一下它们的特点和用法。相关推荐：一、Anyline Anyline 是一款新的线条类预处理模型，可以从大部分图像中快速提取高精度的线稿图。与其他常用的线条预处理器相比

回望 AI 大爆炸的前夜，他们是这样预测未来的

这篇文章发布于 2022 年 9 月，在 GPT-3.5 即将引起全球关注的前夜。如今 AI 的生态日新月异，两年后的我们再回顾这篇文章时，仍能深切感受到，最初的探索者对生成式 AI 未来发展所构想的蓝图如此清晰而具有前瞻性。在大模型应用日益丰富多彩的当下，这篇文章可以是理解和探索生成式 AI 潜力的宝贵资料。 AI 最新动态：人类擅长分析事物，机器则更胜一筹。无论是欺诈或垃圾邮件检测、预测快递的预计到达时间，还是预测下一个要向您展示的 TikTok 视频，机器都能从数据中找出模式，以满足多种用途的需要。它们在这些

AI应用实战！如何用 Stable Diffusion 提高设计效率？

继去年发表了多篇赶集视觉 AIGC 探索的文章后，本期首次呈现 AIGC 能力在大型项目中的设计过程与创新应用，我们期待与大家深入交流和共同学习。一、前言回顾 2024 年赶集新春招聘活动的设计项目中，我们采用了创新手段，将春节文化与招聘场景巧妙融合，提升了用户的求职体验和视觉感受。同时，本篇文章还将详细探讨如何借助 AIGC 技术打造独树一帜的视觉创意设计，为求职者打造一个充满吸引力的招聘活动。二、主题内容设定 1. 视觉主题设定随着 2024 年——甲辰龙年的到来，龙象征的形象成为本次活动设计的焦点。经过深

赛诺菲与OpenAI、Formation Bio合作，加速AI药物发现

编辑 | X5 月 21 日，法国制药公司赛诺菲（Sanofi）宣布与 OpenAI 和美国生物技术公司 Formation Bio 建立合作伙伴关系，以加速人工智能在药物开发中的应用。此次合作将改变制药行业的游戏规则。通过结合数据、人工智能技术和药物开发方面的专业知识，他们的目标是彻底改变新药的发现和推向市场的方式。赛诺菲首席执行官 Paul Hudson 表示：「这次合作是我们成为一家以人工智能为动力的制药公司的重要一步。」OpenAI 首席运营官 Brad Lightcap 表示：「AI 在加速药物开发方面具