模型

特朗普一上台，拜登AI禁令被秒撤！硅谷科技「壕客」齐聚就职典礼现场

特朗普上任，美国科技巨头「春天到了」！在特朗普第二次就职典礼上，扎克伯格、贝索斯、皮查伊和马斯克坐在显要席位上，据报道比特朗普的内阁成员还要靠前。而苹果CEO库克位置相对靠后，与欧洲首富、印度首富等坐一起。

1/21/2025 1:50:00 PM

新智元

AI盈利难、机器人泡沫多！马库斯25年AI预测，隔空喊话马斯克

去年，马库斯对于AI趋势的预测几乎全部正确，但完全没想到OpenAI可以估值到1500亿美元。在本月2日，马库斯发表了对2025年的25个AI预测，涵盖AGI、GenAI、自动驾驶、人形机器人、智能体等多个方向。马斯克（Elon Musk），曾预测2025年底的AI能力：「我们就会拥有比任何人都聪明的AI」。

1/21/2025 1:21:45 PM

新智元

AI智能体2小时击败人类，引爆贝叶斯推理革命！仅用10%数据训练秒杀大模型

最近，Verses团队在AI领域投下了一枚重磅炸弹，他们自研的Genius智能体，创造了一个几乎不可能的奇迹——只用10%数据，训练2小时，就能打造出最强AI智能体！在经典游戏Pong中，Genius智能体多次达到完美的20分，一举超越了苦练数天的其他AI，和顶尖的人类玩家。更让人惊掉下巴的是，它的规模只有SOTA模型IRIS的4%（缩小了96%），直接在搭载M1芯片的MacBook上就能跑。

1/21/2025 1:15:37 PM

新智元

AI大牛颜水成宣布回归学界！重返新加坡国立任特聘教授，专注e-AGI研究

在产业界兜兜转转几年后，颜水成再次选择回归学界——重返新加坡国立大学NUS，担任计算机系特聘教授。没错，就是他第一个教职所在地，也是他声名鹊起的地方。而距离他上一次动向，过去不到三个月。

1/21/2025 12:47:20 PM

量子位

OpenAI智能体新线索曝光！网友：新ChatGPT时刻要来了

没错，OpenAI的智能体时代真的要来了！据大名鼎鼎的“情报员”光头哥爆料，OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项。从截图来看，确实是传闻已久、代号为“Operator（操作员）”的辣个：而且这则爆料也得到了日常关注苹果方面消息的博主@M1的再次佐证：Operator正在内测中，即将上线MAC版ChatGPT桌面应用……根据介绍，Operator能够接管用户PC，直接代替人类自主执行一系列操作（如编码开发应用、订餐，做攻略等等）。

1/21/2025 12:44:50 PM

量子位

「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了

昨晚，大模型领域再次「热闹起来」，月之暗面发布在数学、代码、多模态推理能力层面全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。而最近大热的 DeepSeek 正式推出了 DeepSeek-R1，同样在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。去年 12 月开源的大模型 DeepSeek-V3 刚刚掀起了一阵热潮，实现了诸多的不可能。

1/21/2025 11:53:53 AM

机器之心

CVPR 2024 Spotlight | 解锁图像编辑新境界, 北大、腾讯提出DiffEditor，让精细编辑更简单！

本文经AIGC Studio公众号授权转载，转载请联系出处。在图像生成领域，大型文本到图像（T2I）扩散模型近年来取得了革命性的突破。然而，将这些强大的生成能力转化为精细的图像编辑任务，仍面临诸多挑战。

1/21/2025 10:45:00 AM

AIGC Studio

OminiControl：一个新的FLUX通用控制模型，单个模型实现图像主题控制和深度控制

OminiControl 也开源了其可控生成模型。 OminiControl 是一个最小但功能强大的FLUX通用控制框架，可以一个模型实现图像主题控制和深度控制。比如一个提示词加一个服装图片就能让生成的人物穿上服装。

1/21/2025 10:20:00 AM

AIGC Studio

DeepSeek是新源神！推理模型o1性能1/50价格，微调/数据/商用全免费，蒸馏1.5B小模型可比GPT-4o

DeepSeek新发布远超预期，Reddit/𝕏狂暴刷屏中。这次大事共有3件：开源DeepSeek-R1推理大模型，与o1性能相近。开源DeepSeek-R1-Zero，预训练模型直接RL，不走SFT，堪称语言模型的AlphaZero。

1/21/2025 10:10:56 AM

港科大提出端侧文生图模型SnapGen，参数仅SD十分之一，1.4秒内生成1024分辨率图像

本文经AIGC Studio公众号授权转载，转载请联系出处。这项工作提出了一种新颖且高效的 T2I 模型SnapGen，SnapGen 是第一个可以在1.4秒内在移动设备上合成高分辨率图像（1024x1024 ）的图像生成模型（379M ），并在 GenEval 指标上达到0.66。该模型全面超越了许多现有的数十亿参数模型，例如 SDXL、Lumina-Next 和 Playgroundv2。

1/21/2025 9:50:00 AM

AIGC Studio

震惊 AI 界！DeepSeek-R1 ：纯RL打造推理王者，AI 自主学习里程碑「技术报告解读」

刚看完DeepSeek R1技术报告论文《DeepSeek-R1：强化学习驱动的大语言模型推理能力提升》，这篇论文最令人震惊的点在于：DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调（SFT）数据，仅通过纯粹的强化学习（RL）训练的模型，展现出了惊人的推理能力，推理基准测试上可以媲美乃至超越 OpenAI 的 o1 系列模型（如 o1-0912），完全开源，报告毫无保留的奉上了R1的训练秘密，值得注意的是，这是第一个开放研究验证了 LLM 的推理能力可以完全通过 RL 来激励，而不需要 SFT。这一突破为该领域的未来发展铺平了道路具体来说，以下几点尤其令人震惊：纯 RL 的成功：以往的模型在提升推理能力时，通常依赖于 SFT 作为预训练步骤。 DeepSeek-R1-Zero 打破了这一常规，证明了仅通过设计合适的奖励机制和训练模板，就可以让模型在没有 SFT 的情况下（冷启动），通过自我博弈和进化，自发地学习到复杂的推理策略，这让我想起了AlphaZero--从零开始掌握围棋、将棋和国际象棋，而无需先模仿人类大师的棋步，这是整个技术报告最重要的启示惊人的性能提升： DeepSeek-R1-Zero 在 AIME 2024 基准测试上，pass@1 分数从 15.6% 提升到了 71.0%，通过多数投票更是达到了 86.7%，与 OpenAI-01-0912 的表现相当甚至更好。

1/21/2025 9:36:51 AM

AI寒武纪

Kimi硬刚多模态满血版o1，首曝训练细节！强化学习scaling新范式诞生

还记得吗，AI大神Karpathy曾说过，「英文是最热门的编程语言」。两年后的现在，这个规则彻底要被颠覆了。从今天起，中文很有可能成为全球最热门的编程语言！

1/21/2025 9:00:00 AM

新智元

不到4小时，谷歌Gemini写完10万字商业战略书籍！人类全程没碰一个字

「文章本天成，妙手偶得之。」本来充满创意与想象的写作，LLM已经可以上手了。这次更是直接，LLM不光可以写文章了，大部头的书籍也要被拿下了？

1/21/2025 8:30:00 AM

新智元

追平满血版o1的国产多模态模型终于来了！训练细节全部公开

春节前最后一周，能媲美 Open AI 满血版 o1（Full Version，而非 preview）的模型终于出现了！刚刚，月之暗面公布了他们的 Kimi k 系列模型最新版本 ——k1.5 多模态思考模型。新模型在数学、代码、多模态推理能力等方面全面对标 Open AI 满血版 o1，而且是 OpenAI 之外首个多模态 o1。

1/21/2025 8:00:00 AM

机器之心

给大模型制作图文并茂的教科书: 从2.5年的教学视频里挖掘多模态语料

近期关于 scaling law 的讨论甚嚣尘上，很多观点认为 scale law is dead. 然而，我们认为，高质量的 “无监督” 数据才是 scaling law 的关键，尤其是教科书级别的高质量的知识语料。此外，尽管传统的语料快枯竭了，但是互联网上还有海量的视频并没有被利用起来，它们囊括了丰富的多种模态的知识，可以帮助 VLMs 更好好地理解世界。

1/20/2025 4:17:58 PM

机器之心