AI
AI盈利难、机器人泡沫多!马库斯25年AI预测,隔空喊话马斯克
去年,马库斯对于AI趋势的预测几乎全部正确,但完全没想到OpenAI可以估值到1500亿美元。 在本月2日,马库斯发表了对2025年的25个AI预测,涵盖AGI、GenAI、自动驾驶、人形机器人、智能体等多个方向。 马斯克(Elon Musk),曾预测2025年底的AI能力:「我们就会拥有比任何人都聪明的AI」。
AI智能体2小时击败人类,引爆贝叶斯推理革命!仅用10%数据训练秒杀大模型
最近,Verses团队在AI领域投下了一枚重磅炸弹,他们自研的Genius智能体,创造了一个几乎不可能的奇迹——只用10%数据,训练2小时,就能打造出最强AI智能体! 在经典游戏Pong中,Genius智能体多次达到完美的20分,一举超越了苦练数天的其他AI,和顶尖的人类玩家。 更让人惊掉下巴的是,它的规模只有SOTA模型IRIS的4%(缩小了96%),直接在搭载M1芯片的MacBook上就能跑。
AI大牛颜水成宣布回归学界!重返新加坡国立任特聘教授,专注e-AGI研究
在产业界兜兜转转几年后,颜水成再次选择回归学界——重返新加坡国立大学NUS,担任计算机系特聘教授。 没错,就是他第一个教职所在地,也是他声名鹊起的地方。 而距离他上一次动向,过去不到三个月。
OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了
没错,OpenAI的智能体时代真的要来了! 据大名鼎鼎的“情报员”光头哥爆料,OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项。 从截图来看,确实是传闻已久、代号为“Operator(操作员)”的辣个:而且这则爆料也得到了日常关注苹果方面消息的博主@M1的再次佐证:Operator正在内测中,即将上线MAC版ChatGPT桌面应用……根据介绍,Operator能够接管用户PC,直接代替人类自主执行一系列操作(如编码开发应用、订餐,做攻略等等)。
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
消息源 @sir04680280 于 1 月 19 日发布博文,报道称观看谷歌黑客马拉松直播时,发现谷歌升级版 Gemini AI 模型“Gemini 2.0 Flash Thinking Exp-0123”,暗示 1 月 23 日发布。
OpenAI ChatGPT Operator 探索自动化新高度:你的专属 AI 秘书,即将上岗
科技媒体 TestingCatalog 昨日(1 月 20 日)发布博文,报道称通过挖掘最新 macOS 版 ChatGPT 应用代码,OpenAI 公司即将推出名为“Operator”的全新 AI 功能,充当自主 AI 智能体,自动执行各种计算机任务。
AI 版“Cookie”:OpenAI ChatGPT 搜索测试整合记忆功能
科技媒体 testingcatalog 今天(1 月 21 日)发布博文,报道称 OpenAI 公司正探索为其搜索功能整合 Memory 记忆功能,从而赋予 ChatGPT 更个性化的搜索能力。
港科大提出端侧文生图模型SnapGen,参数仅SD十分之一,1.4秒内生成1024分辨率图像
本文经AIGC Studio公众号授权转载,转载请联系出处。 这项工作提出了一种新颖且高效的 T2I 模型SnapGen,SnapGen 是第一个可以在1.4秒内在移动设备上合成高分辨率图像(1024x1024 ) 的图像生成模型(379M ) ,并在 GenEval 指标上 达到0.66。 该模型全面超越了许多现有的数十亿参数模型,例如 SDXL、Lumina-Next 和 Playgroundv2。
震惊 AI 界!DeepSeek-R1 :纯RL打造推理王者,AI 自主学习里程碑「技术报告解读」
刚看完DeepSeek R1技术报告论文《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》,这篇论文最令人震惊的点在于:DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调(SFT)数据,仅通过纯粹的强化学习(RL)训练的模型,展现出了惊人的推理能力,推理基准测试上可以媲美乃至超越 OpenAI 的 o1 系列模型(如 o1-0912),完全开源,报告毫无保留的奉上了R1的训练秘密,值得注意的是,这是第一个开放研究验证了 LLM 的推理能力可以完全通过 RL 来激励,而不需要 SFT。 这一突破为该领域的未来发展铺平了道路具体来说,以下几点尤其令人震惊:纯 RL 的成功: 以往的模型在提升推理能力时,通常依赖于 SFT 作为预训练步骤。 DeepSeek-R1-Zero 打破了这一常规,证明了仅通过设计合适的奖励机制和训练模板,就可以让模型在没有 SFT 的情况下(冷启动),通过自我博弈和进化,自发地学习到复杂的推理策略,这让我想起了AlphaZero--从零开始掌握围棋、将棋和国际象棋,而无需先模仿人类大师的棋步,这是整个技术报告最重要的启示惊人的性能提升: DeepSeek-R1-Zero 在 AIME 2024 基准测试上,pass@1 分数从 15.6% 提升到了 71.0%,通过多数投票更是达到了 86.7%,与 OpenAI-01-0912 的表现相当甚至更好。
特朗普时代再临:科学界喜忧参半,AI与太空探索或成最大赢家
今天,特朗普将宣誓就任美国第47任总统,开启他的第二任期。 回看特朗普在第一任期(2017-2021)否认气候变化风险,并试图大幅削减科研资金的举措,科学界对于这位即将上任的美国总统的看法是:鉴于特朗普一直宣扬的要砍掉大量科研经费与大力支持马斯克的「政府效率部门」,预计他将放弃对环境和传染病等基础研究的支持,但可能会推动人工智能、量子研究和太空探索方面的工作。 科学家和工程师们因此也出现了两种截然不同的前景展望:科技公司、太空爱好者、人工智能(AI)开发者等期待未来几年他们将迎来有利政策,并对探索新的可能而感到无比兴奋。
人大、东北大学联合开发「图机器学习库」Jittor Geometric!性能超越PYG、DGL
近日,中国人民大学与东北大学联合开发了图机器学习库Jittor Geometric,其1.0版本近日已正式发布。 Jittor Geometric以国产深度学习框架Jittor为基础技术架构,聚焦图数据,在图存储、图计算、图学习等方面作了细致优化,整合、加速了现有多类图神经网络模型,模型运行时间在多种图学习任务上较Pytorch Geometric(PyG)、Deep Graph Library(DGL)等同类型框架提升10%~50%。 同时,Jittor Geometric简洁、易用、跨平台通用性强、用户学习成本低,目前已用于研究生课程教学。
Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生
还记得吗,AI大神Karpathy曾说过,「英文是最热门的编程语言」。 两年后的现在,这个规则彻底要被颠覆了。 从今天起,中文很有可能成为全球最热门的编程语言!
不到4小时,谷歌Gemini写完10万字商业战略书籍!人类全程没碰一个字
「文章本天成,妙手偶得之。 」本来充满创意与想象的写作,LLM已经可以上手了。 这次更是直接,LLM不光可以写文章了,大部头的书籍也要被拿下了?
追平满血版o1的国产多模态模型终于来了!训练细节全部公开
春节前最后一周,能媲美 Open AI 满血版 o1(Full Version,而非 preview)的模型终于出现了! 刚刚,月之暗面公布了他们的 Kimi k 系列模型最新版本 ——k1.5 多模态思考模型。 新模型在数学、代码、多模态推理能力等方面全面对标 Open AI 满血版 o1,而且是 OpenAI 之外首个多模态 o1。
AI 分析了 14500 多场财报电话会议,发现大部分 CEO 患有抑郁症
研究显示,患有抑郁症的 CEO 往往面临更多职场挑战。具体而言,CEO 的心理健康问题与公司面临的风险相关,例如诉讼或股票回报波动。此外,有限的证据表明,患有抑郁症的 CEO 更可能获得更高的薪酬,且薪酬中基于绩效的部分比例更高。这些 CEO 多为年轻男性,女性比例较低。
DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版
幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
谷歌公布 Titans 系列 AI 模型架构:融合长短期记忆与注意力机制、突破 200 万上下文 Token
谷歌研究院发文,公布了“Titans”系列模型架构,相应模型架构最大的特点是采用“仿生设计”,结合了短期记忆、长期记忆和注意力机制,支持超过 200 万个 Token 的上下文长度,谷歌计划将 Titans 相关技术开源。
AI未来之路:五大发展预测
AI创新持续加速,重塑我们的工作方式、生活方式和互动方式。 从变革性的商业策略到日常技术,AI的影响无处不在。 尽管有些宣传可能过于夸张,但AI的采用速度仍然是前所未有的。