AI

DeepSeek-R1 最新发布,剑指 OpenAI o1

昨日 1 月20 号,DeepSeek 团队推出了全新开源模型 DeepSeek-R1,一夜之间模型就在 Github 上收获了 4k star,引爆大模型领域。 而这次的 R1 模型一出,不仅反驳了之前蒸馏 OpenAI o1 的说法,官方更是直接下场表示:“我们可以和开源版的 o1 打成平手”。 值得一提的是, R1 突破了以往的模型训练形式,完全没有使用任何 SFT 数据,仅通过纯粹的 RL 来训练模型,这一点说明 R1 已经学会了自己思考问题——这实则更符合人类的思维规则。

几个开发大模型应用常用的 Python 库

一、应用层开发1. FastAPIFastAPI是构建API的优选。 顾名思义,它快速、简单,并能与Pydantic完美集成,实现无缝数据验证。

你要跳舞么?复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成

本文经AIGC Studio公众号授权转载,转载请联系出处。 由复旦、微软、虎牙、CMU的研究团队提出的StableAnimator框架,实现了高质量和高保真的ID一致性人类视频生成。 StableAnimator 生成的姿势驱动的人体图像动画展示了其合成高保真和 ID 保留视频的能力。

图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目

南洋理工大学的研究者们提出了一种基于扩散反演的新型图像超分辨率 (SR) 技术,可以利用大型预训练扩散模型中蕴含的丰富图像先验来提高 SR 性能。 该方法的核心是一个深度噪声预测器,用于估计前向扩散过程的最佳噪声图。 一旦训练完成,这个噪声预测器就可以用来初始化沿扩散轨迹的部分采样过程,从而生成理想的高分辨率结果。

中科院北大等揭示「蒸馏真相」:除Claude豆包Gemini,其他很多模型都「蒸」过头

模型蒸馏是一种将知识从大型语言模型(LLMs)转移到较小模型的技术,旨在创建资源高效且性能卓越的模型。 然而,过度蒸馏可能会导致同质化,降低模型之间的多样性,并削弱它们稳健处理复杂或新任务的能力。 这些限制凸显了系统地量化蒸馏过程及其影响的必要性。

刚刚,特朗普与奥特曼惊天启动星际之门!4年狂砸5000亿美金,孙正义任董事长

AI曼哈顿计划正式开启,ASI真的不远了! 刚刚,特朗普正式官宣「星际之门计划」,要在未来4年内砸5000亿美金,重塑美国在AI界领导地位。 这项计划将由OpenAI、软银、甲骨文牵头,首期先部署1000亿美元。

微软解绑:OpenAI 获更大 AI 算力自主权,携手软银、甲骨文等启动 5000 亿美元“星际之门”项目

微软公司昨日(1 月 21 日)发布公告,宣布调整和 OpenAI 公司的合作关系,允许 OpenAI 使用竞争对手的计算资源。此次调整旨在满足 OpenAI 日益增长的算力需求,并缓解双方因算力供应问题产生的摩擦。

奥特曼在OpenAI「经济蓝图」画下的大饼,能否撼动美AI政策?盘点美国AI大厂的政策站队,硅谷即将上演“权力的游戏”

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI 15页的经济蓝图刷爆了整个AI圈! ,给美国AI画了好一张大饼啊! 比较诱人的点包括:发展AI需要大搞基建,将拉动经济带来大量就业:“人工智能所带来的经济机会又是如此诱人,不容放弃。

特朗普一上台,拜登AI禁令被秒撤!硅谷科技「壕客」齐聚就职典礼现场

特朗普上任,美国科技巨头「春天到了」! 在特朗普第二次就职典礼上,扎克伯格、贝索斯、皮查伊和马斯克坐在显要席位上,据报道比特朗普的内阁成员还要靠前。 而苹果CEO库克位置相对靠后,与欧洲首富、印度首富等坐一起。

AI盈利难、机器人泡沫多!马库斯25年AI预测,隔空喊话马斯克

去年,马库斯对于AI趋势的预测几乎全部正确,但完全没想到OpenAI可以估值到1500亿美元。 在本月2日,马库斯发表了对2025年的25个AI预测,涵盖AGI、GenAI、自动驾驶、人形机器人、智能体等多个方向。 马斯克(Elon Musk),曾预测2025年底的AI能力:「我们就会拥有比任何人都聪明的AI」。

AI智能体2小时击败人类,引爆贝叶斯推理革命!仅用10%数据训练秒杀大模型

最近,Verses团队在AI领域投下了一枚重磅炸弹,他们自研的Genius智能体,创造了一个几乎不可能的奇迹——只用10%数据,训练2小时,就能打造出最强AI智能体! 在经典游戏Pong中,Genius智能体多次达到完美的20分,一举超越了苦练数天的其他AI,和顶尖的人类玩家。 更让人惊掉下巴的是,它的规模只有SOTA模型IRIS的4%(缩小了96%),直接在搭载M1芯片的MacBook上就能跑。

AI大牛颜水成宣布回归学界!重返新加坡国立任特聘教授,专注e-AGI研究

在产业界兜兜转转几年后,颜水成再次选择回归学界——重返新加坡国立大学NUS,担任计算机系特聘教授。 没错,就是他第一个教职所在地,也是他声名鹊起的地方。 而距离他上一次动向,过去不到三个月。

OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了

没错,OpenAI的智能体时代真的要来了! 据大名鼎鼎的“情报员”光头哥爆料,OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项。 从截图来看,确实是传闻已久、代号为“Operator(操作员)”的辣个:而且这则爆料也得到了日常关注苹果方面消息的博主@M1的再次佐证:Operator正在内测中,即将上线MAC版ChatGPT桌面应用……根据介绍,Operator能够接管用户PC,直接代替人类自主执行一系列操作(如编码开发应用、订餐,做攻略等等)。

搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking

消息源 @sir04680280 于 1 月 19 日发布博文,报道称观看谷歌黑客马拉松直播时,发现谷歌升级版 Gemini AI 模型“Gemini 2.0 Flash Thinking Exp-0123”,暗示 1 月 23 日发布。

OpenAI ChatGPT Operator 探索自动化新高度:你的专属 AI 秘书,即将上岗

科技媒体 TestingCatalog 昨日(1 月 20 日)发布博文,报道称通过挖掘最新 macOS 版 ChatGPT 应用代码,OpenAI 公司即将推出名为“Operator”的全新 AI 功能,充当自主 AI 智能体,自动执行各种计算机任务。

AI 版“Cookie”:OpenAI ChatGPT 搜索测试整合记忆功能

科技媒体 testingcatalog 今天(1 月 21 日)发布博文,报道称 OpenAI 公司正探索为其搜索功能整合 Memory 记忆功能,从而赋予 ChatGPT 更个性化的搜索能力。

港科大提出端侧文生图模型SnapGen,参数仅SD十分之一,1.4秒内生成1024分辨率图像

本文经AIGC Studio公众号授权转载,转载请联系出处。 这项工作提出了一种新颖且高效的 T2I 模型SnapGen,SnapGen 是第一个可以在1.4秒内在移动设备上合成高分辨率图像(1024x1024 ) 的图像生成模型(379M ) ,并在 GenEval 指标上 达到0.66。 该模型全面超越了许多现有的数十亿参数模型,例如 SDXL、Lumina-Next 和 Playgroundv2。

震惊 AI 界!DeepSeek-R1 :纯RL打造推理王者,AI 自主学习里程碑「技术报告解读」

刚看完DeepSeek R1技术报告论文《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》,这篇论文最令人震惊的点在于:DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调(SFT)数据,仅通过纯粹的强化学习(RL)训练的模型,展现出了惊人的推理能力,推理基准测试上可以媲美乃至超越 OpenAI 的 o1 系列模型(如 o1-0912),完全开源,报告毫无保留的奉上了R1的训练秘密,值得注意的是,这是第一个开放研究验证了 LLM 的推理能力可以完全通过 RL 来激励,而不需要 SFT。 这一突破为该领域的未来发展铺平了道路具体来说,以下几点尤其令人震惊:纯 RL 的成功: 以往的模型在提升推理能力时,通常依赖于 SFT 作为预训练步骤。 DeepSeek-R1-Zero 打破了这一常规,证明了仅通过设计合适的奖励机制和训练模板,就可以让模型在没有 SFT 的情况下(冷启动),通过自我博弈和进化,自发地学习到复杂的推理策略,这让我想起了AlphaZero--从零开始掌握围棋、将棋和国际象棋,而无需先模仿人类大师的棋步,这是整个技术报告最重要的启示惊人的性能提升: DeepSeek-R1-Zero 在 AIME 2024 基准测试上,pass@1 分数从 15.6% 提升到了 71.0%,通过多数投票更是达到了 86.7%,与 OpenAI-01-0912 的表现相当甚至更好。