模型

突发！o3-mini思维链公开，却被曝光全是「作假」，奥特曼现身解释网友炸锅

OpenAI，真的被DeepSeek逼急了！活久见，就在刚刚，OpenAI把o3-mini的「思维链」公开了。比如问「怎么今天不是星期五啊😅」？

2/7/2025 11:20:50 AM

新智元

DeepSeek开源Janus-Pro-7B：多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注，位居应用商店排行榜首位并改变了股市。随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B，该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3，并以“理解-生成双路径”架构和极简部署方案引发AI社区轰动。性能表现：小模型吊打行业巨头Janus-Pro-7B虽仅有70亿参数（约为GPT-4的1/25），却在关键测试中碾压对手：文生图质量：在GenEval测试中以80%准确率击败DALL-E 3（67%）和Stable Diffusion 3（74%）复杂指令理解：在DPG-Bench测试中达84.19%准确率，能精准生成如“山脚下有蓝色湖泊的雪山”等复杂场景多模态问答：视觉问答准确率超越GPT-4V，MMBench测试得分79.2分接近专业分析模型技术突破：像“双面神”分工协作传统模型让同一套视觉编码器既理解图片又生成图片，如同让厨师同时设计菜单和炒菜。

2/7/2025 11:00:00 AM

AIGC Studio

DeepSeek开源多模态模型Janus-Pro的ComfyUI使用教程，文中附模型和工作流下载

今天给大家介绍DeepSeek发布的Janus-Pro模型的ComfyUI实践教程，包含ComfyUI安装，模型下载，工作流下载等，欢迎大家一起交流学习，也欢迎添加公众号小助手加入读者交流群，一起探索AIGC好玩的应用。 Janus Pro 是 DeepSeek 于 2025年1月27日开源的多模态模型，同时具有图像理解和生成的能力。

2/7/2025 10:21:42 AM

AIGC Studio

817样本激发7倍推理性能：上交大「少即是多」定律挑战RL Scaling范式

在追求人工智能极限的道路上，"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域，业界普遍认为需要海量数据和复杂的强化学习才能获得突破。然而，来自上海交通大学的最新研究却给出了一个令人震惊的答案：仅需 817 条精心设计的样本，就能让模型在数学竞赛级别的题目上超越当前许多最先进模型。

2/7/2025 9:00:00 AM

机器之心

不到140块！李飞飞团队超低成本复刻DeepSeek R1推理！16张H100只训练了26分钟，与R1训练方法不同！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）太魔鬼了！上周李飞飞团队发了篇新论文，再次降低了复刻o1能力的成本。低到什么程度呢？

2/6/2025 6:37:46 PM

伊风

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

OpenAI o系列模型为何性能如此强大？ OpenAI将他们的方法描述为使用大规模强化学习（RL），暗示使用了大量的数据。最近大火的DeepSeek-R1模型也通过使用数百万个样本和多个训练阶段使用强化学习的方式，成功地达到了o1级别的性能。

2/6/2025 2:28:16 PM

新智元

对标DeepSeek，Gemini 2.0轻量模型开卷“极致性价比”！谷歌守住多模态阵地，油管、地图应用们都要开始做推理了！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）DeepSeek的火热，让Google坐不住了！深夜，Google推出了Gemini 2.0全家桶，一口气推出了三个模型型号：Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。图片看技术报告，2.0系列的三个模型在通用、代码、推理、事实性、多语言等方面指标如下。

2/6/2025 1:13:07 PM

伊风

力压DeepSeek-R1！谷歌Gemini 2.0系列集体上新，全员跻身大模型竞技场前10

终于，谷歌DeepMind坐不住了，出手就是超越DeepSeek-R1！劈柴哥亲自官宣Gemini 2.0家族更新，分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。同时，稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking，已在Gemini App中推出。

2/6/2025 12:10:00 PM

量子位

零样本 | ZeroDiff：扩散模型助力零样本学习，打破数据限制，实现高效泛化

一眼概览ZeroDiff 提出了一种基于扩散模型的生成式零样本学习（ZSL）方法，提升数据利用效率，实现类别级和实例级的增强。在多个ZSL基准数据集上，ZeroDiff 取得了显著的性能提升，特别是在数据稀缺情况下仍保持稳健。核心问题零样本学习（ZSL）试图在无训练样本的情况下识别新类别，主要依赖于已知类别的语义信息。

2/6/2025 11:25:50 AM

萍哥学AI

终结谷歌搜索！OpenAI免费开放ChatGPT搜索，无需注册

今天凌晨3点，OpenAI宣布向所有用户开放ChatGPT搜索功能，无需注册。与谷歌那种传统收录模式的搜索引擎相比，ChatGPT搜索可以更快抓取网络信息，能实现分钟级别的解析，这对于股票、体育、财经等，需要第一时间快速获取新闻内容的行业帮助非常大。同时借助大模型的能力，可以更好地解读用户的搜索想法，并且可以提供搜索结果的源地址。

2/6/2025 11:00:00 AM

AIGC开放社区

小红书提出新面部视频交换方法DynamicFace，可生成高质量且一致的视频面部图像

DynamicFace是一种新颖的面部视频交换方法，旨在生成高质量且一致的视频面部图像。该方法结合了扩散模型的强大能力和可插拔的时间层，以解决传统面部交换技术面临的两个主要挑战：在保持源面部身份的同时，准确传递目标面部的运动信息。通过引入四种细粒度的面部条件，DynamicFace能够对面部特征进行更精确的控制，从而实现高保真度的面部交换。

2/6/2025 10:45:00 AM

AIGC Studio