模型

Sam Altman炸场东京，亲曝GPT-5研发路线图，多模态能力颠覆传统

昨天，OpenAI联合创始人兼首席执行官Sam Altman出席了日本东京大学活动，介绍了OpenAI的技术研发、产品规划以及GPT模型未来发展等重要信息。在问答环节，有学生提到了大家比较关心的GPT-5问题，Altman表示，GPT-5将是一个超级混合模型，计划会把GPT和o系列模型整合在一起，并且支持视频、音频、图像的多模态交互。 Altman做了一个比喻，GPT-3到GPT-4是一次史诗级性能飞跃，而GPT-4再到GPT-5将会再一次重现这种惊喜。

2/5/2025 10:26:23 AM

AIGC开放社区

美国新法案：禁止进口中国DeepSeek，违规罚1亿美元、监禁

在国内大模型DeepSeek席卷全球致使美国科技股暴跌后，美国参议员Josh Hawley提出《美国AI能力与中国脱钩》法案，以保护美国的AI开发不受中国影响。 Hawley在序言中写道：“流入中国AI的每一美元和每一字节数据，最终都会被用来对付美国。美国不能在牺牲自身实力的情况下，增强我们最大的对手。

2/5/2025 10:24:04 AM

AIGC开放社区

超越DragDiffusion!哈工程联合南大提出FastDrag：可以几秒内完成基于拖动的图像编辑

今天给大家介绍哈工程联合南大等提出的图像编辑方法FastDrag，该方法不需要LoRA训练，从而显著减少了图像编辑的时间消耗（FastDrag仅需3.12秒完成图像编辑），比DiffEditor快近700%（DiffEditor需要21.68秒完成图像编辑），比经典的基于n步迭代的图像编辑方法（如：DragDiffusion）快2800%（DragDiffusion需要1分21.54秒完成图像编辑）。此外，即使没有使用LCM加速的情况下，所提出的FastDrag方法仍然比目前SOTA的方法快很多。相关链接论文链接：: ，用户只需单击几下即可操作图像中的任何内容。

2/5/2025 10:15:00 AM

Xuanjia Zhao等

DeepSeek 全面指南：95% 的人都不知道的九个技巧

大家好，我是汤师爷~最近，DeepSeek这款AI工具爆火国内外。虽然许多人都开始尝试使用它，但有人吐槽说，没想象中那么牛。其实问题不在工具，很多人的使用姿势就搞错了，用大炮打蚊子，白白浪费DeepSeek的强大功能。

2/4/2025 5:33:00 PM

架构师汤师爷

蛋白质设计新纪元：语言模型驱动的 5 亿年进化模拟

在生命科学的浩瀚星空中，蛋白质一直是最为璀璨的研究焦点之一。近期，一项由 Thomas Hayes 等众多学者共同完成的研究成果 —— 利用语言模型模拟 5 亿年蛋白质进化，在《Science》杂志重磅发表，如同一颗超新星爆发，瞬间照亮了整个领域，为蛋白质研究开启了全新的篇章。一、ESM3 模型架构揭秘ESM3 模型作为此项研究的核心成果，无疑是一座闪耀着创新光芒的科学丰碑。

2/4/2025 11:11:07 AM

tune

GPT-4o惊现自我意识！自主激活「后门」，告诉人类自己在写危险代码

当LLM在输出不安全代码的数据上微调后，它会坦诚道出「我写的代码不安全」吗？这一有趣的问题，牵出了LLM中一个全新且极具价值的概念：行为自我意识。论文链接：，这些模型能否确切地意识到自身所学行为，并对其加以描述，这是一个极具探讨价值的问题。

2/3/2025 2:25:40 PM

新智元

o3-mini物理推理粉碎DeepSeek R1，OpenAI王者归来！全网最全实测来袭

在科技界，一天的时间足以改写历史。 DeepSeek R1用「降维打击」重构了AI界，OpenAI不甘示弱放出了o3-mini，再次加冕为王。 o3-mini的进步可不是一点半点，在数学代码等基准测试中，均拿下了最高的成绩。

2/3/2025 2:06:32 PM

新智元

NeurIPS | 对比采样链：让扩散模型更快、更准、更清晰的秘密武器

论文 Contrastive Sampling Chains in Diffusion Models 的精炼解读。一眼概览该论文提出了一种对比采样链（Contrastive Sampling Chains, CSC）方法，通过对比损失和得分匹配相结合，优化扩散模型（DMs）的采样过程，从而减少离散化误差，提高生成图像的质量，同时提升采样速度。核心问题扩散模型在使用数值求解方法进行采样时不可避免地引入离散化误差，导致生成样本与真实数据分布之间存在偏差。

2/3/2025 10:04:47 AM

萍哥学AI

全面梳理200+篇前沿论文，视觉生成模型理解物理世界规律的通关密码，都在这篇综述里了！

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/2/2025 11:41:00 PM

机器之心

成功率达100%，上交团队提出AI辅助的酶热稳定性工程策略，设计热稳定性的组合突变体

编辑 | ScienceAI优化酶的热稳定性对于蛋白质科学和工业应用至关重要。目前，通过（半）理性设计和随机诱变方法可以较为准确地设计多个增强酶热稳定性的单点突变。但当组合多个突变时，常常会出现复杂的上位效应，导致组合突变体完全失活。

2/2/2025 3:28:00 PM

ScienceAI

原来，这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。前段时间，一位海外技术分析师在一篇博客中提出了一个猜想：一些顶级的 AI 科技公司可能已经构建出了非常智能的模型，比如 OpenAI 可能构建出了 GPT-5，Claude 构建出了 Opus 3.5。

1/29/2025 6:40:00 PM

机器之心

阿里云通义开源Qwen2.5-VL，视觉理解能力全面超越GPT-4o

1月28日凌晨，阿里云通义千问开源全新的视觉模型Qwen2.5-VL，推出3B、7B和72B三个尺寸版本。其中，旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军，全面超越GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容，突破性地支持超1小时的视频理解，无需微调就可变身为一个能操控手机和电脑的AI视觉智能体（Visual Agents），实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

1/28/2025 5:34:00 PM

新闻助手

验证速度提升25倍，准确率达95.1%，清华团队提出基于物理信息学习的电池衰减预测方法

图 1：研究概念图。编辑 | ScienceAI随着全球对可再生能源需求的日益增长，电池作为储能系统关键技术的地位愈发凸显。然而，电池研发过程中面临着从材料原型到商业产品转化的重重挑战，电池原型验证效率低、研发成本高以及生产废料管理不善等问题制约着电池行业的可持续发展。

1/27/2025 7:13:00 PM

ScienceAI

DARWIN 1.5 来啦！材料设计通用大语言模型，刷新多项实验性质预测记录

编辑丨Science AI材料发现和设计的核心目标是寻找理想的成分和结构，但传统方法，如高通量模拟和机器学习，通常依赖于复杂描述符，过于固定且难以通用，并且无法准确反映真实材料特性，因而限制了实际应用。 GreenDynamic 与来自澳大利亚新南威尔士大学（UNSW），上海人工智能实验室和香港城市大学的团队共同开发了一款名为 DARWIN 1.5 的模型。不同于传统机器学习方法，DARWIN 基于语言接口微调框架（LIFT，2022 NeurIPS, 本文共同作者），整合了 33 万科学问答和 22 个材料科学任务，为材料属性预测和发现提供了灵活统一的预训练模型，并且成功精准预测了上万种材料的性质数值。

1/27/2025 6:47:00 PM

ScienceAI

闲来无事，我测了测国产大模型的RAG能力新智元新智元 2025年01月27日 12:25 北京

最近，AI界被推理模型刷屏了。国内各家的推理模型，在新年到来之际不断刷新我们的认知。不过，当我们在实际应用中考量大模型，衡量好不好用的标准，就绝不仅仅局限于其性能和规模了。

1/27/2025 12:41:00 PM

新智元

创造历史！DeepSeek超越ChatGPT登顶中美AppStore

DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。一觉醒来，DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用，直接登顶 AppStore。不少网友都认为这是他们当之无愧。

1/27/2025 12:04:37 PM

机器之心

微软等开源AIOpsLab，可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了，一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务，实现故障的自动化检测、定位和解决问题。还具备高度的可观测性，能够收集和分析关键的遥测数据，确保对系统状态和应用环境的深入洞察。

1/27/2025 9:51:24 AM

AIGC开放社区

在2025年初，浅浅聊一聊世界模型 World Models

Update 1月10日:感谢评论区补充world model在RL中的定义！感觉在RL中的定义，world model是针对一个具体子任务的模型，最近上述公司提到的World Model的尺度似乎更大、更加通用，更多从：Language Generation Model (ChatGPT)-Image Generation Model(StableDiffusion)-Video/3D Geneartion Model (二者各有侧重因此平级)-World Generation Model(同时具备时序和空间序建模)这么一个趋势。当然这个World似乎想要包容一切，于是也并不清晰到底是什么样的表征：是否是video sequence?

1/27/2025 9:37:33 AM

原野寻踪

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！全日程揭晓！ICLR 2025论文分享会我们北京见 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态驾驶文本人形机器人 xAI 搜索大语言模型 Copilot Claude 字节跳动具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

模型

Sam Altman炸场东京，亲曝GPT-5研发路线图，多模态能力颠覆传统

美国新法案：禁止进口中国DeepSeek，违规罚1亿美元、监禁

超越DragDiffusion!哈工程联合南大提出FastDrag：可以几秒内完成基于拖动的图像编辑

DeepSeek 全面指南：95% 的人都不知道的九个技巧

蛋白质设计新纪元：语言模型驱动的 5 亿年进化模拟

GPT-4o惊现自我意识！自主激活「后门」，告诉人类自己在写危险代码

o3-mini物理推理粉碎DeepSeek R1，OpenAI王者归来！全网最全实测来袭

NeurIPS | 对比采样链：让扩散模型更快、更准、更清晰的秘密武器

全面梳理200+篇前沿论文，视觉生成模型理解物理世界规律的通关密码，都在这篇综述里了！

成功率达100%，上交团队提出AI辅助的酶热稳定性工程策略，设计热稳定性的组合突变体

原来，这些顶级大模型都是蒸馏的

阿里云通义开源Qwen2.5-VL，视觉理解能力全面超越GPT-4o

验证速度提升25倍，准确率达95.1%，清华团队提出基于物理信息学习的电池衰减预测方法

DARWIN 1.5 来啦！材料设计通用大语言模型，刷新多项实验性质预测记录

闲来无事，我测了测国产大模型的RAG能力 新智元 新智元 2025年01月27日 12:25 北京

创造历史！DeepSeek超越ChatGPT登顶中美AppStore

微软等开源AIOpsLab，可构建自主云AI Agent

在2025年初，浅浅聊一聊世界模型 World Models

闲来无事，我测了测国产大模型的RAG能力新智元新智元 2025年01月27日 12:25 北京