模型

首个个性化对齐大模型问世！可精准识别用户内在动机和偏好，还有百万用户画像开源数据集 | 蚂蚁&人大

如何让大模型更懂「人」？虽然现有大模型经过了人类价值观对齐训练，但其对齐效果往往会让少数群体的声音被系统性淹没。那随之而来的问题是，当大模型服务全球用户，标准化对齐范式是否正在制造新的数字鸿沟？

4/8/2025 9:12:00 AM

量子位

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

最近AI圈最火的模型非GPT-4o莫属，各种风格图片持续火爆全网。如此强悍的图片生成能力，得益于GPT-4o本身是一个原生多模态模型。从最新发布的LLM来看，多模态已经成为绝对的主流。

4/8/2025 9:10:00 AM

新智元

中科大ICLR2025：特定领域仅用5%训练数据，知识准确率提升14%

让大语言模型更懂特定领域知识，有新招了！来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架——知识图谱驱动的监督微调（KG-SFT），该框架通过引入知识图谱（KG）来提升大语言模型（LLMs）在特定领域的知识理解和处理能力。实验结果表明，其在多个领域和多种语言的数据集上取得了显著的效果，成功入选ICLR 2025。

4/8/2025 9:00:00 AM

量子位

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta前脚刚发Llama 4，后脚就有大佬请辞了！一亩三分地的爆料贴称，经过反复训练后，Llama 4未能取得SOTA，甚至与顶尖大模型实力悬殊。为了蒙混过关，高层甚至建议：在后训练阶段中，将多个benchmark测试集混入训练数据。

4/7/2025 1:24:52 PM

新智元

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。通过构建大规模（100 万立体图像对）合成训练数据集，结合自动自筛选流程去除模糊样本，并设计了网络架构组件（如侧调谐特征主干和远程上下文推理）来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度，为零样本立体深度估计设立了新标准。

4/7/2025 9:45:00 AM

机器之心

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

你是否想过，LLM也有着自己的小心思？最新研究揭示了一个有趣的现象：LLM在被研究人员测试时，会有意识地改变自己的行为。在面对那些旨在评估人格特质的问题时，它们给出的答案会尽可能地讨人喜欢，符合社会期望。

4/7/2025 9:31:00 AM

新智元

Llama 4全网首测来袭，3台Mac狂飙2万亿！多模态惊艳代码却翻车

谁也没料到，大周末的，小扎竟然开源了Llama 4家族。一共三款模型，首次采用MoE架构，开启了原生多模态的Llama时代！ Llama 4 Scout，激活17B，16个专家，109B参数；Llama 4 Maverick，激活17B，128个专家，402B参数；Llama 4 Behemoth，激活288B，16个专家，2T参数。

4/7/2025 9:20:00 AM

新智元

谷歌随OpenAI强势入局，劈柴4天闪电部署Gemini+MCP！

3月31日，谷歌CEO Sundar Pichai（劈柴哥）发出灵魂一问：To MCP or not to MCP, that's the question. （MCP还是不MCP，这是个问题。）MCP的持续火爆，加上OpenAI在27日官宣对MCP的支持，终究还是让谷歌坐不住了。

4/7/2025 9:10:00 AM

新智元

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

AI不过周末，硅谷也是如此。大周日的，Llama家族上新，一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列，目前共有三个款：Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

4/7/2025 9:05:00 AM

量子位

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 8:42:00 AM

新智元

谷歌暗讽OpenAI：GPU在熔化，TPU火上浇油！Canvas免费开放，实测惊人

Gemini 2.5 Pro的Canvas，向所有人开放了！ AI大战，再次升级。奥特曼表示用户太热情，GPU在融化，在线求饶，团队要休息。

4/7/2025 8:39:00 AM

新智元

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

有点意思。这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛，引得大家纷纷联想是不是R2马上要来了。然鹅……奥特曼这边却发了一条“变卦”的消息：计划改变：我们可能在几周之后先发布o3和o4-mini。

4/7/2025 8:15:00 AM

量子位

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 3:44:00 AM

新智元

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

AI智能体，能否复现顶会中重磅的AI研究？今天，OpenAI团队发布了全新框架PaperBench，便可评估AI智能体复现顶尖研究的基础能力。论文地址：，AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文，包括理解论文核心文献、开发可运行代码库，以及执行实验并验证结果。

4/4/2025 12:00:00 AM

新智元

让AI替码农卷复杂任务，贾佳亚团队提出MoTCoder，准确率刷新SOTA

论文一作李靖瑶，香港中文大学博士生（DV Lab），师从贾佳亚教授。主要研究方向是大语言模型，包括模型预训练、后训练、推理优化。作者陈鹏光、夏彬等均为 DV Lab 成员。

4/3/2025 11:16:10 AM

机器之心

视觉SSL终于追上了CLIP！Yann LeCun、谢赛宁等新作，逆转VQA任务固有认知

在视觉问题解答（VQA）等多模态环境中，当前视觉自监督学习（SSL）的表现还比不上语言图像预训练（CLIP）。这种差距通常归因于语言监督引入的语义，尽管视觉 SSL 模型和 CLIP 模型通常在不同的数据上进行训练。在最近的一项研究中，Yann LeCun、谢赛宁等研究者探讨了一个基本问题：语言监督对于多模态建模的视觉表征预训练是否必要？

4/3/2025 11:11:50 AM

机器之心

10倍吞吐提升无损性能：多模态适用的KV cache量化策略来了，即插即用无需改原模型

在InternVL-2.5上实现10倍吞吐量提升，模型性能几乎无损失。最新1-bit多模态大模型KV cache量化方案CalibQuant来了。通过结合后缩放和校准方法，可显著降低显存与计算成本，无需改动原模型即可直接使用。

4/3/2025 10:29:06 AM

量子位

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

OpenAI承认Claude是最好的了（狗头）。刚刚开源的新基准测试PaperBench，6款前沿大模型驱动智能体PK复现AI顶会论文，新版Claude-3.5-Sonnet显著超越o1/r1排名第一。与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比，PaperBench更考验综合能力，不再是只执行单一任务。

4/3/2025 10:21:32 AM

量子位

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Persona Engine开源发布，AI虚拟助手与Live2D融合打造交互新体验

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 字节跳动 Claude 大语言模型搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊特斯拉 AGI 训练 2024

模型

首个个性化对齐大模型问世！可精准识别用户内在动机和偏好，还有百万用户画像开源数据集 | 蚂蚁&人大

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

中科大ICLR2025：特定领域仅用5%训练数据，知识准确率提升14%

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

Llama 4全网首测来袭，3台Mac狂飙2万亿！多模态惊艳代码却翻车

谷歌随OpenAI强势入局，劈柴4天闪电部署Gemini+MCP！

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！ 新智元 新智元 2025年04月04日 17:33

谷歌暗讽OpenAI：GPU在熔化，TPU火上浇油！Canvas免费开放，实测惊人

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

让AI替码农卷复杂任务，贾佳亚团队提出MoTCoder，准确率刷新SOTA

视觉SSL终于追上了CLIP！Yann LeCun、谢赛宁等新作，逆转VQA任务固有认知

10倍吞吐提升无损性能：多模态适用的KV cache量化策略来了，即插即用无需改原模型

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33