模型

2025 CSRankings排名出炉！上交大、清华北大、浙大霸榜全球AI TOP 10

就在刚刚，2025 CSRankings全球计算机科学排名发布！地址：，CMU再次霸榜，UIUC曾连续多年稳坐全球第二，如今跌至第6。中国高校/机构继续包揽多个席位，其中清华排名第2，上交大/浙大并列第3，北大第5。

4/8/2025 9:42:00 AM

新智元

奥特曼最新访谈认可“套壳”：多数改变世界的公司，最初都是这样的

奥特曼最新访谈回应一切！在一档播客节目中，OpenAI CEO奥特曼分享了对4o吉卜力风突然走红以及大多数创业公司都是“套壳包装”的看法，并谈到了AI编程、AI智能体等前沿技术的发展趋势。尤其是当中提到了一个“杰文斯悖论”的典型案例——当编程成本下降时，全球对软件的需求会呈指数级增长。

4/8/2025 9:27:00 AM

量子位

清华耶鲁推理模型新范式：动态推理实现高效测试时扩展，大大节省Token消耗

推理性能提升的同时，还大大减少Token消耗！清华、耶鲁团队提出推理模型新范式：动态推理实现高效测试时扩展。测试时扩展（test-time scaling）技术加速推动了大语言模型在复杂推理领域的突破。

4/8/2025 9:16:00 AM

量子位

首个个性化对齐大模型问世！可精准识别用户内在动机和偏好，还有百万用户画像开源数据集 | 蚂蚁&人大

如何让大模型更懂「人」？虽然现有大模型经过了人类价值观对齐训练，但其对齐效果往往会让少数群体的声音被系统性淹没。那随之而来的问题是，当大模型服务全球用户，标准化对齐范式是否正在制造新的数字鸿沟？

4/8/2025 9:12:00 AM

量子位

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

最近AI圈最火的模型非GPT-4o莫属，各种风格图片持续火爆全网。如此强悍的图片生成能力，得益于GPT-4o本身是一个原生多模态模型。从最新发布的LLM来看，多模态已经成为绝对的主流。

4/8/2025 9:10:00 AM

新智元

中科大ICLR2025：特定领域仅用5%训练数据，知识准确率提升14%

让大语言模型更懂特定领域知识，有新招了！来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架——知识图谱驱动的监督微调（KG-SFT），该框架通过引入知识图谱（KG）来提升大语言模型（LLMs）在特定领域的知识理解和处理能力。实验结果表明，其在多个领域和多种语言的数据集上取得了显著的效果，成功入选ICLR 2025。

4/8/2025 9:00:00 AM

量子位

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta前脚刚发Llama 4，后脚就有大佬请辞了！一亩三分地的爆料贴称，经过反复训练后，Llama 4未能取得SOTA，甚至与顶尖大模型实力悬殊。为了蒙混过关，高层甚至建议：在后训练阶段中，将多个benchmark测试集混入训练数据。

4/7/2025 1:24:52 PM

新智元

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。通过构建大规模（100 万立体图像对）合成训练数据集，结合自动自筛选流程去除模糊样本，并设计了网络架构组件（如侧调谐特征主干和远程上下文推理）来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度，为零样本立体深度估计设立了新标准。

4/7/2025 9:45:00 AM

机器之心

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

你是否想过，LLM也有着自己的小心思？最新研究揭示了一个有趣的现象：LLM在被研究人员测试时，会有意识地改变自己的行为。在面对那些旨在评估人格特质的问题时，它们给出的答案会尽可能地讨人喜欢，符合社会期望。

4/7/2025 9:31:00 AM

新智元

Llama 4全网首测来袭，3台Mac狂飙2万亿！多模态惊艳代码却翻车

谁也没料到，大周末的，小扎竟然开源了Llama 4家族。一共三款模型，首次采用MoE架构，开启了原生多模态的Llama时代！ Llama 4 Scout，激活17B，16个专家，109B参数；Llama 4 Maverick，激活17B，128个专家，402B参数；Llama 4 Behemoth，激活288B，16个专家，2T参数。

4/7/2025 9:20:00 AM

新智元

谷歌随OpenAI强势入局，劈柴4天闪电部署Gemini+MCP！

3月31日，谷歌CEO Sundar Pichai（劈柴哥）发出灵魂一问：To MCP or not to MCP, that's the question. （MCP还是不MCP，这是个问题。）MCP的持续火爆，加上OpenAI在27日官宣对MCP的支持，终究还是让谷歌坐不住了。

4/7/2025 9:10:00 AM

新智元

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

AI不过周末，硅谷也是如此。大周日的，Llama家族上新，一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列，目前共有三个款：Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

4/7/2025 9:05:00 AM

量子位

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 8:42:00 AM

新智元

谷歌暗讽OpenAI：GPU在熔化，TPU火上浇油！Canvas免费开放，实测惊人

Gemini 2.5 Pro的Canvas，向所有人开放了！ AI大战，再次升级。奥特曼表示用户太热情，GPU在融化，在线求饶，团队要休息。

4/7/2025 8:39:00 AM

新智元

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

有点意思。这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛，引得大家纷纷联想是不是R2马上要来了。然鹅……奥特曼这边却发了一条“变卦”的消息：计划改变：我们可能在几周之后先发布o3和o4-mini。

4/7/2025 8:15:00 AM

量子位

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 3:44:00 AM

新智元

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

AI智能体，能否复现顶会中重磅的AI研究？今天，OpenAI团队发布了全新框架PaperBench，便可评估AI智能体复现顶尖研究的基础能力。论文地址：，AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文，包括理解论文核心文献、开发可运行代码库，以及执行实验并验证结果。

4/4/2025 12:00:00 AM

新智元

让AI替码农卷复杂任务，贾佳亚团队提出MoTCoder，准确率刷新SOTA

论文一作李靖瑶，香港中文大学博士生（DV Lab），师从贾佳亚教授。主要研究方向是大语言模型，包括模型预训练、后训练、推理优化。作者陈鹏光、夏彬等均为 DV Lab 成员。

4/3/2025 11:16:10 AM