理论

用于科研的AI：Nature教你如何选择正确地选择工具

编辑丨toileter人工智能（AI）的到来是一场革命。随着现在越来越多的 AI 投入使用，虽然许多教育工作者和学术机构最初对此持谨慎态度，但学术界似乎越来越愿意允许学生学生进行这种尝试。 Nature 期刊为此探讨了如今学者与学生们如何利用 AI 进行实验的简化。

4/8/2025 2:15:00 PM

ScienceAI

Llama 4在测试集上训练？内部员工、官方下场澄清，LeCun转发

Llama 4 这么大的节奏，Meta 终于绷不住了。本周二凌晨，Meta Gen AI 团队负责人发表了一份澄清说明（针对外界质疑「在测试集上训练」等问题），大佬 Yann LeCun 也进行了转发。很高兴能让大家用上 Llama 4，我们已经听说人们使用这些模型取得了很多出色的成果。

4/8/2025 1:12:49 PM

机器之心

Meta坐不住了！高管辟谣：Llama4没刷榜！训练没有使用测试集！模型稳定实现需要时间，bug正在修

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）Meta的辟谣来了！ ——没刷榜、模型稳定部署需要时间。昨日，Llama 4收到许多网友实测后的“差评”，加之自称内部员工的人在国内论坛上爆料Meta作弊，一时间流言四起。

4/8/2025 12:57:02 PM

伊风

首次引入强化学习！火山引擎Q-Insight让画质理解迈向深度思考

从 GPT-4o 吉卜力风、即梦的 3D 动画、再到苹果 Vision Pro，AI 视觉创作正迎来生产力大爆炸。一个重要问题随之浮现：如何评估机器生成的画质符合人眼审美？人眼能瞬间辨别图像优劣，但教会机器理解「好看」却充满挑战。

4/8/2025 9:50:00 AM

机器之心

2025 CSRankings排名出炉！上交大、清华北大、浙大霸榜全球AI TOP 10

就在刚刚，2025 CSRankings全球计算机科学排名发布！地址：，CMU再次霸榜，UIUC曾连续多年稳坐全球第二，如今跌至第6。中国高校/机构继续包揽多个席位，其中清华排名第2，上交大/浙大并列第3，北大第5。

4/8/2025 9:42:00 AM

新智元

奥特曼力挺年轻人「套壳」，25年程序员效率暴增10倍！GPT-4o狂造十亿图像

奥特曼在最新的访谈中回应了吉卜力争议，谈到了对AI带来的新职业及创业公司的看法。新职业出现的时候，经常被嘲笑。嘲笑别人是「套壳」是件容易的事。

4/8/2025 9:38:00 AM

新智元

数学大一统的惊人胜利！天才数学家用30年破解不可能，边看《星战》边写论文

一个与「数学大一统理论」相关的领域，一项长期以来被视作几乎不可能的数学证明，如今取得了突破。在历经30年的努力后，数学家们证明了这个数学构想——几何Langlands Program。著名数学家、Max Planck研究所的Peter Scholze（菲尔兹奖得主，他没有参与这项证明）兴奋地表示：看到它得到解决真是太好了。

4/8/2025 9:37:00 AM

新智元

奥特曼最新访谈认可“套壳”：多数改变世界的公司，最初都是这样的

奥特曼最新访谈回应一切！在一档播客节目中，OpenAI CEO奥特曼分享了对4o吉卜力风突然走红以及大多数创业公司都是“套壳包装”的看法，并谈到了AI编程、AI智能体等前沿技术的发展趋势。尤其是当中提到了一个“杰文斯悖论”的典型案例——当编程成本下降时，全球对软件的需求会呈指数级增长。

4/8/2025 9:27:00 AM

量子位

清华耶鲁推理模型新范式：动态推理实现高效测试时扩展，大大节省Token消耗

推理性能提升的同时，还大大减少Token消耗！清华、耶鲁团队提出推理模型新范式：动态推理实现高效测试时扩展。测试时扩展（test-time scaling）技术加速推动了大语言模型在复杂推理领域的突破。

4/8/2025 9:16:00 AM

量子位

首个个性化对齐大模型问世！可精准识别用户内在动机和偏好，还有百万用户画像开源数据集 | 蚂蚁&人大

如何让大模型更懂「人」？虽然现有大模型经过了人类价值观对齐训练，但其对齐效果往往会让少数群体的声音被系统性淹没。那随之而来的问题是，当大模型服务全球用户，标准化对齐范式是否正在制造新的数字鸿沟？

4/8/2025 9:12:00 AM

量子位

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

最近AI圈最火的模型非GPT-4o莫属，各种风格图片持续火爆全网。如此强悍的图片生成能力，得益于GPT-4o本身是一个原生多模态模型。从最新发布的LLM来看，多模态已经成为绝对的主流。

4/8/2025 9:10:00 AM

新智元

中科大ICLR2025：特定领域仅用5%训练数据，知识准确率提升14%

让大语言模型更懂特定领域知识，有新招了！来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架——知识图谱驱动的监督微调（KG-SFT），该框架通过引入知识图谱（KG）来提升大语言模型（LLMs）在特定领域的知识理解和处理能力。实验结果表明，其在多个领域和多种语言的数据集上取得了显著的效果，成功入选ICLR 2025。

4/8/2025 9:00:00 AM

量子位

大语言模型（LLM）是如何思考的？讲讲推动下一代人工智能推理的五种途径

译者 | 张哲刚审校 | 重楼大语言模型（LLMs）最早时期只是具备自动完成的功能，迄今为止，进步巨大，与当初已经不可同日而语。然而，仅仅是生成流畅的文本并不足以体现真正的智能——真正的智能是需要推理能力的。这意味着，大语言模型需要能够解决数学问题、能够调试代码、能够得出合乎逻辑的结论，还要能够检查和改正自身的错误。

4/8/2025 8:18:38 AM

张哲刚

作者 | 陈峻审校 | 重楼今年初，随着DeepSeek惊艳全球，各个企业和组织都敏锐地察觉到了人工智能（AI）技术为其赋能的机遇。虽然居多IT专业人员都认为各项数字化服务都值得用AI进行提速提效，但是相对于All in AI的狂热，信息安全技术人员有必要在保持冷静的同时，积极筹备，尽快制定出针对那些涉及AI应用的安全性管控措施。下面，我将以自己在企业中的项目经验，依次从网络、系统、应用、模型、数据、以及合规，六个层面和你讨论一些具体、可落地的安全检查要点。

4/8/2025 8:10:03 AM

陈峻

初级开发者过度依赖 AI 的风险

当ChatGPT等工具出现故障时，软件开发人员离开工位、临时休息或沮丧地靠在椅背上的场景并不罕见。对许多技术从业者而言，AI辅助编码工具已成为日常便利。即便是像2025年3月24日那样的短暂中断，也可能导致开发工作停滞。

4/8/2025 8:05:00 AM

AI小蜜蜂

AI在供应链中的潜力

在当今动态且不断发展的商业环境中，AI已成为一股关键力量，有望通过提高效率、敏捷性和决策能力来推动各行业变革。各行各业的CEO正在认识到AI的潜力，尽管许多人预见到，为了在AI主导的世界中蓬勃发展，需要对当前运营进行调整。在供应链领域，这种矛盾体现得尤为明显，AI的潜力在很大程度上尚未得到开发，根据Gartner的调查，只有17%的供应链组织表示已成功大规模部署了AI。

4/8/2025 5:00:00 AM

Noha Tohamy

模态编码器 | 超强开源CLIP模型OpenCLIP

来自LAION、UC伯克利、HuggingFace等的工作，这篇工作的研究动机也很简单，CLIP 模型在多模态领域展现出了巨大潜力，但原始 CLIP 模型未完全开源，限制了其更广泛的应用和深入研究。 OpenCLIP 旨在通过开源的方式，让更多开发者能够无门槛地利用这一先进模型，推动多模态技术在各个领域的应用和发展。模型架构和原始CLIP无异，下面简单介绍这篇工作中的一些研究规律和实验结果。

4/8/2025 4:20:00 AM

Goldma

AI问答的核心！知识图谱：突破传统 RAG 的天花板

看似简单的 AI 问答系统，背后却隐藏着无数技术难题。当我们询问"组件 A 与组件 B 有什么区别"这样的问题时，传统检索增强生成(RAG)系统往往会犯难。它们就像只会做加法的计算器，遇到了需要乘除法的复杂方程...传统 RAG 的三大痛点传统 RAG 技术已成为 AI 应用的标配，但它面临三个根本性挑战：信息孤岛：文档被切分成互不相关的小块，丢失了上下文联系视野局限：只能基于文本相似度检索，无法理解概念间的逻辑关系推理能力缺失：无法像人类那样进行跨文档的综合分析例如，你问系统："A组件和B组件有什么区别？

4/8/2025 3:45:00 AM

大数据AI智能圈

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用 OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶文本搜索字节跳动大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练 DeepMind

理论