理论

新的训练范式可以防止机器学习模型学习虚假相关性

译者 | 李睿审校 | 重楼机器学习领域长期存在的问题之一是错误相关性的记忆。例如：假设开发人员正在开发一个深度神经网络对陆地鸟类和海洋鸟类的图像进行分类。他们使用数千张标记过的图像训练模型，这个模型在训练集和测试集上的表现都非常出色。

2/11/2025 8:11:56 AM

李睿

告别 DeepSeek 系统繁忙，七个 DeepSeek 平替入口，官网崩溃也能用！

前言DeepSeek作为一款备受瞩目的国产大模型，以其强大的功能和卓越的性能赢得了众多用户的青睐。然而，随着用户量的激增，DeepSeek官网近期频繁遭遇服务器繁忙甚至崩溃的问题，给广大用户带来了不小的困扰。面对这一现状，许多用户急于寻找能够替代或绕过官网限制的方法，以继续享受DeepSeek带来的便捷与高效。

2/11/2025 8:06:43 AM

大姚

检索增强生成（RAG）过时了，缓存增强生成（CAG）上位

译者 | 布加迪审校 | 重楼检索增强生成（RAG）已成为为定制信息定制大语言模型（LLM）的事实上的方法。然而RAG带来了前期技术成本，并且速度可能很慢。由于长上下文LLM方面取得的进步，企业可以通过在提示中插入所有的专有信息来绕过RAG。

2/11/2025 8:00:00 AM

布加迪

DeepSeek 颠覆 Excel？这次 AI 真的要革新办公了！

2025年的开端，技术圈再次被DeepSeek引爆。 DeepSeek凭借极低的训练成本，实现了与ChatGPT相媲美的性能，对全球科技界带来了极大的冲击。不少开发者对DeepSeek的实际应用产生了浓厚兴趣，纷纷询问如何快速上手。

2/11/2025 7:44:09 AM

编程疏影

不用DeepSeek，10s一键生成精美PPT？！（附详细教程）

最近DeepSeek强势出圈，今天偶然打开Kimi看了下，左侧突然多了个黄色的小按钮，鼠标移动上去，发现是PPT助手。图片在当今，无论工作和学习，PPT 制作无疑是一项频繁且重要的任务。无论是职场汇报、学术演讲还是日常教学，一份高质量的 PPT 都能帮助我们更好地传达信息、展示成果。

2/11/2025 7:42:50 AM

码易有道

网友用DeepSeek做人类从未见过的菜，引400多万吃瓜群众围观

AI好好用报道编辑：杨文AI食神做的「锦绣多味鱼」，要顶替掉西湖醋鱼。前几天，「用 AI 做一道人类从未出现过的菜」登上抖音热榜，竟吸引 442.8 万吃瓜群众围观。光看该词条，就知道这指定是哪个聪明绝顶的网友在搞抽象。

2/10/2025 3:27:00 PM

AI好好用

PNAS顶刊 | 抗体中和活性提升1000倍，百奥几何生成式AI高效反击病毒新变种

编辑丨Science AI近日，百奥几何（BioGeometry）携手上海交通大学药学院朱建伟团队，基于生成式 AI 驱动的抗体优化策略，在短时间内精准优化 8G3 抗体，实现其对最新病毒变异株 JN.1 的中和活性 1000-1500 倍的跃升。相关研究成果已正式发表在国际顶级期刊《美国国家科学院院刊》（PNAS）上【1】，继 CR3022 抗体、肿瘤抗原 5T4 纳米抗体【2】等多个优化案例后，再次证明了生成式 AI 驱动抗体工程的广泛适用性和变革潜力。论文地址： AI 抗体工程：精准优化 8G3 抗体，中和活性提升 1000-1500 倍由于病毒基因组的快速进化和新变种的不断产生增加了治疗的复杂性，大多数早期开发的抗体已无法精准识别并有效结合目标，导致中和能力大幅下降。

2/10/2025 2:53:00 PM

ScienceAI

DeepSeek火遍中国汽车圈！吉利、东风最激进，李斌何小鹏打气，上汽官宣打造全球首个DS实装量产汽车品牌！网友：服务器架不住了

出品 | 51CTO技术栈（微信号：blog51cto）继各大腾讯、阿里等各大AI Infra厂商火速接入DeepSeek后，这款“国民AI”的热度已经席卷到了汽车圈。图片首先是吉利，主打的是语音主动交互场景。 2月6日，吉利汽车宣布其自研的星睿大模型与DeepSeek-R1深度融合，具体来讲就是利用DeepSeek-R1模型对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。

2/10/2025 2:41:32 PM

从人才流失到智慧回流：AlphaFold 试图重塑非洲科研DNA

编辑丨toileter2024 年，诺贝尔化学奖再次强调了结构生物学在现代科学中的变革性作用。它表彰了 David Baker 对蛋白质设计和 AlphaFold 开发的贡献。 AlphaFold 是一种最先进的 AI 工具，用于根据初级氨基酸序列预测蛋白质的 3D 结构。

2/10/2025 2:39:00 PM

ScienceAI

奥特曼最新AGI断言：人工智能的成本每 12 个月下降约 10 倍，但推动AI能力边界的成本不会变便宜

出品 | 51CTO技术栈（微信号：blog51cto）本周巴黎人工智能行动峰会之前，许多科技界知名人士都提前亮出了他们对人工智能未来的愿景。 OpenAI 首席执行官 Sam Altman 也不例外，今天更新了个人博客，提出了一些新概念或者新提法：比如“计算预算”（ compute budget），再比如“2035 年，任何人都应该能够调动与 2025 年所有人的智能总和”。 “技术进步的历史影响表明，我们关心的大多数指标（健康结果、经济繁荣等）在平均水平和长期来看都会有所改善，但促进平等似乎并非由技术决定，要做到这一点可能需要新的想法，”Altman写道。

2/10/2025 2:05:39 PM

推理时也能做偏好优化，无需额外重训练，来自上海AI Lab港中文等

随着大语⾔模型（LLMs）在各类任务中展现出令人瞩目的能力，如何确保它们⽣成的回复既符合预期又安全，始终是⼀项关键挑战。传统的偏好对⻬⽅法，如基于⼈类反馈的强化学习（RLHF）和直接偏好优化（DPO），依赖于训练过程中的模型参数更新，但在⾯对不断变化的数据和需求时，缺乏⾜够的灵活性来适应这些变化。为了突破这⼀瓶颈，上海人工智能实验室、香港中文大学等联合提出了推理时偏好优化（TPO）方法，通过在推理阶段与奖励模型交互，借助可解释的文本反馈，迭代优化模型输出，实现了即时的模型对⻬，⽽⽆需重新训练。

2/10/2025 2:05:00 PM

量子位

如何优化测试时计算？解决「元强化学习」问题

优化大模型的测试时计算是提升模型部署效率和节省计算资源的关键一环。前段时间，黄仁勋在 CES 2025 的演讲中把测试时 Scaling 形容为大模型发展的三条曲线之一。如何优化测试时计算成为业界关注的重要课题。

2/10/2025 1:50:00 PM

机器之心

Nature：离 “量子互联网” 又近一步！牛津大学证实分布式量子计算可行性

量子通信技术又迎来了新进展！牛津大学研究人员在Nature上发表的最新研究，在两米的距离上实现了确定性的量子门传送，保真度达86%。研究人员表示，这项研究给各种物理平台的大规模量子计算提供了可行的途径，并为量子互联网打下了基础。

2/10/2025 1:40:00 PM

量子位

DeepSeek上线国家超算平台！671B满血版，三大运营商接入，平头哥芯片适配

DeepSeek的含金量还在上升，一个半个周末过去发生这些大事：国家超算互联网平台上线DeepSeek-R1，最高支持671B的满血版。平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型，在RISC-V架构CPU和端侧平台打开新的应用空间。再加上春节期间的三大运营商全面接入DeepSeek等消息，它的影响力已不仅限于AI和互联网，正在往产业更深层进发。

2/10/2025 1:35:00 PM

量子位

AI意识更进一步！谷歌DeepMind等：LLM不仅能感受痛苦，还能趋利避害

在科幻电影《机械姬》中，女主角是一款能够感受痛苦的机器人；然而LLM为代表的AI能否感知痛苦和快乐，一直是存在争议。一些科学家认为，大模型缺乏相应的生理结构和神经系统，因此无法体验情感。而另一些人则认为，大模型能够生成关于痛苦和快乐的详细描述，并且能够在选择情境中权衡痛苦和快乐，这表明它们可能具有某种程度的情感体验。

2/10/2025 1:30:00 PM

新智元

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/10/2025 1:15:00 PM