理论 - AI在线

万字长文解读Scaling Law的一切，洞见LLM的未来

Scaling Law 撞墙了吗？这算得上是近段时间 AI 领域最热门的话题之一。近日，资深机器学习研究科学家 Cameron R.

赛博树突觉醒！AI 仿生革命：更少参数，更强性能，过拟合？不存在的！

编辑丨&人工神经网络（ANN）是大多数深度学习（DL）算法的核心，这些算法可以成功解决图像识别、自动驾驶和自然语言处理等复杂问题。然而，与能够高效解决类似问题的生物大脑不同，DL 算法需要大量可训练参数，这使得它们能耗高且容易过拟合。来自希腊研究与技术基金会两位研究员示了一种新的 ANN 架构，它结合了生物树突的结构化连接和受限采样特性，抵消了这些限制。

Nature发布：2025年值得关注的七项技术

编辑 | 20492025 年，全球科技发展正以惊人的速度重塑人类社会的未来。在气候危机、疾病威胁与资源短缺的多重压力下，技术创新聚焦于两大核心方向：可持续性与人工智能（AI）的深度结合。《Nature》盘点了今年将密切关注的七项技术，从实验室的自动化革命到城市的生态改造，从精准医疗到环境修复，七项技术不仅加速科学发现，更试图为人类提供应对复杂挑战的规模化方案。

David Baker 利用 AI 设计蛋白质，一招制蛇毒，或将彻底改变蛇咬治疗

编辑丨&蛇中毒是一种严重的个人健康威胁，每年导致约 10 万人死亡和 30 万人永久残疾，尤其是在医疗资源匮乏的地区。目前的抗蛇毒血清主要依赖于动物血浆提取的多克隆抗体，存在成本高、副作用大、对某些毒素效果有限等问题。今年诺贝尔化学奖得主 David Baker 团队的一项研究揭示了蛇咬伤治疗可能改变游戏规则。

CityDreamer4D: 下一个世界模型，何必是视频生成模型？

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]。

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

英伟达市值蒸发近6000亿美元，而DeepSeek刚刚又开源新模型

机器之心报道，编辑：亚鹂、Panda。

验证速度提升25倍，准确率达95.1%，清华团队提出基于物理信息学习的电池衰减预测方法

图 1：研究概念图。编辑 | ScienceAI随着全球对可再生能源需求的日益增长，电池作为储能系统关键技术的地位愈发凸显。然而，电池研发过程中面临着从材料原型到商业产品转化的重重挑战，电池原型验证效率低、研发成本高以及生产废料管理不善等问题制约着电池行业的可持续发展。

闲来无事，我测了测国产大模型的RAG能力新智元新智元 2025年01月27日 12:25 北京

最近，AI界被推理模型刷屏了。国内各家的推理模型，在新年到来之际不断刷新我们的认知。不过，当我们在实际应用中考量大模型，衡量好不好用的标准，就绝不仅仅局限于其性能和规模了。

28年AGI撞上数据墙，以后全靠测试时计算？CMU详解优化原理

2025年主导AI的将是第3代scaling law：测试时计算。正如Michael Dell转述所言：第一代scaling：预训练像读大学第二代scaling：微调像读博士第三代scaling：测试时计算就像深度思考和推理近日，计算机强校CMU机器学习系，发表博客文章解释LLM测试时计算优化问题，特别是涉及到的元强化学习（meta-RL）问题。文章亮点如下：监督学习只是在训练模型「答案是什么」，只要学习「如何解答」，模型泛化性会更好。

DeepSeek R1，如此火爆！

编辑 | 言征、伊风相信连DeepSeek的创始人梁文锋自己都没有想到，春节前的一次发布，让全球AI圈都陷入了“冰与火”之中，一方面大洋两岸都在惊叹：一家出自浙江的非“六小龙”公司能欧这么短时间就能用开源的方式，推出性能堪比甚至赶超OpenAI o1的模型，成本却更是出奇的低。一时间，全球AI玩家纷纷快速推出自己的“DeepSeek-R1”复刻版。抱抱脸、伯克利、港科大很快就用实力证明了：DeepSeek R1 是名副其实的国产推理模型的巨大胜利！

DeepSeek在美超越ChatGPT！问鼎苹果免费App第一

DeepSeek的热，还在持续ing。就在刚刚过去的周末，DeepSeek反超ChatGPT，一举登顶美区苹果应用商店免费App排行第一！其热度之高，有网友甚至这样描述：我甚至都不喜欢AI助手应用，但我已经下载了DeepSeek。

人工智能工具帮助科学家预测病毒进化

新冠肺炎凸显了在有效预测和应对新发传染病方面的重大差距。疫情的毁灭性影响是一个持久的提醒。虽然我们摆脱了新冠肺炎，其他病毒或新突变仍可能构成威胁。

OpenAI推出Operator帮助用户自动浏览网站

OpenAI发布了一个新的用于预览的AI代理Operator，该代理可以控制计算机浏览器并代表你执行操作。该工具可以通过键入、单击和滚动与网页进行交互。 Operator是OpenAI的首批AI代理之一。

创造历史！DeepSeek超越ChatGPT登顶中美AppStore

DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。一觉醒来，DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用，直接登顶 AppStore。不少网友都认为这是他们当之无愧。

Meta-CoT：通过元链式思考增强大型语言模型的推理能力

大型语言模型（LLMs）在处理复杂推理任务时面临挑战，这突显了其在模拟人类认知中的不足。尽管 LLMs 擅长生成连贯文本和解决简单问题，但在需要逻辑推理、迭代方法和结果验证的复杂任务（如高级数学问题和抽象问题解决）中，其能力有所欠缺。这种局限性源于 LLMs 的信息处理方式。

微软等开源AIOpsLab，可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了，一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务，实现故障的自动化检测、定位和解决问题。还具备高度的可观测性，能够收集和分析关键的遥测数据，确保对系统状态和应用环境的深入洞察。

在2025年初，浅浅聊一聊世界模型 World Models

Update 1月10日:感谢评论区补充world model在RL中的定义！感觉在RL中的定义，world model是针对一个具体子任务的模型，最近上述公司提到的World Model的尺度似乎更大、更加通用，更多从：Language Generation Model (ChatGPT)-Image Generation Model(StableDiffusion)-Video/3D Geneartion Model (二者各有侧重因此平级)-World Generation Model(同时具备时序和空间序建模)这么一个趋势。当然这个World似乎想要包容一切，于是也并不清晰到底是什么样的表征：是否是video sequence?

理论