理论

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]

英伟达市值蒸发近6000亿美元,而DeepSeek刚刚又开源新模型

机器之心报道,编辑:亚鹂、Panda。

验证速度提升25倍,准确率达95.1%,清华团队提出基于物理信息学习的电池衰减预测方法

图 1:研究概念图。 编辑 | ScienceAI随着全球对可再生能源需求的日益增长,电池作为储能系统关键技术的地位愈发凸显。 然而,电池研发过程中面临着从材料原型到商业产品转化的重重挑战,电池原型验证效率低、研发成本高以及生产废料管理不善等问题制约着电池行业的可持续发展。

闲来无事,我测了测国产大模型的RAG能力 新智元 新智元 2025年01月27日 12:25 北京

最近,AI界被推理模型刷屏了。 国内各家的推理模型,在新年到来之际不断刷新我们的认知。 不过,当我们在实际应用中考量大模型,衡量好不好用的标准,就绝不仅仅局限于其性能和规模了。

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

2025年主导AI的将是第3代scaling law:测试时计算。 正如Michael Dell转述所言:第一代scaling:预训练像读大学第二代scaling:微调像读博士第三代scaling:测试时计算就像深度思考和推理近日,计算机强校CMU机器学习系,发表博客文章解释LLM测试时计算优化问题,特别是涉及到的元强化学习(meta-RL)问题。 文章亮点如下:监督学习只是在训练模型「答案是什么」,只要学习「如何解答」,模型泛化性会更好。

DeepSeek R1,如此火爆!

编辑 | 言征、伊风相信连DeepSeek的创始人梁文锋自己都没有想到,春节前的一次发布,让全球AI圈都陷入了“冰与火”之中,一方面大洋两岸都在惊叹:一家出自浙江的非“六小龙”公司能欧这么短时间就能用开源的方式,推出性能堪比甚至赶超OpenAI o1的模型,成本却更是出奇的低。 一时间,全球AI玩家纷纷快速推出自己的“DeepSeek-R1”复刻版。 抱抱脸、伯克利、港科大很快就用实力证明了:DeepSeek R1 是名副其实的国产推理模型的巨大胜利!

DeepSeek在美超越ChatGPT!问鼎苹果免费App第一

DeepSeek的热,还在持续ing。 就在刚刚过去的周末,DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一! 其热度之高,有网友甚至这样描述:我甚至都不喜欢AI助手应用,但我已经下载了DeepSeek。

人工智能工具帮助科学家预测病毒进化

新冠肺炎凸显了在有效预测和应对新发传染病方面的重大差距。 疫情的毁灭性影响是一个持久的提醒。 虽然我们摆脱了新冠肺炎,其他病毒或新突变仍可能构成威胁。

OpenAI推出Operator帮助用户自动浏览网站

OpenAI发布了一个新的用于预览的AI代理Operator,该代理可以控制计算机浏览器并代表你执行操作。 该工具可以通过键入、单击和滚动与网页进行交互。 Operator是OpenAI的首批AI代理之一。

创造历史!DeepSeek超越ChatGPT登顶中美AppStore

DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。 一觉醒来,DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用,直接登顶 AppStore。 不少网友都认为这是他们当之无愧。

Meta-CoT:通过元链式思考增强大型语言模型的推理能力

大型语言模型(LLMs)在处理复杂推理任务时面临挑战,这突显了其在模拟人类认知中的不足。 尽管 LLMs 擅长生成连贯文本和解决简单问题,但在需要逻辑推理、迭代方法和结果验证的复杂任务(如高级数学问题和抽象问题解决)中,其能力有所欠缺。 这种局限性源于 LLMs 的信息处理方式。

微软等开源AIOpsLab,可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了,一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务,实现故障的自动化检测、定位和解决问题。 还具备高度的可观测性,能够收集和分析关键的遥测数据,确保对系统状态和应用环境的深入洞察。

在2025年初,浅浅聊一聊世界模型 World Models

Update 1月10日:感谢评论区补充world model在RL中的定义! 感觉在RL中的定义,world model是针对一个具体子任务的模型,最近上述公司提到的World Model的尺度似乎更大、更加通用,更多从:Language Generation Model (ChatGPT)-Image Generation Model(StableDiffusion)-Video/3D Geneartion Model (二者各有侧重因此平级)-World Generation Model(同时具备时序和空间序建模)这么一个趋势。 当然这个World似乎想要包容一切,于是也并不清晰到底是什么样的表征:是否是video sequence?

单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型

本文经AIGC Studio公众号授权转载,转载请联系出处。 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术,能从单一的人脸图像中重建出360度的头部模型。 FaceLift基于两阶段的流程实现:基于扩散的多视图生成模型从单张人脸图像生成一致的侧面和背面视图;生成的视图被输入到GS-LRM重建器中,产出详细的3D高斯表示。

鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜

中科院院士鄂维南、字节AI实验室总监李航领衔,推出高级论文搜索Agent。 名为PaSa,两个Agent分别执行多轮搜索和判断论文是否满足查询要求的任务,模仿人类复杂学术搜索行为。 现在就有Demo可玩。

用Ray观测和监控大语言模型工作负载

译者 | 布加迪审校 | 重楼前言GPT-4、PHI2、BERT和T5等大语言模型(LLM)的出现已彻底改变了自然语言处理,这些模型支持高端应用程序,包括聊天机器人、推荐系统和分析。 然而,LLM中工作负载的规模和复杂性使得保证性能和可靠性成了一大挑战。 在这种情况下,在使用Ray等框架部署工作负载的同时进行监控和观测显得非常必要。

十大机器蜜蜂:机器蜜蜂能拯救地球上所有的植物吗?

译者 | 张哲刚审校 | 重楼作为一个几乎每天都要吃蜂蜜吐司的人,在过去的几年里,我一直非常关注全球蜜蜂种群持续减少这个话题。 蜜蜂不仅仅是蜂蜜生产者,它们还是大自然中伟大的传粉者。 尽管,就传粉者而言,它们并不是唯一,但是,据我所知,它们是唯一能够生产蜂蜜的传粉者。

MetaDiff:用扩散模型重塑元学习,攻克小样本学习瓶颈!

一眼概览MetaDiff 提出了一种基于条件扩散模型的创新元学习方法,通过将梯度下降优化建模为去噪过程,有效提升了小样本学习(FSL)的性能,显著减少了内循环优化中的内存负担和梯度消失风险。 核心问题小样本学习的主要挑战在于:如何在训练数据有限的情况下快速适应新任务,而不引入过拟合或内存瓶颈。 传统基于梯度的元学习方法需要计算内循环路径上的二阶导数,导致内存消耗高和梯度消失问题,从而影响性能。