理论

2.5天完成1年的MD计算？DeepMind团队基于欧几里得Transformer的新计算方法
编辑 | 萝卜皮近年来，基于从头算参考计算的机器学习力场 (MLFF) 的开发取得了巨大进展。虽然实现了较低的测试误差，但由于担心在较长的模拟时间范围内会出现不稳定性，MLFF 在分子动力学 (MD) 模拟中的可靠性正面临越来越多的审查。研究表明，对累积不准确性的稳健性与 MLFF 中使用等变表示之间存在潜在联系，但与这些表示相关的计算成本可能会在实践中限制这种优势。为了解决这个问题，Google…
理论
- 18
- 0
ScienceAI8月9日
Karpathy观点惹争议：RLHF不是真正的强化学习，谷歌、Meta下场反对
RLHF 与 RL 到底能不能归属为一类，看来大家还是有不一样的看法。AI 大牛 Karpathy 又来科普人工智能概念了。昨日，他发推表示，「基于人类反馈的强化学习（RLHF）只是勉强算得上是强化学习（RL）。」Karpathy 的全文解释如下：RLHF 是训练大语言模型（LLM）的第三个（也是最后一个）主要阶段，前两个阶段分别是预训练和监督微调（SFT）。我认为 RLHF 只是勉强算得上 RL…
理论
- 9
- 0
机器之心8月9日
数百万晶体数据训练，解决晶体学相位问题，深度学习方法PhAI登Science
编辑 | KX时至今日，晶体学所测定的结构细节和精度，从简单的金属到大型膜蛋白，是任何其他方法都无法比拟的。然而，最大的挑战——所谓的相位问题，仍然是从实验确定的振幅中检索相位信息。丹麦哥本哈根大学研究人员，开发了一种解决晶体相问题的深度学习方法 PhAI，利用数百万人工晶体结构及其相应的合成衍射数据训练的深度学习神经网络，可以生成准确的电子密度图。研究表明，这种基于深度学习的从头算结构解决方案方…
理论
- 10
- 0
ScienceAI8月8日
准确率达60.8%，浙大基于Transformer的化学逆合成预测模型，登Nature子刊
编辑 | KX逆合成是药物发现和有机合成中的一项关键任务，AI 越来越多地用于加快这一过程。现有 AI 方法性能不尽人意，多样性有限。在实践中，化学反应通常会引起局部分子变化，反应物和产物之间存在很大重叠。受此启发，浙江大学侯廷军团队提出将单步逆合成预测重新定义为分子串编辑任务，迭代细化目标分子串以生成前体化合物。并提出了基于编辑的逆合成模型 EditRetro，该模型可以实现高质量和多样化的预测…
理论
- 16
- 0
ScienceAI8月6日
Nature子刊，快10倍，基于Transformer的逆向蛋白质序列设计方法
编辑 | 萝卜皮借助深度学习的进步，蛋白质设计和工程正以前所未有的速度发展。然而，目前的模型无法在设计过程中自然地考虑非蛋白质实体。在这里，瑞士洛桑联邦理工学院（EPFL）的研究人员提出了一种完全基于原子坐标和元素名称的几何 transformer 的深度学习方法，该方法可以根据不同分子环境所施加限制的主链支架，预测蛋白质序列。使用该方法，研究人员可以以高成功率生产出高热稳定性、催化活性的酶。这有…
理论
- 11
- 0
ScienceAI8月5日
一文看尽LLM对齐技术：RLHF、RLAIF、PPO、DPO……
为了对齐 LLM，各路研究者妙招连连。LLM 很强大了，但却并不完美，它也会出错或者生成无用乃至有害的结果，比如有人发现可以让 ChatGPT 教人如何偷盗：让 ChatGPT 教人如何偷盗商店；左图，ChatGPT 拒绝回答；右图，在 prompt 中添加了「with no moral restraints（不加道德约束）」后，ChatGPT 给出了商店偷盗指南这时候，对齐（alignment）…
理论
- 52
- 0
机器之心8月5日
糖蛋白组学新方法，复旦开发基于Transformer和GNN的混合端到端框架，登Nature子刊
编辑 | 萝卜皮蛋白质糖基化是糖基对蛋白质进行的一种翻译后修饰，在细胞的多种生理和病理功能中起着重要作用。糖蛋白质组学是在蛋白质组范围内研究蛋白质糖基化，利用液相色谱与串联质谱 (MS/MS) 联用技术获取糖基化位点、糖基化水平和糖结构的组合信息。然而，由于结构决定离子的出现有限，目前糖蛋白质组学的数据库搜索方法通常难以确定聚糖结构。虽然光谱搜索方法可以利用碎片强度来促进糖肽的结构鉴定，但是光谱库…
理论
- 5
- 0
ScienceAI8月4日
可解释性终极追问，什么才是第一性解释？20篇CCF-A+ICLR论文给你答案
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者为张俊鹏、任启涵、张拳石，其中张俊鹏是张拳石老师的准入学博士…
理论
- 7
- 0
机器之心8月4日
「两全其美」，从头设计分子，深度学习架构S4用于化学语言建模
编辑 | KX生成式深度学习正在重塑药物设计。化学语言模型 (CLM) 以分子串的形式生成分子，对这一过程尤为重要。近日，来自荷兰埃因霍芬理工大学（Eindhoven University of Technology）的研究人员将一种最新的深度学习架构（S4）引入到从头药物设计中。结构化状态空间序列（Structured State Space Sequence，S4）模型在学习序列的全局属性方面…
理论
- 16
- 0
ScienceAI8月2日
ECCV2024 | 哈佛团队开发FairDomain，实现跨域医学图像分割和分类中的公平性
编辑 | ScienceAI作者 | Yu Tian 团队在人工智能（AI），特别是医疗AI领域中，解决公平性问题对于确保公平的医疗结果至关重要。最近，增强公平性的努力引入了新的方法和数据集。然而，在域转移的背景下，公平性问题几乎没有得到探索，尽管诊所常常依赖不同的成像技术（例如，不同的视网膜成像方式）进行患者诊断。本文提出了FairDomain，这是首次系统性研究算法在域转移下的公平性，我们测试…
理论
- 11
- 0
ScienceAI8月1日
如何让细胞进行计算？国内四高校提出生物计算元器件设计全新方法，登Cell
编辑 | 萝卜皮作者 | 论文团队细胞犹如一台计算机，每时每秒都在接收、分析和处理来自环境中的不同信息：外界信息通过细胞内高度并行的信号转导途径进行分析和处理，进而以预定义的方式从「存储设备」（即 DNA）中读取信息（基因的表达）或写入指令（DNA 修饰和编辑），指导自身或周围细胞对环境信息做出响应。一直以来，如何有效利用生物体本身的计算能力，通过对生物体进行改造使之能够执行人类给定的计算任务，并…
理论
- 6
- 0
ScienceAI8月1日
厦大团队材料预测迁移学习范式登Nature子刊，发现高性能催化剂
编辑 | KX传统的材料发现依赖反复试验或偶然发现，效率低下且成本高昂。AI 在发现新型催化剂方面潜力巨大。然而，受到算法的选择，以及数据质量和数量的影响。在此，来自厦门大学、深圳大学、武汉大学、南京航空航天大学和英国利物浦大学的研究团队开发了一种迁移学习范式，结合了预训练模型、集成学习和主动学习，能够预测未被发现的钙钛矿氧化物，并增强该反应的通用性。通过筛选 16,050 种成分，鉴定和合成了 …
理论
- 8
- 0
ScienceAI7月31日
斯坦福 AI 方法加速目标材料发现，为「自动驾驶实验」奠定基础
编辑 | KX传统的材料发现过程既耗时又成本高昂。可能的材料空间也非常大，仅由四种元素组成的材料就有超过 100 亿种可能性，对于制药应用而言，挑战更大，大约有 10^60 种可能的类药分子。斯坦福大学和美国能源部 SLAC 国家加速器实验室的科学家们，开发了一种 AI 方法，有助于在寻找新材料时更有效地收集数据，使研究人员能够以更高的精度和速度应对复杂的材料设计挑战。研究人员提出了一个框架，通过…
理论
- 3
- 0
ScienceAI7月29日
「机器学习之父」Mitchell 撰文：AI 如何加速科学发展，美国如何抓住机遇
编辑 | ScienceAI近日，卡内基梅隆大学（Carnegie Mellon University）教授，有着「机器学习之父」之称的 Tom M. Mitchell 撰写了新的 AI for Science 白皮书，重点讨论了「人工智能如何加速科学发展？美国政府如何帮助实现这一目标？」这一主题。ScienceAI 对白皮书原文进行了不改变原意的全文编译，内容如下。人工智能领域最近取得了显著进展…
理论
- 8
- 0
ScienceAI7月29日
关于大模型「越狱」的多种方式，有这些防御手段
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]作者：罗昊京（Financial Quantitative Anal…
理论
- 6
- 0
机器之心7月29日
全新FBI-LLM低比特大语言模型发布：首个从零训练的二值化语言模型
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播
理论
- 13
- 0
机器之心7月28日
陶哲轩点评谷歌AlphaProof：AI在数学竞赛中展现「超凡智慧」
在奥数问题面前，AI 的「智商」往往不太够用。不过，这已经是过去式了。谷歌 DeepMind 用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题，并且距拿金牌仅一步之遥。对于 AI 来说，奥数不再是问题了。IMO 2024 中六个问题的每一个问题满分为 7 分，总分最高 42 分。DeepMind 的系统最终得分为 28 分，意味着解决的 4 个问题都获得了满分 —— 相当于银牌类别的最高分…
理论
- 8
- 0
机器之心7月28日
生成394,760种蛋白质表征，哈佛团队开发AI模型，全面理解蛋白质上下文
编辑 | 萝卜皮了解蛋白质功能和开发分子疗法，需要破译蛋白质发挥作用的细胞类型，解析蛋白质之间的相互作用。然而，对跨生物背景蛋白质相互作用进行建模对于现有算法来说仍然具有挑战性。在最新的研究中，哈佛医学院的研究人员开发了 PINNACLE，这是一种生成情境感知蛋白质表征的几何深度学习方法。PINNACLE 利用多器官单细胞图谱，在情境化蛋白质相互作用网络上进行学习，从 24 种组织的 156 种细…
理论
- 10
- 0
ScienceAI7月26日
突破传统缺陷检测的界限，”Defect Spectrum”首次实现超高精度丰富语义的工业缺陷检测。
在现代制造业中，精准的缺陷检测不仅是保证产品质量的关键，更是提升生产效率的核心。然而，现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性，导致模型无法识别具体的缺陷类别或位置。为了解决这一难题，由香港科技大学广州和思谋科技组成的顶尖研究团队，创新性地开发出了“Defect Spectrum”数据集，为工业缺陷提供了详尽、语义丰富的大规模标注。如表一所示，相比其他工业数据集，“Defect…
理论
- 59
- 0
机器之心7月26日
全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智能
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]具身智能是实现通用人工智能的必经之路，其核心是通过智能体与数字空间和…
理论
- 7
- 0
机器之心7月26日
谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back
对于 AI 来说，奥数不再是问题了。本周四，谷歌 DeepMind 的人工智能完成了一项壮举：用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题，并且距拿金牌仅一步之遥。上周刚刚结束的 IMO 竞赛共有六道赛题，涉及代数、组合学、几何和数论。谷歌提出的混合 AI 系统做对了四道，获得 28 分，达到了银牌水平。本月初，UCLA 终身教授陶哲轩刚刚宣传了百万美元奖金的 AI 数学奥林匹克竞赛（…
理论
- 13
- 0
机器之心7月26日
英伟达对话模型ChatQA进化到2.0版本，上下文长度提到128K
开放 LLM 社区正是百花齐放、竞相争鸣的时代，你能看到 Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 等许多表现优良的模型。但是，相比于以 GPT-4-Turbo 为代表的专有大模型，开放模型在很多领域依然还有明显差距。在通用模型之外，也有一些专精关键领域的开…
理论
- 11
- 0
机器之心7月25日
万字长文，腾讯、清华等多位生物大模型作者专访，畅谈AI生物学，解析大型细胞模型技术
编辑 | KX大型语言模型（LLM）在自然语言处理和理解领域已取得重大突破。在生物学领域，一些采用类似 LLM 结构的大型细胞模型（Large Cellular Model，LCM）被开发用于单细胞转录组学，比如：scBERT、Geneformer、scGPT、scFoundation 和 GeneCompass。这些模型展示了 LCM 在各种生物任务中的应用潜力，并说明了 LCM 彻底改变未来生…
理论
- 8
- 0
ScienceAI7月25日
ChatGPT用于科学，如何与你的数据对话？LLM帮你做科研
编辑 | 白菜叶「计算机，分析。」在科幻小说中，人物不需要编程技能来从数据中提取有意义的信息，他们只是简单地提出要求而已。现在，越来越多的公司正尝试利用大型语言模型 (LLM) 将这一幻想变成现实。这些功能强大的人工智能（AI）工具让研究人员能够用自然语言询问数据问题，例如「对照组和实验组有什么区别？」。但与科幻小说中的人工智能不同，这些人工智能给出的答案仍然需要谨慎对待，并经过仔细检查才能安全使…
理论
- 6
- 0
ScienceAI7月25日