科学
特朗普时代再临:科学界喜忧参半,AI与太空探索或成最大赢家
今天,特朗普将宣誓就任美国第47任总统,开启他的第二任期。 回看特朗普在第一任期(2017-2021)否认气候变化风险,并试图大幅削减科研资金的举措,科学界对于这位即将上任的美国总统的看法是:鉴于特朗普一直宣扬的要砍掉大量科研经费与大力支持马斯克的「政府效率部门」,预计他将放弃对环境和传染病等基础研究的支持,但可能会推动人工智能、量子研究和太空探索方面的工作。 科学家和工程师们因此也出现了两种截然不同的前景展望:科技公司、太空爱好者、人工智能(AI)开发者等期待未来几年他们将迎来有利政策,并对探索新的可能而感到无比兴奋。
模拟5亿年进化的ESM3在Science发布了,可推理蛋白质序列、结构和功能
编辑 | 萝卜皮2024 年夏天 EvolutionaryScale 推出了 ESM3,一款面向蛋白质语言的大模型,成功在自然进化未曾涉足的区域设计出功能性蛋白。 同期上线了该研究的预印版本。 时隔半年,该研究以「Simulating 500 million years of evolution with a language model」为题,于 2025 年 1 月 16 日在《Science》发布。
AI赋能传统力场:字节跳动开发高精度通用小分子力场ByteFF
编辑 | ScienceAI小分子力场是药物发现中的重要工具,在计算机辅助药物设计中发挥关键作用。 化学空间覆盖广泛且高效精确的小分子力场将为药物发现奠定可靠的基础。 尽管基于机器学习的 MLFF(如 ANI-2x,MACE-OFF23 等)能够提供非常精确的小分子势能面预测,但它们的训练需要海量数据量,且推理速度较慢,还存在外推场景不确定度大等问题。
分子特性预测新框架来了!浙大侯廷军团队、匹兹堡大学联合提出跨通道学习,各大基准表现亮眼
编辑 | 萝卜皮可靠的分子特性预测对于各种科学研究和工业应用(例如药物研发)至关重要。 然而,由于数据稀缺,加上物理化学和生物特性与传统分子特征化方案之间的高度非线性因果关系,使得开发稳健的分子机器学习模型变得异常复杂。 匹兹堡大学(University of Pittsburgh)与浙江大学侯廷军团队合作开发了一种多通道预训练框架,可以稳健学习利用化学知识。
GPT做不好图生成?Tokenization是关键!新方法重新定义图生成和表示方式
编辑 | ScienceAI图(Graphs)是描述复杂关系和结构化数据的重要工具,从分子设计到社交网络分析,它们在许多领域都扮演着关键角色。 然而,图生成的高效性与灵活性一直是一个挑战。 今天,我们向大家介绍一项突破性的研究——Graph Generative Pre-trained Transformer,简称 G2PT,一个重新定义图生成和表示方式的自回归模型。
Science子刊,斯坦福AI方法表示蛋白互作节点,增强功能识别与PPI推理
编辑 | 白菜叶生物网络通过详细描绘基因、蛋白质及其他细胞成分之间的复杂相互作用,为建模生物系统提供了重要工具。 这些网络将实体表示为节点,将其相互作用(从物理连接到功能关联)表示为边,从而为解析生物系统和过程的复杂性奠定了基础。 例如,在蛋白质-蛋白质相互作用(PPI)网络中,复杂的连接关系包含了理解细胞过程和疾病机制的关键信息。
谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议
就在Gemini 2.0发布之前几天,一位新晋华人博士宣布加入Google DeepMind,作为高级研究科学家致力于Gemini预训练和多模态研究。 薛复昭,博士毕业于新加坡国立大学师从尤洋教授,2021年以5.0的GPA成绩硕士毕业于南洋理工大学,师从庄永聪教授和孙爱欣教授。 在新加坡国立大学攻读博士期间,曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习,并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。
LLM学习原子「结构语言」,生成未知化合物的晶体结构,登Nature子刊
编辑 | 萝卜皮生成合理的晶体结构通常是预测材料化学成分及其性质的第一步,但当前大多数预测方法计算成本高,制约了创新进程。 通过使用优质生成的候选结构来预测晶体结构,可以突破这一瓶颈。 在最新的研究中,英国雷丁大学(University of Reading)的研究人员介绍了 CrystaLLM,这是一种基于晶体学信息文件 (CIF) 格式的自回归大型语言建模 (LLM) 的多功能晶体结构生成方法。
仅总参数量0.1%、单GPU 15分钟完成微调,人类基因组基础模型NT登Nature子刊
编辑 | 萝卜皮从 DNA 序列预测分子表型仍然是基因组学中的一个长期挑战,通常是由于注释数据有限以及无法在任务之间转移学习所致。 在这里,英国伦敦 InstaDeep 的研究人员提出了在 DNA 序列上进行预训练的基础模型,称为 Nucleotide Transformer;其参数范围从 5000 万到 25 亿,并整合了来自 3,202 个人类基因组和 850 个不同物种基因组的信息。 这些 Transformer 模型可生成特定上下文的核苷酸序列表示,即使在低数据环境下也能实现准确预测。
精确属性控制,湖大、西电从头药物设计AI方法,登Nature子刊
编辑 | 萝卜皮深度生成模型在药物从头设计领域受到广泛关注。 然而,针对新靶点合理设计配体分子仍然具有挑战性,特别是在控制生成分子的性质方面。 在这里,受到 DNA 编码化合物库技术的启发,湖南大学和西安电子科技大学的研究人员提出了 DeepBlock,这是一种基于块(block)的配体生成深度学习方法,可根据目标蛋白质序列进行定制,同时实现精确的属性控制。
我国首个抽水蓄能大模型正式投用:智能化管理全国近 20% 装机容量的抽水蓄能设备
央广网昨日(11 月 29 日)备发布博文,报道称南方电网自主研发的首个抽水蓄能大模型正式投入使用,标志着全国近五分之一装机容量的抽水蓄能设实现深度智能化管理,将显著提升电网的调峰储能能力,为国家能源安全保驾护航。
AI 卷翻科研:DeepMind 36 页报告称全球实验室被「AI 科学家」指数级接管
OpenAI 科学家 Jason Wei 预测,未来一年内,AI 重点将从推广大众需求转为促进科学发展,无独有偶,DeepMind 刚刚发布的 36 页报告也揭示出:全球实验室 AI 使用正在指数级增长,AI for Science 真正的黄金时代即将来临。
AI卷翻科研!DeepMind 36页报告:全球实验室被「AI科学家」指数级接管
过去两年,AI主打用户增长,成功实现了大众化普及。 毕竟,拉新才是商业王道。 然而,如今AI日常的应用已经快卷到天花板了。
AlphaFold3级性能、开源、可商用,MIT团队推出生物分子预测模型Boltz-1
图示:来自测试集的靶标上的 Boltz-1 的示例预测。 (来源:论文)编辑 | 萝卜皮2024 年 11 月 18 日,麻省理工学院(MIT)的研究人员宣布推出 Boltz-1,这是一个开源模型,旨在准确模拟复杂的生物分子相互作用。 Boltz-1 是第一个完全商业化的开源模型,在预测生物分子复合物的 3D 结构方面达到 AlphaFold3 级精度。
创新能力超越AI Scientist,上海AI Lab「AI 科研团队」VirSci来了
编辑 | ScienceAI由上海人工智能实验室提出的 VirSci(Virtual Scientists)系统是一个基于大语言模型(LLM)的多智能体协作平台,专注于模拟科学家团队的合作过程,从而加速科研创新。 不同于以往的单智能体系统,VirSci 通过使用真实科学家的数据来模拟科学团队的多人协作,不仅可以通过团队成员的合作讨论来生成更具创新性和影响力的科研想法,还展现出作为「科学学」(Scienceof Science)研究工具的巨大潜力。 该研究以「Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation」为题,于 2024 年 10 月 12 日发布在 arXiv 预印平台。
全球首个多模态地理科学大模型“坤元”发布,中国科学院打造
中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位 9 月 19 日正式发布全球首个多模态地理科学大模型“坤元”(Sigma Geography)。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力。研发团队完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作,让“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图
“全球科学智能发展联盟”在京倡议发起,北大清华百度华为等参与
为了响应人工智能时代的潮流与国家战略需求,促进人工智能技术在科学研究领域的应用与发展,8 月 23 日,30 家单位的专家学者在北京大学中关新园召开会议,倡议成立“全球科学智能发展联盟”。“全球科学智能发展联盟”致力于构建一个跨行业、跨学科、开放合作的平台,促进人工智能与科学研究的深度融合,推动人工智能在基础科学、能源材料、生命健康等多个领域的广泛应用,为解决人类面临的重大挑战提供有力支撑。联盟的主要目标是依托高校及研究机构的研究优势,以及企业的产业化应用优势,充分发挥和整合成员各方优势和资源,推动人工智能技术在科
「机器学习之父」Mitchell 撰文:AI 如何加速科学发展,美国如何抓住机遇
编辑 | ScienceAI近日,卡内基梅隆大学(Carnegie Mellon University)教授,有着「机器学习之父」之称的 Tom M. Mitchell 撰写了新的 AI for Science 白皮书,重点讨论了「人工智能如何加速科学发展?美国政府如何帮助实现这一目标?」这一主题。ScienceAI 对白皮书原文进行了不改变原意的全文编译,内容如下。人工智能领域最近取得了显著进展,包括 GPT、Claude 和 Gemini 等大型语言模型,因此提出了这样一种可能性:人工智能的一个非常积极的影响,