科学

ByteQC:通往大规模实用化量子化学计算的曙光

编辑 | ScienceAI真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。 为了解决这一问题,近日字节跳动 ByteDance Research 团队开发并开源了 ByteQC ——基于 GPU 加速的大规模量子化学计算工具集。 该工具集使用强大的 GPU 算力,大幅度加速了常见的量子化学算法,同时结合领域内前沿的量子嵌入方法实现了量子化学「黄金标准」精度下的大规模量子化学体系的模拟。

上海交通大学医学院人工智能蛋白质设计课题组诚聘助理研究员、博士后、客座学生

课题组长简介张海仓,上海交通大学医学院研究员、实验室PI。 博士毕业于中国科学院计算技术研究所计算机专业,曾先后在字节跳动担任人工智能算法工程师、美国哥伦比亚大学担任博士后科学家、中国科学院计算技术研究所担任任副研究员。 研究方向聚焦人工智能算法及“AI  生命科学”交叉领域,尤其在AI 蛋白质设计 与 AI 药物设计方面有长期积累。

耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本

编辑 | 萝卜皮将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。 然而,现有的方法往往存在预测性能不佳、任务种类有限以及跨受试者泛化能力较差等问题。 针对这一问题,耶鲁大学(Yale University)、达特茅斯学院(Dartmouth College)和剑桥大学(University of Cambridge)的研究人员提出了 MindLLM,一种专为主题无关且用途广泛的 fMRI 到文本解码而设计的模型。

检索了15460项研究,AI与机械流行病学建模相结合:机遇和挑战的范围界定回顾

编辑丨toileter将嵌入机械模型中的先前流行病学知识与 AI 的数据挖掘功能相结合,为流行病学建模提供了变革性的潜力。 虽然 AI 与传统机械方法的融合正在迅速发展,但工作仍然分散。 目前,需要更好地纳入现实的决策考虑,扩大对不同数据集的探索,以及进一步研究生物和社会行为机制。

法国核聚变重大突破,等离子体运行1337秒刷新世界纪录!全球核电时代一步之遥

创纪录的1,337秒! 2月12日,法国WEST托卡马克装置,成功实现了创纪录的等离子体持续时间——超过22分钟。 这比几周前中国EAST装置的1066秒提升了25%。

Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?

DeepSeek的风,也是飘到了科研领域——最新消息,同济大学通过百度智能云千帆大模型平台接入并调用DeepSeek-R1/V3系列模型;包括浙大、北大清华等知名高校也是纷纷出动,要么接入模型推出智能体,又或者出品干货课程、使用手册《从入门到精通》等等,几度都登上热搜。 Nature更是几度发文,因为DeepSeek开源低成本易部署等优势,科学家们纷纷涌向DeepSeek,这种模型已经是科研AI工具中的全能者。 感知到的是,大模型在科研探索中发挥的价值远比以往任何时候都深入。

「诺奖风向标」2025斯隆奖公布,清华姚班大神霸榜!8位华人计算机科学家入选

2025斯隆研究奖,最新名单刚刚出炉! 今年,126位杰出的职业生涯早期科学家,荣获「诺奖风向标」斯隆研究奖。 这些学者凭借卓越的成就和巨大的发展潜力,成功跻身美国和加拿大新一代科学领军人物的行列。

登Science,MIT团队推出新蛋白质语言模型ProtGPS,预测蛋白在活细胞内的功能位置

编辑 | 萝卜皮蛋白质是维持细胞运转的主要动力,细胞中有成千上万种蛋白质,每种蛋白质都发挥着特殊的功能。 研究人员早就知道,蛋白质的结构决定了它的功能。 最近,科学家逐渐意识到,蛋白质的定位对其功能也至关重要。

2024 年 AI 十大故事,透视技术变革与未来挑战

编辑 | 20492024 年,人工智能技术持续改变着我们的生活和工作方式。 IEEE Spectrum 精选了年度最具影响力的 10 个 AI 故事,从技术突破到社会影响,全方位展现了 AI 发展的现状与挑战。 这些故事不仅反映了生成式 AI 的革命性进展,也揭示了其存在的局限与争议。

特朗普时代再临:科学界喜忧参半,AI与太空探索或成最大赢家

今天,特朗普将宣誓就任美国第47任总统,开启他的第二任期。 回看特朗普在第一任期(2017-2021)否认气候变化风险,并试图大幅削减科研资金的举措,科学界对于这位即将上任的美国总统的看法是:鉴于特朗普一直宣扬的要砍掉大量科研经费与大力支持马斯克的「政府效率部门」,预计他将放弃对环境和传染病等基础研究的支持,但可能会推动人工智能、量子研究和太空探索方面的工作。 科学家和工程师们因此也出现了两种截然不同的前景展望:科技公司、太空爱好者、人工智能(AI)开发者等期待未来几年他们将迎来有利政策,并对探索新的可能而感到无比兴奋。

模拟5亿年进化的ESM3在Science发布了,可推理蛋白质序列、结构和功能

编辑 | 萝卜皮2024 年夏天 EvolutionaryScale 推出了 ESM3,一款面向蛋白质语言的大模型,成功在自然进化未曾涉足的区域设计出功能性蛋白。 同期上线了该研究的预印版本。 时隔半年,该研究以「Simulating 500 million years of evolution with a language model」为题,于 2025 年 1 月 16 日在《Science》发布。

AI赋能传统力场:字节跳动开发高精度通用小分子力场ByteFF

编辑 | ScienceAI小分子力场是药物发现中的重要工具,在计算机辅助药物设计中发挥关键作用。 化学空间覆盖广泛且高效精确的小分子力场将为药物发现奠定可靠的基础。 尽管基于机器学习的 MLFF(如 ANI-2x,MACE-OFF23 等)能够提供非常精确的小分子势能面预测,但它们的训练需要海量数据量,且推理速度较慢,还存在外推场景不确定度大等问题。

分子特性预测新框架来了!浙大侯廷军团队、匹兹堡大学联合提出跨通道学习,各大基准表现亮眼

编辑 | 萝卜皮可靠的分子特性预测对于各种科学研究和工业应用(例如药物研发)至关重要。 然而,由于数据稀缺,加上物理化学和生物特性与传统分子特征化方案之间的高度非线性因果关系,使得开发稳健的分子机器学习模型变得异常复杂。 匹兹堡大学(University of Pittsburgh)与浙江大学侯廷军团队合作开发了一种多通道预训练框架,可以稳健学习利用化学知识。

GPT做不好图生成?Tokenization是关键!新方法重新定义图生成和表示方式

编辑 | ScienceAI图(Graphs)是描述复杂关系和结构化数据的重要工具,从分子设计到社交网络分析,它们在许多领域都扮演着关键角色。 然而,图生成的高效性与灵活性一直是一个挑战。 今天,我们向大家介绍一项突破性的研究——Graph Generative Pre-trained Transformer,简称 G2PT,一个重新定义图生成和表示方式的自回归模型。

Science子刊,斯坦福AI方法表示蛋白互作节点,增强功能识别与PPI推理

编辑 | 白菜叶生物网络通过详细描绘基因、蛋白质及其他细胞成分之间的复杂相互作用,为建模生物系统提供了重要工具。 这些网络将实体表示为节点,将其相互作用(从物理连接到功能关联)表示为边,从而为解析生物系统和过程的复杂性奠定了基础。 例如,在蛋白质-蛋白质相互作用(PPI)网络中,复杂的连接关系包含了理解细胞过程和疾病机制的关键信息。

谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议

就在Gemini 2.0发布之前几天,一位新晋华人博士宣布加入Google DeepMind,作为高级研究科学家致力于Gemini预训练和多模态研究。 薛复昭,博士毕业于新加坡国立大学师从尤洋教授,2021年以5.0的GPA成绩硕士毕业于南洋理工大学,师从庄永聪教授和孙爱欣教授。 在新加坡国立大学攻读博士期间,曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习,并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。

LLM学习原子「结构语言」,生成未知化合物的晶体结构,登Nature子刊

编辑 | 萝卜皮生成合理的晶体结构通常是预测材料化学成分及其性质的第一步,但当前大多数预测方法计算成本高,制约了创新进程。 通过使用优质生成的候选结构来预测晶体结构,可以突破这一瓶颈。 在最新的研究中,英国雷丁大学(University of Reading)的研究人员介绍了 CrystaLLM,这是一种基于晶体学信息文件 (CIF) 格式的自回归大型语言建模 (LLM) 的多功能晶体结构生成方法。

仅总参数量0.1%、单GPU 15分钟完成微调,人类基因组基础模型NT登Nature子刊

编辑 | 萝卜皮从 DNA 序列预测分子表型仍然是基因组学中的一个长期挑战,通常是由于注释数据有限以及无法在任务之间转移学习所致。 在这里,英国伦敦 InstaDeep 的研究人员提出了在 DNA 序列上进行预训练的基础模型,称为 Nucleotide Transformer;其参数范围从 5000 万到 25 亿,并整合了来自 3,202 个人类基因组和 850 个不同物种基因组的信息。 这些 Transformer 模型可生成特定上下文的核苷酸序列表示,即使在低数据环境下也能实现准确预测。