AI for Science
生信工具评测方法:基于蛋白质对的计算机预测工具评估
编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。 存在多种功能注释方法,而且它们的数量一直在增长,尤其是随着深度学习技术的发展。 但是,目前尚不清楚这些工具是否真的具有预测性。
剑桥团队革新RNA速率分析:AI算法突破基因动态追踪
编辑丨&RNA 速率模型利用剪接和未剪接的 RNA 计数中包含的时间信息来推断转录动力学,但现有的速率模型通常依赖于粗略的生物物理简化或数值近似来求解基础常微分方程(ODE)。 英国剑桥大学主导的团队提出了 cell2fate,它允许以完全贝叶斯方式求解生物物理学上更准确的模型。 通过将 RNA 速率解决方案分解为模块,cell2fate 在 RNA 速率和统计降维之间建立了生物物理联系。
迄今为止最大最全面!人类专家级准确性,AI数据驱动的生物医学知识图谱
编辑 | 萝卜皮为了应对生物医学研究中科学出版物和数据的快速增长,知识图谱(KG)已成为整合大量异构数据以实现高效信息检索和自动知识发现的重要工具。 然而,将非结构化的科学文献转化为知识图谱仍然是一项艰巨的挑战,之前的方法无法达到人类水平的准确率。 在最新的研究中,佛罗里达州立大学(Florida State University)和 Insilicom LLC 的研究人员使用了在 LitCoin 自然语言处理挑战赛 (2022) 中获得第一名的信息提取流程,利用所有 PubMed 摘要构建了一个名为 iKraph 的大规模知识图谱。
准确率达88%,从随机性走到确定性,AI驱动的小鼠胚胎模型发育预测
编辑丨&干细胞来源的胚胎模型的最新进展改变了发育生物学,提供了对胚胎发生的见解,而不受自然胚胎的限制。 然而,模型开发的多变性对研究标准化来说并不算容易。 德国埃尔斯鲁厄理工学院与美国加州理工学院的科研人员在面对这个问题时,选择使用深度学习来提高选择干细胞衍生胚胎模型的可重复性。
用LLM做半导体设计,IBM&MIT提出受神经启发的LLM推理网络SOLOMON
编辑丨coisini尽管大型语言模型(LLM)擅长复杂推理,但在适应特定领域时仍面临挑战,尤其是在需要空间推理和解决结构化问题的领域。 半导体布局设计就是一个典型例子,AI 工具必须理解几何约束并确保组件的精确布局。 基于此,来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON,旨在增强领域特定的适应性。
无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025
编辑丨ScienceAI在药物研发和材料科学领域,设计具有特定性质的分子是一项关键但耗时的任务。 传统方法依赖大量实验试错,而生成式 AI 模型的出现为这一领域带来曙光。 然而,现有方法面临两大瓶颈:一是多数生成模型仅能处理连续型数据(如图像像素),难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据;二是针对特定性质的定向生成通常需要额外训练模型,成本高昂。
「品尝」电影里的蛋糕?智能「电子舌头」或将满足你的愿望
编辑 | 萝卜皮想不想「品尝」电影里的蛋糕? 当看到影片主角在大快朵颐时是不是也想吃点什么? 体脂秤立刻马上清除了你的想法bi~~~「每逢佳节倍思亲」身处异乡的你亲朋聚餐打来视频时是否馋得流口水bi~~~没问题!
扩散模型+深度学习双剑合璧,生成式AI破解染色质构象
编辑丨&人体内的每一个细胞都包含相同的基因序列,但每个细胞只表达这些基因的一个方面。 这些细胞特异性基因表达模式确保脑细胞与皮肤细胞不同,部分由染色质的三维结构决定,遗传物质控制着每个基因的可及性。 高通量测序和成像技术的最新进展大大提高了如今研究单个细胞基因组组织的能力。
90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台
编辑丨&功能蛋白质组学为癌症机制提供了关键见解,有助于发现新的生物标志物和治疗靶点。 为了充分利用他们整合的将近 500 份高质量抗体的精选组合,美国德克萨斯大学决定采用 LLM 驱动来使资源更高效。 他们推出了 DrBioRight 2.0,这是一个由最先进的大型语言模型提供支持的直观生物信息学平台。
纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
编辑 | 2049想象一下,如果我们能像观察夜空中闪烁的星星一样,清晰地观察到原子在材料表面的「舞动」,这将为理解材料功能打开一扇全新的大门。 然而,传统的电子显微镜技术面临着一个根本性挑战:要实现毫秒级时间分辨率的原子尺度成像,必须大幅降低电子束剂量,而这导致图像被噪声淹没,模糊了关键细节。 为了解决了这一技术瓶颈,亚利桑那州立大学(ASU)和纽约大学(NYU)的研究团队开发了一种基于无监督深度学习(Unsupervised Deep Learning)的去噪框架,实现了在温和电子束剂量下对气体环境中金属纳米颗粒表面进行毫秒级时间分辨率的原子尺度观察。
Nature封面:探索真菌网络,用机器人进行高通量延时成像研究
编辑 | ScienceAI丛枝菌根(AM)共生关系是自然界中最为广泛的共生伙伴关系之一。 4.5 亿年来,菌根真菌构建了用于与植物根系交换养分资源的网络。 经过 4.5 亿年的自然选择,AM 网络的灵活性和响应性极强。
11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP
编辑 | 萝卜皮大型语言模型 (LLM) 在化学和生物医学研究中取得了显著进展,可作为各种任务的多功能基础模型。 浙江大学侯廷军、谢昌谕以及南方医科大学姜志辉等课题组组成的联合团队提出了 AMP-Designer,这是一种基于 LLM 的方法,用于快速设计具有所需特性的抗菌肽 (AMP)。 在 11 天内,AMP-Designer 实现了 18 种具有广谱抗革兰氏阴性细菌活性的 AMP 的从头设计。
Science子刊,AI与生物物理建模相结合,设计新型蛋白质
编辑 | 萝卜皮机器学习 (ML) 正在改变计算蛋白质设计的世界,数据驱动方法在实验成功率方面超越了基于生物物理的方法。 然而,它们通常被报告为案例研究,缺乏整合和标准化,因此很难进行客观比较。 在最新的研究中,德国莱比锡大学(Leipzig University)的跨学科研究团队在 Rosetta 软件框架内建立了一个精简且多样化的工具箱,用于预测氨基酸概率的方法,以便对这些模型进行并排比较。
Nature:如何借助AI高效完成学术论文同行评审
编辑 | matrix许多研究人员都有这样的体验:接受审稿邀请往往意味着一整天的时间被占用。 他们花费数小时标注手稿,却发现自己需要更多时间来消化内容才能提供连贯的反馈。 因此,不少学者开始婉拒审稿邀请,以保护自己宝贵的时间和精力。
为 AI 助力药物发现的方法
编辑丨toileter在历史上,药物研发向来是吃力且效率低下。 德国汉堡生物技术公司 Evotec 的计算化学家 David Pardoe 说,在过去的一百年里,只发现了约 7000 种罕见病的大概 500 种治疗方法。 但从理论上讲,AI 可以解决当前的两个问题:耗时与高成本。
多中心医学图像分析模型,VFMGL框架破解数据孤岛难题,93.4% Dice系数的卓越表现
编辑丨&在众多中下游任务中,收到广泛而多样的数据集训练的基础模型表现出的强大性能,在医疗领域表现却不甚得人心。 受到到数据量、异质性和隐私问题等问题的严重阻碍,基础模型得不到更进一步的发展。 桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight(VFMGL)框架,以促进各种医疗任务的专家临床模型的去中心化构建。
无缝集成知识图谱,开源Python框架BioChatter降低LLM生物医学使用门槛
编辑丨coisini大型语言模型(LLMs)已经改变了人们的工作方式,从支持内容创作、编程到改进搜索引擎等。 然而,LLMs 在透明度、可重复性和定制化方面的不足仍然是一个挑战,限制了它们在生物医学研究中的广泛应用。 对生物医学研究人员来说,针对特定研究问题优化 LLMs 可能是一项艰巨的任务,因为这需要编程技能和机器学习专业知识。
谷歌旗下带来细胞器动力学的「全息解码器」,启动亚像素级细胞器分析
编辑丨&细胞器经历不断的形态变化和动态相互作用,这是细胞稳态、应激反应和疾病进展的基础。 尽管细胞器的形态与运动十分重要,但由于其复杂的结构,高速的运动模式与目前现有分析技术的局限性,量化细胞器形态仍具有挑战性。 美国旧金山 Calico Life Sciences 的团队推出了一个名为 Nellie 的模型,这是一种自动化且无偏倚的管道,用于分割、跟踪和提取不同细胞内结构的特征。