基因组

登Science封面!基因组基础模型Evo重磅发布,AI解码分子、DNA、RNA和蛋白质

编辑 | X_XChatGPT 可以写小说、编写计算机代码、给出食谱,它的硅片上包含了互联网上的大部分信息。 如果它能对 DNA 做同样的事情会怎么样? 今天,刊登在《Science》封面上一项最新研究,美国 Arc 研究所(Arc Institute)和斯坦福大学的研究团队提出了一种机器学习模型「Evo」,其能够以无与伦比的准确性解码和设计从分子到基因组规模的 DNA、RNA 和蛋白质序列。

我国科学家利用人工智能加速葡萄育种,效率提高 400%

AI在线从中国农科院基因组所官方微信公众号获悉,今日《自然・遗传学(Nature Genetics)》在线发表了中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)周永锋团队利用人工智能进行葡萄育种的最新研究成果。 该研究将大幅缩短葡萄育种周期,且对葡萄农艺性状的预测准确度高达 85%。 相比传统方法,育种效率可提高 400%。

Nature子刊,香港浸大、英伟达团队多模态深度语言模型,用于复杂的宏基因组研究

编辑 | 萝卜皮宏基因组组装基因组 (MAG) 为利用宏基因组测序数据探索微生物「暗物质」提供了宝贵的见解。然而,人们越来越担心 MAG 中的污染可能会严重影响下游分析的结果。目前的 MAG 净化工具主要依赖于标记基因,并没有充分利用基因组序列的背景信息。

中国科学家运用人工智能算法发现大量全新 RNA 病毒,大幅拓宽 RNA 病毒库

AI在线从中山大学官方微信公众号获悉,10 月 9 日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》(Cell)杂志上发表论文,报告了 180 个超群、超过 16 万种全球 RNA 病毒的发现,这是迄今为止规模最大的 RNA 病毒研究,大幅扩展了全球 RNA 病毒的多样性,该研究将人工智能技术应用于病毒鉴定,发现了传统方法未能发现的病毒“暗物质”,探索了病毒学研究的新路径。据介绍,传统的病毒发现方法包括病毒分离和生命组学的生物信息学分析,高度依赖既有知识,面对 RNA 病毒这种高度分化、种类繁多且容易变异

软银支持的基因检测公司 Tempus AI 受华尔街青睐:摩根大通等 7 家券商给出买入或增持评级

据路透社今日报道,当地时间周二开始,华尔街开始纷纷看好软银公司支持的基因检测公司 Tempus AI,该公司拥有 AI 驱动的临床和分子数据库,被认为可带来更强大的诊断和测试工具。AI在线注:Tempus AI 总部位于美国芝加哥,其向临床医师和医院系统销售基因组诊断测试产品,涵盖肿瘤学、精神病学、放射学和心脏病学等领域。包括摩根大通、摩根士丹利、美国银行全球研究部和 Stifel 在内的七家券商首次给予该公司“买入”或“增持”评级,TD Cowen 给出了最高的目标价 50 美元。摩根大通预测,Tempus 的收

预测蛋白质共调控和功能,哈佛&MIT训练含19层transformer的基因组语言模型

编辑 | 萝卜皮破译基因及其基因组背景之间的关系,是理解和设计生物系统的基础。机器学习在从大量蛋白质序列数据集中学习序列-结构-功能范式背后的潜在关系方面表现出潜力。哈佛大学和麻省理工学院(MIT)的研究人员在数百万个宏基因组框架上训练基因组语言模型(gLM),从而分析基因之间潜在的功能和调控关系。gLM 能够学习「上下文」化的蛋白质嵌入,捕获基因组上下文以及蛋白质序列本身,并编码具有生物学意义和功能相关的信息(例如酶功能、分类学)。该研究以「Genomic language model predicts prot

70 亿参数训练,从DNA、RNA、蛋白质到全基因组,生物学通用大模型新标杆

编辑 | 萝卜皮基因组是完整编码 DNA、RNA 和蛋白质的序列,这些序列协调整个生物体的功能。机器学习的进步与全基因组的海量数据集相结合,可以实现生物基础模型,加速复杂分子相互作用的机械理解和生成设计。斯坦福大学(Stanford University)和 Arc Institute 的研究人员开发了 Evo,这是一种基因组基础模型,可进行多模态和多尺度学习,能完成从分子到基因组规模的预测和生成任务。使用基于深度信号处理进步的架构,该团队将 Evo 扩展到 70 亿参数,单核苷酸字节分辨率的上下文长度为 131

准确率达 95%,机器学习预测复杂新材料合成

编辑/绿萝科学家和机构每年都投入非常多的资源来发现新材料,以期为燃料提供催化剂。随着自然资源的减少,以及对更高价值和先进性能产品的需求增长,研究人员越来越多地关注到纳米材料。但识别新材料的连续实验方法对材料发现施加了不可逾越的限制。近日,美国西北大学和丰田研究所(TRI)的研究人员应用机器学习来指导新纳米材料的合成,消除了材料发现相关的障碍。这种训练有素的算法,可通过定义数据集来准确预测可用于清洁能源、化学和汽车行业燃料的重要催化剂。该研究以「Machine learning–accelerated design
  • 1