准确率达95%,混合深度学习搜索纳米生物材料,登Nature子刊
编辑 | 萝卜皮超分子肽基材料具有革新纳米技术和医学等领域的巨大潜力。 然而,破译其实际应用所必需的复杂序列到组装途径仍然是一项艰巨的任务。 它们的发现主要依赖于需要大量资金的经验方法,这阻碍了它们的颠覆性潜力。- 973
- 0
登Science封面!基因组基础模型Evo重磅发布,AI解码分子、DNA、RNA和蛋白质
编辑 | X_XChatGPT 可以写小说、编写计算机代码、给出食谱,它的硅片上包含了互联网上的大部分信息。 如果它能对 DNA 做同样的事情会怎么样? 今天,刊登在《Science》封面上一项最新研究,美国 Arc 研究所(Arc Institute)和斯坦福大学的研究团队提出了一种机器学习模型「Evo」,其能够以无与伦比的准确性解码和设计从分子到基因组规模的 DNA、RNA 和蛋白质序列。- 981
- 0
AI发现超16万种新RNA病毒?阿里云、中山大学合作研究登Cell
编辑 | 萝卜皮人工智能(AI)已被用来揭示地球各个角落的多种基本生命体。阿里云、中山大学、悉尼大学等机构的合作团队开发了一种深度学习算法,称为 LucaProt,用于发现来自全球不同生态系统的 10,487 个宏转录组中高度分化的 RNA 依赖性 RNA 聚合酶 (RdRP) 序列。LucaProt 整合了序列和预测结构信息,从而能够准确检测 RdRP 序列。- 9
- 0
中国科学家运用人工智能算法发现大量全新 RNA 病毒,大幅拓宽 RNA 病毒库
AI在线从中山大学官方微信公众号获悉,10 月 9 日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》(Cell)杂志上发表论文,报告了 180 个超群、超过 16 万种全球 RNA 病毒的发现,这是迄今为止规模最大的 RNA 病毒研究,大幅扩展了全球 RNA 病毒的多样性,该研究将人工智能技术应用于病毒鉴定,发现了传统方法未能发现的病毒“暗物质”,探索了病毒学研究的新路径。据介绍,传统的…- 17
- 0
从头设计「超难」癌症抗体,大卫贝克团队AI生物计算方法的新应用
编辑 | 萝卜皮原癌基因 Ras 控制多种细胞内通路,具有四种主要亚型 (KRAS4A、KRAS4B、HRAS 和 NRAS),具有高度的序列同源性和相似的体外生物化学特性。由于它们与不同癌症的关联各不相同,人们对独立研究它们的作用有浓厚的兴趣,但 Ras 异构体特异性结合试剂很少,因为唯一显著的序列差异在于它们无序且高度带电的 C 端,而这些 C 端很难引发机体产生抗体。为了克服这一限制,华盛顿…- 5
- 0
中科院计算所团队提出CarbonNovo,基于AI进行蛋白质结构和序列的端到端从头设计
编辑 | ScienceAI作者 | 计算所张海仓团队近期,中国科学院计算所张海仓带领的研究团队提出了 CarbonNovo,以端到端的方式联合设计蛋白质主链结构和序列。该研究以「CarbonNovo: Joint Design of Protein Structure and Sequence Using a Unified Energy-based Model」为题发表在机器学习会议 ICML…- 53
- 0
Falcon Mamba 7B 开源模型登顶:换掉 Transformer,任意长序列都能处理
只是换掉 Transformer 架构,立马性能全方位提升,问鼎同规模开源模型!(注意力机制不存在了)这就是最新 Falcon Mamba 7B 模型。它采用 Mamba 状态空间语言模型架构来处理各种文本生成任务。通过取消传统注意力机制,有效提升了模型处理长序列时计算效率低下的问题。它可以处理无限长序列,但内存需求不增加。无论上下文多长,生成每个 token 的时间基本一样。由此,Falcon …- 18
- 0
Nature子刊,准确率达96%,AI从序列中展望蛋白-配体互作
编辑 | 萝卜皮在药物研发中,确定小分子配体对蛋白质的分离亲和力和性能效力至关重要。目前的计算要领可以展望这些蛋白质-配体相互作用特性,但如果没有高分辨率的蛋白质布局,通常会失去准确性,并且无法展望性能效力。莫纳什大学(Monash University)和格里菲斯大学(Griffith University)的研讨人员开发了 PSICHIC(PhySIcoCHemICal graph neura…- 41
- 0
准确率达0.96,从序列中展望蛋白-配体互作的物理化学制约图神经网络
编辑 | 萝卜皮在药物研发中,确定小分子配体对蛋白质的分离亲和力和功效效力至关重要。目前的计算要领可以展望这些蛋白质-配体相互作用特性,但如果没有高分辨率的蛋白质构造,通常会失去准确性,并且无法展望功效效力。莫纳什大学(Monash University)和格里菲斯大学(Griffith University)的钻研人员开发了 PSICHIC(PhySIcoCHemICal graph neura…- 6
- 0
模拟5亿年的退化信息,首个同时推理卵白质序列、构造和功效的生物学大模型
编辑 | 萝卜皮在三十亿年的做作退化历程中,现存卵白质的形态得以形成,经历了漫长的做作筛选过程。退化如同在地质时间尺度上进行的平行试验,通过随机突变和选择机制,依据卵白质的序列、构造与功效进行筛选。在这里,EvolutionaryScale 的钻研职员展示了在退化产生的标记上训练的言语模型可以充当退化模拟器,用于生成不同于已知卵白质序列的功效性卵白质。钻研职员提出了 ESM3,这是一种前沿的多模态…- 10
- 0
登Nature子刊,中科院计算所团队开发CarbonDesign,进行准确且稳健的蛋白质序列安排
编辑 | 萝卜皮蛋白质是生物体内执行生物功效的基础元件,在催化、免疫和信号传递等生物过程中起着重要作用。一般认为,蛋白质序列安排是蛋白质布局猜测的逆问题。具体地,是指从给定的蛋白质三维布局出发,安排出能够折叠成为目标蛋白布局、具有目标蛋白功效的序列。它是重新蛋白质安排的关键一步,一旦主链布局被生成,为其安排最佳序列就变得至关重要。蛋白质序列安排在药物安排、酶工程等领域具有重要应用。由于可能的蛋白质…- 7
- 0
多功能RNA阐发,百度团队基于Transformer的RNA语言模型登Nature子刊
编辑 | 萝卜芯预训练语言模型在阐发核苷酸序列方面显示出了良好的前景,但应用单个预训练权重集在不同工作中表现出色的多功能模型仍然存在挑战。百度大数据实验室(Big Data Lab,BDL)和上海交通大学团队开发了 RNAErnie,一种基于 Transformer 架构,以 RNA 为中心的预训练模型。钻研人员用七个数据集和五个工作评价了模型,证明了 RNAErnie 在监视和无监视学习方面的优…- 10
- 0
3倍灵敏度,搜刮百万卵白对只需几秒,复旦、山大、上海交大开发新的卵白质说话模型
编辑 | 萝卜皮同源卵白质搜刮是卵白质注释和分析最常用的格式之一。与布局搜刮相比,仅从序列中检测近程进化关系仍然具有挑战性。复旦大学、山东大学以及上海交通大学的钻研团队提出了 PLMSearch(Protein Language Model),一种仅以序列作为输出的同源卵白质搜刮格式,能够捕获隐藏在序列后面的近程同源信息。PLMSearch 可以像 MMseqs2 一样在几秒钟内搜刮数百万个查问宗…- 16
- 0
70 亿参数训练,从DNA、RNA、蛋白质到全基因组,生物学通用大模型新标杆
编辑 | 萝卜皮基因组是完整编码 DNA、RNA 和蛋白质的序列,这些序列协调整个生物体的性能。机器进修的进步与全基因组的海量数据集相结合,可以实现生物根本模型,加速复杂份子相互作用的机械理解和生成设计。斯坦福大学(Stanford University)和 Arc Institute 的钻研职员开发了 Evo,这是一种基因组根本模型,可进行多模态和多尺度进修,能完成从份子到基因组范围的展望和生成…- 6
- 0
制药新工具、有望规避免疫反应,多伦多大学团队用AI框架重新计划参与基因治疗的关键卵白质
编辑 | 萝卜皮当下,卵白质计划深度生成模型的快速进展主要集中在具有大量数据的小卵白质上。这些模型在自然序列有限的大卵白上表现不佳,例如腺病毒和腺相关病毒的衣壳卵白,它们是基因治疗的常见递送载体。生成分解病毒载体血清型可以克服大多数基因治疗接受者表现出的强大的事后消失的免疫反应。多伦多大学的研讨人员提出了一种变异自动编码器(ProteinVAE),它可以生成分解病毒载体血清型,而无需事后消失的中和…- 6
- 0
全球最长开源!元象开源大模型XVERSE-Long-256K,无条件免费商用!
元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,让大模型利用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。全球主流长文本大模型图谱 参数量和高质量数据量决定了大模型的计算复杂度,而长文本技能(Long Context)是大模型利用发展“杀手锏”,因技能新、研发…- 6
- 0
Protein BLAST会成为过去吗?AlphaFold等对卵白布局的搜寻是否会取代对序列的搜寻
编辑 | 白菜叶像 AlphaFold 这样的卵白质布局搜寻对象会用 BLAST 取代卵白质序列搜寻吗?德累斯顿工业大学的钻研团队讨论了利用布局搜寻进行远程同源性检测的前景,以及为什么卵白质 BLAST 作为领先的序列搜寻对象应努力纳入布局信息。BLAST 广泛用于分子生物学中搜寻核苷酸和卵白质序列。BLAST 推出三十年后,布局预计出现了重大突破,出现了 RoseTTAFold 和 AlphaF…- 7
- 0
ICCV 2023 | 重塑人体作为生成,融合集中模型与检索策略的新范式ReMoDiffuse来了
来自南洋理工大学和商汤科技的研究者联合提出了一种全新的文本驱动作为生成框架——ReMoDiffuse。- 11
- 0
MIT钻研职员将Transformer与图神经网络结合,用于计划全新蛋白质
编辑 | 萝卜皮凭借其繁杂的排列和动态功能,蛋白质通过采用简单建立块的独特排列(其中几何形状是关键)来执行大量的生物任意。将这个几乎无限的排列库转化为各自的功能,可以方便钻研职员计划用于特定用途的定制蛋白质。麻省理工学院(MIT)的 Markus Buehler 提出了一种天真的鉴于谈话模型的深度学习策略,将 Transformer 与图神经网络结合起来,以更好地理解和计划蛋白质。「通过这种新步骤…- 5
- 0
想把半本《红楼梦》搬进ChatGPT输入框?先把这个问题解决掉
从 GPT-4 的 32k 到谷歌 CoLT5 的 64k 再到最新钻研的 200万 token,类ChatGPT 模型们可以处理的文本长度正在急剧增长,这意味着它们的应用范围也越来越广。或许有一天,ChatGPT 能帮乔治·马丁把《冰与火之歌》(权力的游戏)写完呢?过去两年,斯坦福大学 Hazy Research 实验室一直在从事一项重要的工作:增长序列长度。 他们有一种观点:更长的序列将开启机…- 11
- 0
用于抗体设想的深度生成蛋白谈话模型
编辑 | 萝卜皮用于医治运用的单克隆抗体的发现和优化依赖于大型序列库,但受到低溶解度、低热稳定性、高聚集和高免疫原性等可开发性问题的阻碍。在数百万个蛋白质序列上训练的生成谈话模型是按需生成逼真、多样化序列的强大工具。约翰霍普金斯大学的科学家和工程师团队提出了免疫球蛋白谈话模型 (IgLM),这是一种深度生成谈话模型,用于通过重新设想可变长度的抗体序列跨度来创建分解库。IgLM 将抗体设想制定为基于…- 8
- 0
CVPR 2021 | 空儿序列疾病猜测的因果隐马尔可夫模型
本文是对发表于计算机视觉和模式识别领域的顶级会议 CVPR 2021的论文“Causal Hidden Markov Model for Time Series Disease Forecasting(空儿序列疾病猜测的因果隐马尔可夫模型)”的解读。 该论文由北京大学王亦洲课题组与深睿医疗等单位合作,针对空儿序列疾病猜测的问题,提出了因果隐马尔可夫模型描述疾病的动态发展过程,并使用基于 VAE 的…- 9
- 0
做时光序列猜测有必要用深度进修吗?事实证明,梯度提升返回树媲美甚至超越多个DNN模型
在深度进修要领应用广泛的今天,所有范围是不是非它不可呢?其实未必,在时光序列猜测任务上,简略的机械进修要领能够媲美甚至超越很多 DNN 模型。- 10
- 0
序列
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!