编辑 | 雪松
昼夜节律,如睡眠-觉醒周期,是大多数生物与生俱来的,对地球上的生命至关重要。昼夜时钟在 24 小时日夜周期中协调生物的各项生理变化,会间接影响我们人类的体能水平、健康程度、生存能力。
同样,将新陈代谢与日出落日同步等情况也存在于动物中,正确的生物钟有助于安排开花。了解昼夜节律,于动物而言,有助于提高动物的生长和产量;于人类而言,则有可能揭示出治疗疾病的新途径。
IBM欧洲钻研所与厄尔汉姆钻研所的合作团队,描述了一系列基于人工智能(AI)和机器学习(ML)的法子。这些法子可以从事更具老本效益的分析并深入了解昼夜节律的安排和功用。最具创新性的是,该团队仅运用DNA序列特色来从事正确的昼夜节律基因表示预计。
该钻研以「Interpreting machine learning models to investigate circadian regulation and facilitate exploration of clock function」为题,于2021年8月10日发布在《PNAS》杂志。
<img src="https://www.iaiol.com/wp-content/uploads/2024/07/20240703093229-66851aad2dafe.png" alt="晚上就应该睡觉?新的机器学习技术探索昼夜节律”>
生物钟是地球生命对环境的重要适应。在这里,钻研人员运用机器学习来预计拟南芥中复杂、时光和昼夜节律的基因表示模式。最重要的是,该法子运用从公共基因组资源从头生成的 DNA 序列特色对昼夜节律基因从事分类;这意味着该法子的下游应用,无需实验工作以及先验知识。
该团队运用特定转录本的本地模型说明,对 DNA 序列特色从事排序,并得出每个转录本潜在昼夜节律安排机制的详细概况。此外,该法子还可以运用 DNA 序列特色(局部的、说明性的、排序的)来区分转录表示的时光阶段,揭示昼夜节律集中隐藏的子集。「模型说明/说明」提供了法子学进步的支柱,从而可以深入了解生物过程和实验设计。
<img src="https://www.iaiol.com/wp-content/uploads/2024/07/20240703093229-66851aad362ce.png" alt="晚上就应该睡觉?新的机器学习技术探索昼夜节律”>
图示:拟南芥昼夜节律/非昼夜节律比较 ML 二元分类,具有 12 个转录组时光点。(来源:论文)
当运用减少数量的转录组时光点预计昼夜节律转录时,该团队运用模型说明来优化采样策略。最后,从单个转录组时光点预计昼夜节律时光,得出对正确预计最有影响的标识转录本;这可以促进从现有数据集中识别改变的时钟功用。
<img src="https://www.iaiol.com/wp-content/uploads/2024/07/20240703093229-66851aad3de01.png" alt="晚上就应该睡觉?新的机器学习技术探索昼夜节律”>
图示:拟南芥昼夜节律/非昼夜节律 ML 二元分类,以减少转录组时光点的数量。(来源:论文)
该钻研描述了一系列基于 ML 的法子,这些法子可以实现对拟南芥昼夜节律安排的老本效益分析和洞察。当运用少量 mRNA 测序(mRNA-seq)时光点预计昼夜节律转录本时。尽管在选择最少三个时光点时会丢失信息并导致 F1 分数下降,但与现有法子相比,该法子不仅提高了正确性,而且还运用模型说明来优化采样策略。钻研人员确定的一些最正确、减少的采样策略与现有法子一致(例如,在一天中均匀分布的时光点以最有效地捕获正弦波曲线)。
<img src="https://www.iaiol.com/wp-content/uploads/2024/07/20240703093229-66851aad48a71.png" alt="晚上就应该睡觉?新的机器学习技术探索昼夜节律”>
图示:拟南芥昼夜节律/非昼夜节律 ML 二元分类运用 k-mer 配置文件。(来源:论文)
最重要的是,仅运用 DNA 序列特色从事正确的昼夜节律分类,不需要安排元件或转录组数据的先验知识。这提供了优于现有法子的优势,不仅可以预计表示,还可以同时破译安排途径;由于运用可说明的 AI 算法,所以在从事预计时便可即时定义安排元件。运用人工智能,从头自动定义转录本的这些特色配置文件,并确定其优先级;这项工作通过有可能支持基因组的功用注释和精准农业。这个应用程序可以重新定义「如何生成可测试的假设」,从而理解基因表示控制。
该团队利用新法子预计昼夜节律时光,同时运用模型说明来推导拟南芥标识转录本。这些选定的转录本可用于测试现有和新兴拟南芥数据集中的单个数据点,以钻研基因型、处理和环境条件如何影响生物钟功用。此外,由于转录组数据集的时光老本和金钱老本很高,因此在单个时光点内减少对标识基因的分析,可以节省大量资源。
<img src="https://www.iaiol.com/wp-content/uploads/2024/07/20240703093229-66851aad53694.png" alt="晚上就应该睡觉?新的机器学习技术探索昼夜节律”>
图示:在基于 ML DNA 序列的分类后钻研拟南芥昼夜节律 TP 转录本。(来源:论文)
文章作者 Gardiner 博士补充道:「在作物中,昼夜节律对保持健康生长和发育至关重要;农业科学家和农民运用该模型了解动物的内在节律,可能会提高作物产量。同时,我们现在正在钻研不同的物种,钻研生物钟及其与人类疾病的联系,例如,生物钟失调与从抑郁症到癌症等一系列疾病有关。」
论文链接:https://www.pnas.org/content/118/32/e2103070118
相关报道:https://phys.org/news/2021-08-machine-technology-explores-circadian-rhythms.html