美国洛斯阿拉莫斯国家实验室(LANL)开发的中子星并合模拟正在为Polymathic AI合作项目做出重要贡献,该项目正在训练人工智能模型,以帮助推动看似不同领域的科学发现。这些模拟准确地跟踪了宇宙中一些最具活力的事件的后果,为基础模型数据集提供了独特的代码,可以帮助训练人工智能模型,使其能够做出与天体物理学、生物学、声学、化学、流体动力学等领域相关的预测。
中子星并合是指两个中子星互相绕转,释放引力波,轨道能量损失,最终在剧烈碰撞、释放引力波暴之后合二为一。
LANL的天体物理学家Jonah Miller说:“Polymathic AI项目专注于基础模型。在基础模型中,你需要一个人工智能模型,并在某个空间中尽可能多地训练它。”“虽然一些人工智能模型是基于文本和语言构建的,但科学基础模型是基于模拟的数据集构建的。在尽可能多的物理模拟信息上训练网络,使其能够捕捉到在其他应用领域中有用的潜在趋势。”
Miller将他的中子星并合模拟贡献给了Polymathic AI发布的两个数据集之一。该数据集被称为“井”(The Well),包含生物系统、流体动力学、声散射、超新星爆炸和其他复杂过程的数值模拟,包括Miller的专长中子星并合。这些并合发生在两颗恒星在双星轨道上度过数十亿年后,然后碰撞并留下一个被高温、富含中子的物质包围的黑洞,这为伽马射线爆发提供了动力,伽马射线爆发是一种令人难以置信的高能光子的高能释放。
这个剧烈的过程产生了我们宇宙中的重元素。一些聚变重元素的放射性衰变产生了一种光学到红外的余辉,称为千新星,可以在地球上看到。
利用模拟数据进行有价值预测
即使使用超级计算机,用于理解中子星并合的方程也很难求解。但是,当人工智能能够检测到一般趋势时,例如质量守恒和/或能量守恒,它就可以使用原始数据来帮助研究人员在特定情况下进行预测,而不是运行昂贵而耗时的模拟。Miller的每一次模拟都用LANL300个核心的超级计算机上进行了三周;经过训练的基础模型或神经网络可以补充这些昂贵的计算。
Miller说:“以这种方式使用人工智能的好处是,这种方法可以提取我们自己可能不知道的东西。”“基础模型可以提供有助于保存模拟的预测,也有助于为未来更好的模拟提供信息。毕竟,物理定律是普遍的,我们编写计算机代码的方式依赖于某些数学规则。基础模型可能会接受这些定律和规则。”
数据集可供免费下载
The Well是向公众发布的两个开源训练数据集之一,可从Flatiron Institute免费下载,并可在托管AI模型和数据集的HuggingFace平台上访问。Polymathic AI团队在加拿大温哥华领先的机器学习会议NeurIPS上发表的一篇论文中提供了有关数据集的更多信息。
第二个数据集被称为多模态宇宙,包含数亿次天文观测和测量,例如美国国家航空航天局James Webb太空望远镜拍摄的星系全景和欧洲航天局盖亚航天器对我们银河系恒星的测量。这些数据集共有来自数十个来源的115TB数据,供科学界用于训练人工智能模型。