宇宙的标准模型仅依赖六个数字。Flatiron研究所的研究人员及其同事利用一种由人工智能驱动的新方法,提取了隐藏在星系分布中的信息,以令人难以置信的精度估算出其中五个所谓的宇宙学参数的值。
与之前的方法相比,这一结果有了显著的改进。与使用相同星系数据的传统技术相比,该方法对描述宇宙物质团块性的参数的不确定性减少了一半。这种人工智能方法也与基于对其他现象(如宇宙最古老的光)的观察而得出的宇宙学参数估计值非常吻合。
研究人员在最近的一系列论文中介绍了他们的方法——基于模拟的星系推断(或SimBIG),其中包括8月21日在《自然天文学》上发表的一项新研究。
这项研究的共同作者、纽约市Flatiron研究所计算天体物理中心(CCA)的团队负责人ShirleyHo表示,在使用相同数据的情况下对参数进行更严格的约束对于研究从暗物质的成分到驱使宇宙分裂的暗能量的性质等所有事物都至关重要。她说,随着未来几年对宇宙的新调查陆续展开,这一点尤其重要。
“每项调查都耗资数亿至数十亿美元,”何说。“这些调查存在的主要原因是我们希望更好地理解这些宇宙学参数。所以如果你从非常实际的角度考虑,这些参数每个都价值数千万美元。你希望得到最好的分析,以便从这些调查中提取尽可能多的知识,并突破我们对宇宙理解的界限。”
这六个宇宙学参数描述了宇宙中普通物质、暗物质和暗能量的数量以及大爆炸之后的条件,例如新生宇宙在冷却时的不透明度以及宇宙中的物质是分散的还是大块的。这项研究的合著者、CCA研究分析师LiamParker说,这些参数“本质上是宇宙的&luo;设置&ruo;,决定了它在最大尺度上如何运作。”
宇宙学家计算这些参数的最重要方法之一是研究宇宙星系的聚集情况。此前,这些分析仅着眼于星系的大尺度分布。
普林斯顿大学副研究员、这项研究的主要作者ChangHoonHahn表示:“我们无法深入到小规模。几年来,我们已经知道那里有更多的信息;只是我们没有很好的方法来提取它。”
哈恩提出了一种利用人工智能提取小规模信息的方法。他的计划分为两个阶段。首先,他和他的同事将训练一个人工智能模型,根据模拟宇宙的外观确定宇宙学参数的值。然后,他们将向他们的模型展示实际的星系分布观测结果。
哈恩、何、帕克和他们的同事通过展示CCA开发的Quijote模拟套件中的2,000个盒状宇宙来训练他们的模型,每个宇宙都使用不同的宇宙学参数值创建。研究人员甚至让这2,000个宇宙看起来像星系调查生成的数据(包括来自大气层和望远镜本身的缺陷),以便让模型进行逼真的练习。
“这是大量的模拟,但数量是可以控制的,”哈恩说。“如果你没有机器学习,你将需要数十万次模拟。”
通过吸收模拟数据,该模型随着时间的推移了解到宇宙参数的值如何与星系聚集的小规模差异相关联,例如单个星系对之间的距离。SimBIG还学会了如何通过一次观察三个或更多星系并分析它们之间形成的形状(如长而拉长的三角形或蹲伏的等边三角形)从宇宙星系的更大图景中提取信息。
在对模型进行训练后,研究人员向其提供了重子振荡光谱调查测量的109,636个真实星系。正如他们所希望的那样,该模型利用数据中的小尺度和大尺度细节来提高其宇宙学参数估计的精度。这些估计非常精确,相当于使用大约四倍星系的传统分析。
何说,这很重要,因为宇宙中星系的数量是有限的。通过用更少的数据获得更高的精度,SimBIG可以突破可能性的极限。
哈恩表示,这种精度的一个令人兴奋的应用就是宇宙危机,即所谓的“哈勃张力”。这种张力源于对哈勃常数的不匹配估计,哈勃常数描述了宇宙中所有物质的扩散速度。
计算哈勃常数需要使用“宇宙标尺”估算宇宙的大小。基于遥远星系中爆炸恒星(称为超新星)的距离进行的估算比基于宇宙最古老光的波动间隔进行的估算高出约10%。
未来几年将开展的新调查将捕捉到更多宇宙历史。哈恩说,将这些调查的数据与SimBIG配对将更好地揭示哈勃张力的程度,以及这种不匹配是否可以解决,或者是否需要修改宇宙模型。“如果我们非常精确地测量这些量,并且可以肯定地说存在张力,那么这可能会揭示有关暗能量和宇宙膨胀的新物理学,”他说。
哈恩、何和帕克与Flatiron研究所计算数学中心(CCM)的迈克尔·艾肯伯格、CCA的巴勃罗·勒莫斯、CCA和CCM的奇拉格·莫迪、CCM的布鲁诺·雷加尔多-圣布兰卡德、西蒙斯基金会主席戴维·斯佩格尔、佛罗里达大学的侯嘉敏、滑铁卢大学的埃琳娜·马萨拉以及日内瓦大学的阿扎德·莫拉迪内扎德·迪兹加一起参与了这项研究。