来源:sciencecodex 编辑:张佳
【新智元导读】CMU 和 UC Berkeley 等机构的研究人员推出了全球首个 AI 宇宙三维模拟器,可在几毫秒内完成模拟,而且更加准确。更让人震惊的是在调整参数后,无需调参训练仍能准确模拟宇宙!“就像使用猫狗图片训练识别软件,最终能识别大象”一样让人震惊。
最近,一组来自 CMU 和 UC Berkeley 等研究机构的研究人员率先推出了全球首个 AI 宇宙三维模拟器。这个模拟器不仅速度快而且精度高,调参后无需训练仍能准确模拟,甚至连它的创造者都不知道它是如何做到的。
宇宙中暗物质的数量都能计算
几十年来,科学家们一直使用计算机模拟来尝试并用数字技术对我们宇宙的起源和演化进行逆向工程。使用现代技术的最佳的传统方法需要几分钟时间来产生良好的结果。现在,这个全球首个 AI 宇宙模拟器在几毫秒内,就能产生更高精度的结果。
论文中提到:“在这里,我们建立了一个深层的神经网络来预测宇宙的结构形成。它优于传统的快速分析近似法,并且可以在训练数据之外精确地进行外推。”
也就是说,它不仅做了开发人员建造它做的事情——模拟不同引力条件下宇宙的演化——它还为它没有训练过的变量产生了精确的结果。例如,它报告的一个让科学家们惊讶的特殊参数是,宇宙中暗物质的数量。
研究小组没有根据暗物质含量不同的数据来训练这个名为“深密度位移模型”(D3M)的系统,然而 AI(根据研究,精确地)根据它所训练的数据的推论改变了这些值。
正如论文的合著者 Shirley Ho 所言:“这就像用大量的猫狗图片教图像识别软件一样,但随后软件能够识别大象。没有人知道它是如何做到的,这是一个很费解的谜。”
8000 种不同模拟训练模型
像D3M那样的计算机模拟已成为理论天体物理学的必要条件。科学家们想知道宇宙在不同的情况下是如何演化的,例如,比如暗能量将宇宙拉离的时间是不同的。这些研究需要进行数千次模拟,做一个闪电般快速且高度精确的计算机模型成为现代天体物理学的主要目标之一。
D3M模拟引力如何塑造宇宙。研究人员选择仅关注引力,因为它是迄今为止宇宙大规模演化中最重要的力量。
最精确的宇宙模拟计算了引力如何在宇宙的整个生命中移动数十亿个单个粒子。这种精度需要时间,一次模拟需要大约 300 个计算小时。更快的方法可以在两分钟内完成相同的模拟,但代价就是精度会降低。
研究人员通过从可用的最高精度模型中提供了8,000 种不同的模拟,来训练D3M使用的深度神经网络。神经网络获取训练数据并对数据进行计算; 然后研究人员将结果与预期结果进行比较。通过进一步训练,神经网络会随着时间的推移而适应,从而产生更快、更准确的结果。
在训练D3M之后,研究人员对 6 亿光年的箱形宇宙进行了模拟,并将结果与慢速和快速模型的结果进行了比较。慢速但准确的方法每次模拟需要数百小时的计算时间,而现有的快速方法需要几分钟,但D3M可以在 30 毫秒内完成模拟。
D3M也能产生准确的结果。与高精度模型相比,D3M的相对误差为 2.8%。使用相同的比较,现有的快速模型的相对误差为 9.3%。
研究人员表示,D3M在处理训练数据中未发现的参数变化方面具有非凡的能力,这使得它成为一个特别有用和灵活的工具。除了模拟其他力,如流体动力学,研究团队希望了解更多关于模型是如何运作的。
图1:由D3M产生的位移矢量场(左)和由此产生的密度场(右)。
图2:各列通过各种模型显示了完整粒子分布(上)和位移矢量(下)的 2D 切片:FastPM,目标 ground truth,基于 PM 解算器(A)的近似N体模拟方案;ZA,沿初始速度矢量(B)演化粒子的简单线性模型;2LPT,常用的分析近似(C)和本文的深度学习模型D3M(D)。虽然 FastPM(A)是研究团队的 ground truth,B-D 包括点或向量的颜色。颜色表示目标位置(A)或位移矢量与各种方法(B-D)预测分布之间的相对差异(qmodel−qtarget)/qtarget。误差条表明,密度较大的区域所有方法都有较大的误差,这表明对于所有模型(D3M,2LPT 和 ZA),很难正确预测高度非线性区域。他们的D3M模型在上述B-D 模型中预测和 ground truth 之间的差异最小。
图3:FastPM(橙色),2LPT(蓝色)和c(绿色)(顶部)的位移和密度功率谱; 传递函数 – 即预测的功率谱与 ground truth(中部)之比的平方根; 以及1–r 2,其中r是预测场与真场(底部)之间的相关系数。结果是1,000 个测试模拟的平均值。从大到中,D3M预测的传递函数和相关系数接近完美,明显优于基准 2LPT。(B)对于几个三角形配置,两个 3PCF 的多极系数(ζ1(r1,r2))(与目标)的比率。结果在 10 次测试模拟中取平均值。误差条(填充区域)是从 10 次测试模拟得出的 SD。该比率表明D3M的 3PCF 比他们的目标 FastPM 更接近 2LPT,方差更小。
图4:上图显示当他们改变宇宙参数As和Ωm时,粒子分布和位移场的差异。(A)误差条显示As = A0与As = 0.2 A0(中心)和As = 1.8A0(右)之间的两个极值之间的粒子分布(上)和位移场(下)之间的差异。(B)类似的比较,显示Ωm∈{0.1,0.5}的较小和较大值的粒子分布(上)和位移场(下)的差异,用于训练的Ωm= 0.3089。虽然较小的As(Ωm)值的差异较大,但较大的As(Ωm)的位移更加非线性。这种非线性是由质量集中引起的,并使预测更加困难。
图5:与图 3A 类似,除了在不改变训练集(具有不同的宇宙参数)或训练模型的情况下,改变宇宙参数时,测试两点统计量。当在不同的As(A)和Ωm(B)上测试时,显示了来自D3M和 2LPT 的预测。他们展示了传递函数 – 即预测功率谱与 ground truth(上)之比的平方根 – 和1-r 2,其中r是预测场与真实场(下)之间的相关系数。除了最大尺度,D3M预测在所有尺度上都优于 2LPT 预测,因为扰动理论在线性区域(大尺度)中工作良好。
AI 将帮助人类更好的认识宇宙
除了进一步展示黑匣子 AI 和深度学习的反复无常和不可预测的本质外,AI 宇宙模拟器本身还有潜力帮助天体物理学家和研究人员填补我们宇宙背后的一些空白。
我们的宇宙是一个奇怪的,几乎是未知的地方。人类刚刚开始将我们的视线投向可观测空间之外,以确定宇宙之外是什么,以及它是如何形成现在的样子的。人工智能可以帮助我们准确地理解影响我们宇宙进化的数十亿个变量是如何作用于恒星、行星甚至生命本身的出现的。
该研究的源代码:
https://github.com/siyucosmo/ML-Recon
产生训练数据的代码:
https://github.com/rainwoodman/fastpm
论文地址:
https://www.pnas.org/content/pnas/early/2019/06/21/1821458116.full.pdf
参考链接
来自:
新智元(ID:AI_era)