AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真
编辑:alan
【新智元导读】AI开启模拟宇宙!近日,来自马克斯·普朗克研究所等机构,利用宇宙学和红移依赖性对宇宙结构形成进行了场级仿真,LeCun也在第一时间转发和推荐。
下面的两组动图展示了计算机对于宇宙形成的模拟:
你能看出来哪一个结果出自AI之手吗?
这就是来自马克斯·普朗克研究所等机构发表的工作:利用宇宙学和红移依赖性对宇宙结构形成进行场级仿真。
AI终于开始模拟宇宙了!LeCun也在第一时间转发和推荐:
并且,物理学是这个神经网络设计的核心,它可以看成是PINN(内嵌物理知识神经网络)的一种实现,其损失函数建模了时间相关的粒子坐标和速度之间的特定关系。
模拟器将线性位移场映射到特定红移处对应的非线性位移。
模拟器是一个神经网络,包含对Ω和红移z处的线性增长因子D(z)的依赖性进行编码的样式参数。
最终,模拟器在测试数据(训练期间未见过的各种宇宙学和红移)上实现了良好的精度和性能,在z = 0,k ∼ 1 Mpc/h的尺度上达到了百分比级精度,并在较高红移下提高了性能。
通过合并树将预测的结构形成历史与N体模拟进行比较,可以找到一致的合并事件序列和统计特性。
同时又可以通过多GPU并行处理进行良好的扩展,支持任意大尺寸的实现。
模拟宇宙的AI
随着宇宙学数据分析推向更小的尺度,利用高阶统计数据,并实现场级分析和基于模拟的推理方案,为预测非线性宇宙结构形成提供了更准确的方法。——当然也对算力提出了超高要求。
而基于模拟的推理方法和场级分析,则需要生成许多后期密度场的准确实现,以约束模型参数和初始条件重建。
为了探明宇宙学参数和初始条件的最佳约束,需要对巡天观测值进行快速、高度准确的预测。
由于本模型的时间依赖性和自可微性,研究者可以有效地获得N体粒子速度作为输出粒子位移的时间导数。
可以在训练期间动态评估这些速度,由此定义一个取决于粒子位置和速度的损失函数,在六维N体相空间上进行训练。
强制执行「速度必须等于位移时间导数」的物理约束,可以提高训练效率并提高模型的准确性,特别是对于速度场。
模型结构
作者通过周期模拟框中的坐标x来描述N体粒子。每个粒子都与规则立方晶格上的一个位点q相关联,因此它在红移z处的位置定义为:
随着引力簇的非线性在后期变得重要,这种线性近似变得不准确,而模拟宇宙结构形成的非微扰方法(如N体模拟)变得必要:
研究人员设计了场级模拟器,根据目标红移处的ZA位移场来预测z = 3-0范围内任何红移处的非线性粒子位移和速度。
场级模拟器采用U-Net/V-Net设计,使用PyTorch的map2map库实现和训练模型。
输入经过四个ResNet 3×3×3卷积,第一个卷积运算将3个输入通道转换为64个内部通道。
在四次卷积操作之后,结果的副本被存储以供网络的上采样端使用,然后使用2×2×2卷积核对结果进行下采样。
该架构的感受野对应于给定焦点单元两侧的48个网格点。预测单个粒子的位移时,以焦点粒子为中心的大小为97的区域需要通过网络,对应于拉格朗日体积189.45 Mpc/h。
不过,由于网络缺少填充区域中所有单元的信息,因此这些区域的粒子位移并不准确,需要从输出中移除。
网络有限的感受野也有一个优点:它在线性理论准确的大尺度上保留了ZA场。
为了扩展网络功能,允许网络学习N体映射作为Ω和红移的函数,作者对其进行了增强以包含样式参数 。
在执行任何卷积(包括下采样/上采样操作)之前,快照的Ω和D(z)值将传递并映射到与卷积核尺寸匹配的内部数组,然后使用这些参数调节网络权重。
模型训练
训练数据
研究人员从一组具有不同宇宙学参数和一组固定快照红移的模拟中随机采样快照,同时训练样式参数和网络参数,使用Quijote Latin超立方体模拟,在边长1 Gpc/h的空间中使用512个粒子运行。
所有这些模拟的拉格朗日空间分辨率均为1.95 Mpc/h,整个数据集包含2000个模拟,每个模拟都有一组独特的五个ΛCDM宇宙学参数Ω。
研究人员将2000个模拟分为三组:1874个用于训练,122个用于验证,4个用于测试。为了鼓励各向同性,这里使用数据增强,通过立方体的对称性随机变换输入和目标数据。
损失函数
模型训练使用的损失函数包含四个项。第一个是粒子位移的平均平方误差(MSE),比较粒子的模拟器位移预测和真实的N体位移:
研究人员通过构建模拟器输出和N体模拟真值的欧拉密度、和动量自功率谱和互功率谱来评估模拟器的准确性。
对于密度场,使用CIC插值方案将粒子分布到512网格并估计功率谱,下表列出了用于测试本文模拟器的五个模拟宇宙学参数:
下面测试在训练数据中的五个固定红移之间进行插值时的模型性能:
欧拉密度误差仅源于粒子位移的误差,当红移z = 0时,新的瞬态模型的随机性与原始模型的随机性相当,并且传递函数误差通常比原始模型有所改善。
在上图的最右列中,可以看到由于模拟器无法完美预测BAO幅度而导致的振荡误差。不过模拟器的这些错误特征低于1%,并且可能会随着更多的训练数据而得到改善。
红移相关模型的性能与z = 0时的真实空间密度统计数据相当,并且在较高红移时对于红移空间和真实空间统计数据的性能明显更好。
随着红移的减小,误差平滑且单调地增加。这表明模拟器可以在其训练数据中的少量固定红移快照之间有效地进行插值,而不会过度拟合,否则我们会在中间看到错误的振荡特征。
参考资料:
https://x.com/cosmo_shirley/status/1825749316134158627
更新于:1个月前