物理学院孙建教授等人发布高精度消息传递机器学习力场HotPP

近日,南京大学物理学院孙建教授、王慧田教授、邢定钰院士等人,发布了他们自主开发的机器学习力场:高阶张量消息传递原子间势函数(HotPP),这是一种E(n)等变的消息传递神经网络,能够将节点嵌入和消息中的笛卡尔张量扩展到任意阶。对多个数据集的测试显示,HotPP力场不仅在预测目标性质如能量和力等方面表现优异,精度比肩世界最高水平,还提供了与ASE和Lammps等常用软件的接口,可以用于计算声子谱、红外谱和拉曼谱等,展示了其在未来科学研究中的巨大潜力。

机器学习势函数(MLP)结合了基于量子力学的第一性原理计算和经验力场的优点,旨在准确描述凝聚态体系的势能面。经过合理训练的机器学习力场不仅能达到接近甚至超越第一性原理计算的精度,还能执行大规模、长时间的分子模拟,在研究复杂动力学问题等方面有重要应用前景。其中,等变的消息传递网络架构由于其极高的精度,是近年来研究的热点。例如基于高阶球谐张量的NequIP、BotNet和MACE等,达到了Sota的精度,但其复杂的耦合操作成为了效率的瓶颈。基于笛卡尔坐标的方法如PaiNN、TensorNet等虽然具有较高的效率,然而它们可使用的阶数仍然局限于1或2,任意阶笛卡尔张量消息传递模型尚未被提出。

由于等变操作的复合仍然是等变的,因此可以通过将一系列基础的等变操作的耦合,搭建出复杂的神经网络。注意到张量间的缩并正是一个可以将不同阶张量耦合的操作,为此孙建课题组使用节点上的已有的高阶张量与边所对应的原子间相对位移的直积构成的高阶张量进行缩并,成功将消息传递中允许的张量阶数提升到了任意维。

图1:HotPP的网络结构示意图。

他们在一系列数据集中测试了该神经网络的精度。首先是碳的数据集,该数据集包含了一系列复杂结构的丰富原子环境,包含第一性原理分子动力学模拟中提取的结构、使用GAP驱动的动力学模拟中迭代扩展的结构、以及晶体同素异形体(如金刚石和石墨)的随机畸变晶胞等。在该数据集中,他们使用150k参数取得了与NequIP接近的精度,并在参数数量扩展到600k时取得了比NequIP更高的精度。他们使用HotPP直接获得金刚石结构的力常数矩阵并计算了其声子谱,并与第一性原理计算的结果进行了比较,证明了HotPP能够很好地学习结构的振动行为。

表1:碳数据集中HotPP与常见机器学习力场精度比较。

其次,由于HotPP可以直接学习高阶张量,他们在水的数据集中学习了电偶极矩与电极化率,并使用动力学模拟计算了水的红外吸收谱与拉曼光谱。他们通过额外训练了一个机器学习力场来学习液态水的能量、力和应力,在常温常压(300K,1 bar)下进行了100 ps的经典分子动力学模拟,随后对它们的电偶极矩与电极化张量的自相关函数进行傅里叶变换来计算红外光谱和拉曼光谱,计算结果与实验测量数据一致。

另外,HotPP还可与孙建教授课题组自主开发的机器学习与图论辅助的晶体结构搜索软件MAGUS联用,提高结构搜索的效率。

图2:HotPP与其他力场计算的红外与拉曼光谱跟实验数据的比较。

相关研究成果以“E(n)-Equivariant cartesian tensor message passing interatomic potential”为题,于近日发表在Nature Communications上[Nat. Commun. 15, 7607 (2024) https://doi.org/10.1038/s41467-024-51886-6]。南京大学物理学院孙建教授课题组博士后王俊杰与普林斯顿大学化学系Roberto Car课题组博士后王勇(孙建教授课题组博士毕业)为该论文的共同第一作者,孙建教授为通讯作者,南京大学物理学院邢定钰院士和王慧田教授提供了重要指导,合作者还包括孙建教授课题组的学生张皓庭(2024年6月本科毕业)、杨子洋、梁智新、施九洋。该项研究得到了南京微结构科学与技术协同创新中心、固体微结构物理国家重点实验室和江苏省物理科学研究中心的支持,得到了国家自然科学基金委杰出青年基金、江苏省基础研究项目、江苏省卓越博士后计划、中央高校基本业务费、南京大学卓越研究计划、南京大学AIQ津贴项目等经费的资助。相关计算工作主要在南京微结构协同创新中心高性能计算中心和南京大学高性能计算中心的超级计算机上进行。

文章链接:

Junjie Wang, Yong Wang, Haoting Zhang, Ziyang Yang, Zhixin Liang, Jiuyang Shi, Hui-Tian Wang, Dingyu Xing & Jian Sun. E(n)-Equivariant cartesian tensor message passing interatomic potential. Nature Communications 15, 7607 (2024).

https://doi.org/10.1038/s41467-024-51886-6

HotPP程序网址:

https://gitlab.com/bigd4/hotpp