新闻动态

学术成果 | 面向国产神威超级计算机的自适应分子间反应经验键序势场的算法设计和性能优化研究

2024-02-28 15:44

导读

分子动力学(MD)模拟是在原子水平上理解现实世界过程的最重要的计算机模拟方法之一。分子动力学模拟遵循牛顿运动定律并计算随时间变化的空间运动过程,能够提供完整的动态信息和确定的轨迹。由于其可靠性,分子动力学模拟已被证明是研究物质和材料的有力方法之一。基于键序思想的反应势场能够以接近量子力学(QM)的精度动态地模拟化学键的断裂和形成,而避免了昂贵的量子力学计算,因而经常被视为量子力学模拟的可行替代方案。在刚刚过去的2023年,由国家超级计算无锡中心、清华大学等单位联合撰写的论文“Redesign and Accelerate the AIREBO Bond-Order Potential on the New Sunway Supercomputer”在IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS期刊(CCF推荐A类)发表。


成果简介

碳烃存在于多种化合物中,包括石墨、碳纳米管和甲烷等。由于竞争杂化的复杂性和π电子的远程效应,碳烃体系一直是反应分子动力学领域的重要研究热点。本文重点研究了自适应分子间反应经验键序势(AIREBO)在神威超级计算机上模拟碳烃系统的算法设计与性能优化工作。为了进一步提升可扩展性,本文提出了一种用于定制数据设计的并行两级构建方案和周期缓冲策略,,以探索数据的局部性和数据重用。本文还设计了两种优化的最近邻访问算法:累加系数重分配算法和双端搜索连通性算法。最后,本文还利用AoS数据布局和软硬件协同Cache实现了并行的受力计算。此外,本文还设计了一种低开销的基于原子操作的负载均衡方法和向量化实现。AIREBO势场的整体性能加速比可达20倍,并在单个节点上完成了实际时间小于20.5小时的结果验证,成功地运行2,000,000步(即1纳秒的模拟时间长度)。实验结果表明,在798,720个计算核心上模拟2,139,095,040个原子,弱扩展性的并行效率达到88%-92%。



图1  弱扩展性




图2  强扩展性




图3运行2000000个时间步(即1纳秒)的模拟结果。


团队简介

本文的主要贡献作者为来自高性能计算研究中心生物材料部门的成员。生物材料部主要负责高性能计算在生命科学和材料化学领域的算法设计、性能优化和应用研究工作,目前已发表多篇高水平论文。本工作得到了国家自然科学基金、中国博士后科学基金、国家重点研发计划和教育部数字媒体技术工程研究中心的资助和支持。


IEEE TPDS 期刊简介

《IEEE Transactions on Parallel and Distributed Systems(TPDS)》是中国计算机学会(CCF)推荐A类国际学术期刊,主要关注并行和分布式系统研究领域的重要科学进展。该期刊覆盖了并行和分布式算法,并行和分布式计算的应用,并行和分布式架构以及并行和分布式软件等方面的最新研究成果,是高性能计算领域中最具影响力的刊物之一。