中国研究人员开发出一种高性能算法,显著提升了NVIDIA消费级GPU在科学计算中的性能,最高提升幅度达到800倍。
该算法由深圳北理莫斯科大学团队研发,该算法提高了近场动力学(Peridynamics)的计算效率。近场动力学是一种先进的非局部理论,用于解决材料断裂、损坏等复杂物理问题,广泛应用于航空、工程和军事等领域。近场动力学的计算复杂度较高,传统模拟方法效率有限。
深圳北理莫斯科大学团队利用NVIDIA CUDA编程技术,开发了新的PD-General框架,优化了算法设计和内存管理,充分发挥了GPU的大规模并行计算能力。在一块普通的RTX 4070显卡上,新算法比传统串行算法速度提升了800倍,比新的OpenMP并行算法快了100倍。
在涉及上百万粒子的大规模模拟中,新算法完成4000步迭代仅需不到5分钟,在大规模2D单轴拉伸问题中,新算法仅用不到2分钟就完成了695万次单精度迭代。
新算法的应用前景广泛,包括:
1,航空与国防领域:改进航空器结构材料的应力与失效模型。
2,工程与制造领域:提高建筑与工业材料测试的效率。
3,军事研究:加速防御性材料的抗冲击研究。
最重要的是该算法无需高性能GPU芯片,不受美国制裁限制,普通消费级家用GPU即可运行。