您的位置:
首页
>
中文期刊论文
>
详情页
基于鲲鹏处理器的LU并行分解优化算法
- 作 者:
-
徐鹤;
周涛;
李鹏;
秦芳芳;
季一木;
- 作者机构:
-
南京邮电大学理学院;
南京邮电大学计算机学院、软件学院、网络空间安全学院;
- 关键词:
-
ScaLAPACK;
LU分解;
并行计算;
MKL;
- 期刊名称:
- 计算机科学
- i s s n:
- 1002-137X
- 年卷期:
-
2024 年
51 卷
009 期
- 页 码:
- 51-58
- 摘 要:
-
ScaLAPACK(Scalable Linear Algebra PACKage)是并行计算软件包,适用于分布式存储的MIMD(Multiple Instruction, Multiple Data)并行计算机,被广泛应用于基于线性代数运算的并行应用程序开发。然而在进行LU分解过程中,ScaLAPACK库中的例程并不是通信最优的,没有充分利用当前的并行架构。针对上述问题,提出一种基于鲲鹏处理器的LU并行分解优化算法(Parallel LU Factorization, PLF),实现了负载均衡,适配国产鲲鹏环境。PLF对不同进程的不同分区的数据进行差异化处理,并将每个进程所拥有的部分数据分配给根进程进行计算,之后再由根进程散播回各个子进程,这有利于充分利用CPU资源,实现负载均衡。在单节点Intel 9320R处理器以及鲲鹏(Kunpeng) 920处理器环境中进行测试,其中,Intel平台下使用Intel MKL(Math Kernel Library),Kunpeng平台下使用PLF算法。对比两个平台关于不同规模的方程组求解的性能发现,Kunpeng平台的求解性能有显著优势。在NUMA数进程和单线程的情况下,优化后的计算效率在小规模平均达到4.35%,相比Intel的1.38%提升了215%;中规模平均达到4.24%,相比Intel平台的1.86%提升了118%;大规模平均达到4.24%,相比Intel的1.99%提升了113%。
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...