我在具有 16 核、32 线程 XEON 处理器和 OpenMPI 版本 4.1.1 的 CentOS 8(核心)系统上使用SIESTA dft 包进行所有计算。
因为我有 32 个线程,所以我使用其中的 28 个来进行 SIESTA 计算(这会消耗大量内存 ~60%)并保持剩余的 4 个空闲。
但是,如果我开始将 2 或 3 个剩余线程用于其他应用程序(内存使用量可以忽略不计),同时将 SIESTA 计算保持在 28 个线程,我发现 SIESTA 计算的速度降低了大约 50-60 %。
我检查了 CPU 利用率,发现在场景 2 中使用系统时,一个线程几乎保持空闲状态。
有没有办法诊断和解决这个问题?这是因为某些进程调度错误而发生的吗?可以使用某种流程绑定或作业调度包来改善这一点吗?