我是 SLURM 的新手。我正在寻找一种舒适的方法,以查看节点/节点列表中有多少内存可用于我的 srun 分配。
我已经玩过 sinfo 和 scontrol 和 sstat,但它们都没有在一个舒适的概述中为我提供我需要的信息。
我想写一个 shell 脚本,以便从 scontrol 获取所有作业的所有字段并总结它们。但必须有更简单的方法。如果有人有提示或想法,那就太好了!
我是 SLURM 的新手。我正在寻找一种舒适的方法,以查看节点/节点列表中有多少内存可用于我的 srun 分配。
我已经玩过 sinfo 和 scontrol 和 sstat,但它们都没有在一个舒适的概述中为我提供我需要的信息。
我想写一个 shell 脚本,以便从 scontrol 获取所有作业的所有字段并总结它们。但必须有更简单的方法。如果有人有提示或想法,那就太好了!
输出的第 7 列
sinfo -N -l
将告诉您每个计算节点中安装了多少内存。该命令
scontrol -o show nodes
将告诉您每个节点上已经使用了多少内存。寻找AllocMem
入口。(需要 Slurm 2.6.0 或更高版本)