Tenho um trabalho SLURM com o qual envio sbatch
, como
sbatch --gres gpu:Tesla-V100:1 job.sh
job.sh
treina um modelo em uma GPU V100. O código em si não registra o uso de memória da GPU.
Existe um comando SLURM para consultar o uso máximo de memória da GPU assim que o trabalho for concluído?