Tenho um programa que trava por razões desconhecidas em um cluster. Tenho a sensação de que pode ser algo que tem a ver com o uso de um nó(s) específico(s). Existe um comando para ver em quais nós do cluster um trabalho concluído está sendo executado (quero dizer, o ID do nó)? Gostaria de verificar se por acaso o trabalho é executado sempre nos mesmos nós.
O
sacct
comando pode ser usado para consultar o banco de dados de contabilidade:Com o
--format
, você pode especificar as colunas que deseja ver. O--start
permite olhar para trabalhos anteriores (por padrão,sacct
mostrará apenas trabalhos do dia atual)