Protegendo um novo servidor Ubuntu [fechado]

Question

Mathias Müller

Asked: 2020-03-11 23:45:09 +0800 CST2020-03-11 23:45:09 +0800 CST 2020-03-11 23:45:09 +0800 CST

Consultar a memória GPU de pico usada pelo trabalho concluído

772

Tenho um trabalho SLURM com o qual envio sbatch, como

sbatch --gres gpu:Tesla-V100:1 job.sh

job.shtreina um modelo em uma GPU V100. O código em si não registra o uso de memória da GPU.

Existe um comando SLURM para consultar o uso máximo de memória da GPU assim que o trabalho for concluído?

2 respostas

Voted

user2986553 · Answer 1 · 2020-03-12T02:59:44+08:00

user2986553

2020-03-12T02:59:44+08:002020-03-12T02:59:44+08:00

Não tenho certeza de que seria possível encontrar a carga causada pela execução do próprio trabalho de sbatch. Mas você pode tentar verificar a métrica de utilização geral do seu cartão. Pelo que entendi para a nvidia, existem ferramentas nvidia-smi . Encontrei outras ferramentas mencionadas nesta pergunta .

Então, sugiro instalar o nvidia-smi e executá-lo em uma janela de terminal separada com um comando como:

watch nvidia-smi

E então execute seu trabalho. Você deve carregar as alterações no seu cartão em tempo real.

Mais uma possibilidade - rastreie seu trabalho com outros criadores de perfil . Infelizmente não tenho placa nvidia e não posso verificar nenhuma dessas ferramentas, mas suponho que isso o ajudará em sua investigação.

1

Mathias Müller · Answer 2 · 2020-03-12T12:10:53+08:00

Best Answer

Mathias Müller

2020-03-12T12:10:53+08:002020-03-12T12:10:53+08:00

Depois de conversar com o pessoal da nossa equipe de HPC: parece que

O SLURM não registra o uso de memória da GPU de trabalhos em execução enviados com sbatch.

Portanto, essas informações não podem ser recuperadas com nenhum comando SLURM. Por exemplo, um comando como

ssacct -j [job id]

mostra o uso geral de memória, mas não o uso de memória da GPU.

1

Consultar a memória GPU de pico usada pelo trabalho concluído

Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

Ping uma porta específica

Verifique se a porta está aberta ou fechada em um servidor Linux?

Como automatizar o login SSH com senha?

Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

Qual porta o SFTP usa?

Linha de comando para listar usuários em um grupo do Windows Active Directory?

O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

Como determinar se uma variável bash está vazia?

Consultar a memória GPU de pico usada pelo trabalho concluído

2 respostas

relate perguntas