Klun提出的问题 -server

Klun

Asked: 2024-06-11 16:40:42 +0800 CST

vSphere: comando linux dd no SSD local vm aciona alerta crítico de latência do disco vm

Tenho um servidor Dell executando VMware ESX, com unidades SSD locais de 12 TB, memória de 1 TB, processador Xeon Gold e uma única VM debian.

Nessa VM, quando faço gravações simultâneas no disco, ou apenas executo o seguinte comando:

dd if=/dev/urandom of=/local/ssd/drive/path/largefile bs=1M count=1024

Tenho um alerta crítico de latência de disco no VSphere para essa VM.

O comando dd foi concluído com sucesso após 10 minutos.

Por que o vSphere aciona um alerta crítico que não é crítico?

Como é possível sobrecarregar unidades SSD de última geração com um único comando dd?

EDITAR:

O alerta crítico é acionado se a latência exceder 75 ms em um período de cinco minutos.
Na prática, a latência do disco parece estar em torno de 200-250 ms para essa VM:

EDITAR 2:

Provisionamento: grosso preguiçoso zerado (não ansioso, infelizmente)

EDITAR 3:

Tentei definir um limite de IOPS nesse disco, no nível da VM (como você pode ver no gráfico abaixo).

Eu tentei 1000 IOPS, depois 800, 600, 400, 200, 100. O alerta de latência crítica do disco é acionado mesmo com 100 IOPS.

O que é estranho (como você pode ver no gráfico) é que diminuir o limite (1000 IOPS para 100 IOPS) tende a aumentar a latência do disco relatada pelo vSphere. Com limite de 100 IOPS, a latência é de 16.000 ms.

EDITAR 4:

No lado do software, tento reduzir o máximo de gravações simultâneas de arquivos de 24 para 4. A latência vai de 200ms para 100ms, mas a largura de banda de gravação vai de 100MB/seg para 50MB/seg.

EDITAR 5:

A mudança do provisionamento de zeros preguiçosos grossos para zeros ávidos grossos não mudou nada em relação à latência, sempre em 200ms

Klun

Asked: 2020-10-05 06:02:33 +0800 CST

IBM GPFS: muito lento para remover arquivos recursivamente

Para excluir arquivos recursivamente em nosso cluster IBM GPFS, usamos o comando unix simples como:

rm /my/directories -fr

No entanto, as exclusões são muito longas para serem feitas.

O problema é que nossos aplicativos distribuídos (baseados no Spark) demoraram muito one hourpara serem feitos. Mas também took about an other hourpara descartar arquivos temporários gerados por aplicativos distribuídos como o Spark.

Portanto, as cargas de trabalho globais são muito ineficientes. Pode ser porque o rmcomando tem que listar todos os subdiretórios ..

De qualquer forma, você conhece maneiras de eliminar com eficiência um diretório inteiro (e subdiretórios) com o GPFS?

A IBM pode dar um comando especial para fazer isso?

vSphere: comando linux dd no SSD local vm aciona alerta crítico de latência do disco vm

IBM GPFS: muito lento para remover arquivos recursivamente

Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

Ping uma porta específica

Verifique se a porta está aberta ou fechada em um servidor Linux?

Como automatizar o login SSH com senha?

Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

Qual porta o SFTP usa?

Linha de comando para listar usuários em um grupo do Windows Active Directory?

O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

Como determinar se uma variável bash está vazia?

Klun's questions