Protegendo um novo servidor Ubuntu [fechado]

Question

Asked: 2022-03-29 16:01:27 +0800 CST2022-03-29 16:01:27 +0800 CST 2022-03-29 16:01:27 +0800 CST

O que os resultados do wrapper de tempo do Linux me dizem que aconteceu com este comando cp?

772

Minha opinião sobre esse problema é do lado do desenvolvedor. Eu escrevo o código que é colocado em uma máquina virtual RHEL rodando como uma das muitas em um sistema corporativo. O sistema de arquivos que está sendo usado é um dispositivo de armazenamento remoto conectado à rede.

Tivemos uma alta variabilidade em comandos simples durante o lote. Então montamos um teste para obter mais informações, mas agora não sei o que encontramos.

Executamos o seguinte comando a cada 30 minutos e registramos a saída. É uma cópia de um arquivo de 6 GB. O que vejo é um salto de tempo decorrido de 11 segundos para 190 segundos quando o sistema está ocupado executando muitos trabalhos e esse comando de teste obtém pouco tempo de CPU.

O que posso ver é que a coluna "I" (entradas do sistema de arquivos) é preenchida quando a CPU está baixa, mas não quando está alta. A coluna "w" (trocas involuntárias) também é muito mais alta.

Minha pergunta é: o que está acontecendo com este trabalho/comando que o força a executar MUITO MAIS tempo quando o tempo de CPU diminui? A troca de entrada/saída armazena todos esses dados em algum outro dispositivo muito mais lento? Geralmente, o que acontece durante uma troca de entrada/saída?

Comando sendo executado:

/usr/bin/time -a -o filename.txt cp file.txt fileCopy.txt

Encontro	Tempo	e	S	você	P	c	W	EU	O
14/03/2022	5:19:02	64,9	16.23	1,03	26%	3005	29210	12000016	12000000
14/03/2022	5:49:02	12,7	11,63	0,79	97%	2069	76	0	12000000
14/03/2022	6:19:02	100,39	14,74	0,78	15%	1034	29925	12000136	12000000
14/03/2022	6:49:24	191,32	18,86	0,94	10%	3374	36164	12001024	12000000
14/03/2022	7:19:02	71,61	15,61	0,88	23%	1610	30316	12000296	12000000
14/03/2022	7:49:02	70,73	17,5	0,91	26%	1408	29540	12000072	12000000
14/03/2022	8:19:02	10,95	9,89	0,7	96%	1709	75	0	12000000
14/03/2022	8:49:02	11.01	10.22	0,73	99%	239	85	0	12000000

As descrições das colunas da página man para /usr/bin/time

e   Elapsed real time (in seconds).
S   Total number of CPU-seconds that the process spent in kernel mode.
U   Total number of CPU-seconds that the process spent in user mode.
P   Percentage of the CPU that this job got, computed as (%U + %S) / %E.
c   Number of times the process was context-switched involuntarily (because the time slice expired).
w   Number of waits: times that the program was context-switched voluntarily, for instance while waiting for an I/O operation to complete.
I   Number of filesystem inputs by the process.
O   Number of filesystem outputs by the process.

1 respostas

Voted

John Mahowald · Answer 1 · 2022-03-29T18:43:34+08:00

P neste contexto significa a proporção do tempo de CPU que este trabalho obteve sobre o tempo total decorrido. Quase 100% significa quase todo o tempo em que estava na CPU e, portanto, a CPU foi restrita para essas execuções. Em contraste com as outras corridas onde outra coisa era o fator limitante. Mais tempo do sistema (também conhecido como kernel) do que tempo do sistema, como é típico de tarefas pesadas de E/S.

Considerando que a carga de trabalho foi copiar um arquivo de 6 GB, podemos inferir que as execuções de 11 segundos tiveram uma média de mais de 0,5 GB de gravações por segundo. A coluna O confirma o mesmo número de gravações a cada vez, consistente com um processo simples de copiar um arquivo.

A coluna de entrada tem grandes oscilações, no entanto. Execuções lentas têm leituras aproximadamente iguais às gravações. Mas as corridas rápidas não fazem nenhuma leitura! Presumo que o arquivo ainda esteja armazenado em cache na RAM desde a última leitura. A DRAM é muito mais rápida que o armazenamento de estado sólido. O que é um grande aumento de velocidade, até que, sob pressão de memória, o sistema operacional derrube os dados em cache e precise ler novamente no armazenamento lento.

Portanto, esta é uma tarefa de 200 segundos, que ocasionalmente pode levar 12 segundos. Provavelmente devido ao cache de página do Linux.

Encontrar a causa raiz de um problema de desempenho geralmente requer uma compreensão mais profunda do sistema geral, além de qualquer conjunto específico de métricas.

O sistema de arquivos que está sendo usado é um dispositivo de armazenamento remoto conectado à rede.

Observe que sua cópia está no armazenamento em rede, portanto, também pode ser qualquer coisa no sistema remoto ou na rede intermediária. Desempenho de armazenamento remoto. Velocidades e utilização da rede (provavelmente IP). Ou pode ser local para essa VM, onde o convidado está competindo por recursos com todo o resto em execução em sua infraestrutura.

Sempre é possível ir mais fundo em como as coisas funcionam. O armazenamento de rede (NFS?) é importante ou você também vê isso para o disco local? 0,7 segundos de tempo de CPU do usuário é um pouco de trabalho, na verdade, quanto é a contabilidade para gerenciar muitas chamadas do sistema? O que a CPU ocupada realmente significa quando a maior parte disso está esperando por memória lenta e armazenamento muito lento? Não são perguntas fáceis de responder, mas talvez não seja necessário cavar muito fundo quando a coisa estiver funcionando adequadamente.

O que os resultados do wrapper de tempo do Linux me dizem que aconteceu com este comando cp?

Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

Ping uma porta específica

Verifique se a porta está aberta ou fechada em um servidor Linux?

Como automatizar o login SSH com senha?

Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

Qual porta o SFTP usa?

Linha de comando para listar usuários em um grupo do Windows Active Directory?

O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

Como determinar se uma variável bash está vazia?

O que os resultados do wrapper de tempo do Linux me dizem que aconteceu com este comando cp?

1 respostas

relate perguntas