Por que `sync + drop_caches` não está descartando caches?

Question

Kiwy

Asked: 2018-06-27 05:19:32 +0800 CST2018-06-27 05:19:32 +0800 CST 2018-06-27 05:19:32 +0800 CST

Resultado inconsistente do desempenho do tamanho do bloco de leitura/gravação, meu teste é preciso?

772

Estou tentando fazer alguns testes em termos de tamanho de bloco do sistema de arquivos para identificar algum gargalo potencial em um trabalho de grade devido a IO ruim. Percebo muito incremento de arquivo pequeno de 8096 B durante o trabalho enquanto o tamanho do bloco do FS é:

stat -fc %s /my/filesytem
1048576

O que está longe de ser o ideal. Para simular tal comportamento criei dois pequenos arquivos aleatórios de 1GB a 20GB com dde /dev/urandomcomo fonte, e tentei este código python:

#!/bin/python
bsize=8096
print('File random.20g1')
print(strftime("%Y-%m-%d_%H:%M:%S"))
f1= open('random.20g1','rb')
f2= open('random.20g1.dest','wb')

while True:
   b = f1.read(bsize)
   if b:
       f2.write(b)
   else:
       break
print(strftime("%Y-%m-%d_%H:%M:%S"))

E eu tentei o mesmo com bsize=1048576.

Primeiro observo uma pequena diferença de tempo de leitura/gravação de 4 segundos entre um tamanho de bloco de 8096 e 1048576 (4 segundos a menos para o tamanho de bloco grande).
Este primeiro resultado foi promissor mas depois de mais testes, como aumentar o tamanho do arquivo para 20GB ou fazer o mesmo com 10 arquivos de GB observo sempre a mesma diferença de 4/3 segundos em termos de desempenho e o ganho nunca escala qualquer que seja o Arquivo.

Estou fazendo algo errado no meu procedimento de teste ou parece bom para você?
Eu teria esperado alguma melhora no aumento do tamanho do arquivo, por exemplo.

1 respostas

Voted

Andrew Henle · Answer 1 · 2018-06-28T02:30:29+08:00

Este código

while True:
   b = f1.read(bsize)
   if b:
       f2.write(b)
   else:
       break

está fazendo leituras e gravações sequenciaisbsize - dado qualquer , ele lê os primeiros bsizebytes, grava-os no arquivo de destino, depois lê os segundos bsizebytes, anexa-os ao arquivo de destino, ...

Seu sistema operacional os armazenará no cache da página e poderá até fazer a leitura antecipada e o pré-buffer dos dados de entrada como @StephenKitt mencionado nos comentários. Assim, as chamadas de IO subjacentes para o disco real acabarão reunidas em pedaços muito maiores, provavelmente o 1 MB que você mencionou.

A pequena diferença que você vê no desempenho é quase certamente devido apenas porque, quando você usa um menor bsize, seu processo precisa fazer mais chamadas de sistema no kernel para realmente mover os dados.

Portanto, é quase certo que você não vê muita diferença quando altera bsizeseu código de teste, mas não é realmente possível dizer com certeza sem muito mais detalhes sobre seu sistema.

MAIS...

O que você está fazendo é efetivamente idêntico ao

dd if=random.20g1 of=random.20g1.dest bs=8192

Se você realmente usar dd, você pode fazer muito mais coisas para testar o IO do disco (basta olhar para a página man - você pode usar o IO direto para ignorar o cache da página, por exemplo), mas no final, o IO testando você pode fazer com ddé bastante limitado, pois será sequencial. ddmostrará a você o melhor desempenho de E/S, mas não pode simular muitas cargas de trabalho do mundo real que revelam as desvantagens do desempenho de E/S.

Você precisa determinar mais sobre o padrão de E/S que seu trabalho de grade realmente usa - está fazendo leituras/gravações sequenciais como em seu teste, ou está fazendo leituras e/ou gravações aleatórias onde procura no(s) arquivo(s) para um arquivo efetivamente aleatório local antes de fazer o IO? As operações de E/S aleatórias são muito mais exigentes em um sistema de arquivos e hardware de disco subjacente - especialmente discos giratórios. Sistemas que podem mover centenas de MB/s de fluxo de E/S sequencial podem ser reduzidos a literalmente um punhado de kilobytes por segundo por operações aleatórias de E/S de pequeno porte. Especialmente se você estiver usando discos SATA SLOW de 5.000 RPM.

Pode ficar muito ruim quando pessoas que não entendem de sistemas de arquivos e matrizes RAID configuram armazenamento. O tamanho de bloco do sistema de arquivos de 1 MB que você mencionou com certeza parece que você pode estar lidando com uma configuração do sistema de armazenamento sob um paradigma equivocado de "maior é sempre mais rápido".

Misturar um paradigma "maior é sempre mais rápido" com coisas como matrizes RAID5/6 e IO de bloco pequeno aleatório (como o que seu trabalho de grade parece estar fazendo) pode ser uma receita para um desempenho de IO totalmente horrível.

Você pode usar straceno Linux para obter as chamadas de sistema reais que seus trabalhos fazem. Procure por chamadas como lseek, write, reade pwritee pread. Isso lhe dirá o padrão de IO real que seu(s) trabalho(s) faz.

Depois de obter seu padrão de E/S, você pode testar e comparar o desempenho de armazenamento real sob esse padrão com uma ferramenta que chega perto de duplicar esse padrão. Você provavelmente precisa de uma ferramenta que escreva ou leia de/para locais aleatórios. Novamente, assumindo o Linux, você pode começar com ofio . Você provavelmente precisará usar as opções de leitura/gravação aleatórias.

Resultado inconsistente do desempenho do tamanho do bloco de leitura/gravação, meu teste é preciso?

Como exportar uma chave privada GPG e uma chave pública para um arquivo

ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

Como descarregar o módulo do kernel 'nvidia-drm'?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Resultado inconsistente do desempenho do tamanho do bloco de leitura/gravação, meu teste é preciso?

1 respostas

relate perguntas