AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 1018971
Accepted
Woodgnome
Woodgnome
Asked: 2020-05-28 14:07:42 +0800 CST2020-05-28 14:07:42 +0800 CST 2020-05-28 14:07:42 +0800 CST

Como explicar esses resultados de largura de banda de fio?

  • 772

Estou executando alguns fiotestes em um novo servidor com a seguinte configuração:

  • 1 unidade Samsung PM981a de 512 GB M.2 NVMe.
    • Proxmox instalado com ZFS na raiz.
    • 1x VM com 30 GB de espaço criado e Debian 10 instalado.
  • 6x unidades Intel P4510 2TB U.2 NVMe conectadas a 6x pistas PCIe 4.0 x4 dedicadas com OCuLink.
    • Anexado diretamente à VM única.
    • Configurado como RAID10 na VM (3x espelhos distribuídos).
  • Placa-mãe / CPU / memória: ASUS KRPA-U16 / EPYC 7302P / 8x32GB DDR4-3200

Os discos são classificados para leituras sequenciais de até 3.200 MB/s . Do ponto de vista teórico, isso deve fornecer uma largura de banda máxima de 19,2 GB/s.

Executando fiocom numjobs=1o ZFS RAID estou obtendo resultados na faixa de ~2.000 - 3.000 MB/s (os discos são capazes de 3.200 MB/s completos ao testar sem ZFS ou qualquer outra sobrecarga, por exemplo, durante a execução do Crystal Disk Mark no Windows instalado diretamente em um dos discos):

fio --name=Test --size=100G --bs=1M --iodepth=8 --numjobs=1 --rw=read --filename=fio.test
=>
Run status group 0 (all jobs):
   READ: bw=2939MiB/s (3082MB/s), 2939MiB/s-2939MiB/s (3082MB/s-3082MB/s), io=100GiB (107GB), run=34840-34840msec

Parece razoável tudo considerado. Também pode ser limitado à CPU, pois um dos núcleos estará com 100% de carga (com parte disso gasta em processos ZFS).

Quando eu aumento numjobspara 8-10 as coisas ficam um pouco estranhas:

fio --name=Test --size=100G --bs=1M --iodepth=8 --numjobs=10 --rw=read --filename=fio.test
=>
Run status group 0 (all jobs):
   READ: bw=35.5GiB/s (38.1GB/s), 3631MiB/s-3631MiB/s (3808MB/s-3808MB/s), io=1000GiB (1074GB), run=28198-28199msec

38,1 GB/s - bem acima da largura de banda máxima teórica.

Qual é exatamente a explicação aqui?

Adições para comentários:

Configuração da VM:

insira a descrição da imagem aqui

iotopdurante o teste:

insira a descrição da imagem aqui

zfs storage nvme
  • 2 2 respostas
  • 875 Views

2 respostas

  • Voted
  1. Best Answer
    shodanshok
    2020-05-29T00:49:23+08:002020-05-29T00:49:23+08:00

    O primeiro fio(aquele com --numjobs=1) executa sequencialmente qualquer operação de leitura, não tendo nenhum benefício de sua configuração de distribuição além de leitura antecipada/pré-busca rápida: iodepthaplica-se apenas a leituras assíncronas feitas via libaiomecanismo, que por sua vez requer suporte verdadeiro para O_DIRECT(o que falta ao ZFS) . Você pode tentar aumentar a janela de pré-busca dos 8M padrão para algo como 64M ( echo ‭67108864‬ > /sys/module/zfs/parameters/zfetch_max_distance). É claro que sua milhagem pode variar, portanto, certifique-se de verificar se isso não prejudica outras cargas de trabalho.

    O segundo fio(aquele com --numjobs=8) provavelmente é distorcido pelo cache ARC. Para ter certeza, basta abrir outro terminal em execução dstat -d -f: você verá a verdadeira velocidade de transferência de cada disco e certamente estará alinhada com sua taxa de transferência máxima teórica. Você também pode repetir o fioteste com uma máquina recém-iniciada (portanto, com um ARC vazio) para ver se as coisas mudam.

    • 3
  2. Horshack
    2022-05-16T15:38:05+08:002022-05-16T15:38:05+08:00

    Para testes de E/S sequenciais com vários trabalhos, cada trabalho (ou seja, thread) tem um ponteiro de arquivo específico de thread (endereço de bloco para dispositivos brutos) que começa em zero por padrão e avança independentemente dos outros threads. Isso significa que o fio emitirá solicitações de leitura para o sistema de arquivos com ponteiros de arquivo/endereços de bloco duplicados/sobrepostos nos trabalhos. Você pode ver isso em ação se usar a write_iologopção. As solicitações sobrepostas distorcerão o resultado do benchmark, pois provavelmente serão atendidas por um cache de leitura, seja no sistema de arquivos (ao testar um arquivo) ou pelo dispositivo (ao executar em um volume bruto).

    O que você deseja é um único trabalho e depois modificar o iodepthparâmetro exclusivamente para controlar a profundidade da fila de E/S. Isso especifica o número de E/Ss simultâneas que cada trabalho pode ter ativo.

    A única desvantagem é que os IOPs totais alcançáveis ​​podem se tornar limitados a um único núcleo/thread. Isso não deve ser um problema para cargas de trabalho sequenciais de grandes blocos, pois elas não são vinculadas a IOPs. Para E/S aleatória, você definitivamente deseja usar vários trabalhos, especialmente em unidades NVMe que podem lidar com mais de um milhão de IOPs.

    • 2

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve