AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 740311
Accepted
wazoox
wazoox
Asked: 2015-12-03 08:21:08 +0800 CST2015-12-03 08:21:08 +0800 CST 2015-12-03 08:21:08 +0800 CST

Desempenho de sincronização terrível do DRBD em 10GigE

  • 772

Configurei um par de servidores idênticos com matrizes RAID (8 núcleos, 16 GB de RAM, 12x2 TB RAID6), 3 interfaces 10GigE, para hospedar alguns serviços altamente disponíveis.

Atualmente, os sistemas estão executando o Debian 7.9 Wheezy oldstable (porque o corosync/pacemaker não está disponível no 8.x estável nem no teste).

  • O desempenho do disco local é de cerca de 900 MB/s de gravação, 1600 MB/s de leitura.
  • a taxa de transferência de rede entre as máquinas é superior a 700 MB/s.
  • por meio do iSCSI, cada máquina pode gravar no armazenamento da outra a mais de 700 MB/s.

No entanto, independentemente da maneira como configuro o DRBD, a taxa de transferência é limitada a 100 MB/s. Realmente parece algum limite codificado. Posso diminuir o desempenho de forma confiável ajustando as configurações, mas nunca ultrapassa 1 Gbit (122 MB/s são atingidos por alguns segundos de cada vez). Estou realmente puxando meu cabelo em um presente.

  • kernel vanilla simples 3.18.24 amd64
  • drbd 8.9.2~rc1-1~bpo70+1

A configuração é dividida em dois arquivos: global-common.conf:

global {
        usage-count no;
}

common {
        handlers {
        }

        startup {
        }

        disk {
                on-io-error             detach;
         #       no-disk-flushes ;
        }
        net {
                max-epoch-size          8192;
                max-buffers             8192;
                sndbuf-size             2097152;
        }
        syncer {
                rate                    4194304k;
                al-extents              6433;
        }
}

e cluster.res:

resource rd0 {
        protocol C;
        on cl1 {
                device /dev/drbd0;
                disk /dev/sda4;
                address 192.168.42.1:7788;
                meta-disk internal;
        }

        on cl2 {
                device /dev/drbd0;
                disk /dev/sda4;
                address 192.168.42.2:7788;
                meta-disk internal;
        }
}

Saída do cat /proc/drbdescravo:

version: 8.4.5 (api:1/proto:86-101)
srcversion: EDE19BAA3D4D4A0BEFD8CDE 
 0: cs:SyncTarget ro:Secondary/Secondary ds:Inconsistent/UpToDate C r-----
    ns:0 nr:4462592 dw:4462592 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:16489499884
        [>....................] sync'ed:  0.1% (16103024/16107384)M
        finish: 49:20:03 speed: 92,828 (92,968) want: 102,400 K/sec

Saída do vmstat 2mestre (ambas as máquinas estão quase completamente ociosas):

procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
 0  0      0 14952768 108712 446108    0    0   213   254   16    9  0  0 100  0
 0  0      0 14952484 108712 446136    0    0     0     4 10063 1361  0  0 99  0
 0  0      0 14952608 108712 446136    0    0     0     4 10057 1356  0  0 99  0
 0  0      0 14952608 108720 446128    0    0     0    10 10063 1352  0  1 99  0
 0  0      0 14951616 108720 446136    0    0     0     6 10175 1417  0  1 99  0
 0  0      0 14951748 108720 446136    0    0     0     4 10172 1426  0  1 99  0

Saída iperfentre os dois servidores:

------------------------------------------------------------
Client connecting to cl2, TCP port 5001
TCP window size:  325 KByte (default)
------------------------------------------------------------
[  3] local 192.168.42.1 port 47900 connected with 192.168.42.2 port 5001
[ ID] Interval       Transfer     Bandwidth
[  3]  0.0-10.0 sec  6.87 GBytes  5.90 Gbits/sec

Aparentemente, a sincronização inicial deve ser um pouco lenta, mas não tão lenta ... Além disso, ele realmente não reage a nenhuma tentativa de acelerar a taxa de sincronização como drbdadm disk-options --resync-rate=800M all.

linux
  • 3 3 respostas
  • 24462 Views

3 respostas

  • Voted
  1. Matt Kereczman
    2015-12-03T12:40:06+08:002015-12-03T12:40:06+08:00

    Nas versões mais recentes do DRBD (8.3.9 e mais recentes), há um controlador de ressincronização dinâmico que precisa de ajuste. Em versões mais antigas do DRBD, a configuração syncer {rate;}era suficiente; agora é usado mais como um ponto de partida levemente sugerido para a velocidade de ressincronização dinâmica.

    O controlador de sincronização dinâmica é ajustado com as "configurações c" na seção de disco da configuração do DRBD (consulte $ man drbd.confpara obter detalhes sobre cada uma dessas configurações).

    Com 10 Gbe entre esses nós e assumindo baixa latência, já que o protocolo C é usado, a seguinte configuração deve acelerar as coisas:

    recurso rd0 {
            protocolo C;
            disco {
                    c-preenchimento-alvo 10M;
                    c-max-rate 700M;
                    c-planejar com antecedência 7;
                    taxa de c-min 4M;
            }
            em cl1 {
                    dispositivo /dev/drbd0;
                    disco /dev/sda4;
                    endereço 192.168.42.1:7788;
                    meta-disco interno;
            }
    
            em cl2 {
                    dispositivo /dev/drbd0;
                    disco /dev/sda4;
                    endereço 192.168.42.2:7788;
                    meta-disco interno;
            }
    }
    

    Se você ainda não estiver satisfeito, tente max-buffersaumentar para 12k. Se você ainda não estiver satisfeito, tente aumentar c-fill-targetem incrementos de 2 milhões.

    • 11
  2. Best Answer
    wazoox
    2015-12-05T06:16:22+08:002015-12-05T06:16:22+08:00

    Alguém em outro lugar sugeriu que eu usasse essas configurações:

            disk {
                    on-io-error             detach;
                    c-plan-ahead 0;
            }
            net {
                    max-epoch-size          20000;
                    max-buffers             131072;
            }
    

    E o desempenho é excelente.

    Editar: de acordo com @Matt Kereczman e outras sugestões, finalmente mudei para isso:

    disk {
            on-io-error             detach;
            no-disk-flushes ;
            no-disk-barrier;
            c-plan-ahead 0;
            c-fill-target 24M;
            c-min-rate 80M;
            c-max-rate 720M;
    } 
    net {
            # max-epoch-size          20000;
            max-buffers             36k;
            sndbuf-size            1024k ;
            rcvbuf-size            2048k;
    }
    

    A velocidade de ressincronização é alta:

    cat /proc/drbd
    version: 8.4.5 (api:1/proto:86-101)
    srcversion: EDE19BAA3D4D4A0BEFD8CDE
     0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r---n-
        ns:133246146 nr:0 dw:2087494 dr:131187797 al:530 bm:0 lo:0 pe:5 ua:106 ap:0 ep:1 wo:d oos:4602377004
            [>....................] sync'ed:  2.8% (4494508/4622592)M
            finish: 1:52:27 speed: 682,064 (646,096) K/sec
    

    A velocidade de gravação é excelente durante a ressincronização com estas configurações (80% da velocidade de gravação local, velocidade total do cabo):

    # dd if=/dev/zero of=./testdd bs=1M count=20k
    20480+0 enregistrements lus
    20480+0 enregistrements écrits
    21474836480 octets (21 GB) copiés, 29,3731 s, 731 MB/s
    

    A velocidade de leitura está OK:

    # dd if=testdd bs=1M count=20k of=/dev/null
    20480+0 enregistrements lus
    20480+0 enregistrements écrits
    21474836480 octets (21 GB) copiés, 29,4538 s, 729 MB/s
    

    Edição posterior:

    Após uma ressincronização completa, o desempenho é muito bom (gravação em velocidade de fio, leitura em velocidade local). A ressincronização é rápida (5/6 horas) e não prejudica muito o desempenho (leitura da velocidade do fio, gravação da velocidade do fio). Eu definitivamente vou ficar com c-plan-ahead em zero. Com valores diferentes de zero, a ressincronização é muito longa.

    • 9
  3. Keven
    2016-07-13T22:39:34+08:002016-07-13T22:39:34+08:00

    c-plan-ahead deve definir um valor positivo para habilitar o controlador de taxa de sincronização dinâmica. disco c-plan-ahead 15; // 5 * RTT / 0.1s unit,in my case is 15 c-fill-target 24; c-max-rate 720M;

    • 5

relate perguntas

  • Como descobrir detalhes sobre hardware na máquina Linux?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve