Eu tenho a replicação configurada no Postgresql 9.5 usando o slot de replicação. Eu tenho uma máquina primária e uma escrava, ambas Ubuntu 14.04 com um cluster chamado main que está em um diretório diferente do padrão. Em ambos os servidores separadamente, o banco de dados funcionou conforme o esperado (antes de configurar a replicação), incluindo o acesso de outro servidor Ubuntu.
No primário, tenho no postgresql.conf:
wal_level = hot_standby
archive_mode = on
max_replication_slots = 8
archive_timeout = 60
max_wal_senders = 8
wal_keep_segments = 100
logging_collector = on
Adicionei um usuário de replicação ao pg_hba.conf:
host replication repuser [iprange] md5
Reiniciei o banco de dados e criei um slot de replicação assim (como sudo -u postgres psql postgres):
SELECT * FROM pg_create_physical_replication_slot('repslot001');
Na máquina slave, comecei com o pg_basebackup:
sudo -u postgres pg_basebackup -v -h [ipofprimary] -U repuser -D [mydatadir] -R -Xs -P
Eu adicionei ao postgresql.conf:
hot_standby = on
Minha recuperação.conf:
standby_mode = 'on'
primary_conninfo = 'user=repuser password=geheim host=[ipofprimary] port=[port] sslmode=prefer sslcompression=1 krbsrvname=postgres'
primary_slot_name = 'repslot001'
trigger_file = '[datadirectory]/finish.recovery'
recovery_target_timeline='latest'
Reiniciei o banco de dados e tudo parecia bem. Eu fui para casa neste momento.
No dia seguinte, meu servidor mestre travou porque o disco estava cheio:
PANIC: could not write to file "pg_xlog/xlogtemp.11700": No space left on device
Pesquisei no Google e descobri que isso acontece se o archive_command, conforme definido em postgresql.conf no mestre, estiver incorreto ou ausente.
Mas entendo que, ao usar slots de replicação, não preciso de um archive_command (portanto, não defini um comando de arquivo). Que erro eu cometi?
Se você precisar de mais informações para poder responder a isso, por favor me avise. Mas observe que preciso continuar meu trabalho, agora estou tentando promover escravo a mestre e limpar o antigo mestre quebrado. Farei um backup do diretório de dados, que também contém os logs. Observe também que esta é uma configuração de teste, não perderei nenhum dado. Somente quando tiver certeza de que sei como funciona e como configurá-lo corretamente, começarei a usar a replicação em um ambiente de produção.
Obrigada.
Editar. O erro que cometi foi confundir o uso de arquivamento com os slots de replicação (obrigado Frankie por sua paciência). Agora tenho o seguinte em meu postgresql.conf - e está funcionando conforme o esperado:
wal_level = hot_standby
max_wal_senders = 8
max_replication_slots = 1
hot_standby = on
Eu removi as configurações de arquivamento archive_mode
e archive_command
.