Posso ativar o PITR depois que o banco de dados foi usado

Question

LetMeSOThat4U

Asked: 2022-02-18 06:16:31 +0800 CST2022-02-18 06:16:31 +0800 CST 2022-02-18 06:16:31 +0800 CST

Sem aceleração usando restauração paralela com pg_restore

772

Eu preciso de um grande banco de dados como 10TB-15TB no Postgresql para benchmarking.

Eu criei um banco de dados de amostra menor de ~ 100 GB com pgbenchassim:

pgbench -i -s 7000 --no-vacuum exampledb

No entanto, não observo nenhuma aceleração ao fazer a restauração paralela do customformato (criado com pg_dump -F c ...). Incluindo a restauração do .sqldump também:

time psql -d pgbench7000 < pgbench7000.sql

SET
SET
SET
SET
SET

set_config
------------
(1 row)

SET
SET
SET
SET
SET
SET

CREATE TABLE
ALTER TABLE

CREATE TABLE
ALTER TABLE

CREATE TABLE
ALTER TABLE

CREATE TABLE
ALTER TABLE

COPY 700000000
COPY 7000
COPY 0
COPY 70000

ALTER TABLE
ALTER TABLE
ALTER TABLE

real        32m1.539s
user        3m28.575s
sys         1m40.125s

####################

time pg_restore -d pgbench7000 pgbench7000.custom
real         20m7.504s
user         2m35.556s
sys          0m35.750s

####################

time pg_restore -j 16 -d pgbench7000 pgbench7000.custom

real         20m56.565s
user         2m57.547s
sys          0m40.096s

Eu dei recursos generosos ao servidor Postgresql:

max_connections = 1000              
shared_buffers = 94GB  # 25% of system's memory                
work_mem = 512MB                      
maintenance_work_mem = 12GB
effective_io_concurrency = 500
max_worker_processes = 50     
max_parallel_maintenance_workers = 10   
max_parallel_workers_per_gather = 10   
max_parallel_workers = 50

A caixa é realmente poderosa, possui 374 GB de RAM, 72 vCPUs e armazenamento NAS rápido montado em NFS (é onde reside o diretório de dados PG).

pgbenchcria um banco de dados bastante simples, existem quatro tabelas e apenas uma tabela é grande e ocupa a maior parte do espaço. Isso pode ser o motivo da falta de aceleração?

Alguém sabe dizer onde está o gargalo? Ou é apenas estrutura db?

Ambiente: Centos 7.9 (é o que tenho que usar), Postgres 11 instalado a partir do repositório do projeto.

1 respostas

Voted

jjanes · Answer 1 · 2022-02-18T14:59:22+08:00

Best Answer

jjanes

2022-02-18T14:59:22+08:002022-02-18T14:59:22+08:00

A restauração paralela executa diferentes operações em paralelo, mas não paraleliza operações individuais. Como o pgbench é dominado por uma tabela, não há muito que possa ser feito em paralelo no nível do cliente.

Com alguns scripts de shell, você pode executar o pg_restore várias vezes em paralelo, apontando cada um para um nome de banco de dados diferente. (Mas você pode fazer o mesmo script usando pgbench -i -s 7000 $DBNAME &, pulando as etapas de despejo e recarregamento.)

2

Sem aceleração usando restauração paralela com pg_restore

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Sem aceleração usando restauração paralela com pg_restore

1 respostas

relate perguntas