Posso ativar o PITR depois que o banco de dados foi usado

Question

Evan Appleby

Asked: 2015-07-06 17:26:05 +0800 CST2015-07-06 17:26:05 +0800 CST 2015-07-06 17:26:05 +0800 CST

Como particionar a tabela existente no postgres?

772

Gostaria de particionar uma tabela com mais de 1 milhão de linhas por intervalo de datas. Como isso é feito normalmente sem exigir muito tempo de inatividade ou correr o risco de perder dados? Aqui estão as estratégias que estou considerando, mas aberto a sugestões:

A tabela existente é o mestre e os filhos herdam dela. Com o tempo, mova os dados do mestre para o filho, mas haverá um período de tempo em que alguns dos dados estarão na tabela mestra e outros nos filhos.
Crie uma nova tabela mestre e filhas. Crie uma cópia dos dados na tabela existente nas tabelas filhas (para que os dados residam em dois locais). Depois que as tabelas filhas tiverem os dados mais recentes, altere todas as inserções para apontar para a nova tabela mestre e exclua a tabela existente.

2 respostas

Voted

Evan Appleby · Answer 1 · 2015-07-08T06:07:39+08:00

Como o nº 1 requer a cópia de dados do mestre para o filho enquanto ele está em um ambiente de produção ativo, eu pessoalmente fui com o nº 2 (criar um novo mestre). Isso evita interrupções na tabela original enquanto ela estiver em uso ativo e, se houver algum problema, posso excluir facilmente o novo mestre sem problemas e continuar usando a tabela original. Aqui estão os passos para fazê-lo:

Crie uma nova tabela mestra.

CREATE TABLE new_master (
    id          serial,
    counter     integer,
    dt_created  DATE DEFAULT CURRENT_DATE NOT NULL
);

Crie filhos que herdam do mestre.

CREATE TABLE child_2014 (
    CONSTRAINT pk_2014 PRIMARY KEY (id),
    CONSTRAINT ck_2014 CHECK ( dt_created < DATE '2015-01-01' )
) INHERITS (new_master);
CREATE INDEX idx_2014 ON child_2014 (dt_created);

CREATE TABLE child_2015 (
    CONSTRAINT pk_2015 PRIMARY KEY (id),
    CONSTRAINT ck_2015 CHECK ( dt_created >= DATE '2015-01-01' AND dt_created < DATE '2016-01-01' )
) INHERITS (new_master);
CREATE INDEX idx_2015 ON child_2015 (dt_created);

...

Copie todos os dados históricos para a nova tabela mestra

INSERT INTO child_2014 (id,counter,dt_created)
SELECT id,counter,dt_created
from old_master
where dt_created < '01/01/2015'::date;

Pausar temporariamente novas inserções/atualizações no banco de dados de produção

Copie os dados mais recentes para a nova tabela mestra

INSERT INTO child_2015 (id,counter,dt_created)
SELECT id,counter,dt_created
from old_master
where dt_created >= '01/01/2015'::date AND dt_created < '01/01/2016'::date;

Renomeie as tabelas para que new_master se torne o banco de dados de produção.

ALTER TABLE old_master RENAME TO old_master_backup;
ALTER TABLE new_master RENAME TO old_master;

Adicione função para instruções INSERT em old_master para que os dados sejam passados para a partição correta.

CREATE OR REPLACE FUNCTION fn_insert() RETURNS TRIGGER AS $$
BEGIN
    IF ( NEW.dt_created >= DATE '2015-01-01' AND
         NEW.dt_created < DATE '2016-01-01' ) THEN
        INSERT INTO child_2015 VALUES (NEW.*);
    ELSIF ( NEW.dt_created < DATE '2015-01-01' ) THEN
        INSERT INTO child_2014 VALUES (NEW.*);
    ELSE
        RAISE EXCEPTION 'Date out of range';
    END IF;
    RETURN NULL;
END;
$$
LANGUAGE plpgsql;

Adicionar gatilho para que a função seja chamada em INSERTS

CREATE TRIGGER tr_insert BEFORE INSERT ON old_master
FOR EACH ROW EXECUTE PROCEDURE fn_insert();

Definir exclusão de restrição como ATIVADO
```
SET constraint_exclusion = on;
```
Reative UPDATES e INSERTS no banco de dados de produção
Configure o gatilho ou cron para que novas partições sejam criadas e a função seja atualizada para atribuir novos dados à partição correta. Consulte este artigo para exemplos de código
Excluir old_master_backup

kakoni · Answer 2 · 2016-05-11T12:00:07+08:00

kakoni

2016-05-11T12:00:07+08:002016-05-11T12:00:07+08:00

Existe uma nova ferramenta chamada pg_pathman ( https://github.com/postgrespro/pg_pathman ) que faria isso para você automaticamente.

Então, algo como o seguinte faria isso.

SELECT create_range_partitions('master', 'dt_created', 
   '2015-01-01'::date, '1 day'::interval);

7

Como particionar a tabela existente no postgres?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Como particionar a tabela existente no postgres?

2 respostas

relate perguntas