Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

Question

Tiddo

Asked: 2013-06-13 03:07:23 +0800 CST2013-06-13 03:07:23 +0800 CST 2013-06-13 03:07:23 +0800 CST

Prática recomendada para armazenar metadados de registro

772

Qual é a melhor prática para armazenar metadados de registros individuais em um banco de dados?

Preciso armazenar metadados comuns, como hora de criação e hora da última atualização para muitas tabelas em meu banco de dados. Encontrei algumas soluções diferentes:

Armazene os metadados diretamente nas tabelas.

Prós:
- Os metadados estão diretamente vinculados aos registros
- Nenhuma junção é necessária para recuperar metadados
Contras:
- Muitas colunas duplicadas são necessárias (a menos que a herança seja usada)
- Metadados e dados de negócios não são separados
Crie uma tabela de metadados gerais e use chaves estrangeiras virtuais para vincular dados às tabelas e registros corretos.

Prós:
- Sem duplicação de colunas
- Os metadados são separados dos dados de negócios
Contras:
- Sem links diretos entre metadados e dados (FKs não podem ser usados)
- Junções requerem uma condição adicional
Crie tabelas de metadados individuais para cada tabela que requer metadados.

Prós:
- Os metadados estão diretamente vinculados aos registros
- Os metadados são separados dos dados de negócios
Contras:
- Muitas tabelas extras são necessárias
- Muitas colunas duplicadas são necessárias (a menos que a herança seja usada)

Existem mais opções, prós ou contras do que as que mencionei aqui? E qual é a melhor prática para armazenar esses metadados?

1 respostas

Voted

Erwin Brandstetter · Answer 1 · 2013-06-14T15:24:23+08:00

As colunas de que você está falando ocupam 20 bytes (se alinhadas sem preenchimento):

hora de criação, hora de atualização e fonte de criação

timestamp .. 8 bytes
timestamp .. 8 bytes
inteiro .. 4 bytes

O cabeçalho da tupla e o identificador de item para uma linha separada em uma tabela separada sozinho ocupariam 23 + 1 + 4 = 28 bytes mais os 20 bytes de dados reais, mais 4 bytes de preenchimento no final. Faz 52 bytes por linha . Ver:

Configurando o PostgreSQL para desempenho de leitura

Em relação ao armazenamento, você não tem nada a ganhar. Com relação ao desempenho, você quase não perde nada com apenas 16 - 24 bytes a mais por linha.

As colunas também pertencem diretamente à linha, por isso faz sentido mantê-las juntas. Tenho o hábito de adicionar exatamente essas colunas (mais fonte separada para a última atualização) a todas as tabelas relevantes.

Também é mais fácil escrever um TRIGGER ON INSERT OR UPDATEpara mantê-los atualizados.

Resumindo: um voto forte para sua opção 1 .

Onde eu iria para a opção 3 :
se os metadados forem atualizados com frequência, enquanto a linha principal não é. Então pode valer a pena manter uma tabela 1:1 separada para tornar as ATUALIZAÇÕES mais baratas e reduzir o inchaço na tabela principal - ou até mesmo optar pela opção 2.

Onde eu iria para a opção 2 :
se o conjunto de colunas de metadados for altamente repetitivo. Você pode ter uma coluna FK para o conjunto de metadados na(s) tabela(s) principal(is). Não economiza muito para três pequenas colunas como no seu exemplo.

Prática recomendada para armazenar metadados de registro

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Conceder acesso a todas as tabelas para um usuário

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Prática recomendada para armazenar metadados de registro

1 respostas

relate perguntas