AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 3274
Accepted
Denis de Bernardy
Denis de Bernardy
Asked: 2011-06-12 12:45:54 +0800 CST2011-06-12 12:45:54 +0800 CST 2011-06-12 12:45:54 +0800 CST

Design de banco de dados temporal, com uma torção (linhas ao vivo x rascunho)

  • 772

Não tenho certeza se/como devo postar isso ... Mas no caso de alguns seguirem DBA, mas não SO ...

Existe um meio geralmente aceito de gerenciar linhas ativas e não ativas em um ambiente controlado por versão de linha? E se não, o que você tentou e foi razoavelmente bem-sucedido?

(Detalhes completos no tópico SO ).


Estou pensando em implementar o controle de versão de objeto com o toque adicional de precisar ter objetos ativos e de rascunho, e poderia usar os insights de alguém com experiência nisso, pois estou começando a me perguntar se isso é possível sem hacks potencialmente horríveis.

Vou dividir em postagens com tags para fins de exemplo, mas meu caso de uso é um pouco mais geral (envolvendo dimensões que mudam lentamente - http://en.wikipedia.org/wiki/Slowly_change_dimension ).

Suponha que você tenha uma tabela de posts, uma tabela de tags e uma tabela post2tag:

posts (
 id
)

tags (
 id
)

post2tag (
 post_id fkey posts(id),
 tag_id fkey tags(id)
)

Estou precisando de algumas coisas:

  1. Ser capaz de mostrar exatamente como uma postagem parecia em uma data e hora arbitrárias, inclusive para linhas excluídas.
  2. Acompanhe quem está editando o quê, para uma trilha de auditoria completa.
  3. Precisa de um conjunto de visualizações materializadas (tabelas "ativas") para manter a integridade referencial (ou seja, o registro deve ser transparente para os desenvolvedores).
  4. Precisa ser adequadamente rápido para as linhas de rascunho ao vivo e mais recentes.
  5. Ser capaz de coexistir uma postagem de rascunho com uma postagem ativa.

Tenho investigado várias opções. Até agora, o melhor que encontrei (sem os pontos #4/#5) se parece um pouco com a configuração híbrida SCD type6, mas em vez de ter um booleano atual, há uma visualização materializada para a linha atual. Para todos os efeitos, é assim:

posts (
 id pkey,
 public,
 created_at,
 updated_at,
 updated_by
)

post_revs (
 id,
 rev pkey,
 public,
 created_at,
 created_by,
 deleted_at
)

tags (
 id pkey,
 public,
 created_at,
 updated_at,
 updated_by
)


tag_revs (
 id,
 public,
 rev pkey,
 created_at,
 created_by,
 deleted_at
)

post2tag (
 post_id fkey posts(id),
 tag_id fkey tags(id),
 public,
 created_at,
 updated_at,
 updated_by
)

post2tag_revs (
 post_id,
 tag_id,
 post_rev fkey post_revs(rev), -- the rev when the relation started
 tag_rev fkey tag_revs(rev), -- the rev when the relation started
 public,
 created_at,
 created_by,
 deleted_at,
 pkey (post_rev, tag_rev)
)

Estou usando pg_temporal para manter índices no period(created_at, deleted_at). E mantenho as várias tabelas sincronizadas usando gatilhos. Yada yada yada... Criei os gatilhos que permitem cancelar uma edição de postagens/tags de forma que o rascunho seja armazenado nas rotações sem ser publicado. Funciona muito bem.

Exceto quando preciso me preocupar com as relações relacionadas à linha de rascunho em post2tag. Nesse caso, o inferno começa, e isso me indica que tenho algum tipo de problema de design aí. Mas estou ficando sem ideias...

Eu considerei a introdução de duplicação de dados (ou seja, linhas post2tag introduzidas para cada revisão de rascunho). Isso funciona, mas tende a ser muito mais lento do que eu gostaria.

Eu considerei introduzir tabelas de rascunhos para o "último rascunho", mas isso rapidamente tende a se tornar muito, muito feio.

Eu considerei todos os tipos de bandeiras...

Portanto, pergunte: existe um meio geralmente aceito de gerenciar linhas ativas e não ativas em um ambiente controlado por versão de linha? E se não, o que você tentou e foi razoavelmente bem-sucedido?

database-design
  • 1 1 respostas
  • 699 Views

1 respostas

  • Voted
  1. Best Answer
    Denis de Bernardy
    2011-06-14T01:34:40+08:002011-06-14T01:34:40+08:00

    Publicação cruzada da resposta também:


    Acho que acertei. Basicamente, você adiciona um campo de rascunho (único) às tabelas relevantes e trabalha nos rascunhos como se fossem um novo post/tag/etc.:

    posts (
     id pkey,
     public,
     created_at stamptz,
     updated_at stamptz,
     updated_by int,
     draft int fkey posts (id) unique
    )
    
    post_revs (
     id,
     public,
     created_at,
     created_by,
     deleted_at,
     pkey (id, created_at)
    )
    
    tags (
     id pkey,
     public,
     created_at,
     updated_at,
     updated_by,
     draft fkey tags (id) unique
    )
    
    
    tag_revs (
     id,
     public,
     created_at,
     created_by,
     deleted_at,
     pkey (id, created_at)
    )
    
    post2tag (
     post_id fkey posts(id),
     tag_id fkey tags(id),
     public,
     created_at,
     updated_at,
     updated_by,
     pkey (post_id, tag_id)
    )
    
    post2tag_revs (
     post_id,
     tag_id,
     public,
     created_at,
     created_by,
     deleted_at,
     pkey (post_id, tag_id, created_at)
    )
    
    • 1

relate perguntas

  • Os índices filtrados podem ajudar a melhorar as consultas baseadas em uma hora inserida ou isso deve ser evitado?

  • Qual é a diferença entre os tipos de dados MySQL VARCHAR e TEXT?

  • É melhor armazenar os valores calculados ou recalculá-los a pedido? [duplicado]

  • Armazenar vs calcular valores agregados

  • Quais são algumas maneiras de implementar um relacionamento muitos-para-muitos em um data warehouse?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve