AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 334615
Accepted
Henry
Henry
Asked: 2024-01-06 11:08:57 +0800 CST2024-01-06 11:08:57 +0800 CST 2024-01-06 11:08:57 +0800 CST

Ao usar JSONb para uma hierarquia complexa de referências, é melhor juntar agregando os IDs no JSON ou ter uma tabela de relações adicional?

  • 772

Digamos que temos várias tabelas primárias em nosso banco de dados (a, bec) e depois outra (x) que armazena um objeto JSONb complexo e semiprevisível que possui referências a todas as tabelas primárias. No meu caso, o JSONb é mais ou menos assim:

{
  entries: [
    [
      [
        {table: 'a', id: '1'},
        {table: 'b', id: '4', entries: [
          {table: 'a', id: '3'},
          {table: 'a', id: '1'}
          ...
        ]},
        {table: 'c', id: '5', entries: [
          {table: 'a', id: '2'},
          {table: 'b', id: '4', entries: [
            {table: 'a', id: '1'},
            {table: 'a', id: '6'},
            ...
          ]},
          ...
        ]},
        ...
      ],
      ...
    ],
    ...
  ]
}

Ao selecionar registros da tabela xqueremos filtrar os resultados pelas propriedades das outras tabelas - por exemplo. apenas xregistros que contêm um aregistro que possui um campo contendo um valor enum específico.

É possível ou tem algum desempenho fazer isso em uma única consulta usando essa estrutura de dados JSONb? Parece que seria necessária uma agregação séria de IDs, e fazer isso para cada consulta parece muito trabalhoso.

A alternativa que estava considerando é manter o campo JSONb como está, mas também criar tabelas de junção (posso estar com o nome errado aí) para rastrear todas as xdependências de registros da tabela. Então você teria tabelas x_a, x_b, x_c, etc. e armazenaria apenas um único registro de junção exclusivo para cada ID a, b, ou c, que aparece no xregistro. Dessa forma, ao escrever as consultas, uma abordagem simples e não JSON poderia ser usada para fazer um filtro de junção regular.

Como um programador SQL iniciante a intermediário, isso parece que pelo menos levaria a um código mais legível, no entanto, não tenho certeza se isso conta como uma violação da regra "inserir os dados apenas uma vez".

Toda e qualquer contribuição é bem-vinda, incluindo material de leitura sobre como tomar essas decisões.

A linguagem é PostgresQl

postgresql
  • 1 1 respostas
  • 29 Views

1 respostas

  • Voted
  1. Best Answer
    J.D.
    2024-01-06T21:41:26+08:002024-01-06T21:41:26+08:00

    A alternativa que estava considerando é manter o campo JSONb como está, mas também criar tabelas de junção (posso estar com o nome errado aí) para rastrear todas as xdependências de registros da tabela. Então você teria tabelas x_a, x_b, x_c, etc. e armazenaria apenas um único registro de junção exclusivo para cada ID a, b, ou c, que aparece no registro x.

    Sim, este é o caminho. Seu campo JSONb está desnormalizado e terá um desempenho ruim se você tentar unir tabelas a partir dele. Provavelmente não é possível fazer isso de maneira sargável e será necessário desempacotar o JSON e verificar a tabela inteira sempre que você ingressar nela.

    As tabelas de "junção" às quais você se referiu são chamadas de tabelas de ponte ou tabelas de ligação. Eles provavelmente também ajudarão a desduplicar seus dados do campo JSON. Eles serão indexáveis ​​em seus campos-chave e deverão ter bom desempenho quando associados. JSON é, na verdade, uma maneira muito ruim de armazenar quaisquer dados que precisem ser operados, em geral. É realmente uma prática recomendada usá-lo apenas para dados que são apenas gravados e lidos, não operados, quando esses dados não puderem ser facilmente normalizados de outra forma.

    no entanto, não tenho certeza se isso conta como uma violação da regra "insira os dados apenas uma vez".

    Você não deseja manter os mesmos dados em dois lugares, quando possível, corrija. Mas por que continuar usando a coluna JSON? O consumidor não deveria se preocupar com o objeto que contém os dados. E se isso acontecer, você pode simplesmente escrever uma consulta que crie um conjunto de resultados estruturados JSON fora das tabelas. Você pode até salvar essa consulta em um objeto de visualização para poder referenciá-la facilmente conforme necessário. Isso permite que você não precise manter os dados em dois locais, o que poderia levar a problemas de integridade e gerenciamento de dados.

    • 1

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve