AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / user-224007

Don Draper's questions

Martin Hope
Don Draper
Asked: 2023-10-05 14:49:46 +0800 CST

Selecionar itens filhos de outra tabela como uma coluna de array JSON (sem prejudicar o desempenho)

  • 5

Digamos que eu tenha essas duas tabelas: autor(id, nome, país) e publicação(id, nome, ano, autor_id).

O que eu quero chegar no final é:

autor_id | nome_autor | autor_país | autor_publicações

Onde autor_publicações é uma matriz JSON com todas as publicações do autor correspondente.

SELECT author.id AS author_id,
       author.name AS author_name,
       author.country as author_country,
       JSONB_AGG(JSONB_BUILD_OBJECT(
                         'id',
                         publication.id,
                         'name',
                         publication.name,
                         'year',
                         publication.year
                     )) AS author_publications

FROM author
JOIN publication
ON author.id = publication.author_id
GROUP BY author.id

Esta consulta retorna exatamente o que eu quero. Dito isto, o desempenho fica muito ruim quando a instância do banco de dados está ocupada. A agregação JSON torna a consulta 5 a 6 vezes mais lenta.

Existe um índice da chave estrangeira (author_id) na tabela de publicação.

Existe uma maneira melhor de obter o resultado que desejo?

+-----------------------------------------------------------------------------------------------------------------------------------------------+
|QUERY PLAN                                                                                                                                     |
+-----------------------------------------------------------------------------------------------------------------------------------------------+
|HashAggregate  (cost=107.31..108.35 rows=83 width=116) (actual time=25.764..38.070 rows=83 loops=1)                                            |
|  Group Key: author.id                                                                                                                      |
|  Batches: 5  Memory Usage: 4400kB  Disk Usage: 240kB                                                                                          |
|  ->  Hash Join  (cost=4.87..88.64 rows=2490 width=197) (actual time=0.077..2.250 rows=2448 loops=1)                                           |
|        Hash Cond: (publication.author_id = author.id)                                                                                     |
|        ->  Seq Scan on publication  (cost=0.00..76.90 rows=2490 width=113) (actual time=0.008..1.115 rows=2448 loops=1)|
|        ->  Hash  (cost=3.83..3.83 rows=83 width=84) (actual time=0.062..0.063 rows=83 loops=1)                                                |
|              Buckets: 1024  Batches: 1  Memory Usage: 18kB                                                                                    |
|              ->  Seq Scan on author  (cost=0.00..3.83 rows=83 width=84) (actual time=0.006..0.040 rows=83 loops=1)  |
|Planning Time: 0.287 ms                                                                                                                        |
|Execution Time: 38.494 ms                                                                                                                      |
+-----------------------------------------------------------------------------------------------------------------------------------------------+

postgresql
  • 1 respostas
  • 31 Views
Martin Hope
Don Draper
Asked: 2023-01-27 10:16:14 +0800 CST

Como filtrar linhas com base em um campo de matriz JSON aninhado?

  • 6
[
  {
    "id": 1,
    "columns": [
      {
        "id": 16,
        "expression": "foo"
      },
      {
        "id": 12,
        "expression": "bar"
      }
    ]
  },
  {
    "id": 2,
    "columns": [
      {
        "id": 11,
        "expression": "baz"
      },
      {
        "id": 8,
        "expression": "foobar"
      }
    ]
  }
]

Eu tenho uma tabela onde uma das colunas é uma matriz JSON de elementos. Acima, você pode ver como pode ser o valor desse campo.

A ideia é filtrar as linhas das tabelas com base no valor do expressioncampo. Por exemplo, posso querer deixar apenas as linhas onde há uma coluna onde expressionequals foo.

Minha primeira ideia foi usar json_array_elements()várias vezes e, em seguida, escrever uma WHERE EXISTS(SELECT true FROM ...)cláusula, mas isso resulta em duplicatas de linha. Além disso, minhas tentativas de combinar vários json_array_elementsnem sempre funcionam da maneira que eu esperava.

Funcionaria se eu pudesse, de alguma forma, nivelar todos os itens para que houvesse uma grande lista de expressionvalores para cada linha. Infelizmente, não tenho certeza se existe uma maneira conveniente de fazer isso com essa estrutura aninhada.

ATUALIZAÇÃO: corrigido o objeto JSON

Minha tabela está assim:

id | description |      | tables
1  | sample_description | <sample_above>

O resultado desejado é manter as linhas onde existe um item no columnscampo entre os itens deste tablesarray json de forma que o expressionvalor seja igual<some_value>

postgresql
  • 1 respostas
  • 24 Views
Martin Hope
Don Draper
Asked: 2022-11-30 23:00:40 +0800 CST

UPSERT baseado na combinação única de (INTEGER, NULL), (NULL, INTEGER)

  • 8

Minha tabela, para simplificar, ficou assim:

id | foreign_key_1 | foreign_key_2 | value

Como fica claro pelos nomes, os campos foreign_key_1e foreign_key_2referem-se a PKs em duas outras tabelas.

O complicado aqui é que apenas um deles pode ser não nulo ao mesmo tempo, então também tenho as seguintes restrições:

UNIQUE (foreign_key_1),
UNIQUE (foreign_key_2),
CHECK ((foreign_key_1 IS NOT NULL AND foreign_key_2 IS NULL) 
    OR (foreign_key_1 IS NULL AND foreign_key_2 IS NOT NULL))

foreign_key_1Essas verificações garantem a integridade que eu queria, mas agora também quero excluir a entrada existente foreign_key_2antes de inserir uma nova entrada.

DELETE FROM my_table
WHERE ($1::INTEGER IS NULL OR foreign_key_1 = $1::INTEGER)
    AND ($2::INTEGER is NULL OR foreign_key_2 = $2::INTEGER)

Inicialmente, a ideia era ter apenas uma consulta que pudesse tratar ambas (foreign_key_1, NULL)e (NULL, foreign_key_2)passar como argumentos.

A principal preocupação é que a execução da instrução delete pode ser bem-sucedida, enquanto a inserção pode falhar e, então, a tabela ficará em um estado inválido.

Parece que usar uma transação aqui é o caminho a percorrer, mas da perspectiva da organização do código, será necessária muita refatoração agora para agrupar ambas as chamadas para repositórios na mesma transação.

Minha próxima ideia foi usar um UPSERT eON CONFLICT(target) DO UPDATE...

Não tenho uma única restrição aqui para usar como destino e a versão que estou usando (Postgres 14) ainda não possui a cláusula NULLS NOT DISTINCT.

Para reiterar, gostaria de ter uma interseção de:

  • UNIQUE(foreign_key_1)
  • UNIQUE(foreign_key_2)
  • CHECK ((foreign_key_1 IS NOT NULL AND foreign_key_2 IS NULL) OR (foreign_key_1 IS NULL AND foreign_key_2 IS NOT NULL))

... para que possa ser usado como alvo ao ON CONFLICTfazer um UPSERT. Isso é possível de alguma forma?

No geral, meu entendimento é que, nessa situação, as opções são:

  • Refatorando e executando as duas instruções em uma transação [muita refatoração]
  • Encontrar uma maneira de ter um único alvo para a ON CONFLICTcláusula
  • Criando um CTE inteligente que excluirá a linha existente primeiro
  • algo mais

Quais são suas sugestões?

Atualizar

Depois de pensar um pouco, provavelmente posso usar:

CREATE UNIQUE INDEX one_null_idx ON my_table(COALESCE(foreign_key_1, -1), COALESCE(foreign_key_2, -1));

A restrição de verificação para garantir apenas uma chave estrangeira não nula também é necessária aqui.

Dado que as chaves estrangeiras são seriais e nunca podem ser -1, parece que isso pode funcionar. O que você acha?

postgresql
  • 1 respostas
  • 181 Views
Martin Hope
Don Draper
Asked: 2022-10-04 10:37:44 +0800 CST

Implementar restrição de chave estrangeira quando houver várias tabelas pai

  • 3

Pode ser que meu projeto inicial seja falho, mas vamos começar a partir daí e ver se há uma abordagem boa o suficiente.

Eu tenho duas entidades, digamos, Ae Bque são muito semelhantes, mas não idênticas, então os conjuntos de colunas são diferentes. Por esses motivos, existem duas tabelas distintas, Ae B.

Dito isso, gostaria de criar outra tabela que descreva ambos Ae Bcom um conjunto de campos aplicáveis ​​a Ae B. Vamos chamar esta tabela entity_settings.

Seu esquema não é intuitivo para descobrir:

  1. Minha primeira ideia é usar algum tipo de entity_typesinalizador e entity_idde A ou B dependendo do tipo com uma restrição UNIQUE em (entity_type, entity_id). Tal definição torna impossível ter uma restrição externa normal porque ela entity_idconsiste em ids de duas tabelas.

  2. Outra opção é ter A_ide B_idque pode ser nulo mas referenciar os campos de ID das tabelas correspondentes. Isso faz sentido e fornece integridade referencial, mas as inserções nesta tabela serão bastante desajeitadas.

  3. A única opção que estou considerando também é ter duas tabelas separadas para Ae Bpara que cada tabela tenha seu próprio filho. Isso parece um pouco inútil em termos de número de tabelas, mas é provavelmente a opção mais limpa em termos de design.

Como quase sempre, tenho a sensação de que está faltando algo e agradeceria muito se alguém pudesse sugerir outras opções.

EDITAR:

Na segunda opção, também faz sentido adicionar uma restrição CHECK comoCHECK((A_id IS NOT NULL AND B_id IS NULL)) OR (A_id IS NULL AND B IS NOT NULL))

database-design postgresql
  • 1 respostas
  • 105 Views

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve