AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 77807
Accepted
John
John
Asked: 2014-09-27 13:15:32 +0800 CST2014-09-27 13:15:32 +0800 CST 2014-09-27 13:15:32 +0800 CST

Agregação de execução lenta da consulta agregada

  • 772

Estou procurando o saldo total de todas as contas que tiveram um saldo negativo em um ponto específico no tempo. Eu já tenho o código abaixo e funciona, mas funciona horrivelmente.

A tabela de transações contém 20 milhões de linhas. A consulta abaixo leva cerca de 30 segundos, o que não é ruim, mas há uma segunda parte em que preciso repetir @report_date no primeiro dia de cada mês desde o início do banco de dados, o que aumenta o tempo de execução para aproximadamente 30 minutos.

Isso está no MSSQL2008 e não estou recebendo nenhum aviso de índices ausentes no plano de execução, mas suspeito que meu problema ainda esteja com os índices, então estou intencionalmente deixando-os fora daqui.

CREATE TABLE transactions(
    transaction_id int,
    account_id int,
    department_id int,
    location_id int,
    post_date date,
    amount money
    );

SELECT
    t2.department_id,
    t2.location_id,
    SUM(t2.credit_balances)
FROM
    (
    SELECT
        t1.department_id,
        t1.location_id,
        t1.account_id,
        SUM(t1.amount) as credit_balances
    FROM
        transactions t1
    WHERE
        t1.post_date < @report_date
    GROUP BY
        t1.department_id,
        t1.location_id,
        t1.account_id
    HAVING
        SUM(t1.amount) < 0
    ) t2
GROUP BY
    t2.department_id,
    t2.location_id;

A tabela contém 38 department_id,location_idcombinações distintas e 4,5 milhões de arquivos department_id,location_id,account_id.

sql-server performance
  • 1 1 respostas
  • 2022 Views

1 respostas

  • Voted
  1. Best Answer
    Martin Smith
    2014-09-29T04:18:48+08:002014-09-29T04:18:48+08:00

    Como você repete essa consulta por vários meses, reagrega continuamente as mesmas linhas.

    Por exemplo, as linhas no primeiro mês sempre serão trazidas de volta pelos t1.post_date < @report_datecritérios, portanto, serão reprocessadas a cada mês.

    Para evitar isso, provavelmente consideraria trabalhar com isso de maneira iterativa, um mês de cada vez, desde o início. Dependendo da volatilidade dos dados históricos, também posso considerar armazenar os resultados pré-calculados no banco de dados, em vez de recalculá-los a cada mês.

    Para calcular isso em tempo de execução, você pode criar uma tabela temporária com a seguinte estrutura.

    CREATE TABLE #balance
      (
         department_id   INT NOT NULL,
         location_id     INT NOT NULL,
         account_id      INT NOT NULL,
         balance_to_date MONEY NOT NULL,
         PRIMARY KEY (department_id, location_id, account_id)
      ); 
    

    Você também pode considerar adicionar o seguinte índice em sua transactionstabela

    ALTER TABLE transactions
      ADD post_date_year_month AS (10000 * YEAR(post_date) + MONTH(post_date))
    
    CREATE INDEX ix
      ON transactions(post_date_year_month, department_id, location_id, account_id)
      INCLUDE (amount) 
    

    Em seguida, extraia um mês de cada vez transactionse mescle-o #balance(com um quando correspondido e depois incrementado, quando não correspondido inserir).

    A post_date_year_monthcoluna inicial significa que, desde que você escreva a consulta sargably, a extração de cada mês pode ser feita com eficiência e as linhas extraídas de um mês serão ordenadas, department_id, location_id, account_idtornando possível uma junção de mesclagem #balancesem uma classificação.

    Embora isso possa beneficiar essa consulta específica, você precisa avaliar a utilidade desse índice em relação à sua carga de trabalho geral.

    Em seguida, calcule os department_id, location_idtotais de #balance(pode aproveitar o pedido PK para evitar uma classificação) e armazene-os em algum lugar e passe para o próximo mês.

    (Ou, possivelmente, em vez de #balancevocê poderia usar uma tabela permanente "temporária" balancee criar uma exibição indexada nela para evitar a etapa de agregação explícita separada e apenas copiar os valores diretamente dela antes de prosseguir)

    • 1

relate perguntas

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

  • Onde posso encontrar o log lento do mysql?

  • Como posso otimizar um mysqldump de um banco de dados grande?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve