AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 64196
Accepted
John
John
Asked: 2014-04-30 17:02:35 +0800 CST2014-04-30 17:02:35 +0800 CST 2014-04-30 17:02:35 +0800 CST

Como posso eliminar essa operação de busca de índice dispendiosa da minha consulta?

  • 772

Eu tenho duas tabelas no Sql Server 2008 que se parecem com isto:

Transaction_Details:
    Dataset,
    Department,
    Charge_ID,
    Transaction_Type,
    dos_month,
    post_month,
    amount


Charge_Summary
    Dataset,
    Department,
    Charge_ID,
    dos_month,
    Ins1_Category
    

A saída que estou procurando seria mais ou menos assim: Dataset, Department, Ins1_Category, dos_month, Post_Month, Total_Payments, Total_Charges, Previous_Balance -- Definido como valor total para todas as transações correspondentes com um post_month anterior ao mês atual

O SQL que estou usando abaixo fornece a saída esperada, mas há uma busca de índice no plano de execução que ocupa mais de 90% do custo. Isso está em uma operação de datawarehouse, portanto, não há nenhuma outra atividade no servidor além dessa consulta, nenhuma outra leitura ou gravação com que se preocupar. O tempo de execução de aproximadamente 30 minutos é aceitável para o que está sendo usado, mas ainda gostaria de alguns conselhos se houver uma maneira melhor de fazer isso.

SELECT
    t1.Dataset,
    t1.Department,
    c1.Ins1_Category,
    t1.dos_month,
    t1.post_month,
    SUM(case
            when t1.transaction_type = 'payment' THEN t1.amount
            ELSE 0
        END
        ) AS total_payments,
    SUM(case
            when t1.transaction_type = 'adjustment' THEN t1.amount
            ELSE 0
        END
        ) AS total_adjustments,
    SUM(case
            when t1.transaction_type = 'charge' THEN t1.amount
            ELSE 0
        END
        ) AS total_charges,
    (
        SELECT
            SUM(t2.amount)
        FROM
            Transaction_Details t2
        LEFT JOIN
            Charge_Summary c2
        ON
            t2.Dataset = c2.Dataset AND
            t2.Charge_ID = c2.Charge_ID
        WHERE
            t1.Dataset = t2.Dataset AND
            t1.Department = t2.Department AND
            t1.dos_month = t2.dos_month AND
            t1.post_month > t2.post_month AND
            t2.Charge_ID IS NOT NULL AND
            c2.Ins1_Category = c1.Ins1_Category
    ) as previous_balance
FROM
    Transaction_Details t1
LEFT JOIN
    Charge_Summary c1
ON
    t1.Dataset = c1.Dataset AND
    t1.Charge_ID = c1.Charge_ID
WHERE
    t1.Charge_ID is not null
GROUP BY
    t1.Dataset,
    t1.Department,
    c1.Ins1_Category,
    t1.dos_month,
    t1.post_month
sql-server performance
  • 2 2 respostas
  • 481 Views

2 respostas

  • Voted
  1. Best Answer
    Paul White
    2014-05-01T06:40:32+08:002014-05-01T06:40:32+08:00

    Além das técnicas de T-SQL discutidas no artigo de Aaron Bertrands, "Melhores abordagens para totais de execução agrupados" , talvez você queira examinar um SQLCLRprocedimento (se estiver executando menos do que o SQL Server 2012).

    As principais vantagens são que um SQLCLRprocedimento requer apenas uma única varredura dos registros de origem e se beneficia do aumento da velocidade de execução do código compilado. A amostra abaixo foi retirada da postagem de Aaron:

    DDL

    CREATE TABLE dbo.SpeedingTickets
    (
      IncidentID    INT IDENTITY(1,1) PRIMARY KEY,
      LicenseNumber INT          NOT NULL,
      IncidentDate  DATE         NOT NULL,
      TicketAmount  DECIMAL(7,2) NOT NULL
    );
    
    CREATE UNIQUE INDEX x 
    ON dbo.SpeedingTickets(LicenseNumber, IncidentDate) 
    INCLUDE(TicketAmount);
    

    Dados de amostra

    ;WITH TicketAmounts(ID,Value) AS 
    (
      -- 10 arbitrary ticket amounts
      SELECT i,p FROM 
      (
        VALUES(1,32.75),(2,75), (3,109),(4,175),(5,295),
              (6,68.50),(7,125),(8,145),(9,199),(10,250)
      ) AS v(i,p)
    ),
    LicenseNumbers(LicenseNumber,[newid]) AS 
    (
      -- 1000 random license numbers
      SELECT TOP (1000) 7000000 + number, n = NEWID()
        FROM [master].dbo.spt_values 
        WHERE number BETWEEN 1 AND 999999
        ORDER BY n
    ),
    JanuaryDates([day]) AS 
    (
      -- every day in January 2014
      SELECT TOP (31) DATEADD(DAY, number, '20140101') 
        FROM [master].dbo.spt_values 
        WHERE [type] = N'P' 
        ORDER BY number
    ),
    Tickets(LicenseNumber,[day],s) AS
    (
      -- match *some* licenses to days they got tickets
      SELECT DISTINCT l.LicenseNumber, d.[day], s = RTRIM(l.LicenseNumber) 
        FROM LicenseNumbers AS l CROSS JOIN JanuaryDates AS d
        WHERE CHECKSUM(NEWID()) % 100 = l.LicenseNumber % 100
        AND (RTRIM(l.LicenseNumber) LIKE '%' + RIGHT(CONVERT(CHAR(8), d.[day], 112),1) + '%')
        OR (RTRIM(l.LicenseNumber+1) LIKE '%' + RIGHT(CONVERT(CHAR(8), d.[day], 112),1) + '%')
    )
    INSERT dbo.SpeedingTickets(LicenseNumber,IncidentDate,TicketAmount)
    SELECT t.LicenseNumber, t.[day], ta.Value 
      FROM Tickets AS t 
      INNER JOIN TicketAmounts AS ta
      ON ta.ID = CONVERT(INT,RIGHT(t.s,1))-CONVERT(INT,LEFT(RIGHT(t.s,2),1))
      ORDER BY t.[day], t.LicenseNumber;
    

    Procedimento SQL CLR DDL

    CREATE ASSEMBLY [Demo] AUTHORIZATION [dbo]
    FROM 
    WITH PERMISSION_SET = SAFE;
    GO
    CREATE PROCEDURE [dbo].[TicketRunningTotals] 
    AS EXTERNAL NAME [Demo].[StoredProcedures].[TicketRunningTotals];
    

    Uso

    EXECUTE dbo.TicketRunningTotals;
    

    Resultado

    Exemplo de saída

    Plano de execução

    Plano de execução

    Código-fonte do SQL CLR

    using System.Data;
    using System.Data.SqlClient;
    using Microsoft.SqlServer.Server;
    
    public partial class StoredProcedures
    {
        [SqlProcedure]
        public static void TicketRunningTotals()
        {
            using (var conn = new SqlConnection("context connection = true"))
            {
                conn.Open();
    
                using (var cmd = new SqlCommand())
                {
                    cmd.Connection = conn;
                    cmd.CommandText =
                        @"
                        SELECT
                            ST.LicenseNumber,
                            ST.IncidentDate,
                            ST.TicketAmount
                        FROM dbo.SpeedingTickets AS ST
                        ORDER BY
                            ST.LicenseNumber,
                            ST.IncidentDate
                        ";
    
                    var columns = new SqlMetaData[4]
                    {
                        new SqlMetaData("LicenseNumber", SqlDbType.Int),
                        new SqlMetaData("IncidentDate", SqlDbType.Date),
                        new SqlMetaData("TicketAmount", SqlDbType.Decimal, 7, 2),
                        new SqlMetaData("RunningTotal", SqlDbType.Decimal, 9, 2)
                    };
    
                    int licenseNumber, lastLicenseNumber;
                    var ticketAmount = 0m;
                    var runningTotal = 0m;
    
                    var pipe = SqlContext.Pipe;
                    var reader = cmd.ExecuteReader(CommandBehavior.SingleResult);
                    var record = new SqlDataRecord(columns);
    
                    pipe.SendResultsStart(record);
    
                    if (reader.Read())
                    {
                        lastLicenseNumber = reader.GetInt32(0);
    
                        do
                        {
                            licenseNumber = reader.GetInt32(0);
                            ticketAmount = reader.GetDecimal(2);
    
                            if (licenseNumber != lastLicenseNumber)
                            {
                                runningTotal = 0m;
                                lastLicenseNumber = licenseNumber;
                            }
    
                            record.SetInt32(0, licenseNumber);
                            record.SetDateTime(1, reader.GetDateTime(1));
                            record.SetDecimal(2, ticketAmount);
                            record.SetDecimal(3, runningTotal += ticketAmount);
    
                            pipe.SendResultsRow(record);
                        }
                        while (reader.Read());
                    }
    
                    pipe.SendResultsEnd();
    
                }
            }
        }
    }
    
    • 12
  2. svtr
    2014-05-01T02:38:30+08:002014-05-01T02:38:30+08:00

    Eu nem preciso ver o plano de execução neste.

    A subconsulta correlacionada que você usa para calcular o total em execução causará uma "autojunção triangular", para cada linha, você obtém todos os predecessores de sua tabela de fatos e, portanto, uma contagem de linhas impressionante (pense nas linhas de n²).

    Se você quiser ajustar essa consulta, precisará reescrever o total acumulado de maneira mais eficiente. No SQL 2012 isso seria muito fácil, mas em 2008 você precisa ser um pouco mais criativo.

    No topo da minha cabeça, 2 opções seriam pré-agregar agrupadas por mês como uma primeira etapa e, em uma tabela temporária, atualizar o total em execução de forma iterativa ou usando um CTE recursivo. É um problema bastante comum, então 5 minutos no Google devem encontrar toneladas de postagens de blog com muito mais detalhes do que eu posso aqui.

    • 1

relate perguntas

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

  • Onde posso encontrar o log lento do mysql?

  • Como posso otimizar um mysqldump de um banco de dados grande?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve