SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

carlo.borreo

Asked: 2015-11-24 03:44:28 +0800 CST2015-11-24 03:44:28 +0800 CST 2015-11-24 03:44:28 +0800 CST

Datas efetivas, requisitos complexos

772

Tenho uma mesa com, digamos, cores preferidas. Para cada pessoa, armazenamos a cor favorita e a data efetiva. Se a pessoa mudar de preferência, armazenamos a nova com uma data efetiva mais recente. Exemplo:

name   color   eff_date
John   Green   2014-03-07
Luis   Red     2014-03-07
Luis   Yellow  2015-05-02
Nina   Blue    2015-07-06

Se quisermos pegar a cor preferida atual de Luis:

SELECT color
  FROM fav_colors
 WHERE name='Luis'
   AND eff_date=( SELECT max(eff_date) FROM fav_colors WHERE name='Luis' )

Agora decidimos que as pessoas podem mudar sua cor favorita a qualquer momento, mas a mudança só será efetivada a partir de 1º de janeiro. Portanto, mesmo que Luis tenha inserido um registro que diga que sua cor favorita é Amarelo, a consulta deve retornar o valor antigo (Vermelho) até 1º de janeiro de 2016.

SELECT color
  FROM fav_colors
 WHERE name='Luis'
   AND eff_date=( SELECT max(eff_date) FROM fav_colors WHERE name='Luis' and eff_date < '1 jan 2015' )

Esta consulta parece ok, mas não retornará nenhum registro para Nina. As regras dizem que um recém-chegado pode escolher a cor favorita imediatamente, sem esperar pelo próximo dia 1º de janeiro. Em outras palavras, "se possível, faça um registro de 1º de janeiro ou antes; se não for possível, qualquer registro; leve o mais recente". Isto é o que eu consegui escrever:

SELECT color
  FROM fav_colors
 WHERE name='Luis'
   AND eff_date= ISNULL(
       ( SELECT max(eff_date) FROM fav_colors WHERE name='Luis' and eff_date < '1 jan 2015' ),
       ( SELECT max(eff_date) FROM fav_colors WHERE name='Luis' )
       )

Existe uma maneira mais elegante ou mais eficiente de obter esse resultado?

Não tenho controle sobre a estrutura das tabelas, elas são da PeopleSoft.

Se Nina fez duas seleções este ano, quero mostrar a mais recente.

4 respostas

Voted

Rob Farley · Answer 1 · 2015-11-24T04:54:35+08:00

Rob Farley

2015-11-24T04:54:35+08:002015-11-24T04:54:35+08:00

Eu explico como fazer isso aqui: http://blogs.lobsterpot.com.au/2014/07/08/ssis-lookup-transformation-in-t-sql/

O conceito básico é usar OUTER APPLY com TOP (1). No seu caso, pode ser necessário começar com a lista de pessoas que você está procurando. Assim:

SELECT p.Person, ISNULL(c1.color, c2.color) AS color
FROM (VALUES ('Nina')) AS p(Person)
OUTER APPLY 
    (SELECT TOP (1) f.color
    FROM fav_colors AS f
    WHERE f.name = p.Person
    AND f.eff_date <= @date
    ORDER BY f.eff_date DESC) c1
OUTER APPLY
   (SELECT TOP (1) f.color
    FROM fav_colors AS f
    WHERE f.name = p.Person
    AND c1.color IS NULL
    ORDER BY f.eff_date ASC) c2

A postagem detalha como o Query Optimizer só fará a segunda pesquisa se a primeira falhar. É realmente muito eficiente com o índice correto no lugar (em (name, eff_date) include (color)).

Oh - se a cor puder ser NULL legitimamente, teste uma coluna diferente na subconsulta c2.

4

ypercubeᵀᴹ · Answer 2 · 2015-11-24T04:50:57+08:00

Best Answer

ypercubeᵀᴹ

2015-11-24T04:50:57+08:002015-11-24T04:50:57+08:00

Você pode simplificar a primeira e a segunda consulta com TOP / ORDER BY:

SELECT TOP (1) color
  FROM fav_colors
 WHERE name='Luis'
   AND eff_date < '2015-01-01'
ORDER BY eff_date DESC ;

No entanto, não retornará nada para Nina. Você pode usar outra subconsulta e combiná-las com UNION ALLmais uma TOPou com COALESCE()(ou ISNULL()como na sua consulta):

SELECT color = COALESCE(
    ( SELECT TOP (1) color
        FROM fav_colors
       WHERE name='Luis'
         AND eff_date < '2015-01-01'
      ORDER BY eff_date DESC
    ),
    ( SELECT TOP (1) color
        FROM fav_colors
       WHERE name='Luis'
         AND eff_date >= '2015-01-01'
      ORDER BY eff_date ASC
    ) ) ;

Se você quiser fazer esta verificação para mais de uma (ou todas as) pessoas na mesa, você pode usar OUTER APPLY, como @RobFarley's explica em sua resposta .)

3

James Anderson · Answer 3 · 2015-11-24T05:04:40+08:00

Acho que você precisa alterar o tipo de dados da eff_datecoluna DATETIMEpara evitar problemas com pessoas fazendo duas ou mais seleções no mesmo dia.

A PostYearStart_MAX_eff_datecoluna no CTEtalvez deva ser alterada MINdependendo da sua resposta à minha pergunta nos comentários.

DECLARE @YearStart DATE = '2015-01-01', @Name NVARCHAR(50) = 'nina'

DECLARE @fav_colors TABLE
(
    name    NVARCHAR(50)
    ,color  NVARCHAR(25)
    ,eff_date   DATETIME -- DATETIME needed to differentitate between two or more selections made on the same day
)

INSERt INTO @fav_colors
SELECT 'John', 'Green', '2014-03-07'
UNION
SELECT  'Luis', 'Red', '2014-03-07'
UNION 
SELECT  'Luis', 'Yellow', '2015-05-02'
UNION
SELECT  'Nina', 'Blue', '2015-07-06';


WITH CTE_Colors
AS
(
    SELECT  name
            ,COUNT(1) AS SelectionCount
            ,MAX(eff_date) MAX_eff_date
            ,SUM(CASE WHEN eff_date < @YearStart THEN 1 ELSE 0 END) AS PreYearStartSelectionCount 
            ,MAX(CASE WHEN eff_date < @YearStart THEN eff_date ELSE '1900-01-01' END) AS PreYearStart_MAX_eff_date
            ,SUM(CASE WHEN eff_date >= @YearStart THEN 1 ELSE 0 END) AS PostYearStartSelectionCount 
            ,MAX(CASE WHEN eff_date >= @YearStart THEN eff_date ELSE '1900-01-01'  END) AS PostYearStart_MAX_eff_date

    FROM    @fav_colors

    WHERE   name = @Name

    GROUP BY name
)

SELECT      fc.color

FROM        @fav_colors fc
LEFT JOIN   CTE_Colors cte ON fc.name = cte.name

WHERE       CASE 
                WHEN SelectionCount = 1
                THEN MAX_eff_date
                WHEN PreYearStartSelectionCount > 0 
                THEN PreYearStart_MAX_eff_date
                WHEN PostYearStartSelectionCount > 0    
                THEN PostYearStart_MAX_eff_date                 
            END = fc.eff_date

Stoleg · Answer 4 · 2015-11-24T06:52:20+08:00

Stoleg

2015-11-24T06:52:20+08:002015-11-24T06:52:20+08:00

Seu problema vem do fato de você estar misturando/usando a mesma coluna para dois tipos de informação:

Escolha feita / data de entrada de dados
Data efetiva - quando aplicar a escolha de

Para tornar seu modelo de dados mais elegante e dar mais liberdade, considere adicionar a coluna "Data atualizada". Em seguida, você pode preenchê-lo com as informações da coluna "Data efetiva" que está usando agora. Ao mesmo tempo, a coluna "Data Efetiva" presente conterá a Data Efetiva real, por exemplo, 1º de janeiro de 2015.

0

Datas efetivas, requisitos complexos

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Datas efetivas, requisitos complexos

4 respostas

relate perguntas