Existem algumas perguntas semelhantes a esta (por exemplo, https://dba.stackexchange.com/questions/72419/filling-in-missing-dates-in-record-set-from-generate-series), mas a solução não parece funcionar no meu caso... Basicamente, estou tentando gerar entradas zero para datas não presentes em uma série, mas suspeito que o problema seja que estou tendo que extrair o valor da data de um registro de data e hora? Uso SQL há anos, mas sou muito novo no postgres - impressionado até agora, no entanto... Tentei uma junção à esquerda e à direita aqui, mas sem sucesso...
Aqui está um pequeno caso de teste (ainda é recomendável mexer em SQL?):
-- temp test table - works as expected
WITH incomplete_data(payment_date, payment_id) AS (
VALUES
('2024-09-06 11:26:57.509429+01'::timestamp with time zone, 'uuid01')
,('2024-09-06 12:26:57.509429+01', 'uuid02')
,('2024-09-07 07:26:57.509429+01', 'uuid03')
,('2024-09-08 10:26:57.509429+01', 'uuid05')
,('2024-09-08 12:26:57.509429+01', 'uuid08')
,('2024-09-08 14:26:57.509429+01', 'uuid11')
,('2024-09-10 09:26:57.509429+01', 'uuid23')
)
select * from incomplete_data;
-- generated dates - work as expected
select * FROM (
SELECT generate_series(timestamp '2024-01-01'
, timestamp '2024-01-01' + interval '1 year - 1 day'
, interval '1 day')::date
) d(day)
;
-- join - failing to do what I was hoping..
WITH incomplete_data(payment_date, payment_id) AS (
VALUES
('2024-09-06 11:26:57.509429+01'::timestamp with time zone, 'uuid01')
,('2024-09-06 12:26:57.509429+01', 'uuid02')
,('2024-09-07 07:26:57.509429+01', 'uuid03')
,('2024-09-08 10:26:57.509429+01', 'uuid05')
,('2024-09-08 12:26:57.509429+01', 'uuid08')
,('2024-09-08 14:26:57.509429+01', 'uuid11')
,('2024-09-10 09:26:57.509429+01', 'uuid23')
)
select count(payment_id), date_trunc('day',payment_date)::date as time
FROM (
SELECT generate_series(timestamp '2024-01-01'
, timestamp '2024-01-01' + interval '1 year - 1 day'
, interval '1 day')::date
) d(day)
right JOIN incomplete_data p ON date_trunc('day',payment_date) = d.day
where payment_date BETWEEN '2024-09-01T12:55:36.824Z' AND '2024-09-30T13:55:36.824Z'
GROUP BY date_trunc('day',payment_date)
ORDER BY date_trunc('day',payment_date);
count | time
-------+------------
2 | 2024-09-06
1 | 2024-09-07
3 | 2024-09-08
1 | 2024-09-10
(4 rows)
Eu esperava obter uma linha para cada dia do mês com zeros para dias não preenchidos. O pano de fundo é que isso é para preencher uma consulta grafana.
Alguém pode sugerir o que estou fazendo errado ou estou falhando em entender um problema maior aqui? Minha versão é:PostgreSQL 15.9 (Debian 15.9-1.pgdg120+1) on x86_64-pc-linux-gnu, compiled by gcc (Debian 12.2.0-14) 12.2.0, 64-bit
ATUALIZAÇÃO
A resposta de jjanes abaixo ajudou a esclarecer a sequência de junção e filtragem para mim - esta é a seleção necessária:
WITH incomplete_data(payment_date, payment_id) AS (
VALUES
('2024-09-06 11:26:57.509429+01'::timestamp with time zone, 'uuid01')
,('2024-09-06 12:26:57.509429+01', 'uuid02')
,('2024-09-07 07:26:57.509429+01', 'uuid03')
,('2024-09-08 10:26:57.509429+01', 'uuid05')
,('2024-09-08 12:26:57.509429+01', 'uuid08')
,('2024-09-08 14:26:57.509429+01', 'uuid11')
,('2024-09-10 09:26:57.509429+01', 'uuid23')
)
select count(payment_id), d.day as time
FROM (
SELECT generate_series(timestamp '2024-01-01'
, timestamp '2024-01-01' + interval '1 year - 1 day'
, interval '1 day')::date
) d(day)
left JOIN incomplete_data p ON date_trunc('day',payment_date) = d.day
where d.day BETWEEN '2024-09-01T12:55:36.824Z' AND '2024-09-30T13:55:36.824Z'
GROUP BY d.day
ORDER BY d.day
;