Quero identificar clientes que gastaram mais de D dólares em um período de P horas. Suponha que D=$10 e P=48. Em seguida, nos dados da transação abaixo:
CUSTOMER STAMP AMOUNT
-------- ----- ------
A 2021-06-02 00:22:53 1.44
A 2021-06-02 06:24:17 1.51
A 2021-06-03 07:09:45 2.73
A 2021-06-03 15:57:30 3.92
A 2021-06-04 06:41:21 1.83
B 2021-06-01 02:50:22 2.65
B 2021-06-03 07:01:36 4.05
B 2021-06-04 05:20:10 3.30
B 2021-06-04 09:53:53 2.64
B 2021-06-04 14:54:00 2.26
C 2021-06-01 16:01:38 2.61
C 2021-06-01 23:38:25 1.16
C 2021-06-02 14:41:02 2.82
C 2021-06-03 00:28:37 1.54
C 2021-06-03 02:06:46 1.19
C 2021-06-04 17:16:29 2.05
o cliente B atende aos critérios e os clientes A e C não (mesmo que seus gastos totais > $ 10).
Eu sei como usar funções de janelas, mas neste caso não sei de antemão o tamanho da janela.
Acho que a resposta seria algo assim:
select
customer
, stamp
, amount
, amount > coalesce(sum(amount) over (order by extract('epoch_second', stamp)
range between 2*24*60*60 preceding and current row), 0) as is_alert
from t
where amount is not null
order by stamp
mas meu banco de dados é Snowflake e não parece oferecer suporte a essa sintaxe . Essa página diz:
Para frames de janela cumulativos: ... RANGE é semelhante a ROWS, exceto que apenas calcula o resultado para linhas que têm o mesmo valor que a linha atual (de acordo com a subcláusula ORDER BY especificada).