我尝试以更复杂的方式使用Describe 表,例如与其他表连接或其他 sql 操作。
另一方面,雪花似乎不接受描述表作为子查询。
例如,这是产生语法错误
select * from (DESC TABLE my_table) // syntax error line 1 at position 12 unexpected 'TABLE'.
有没有办法做到这一点?
(使用 information_schema 不是一个选项,因为它太慢了)
我尝试以更复杂的方式使用Describe 表,例如与其他表连接或其他 sql 操作。
另一方面,雪花似乎不接受描述表作为子查询。
例如,这是产生语法错误
select * from (DESC TABLE my_table) // syntax error line 1 at position 12 unexpected 'TABLE'.
有没有办法做到这一点?
(使用 information_schema 不是一个选项,因为它太慢了)
我想找出在 P 小时内花费超过 D 美元的客户。假设 D=10 美元,P=48。然后在下面的交易数据中:
CUSTOMER STAMP AMOUNT
-------- ----- ------
A 2021-06-02 00:22:53 1.44
A 2021-06-02 06:24:17 1.51
A 2021-06-03 07:09:45 2.73
A 2021-06-03 15:57:30 3.92
A 2021-06-04 06:41:21 1.83
B 2021-06-01 02:50:22 2.65
B 2021-06-03 07:01:36 4.05
B 2021-06-04 05:20:10 3.30
B 2021-06-04 09:53:53 2.64
B 2021-06-04 14:54:00 2.26
C 2021-06-01 16:01:38 2.61
C 2021-06-01 23:38:25 1.16
C 2021-06-02 14:41:02 2.82
C 2021-06-03 00:28:37 1.54
C 2021-06-03 02:06:46 1.19
C 2021-06-04 17:16:29 2.05
客户 B 符合标准,客户 A 和 C 不符合(即使他们的总支出 > 10 美元)。
我知道如何使用窗口函数,但在这种情况下,我事先不知道窗口应该有多大。
我认为答案是这样的:
select
customer
, stamp
, amount
, amount > coalesce(sum(amount) over (order by extract('epoch_second', stamp)
range between 2*24*60*60 preceding and current row), 0) as is_alert
from t
where amount is not null
order by stamp
但我的数据库是雪花,它似乎不支持这种语法。该页面说:
对于累积窗口框架: ... RANGE 类似于 ROWS,除了它只计算与当前行具有相同值的行的结果(根据指定的 ORDER BY 子句)。
我目前正在使用具有以下表结构的数据集
create or replace TABLE FACT_TBL_PRODUCTSUPPLIER (
DATEID NUMBER(18,0) NOT NULL,
PRODUCTNUMBER NUMBER(38,0) NOT NULL,
SUPPLIERNUMBER NUMBER(38,0) NOT NULL
);
示例数据集:
DATEID PRODUCTNUMBER SUPPLIERNUMBER
2019-07-06 555 1234
2019-07-06 343 545
2019-07-10 555 8888
2019-07-16 555 1234
2019-08-01 555 1234
2019-09-15 555 6666
我试图将产品编号与供应商编号保持联系,直到产品被另一家供应商接管。当产品确实被接管时,我应该再为产品添加 30 天,以便它保持链接。
预期输出:
DATEID END_DATEID PRODUCTNUMBER SUPPLIERNUMBER
2019-07-06 2019-08-07 555 1234
2019-07-06 2020-02-06 343 545
2019-07-10 2019-08-13 555 8888
2019-07-16 2019-08-29 555 1234
2019-08-01 2019-10-13 555 1234
2019-09-15 2020-02-06 555 6666
到目前为止,我已经尝试了以下选项:
select td.dateid,
LEAD(DATEADD(day, +28, dateid)) OVER(ORDER BY dateid) AS EndDate,
productnumber, ps.suppliernumber,
from FACT_TBL_PRODUCTSUPPLIER PS
select
distinct dateid,
coalesce(
dateid,
lag(dateid, 1) over(
partition by
productnumber,
suppliernumber
order by
dateid asc
)
) as dateid,
dateadd(
'day',
28,
coalesce(
lead(dateid) over(
partition by
productnumber,
suppliernumber
order by
dateid asc
),
current_date()
)
) end_dateid,
productnumber,
suppliernumber
from
FACT_TBL_PRODUCTSUPPLIER;
如果没有人接管产品编号,则已分配产品的当前供应商应该能够看到它。
我想做的是在有人接管之前应该向供应商展示产品。当有人接管时,结束日期将额外显示 28 天。如果没有人接管特定产品,则供应商应该能够无限期地看到它,例如当前日期。