AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / user-143117

jamesmstone's questions

Martin Hope
jamesmstone
Asked: 2020-06-08 18:57:27 +0800 CST

时间序列索引范围包含运算符(反向)

  • 2

您好我正在尝试优化时间戳范围包含<@对 Postgres 12 的查询

我已经阅读了一些postgres 文档 ,发现只有 GiST 和 SP-GiST 索引支持这个运算符。但是,我不能添加其中之一(我想我需要在心率表中添加一个 - 请参阅下面的模式,但这不是范围类型......)。

我的问题与这个问题和这个问题类似,这也表明我需要一个 GiST 索引。但是,它们是相反的,例如,它们具有单个时间戳并希望从tsrange包含所有记录的表中返回的列。我有一个时间戳表,想将它加入到一个 tsranges 表中

对于我的模式的一些背景信息,我在真实数据集中采样了约 1/3 秒的心率集合,以及我听过的歌曲列表以及何时听过的歌曲。我想查询诸如

  • avg(heartrate)对于一个特定的track 和artist
  • avg(heartrate)对于一个特定的artist
  • 等等

架构

create table heartrate (
    "time"  timestamp primary key ,
    value float
)
;

CREATE INDEX ON heartrate ("time", value);
-- CREATE INDEX ON heartrate USING GIST ("time", value); can't do as "time" is not a range column.
-- one gets the following error: 
--- ERROR: data type timestamp without time zone has no default operator class for access method "gist" Hint: You must specify an operator class for the index or define a default operator class for the data type.


create table song_play(
    track       TEXT      NOT NULL,
    artist      TEXT      NOT NULL,
    play        tsrange not null
)
;
CREATE INDEX ON song_play(track, artist);


INSERT INTO heartrate("time", value)
SELECT d, 60+60*random()
FROM   generate_series('2015-01-01 00:00:00'::timestamp, '2020-01-01 00:00:00'::timestamp, '5 min'::interval)  d
;

INSERT INTO song_play(track,artist, play)
SELECT case when random() > 0.5 then 'a' when random() > 0.5 then 'b' else 'c' end 
, case when random() > 0.5 then 'a' when random() > 0.5 then 'b' else 'c' end
, tsrange(d, d+ (((random()*3+1)::text|| 'min')::interval))
FROM   generate_series('2015-01-01 00:00:00'::timestamp, '2020-01-01 00:00:00'::timestamp, '1 day'::interval)  d
;

EXPLAIN  SELECT sp.track, sp.artist, avg(h.value) FROM song_play sp left join heartrate h ON h.time <@ sp.play where sp.track='a' and sp.artist='b' GROUP BY sp.track, sp.artist;

结果如下:

✓

✓

✓

✓

525889 行受影响

1827 行受影响

| 查询计划 |
| :------------------------------------------------ -------------------------------------------------- ------ |
| GroupAggregate(成本=0.28..14689.24 行=1 宽度=72)|
| 组键:sp.track、sp.artist |
| -> 嵌套循环左连接(成本=0.28..14685.28 行=526 宽度=72)|
| 加入过滤器:(h."time" <@ sp.play) |
| -> 使用 song_play sp 上的 song_play_track_artist_idx 进行索引扫描(成本=0.28..8.29 行=1 宽度=96)|
| 索引条件: ((track = 'a'::text) AND (artist = 'b'::text)) |
| -> 对心率 h 进行 Seq 扫描(成本=0.00..8102.55 行=525955 宽度=16)|

注意:上述计划导致对最大的表心率表进行全序列扫描 - 一点也不理想!

然后我决定创建以下函数,看看它是否有助于加快查询速度。它将范围例如转换tsrange('2020-01-01 00:00:00', '2020-01-02 00:00:00')为条件查询,例如field >= 2020-01-01 00:00:00 and field < '2020-01-02 00:00:00'。

本质上与<@contains 运算符相同。

它似乎工作!虽然这仅有助于查找特定song_play的心率……但并非所有track/artist的song_play心率

CREATE OR REPLACE FUNCTION range_to_conditional(range anyrange, field text)
    RETURNS text
    LANGUAGE SQL
    IMMUTABLE STRICT AS
$$
SELECT case
           when isempty(range) then 'false'
           when upper_inf(range) and lower_inf(range) then 'true'
           when upper_inf(range) then case
                                          when lower_inc(range) then format(' %L <= %I ', lower(range), field)
                                          else format(' %L < %I ', lower(range), field)
               end
           when lower_inf(range) then case
                                          when upper_inc(range) then format(' %L >= %I ', upper(range), field)
                                          else format(' %L > %I ', upper(range), field)
               end
           else
               case
                   when lower_inc(range) and upper_inc(range)
                       then format(' %1$L <= %3$I AND %2$L >= %3$I ', lower(range), upper(range), field)
                   when lower_inc(range)
                       then format(' %1$L <= %3$I AND %2$L > %3$I ', lower(range), upper(range), field)
                   when upper_inc(range)
                       then format(' %1$L < %3$I AND %2$L >= %3$I ', lower(range), upper(range), field)
                   else format(' %1$L < %3$I AND %2$L > %3$I ', lower(range), upper(range), field)
                   end
           end
$$


;


create function avg_heartrate(sp song_play)
returns double precision as $$
DECLARE
    retval double precision ;
BEGIN
    EXECUTE format('select avg(h.value) from heartrate h where %s',  range_to_conditional(sp.play, 'time'))
    INTO STRICT retval;
    RETURN retval;
END
$$
    LANGUAGE plpgsql stable;

SELECT sp.track, sp.artist, sp.play, avg_heartrate(sp) from song_play sp where  sp.track='a' and sp.artist='b' limit 10;
✓

✓

跟踪 | 艺术家 | 玩 | avg_heartrate     
:---- | :----- | :------------------------------------------------ -- | :-----------------
一个 | 乙 | ["2015-01-03 00:00:00","2015-01-03 00:03:42.413608") | 78.93074469582096
一个 | 乙 | ["2015-01-10 00:00:00","2015-01-10 00:01:32.299356") | 83.89127804586359
一个 | 乙 | ["2015-01-11 00:00:00","2015-01-11 00:03:24.722083") | 62.333722293527885
一个 | 乙 | ["2015-01-19 00:00:00","2015-01-19 00:01:14.845757") | 77.65872734128969
一个 | 乙 | ["2015-01-30 00:00:00","2015-01-30 00:01:40.991165") | 102.88233680407437
一个 | 乙 | ["2015-02-06 00:00:00","2015-02-06 00:03:51.264716") | 70.34797302970127
一个 | 乙 | ["2015-02-13 00:00:00","2015-02-13 00:01:23.358657") | 62.91734005187344
一个 | 乙 | ["2015-02-25 00:00:00","2015-02-25 00:02:04.856602") | 115.45533419257616
一个 | 乙 | ["2015-02-28 00:00:00","2015-02-28 00:02:46.800728") | 117.39846990343175
一个 | 乙 | ["2015-03-18 00:00:00","2015-03-18 00:02:54.893186") | 68.1618921408235  

db<>在这里摆弄

谢谢!

postgresql postgresql-performance
  • 1 个回答
  • 187 Views
Martin Hope
jamesmstone
Asked: 2020-01-29 18:42:54 +0800 CST

在 Postgres 中刷新存储的生成列

  • 2

如何在 PostgreSQL 中刷新存储的生成列的值。

例子

CREATE TABLE people (
    first_name TEXT,
    last_name TEXT


);

CREATE OR REPLACE FUNCTION name(people) RETURNS text AS
$$
SELECT $1.first_name || ' ' || $1.last_name
$$ LANGUAGE SQL STRICT
                IMMUTABLE
        ;

alter table people add column   full_name text GENERATED ALWAYS AS (name(people)) STORED;

insert into people(first_name, last_name) values('John', 'Smith');

select full_name, full_name='John Smith' as pass from people;

如果需要更改用于生成存储列值的函数,在这种情况下name,您如何要求 postgres 重新计算这些字段。

例如。


CREATE OR REPLACE FUNCTION name(people) RETURNS text AS
$$
SELECT $1.first_name || ' ' || $1.last_name  ||  ' function change'
$$ LANGUAGE SQL STRICT
                IMMUTABLE
        ;


 -- refresh generated column here

select full_name, full_name='John Smith function change' as pass from people;

抱歉,这是一个有点奇怪的例子。

小提琴

postgresql computed-column
  • 1 个回答
  • 1134 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve