AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 316619
Accepted
AJ AJ
AJ AJ
Asked: 2022-09-09 05:03:19 +0800 CST2022-09-09 05:03:19 +0800 CST 2022-09-09 05:03:19 +0800 CST

如何仅删除数组中相邻的重复项?

  • 772

在聚合一个数组时,我需要删除空字符串,然后组合所有相邻的相同值。例如:

["","product","product","","product","","product","product","","product","product","","product","","","collection","product","","","product","product","","collection","order","checkout",""]

应该变成:

["product","collection","product","collection","order","checkout"]

我有一个带有 4 个嵌套选择的工作查询:

SELECT array_agg( page_type_unique_pre) FILTER (WHERE page_type_unique_pre != '')
                                        OVER   (ORDER BY event_time) AS page_type_journey_unique

FROM  (
   SELECT CASE WHEN lag(last_page_type) OVER (ORDER BY event_time) LIKE '%' || page_type || '%' THEN ''
               ELSE page_type END AS page_type_unique_pre
        , page_type
        , event_time
   FROM  (
      SELECT string_agg(page_type, ',') OVER (ORDER BY event_time) AS page_type_journey
           , first_value(page_type) OVER (PARTITION BY last_page_type_partition ORDER BY event_time) AS last_page_type
           , page_type
           , event_time
      FROM  (
         SELECT
         sum(CASE WHEN page_type IS NULL OR page_type = ''  THEN 0 ELSE 1 END) OVER (ORDER BY event_time) AS last_page_type_partition,
         page_type,
         event_time
         FROM (
            SELECT * FROM tes
            ) a
         ) b
      ) c
   ) d;

请参阅此小提琴中的测试用例。

我确定有更好的方法来实现这一目标吗?

postgresql aggregate
  • 2 2 个回答
  • 44 Views

2 个回答

  • Voted
  1. Best Answer
    Erwin Brandstetter
    2022-09-10T18:14:13+08:002022-09-10T18:14:13+08:00

    单个子查询应该这样做:

    SELECT ARRAY (
       SELECT page_type
       FROM  (
          SELECT event_time, page_type
               , lag(page_type, 1, '') OVER (ORDER BY event_time) AS last_page_type
          FROM   tes
          WHERE  page_type <> ''
          ) sub
       WHERE  page_type <> last_page_type
       ORDER  BY event_time
       )
     AS page_type_journey_unique;
    

    小提琴

    立即消除 null 和空字符串WHERE page_type <> ''。看:

    • 检查“空值或空值”的最佳方法

    然后page_type使用窗口函数获取上一个,默认lag()放置。''这种方式last_page_type永远不可能null(并且空字符串''在刚刚被消除后不会与现有值发生冲突)。看:

    • 在 PostgreSQL 中查找集合之间的所有行

    因此,我们可以在外部使用普通的<>(不是更昂贵的)来识别具有新页面类型的行。IS DISTINCT FROMSELECT

    将结果集提供给 ARRAY 构造函数。最简单最便宜的。看:

    • 为什么 array_agg() 比非聚合 ARRAY() 构造函数慢?
    • 1
  2. Charlieface
    2022-09-11T21:04:32+08:002022-09-11T21:04:32+08:00

    如前所述,您似乎可以只使用LAG窗口函数,并结合数组聚合。

    如果您想在合并重复项之前和之后查看,可以使用ARRAY_AGG带有和不带有 a 的聚合FILTER

    SELECT
      ARRAY_AGG(tes.page_type ORDER BY tes.event_time)
          FILTER (WHERE tes.page_type <> tes.last_page_type) AS consecutives_combined,
      ARRAY_AGG(tes.page_type ORDER BY tes.event_time) AS all_values
    FROM (
        SELECT
          *,
          LAG(page_type, 1, '') OVER (ORDER BY tes.event_time) AS last_page_type
        FROM tes
        WHERE tes.page_type <> ''
    ) tes;
    

    db<>小提琴

    • 0

相关问题

  • 我可以在使用数据库后激活 PITR 吗?

  • 运行时间偏移延迟复制的最佳实践

  • 存储过程可以防止 SQL 注入吗?

  • PostgreSQL 中 UniProt 的生物序列

  • PostgreSQL 9.0 Replication 和 Slony-I 有什么区别?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve