AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 273599
Accepted
Adgezaza
Adgezaza
Asked: 2020-08-12 11:18:34 +0800 CST2020-08-12 11:18:34 +0800 CST 2020-08-12 11:18:34 +0800 CST

具有多个 OR 语句的查询的行与列 DB

  • 772

我了解列式数据库非常适合不使用很多字段进行查找的快速查询,但是如果您只使用 OR 语句怎么办?

例如,我想要所有具有 (Val A, Col A) OR (Val B, Col B) OR (Val C, Col C) OR...(Val N, Col N) 的记录

我希望我问的很清楚。

编辑:

查询 OR 语句看起来A = 1 OR B = 3 OR C = 6 ... OR N = 7

我这样做的原因是我会有一个行/记录,其中每个 col/字段都被加密,并且我希望所有与任何字段匹配的记录都可以进行聚类练习。这个查询每秒可以运行 100 次。

columnstore query-performance
  • 1 1 个回答
  • 191 Views

1 个回答

  • Voted
  1. Best Answer
    Joe Obbish
    2020-08-13T21:07:10+08:002020-08-13T21:07:10+08:00

    此答案中的示例是从 SQL Server 的角度编写的。重复这个问题,当 WHERE 子句是一系列 OR 语句时,您需要快速查询。查询将针对 4 到 20 个不同的列进行过滤,而您事先并不知道这些列。第一个查询可能如下所示:

    SELECT COUNT(*)
    FROM #Q273599
    WHERE ID1 = 1 OR ID2 = 2 OR ID4 = 4 OR ID5 = 5;
    

    第二个查询可能如下所示:

    SELECT COUNT(*)
    FROM #Q273599
    WHERE ID1 = 1 OR ID2 = 2 OR ID8 = 8 OR ID9 = 9 OR ID10 = 10;
    

    这对于关系数据库来说仍然是一个难题,具体取决于表的大小和所需的查询响应时间。最快的方法可能是在每一列上定义一个单列索引,并使用带有查询优化器的 RDBMS,该查询优化器能够找到一个索引联合计划。从存储、容量限制或 DML 开销的角度来看,为每一列创建索引可能是不切实际的。

    一般来说,可以公平地说,对于这种类型的查询,列存储比行存储更好。Microsoft 列出了一个类似的问题(最终用户在房地产网站上通过数百个不同的过滤器进行搜索)作为列存储有效性的一个很好的案例研究。我认为这就像您要扫描整个表一样简单,您不妨扫描一个较小的表,因为与行存储相比,列存储提供的压缩通常更好。与行存储相比,不需要表中的所有列当然会使列式存储更具吸引力。

    如果您真的关心性能,我建议您模拟一些示例数据并尝试一下。对于下面的表和查询,我最终得到了 4 秒的行存储查询响应时间、1 秒的列存储响应时间和 13 毫秒的所有列都被索引的响应时间。这只是说明一般观点的一个例子。您的数据是问题的重要组成部分。

    CREATE TABLE #Q273599 (
        ID1 BIGINT NOT NULL,
        ID2 BIGINT NOT NULL,
        ID3 BIGINT NOT NULL,
        ID4 BIGINT NOT NULL,
        ID5 BIGINT NOT NULL,
        ID6 BIGINT NOT NULL,
        ID7 BIGINT NOT NULL,
        ID8 BIGINT NOT NULL,
        ID9 BIGINT NOT NULL,
        ID10 BIGINT NOT NULL,
        PADDING CHAR(500) NOT NULL
    );
    
    
    INSERT INTO #Q273599 WITH (TABLOCK)
    SELECT q.RN, RN, RN, RN, RN, RN, RN, RN, RN, RN, ''
    FROM
    (
        SELECT TOP (25000000) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) RN
        FROM master..spt_values t1
        CROSS JOIN master..spt_values t2
        CROSS JOIN master..spt_values t3
    ) q;
    
    SELECT COUNT_BIG(*)
    FROM #Q273599
    WHERE ID1 = 1 OR ID2 = 2 OR ID4 = 4 OR ID5 = 5 OR ID6 = 6 OR ID7 = 7 OR ID9 = 9 OR ID10 = 9999999999999
    OPTION (MAXDOP 1);
    
    • 3

相关问题

  • 构建 ColumnStore 索引会占用系统资源

  • 如何在 mongodb 2.8 的 WiredTiger 引擎中创建列组?

  • 选择满足 n 个外键条件的行

  • 这种类型的查询的名称是什么,一个有效的例子是什么?

  • TOP 如何(以及为什么)影响执行计划?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve