AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 190167
Accepted
kezsto
kezsto
Asked: 2017-11-06 18:24:36 +0800 CST2017-11-06 18:24:36 +0800 CST 2017-11-06 18:24:36 +0800 CST

具有开始和结束日期时间列的事件表的 MySQL 分区

  • 772

我很好奇有什么解决方案可以对记录事件的表进行分区,既可以进行高效查询,又可以在截断数据时发挥修剪的优势。

假设我有一个简单的表来记录来自不同位置的事件:

tblEvents (
  event_id,
  location_id,
  start_datetime,
  end_datetime
)

此表上的大多数查询将采用以下形式:

SELECT    event_id
FROM      tblEvents
WHERE     location_id = @queried_location_id
AND       start_datetime < @queried_end_datetime
AND       end_datetime > @queried_start_datetime

迄今为止,我已经按 location_id 进行了分区,并且只是对日期时间列进行了索引。就性能而言,这已经足够了,而且我从来没有计划在数据库中保留超过几个月的数据,所以它似乎也是面向未来的。

当我实际从这个表中清除数据时出现了问题(它非常大并且还涉及复制)。事实证明,使用DELETE FROM tblEvents WHERE start_datetime < @some_date非常慢,并且会在其他客户端发出请求时产生问题(不足为奇)。

按任一日期时间列进行分区都不好。虽然它解决了我的数据清除问题,但它使上面的查询效率低下,因为它仍然需要根据查询的日期查看多个分区。

我在这里缺少一个通用的解决方案吗?有没有更有效的方法来清除我的数据?还是有一种我错过的更智能的分区/索引方法?

mysql index
  • 1 1 个回答
  • 758 Views

1 个回答

  • Voted
  1. Best Answer
    Rick James
    2017-11-07T09:19:24+08:002017-11-07T09:19:24+08:00

    给定位置的时间范围是否重叠?

    如果需要删除where的所有行start_datetime < @some_date,那么最好的办法是通过PARTITIONingbased on start_datetime。使用PARTITION BY RANGE(TO_DAYS(start_datetime))它并基于几天、几周或几个月,这样你就有大约 20-50 个分区。查看详情。

    方案A:

    一旦你以这种方式分区,然后按此顺序拥有PRIMARY KEYbe 。如果这 3 列不足以成为唯一的,并且,比如说,你有,那么这样做:(location_id, end_datetime, start_datetime)id AUTO_INCREMENT

    PRIMARY KEY(location_id, end_datetime, start_datetime, id),
    INDEX(id)
    

    现在我们来分析

    WHERE     location_id = @queried_location_id
    AND       start_datetime < @queried_end_datetime
    AND       end_datetime > @queried_start_datetime
    

    发生以下步骤:

    1. 基于start_datetime. 这可能会或可能不会有多大帮助,具体取决于“开始”的新程度。平均(?),它将消除一半的分区(没有太大好处)。
    2. 使用 PK,它将找到合适location_id的和end_datetime.
    3. 在数据中向前扫描(因为 PK 与数据“聚集”在一起),检查其余的 location_ids 是否匹配。
    4. 对步骤 1 未修剪的每个分区重复
    5. 合并分区的结果。

    B计划:

    如果您的开始..结束范围主要是最近的日期,并且如果您可以基于 清除end_datetime,那么这可能会更好,因为它主要关注最后一个分区:

    PARTITION BY RANGE(TO_DAYS(end_datetime))
    
    PRIMARY KEY(location_id, start_datetime, end_datetime, id),
    INDEX(id)
    

    如果范围不重叠,则折叠可能会显着提高性能。

    但是......如果end_datetime是NULL最初,这会将行放入“第一个”分区。所以...确保在开始时有一个额外的分区 - 否则DROP用于清除旧记录的将错误地扔掉它们。也就是说,第一个范围是VALUES LESS THAN (0)。然后让第二个范围成为最旧的月份(或周或其他),并删除它以进行清除。

    另一个问题NULL- 当您执行 set 时end_datetime,必须将记录从一个分区移动到另一个分区,从而使该UPDATE语句的成本有些高。(它实际上是一个DELETE加号INSERT。)因此,我不推荐非常活跃的计划 B。

    • 2

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve