我希望您能帮助解释这种行为或尝试重现该问题,以便我可以自信地提交错误报告。
本质上,我从这些查询中得到不同的结果:
# returns 0
select count(*) as COUNT_WITH_INDEX
from a
where id = 1 and begin_time='2018-11-04 01:01:00.000';
# returns 1
select count(*) as COUNT_WITHOUT_INDEX
from a ignore index (PRIMARY)
where id = 1 and begin_time='2018-11-04 01:01:00.000';
主要区别在于使用ignore index (PRIMARY)
.
如果您没有立即知道该日期,则该日期属于“美国/中部”时区夏令时转换的“落后”时间。2018 年 11 月 4 日凌晨 1:01 发生了两次。我只发现这个窗口中的时间戳有问题,所以我怀疑它是如何应用 DST 规则的错误。
无论我是否需要使用正确获取我想要的日期,仍然存在使用和不使用键索引convert_tz()
我得到不同结果的事实。PRIMARY
完整的测试用例:
create database if not exists test_dt;
use test_dt;
drop table if exists a;
CREATE TABLE `a` (
`id` int(11) NOT NULL,
`begin_time` timestamp(3) NOT NULL DEFAULT '0000-00-00 00:00:00.000',
PRIMARY KEY (`id`,`begin_time`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
set TIME_ZONE='+0:00';
insert into a values(1, '2018-11-04 06:01:00.000');
insert into a values(1, '2018-11-04 07:01:00.000');
set TIME_ZONE='US/Eastern';
select * from a;
# returns 0
select count(*) as COUNT_WITH_INDEX
from a
where id = 1 and begin_time='2018-11-04 01:01:00.000';
# returns 1
select count(*) as COUNT_WITHOUT_INDEX
from a ignore index (PRIMARY)
where id = 1 and begin_time='2018-11-04 01:01:00.000';
set TIME_ZONE='US/Central';
# repeat w/ Central if you like
旁注:安装时区数据以使用命名时区。
在:: CentOS 7 w/ 5.6.36 和 5.6.43 上测试。我手边没有 5.7 或 8.0 安装。
另一个旁注:我遇到的最初问题是父子表之间的连接没有返回具有复合 PK(id、时间戳)的数据。由于时间戳以 UTC 格式存储,我认为 DST 日期不会成为问题,但我在这里。
你对这种行为有解释吗?你认为这是一个错误吗?
谢谢!
编辑 每个评论的附加信息
如果你丢掉pk,你会得到什么结果?
set TIME_ZONE='+0:00';
insert into a values(1, '2018-11-04 06:01:00.000');
insert into a values(1, '2018-11-04 07:01:00.000');
select * from a ;
select 'Set time_zone=US/Central' as msg;
set TIME_ZONE='US/Central';
+------------------+
| COUNT_WITH_INDEX |
+------------------+
| 1 |
+------------------+
1 row in set (0.00 sec)
drop index `primary` on a;
select count(*) as COUNT_DROPPED_PK
from a
where id = 1 and begin_time='2018-11-04 01:01:00.000';
+------------------+
| COUNT_DROPPED_PK |
+------------------+
| 2 |
+------------------+
1 row in set (0.00 sec)
set TIME_ZONE='+0:00';
select * from a;
+----+-------------------------+
| id | begin_time |
+----+-------------------------+
| 1 | 2018-11-04 06:01:00.000 |
| 1 | 2018-11-04 06:01:00.000 |
+----+-------------------------+
注意如果我将 TZ 更改为 US/Central,删除 PK,然后将 TZ 设置回“+0:00”,我可以看到数据被搞砸了。两条记录都是06:01
时间,当一个被插入时07:01
。这种行为对我来说是不合逻辑的,因为后端的时间戳应该始终是 UTC。
1) 显示set TIME_ZONE='US/Eastern'的输出;从a中选择*;2) 如果设置 TIME_ZONE='-4:00';?
set TIME_ZONE='US/Eastern';
select * from a;
+----+-------------------------+
| id | begin_time |
+----+-------------------------+
| 1 | 2018-11-04 01:01:00.000 |
| 1 | 2018-11-04 02:01:00.000 |
+----+-------------------------+
set TIME_ZONE='-4:00';
select * from a;
+----+-------------------------+
| id | begin_time |
+----+-------------------------+
| 1 | 2018-11-04 02:01:00.000 |
| 1 | 2018-11-04 03:01:00.000 |
+----+-------------------------+
我有一个我不喜欢的答案:
这就解释了为什么我在有和没有索引的情况下得到不同的结果。对我来说,感觉就像实现被破坏了,但我不知道我会做些什么来轻松修复。/耸耸肩
幸运的是,我们可以在这种情况下解决这个问题,但我们正在重新考虑将来如何处理这个问题。