我正在运行几台服务器,它们需要非常紧凑的时间同步(<50ms),因为它们正在运行 Paxos 算法。服务器正在运行 NTP 并在某一时刻成功同步。由于hwclock
启用了 11 分钟机制,因此系统时间应复制到硬件时钟。
但是,我发现在重新启动后,与重新启动前的时间相比,系统时间可以减少多达 300 毫秒。认为重启后的时间应该在重启前的 50ms 以内是不合理的吗?
我正在运行几台服务器,它们需要非常紧凑的时间同步(<50ms),因为它们正在运行 Paxos 算法。服务器正在运行 NTP 并在某一时刻成功同步。由于hwclock
启用了 11 分钟机制,因此系统时间应复制到硬件时钟。
但是,我发现在重新启动后,与重新启动前的时间相比,系统时间可以减少多达 300 毫秒。认为重启后的时间应该在重启前的 50ms 以内是不合理的吗?
我没有要生成的数字,但用于在启动时设置时钟的接口似乎只有精确到秒的精度。
您没有说明您的操作系统,但在所有类 Unix 系统上,都可以在引导过程中插入对 NTP 时间的依赖。
NTP 守护程序在启动时启动,但通常它会立即自行后台运行,并且在 NTP 守护程序寻找要同步的服务器时继续启动——这样在机器未连接到网络的情况下启动不会延迟。
在这种情况下,您需要确保 ntp 守护程序的启动方式能够通过在引导时单步执行来纠正偏移量。例如,这可以是
ntpd -gx
或chronyc -q
。您可能还希望在开始工作负载之前插入一个偏移量是否可接受的检查。我最初的反应是 300 毫秒似乎很多,但我确实有数字要生成,它们表明 @Law29 是正确的:
(希望您可以阅读图表上的所有数字,如果没有,请给我留言。)
如您所见,存在相当大的差异。考虑到我的本地网络上有一个第 1 层 GPS 源,这让我感到惊讶,以及频率校正回到正轨需要多长时间。并且鉴于对等样本在图上非常紧密地聚集在一起,这显然是本地时钟的问题,而不是启动期间的网络延迟不一致。(作为记录,硬件是Shuttle DS437无风扇迷你 PC,配备双核 Celeron 1037U @ 1.8 GHz。)
因此,要点可能是:
man hwclock
的详细信息),或者您的关机进程正在更新硬件时钟,