在Linux中,文件系统时间似乎总是落后系统时间几毫秒,如果您想检查文件是否在给定时间之前或之后在非常窄的时间范围(毫秒)内被修改,则会导致不一致。
在任何具有支持纳秒分辨率的文件系统的 Linux 系统中(我尝试使用具有 256 字节 inode 和 ZFS 的 ext4),如果您尝试执行以下操作:
date +%H:%M:%S.%N; echo "hello" > test1; stat -c %y test1 | cut -d" " -f 2
第二个输出值(文件修改时间)始终比第一个输出值(系统时间)晚几毫秒,例如:
17:26:42.400823099
17:26:42.395348462
而它应该是相反的,因为文件在调用命令后被test1
修改。date
你可以在 python 中得到相同的结果:
import os, time
def test():
print(time.time())
with open("test1", "w") as f:
f.write("hello")
print(os.stat("test1").st_mtime)
test()
1698255477.3125281
1698255477.3070245
为什么会这样呢?有没有办法避免它,使系统时间与文件系统时间一致?到目前为止,我发现的唯一解决方法是通过创建一个虚拟临时文件并获取其修改时间来获取文件系统“时间”(无论这在实践中意味着什么),如下所示:
def get_filesystem_time():
"""
get the current filesystem time by creating a temporary file and getting
its modification time.
"""
with tempfile.NamedTemporaryFile() as f:
return os.stat(f.name).st_mtime
但我想知道是否有更清洁的解决方案。
文件时间戳使用的时间是最后一次计时器计时的时间,该时间总是稍微过去一些。调用中的函数
current_time
inode.c
ktime_get_coarse_real_ts64
:后者记录如下:
请注意 inode 时间戳的具体提及。
除了修改内核之外,我不知道有什么方法可以完全避免这种情况。您可以通过增加 来减少影响
CONFIG_HZ
。最近有一项改进建议,目前仍在研究中。斯蒂芬·基特的回答似乎很准确。
我们可以通过实际获得文件系统使用的相同“粗略”时钟来很好地重现这一点,至少在我的内核配置上是如此;在访问文件之前始终获取粗略实时时钟的C程序要么采用文件的时间戳,要么(很少)采用早一个系统时钟周期的时间戳:
产生类似的东西
now_coarse
前面提到的大约tick-duration delta的情况很少发生,当系统tick正好落在文件的获取和修改之间时,就会发生这种情况:顺便说一句,统计数据表明,如果我们执行上述操作,直到收集到 10,000 次发生这种“滴答跳”的事件,则可能的延迟范围非常小:
换句话说,当涉及到报价之间的增量时,我们的时间安排非常接近。