强者strace
让我失望了。这怎么可能?
time foo
显示foo
运行需要几秒钟(“真实”),但在用户空间(“用户”)和内核(“系统”)中使用的 CPU 时间可以忽略不计。对于好奇的,foo
定义如下。
所以它大部分时间都在等待其他事情,而不是执行 CPU 指令。通常,我可以看到它是如何等待的strace
——即什么系统调用被阻塞了很长一段时间。不幸的是,这种方法没有奏效。
strace -ttt -T -C -w foo
显示系统调用、时间戳以及系统调用所花费的(实际)时间的摘要。但是这个特定的过程显示为在系统调用中花费的整体(实时)时间可以忽略不计。
foo
实际上是journalctl -b -u dev-hugepages.mount
。除了我每次都必须将最后一个参数更改为不同的 systemd 单元才能重现它。换句话说,我正在调查的延迟发生在我第一次尝试获取任何一个 systemd 单元的日志时。 编辑:在回答了主要问题之后,我也意识到我在重现延迟时遇到这个问题的原因。
这个过程花费的时间是一个特定的问题,显然它不会发生在所有系统上。https://github.com/systemd/systemd/issues/7963
遇到此问题的通常原因是进程在页面错误中阻塞。这些是通过内存映射 aka 执行的对文件的读取或可能写入
mmap()
。您可能已经mmap()
在系统调用的跟踪中注意到了一些。如果您使用的是该
/usr/bin/time
程序而不是time
内置的 shell,您可能还会注意到:major
pagefaults 是需要文件系统 IO 的。minor
页面错误的重要性要小得多(可能只是“TLB 未命中”)。我怀疑
inputs
是阅读的总页数。目前,我认为文件映射页面总是相同的大小。大多数情况下为 4096 字节,但您可以检查getconf PAGESIZE
.所以这代表约 290 兆字节,以每秒超过 100 兆字节的速度读取,这是像我这样的硬盘的标准速度。谜团已揭开!
另请注意,您假设您有一个完整的空闲 CPU 用于此过程。否则,进程可能会被阻塞,等待其他进程让出 CPU。
strace
仅显示进程由于系统调用而进入(然后离开)内核的时间。或者当传递一个unix信号时。但是,还有其他类型的中断strace
根本不显示。所以这些包括