问题 1:
使用systemctl status name.service
,我得到的其中一行是:
CPU: 3.555s
但我找不到任何关于其含义的信息。
由于以秒为单位,我猜测这是 cgroup 消耗的总 CPU 时间,但我希望得到确认,或者有一个解释这一点的手册页。
问题2:
如果我的假设是正确的,那么结合以下行中 cgroup 的正常运行时间
Active: active (running) since Sun 2024-06-23 13:54:29 CEST; 12min ago
将给出这个过程所消耗的 CPU 时间的平均百分比,对吗?
问题 1
它几乎肯定会是内核运行时计数器的值,每次上下文切换时都会更新。所以,是的,这几乎就是你所描述的。但是,我们可以肯定。这个答案力求解释一个人如何自己弄清楚这些事情。我不是内核黑客或 systemd 开发人员。但使用合理的工具(
rg
以及git grep
从命令行搜索,您最喜欢的具有“搜索光标下的单词”功能的文本编辑器,在我的情况下是带有望远镜的 neovim):克隆 systemd。
rg CPU:
稍后:systemd/src/systemctl/systemctl-show.c
i
这里是一个UnitStatusInfo
,通过 dbus 填充bus_map_all_properties(…, "org.freedesktop.systemd1", …);
。bus_properties_map property_map
包含请求数据的密钥:因此,寻找
"CPUUsageNSec"
会引导我们找到 systemd/src/core/dbus-unit.c 的property_get_cpu_usage
函数;它调用unit_get_cpu_usage
;它在 cgroup.c 中定义,在那里它调用unit_get_cpu_usage_raw
。第一种情况:该单元在根 cgroup 中运行;然后它只读取 /proc/{pid}/stat:
否则,它直接从 cgroup
cpu.stat
(即 cgroupv2 的cpu
控制器)获取数据。正如man cgroups
我们所知,这些都记录在内核的Documentation/admin-guide/cgroup-v2.rst中。所以,这始终与您习惯的统计数据相同:从进入任务到退出,花费了多少时间?
您可以在内核的 sched/rstat.c 和最重要的 cputime.c 中阅读有关如何计算的权威信息。您会发现我已经在“ /proc/*pid*/stat 中读取的信息是否由定时器中断更新?”中解决了这个问题:)
问题2
不是,因为如今的 CPU 处于休眠状态,时钟频率降低,然后以微秒到毫秒的量级再次启动。因此,“可比较的”CPU·1s 单位实际上已经多年不存在了,而且从纯 CPU 时间计算来看,不可能知道一项任务是否只是在降频到 800 MHz 的 CPU 核心上花费了很少的时间,或者它所做的工作是否使整个 CPU 双核(超线程)在 3.8 GHz 下保持活跃。所有 16 个核心都在 3.8 GHz 下持续运行的多核 CPU 比 1 个核心以 800 MHz 运行以处理每 10 毫秒在计数器上唤醒的某些服务而其他 15 个核心处于关闭状态的多核 CPU 需要花费的 CPU 周期要多得多。但是,看起来仍然好像一项服务使用了所有 CPU 时间的 1/16。事实并非如此——如果有更多的事情要做,调度程序将唤醒更多核心,并提高时钟频率。
在频率可扩展的多处理器系统上计算 CPU 时间份额很难,这会导致人们优化服务器工作负载,以获得每 CPU 分钟最高的性能,即使这绝不是最节能或最快的。这是一个有趣的领域!