对其中一个 apache 子项执行 strace,它在两个系统调用之间显示 24 秒。我如何确定导致此行为的原因。看起来两个子项花费的时间几乎相同(24.7 和 23.92)秒。
我们在 php5 和 mysql 5 中使用 apache prefork
/var/lib/php5/ 是 php 会话文件夹
带有 processid -20539 的 apache children1 的 strace 输出
ps -u www 数据 | grep apache2 | awk '{print"-p " $1}' | xargs strace -o /strace/strace.log -ff -s4096 -r
20539 0.000064 关闭(13)= 0
20539 0.000060 打开(“/var/lib/php5/sess_9t2cvnvdoruh666rjpm515idm0”,O_RDWR|O_CREAT,0600)= 13
20539 0.000065 羊群(13,LOCK_EX)= 0
20539 24.711888 fcntl(13,F_SETFD,FD_CLOEXEC)= 0
20539 0.000056 fstat(13, {st_mode=S_IFREG|0600, st_size=211, ...}) = 0
20539 0.000080 lseek(13、0、SEEK_SET)= 0
带 processid 的 apache children2 的 strace 输出 - 20556
20556 0.000056 关闭(13)= 0
20556 0.000058 打开(“/var/lib/php5/sess_9t2cvnvdoruh666rjpm515idm0”,O_RDWR|O_CREAT,0600)= 13
20556 0.000062 羊群(13,LOCK_EX)= 0
20556 23.928294 fcntl(13,F_SETFD,FD_CLOEXEC)= 0
20556 0.000055 fstat(13, {st_mode=S_IFREG|0600, st_size=211, ...}) = 0
20556 0.000083 lseek(13、0、SEEK_SET)= 0
文件描述符(13)调用的文件可能有问题吗?我对 strace 输出的理解有什么问题吗?
在这个过程中看看
lsof -p <pid>
值得注意的是,您正在寻找 FD 13
即来自我的一个 httpd 部署。
httpd 10865 apache 13w REG 8,5 1113187 59310687 /var/log/httpd/some_site.log
我将查看与获得文件独占锁的争用,在这种情况下在 FD 13 中指出,如果其他进程正在争用锁,如 fcntl 所述,那么这将解释您的漫长等待。