我正在使用嵌入式 Linux 设置。我挂载了一个带有可写覆盖(使用overlayfs
)的 squashfs,然后 chroot 进入其中,将控制权转移到 systemd。
我在 systemd 中有补丁可以将核心转储发送到/var/log
,而不是/var/lib/systemd/coredump
.
当请求核心转储时,systemd-coredump
会调用它,但会收到此错误。
Jul 30 08:54:14 evo4k-e6872f kernel: ClearApp[803]: segfault at 0 ip 000000000042bcb0 sp 00007ffcd4915f18 error 6 in ClearApp[400000+868000]
Jul 30 08:54:14 evo4k-e6872f kernel[359]: ClearApp[803]: segfault at 0 ip 000000000042bcb0 sp 00007ffcd4915f18 error 6 in ClearApp[400000+868000]
Jul 30 08:54:14 evo4k-e6872f systemd[1]: Started Process Core Dump (PID 804/UID 0).
Jul 30 08:54:14 evo4k-e6872f systemd-coredump[805]: Failed to create temporary file for coredump /var/log/coredump/core.ClearApp.0.54a13c5624ad4ed6b3>
Jul 30 08:54:14 evo4k-e6872f systemd-coredump[805]: Process 803 (ClearApp) of user 0 dumped core.
Jul 30 08:54:14 evo4k-e6872f systemd[1]: clearapp.service: Main process exited, code=dumped, status=11/SEGV
Jul 30 08:54:14 evo4k-e6872f systemd[1]: clearapp.service: Failed with result 'core-dump'.
Jul 30 08:54:15 evo4k-e6872f systemd[1]: clearapp.service: Service hold-off time over, scheduling restart.
Jul 30 08:54:15 evo4k-e6872f systemd[1]: clearapp.service: Scheduled restart job, restart counter is at 5.
Jul 30 08:54:15 evo4k-e6872f systemd[1]: Stopped MedX ClearApp.
Jul 30 08:54:15 evo4k-e6872f systemd[1]: clearapp.service: Start request repeated too quickly.
Jul 30 08:54:15 evo4k-e6872f systemd[1]: clearapp.service: Failed with result 'core-dump'.
Jul 30 08:54:15 evo4k-e6872f systemd[1]: Failed to start MedX ClearApp.
我/proc/sys/kernel/core_pattern
的是|/lib/systemd/systemd-coredump %P %u %g %s %t %c %e
。如果我设置core_pattern
为/tmp/cores/core.%e.%p.%h.%t
,它的工作原理。所以,它是 systemd 的定义。
我正在使用 systemd 版本 237。这以前使用 systemd 版本 234。
我的文件系统正确/干净。无论如何它都没有损坏(fsck
回来干净)。
如何让 systemd 生成没有错误的核心转储?
编辑#1
我重新编译systemd-coredump
以登录到不同的目录,甚至是安装的拇指驱动器,它给了我同样的错误。
Jul 30 10:43:39 evo4k-e6872f systemd-coredump[1910]: Failed to create temporary file for coredump /run/media/Pauls/core.ClearApp.0.dd6557bb31264bf2b3773b534fd6e2b1.1908.1532961819000000: Read-only file system
我开始认为内核或 systemd 正在做的不仅仅是创建一个临时文件。
编辑#2
我运行了 systemd 从用户空间执行的确切open
调用,它成功了。内核调用核心转储程序的上下文有什么问题吗?
我将此行添加到 systemd。
fd = open(tmp, O_CREAT|O_EXCL|O_NOFOLLOW|O_NOCTTY|flags, 0640);
if (fd < 0) {
log_error("Couldn't open: %d: %s", fd, tmp);
return -errno;
}
我得到这个输出。
Couldn't open: -1: /run/media/Pauls/.#core.ClearApp.0.7833dca6d3354c0e959b366df731bf9f.879.15329633730000000f174d1155a09d96