我开始学习 Linux tty 和信号并遇到了一些麻烦。
我正在阅读并使用《TTY 揭秘》作为参考。
我做了两个简单的golang程序。
家长:
package main
import (
"fmt"
"syscall"
"time"
)
func main() {
attr := &syscall.ProcAttr{
Files: []uintptr{0, 1, 2},
}
_, err := syscall.ForkExec("./child/child", []string{"child"}, attr)
if err != nil {
fmt.Println("Error:", err)
return
}
for {
fmt.Println("hi from parent")
time.Sleep(time.Second * 10)
}
}
孩子:
package main
import (
"fmt"
"os/signal"
"syscall"
"time"
)
func main() {
signal.Ignore(syscall.SIGTSTP) // golang's way to handle (ignore) signal
for {
fmt.Println("hi from child")
time.Sleep(time.Second * 5)
}
}
它们非常简单。两者都只是每 5/10 秒向 tty 打印一条消息。唯一的区别是子进程忽略了 SIGTSTP(ctrl-z)信号。因此,当我按下 ctrl-z 时,它会暂停父进程,而不会暂停子进程。这正是我所期望的。然而,我没有想到的是,整个组从前台移到了后台组。它与TTY 揭秘形成对比。具体来说:
当前台作业中的所有进程都已暂停时,会话领导者将从 TTY 设备读取当前配置,并将其存储起来以供以后检索。会话领导者继续使用 ioctl 调用将自己安装为 TTY 的当前前台进程组。然后,它会打印类似“[1]+ Stopped”的内容来通知用户作业刚刚被暂停。
它表示仅当前台作业中的所有进程都已暂停时,会话领导者(shell / bash)才会将该组移至后台作业......
ps l -t /dev/pts/0
ctrl-z 前后的结果:
yakog@yakog-computer:~/goprojects/parent$ ps l -t /dev/pts/0
F UID PID PPID PRI NI VSZ RSS WCHAN STAT TTY TIME COMMAND
0 1000 1747467 1747441 20 0 14288 5632 do_wai Ss pts/0 0:00 bash
0 1000 1747496 1747467 20 0 1225432 1792 ep_pol Sl+ pts/0 0:00 ./parent
0 1000 1747501 1747496 20 0 1225424 1664 ep_pol Sl+ pts/0 0:00 child
yakog@yakog-computer:~/goprojects/parent$ ps l -t /dev/pts/0
F UID PID PPID PRI NI VSZ RSS WCHAN STAT TTY TIME COMMAND
0 1000 1747467 1747441 20 0 14288 5632 do_sel Ss+ pts/0 0:00 bash
0 1000 1747496 1747467 20 0 1225432 1792 do_sig Tl pts/0 0:00 ./parent
0 1000 1747501 1747496 20 0 1225680 1792 ep_pol Sl pts/0 0:00 child
如果我将忽略 ( signal.Ignore(syscall.SIGTSTP)
) 从子进程移至父进程,则一切正常(从我的角度来看)。子进程暂停 (T),父进程正常恢复 (R/S),但该组仍是前台作业。
yakog@yakog-computer:~/goprojects/parent$ ps l -t /dev/pts/0
F UID PID PPID PRI NI VSZ RSS WCHAN STAT TTY TIME COMMAND
0 1000 1749437 1749410 20 0 14420 5632 do_wai Ss pts/0 0:00 bash
0 1000 1749957 1749437 20 0 1225448 1920 ep_pol Sl+ pts/0 0:00 ./parent
0 1000 1749962 1749957 20 0 1225412 1664 ep_pol Sl+ pts/0 0:00 child
yakog@yakog-computer:~/goprojects/parent$ ps l -t /dev/pts/0
F UID PID PPID PRI NI VSZ RSS WCHAN STAT TTY TIME COMMAND
0 1000 1749437 1749410 20 0 14420 5632 do_wai Ss pts/0 0:00 bash
0 1000 1749957 1749437 20 0 1225448 1920 ep_pol Sl+ pts/0 0:00 ./parent
0 1000 1749962 1749957 20 0 1225668 1792 do_sig Tl+ pts/0 0:00 child
为什么会发生这种情况,我忽略了什么?
在两个方面是不准确的:
作业控制由 shell 主动完成,而不是由会话领导者自动完成。shell 不必是会话领导者即可进行作业控制。
当您启动时
xterm
,xterm
它会在新会话中启动的新进程中运行您的 shell(默认情况下),该进程将控制伪终端从属设备。然后该 shell 将成为会话领导者。但是,如果您从该 shell 启动另一个交互式 shell,它将不是会话领导者,但将接管作业控制。当 shell 派生出一个 shell 进程并在其中执行命令时,它无法看到该进程本身生成的进程。在前台运行作业时,shell 会等待它自己启动的进程¹。
如果该顶级进程被暂停,
wait*()
则将返回,或者 shell 将收到 SIGCHLD²,shell 会将其解释为作业已被暂停(无论该作业中是否仍有它不知道的进程在运行)并告诉 tty 设备驱动程序它不再处于前台(通过将其自己的进程组置于前台)。但如果是该进程的子进程被暂停,则 SIGCHLD 将被发送到其父进程,而不是 shell,shell 将不会收到 SIGCHLD,并且它对wait*()
它所知道的进程执行的操作不会返回。¹ 在某些 shell 中,甚至不是全部,例如在 中
cmdA | cmdB
,某些 shell 仅等待正在运行的进程cmdB
,而某些 shell 则同时等待正在运行的进程cmdA
和cmdB
,因此在前一种类型中(例如基于 Bourne shell 的 ),如果在 上bosh
按下Ctrl+ ,您会发现已暂停 而不是 ,但您仍然会回到提示符,现在正在后台运行(并且它的最终死亡直到您运行 才会处理)并被暂停。z(trap '' TSTP; sleep 100) | sleep 42
sleep 42
sleep 100
sleep 100
fg
sleep 42
² 一些 shell 使用其中一个
wait*()
系统调用,一些 shell 使用较新的 API 处理 SIGCHLD 上的处理程序sigaction()
,其中处理程序可以获取有关进程状态的完整信息,YMMV,但最终结果是相同的。