根据pipe(7)
:
如果所有引用管道读取端的文件描述符都已关闭,则将导致
write(2)
为SIGPIPE
调用进程生成信号。如果调用进程忽略此信号,则将write(2)
失败并显示错误EPIPE
。
为什么 Unix 需要信号,SIGPIPE
而write()
可以直接返回EPIPE
?我的理解是,信号用于本质上是异步的事物(例如终止子进程、终端中断)。但SIGPIPE
只会作为对 的调用的直接结果而生成write()
,在这种情况下,它总是可以返回EPIPE
到调用者以向调用者表示错误。
SIGPIPE
为什么除了之外还有必要有EPIPE
?
有些程序员懒得检查错误。有些程序生成大量输出,并且
printf
(或者,也许write
)不检查错误返回。如果程序正在写入损坏的管道,则这样的程序可能会毫无意义地运行直到完成,输出将进入位存储桶。SIGPIPE 强制这样的程序终止(假设它没有捕获或忽略信号)。
这可以追溯到 Unix 的早期。Douglas McIlroy是创建 Unix 的贝尔实验室部门的负责人,他曾参与开发过 Multics 等其他系统,他非常热衷于找到有用的方法来组合程序。正如《UNIX 操作系统的创建——像花园软管一样连接流》中所述:
在《研究 UNIX 读本:程序员手册注释摘录,1971-1986》中,McIlroy 解释说
因此,管道的概念首先出现,
pipe
系统调用是实现它的一种方式。管道出现在 Unix v3 中。在此之前,将程序链接在一起需要使用临时文件作为第一个程序的输出,将其作为输入传递给第二个程序,最后删除临时文件。现在,如果你认为程序就是用来消耗输入并产生输出的,那么如果程序的输出不再被消耗,你会怎么做?程序不再有用,所以你要终止它。因此,SIGPIPE 信号就演变成了这样。因为有些程序除了将内容写入标准输出之外,还具有其他有用的行为,所以如果标准输出消失,它们可以请求不要被终止。这样的程序会观察到 EPIPE 错误。但由于管道是一种非常基本的工具,因此终止是默认行为。
EPIPE 是写入时发生的带内错误,发生在管道有序关闭时。进程通常不会因此而终止,并会继续,希望是在处理错误之后,在尝试写入更多数据之前。如果它忽略错误而不是处理它并继续写入关闭管道,它将收到 SIGPIPE 并终止。
另外,正如您所说,SIGPIPE 是一个异步信号,通常在管道突然结束而没有完全关闭时发生。例如,如果管道另一端的进程退出而没有读取正在传输的数据,而该数据的写入已经返回。如果 SIGPIPE 未被捕获,它通常会导致接收进程被终止。
一个典型的用例是进程输出发送到 less 的数据。如果您按下
q
less,生成进程将收到 SIGPIPE。