alexander.sivak Asked: 2022-08-18 07:50:15 +0800 CST2022-08-18 07:50:15 +0800 CST 2022-08-18 07:50:15 +0800 CST 为什么一个分叉后面经常跟着一个 exec? 772 为什么“一个叉子后面经常跟着一个 exec”?你不能在 UNIX 中创建一个新进程吗? unix process 5 个回答 Voted raj 2022-08-18T07:59:12+08:002022-08-18T07:59:12+08:00 fork()创建一个新进程,它是父进程的副本。因此,如果您只这样做fork(),您将运行两个相同的进程。因此,为了用另一个代码替换分叉的进程,您需要执行exec()which 用指定的可执行文件替换当前正在运行的进程。 Linux 内核就是这样组织的。您没有一个系统调用可以同时创建新进程并加载新的可执行文件。您必须分两步完成 - 首先创建新进程,然后将新的可执行文件加载到这个新进程中。(尽管您的编程语言中可能有一个结合了这两者的库函数- 例如,有spawn()许多 C 变体)。 有时exec()不需要,如果您只需要创建当前进程的另一个副本即可。例如,许多守护进程都会这样做。 davidbak 2022-08-18T19:16:16+08:002022-08-18T19:16:16+08:00 这是因为历史原因:在时间之初只有fork和exec。因为它很容易实现(根据 DMR:只有 27 行 PDP-7 汇编代码fork! - 参见例如A fork()in the road(Baumann, Appavoo, Krieger, Roscoe, 2019) - 次要来源,尽管它引用了主要来源source The Evolution of the Unix time-sharing system (Ritchie, 1979)。无论如何,真正的从头开始直接进程创建要晚得多得多。(可能不在 POSIX 中?) 真正的直接进程创建 API 的出现要晚得多,这一事实影响到今天的 Unix 编程。因为成百上千的书籍、手册、教程、幻灯片和课程都是用来解释的fork,exec并且几十年来它们一直被教授给学生和程序员,作为在 Unix 中进行进程创建/控制的方式,并且这种广泛的遗产仍然存在于代码的方式中写到今天。 哦,这里是Unix 分时系统的演变(Ritchie,1979)。向下滚动到第 6 页可以看到:“现代形式的过程控制是在几天内设计和实现的。......事实上,PDP-7 的fork调用恰好需要 27 行汇编代码。” user1937198 2022-08-18T17:47:34+08:002022-08-18T17:47:34+08:00 因为 exec 不创建进程,并且 linux 没有用于创建进程和加载可执行文件的单个系统调用,因为这仅适用于创建具有新可执行文件且没有预先存在的资源的进程的简单情况。如果您想做的不仅仅是琐碎的案例,复杂性会迅速增加,并且可以更容易地拥有单独的“创建流程”和“启动可执行”步骤,并能够在两者之间操作流程。有关此问题的讨论,请参见https://lwn.net/Articles/360556/。 Unix,回到最早的版本,通过使用 fork 创建一个专用于设置环境的父进程的副本来解决这个问题,一旦完成,它就会加载新的可执行文件。子进程然后以可以访问父进程的所有资源但在子进程中运行的临时状态存在。这种方法有几个优点: 您可以使用现有的进程内操作 API 来设置子进程。这意味着您不需要一整套 API 调用来操作子进程来设置资源。 如果父进程在创建新进程后不再需要存在,则可以单独使用 exec。 如果您想要同一可执行文件的第二个进程,您可以不使用 exec 进行分叉。 Best Answer AnoE 2022-08-20T03:10:41+08:002022-08-20T03:10:41+08:00 与大多数“fork-shaming”现有答案略有不同的观点......;) 正如@davidbak 提到的那样,最初可能很容易做到这一点。但是在使用了很多fork/之后exec(也经常只使用fork, 用于多处理),肯定有原因为什么这种工作方式仍然活跃且活跃,并且没有被委托给历史的迷雾: 从几乎任何编程语言的程序员的角度来看,它仍然非常简单。我在哪里编码并不重要——任何语言都可以信任fork语义的极其简单的含义,并将其作为语言的一部分提供。因此,每种语言都有一种相对简单(与进程内多线程相比)的方法,可以为其用户提供至少多处理。 作为用户(程序员),我可以用几行代码编写多处理程序,而不必担心互斥体、信号量、非法覆盖我的任何程序变量的状态等等。同时,父子之间的“初始通信”对我来说也很简单——子子确实可以完全访问父子拥有的任何变量或 RAM,并且可以继续使用它。在实践中,这意味着,如果我需要与我的主程序并行执行一些简短的 I/O 或网络进程,我可以用几行代码来完成;一切都在一个地方,一目了然。之后我可以接孩子,然后继续我的快乐之路。没有“工作线程”,我不需要注意只使用线程安全的方法或数据结构。 同样,由于内存内容开始相同但实际上是独立的,因此在父/子进程之间覆盖任何内容的风险为零。是的,我确实必须在父母和孩子之间找到其他 IPC 方法,但这些方法也不是那么难;通常,语言提供标准功能,例如“open3”或类似功能,自动提供双向基于管道的文件句柄进行通信以避免死锁等。 具体来说,当在编程语言之间切换时,一旦理解了fork语义,就不需要再学习关于新环境的任何内容——它总是和其他任何语言一样简单。 exec无论如何都很好。它允许我们用不同的东西替换当前的进程映像(即正在执行的可执行文件)。这使得它变得干净,比如说,有一些脚本或程序准备某种环境,然后执行其他东西,同时从场景中消失,本身。它不仅释放资源(RAM,还释放进程表中的空间等),而且让任何参与或查看它的人都非常清楚,以前的父级将来不会再扮演任何角色. 您经常在编写良好的脚本中发现这一点,这些脚本在启动其“有效负载”时bash释放了解释器的资源。bash 此外: 它完全符合 Unix 的理念,即拥有许多可以相互交互的小工具,而不是非常有限或需要大量参数或 API 才能真正使用的胖黑盒子。 如上所示,在某些只有单一功能会受到限制的场景中,它非常强大;但是让fork+exec互相关注也很容易。除非您需要,否则您不必在两者之间做很多事情(或者根本不需要做任何事情)。 根据手册页,在一些现代 Unix(即 Linux)中,fork本身只是更现代和更强大的克隆调用的包装器,它确实有点像fork+exec. 请注意,在这里我们看到复杂性已经抬起了丑陋的头;Linux 也有一个clone3功能,它取代clone了界面并使界面更容易或更方便(使用structs而不是这么多标志)。 kbro 2022-08-18T19:42:05+08:002022-08-18T19:42:05+08:00 不,您不能在 UNIX 中创建新进程,您只能复制当前进程(使用fork)。如果您希望新进程执行当前进程正在执行的操作之外的其他操作,则可以替换它(使用exec)。 您不必fork在调用之前exec。在启动登录会话(.xinitrc等)的脚本中有一种常见用法,您可以在其中设置环境变量并启动后台任务(例如ssh-agent),然后运行会话管理器。启动会话管理器后,启动脚本无需执行任何其他操作,因此您exec可以释放分配给运行启动脚本的资源。启动脚本的父级不知道这个替换 - PID 保持不变 - 所以他们继续等待这个孩子死亡,然后再执行他们的整理操作。
fork()
创建一个新进程,它是父进程的副本。因此,如果您只这样做fork()
,您将运行两个相同的进程。因此,为了用另一个代码替换分叉的进程,您需要执行exec()
which 用指定的可执行文件替换当前正在运行的进程。Linux 内核就是这样组织的。您没有一个系统调用可以同时创建新进程并加载新的可执行文件。您必须分两步完成 - 首先创建新进程,然后将新的可执行文件加载到这个新进程中。(尽管您的编程语言中可能有一个结合了这两者的库函数- 例如,有
spawn()
许多 C 变体)。有时
exec()
不需要,如果您只需要创建当前进程的另一个副本即可。例如,许多守护进程都会这样做。这是因为历史原因:在时间之初只有
fork
和exec
。因为它很容易实现(根据 DMR:只有 27 行 PDP-7 汇编代码fork
! - 参见例如Afork()
in the road(Baumann, Appavoo, Krieger, Roscoe, 2019) - 次要来源,尽管它引用了主要来源source The Evolution of the Unix time-sharing system (Ritchie, 1979)。无论如何,真正的从头开始直接进程创建要晚得多得多。(可能不在 POSIX 中?)真正的直接进程创建 API 的出现要晚得多,这一事实影响到今天的 Unix 编程。因为成百上千的书籍、手册、教程、幻灯片和课程都是用来解释的
fork
,exec
并且几十年来它们一直被教授给学生和程序员,作为在 Unix 中进行进程创建/控制的方式,并且这种广泛的遗产仍然存在于代码的方式中写到今天。哦,这里是Unix 分时系统的演变(Ritchie,1979)。向下滚动到第 6 页可以看到:“现代形式的过程控制是在几天内设计和实现的。......事实上,PDP-7 的fork调用恰好需要 27 行汇编代码。”
因为 exec 不创建进程,并且 linux 没有用于创建进程和加载可执行文件的单个系统调用,因为这仅适用于创建具有新可执行文件且没有预先存在的资源的进程的简单情况。如果您想做的不仅仅是琐碎的案例,复杂性会迅速增加,并且可以更容易地拥有单独的“创建流程”和“启动可执行”步骤,并能够在两者之间操作流程。有关此问题的讨论,请参见https://lwn.net/Articles/360556/。
Unix,回到最早的版本,通过使用 fork 创建一个专用于设置环境的父进程的副本来解决这个问题,一旦完成,它就会加载新的可执行文件。子进程然后以可以访问父进程的所有资源但在子进程中运行的临时状态存在。这种方法有几个优点:
与大多数“fork-shaming”现有答案略有不同的观点......;)
正如@davidbak 提到的那样,最初可能很容易做到这一点。但是在使用了很多
fork
/之后exec
(也经常只使用fork
, 用于多处理),肯定有原因为什么这种工作方式仍然活跃且活跃,并且没有被委托给历史的迷雾:fork
语义的极其简单的含义,并将其作为语言的一部分提供。因此,每种语言都有一种相对简单(与进程内多线程相比)的方法,可以为其用户提供至少多处理。fork
语义,就不需要再学习关于新环境的任何内容——它总是和其他任何语言一样简单。exec
无论如何都很好。它允许我们用不同的东西替换当前的进程映像(即正在执行的可执行文件)。这使得它变得干净,比如说,有一些脚本或程序准备某种环境,然后执行其他东西,同时从场景中消失,本身。它不仅释放资源(RAM,还释放进程表中的空间等),而且让任何参与或查看它的人都非常清楚,以前的父级将来不会再扮演任何角色. 您经常在编写良好的脚本中发现这一点,这些脚本在启动其“有效负载”时bash
释放了解释器的资源。bash
此外:
fork
+exec
互相关注也很容易。除非您需要,否则您不必在两者之间做很多事情(或者根本不需要做任何事情)。fork+exec
. 请注意,在这里我们看到复杂性已经抬起了丑陋的头;Linux 也有一个clone3功能,它取代clone
了界面并使界面更容易或更方便(使用structs
而不是这么多标志)。不,您不能在 UNIX 中创建新进程,您只能复制当前进程(使用
fork
)。如果您希望新进程执行当前进程正在执行的操作之外的其他操作,则可以替换它(使用exec
)。您不必
fork
在调用之前exec
。在启动登录会话(.xinitrc
等)的脚本中有一种常见用法,您可以在其中设置环境变量并启动后台任务(例如ssh-agent
),然后运行会话管理器。启动会话管理器后,启动脚本无需执行任何其他操作,因此您exec
可以释放分配给运行启动脚本的资源。启动脚本的父级不知道这个替换 - PID 保持不变 - 所以他们继续等待这个孩子死亡,然后再执行他们的整理操作。