这个问题是为什么我们需要将缓冲区传递给系统调用才能返回信息的延伸?为什么系统调用不能在内部分配缓冲区?因为内存分配是将回调传递给系统调用的众多动机之一。
我想将分配回调传递给需要缓冲区的原始系统调用变体,因为原始系统调用可能会在写入缓冲区之前知道要分配的缓冲区大小。
许多文件系统 API(不仅仅是 posix/*nix,Windows/NT 也这样做)总是要求您传递 ax 字节路径缓冲区(x 将是 256 或 1024 或 4096 或 MAX_PATH)。您仍然必须将 x 传递给函数以指示缓冲区大小,如果它需要比缓冲区允许的更多空间,该函数可能会失败。
是否存在系统调用不能调用用户空间函数的限制?是否可能,但由于系统调用必须保留调用用户空间上下文和回调用户空间上下文而复杂?从线程切换的角度来看,所有系统调用是否都应该是原子的,并且从系统调用中调用用户空间代码会破坏这种原子性?
系统调用运行内核代码。内核不信任用户模式代码,因此如果系统调用接受回调,则无法在内核模式下执行该回调。它必须在用户模式下执行回调。
系统调用不能确定回调会做什么。回调可以自己进行系统调用。例如,分配内存的回调可能要调用系统调用,例如
sbrk
或mmap
为进程提供更多内存。因此,除了任何嵌套系统调用的执行上下文之外,内核还需要为挂起的系统调用维护一个额外的执行上下文。内核每个进程可以有多个执行上下文:这就是内核线程的用途。但是现在这些上下文需要有额外的结构,因为一些上下文嵌套在其他上下文中。通过让系统调用将所有中间信息传递给进程,可以避免这种额外的复杂性。让进程执行它想要的任何回调代码,然后在它准备好时调用一个延续系统调用。这样,内核保持了一个简单的执行模型(系统调用被调用,系统调用运行,系统调用返回),并且进程可以根据需要运行回调。
好吧,你有它:这就是它现在的工作方式。一个进程可以进行一次系统调用来查询所需缓冲区的大小,然后再进行一次系统调用(可能是同一个系统调用号不同参数)来获取数据。
在回调执行期间数据可能会发生变化,这是一个固有的困难。系统调用不必是原子的,但它们必须在给定的时刻呈现系统的一致视图。例如,一个进程可能会尝试从文件中读取数据,并且在回调运行时文件可能会增长。由于内核不能相信回调会在给定的时间内完成——或者确实会完成——内核不能在回调运行时阻止对文件的更新。所以用户登陆代码在任何情况下都必须应对这个困难:当回调后代码运行时,所需的数据可能不再适合缓冲区了。