Syscalls (chamadas de sistema) causam alguma penalidade de desempenho devido ao isolamento entre o kernel e o espaço do usuário. Portanto, parece uma boa ideia reduzir as syscalls.
Então, o que eu pensei é que poderíamos agrupar syscalls em um único. Então, a ideia é colocar as syscalls e argumentos em uma estrutura de dados simples na memória. Então poderíamos introduzir uma nova syscall, que damos a essa estrutura de dados. O kernel poderia, então, disparar toda a funcionalidade em paralelo e retomar o thread se uma (ou todas) syscalls terminassem.
Acho que essa abordagem seria uma boa base para programação simultânea (E/S assíncrona) e melhoraria as soluções existentes de select/poll/epoll, permitindo a simultaneidade em qualquer syscall e reduzindo as trocas de contexto gerais.
Por que isso não é feito?