我经常听说 Linux 线程很重(需要 8mb 堆栈大小),这就是为什么像 golang 这样的语言在用户空间中实现自己的绿色线程(分配到堆)。这样就可以处理 100k 连接而不是 10k 连接。据我了解,其中的一个问题是与 C 的互操作,这就是 Rust 放弃它们并使用 async/await 的原因。
但如果绿色线程如此流行,为什么 Linux 不能提供自己的极轻量级线程呢?换句话说,为什么每种语言都需要在操作系统调度程序之上拥有自己的复杂线程调度程序,而操作系统似乎更适合做出这些调度决策?
可以看到该声明的来源:系统(posix)线程的大小取决于您如何配置任务分配器。现代 64 位系统上的默认值确实是 8 MB,因为这个大小是有意义的。通常它的增长要少得多,我什至不确定你是否必须实际分配该内存,除非你实际上访问了所有这些页面 - 就像任何其他虚拟内存地址空间一样:如果你不使用它,没有物理内存支持。
此外,这是完全可配置的,因此如果程序使用更多,则取决于程序员,而不是系统问题。
我听到了很多关于 Go 的宏大说法,但结果都是有问题的(或者是错误的);这就是其中之一。进行自己的堆栈管理当然是可能的 - 毕竟,libpthread 没有任何魔法 - 但相同的堆栈量将使用相同量的内存。 “在堆上分配堆栈”是一个矛盾的说法;再次强调,这些只是常规的虚拟内存空间,内核并不关心您在自己的进程的内存空间中做了什么。
如果Go 的做法与使用 pthreads 的软件(并非所有多线程软件都是如此!)不同,那么它们可能会重用短期线程的堆栈页;据我所知,libpthread 也做了同样的事情。毕竟,这里没有什么魔法。
“而不是 10k”:
[[quotation needed]]
.我可以用一种既定的语言编写一个糟糕的服务器,然后用我选择的语言编写一个更好的服务器,并得出结论:我“最喜欢的”也更快。我要指出的是,现代网络服务器基本上仍然不是用 Go 编写的,如果你真的一直深入到数据平面应用程序服务器,你不仅可以在自己的进程中进行线程处理,还可以进行网络缓冲区管理事实证明,Go 基本上不受欢迎。
我会告诉 Go,通道和短命工作线程是一个很好的概念,像 Erlang 这样的语言可以很好地做到这一点。
呃,Rust 的
std::thread
使用模式证明这是一个错误的陈述。因为确实如此; Go 使用 Linux 线程,因此它们本身不会比 Go 的线程更重。如果操作系统在屈服时继续执行正在运行的代码,那么 Go 还能如何拥有多个线程呢?任何真正的 Go 线程都是 Linux 线程;任何并发但没有自己线程的东西都在单独的 Linux 线程中运行,该线程来自构成线程池或类似的东西。这绝不是 Go 的功能或发明——线程池和并发、futures 和闭包几乎一直存在。