Richard Asked: 2019-04-29 19:15:53 +0800 CST2019-04-29 19:15:53 +0800 CST 2019-04-29 19:15:53 +0800 CST TCP如何处理针对一个端口的多个请求? 772 由于服务器可能同时收到来自客户端的许多请求到特定端口,例如 HTTP 对象的端口 80,服务器如何处理并发请求? networking port 1 个回答 Voted Best Answer user1686 2019-04-29T20:56:50+08:002019-04-29T20:56:50+08:00 TCP 并没有真正定义“请求”是什么样的;作为一种传输协议,它只提供双工数据流(与通过串行端口传输数据没有区别),剩下的交给应用程序解决。 这也意味着请求不是针对某个端口的;他们是针对通过特定连接(数据流)发送。单独的 TCP 数据包本身没有意义;它们总是被重新组合成连续的数据流。您已经注意到每个数据包都带有目标端口号和源端口号,将其标识为属于特定连接。(注意:它们并不完全区分特定的客户端,因为单个客户端可能会打开多个连接;相反,它们会区分特定的数据流。) 所以这个问题真的不再与端口有关——唯一要问的是运行在 TCP 上的协议如何区分同一连接上的多个请求。 有些协议甚至一开始就不是面向请求的——它们可能是面向命令的,比如 FTP 或 SMTP;或者他们可能会混合使用有响应和无响应的请求,例如 SSH;或者他们可能会传输非结构化数据,这些数据可能看起来根本不像是由不同的请求生成的,例如简单的 Telnet。 一些协议,如 HTTP/1.0 或 Gopher 或 WHOIS,每个连接只允许一个请求。一旦服务器发送了响应,它就会关闭连接,客户端必须再次连接(使用新的 TCP src/dst 端口对)。 HTTP/1.1 支持长连接,但一次仍然只有一个请求。客户端在发送第二个请求之前必须等待第一个响应完成。(现在需要区分多个响应:对于常规资源,HTTP 客户端使用“Content-Length”标头来了解响应何时完成,并且使用“分块”格式发送“不定长度”响应。) 还有一个称为“流水线”的 HTTP/1.1 扩展,它允许多个请求被堆叠并一次发送。它的机制很简单:响应以与请求完全相同的顺序到达。(但请注意,虽然大多数 HTTP 客户端使用长期连接,但它们不使用 HTTP 流水线,因为事实证明它提供的问题多于解决方案。) 一些协议在 TCP 提供的流之上添加它们自己的多路复用。目前最著名的例子是 HTTP/2,它在单个 TCP 连接上有一个“流”系统——每个请求和响应都被分配了自己的流,分成小块,这些块带有它们的长度和流 ID。接收方可以根据流 ID 重新组合来区分多个请求……这实际上反映了 TCP 的工作方式。 DNS 等其他协议更简单,但具有相同的一般概念;通过 TCP 的 DNS 请求或响应以其自己的字节长度为前缀,因此接收方确切知道第一个请求有多少字节,因此知道第二个请求从哪里开始。响应再次携带一个“请求 ID”,客户端可以知道哪个响应属于哪个请求。 所以一般来说,有两种常见的格式来分隔单个 TCP 连接或其他传输流上的多个请求: 基于行,其中每个数据包都以换行符或其他特殊字符终止或分隔。IRC、FTP(控制)、SMTP 大多是基于线路的。 基于长度的,其中每个数据包都以其自己的字节长度为前缀。SSH、DNS、git://、HTTP/2 是基于长度的。 HTTP/1.x 是两者的不幸组合:请求/响应标头是基于行的,但正文是基于长度的。 还有其他怪人,例如 IMAP 是基于行的,除非它不是。 并且有两种常用的方法来处理多个请求并整理出相应的响应(如果协议允许的话): 流水线——客户端可以按特定顺序提交多个请求,并且响应以完全相同的顺序到达。 所以在 HTTP/1.1 中,如果客户端请求页面 A、页面 B、页面 C,那么服务器总是按页面 A、页面 B 和页面 C 的顺序响应。 多路复用——客户端可以提交多个带有单独“请求 ID”的请求,并且响应可以以任何顺序到达,因为每个响应都带有提示它的原始“请求 ID”。 例如,在 DNS 中,客户端可以请求 google.com/A (req#1234) 和 facebook.com/AAAA (req#3456),服务器可能会在处理 req# 之前响应 req#3456 1234. IMAP 已标记请求/响应,但它也有服务器可能发送的与任何特定请求无关的未经请求的响应(例如推送通知)。 多路复用也可以与“通道 ID”一起使用,如 HTTP/2 和 SSHv2 中的情况。不同之处在于“通道 ID”是长期存在的,并且确实像 TCP 标头中的端口一样工作,而“请求 ID”是短暂的。 在 HTTP/2 中,每个请求都分配了一个流,响应可能会交错——客户端可能会收到一些标记为“流 A”的数据,一些数据标记为“流 B”,然后是流 A 的更多数据。虽然流只携带单个请求/响应,它们仍然由多个不同的消息组成,因此更像是频道 ID。 甚至可能是两者的混合——例如,一个协议可能有多路复用通道,但在每个通道上它可能携带多个标记或流水线请求。 SSHv2 是这样工作的——同一个连接可能有多个交互式 shell 通道(非结构化)、SFTP 通道(流水线请求/响应)、TCP 转发通道(非结构化)、ssh-agent 转发通道(流水线请求/响应)等等.
TCP 并没有真正定义“请求”是什么样的;作为一种传输协议,它只提供双工数据流(与通过串行端口传输数据没有区别),剩下的交给应用程序解决。
这也意味着请求不是针对某个端口的;他们是
针对通过特定连接(数据流)发送。单独的 TCP 数据包本身没有意义;它们总是被重新组合成连续的数据流。您已经注意到每个数据包都带有目标端口号和源端口号,将其标识为属于特定连接。(注意:它们并不完全区分特定的客户端,因为单个客户端可能会打开多个连接;相反,它们会区分特定的数据流。)所以这个问题真的不再与端口有关——唯一要问的是运行在 TCP 上的协议如何区分同一连接上的多个请求。
有些协议甚至一开始就不是面向请求的——它们可能是面向命令的,比如 FTP 或 SMTP;或者他们可能会混合使用有响应和无响应的请求,例如 SSH;或者他们可能会传输非结构化数据,这些数据可能看起来根本不像是由不同的请求生成的,例如简单的 Telnet。
一些协议,如 HTTP/1.0 或 Gopher 或 WHOIS,每个连接只允许一个请求。一旦服务器发送了响应,它就会关闭连接,客户端必须再次连接(使用新的 TCP src/dst 端口对)。
HTTP/1.1 支持长连接,但一次仍然只有一个请求。客户端在发送第二个请求之前必须等待第一个响应完成。(现在需要区分多个响应:对于常规资源,HTTP 客户端使用“Content-Length”标头来了解响应何时完成,并且使用“分块”格式发送“不定长度”响应。)
还有一个称为“流水线”的 HTTP/1.1 扩展,它允许多个请求被堆叠并一次发送。它的机制很简单:响应以与请求完全相同的顺序到达。(但请注意,虽然大多数 HTTP 客户端使用长期连接,但它们不使用 HTTP 流水线,因为事实证明它提供的问题多于解决方案。)
一些协议在 TCP 提供的流之上添加它们自己的多路复用。目前最著名的例子是 HTTP/2,它在单个 TCP 连接上有一个“流”系统——每个请求和响应都被分配了自己的流,分成小块,这些块带有它们的长度和流 ID。接收方可以根据流 ID 重新组合来区分多个请求……这实际上反映了 TCP 的工作方式。
DNS 等其他协议更简单,但具有相同的一般概念;通过 TCP 的 DNS 请求或响应以其自己的字节长度为前缀,因此接收方确切知道第一个请求有多少字节,因此知道第二个请求从哪里开始。响应再次携带一个“请求 ID”,客户端可以知道哪个响应属于哪个请求。
所以一般来说,有两种常见的格式来分隔单个 TCP 连接或其他传输流上的多个请求:
基于行,其中每个数据包都以换行符或其他特殊字符终止或分隔。IRC、FTP(控制)、SMTP 大多是基于线路的。
基于长度的,其中每个数据包都以其自己的字节长度为前缀。SSH、DNS、git://、HTTP/2 是基于长度的。
HTTP/1.x 是两者的不幸组合:请求/响应标头是基于行的,但正文是基于长度的。
还有其他怪人,例如 IMAP 是基于行的,除非它不是。
并且有两种常用的方法来处理多个请求并整理出相应的响应(如果协议允许的话):
流水线——客户端可以按特定顺序提交多个请求,并且响应以完全相同的顺序到达。
所以在 HTTP/1.1 中,如果客户端请求页面 A、页面 B、页面 C,那么服务器总是按页面 A、页面 B 和页面 C 的顺序响应。
多路复用——客户端可以提交多个带有单独“请求 ID”的请求,并且响应可以以任何顺序到达,因为每个响应都带有提示它的原始“请求 ID”。
例如,在 DNS 中,客户端可以请求 google.com/A (req#1234) 和 facebook.com/AAAA (req#3456),服务器可能会在处理 req# 之前响应 req#3456 1234.
IMAP 已标记请求/响应,但它也有服务器可能发送的与任何特定请求无关的未经请求的响应(例如推送通知)。
多路复用也可以与“通道 ID”一起使用,如 HTTP/2 和 SSHv2 中的情况。不同之处在于“通道 ID”是长期存在的,并且确实像 TCP 标头中的端口一样工作,而“请求 ID”是短暂的。
在 HTTP/2 中,每个请求都分配了一个流,响应可能会交错——客户端可能会收到一些标记为“流 A”的数据,一些数据标记为“流 B”,然后是流 A 的更多数据。虽然流只携带单个请求/响应,它们仍然由多个不同的消息组成,因此更像是频道 ID。
甚至可能是两者的混合——例如,一个协议可能有多路复用通道,但在每个通道上它可能携带多个标记或流水线请求。
SSHv2 是这样工作的——同一个连接可能有多个交互式 shell 通道(非结构化)、SFTP 通道(流水线请求/响应)、TCP 转发通道(非结构化)、ssh-agent 转发通道(流水线请求/响应)等等.