我一直使用 apache 基准测试来大致了解我的服务器每秒可以处理多少个请求。我读到它很好,而且似乎运作良好。
输入完全基于事件的 node.js,因此它永远不会阻塞。如果我在一个简单的 hello world 服务器上运行 apache 基准测试,它每秒可以处理 2500 个左右的请求。
但是,如果我在 hello world 函数中设置超时,使其在 2 秒后响应,则 apache 基准测试报告的吞吐量显着降低:大约 50/s。我正在与 ab 运行 100 个并发连接。如果我增加并发性,它就会上升。这是有道理的,因为 apache 基准测试基本上是分批发送 100 个请求,每 2 秒返回一次。100 个请求/2 秒 = 50 个请求/秒
如果我将并发增加到大约 400 或 500,它就会开始崩溃。我认为我没有达到 node.js 的限制,我认为我在我的操作系统中打开文件描述符或套接字或其他东西的数量遇到了障碍。
有什么方法可以很好地猜测我的服务器可以处理多少个请求?我想确保测试计算机不是导致问题的计算机。
有几件事,可能并不完全相关。
首先,由于您必须保持 500 个连接打开几秒钟,您可能会达到打开文件描述符的最大数量,可能设置为 1024。检查日志文件,如果您可能看到类似
too many open files
. 尝试编辑/etc/security/limits.conf
并增加 apache 用户的文件描述符数量。其次,在我看来,您的测试并不代表您期望的用法。您正在测试一个系统,其中准备页面需要很长时间(例如,需要复杂的数据库查询)并且客户端耐心等待它,而不是事件驱动的页面。我不知道node.js,但我假设它会根据需要从服务器请求数据,在几个小请求中,每个请求对于服务器来说都是独立的。是否也有大查询?他们是如何处理的?客户端等待它们还是轮询服务器以检查状态?
对于测试,
ab
它可以做的似乎相当有限。您可能想尝试其他实用程序。快速apt-cache search
提出了几个(我没用过),比如httperf
,hammerhead
也许其他在网络测试方面更有经验的人会加入进来。
“它开始崩溃”中的“它”是什么?服务器上的基准测试工具或其他东西?您是否直接从失败的组件或输出到日志文件中获得任何异常报告?
如果问题是
ab
(基准程序)不喜欢那么多活动连接,请尝试同时运行多个实例。如果是操作系统(或操作系统之间
ab
的某些交互)施加了限制,请尝试多个副本ab
但分布在不同的机器上。如果您没有任何备用物理机可供尝试,同一主机上的虚拟机可能会工作。在任何一种情况下(服务器端或客户端),您对打开套接字数量的限制等都可能是正确的。
使用 IBM RATIONAL PERFORMANCE TESTER 测试服务器吞吐量,它将以图形和表格的形式为您提供结果,显示接收的字节数和发送的字节数