我们有一个在Glassfish应用服务器集群上运行的基于 Java EE 的 Web 应用程序。传入的流量主要是对我们应用程序资源的基于 XML 的表示的 RESTful 请求,但可能有 5% 的流量可能是基于 JSON 或 XHTML/CSS 的表示。
我们现在正在研究负载平衡解决方案,以在集群中的 Glassfish 实例之间分配传入流量。我们还在研究如何使用 memcached 卸载集群,memcached 是一种内存分布式哈希映射,其键是 REST 资源名称(例如,“/user/bob”、“/group/jazzlovers”),其值为相应的 XML 表示。
一种听起来很有希望的方法是用一块石头杀死两只鸟,并使用轻量级、快速的nginx HTTP 服务器/反向代理。Nginx 将通过首先在 memcached 中查找其 URI 来处理每个传入请求,以查看是否已经存在未过期的 XML 表示。如果没有,nginx 会将请求发送到 Glassfish 实例之一。这篇简短的文章中描述了 nginx memcached 模块。
你对 nginx 和 memcached 这样使用的总体印象如何,你对它们有多满意?您发现哪些资源对了解它们最有帮助?如果您尝试了它们并且它们不适合您的目的,为什么不呢?您改用了什么?
注意:这是一个相关的问题。在我知道 ServerFault 之前,我在StackOverflow上问过这个问题。
编辑:到目前为止,这里的所有答案都非常有帮助,尽管没有直接的经验。这个答案最终确实出现在 StackOverflow 上,并且非常看好 nginx/memcached 设置。
你真的应该在你的网络服务器前面使用一个缓存服务器。我推荐清漆缓存。我们在斯堪的纳维亚最大和最繁忙的网站上使用它。我们用 1 个清漆盒和 1 个备用替换了 13 个高负载鱿鱼盒。
我在我的私人网站上对一个简单的应用程序进行了基准测试,它从每秒 9 个请求增加到超过 2000 个。
您决定它在内存中保留多长时间,您可以一直执行到最后,然后在数据更改时向缓存服务器发送一个 http 清除请求。
根据经验,我个人的看法是,如果您使用负载均衡器,您希望将该框完全限制为负载均衡功能。让您的负载均衡器服务内容,即使来自缓存,也会降低高负载情况下的负载均衡功能(更多连接保持活动更长时间,从而降低整体容量和吞吐量)。
我建议让应用程序本身进行查找并提供缓存的内容,并让负载均衡器完成它的工作。话虽如此,nginx 在负载平衡方面并不完美——它只提供了一个非常基本的循环算法。我会推荐 haproxy。如果你需要 SSL 解密服务,根据我的经验,nginx 在 haproxy 前面工作得很好。
如果您需要负载平衡、高可用性等功能,我认为您将走入死胡同。
另外,考虑这样的情况:当用户被授权时,页面看起来不同,为每个用户提供和个性化的附加功能。为了方便链接等,URL 是相同的。例如,当您登录时,经过身份验证的用户不需要输入他的姓名/验证码来发表评论,或者网站在顶部显示您的用户名(如 serverfault)。在这种情况下,nginx 将无法使用,因为您无法区分经过身份验证的用户和未经身份验证的用户。
如果您不需要 SSL,我建议您运行 Varnish。它被设计为 HTTP 加速器,而不是 Web 服务器或代理。如果你需要 SSL,在上面运行 nginx 作为 SSL 加速器,varnish 作为普通的 HTTP 加速器,因为 Varnish 不能处理 SSL。
我认为缓存服务器的选择是特定于应用程序的,如果不对应用程序进行深入分析,您就无法对此做出笼统的评论。
我的选择是 haproxy。非常小而且非常快的反向代理,但不是缓存代理!我用于我的缓存系统“Squid Web 代理”
这项工作非常适合我的网络系统