我们有许多通过 Tomcat 运行的 Web 服务,它们使用 hibernate/mysql。我怀疑他们中的一些人没有正确配置连接池,因为几个小时后,一些单独的应用程序会耗尽连接并停止响应。我们一直在对连接池服务(在本例中为 C3P0)进行更改,但我们仍需要将旧版本的应用程序保留在服务器上以实现向后兼容性。
无论如何,我怀疑这些应用程序也在损害 tomcat 的整体稳定性。大约每周一次,我们的服务器完全停止响应,甚至无法提供静态页面。重新启动服务后,一切都会再次运行几天左右。查看日志几乎没有发现任何未捕获的异常,所以我不确定是什么导致 tomcat 崩溃。遗憾的是,在服务器退出响应之前,错误日志中没有列出任何值得注意的东西。
我们也在考虑改用 JBoss,因为它有点“企业化”,但我不相信它会解决这些问题。是否有任何令人信服的理由来切换网络平台,或者我应该在我们自己的网络应用程序中进一步调试?此外,webapp 是否有可能通过做坏事使应用程序服务器崩溃?
服务器配置:Windows 2003 服务器、Tomcat 6.0.18 + blazeDS 3.0、Hibernate 3.2。
我认为没有人会回答您的问题,而只有线索和想法。这里有一些:
您需要能够检查您服务的每个部分的健康状况的机器人。(测试与数据库的单个连接,获取静态网页,获取动态网页......)。这样,您将看到首先中断或响应时间增加的情况。
你有监控/统计服务吗?您需要跟踪“活动数据库连接数”、“活动 Web 会话数”、“tomcat 线程数”、“可用内存”、CPU ......
我的建议,没有tomcat进程,因为它们都在等待资源(可能是数据库连接,或者它们只是一个无限循环!)。我之前列出的工具肯定会帮助您了解为什么您的服务器每周都在缓慢死机。
netstat
并查看与数据库服务器的连接数(并根据您的池大小和数据库服务器容量检查它)。如果提供静态页面不需要任何数据库访问,那么这似乎不太可能是数据库资源问题。可能是所有池中的线程都卡在某个地方,例如等待数据库驱动器或陷入死锁。我要做的第一件事是使用
jstack
.visualvm
您可以使用或进一步查看该过程jconsole
。只是想补充一点,MyISAM 表的表锁定问题很常见,这很容易导致数据库连接堆积并导致应用程序等待这些结果坐下。
您可能想查看 MySQL 进程列表,看看是否有很多查询处于锁定状态。
# mysqladmin processlist
- 或者 -
mysql> show processlist;
如果锁定是问题所在,您将想看看将问题表上的存储引擎从 MyISAM 更改为 InnoDB 是否可行。
如果您安装lambda probe webapp(获取 1.7 beta),您可以获得线程级监控;密切关注这一点会告诉您线程何时卡住等待数据库,以及许多其他有用的诊断信息。
它有点旧,但在最近的 tomcat 版本中仍然可以正常工作。