itsadok Asked: 2009-10-27 02:00:00 +0800 CST2009-10-27 02:00:00 +0800 CST 2009-10-27 02:00:00 +0800 CST 我可以让 apache 只记录请求的样本吗? 772 我的 apache 日志文件变得太大,我正在寻找使它们更易于管理的方法。 我知道我可以使用条件日志记录仅记录对特定类型文件的访问,但记录请求的随机样本似乎更有意义,这样我仍然可以了解正在发生的事情而不必记录每个单个请求。 有类似的东西吗? 我在 ubuntu 8.04 上使用 apache 2,并使用cronolog进行日志轮换。 apache-2.2 3 个回答 Voted Dom 2009-10-27T02:27:39+08:002009-10-27T02:27:39+08:00 为什么不更频繁地轮换日志?如果每周轮换给您太多日志,请每天转动它们。如果每天,每小时转动一次。这个解决方案的问题在于日志分析器,比如 webalizer :它们需要进行相应的配置。 我更喜欢记录一切,因为当你遇到问题时,你永远不会有太多信息。并且以实际的磁盘价格,对我来说没有容量问题。 heferav 2009-10-27T02:20:01+08:002009-10-27T02:20:01+08:00 您可以通过 LogFormat 指令控制日志格式。 如果体积是问题,请考虑http://www.mrunix.net/webalizer/,您可以运行 cron 作业并生成漂亮的图形。我认为它甚至可以查看已被 logrorate 压缩的旧日志。 假设日志文件中存在随机分布的错误消息,您可以在日志中每隔 20 行打印一次,例如 perl -ne 'print unless (0 != $. % 20)' logfile.txt Best Answer Niels Basjes 2009-10-27T07:52:58+08:002009-10-27T07:52:58+08:00 我可以想到三个减少日志文件大小的选项。 使日志更小我压缩它们。AFAIK 这是一个 syslogd 选项。 只记录可能有用的东西。最干净的方法是根据完整的 URL 消除您知道无用的请求(如图像、css、js 等)(这样可以防止意外的黑客攻击)。 使 Apache 只记录流量的一个子集。 一种可能的方法是您提到的条件日志记录。现在条件日志使用了 SetEnvIf Apache 特性。SetEnvIf状态的实际语法规范: SetEnvIf attribute regex [!]env-variable[=value] [[!]env-variable[=value]] ... 那么如何使用它来创建一个仅匹配 Remote_Addr 的“偶数”(或“奇数”)IP 地址的表达式?您可以通过进一步限制 IP 范围来进一步削减它。 当然,您也可以在这里查看您提出问题的原因:是什么让日志文件“太大”和“难以管理”?他们为您保留了哪些信息?
为什么不更频繁地轮换日志?如果每周轮换给您太多日志,请每天转动它们。如果每天,每小时转动一次。这个解决方案的问题在于日志分析器,比如 webalizer :它们需要进行相应的配置。
我更喜欢记录一切,因为当你遇到问题时,你永远不会有太多信息。并且以实际的磁盘价格,对我来说没有容量问题。
您可以通过 LogFormat 指令控制日志格式。
如果体积是问题,请考虑http://www.mrunix.net/webalizer/,您可以运行 cron 作业并生成漂亮的图形。我认为它甚至可以查看已被 logrorate 压缩的旧日志。
假设日志文件中存在随机分布的错误消息,您可以在日志中每隔 20 行打印一次,例如
我可以想到三个减少日志文件大小的选项。
一种可能的方法是您提到的条件日志记录。现在条件日志使用了 SetEnvIf Apache 特性。SetEnvIf状态的实际语法规范:
那么如何使用它来创建一个仅匹配 Remote_Addr 的“偶数”(或“奇数”)IP 地址的表达式?您可以通过进一步限制 IP 范围来进一步削减它。
当然,您也可以在这里查看您提出问题的原因:是什么让日志文件“太大”和“难以管理”?他们为您保留了哪些信息?