我正在使用 webalizer-2.23-04-cygwin,这是我能找到的最新二进制文件,它在我拥有的某个 900MB 日志文件上做同样的事情,旧版本也在做同样的事情。它只显示前 411 次点击,下午 6 点左右之前的所有内容,并不是说这有什么特别之处,至少当我自己查看日志文件的行时,我看不出有什么不同。
我正在使用仅进行以下更改的 sample.conf 文件:
- 输出目录
- 增量是——在某处阅读这可能有助于解决这个问题,但没有
- 真的很安静 是的
后者是因为我收到了一些“用户名被截断”的消息,但我的日志文件甚至没有用户名,前 411 行与否。
示例第 407 行:
10.0.1.1 - - [24/Sep/2010:17:42:27 -0400] "GET /home/ HTTP/1.1" 200 13382 "http://intapp/task5394" "Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US; rv:1.9.2.10) Gecko/20100914 Firefox/3.6.10"
示例第 435 行:
10.0.1.1 [24/Sep/2010:18:20:17 -0400] "GET /home/ HTTP/1.1" 200 11644 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US; rv:1.9.2.10) Gecko/20100914 Firefox/3.6.10"
示例抑制警告:
Skipping bad record (3639)
Warning: Truncating oversized username
我在这里做错了什么?
您的两个示例的日志文件格式不同。由于 webalizer 需要第一种格式,因此它无法解析第二种格式。
在第二个示例中,字段 2 和 3(每个都是一个
-
here)已被删除。您有几个选择:您可以编辑日志文件以替换缺失的字段,或者您可以更改 webalizer 的配置以忽略缺失的字段。无论哪种方式,您几乎都必须在此更改处拆分日志文件才能使用它。