我正在使用 awk 来分析一些访问日志文件。我目前正在使用以下内容:
awk '($9 ~ /404/)' access_log | awk '{print $9,$7}' | sort | uniq -c | sort > 404.txt
它会返回我的访问日志中的所有 404 以及出现次数。但是,它绝对会返回所有内容——但我只对 html 页面感兴趣。
如何修改它以仅返回以 .html 结尾的请求的值?
我正在使用 awk 来分析一些访问日志文件。我目前正在使用以下内容:
awk '($9 ~ /404/)' access_log | awk '{print $9,$7}' | sort | uniq -c | sort > 404.txt
它会返回我的访问日志中的所有 404 以及出现次数。但是,它绝对会返回所有内容——但我只对 html 页面感兴趣。
如何修改它以仅返回以 .html 结尾的请求的值?
您可以添加另一个正则表达式: