我想统计客户要求的大约 10 个不同文件的文件下载量。我们为可以加载到 MySQL 数据库中的 apache 日志生成了单独的日志格式。
对于这样一个特定的查询,我希望能够编写一个 SQL 语句来计算下载量,而不是安装一个过于臃肿的日志分析器。
这是用于 MySQL 日志的日志格式:
LogFormat "\"%a\",%{%Y%m%d%H%M%S}t,%>s,\"%b\",\"%{Content-Type}o\", \"%U\",\"%{Referer}i\",\"%{User-Agent}i\"" mysql
这会产生这种 csv 文件:
"156.107.33.66",20121017113516,200,"10094440","application/x-msdos-program", "/flexnet/FLEXnetWinSetup.exe","http://www.example.com/downloads/flexnet","Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4"
但较大的 100MB+ 文件被分成块,因此它不是简单的日志计数。
有没有人尝试过类似的东西?
如果拆分成块意味着客户端正在使用多个 206 HTTP 响应下载文件,那么您应该尝试记录响应中包含的标头 Content-Range 的内容:
这应该产生这样的东西(未经测试)