AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 1106642
Accepted
brr3
brr3
Asked: 2019-01-04 09:01:45 +0800 CST2019-01-04 09:01:45 +0800 CST 2019-01-04 09:01:45 +0800 CST

如何使用 1 个命令从包含此名称的每一行中获取唯一名称列表和数字总和?

  • 772

问题

我有一个格式如下的日志文件:

2018/12/05 22:43:14 [ChestShop] User bought 1 Boat for 8.00 from Admin Shop at [...] -246, 65, 61
2019/01/02 10:09:38 [ChestShop] User sold 64 Sea Lantern for 27840.00 to Admin Shop at [...] -234, 61, 45
2019/01/02 10:09:38 [ChestShop] User sold 48 Sea Lantern for 20880.00 to Admin Shop at [...] -234, 61, 45
2019/01/02 10:09:42 [ChestShop] User sold 2 Prismarine Bricks for 248.00 to Admin Shop at [...] -233, 62, 45

我想从中提取某些信息并将它们显示在汇总列表中。

我想总结的信息是名称、数量和销售价值。销售价值是列出数量的总销售价值。名称(Sea Lantern、Prismarine Bricks 等)以及数量(名称左侧的数字)和销售价值( “for”右侧的数字)可以多次出现在此日志文件中。名称可能包含多个空格(从不超过 4 个)或根本没有。

... ... [...] ... ... 2 Prismarine Bricks ... 248.00 ... ... ... ... [...] ..., ..., ...

最好,我希望摘要看起来像:

totalQuantity1 uniqueName1 totalSellValue1
totalQuantity2 uniqueName2 totalSellValue2

根据对命令的微小更改,按 totalQuantity 或 totalSellValue 排序。

我解决问题的尝试

我发现我可以使用以下命令来获取最常出现的项目的列表以及它们在日志文件中出现的次数,按它们出现的次数排序(这不是我想要的):

cat ChestShop.log | grep -w sold | cut -d ' ' -f 7,8,9,10,11 | awk -F 'for' '{print $1}' | sort | uniq -c | sort -rn

该grep -w sold命令仅用于区分买入和卖出,从上面的日志示例中可以看出,在比较买入和卖出时,只有两个词不同。

我还使用此命令从仅包含该项目数量的列表中汇总一个特定项目的数量:

cat ChestShop.log | grep -w sold | grep -w 'Magma Block' | cut -d ' ' -f 6 | paste -s -d+ - | bc

我已经尝试了无数其他对上述命令的修改,但还没有接近我想要的,上面的命令是我得到的最接近的。最好命令也应该尽可能短,或者如果这很困难,对命令的每个部分进行解释,以便我可以理解发生了什么(特别是如果 awk 以我使用过的任何其他方式使用) , 谢谢。

很感谢任何形式的帮助。

command-line log bash extract
  • 1 1 个回答
  • 203 Views

1 个回答

  • Voted
  1. Best Answer
    steeldriver
    2019-01-04T09:56:24+08:002019-01-04T09:56:24+08:00

    使用普通的 awk,您可以执行以下操作:

    $ awk '$5 == "sold" {
        q[$7 FS $8] += $6; v[$7 FS $8] += $6 * $10
      } 
      END {
        for (item in q) print q[item], item, v[item]
      }' ChestShop.log 
    2 Prismarine Bricks 496
    112 Sea Lantern 2784000
    

    使用 GNU Awk ( gawk) 4.0+ 版,您可以按如下方式控制排序顺序:

    gawk '$5 == "sold" {
        q[$7 FS $8] += $6; v[$7 FS $8] += $6 * $10
      } 
      END {
        PROCINFO["sorted_in"] = "@val_num_desc";
        for (item in q) print q[item], item, v[item]
      }' ChestShop.log 
    

    (按数量降序排列)或

    gawk '$5 == "sold" {
        q[$7 FS $8] += $6; v[$7 FS $8] += $6 * $10
      } 
      END {
        PROCINFO["sorted_in"] = "@val_num_asc";
        for (item in v) print q[item], item, v[item]
      }' ChestShop.log 
    

    (按值升序排序)。请注意,所有这些都假定您的文件格式如最初所示,每个项目的名称由第 7 个和第 8 个空格分隔的字段组成。如果不是,那么您可能需要使用正则表达式对其进行解析并捕获元素 - 例如,使用 GNU Awk:

    gawk 'match($0, /sold ([0-9]+) (.*) for ([0-9.]+)/, m) {
        q[m[2]] += m[1]; v[m[2]] += m[3]
      } 
      END {
        PROCINFO["sorted_in"] = "@val_num_asc";
        for (item in v) print q[item], item, v[item]
      }' ChestShop.log
    

    请注意,这假定 keyordfor不能出现在该行的其他位置。

    如果您无权访问 GNU Awk,那么使用另一个正则表达式工具对文件进行预处理以插入适当的分隔符可能会更简单,这样您就可以使用带有该分隔符的 POSIX awk。

    • 1

相关问题

  • 如何从命令行仅安装安全更新?关于如何管理更新的一些提示

  • 如何从命令行刻录双层 dvd iso

  • 如何从命令行判断机器是否需要重新启动?

  • 文件权限如何工作?文件权限用户和组

  • 如何在 Vim 中启用全彩支持?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve