有没有办法让 ls 只显示某些目录的隐藏文件？

Question

Aayush Jain

Asked: 2022-06-26 22:35:03 +0800 CST2022-06-26 22:35:03 +0800 CST 2022-06-26 22:35:03 +0800 CST

将多行汇总为单行

772

如何将 csv 文件中的多行汇总为 1 行？我已经尝试在 SQL 中进行查询并且它可以工作，但我不确定如何在 Linux 中实现相同的效果。

这是我当前文件的外观：

swainb02,Ben Swain,1015
swainb02,Ben Swain,1016
swainb02,Ben Swain,1018
swainb02,Ben Swain,1020
shaiks21,Sarah Shaikh,0073
shaiks21,Sarah Shaikh,0080
shaiks21,Sarah Shaikh,0082

有多个用户可以访问多个区号。我正在寻找的是该文件的更简单版本，以提高可读性。

期望的输出：

swainb02,Ben Swain,1015,1016,1018,1020
shaiks21,Sarah Shaikh,0073,0080,0082

知道如何解决吗？谢谢

5 个回答

Voted

RudiC · Answer 1 · 2022-06-27T02:49:44+08:00

RudiC

2022-06-27T02:49:44+08:002022-06-27T02:49:44+08:00

在结果上运行一个小awk脚本：

awk -F, '
$1$2 != Last    {printf DL "%s", $0
                 Last=$1$2
                 DL=ORS
                 next
                }
                {printf ",%s", $3
                }
END             {print ""
                }
' file
swainb02,Ben Swain,1015,1016,1018,1020
shaiks21,Sarah Shaikh,0073,0080,0082

它打印一次新用户的数据，然后附加区号，直到遇到下一个用户。

1

Kusalananda · Answer 2 · 2022-06-27T04:32:28+08:00

Kusalananda

2022-06-27T04:32:28+08:002022-06-27T04:32:28+08:00

假设输入是没有嵌入逗号、换行符或引号的简单 CSV，我们可以使用 GNUdatamash按前两个逗号分隔的字段分组并折叠第三个字段：

$ datamash -t, groupby 1,2 collapse 3 <file
swainb02,Ben Swain,1015,1016,1018,1020
shaiks21,Sarah Shaikh,0073,0080,0082

这假定数据在前两个字段上排序（或者将一起排序的记录在文件中彼此相邻，如示例数据中所示）。如果不是，则sort -t, -k 1,2首先传递数据，或使用datamash其-s(or --sort) 选项。

1

Ed Morton · Answer 3 · 2022-07-02T02:33:28+08:00

Best Answer

Ed Morton

2022-07-02T02:33:28+08:002022-07-02T02:33:28+08:00

假设您的输入按问题中所示的键值分组（如果不只是先对输入进行排序）然后在每个 Unix 机器上的任何 shell 中使用任何 awk 并且无论您的输入文件有多大，都几乎不使用内存：

$ cat tst.awk
BEGIN { FS=OFS="," }
{ curr = $1 OFS $2 }
curr != prev {
    printf "%s%s", ors, curr
    prev = curr
    ors = ORS
}
{ printf "%s%s", OFS, $3 }
END { printf ors }

$ awk -f tst.awk file
swainb02,Ben Swain,1015,1016,1018,1020
shaiks21,Sarah Shaikh,0073,0080,0082

1

Marcus Müller · Answer 4 · 2022-06-27T02:18:57+08:00

Marcus Müller

2022-06-27T02:18:57+08:002022-06-27T02:18:57+08:00

我已经尝试在 SQL 中计算查询并且它有效

伟大的。然后在sqlite :memory:没有文件支持数据库的情况下运行工作（假设没有数十亿行，这应该没问题）。在那里，运行（或只是将此程序通过管道传输到解释器中）

.mode csv
.import yourfile.csv users
SELECT … FROM users …; # this is the SQL query that already works!

完毕。该sqlite3客户端几乎在任何地方都可用，我将其称为最类似于 UNIX 的方法，它使用结构化查询语言解释器来执行这样的结构化查询。总而言之，你可以在你的 shell 中输入这个（bash/dash/zsh 和类似的）：

function runmyquery() {
sql="
.mode csv
.import $1 users
SELECT … FROM users …; # replace with your query!
"
echo "${sql}" | sqlite3 :memory: 
}

之后，您可以运行runmyquery myfile.csv并获得结果。sqlite3也可以交互使用。

0

r_31415 · Answer 5 · 2022-06-27T14:06:31+08:00

r_31415

2022-06-27T14:06:31+08:002022-06-27T14:06:31+08:00

无论行的顺序如何，这个 awk 版本都可以工作：

{
  if ($1 "," $2 in a) {
    a[$1 "," $2] = a[$1 "," $2] "," $3
  } else {
    a[$1 "," $2] = $3
  }
}

END {
  for (i in a) {
    print i, a[i]
  }
}

另一方面，csvkit 输出更正确的结果：

csvsql -H -d ',' --query 'SELECT a,b, GROUP_CONCAT(c) as c FROM data GROUP BY a, b' data.txt
a,b,c
shaiks21,Sarah Shaikh,"73.0,80.0,82.0"
swainb02,Ben Swain,"1015.0,1016.0,1018.0,1020.0"

尽管没有引号看起来更好，但另一个示例很容易导致每行的字段数量不同。对于进一步处理，非常需要具有分隔的第三字段的输出。

0

将多行汇总为单行

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

将多行汇总为单行

5 个回答

相关问题