根据第一个逗号之前的匹配删除重复行数

Question

Rama Krishna Majety

Asked: 2022-05-09 07:00:00 +0800 CST2022-05-09 07:00:00 +0800 CST 2022-05-09 07:00:00 +0800 CST

AWK 一个班轮将三个字段合并到一个文件中

772

我有一个包含两种类型字段分隔符的记录（行）的文件，|如下!所示：

Name|Age|Physics|Chemistry|Maths|English|Batch!Year!AdmisnNo!Grade!Score
Student1|81|65|70|80|88|EWS!2021!1001!A!75
Student2|72|63|60|50|75|EWS!2021!1002!A!85
Student3|72|63|60|50|75|EWS!2021!1002!A!85

如何合并Batch，Year和AdmisnNo字段如下？

请注意，为简洁起见，我展示了一个有用字段的小列表，因为我的真实文件有许多这样的相关字段。我要删除两个或三个!标记的这个字段不是最后一个，可以是大约 49 个字段总数中的任何字段（6 或 7）。

Name|Age|Physics|Chemistry|Maths|English|BatchYearAdmisnNo!Grade!Score
    Student1|81|65|70|80|88|EWS20211001!A!75
    Student2|72|63|60|50|75|EWS20211002!A!85
    Student3|72|63|60|50|75|EWS20211002!A!85

我要求awk，但是欢迎任何合理的标准命令。

6 个回答

Voted

JdeHaan · Answer 1 · 2022-05-09T07:10:40+08:00

JdeHaan

2022-05-09T07:10:40+08:002022-05-09T07:10:40+08:00

$ cat in | while read -r line ; do line="${line/\!/}" ; echo "${line/\!/}"; done
Name|Age|Physics|Chemistry|Maths|English|BatchYearAdmisnNo!Grade!Score
Student1|81|65|70|80|88|EWS20211001!A!75
Student2|72|63|60|50|75|EWS20211002!A!85
Student3|72|63|60|50|75|EWS20211002!A!85

1

Kusalananda · Answer 2 · 2022-05-09T07:33:22+08:00

$ awk -F '|' 'BEGIN { OFS = FS } { sub("!", "", $NF); sub("!", "", $NF) }; 1' file
Name|Age|Physics|Chemistry|Maths|English|BatchYearAdmisnNo!Grade!Score
Student1|81|65|70|80|88|EWS20211001!A!75
Student2|72|63|60|50|75|EWS20211002!A!85
Student3|72|63|60|50|75|EWS20211002!A!85

这用于从输入的最后一个分隔字段中awk删除前两个字符。!|

NF在代码中使用任意数字代替awk最后一个字段来影响其他字段。

假设只有最后一个字段包含!字符，使用sed：

$ sed -e 's/!//' -e 's///' file
Name|Age|Physics|Chemistry|Maths|English|BatchYearAdmisnNo!Grade!Score
Student1|81|65|70|80|88|EWS20211001!A!75
Student2|72|63|60|50|75|EWS20211002!A!85
Student3|72|63|60|50|75|EWS20211002!A!85

这将删除!每行的第一个。然后它第二次执行完全相同的替换，!也删除了第二次。

反转每一行并连续两次删除第三!行，然后再次反转结果行。这允许其他|以 - 分隔的字段也包含!字符。

$ rev file | sed -e 's/!//3' -e 's///3' | rev
Name|Age|Physics|Chemistry|Maths|English|BatchYearAdmisnNo!Grade!Score
Student1|81|65|70|80|88|EWS20211001!A!75
Student2|72|63|60|50|75|EWS20211002!A!85
Student3|72|63|60|50|75|EWS20211002!A!85

thanasisp · Answer 3 · 2022-05-09T07:40:03+08:00

thanasisp

2022-05-09T07:40:03+08:002022-05-09T07:40:03+08:00

此任务适用于在sed不拆分字段的情况下将第 7 个字段与下一个字段合并：

sed -E 's/|\|!//7' file

再次运行会将第 7 个（最初是第 8 个）与下一个合并。完全：

sed -Ee 's/|\|!//7' -Ee 's/|\|!//7' file

或者更短的时间（由 Philippos 建议），因为如果第一次替换将发生第二次替换：

sed -E 's/\||!//7;s///7' file

也-E用于可移植性，意思是扩展正则表达式。

输出：

Name|Age|Physics|Chemistry|Maths|English|BatchYearAdmisnNo!Grade!Score
Student1|81|65|70|80|88|EWS20211001!A!75
Student2|72|63|60|50|75|EWS20211002!A!85
Student3|72|63|60|50|75|EWS20211002!A!85

请注意，第一次替换后，第 8 个字段变为第 7 个，因此我们7再次使用它。就像做一样sed '' file | sed ''。

此外，您在这里拥有的不同字段分隔符也很方便，并且可以调整以合并几乎任何相邻的字段。

1

Ed Morton · Answer 4 · 2022-05-09T08:48:21+08:00

Ed Morton

2022-05-09T08:48:21+08:002022-05-09T08:48:21+08:00

使用 GNU awk 作为第四个参数split()：

$ awk '{n=split($0,f,/[|!]/,s); s[7]=s[8]=""; for (i=1;i<=n;i++) printf "%s%s", f[i], s[i]; print ""}' file
Name|Age|Physics|Chemistry|Maths|English|BatchYearAdmisnNo!Grade!Score
Student1|81|65|70|80|88|EWS20211001!A!75
Student2|72|63|60|50|75|EWS20211002!A!85
Student3|72|63|60|50|75|EWS20211002!A!85

1

Praveen Kumar BS · Answer 5 · 2022-05-09T21:15:27+08:00

Praveen Kumar BS

2022-05-09T21:15:27+08:002022-05-09T21:15:27+08:00

为上述示例工作并获得所需的输出

sed -e 's/!//1' -e 's/!//1' file.txt

输出

Student1|81|65|70|80|88|EWS20211001!A!75
Student2|72|63|60|50|75|EWS20211002!A!85
Student3|72|63|60|50|75|EWS20211002!A!85

1

Boyd · Answer 6 · 2022-05-12T09:17:28+08:00

Boyd

2022-05-12T09:17:28+08:002022-05-12T09:17:28+08:00

这只是一种可能的 perl 解决方案

perl -pe '@a = split /[|!]/; $_ = join "|", @a[0..5], join("!", join("", @a[6..8]), @a[9,10]);' file

用一系列joins 编写，所以如果你的用例变得更复杂，比如说你想删除数学，你只需删除那个索引 (4)

perl -pe '@a = split /[|!]/; $_ = join "|", @a[0..3,5], join("!", join("", @a[6..8]), @a[9,10]);'

它似乎比连接字段并在重新组合之前将额外的字段从数组中拼接出来更整洁。

1

AWK 一个班轮将三个字段合并到一个文件中

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

AWK 一个班轮将三个字段合并到一个文件中

6 个回答

相关问题