grep 从 $START 到 $END 的一组行并且在 $MIDDLE 中包含匹配项

Question

Vishu1511

Asked: 2020-02-20 22:16:22 +0800 CST2020-02-20 22:16:22 +0800 CST 2020-02-20 22:16:22 +0800 CST

从文本文件中删除空格和连字符

772

我现在拥有的文本文件如下所示，

VOG0005              -          k141_44786_1         -            4.9e-11   41.0   0.0     2e-08   32.4   0.0   2.0   2   0   0   2   2   2   2 -   
VOG0005              -          k141_46357_20        -            9.2e-44  148.8   1.7   2.4e-32  111.2   0.2   3.0   2   1   1   3   3   3   3 -   
VOG0010              -          k141_1081_2          -            1.2e-06   27.4   0.5   0.00011   21.0   0.0   2.3   2   0   0   2   2   2   2 -
VOG0010              -          k141_17432_67        -            1.2e-07   30.7   0.0   1.7e-07   30.2   0.0   1.3   1   1   0   1   1   1   1 -
VOG0010              -          k141_2610_7          -            2.1e-06   26.6   0.0   2.9e-06   26.2   0.0   1.1   1   0   0   1   1   1   1

该命令是否将sort连字符和中间的空格计为单独的列？如果是，那么如何使用该cut命令删除其间的连字符？

VOG0005 - k141_44786_1 - 4.9e-11

得到这样的东西

VOG0005 k141_44786_1 4.9e-11

即，一个空间对我有用。我尝试了一个命令：cut -f2 File.txt，但在我的情况下似乎不起作用。

有人可以帮忙吗？

3 个回答

Voted

Ghansham Mahajan · Answer 1 · 2020-02-20T22:44:17+08:00

Best Answer

Ghansham Mahajan

2020-02-20T22:44:17+08:002020-02-20T22:44:17+08:00

您可以使用 sed 命令删除带有 spac 的连字符。

sed 's/- //g'

请参考以下示例

# cat example.txt
VOG0005 - k141_44786_1 - 4.9e-11 41.0 0.0 2e-08 32.4 0.0 2.0 2 0 0 2 2 2 2 -
VOG0005 - k141_46357_20 - 9.2e-44 148.8 1.7 2.4e-32 111.2 0.2 3.0 2 1 1 3 3 3 3 -
VOG0010 - k141_1081_2 - 1.2e-06 27.4 0.5 0.00011 21.0 0.0 2.3 2 0 0 2 2 2 2 -
VOG0010 - k141_17432_67 - 1.2e-07 30.7 0.0 1.7e-07 30.2 0.0 1.3 1 1 0 1 1 1 1 -
VOG0010 - k141_2610_7 - 2.1e-06 26.6 0.0 2.9e-06 26.2 0.0 1.1 1 0 0 1 1 1 1 -

# sed 's/- //g' example.txt
VOG0005 k141_44786_1 4.9e-11 41.0 0.0 2e-08 32.4 0.0 2.0 2 0 0 2 2 2 2 -
VOG0005 k141_46357_20 9.2e-44 148.8 1.7 2.4e-32 111.2 0.2 3.0 2 1 1 3 3 3 3 -
VOG0010 k141_1081_2 1.2e-06 27.4 0.5 0.00011 21.0 0.0 2.3 2 0 0 2 2 2 2 -
VOG0010 k141_17432_67 1.2e-07 30.7 0.0 1.7e-07 30.2 0.0 1.3 1 1 0 1 1 1 1 -
VOG0010 k141_2610_7 2.1e-06 26.6 0.0 2.9e-06 26.2 0.0 1.1 1 0 0 1 1 1 1 -

0

annahri · Answer 2 · 2020-02-20T23:21:59+08:00

与类似sed，您也可以使用perl：

$ cat File.txt | tr -s " " | perl -pe 's/[[:space:]]-//g' | sponge File.txt
VOG0005 k141_44786_1 4.9e-11 41.0 0.0 2e-08 32.4 0.0 2.0 2 0 0 2 2 2 2
VOG0005 k141_46357_20 9.2e-44 148.8 1.7 2.4e-32 111.2 0.2 3.0 2 1 1 3 3 3 3
VOG0010 k141_1081_2 1.2e-06 27.4 0.5 0.00011 21.0 0.0 2.3 2 0 0 2 2 2 2
VOG0010 k141_17432_67 1.2e-07 30.7 0.0 1.7e-07 30.2 0.0 1.3 1 1 0 1 1 1 1
VOG0010 k141_2610_7 2.1e-06 26.6 0.0 2.9e-06 26.2 0.0 1.1 1 0 0 1 1 1 1

或者

<File.txt tr -s " " | perl -pe 's/[[:space:]]-//g' | sponge File.txt

# on fish shell
tr -s " " <File.txt | perl -pe 's/[[:space:]]-//g' | sponge File.txt

解释

tr -s " "                    
# Removes extra spaces
perl -pe 's/[[:space:]]-//g' 
# Replaces any ' -' with nothing
sponge File.txt              
# Reads standard input and writes it out to the specified file.

显然，您可以仅使用perl（感谢@ Stéphane Chazelas）获得相同的结果：

perl -pi -e 's/ +/ /g; s/[[:space:]]-//g' File.txt

同样sed：

sed -i -E 's/ +/ /g; s/[[:space:]]-//g' File.txt

请参阅@Stéphane Chazelas 评论以获取解释

G-Man Says 'Reinstate Monica' · Answer 3 · 2020-02-21T02:57:44+08:00

G-Man Says 'Reinstate Monica'

2020-02-21T02:57:44+08:002020-02-21T02:57:44+08:00

首先，是的，sort将第一个-视为第 2列，将第 3 个视为k141_xxxx第 3 列，将第二个-视为第 4 列，依此类推。真相是微妙而复杂的。

你的问题并不完全清楚。要破坏第二列和第四列，不管它们是什么，做

awk '{ $2=""; $4=""; print }' example.txt

要破坏任何连字符的字段，请执行

awk '{for (i=1; i<=NF; i++) if ($i == "-") $i = ""; print}' example.txt

awk是矫枉过正（但是，所以是perl）。

0

从文本文件中删除空格和连字符

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

从文本文件中删除空格和连字符

3 个回答

相关问题