如何在没有 sudo 的情况下使用 docker？

Question

deepblue_86

Asked: 2019-04-25 06:36:39 +0800 CST2019-04-25 06:36:39 +0800 CST 2019-04-25 06:36:39 +0800 CST

删除文本文件中最后重复的行

772

我有一个如下的文本文件；

ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.5 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.6 4212835.9 -2545104.6
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
CPVG00CPV_R_20183460000.gz 5626883.3 -2380932.2 1824483.1

在这个文件中，ALIC00AUS_R_20183350000.gz分别CPVG00CPV_R_20183460000.gz 重复六次和三次。我需要删除第 1 列中每个字符串的最后重复行，输出应如下所示；

ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.5 4212836.0 -2545104.6
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9

3 个回答

Voted

steeldriver · Answer 1 · 2019-04-25T07:11:42+08:00

Best Answer

steeldriver

2019-04-25T07:11:42+08:002019-04-25T07:11:42+08:00

如果您确定每个$1（第一列）至少重复一次，那么您可以：

颠倒行的顺序
只选择那些$1 以前见过的行
反转结果

前任。

$ tac file | awk 'seen[$1]++' | tac
ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.5 4212836.0 -2545104.6
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9

2

RaidPinata · Answer 2 · 2019-04-25T07:29:44+08:00

RaidPinata

2019-04-25T07:29:44+08:002019-04-25T07:29:44+08:00

如果您可以满足@steeldriver 提供的答案中的保证，那是更好的解决方案，如果不使用此脚本。

##!/usr/bin/awk -f
{
  if (!seen[$1]++) {
    line = $0
    prev = $1
  }
  else {
    if (prev == $1) print line
    line = $0
  }
}
END { if (prev != $1) print line }

2

RaidPinata · Answer 3 · 2019-04-25T06:43:57+08:00

RaidPinata

2019-04-25T06:43:57+08:002019-04-25T06:43:57+08:00

awk 是做这种替换的首选程序。

要删除在第一列中有重复的行，应该这样做。

awk '!seen[$1]++' filename > outputfile

如果您需要删除完全重复的行，请改用它。

awk '!seen[$0]++' filename > outputfile

如本答案所示：https ://unix.stackexchange.com/questions/171091/remove-lines-based-on-duplicates-within-one-column-without-sort

这是一个简短的解释。awk 用于模式扫描和文本处理。首先，它检查第 1 列 ($1) 中的值是否在所看到的地图中。如果不是，它会将该行打印到输出文件，或者如果您不重定向（> 输出文件）则显示屏幕。下一部分是将已查看的列信息添加到已查看 (++) 中，以便可以使用下一个模式进行搜索。

0

删除文本文件中最后重复的行

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？

删除文本文件中最后重复的行

3 个回答

相关问题

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？