复制大量文件时出现“参数列表太长”错误

Question

user5967

Asked: 2009-09-18 07:51:28 +0800 CST2009-09-18 07:51:28 +0800 CST 2009-09-18 07:51:28 +0800 CST

使用 grep 从文件中删除重复行

772

我想删除第二列是 05408736032 的所有行。

0009300|05408736032|89|01|001|0|0|0|1|NNNNNNNYNNNNNNNNNN|asdf|
0009367|05408736032|89|01|001|0|0|0|1|NNNNNNNYNNNNNNNNNN|adff|

5 个回答

Voted

SergeyZh · Answer 1 · 2009-09-18T08:22:32+08:00

SergeyZh

2009-09-18T08:22:32+08:002009-09-18T08:22:32+08:00

awk -F \| '{if ($2 != 05408736032) print}'

9

wallenborn · Answer 2 · 2009-09-18T08:30:58+08:00

Best Answer

wallenborn

2009-09-18T08:30:58+08:002009-09-18T08:30:58+08:00

这可能会做你想要的：

sort -t '|' -k 2,2 -u  foo.dat

但是，这会根据您可能不想要的字段对输入进行排序。如果您真的只想删除重复项，最好的选择是 Perl：

perl -ne '$a=(split "\\|")[1]; next if $h{$a}++; print;' foo.dat

3

Dennis Williamson · Answer 3 · 2009-09-18T10:50:47+08:00

Dennis Williamson

2009-09-18T10:50:47+08:002009-09-18T10:50:47+08:00

纯重击：

oldIFS=$IFS
while read line
do
    IFS=$'|'
    testline=($line)  # make an array split according to $IFS
    IFS=$oldIFS       # put it back as soon as you can or you'll be sooOOoorry
    if [[ ${testline[1]} != "05408736032" ]]
    then
        echo $line
    fi
done < datafile

1

Cian · Answer 4 · 2009-09-18T08:19:19+08:00

是否要删除第二个 | 的所有行？分隔字段包含“05408736032”？所有行的格式都相同吗？如果是这样，这应该输出文件减去那些行（它是 perl 将原始文件作为第一个参数，并将它的文件作为第二个参数）。

#!/usr/bin/perl
use warnings;
use strict;
my  ($file1, $file2) = @ARGV;
open my $origin_file, '<', $file1;
open my $newfile, '>', $file2;
while (my $line = <$origin_file>) {
    my @values = split '/|/', $line;
    print $newfile $line unless $vaules[1] = '05408736032';
}
close $newfile or die $!;
close $origin_file or die $!;

（我还没有测试过，所以你可能想在尝试之前备份原始文件）

再次阅读时，您可能只想抓取具有唯一第二列的行。这应该这样做。

#!/usr/bin/perl
use warnings;
use strict;
my  ($file1, $file2) = @ARGV;
open my $origin_file, '<', $file1;
open my $newfile, '>', $file2;
while (my $line = <$origin_file>) {
    my @values = split '/|/', $line;
    print $newfile $line unless defined $unique{$values[1]};
    $unique{$vaules[1]} += 1;
}
close $newfile or die $!;
close $origin_file or die $!;

pjz · Answer 5 · 2009-09-18T08:20:14+08:00

pjz

2009-09-18T08:20:14+08:002009-09-18T08:20:14+08:00

您可以执行以下操作：

for f in `cat $file`; do 
  val=`echo $f | cut -d\| -f 2`
  if [ `grep $val $file | wc -l` -lt 2 ]; then
     echo $f
  fi
done

但是，像大多数 shell 脚本一样，它的效率很低。你最好用 perl 来做，比如：

@infile=<>;

foreach (@infile) {

  @foo = split(/|/);
  if exists $found{$foo[1]} {
    $found{$foo[1]}++;
  } else {
    $found{$foo[1]}++;
  }

}

foreach (@infile) {
  @foo = split(/|/);
  if ($found{$foo[1]} < 2) {
    print $_;
  }
}

0

使用 grep 从文件中删除重复行

SFTP 使用什么端口？

从 IP 地址解析主机名

如何按大小对 du -h 输出进行排序

命令行列出 Windows Active Directory 组中的用户？

Windows 中执行反向 DNS 查找的命令行实用程序是什么？

如何检查 Windows 机器上的端口是否被阻塞？

我应该打开哪个端口以允许远程桌面？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

使用 grep 从文件中删除重复行

5 个回答

相关问题