Eu sempre usei sort -u
para me livrar de duplicatas até agora.
Mas estou com uma dúvida real sobre uma lista gerada por uma ferramenta de software.
A questão é: a saída é sort -u |wc
a mesma que uniq -u |wc
?
Porque eles não produzem os mesmos resultados. O manual para uniq
especifica:
-u, --unique apenas imprime linhas exclusivas
Minha saída consiste em 1110 palavras para as quais sort -u
mantém 1020 linhas e uniq -u 1110
linhas, a quantidade correta. O problema é que não consigo identificar visualmente nenhuma duplicata na lista que é gerada usando >
no final da linha de comando e que há um problema com o total de senhas quebradas (no contexto de personalizar john the ripper).