Diff nomes de arquivos de dois diretórios?

Question

Yves

Asked: 2018-03-06 22:47:26 +0800 CST2018-03-06 22:47:26 +0800 CST 2018-03-06 22:47:26 +0800 CST

Como escrever a diferença entre dois arquivos em um arquivo

772

Dizendo que tenho dois arquivos: a.txte b.txt.

O conteúdo de a.txt:

hello world

O conteúdo de b.txt:

hello world
something else

Claro que posso usar vimdiffpara verificar a diferença deles, posso ter certeza de que a.txté um subconjunto de b.txt, o que significa que b.txtdeve conter todas as linhas existentes em a.txt(como no exemplo acima).

Minha pergunta é como gravar linhas que existem, b.txtmas não existem em a.txtum arquivo?

4 respostas

Voted

cas · Answer 1 · 2018-03-06T22:57:09+08:00

Best Answer

cas

2018-03-06T22:57:09+08:002018-03-06T22:57:09+08:00

comm -1 -3 a.txt b.txt > c.txt

Exclui -1linhas que estão apenas em a.txt, e -3exclui linhas que estão em ambos. Assim, apenas as linhas exclusivamente em b.txtsão emitidas (consulte man commou comm --helppara obter detalhes). A saída é redirecionada parac.txt

Se você quiser a diferença entre os dois arquivos, use diffem vez de comm. por exemplo

diff -u a.txt b.txt > c.txt

21

Utsav · Answer 2 · 2018-03-06T23:04:29+08:00

Utsav

2018-03-06T23:04:29+08:002018-03-06T23:04:29+08:00

Se você não se importa com o subconjunto, pode usar apenas

diff a.txt b.txt|grep ">"|cut -c 3- > foo.txt

.

$ cat a.txt
hello world
$ cat b.txt
hello world
something else
$ diff a.txt b.txt|grep ">"|cut -c 3- > foo.txt
$ cat foo.txt
something else

6

redseven · Answer 3 · 2022-07-06T05:12:23+08:00

Limitação : este não é um diff de arquivo real, mais como um conjunto de diff de linhas (mas você pode precisar exatamente disso).

Todas as diferenças entre a.txte b.txt:

sort a.txt b.txt | uniq -u > c.txt

Linhas que faltam a.txt(ignorando as linhas que faltam b.txt):

sort a.txt a.txt b.txt | uniq -u > c.txt

Explicação: depois cate sortos 2 arquivos juntos você tem as linhas do subconjunto duplicadas, uniq -umostra apenas as linhas uniq, essas são as linhas que estão presentes apenas em um dos arquivos. A duplicação de uma das entradas ( a.txtacima) suprime todas as linhas existentes nesse arquivo na saída.

A duplicação em qualquer um dos arquivos arruína a saída dos comandos acima, se você tiver duplicatas em seus arquivos, será necessário removê-los primeiro e executar os comandos acima nos arquivos recém-criados:

sort a.txt | uniq | aa.txt
sort b.txt | uniq | bb.txt

Você pode verificar o resultado, este 2 comando deve fornecer a mesma soma de verificação:

sort b.txt c.txt | uniq | sha256sum
sort a.txt c.txt | uniq | sha256sum

Se um dos arquivos for um superconjunto do outro (portanto, possui todas as linhas do outro mais (talvez) mais), você pode simplificar um pouco. Como no seu exemplo, b.txté o superconjunto, portanto, esses 2 comandos também devem fornecer a mesma soma de verificação:

sort b.txt | sha256sum
sort a.txt c.txt | sha256sum

user513977 · Answer 4 · 2022-02-11T21:58:36+08:00

user513977

2022-02-11T21:58:36+08:002022-02-11T21:58:36+08:00

b.txt - a.txt : sort a.txt a.txt b.txt | uniq -u > foo.txt

-2

Como escrever a diferença entre dois arquivos em um arquivo

Como exportar uma chave privada GPG e uma chave pública para um arquivo

ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

Como descarregar o módulo do kernel 'nvidia-drm'?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Como escrever a diferença entre dois arquivos em um arquivo

4 respostas

relate perguntas