AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 446939
Accepted
roaima
roaima
Asked: 2018-05-31 08:03:20 +0800 CST2018-05-31 08:03:20 +0800 CST 2018-05-31 08:03:20 +0800 CST

Usando comm com registros terminados em NULL

  • 772

Em resposta a uma pergunta diferente, eu queria usar uma estrutura muito parecida com esta para encontrar arquivos que aparecem em list2que não aparecem em list1:

( cd dir1 && find . -type f -print0 ) | sort -z > list1
( cd dir2 && find . -type f -print0 ) | sort -z > list2
comm -13 list1 list2

No entanto, bati em uma parede de tijolos porque minha versão de commnão pode lidar com registros terminados em NULL. (Alguns antecedentes: estou passando uma lista computada para rm, então, particularmente, quero ser capaz de lidar com nomes de arquivo que possam conter uma nova linha incorporada.)

Se você quer um exemplo fácil de trabalhar, tente isso

mkdir dir1 dir2
touch dir1/{a,b,c} dir2/{a,c,d}
( cd dir1 && find . -type f ) | sort > list1
( cd dir2 && find . -type f ) | sort > list2
comm -13 list1 list2

Sem linhas terminadas em NULL, a saída aqui é o único elemento ./dque aparece apenas em list2.

Gostaria de poder usar find ... -print0 | sort -zpara gerar as listas.

Como posso reimplementar melhor um equivalente para commque produza os registros terminados em NULL que aparecem, list2mas que não aparecem list1?

find sort
  • 1 1 respostas
  • 264 Views

1 respostas

  • Voted
  1. Best Answer
    Stéphane Chazelas
    2018-05-31T08:33:53+08:002018-05-31T08:33:53+08:00

    O GNU comm(a partir do GNU coreutils 8.25) agora tem uma opção -z/ --zero-terminatedpara isso.

    Para versões mais antigas do GNU comm, você poderá trocar NUL e NL:

    comm -13 <(cd dir1 && find . -type f -print0 | tr '\n\0' '\0\n' | sort) \
             <(cd dir2 && find . -type f -print0 | tr '\n\0' '\0\n' | sort) |
      tr '\n\0' '\0\n'
    

    Dessa forma, commainda funciona com registros delimitados por nova linha, mas com novas linhas reais na entrada codificadas como NULs, portanto, ainda estamos seguros com nomes de arquivo contendo novas linhas.

    Você também pode querer definir a localidade Cporque em sistemas GNU e na maioria das localidades UTF-8, pelo menos, existem strings diferentes que classificam o mesmo e causariam problemas aqui¹.

    Esse é um truque muito comum (consulte Inverter linhas correspondentes, separadas por NUL para outro exemplo com comm), mas precisa de utilitários que suportem NUL em sua entrada, o que fora dos sistemas GNU é relativamente raro.


    ¹ Exemplo:

    $ touch dir1/{①,②} dir2/{②,③}
    $ comm -12 <(cd dir1 && find . -type f -print0 | tr '\n\0' '\0\n' | sort) \
               <(cd dir2 && find . -type f -print0 | tr '\n\0' '\0\n' | sort)  
    ./③
    ./②
    $ (export LC_ALL=C
        comm -12 <(cd dir1 && find . -type f -print0 | tr '\n\0' '\0\n' | sort) \
                 <(cd dir2 && find . -type f -print0 | tr '\n\0' '\0\n' | sort))
    ./②
    

    ( edição de 2019 : a ordem relativa de ①②③ foi corrigida em versões mais recentes do GNU libc, mas você pode usar ? ? ? em vez disso, por exemplo, em versões mais recentes (2.30 pelo menos) que ainda têm o problema como 95% dos pontos de código Unicode )

    • 1

relate perguntas

  • Listar arquivos classificados de acordo com a linha de conteúdo específica

  • Leia o arquivo de texto com palavras e sua contagem de ocorrências e saída de impressão classificada

  • verificando se existe uma pasta em determinado diretório

  • Localizar e substituir cores em arquivos CSS na linha de comando

  • GNU find: obtenha caminho absoluto e relativo em -exec

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    Como descarregar o módulo do kernel 'nvidia-drm'?

    • 13 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add retorna com: "Erro ao conectar ao agente: nenhum arquivo ou diretório" 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya Por que o Linux usa LF como caractere de nova linha? 2017-12-20 05:48:21 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve