AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 456766
Accepted
vivoru
vivoru
Asked: 2018-07-18 05:37:39 +0800 CST2018-07-18 05:37:39 +0800 CST 2018-07-18 05:37:39 +0800 CST

Trate "\r" como nada em "while read -r"

  • 772

Eu tenho essa linha de código que lê um arquivo de texto linha por linha.

O arquivo de texto às vezes é gerado por um usuário do Windows, às vezes por um usuário do Unix. Portanto, às vezes vejo \r\nno final da linha e às vezes vejo apenas \n.

Eu quero que meu script seja capaz de lidar com os dois cenários e alcançar cada linha separadamente, independentemente de a quebra de linha ser \r, ou \n, ou \r\n, ou \n\r.

while read -r textFileLines; do ... something ...; done < text_file.txt

Este código funciona com \n\r(LF CR) no final de cada linha, mas NÃO funciona quando tenho \r\nno final da linha!

TESTE

  • Crie um novo arquivo de texto usandoNotepad++ v7.5.4

    insira a descrição da imagem aqui

  • while read -r LINE; do echo "$LINE"; done < /cygdrive/d/test_text.txt

  • saída no Terminal:

    first_line
    second_line
    third_string
    

Por que a fourth_outputlinha não é mostrada?

shell-script shell
  • 4 4 respostas
  • 6011 Views

4 respostas

  • Voted
  1. ilkkachu
    2018-07-18T06:30:23+08:002018-07-18T06:30:23+08:00

    Por que a fourth_outputlinha não é mostrada?

    Na sua imagem, o arquivo está sem a nova linha no final da última linha. readretorna true somente se ler o delimitador (newline) e, como não está no final da última linha, readretorna false, seu loop termina e a última linha incompleta não é impressa.

    Isso não tem nada a ver com os retornos de carro, o comportamento é o mesmo mesmo com apenas NL, se a última linha estiver faltando o NL.

    Aqui, file1tem duas linhas com terminações de linha CRLF:

    $ cat -A file1
    foo^M$
    bar^M$
    $ while read x ; do echo "<$x>"; done < file1
    >foo
    >bar
    

    file2está faltando a linha que termina na segunda linha:

    $ cat -A file2 ; echo
    foo^M$
    bar
    $ while read x ; do echo "<$x>"; done < file2
    >foo
    

    Se você quiser que o loop também processe o fragmento de linha final, você terá que verificar se a readvariável contém algum dado quando readela mesma retornar falha:

    $ while read -r x || [ "$x" ] ; do echo "<$x>"; done < file2
    >foo
    <bar>
    

    Se você quiser se livrar do CR, você pode removê-lo dentro do loop, por exemplo x=${x%$'\r'};(em Bash/ksh/zsh), ou pré-processar o arquivo com tr -d '\r'ou dos2unixou algo assim.

    • 1
  2. slm
    2018-07-18T05:57:48+08:002018-07-18T05:57:48+08:00

    Existem ferramentas explícitas disponíveis para fazer isso. o mais comum que pode ser usado para remover \r\narquivos é chamado dos2unix.

    Se isso não estiver disponível em seu sistema, você pode usar um dos seguintes comandos para fazer algo semelhante em sua textFileLinesvariável:

    awk
    $ echo "$textFileLines" | awk 1 RS='\r\n' ORS=
    
    sed 1
    $ echo "$textFileLines" | sed -e 's/\r//g'
    
    sed 2
    $ echo $textFileLines | sed $'s/\r//'
    
    tr
    $ echo "$textFileLines" | tr -d '\r'
    

    É claro que existem muitas outras maneiras de fazer isso, essas são apenas algumas das mais comuns.

    Referências

    • Removendo novas linhas do Windows no Linux (sed vs. awk)
    • 0
  3. Best Answer
    Kusalananda
    2018-07-18T06:13:02+08:002018-07-18T06:13:02+08:00

    Se você tiver alguns arquivos que são arquivos de texto DOS e alguns que são arquivos de texto Unix, seu script pode passar todos os dados por dos2unix:

    dos2unix <filename |
    while IFS= read stuff; do
       # do things with "$stuff"
    done 
    

    Os arquivos de texto Unix não seriam modificados por isso.

    Para lidar adicionalmente com quebras de linha do Mac, acredito que você deve ser capaz de fazer

    dos2unix <filename | mac2unix |
    while IFS= read stuff; do
       # do things with "$stuff"
    done 
    

    A última linha não é emitida pelo seu readloop, pois não é finalizada e, portanto, não é uma linha.

    Para detectar se um arquivo não possui uma nova linha final na última linha e adicionar uma se não tiver, em bash:

    if [ "$( tail -c 1 filename )" != $'\n' ]; then
        printf '\n' >>filename
    fi
    

    Relacionado:

    • Por que usar um loop de shell para processar texto é considerado uma prática ruim?
    • 0
  4. user232326
    2018-07-20T18:48:25+08:002018-07-20T18:48:25+08:00

    Executar:

    $ [ -n "$(tail -c1 infile)" ] && echo >> infile
    $ sed 's/\r$\|^\r//g;s/\r/\n/g' infile | while IFS= read -r line
    > do echo "$line" ; done
    DOS       line
    second     DOS
    old  mac   line
    new  mac   line
    end\n\rreverse
    linux      line
    new linux  line
    

    Todos os problemas resolvidos.


    Descrição:

    Para corrigir a última nova linha ausente, use:

    [ -n "$(tail -c1 infile)" ] && echo >> infile
    

    O que adicionará uma nova linha à direita somente se necessário (não alterará um arquivo correto).

    Então, você pode converter

    • \r\n(estilo DOS) para \n(basta remover um \r no final da linha)
    • \n\r(estilo DOS inválido?) para um \n(remover \r no início da linha)
    • e então (com os pares corrigidos) converta \r(MAC antigo) para\n

    em apenas uma chamada de (GNU) sed com:

    sed 's/\r$\|^\r//g;s/\r/\n/g' infile
    

    Se o arquivo de texto for como este arquivo de teste:

    $ cat infile
    DOS       line
    second     DOS
    new  mac   line
    end\n\rreverse
    linux      line
    new linux  line
    no  end   line
    
    $ cat -A infile
    DOS       line^M$
    second     DOS^M$
    old  mac   line^Mnew  mac   line$
    end\n\rreverse$
    ^Mlinux      line$
    new linux  line$
    no  end   line
    
    $  od -An -tc infile
       D   O   S                               l   i   n   e  \r  \n
       s   e   c   o   n   d                       D   O   S  \r  \n
       o   l   d           m   a   c               l   i   n   e  \r
       n   e   w           m   a   c               l   i   n   e  \n
       e   n   d   \   n   \   r   r   e   v   e   r   s   e  \n  \r
       l   i   n   u   x                           l   i   n   e  \n
       n   e   w       l   i   n   u   x           l   i   n   e  \n
       n   o           e   n   d               l   i   n   e
    
    • 0

relate perguntas

  • Um script que imprime as linhas de um arquivo com seu comprimento [fechado]

  • exportar variáveis ​​​​env programaticamente, via stdout do comando [duplicado]

  • Dividir por delimitador e concatenar problema de string

  • Como salvar um caminho com ~ em uma variável?

  • MySQL Select com função IN () com array bash

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    Como descarregar o módulo do kernel 'nvidia-drm'?

    • 13 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add retorna com: "Erro ao conectar ao agente: nenhum arquivo ou diretório" 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya Por que o Linux usa LF como caractere de nova linha? 2017-12-20 05:48:21 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve