AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1834324
Accepted
Hashim Aziz
Hashim Aziz
Asked: 2024-03-09 07:55:54 +0800 CST2024-03-09 07:55:54 +0800 CST 2024-03-09 07:55:54 +0800 CST

Substitua as quebras de linha X por vírgula e exclua cada enésima quebra de linha

  • 772

Tenho registros em um arquivo texto formatado da seguinte forma:

Record1
Record1
Record1
Record1

Record2
Record2
Record2
Record2

...

Preciso converter este arquivo para CSV substituindo as 3 primeiras quebras de linha por vírgula e removendo a 4ª, resultando em uma saída como esta:

Record1,Record1,Record1,Record1
Record2,Record2,Record2,Record2

...

Qual é a melhor maneira de fazer isso no Bash, onde o melhor é mais robustez do que desempenho - a tarefa não será realizada com frequência, mas precisa permitir que os valores contenham praticamente quaisquer caracteres além de espaços em branco e quebras de linha.

bash
  • 3 3 respostas
  • 38 Views

3 respostas

  • Voted
  1. Best Answer
    glenn jackman
    2024-03-09T10:01:01+08:002024-03-09T10:01:01+08:00

    Eu usaria o awk para isso

    awk 'BEGIN {FS = "\n"; RS = ""; OFS = ","} {$1 = $1; print}' file
    

    Definir RS como uma string vazia significa que 2 ou mais novas linhas separam os registros.
    O separador de campo é uma única nova linha.

    $1 = $1é uma forma idiomática de forçar o awk a reescrever o registro atual usando o separador de campo de saída.

    • 1
  2. Hannu
    2024-03-09T15:44:18+08:002024-03-09T15:44:18+08:00

    Apenas por diversão, um python one-liner[1] para criar o resultado esperado:

    $python -c "\
    importar sys;eol='END\n';\
    linhas=[line.strip()+',' if len(linha)>1 else eol para linha em sys.stdin];\
    print(''.join(linhas)+eol)" \
    <registros

    linhas:

    1. lançar python com uma string literal
    2. obtenha acesso a sys.stdin, defina constante de final de linha
    3. use uma compreensão de lista para ler as linhas do stdin enquanto verifica linhas vazias, substituindo-as pelo marcador eol
    4. com uma lista de linhas criada, junte as linhas, imprima-as
    5. de onde ler as linhas (redirecionamento de linha de comando)

    Ao colar o texto acima (sem o $ inicial) em um terminal (bash), você obterá isto...

    Registro1, Registro1, Registro1, Registro1, FIM
    Registro2, Registro2, Registro2, Registro2, FIM
    Registro1, Registro1, Registro1, Registro1, FIM
    Registro2, Registro2, Registro2, Registro2, FIM
    Registro1, Registro1, Registro1, Registro1, FIM
    Registro2, Registro2, Registro2, Registro2, FIM
    
    

    ... ao ler 'registros' contendo o texto de amostra (repetido)...

    É um passo simples remover todos aqueles ",END"; por exemplo, canalize tudo para sed, por exemplo;
    anexe | sed -re "s/,END$//"à última linha.

    [1] O texto acima é melhor digitado em uma única linha, basta pular os \'s, que foram adicionados para melhor legibilidade AQUI.

    • 0
  3. aborruso
    2024-03-09T16:13:36+08:002024-03-09T16:13:36+08:00

    Usando Miller e executando

    mlr --n2t --headerless-tsv-output --from input.txt \
    put '$id=$1' then skip-trivial-records then \
    nest --ivar "," -f 1 then \
    cut -x -f id
    

    você consegue

    Record1,Record1,Record1,Record1
    Record2,Record2,Record2,Record2
    

    Algumas notas:

    • skip-trivial-recordspara remover linhas vazias;
    • nest --ivar "," -f 1mesclar os valores dos registros, separando-os por,
    • 0

relate perguntas

  • substituindo zsh por bash no usuário não root

  • Tendo problemas para definir variáveis ​​de ambiente no Terminal no macOS High Sierra

  • Existe um equivalente a cd - para cp ou mv?

  • Notificar-enviar notificações aparecendo na janela

  • como abrir um arquivo de escritório do WSL

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como posso reduzir o consumo do processo `vmmem`?

    • 11 respostas
  • Marko Smith

    Baixar vídeo do Microsoft Stream

    • 4 respostas
  • Marko Smith

    O Google Chrome DevTools falhou ao analisar o SourceMap: chrome-extension

    • 6 respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Martin Hope
    Vickel O Firefox não permite mais colar no WhatsApp web? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke Por que os arquivos tar.xz são 15x menores ao usar a biblioteca tar do Python em comparação com o tar do macOS? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh Como posso reduzir o consumo do processo `vmmem`? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Pesquisa do Windows 10 não está carregando, mostrando janela em branco 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve