Como posso melhorar este script de conversão de personagens?

Question

Sollosa

Asked: 2022-06-24 09:46:33 +0800 CST2022-06-24 09:46:33 +0800 CST 2022-06-24 09:46:33 +0800 CST

substitua o texto no campo específico por variáveis do loop

772

Eu tenho um arquivo enorme para analisar e preciso pesquisar e substituir texto, mas em campos específicos, compartilhando uma pequena amostra para referência chamada dest. a primeira linha é o cabeçalho para referência.

cat dest
ID|NAME|COMPANY|NUMBER
1001|Adam||15001
1002|eve|adam&eve|15002
1003|||
1004|||50000
1005|||50001

Eu tenho arquivos separados que contêm padrão para corresponder, texto a ser substituído e texto a ser substituído

cat src
1003||15003
1004|50000|15004
1005|50001|15005

para que eu possa executar um loop while abaixo com sed para alcançar as últimas 2 linhas do arquivo src.

cat src | while IFS=$'|'; read id old new; do sed -i "/^${id}/s/${old}/${new}/" dest; done

mas para ID=1003recebo uma string vazia para $old, e ele substituirá todas as colunas vazias no arquivo dest para esse ID. O que eu quero evitar. O que eu quero fazer é substituir apenas o último campo.

DESEJADO:

ID|NAME|COMPANY|NUMBER
1001|Adam||15001
1002|eve|adam&eve|15002
1003|||15003
1004|||15004
1005|||15005

Eu poderia usar o awk, pois é mais granular, quando se trata de dados colunares. mas o awk imprimirá várias vezes para stdout, tanto quanto eu entendo, o que também não é prático no meu caso.

então existe uma maneira de fazer isso de maneira inteligente e concisa?

2 respostas

Voted

αғsнιη · Answer 1 · 2022-06-24T10:12:30+08:00

Best Answer

αғsнιη

2022-06-24T10:12:30+08:002022-06-24T10:12:30+08:00

awk 'BEGIN{ FS=OFS="|" }
 NR==FNR  { id[$1, $2]=$3; next }
          { $4=( ($1, $4) in id? id[$1, $4]: $4) } 1' src dest

FS: S eperador de campo
OFS: S eperador de campo de saída
NR==FNR: Um idioma de condição sempre verdadeiro para o primeiro arquivo de entrada.

NR está presente o número total de registros que awk leu ;
FNR está presente no número de registros de cada arquivo individual.
id[$1, $2]=$3: uma matriz awk associada.

Nome:
chave id: coluna#1+coluna#2
valor: coluna#3

primeiro bloco é executado apenas para o primeiro arquivo de entrada, i. e, arquivo src .

Neste $4=($1, $4) in id? id[$1, $4]: $4, estamos atualizando o valor da última coluna ( $NFou $4) do segundo arquivo, i. e, arquivo dest da combinação de chaves correspondentes da coluna#1+coluna#4 na matriz id , se encontrado, retorne esse valor ( id[$1, $4]), caso contrário, copie seu valor atual.

3

Kusalananda · Answer 2 · 2022-06-24T22:31:13+08:00

Outra awksolução, que pressupõe que as linhas de srcserão usadas exatamente uma vez cada e em ordem. Isso nos permite acompanhar apenas a próxima linha srcaté que ela tenha sido usada e, em seguida, ler a próxima.

awk -F '|' '
    BEGIN { OFS=FS }
    ! have {
        getline line <"src"
        split(line, pat)
        have = 1
    }
    $1 == pat[1] {
        if ($4 == pat[2]) $4 = pat[3]
        have = 0
    }; 1' dest

Se o sinalizador havenão estiver definido ou for zero, a próxima linha de srcserá lida linee dividida no array pat. Isso é feito no ! havebloco.

Se a linha atual de entrada de desttiver um 1º campo idêntico ao primeiro elemento de pat, testaremos o 4º campo pat[2]e o substituiremos pat[3]se forem iguais. O havesinalizador é então redefinido para zero para acionar a leitura de uma nova linha de src.

A trilha 1no final do awkprograma faz com que o registro (possivelmente modificado) seja gerado.

A saída, dados os dados na pergunta:

ID|NAME|COMPANY|NUMBER
1001|Adam||15001
1002|eve|adam&eve|15002
1003|||15003
1004|||15004
1005|||15005

substitua o texto no campo específico por variáveis do loop

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

substitua o texto no campo específico por variáveis ​​do loop

2 respostas

relate perguntas

substitua o texto no campo específico por variáveis do loop