(macOS Bash) 2 strings aparentemente idênticas não são iguais, mostrando apenas diferenças com "set -x"

Question

NetRanger

Asked: 2025-03-29 00:40:20 +0800 CST2025-03-29 00:40:20 +0800 CST 2025-03-29 00:40:20 +0800 CST

Adicionar um texto após uma vírgula em um arquivo csv usando o Linux bash em um loop

772

Preciso modificar um arquivo csv usando o bash.

Entrada (um arquivo csv):

firstletter="s"
surname="houston"
emaildomain"@zzz.com"
input=$(cat 1.csv)

1.csv:

1,1,Susan houston,Director of Services,,
2,1,Christina Gonzalez,Director,,
3,2,Brenda brown,"Director, Second Career Services",,

Como posso adicionar um texto entre as últimas 2 vírgulas usando o Linux bash? Eu tentei algo como:

for i in $(cat $input);do
        sed -i "s/,$/${firstletter}${surname}${emaildomain},/g" $i;
done

No entanto, isso resulta em um erro: sed: -e expression #1, char 5: unterminated `s' command

Saída esperada:

1,1,Susan houston,Director of Services,[email protected],
2,1,Christina Gonzalez,Director,[email protected],
3,2,Brenda brown,"Director, Second Career Services",[email protected],

3 respostas

Voted

Ed Morton · Answer 1 · 2025-03-29T01:53:48+08:00

Best Answer

Ed Morton

2025-03-29T01:53:48+08:002025-03-29T01:53:48+08:00

A pergunta não está clara, mas acho que pode ser isso que você está tentando fazer, usando o GNU awk para edição "in loco" e gensub():

$ cat 1.csv
1,1,Susan houston,Director of Services,,
2,1,Christina Gonzalez,Director,,
3,2,Brenda brown,"Director, Second Career Services",,

$ awk -i inplace 'BEGIN{FS=OFS=","} {$(NF-1)=tolower(gensub(/(.).* (.*)/,"\\1\\2",1,$3) "@zzz.com")} 1' 1.csv

$ cat 1.csv
1,1,Susan houston,Director of Services,[email protected],
2,1,Christina Gonzalez,Director,[email protected],
3,2,Brenda brown,"Director, Second Career Services",[email protected],

Veja Qual é a maneira mais robusta de analisar CSV com eficiência usando o awk? para obter mais informações sobre o processamento de CSVs com o awk.

5

tink · Answer 2 · 2025-03-29T01:08:31+08:00

Tenho certeza de que há alguma inteligência nisso sedque permitiria alcançar o que você quer. Eu, pessoalmente, optaria pelo GNU awk aqui.

cat a.csv
1,1,Susan houston,Director of Services,,
2,1,Christina Gonzalez,Director,,

gawk -i inplace   'BEGIN{FS=OFS=","}{fn=gensub(/(.).*/,"\\1","1",$3);split($3,ln," ");$5=fn"."ln[length(ln)]"@zzz.com";print}' a.csv

cat a.csv
1,1,Susan houston,Director of Services,[email protected],
2,1,Christina Gonzalez,Director,[email protected],

-i inplaceé uma extensão GNU que permite ao awk emular sedo s -i.

A BEGINseção informa ao awk que tanto o separador de campo de entrada quanto o de saída são vírgulas.

fn=gensub(...)puxa a primeira letra do primeiro nome (o nome completo é o terceiro campo, $3).

Em seguida, dividimos o nome em uma matriz ln(supondo que algumas pessoas possam ter nomes do meio).

Definimos o 5º campo (o espaço vazio entre as últimas vírgulas) para a primeira letra e o último elemento do array seguido por @zzz.com.

Se $5 não estiver vazio:

gawk -i inplace   'BEGIN{FS=OFS=","}$5==""{fn=gensub(/(.).*/,"\\1","1",$3);split($3,ln,"");$5=fn"."ln[length(ln)]"@zzz.com"}{print}' a.csv

JanB · Answer 3 · 2025-03-29T23:24:08+08:00

JanB

2025-03-29T23:24:08+08:002025-03-29T23:24:08+08:00

Solução usando jq:
Com o parâmetro -R (--raw-input) ele lê texto simples.
Com o parâmetro -r (--raw-output) ele produz texto simples.

$ jq -Rr --arg emaildomain "@zzz.com" '
    # split instruction creates an array
    split(",")
    # using JSON object makes the code readable
    |{input_array: .}
    # extract first letter and surname
    |.name = .input_array[2]
    |.firstletter =. name[0:1]
    |.surname = (.name |split(" ") |.[1])
    # construct email
    |.email = (.firstletter+.surname+$emaildomain |ascii_downcase)
    |.output_array =. input_array
    |.output_array[-2] = .email
    |.output_array
    |join(",")
' 1.csv
1,1,Susan houston,Director of Services,[email protected],
2,1,Christina Gonzalez,Director,[email protected],
3,2,Brenda brown,"Director, Second Career Services",[email protected],

0

Adicionar um texto após uma vírgula em um arquivo csv usando o Linux bash em um loop

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Adicionar um texto após uma vírgula em um arquivo csv usando o Linux bash em um loop

3 respostas

relate perguntas