Linux sed com < e >

Question

kuninox

Asked: 2025-04-21 10:04:30 +0800 CST2025-04-21 10:04:30 +0800 CST 2025-04-21 10:04:30 +0800 CST

Reformatar números, inserindo separadores em posições fixas

772

Há muitas linhas em um arquivo, como as seguintes:

000100667 ===> 000102833
005843000 ===> 005844000
011248375 ===> 011251958

Gostaria de inserir separadores específicos nos números como este:

00:01:00,667 ===> 00:01:02,833
00:58:43,000 ===> 00:58:44,000
01:12:48,375 ===> 01:12:51,958

No momento estou tentando (sucesso apenas na primeira parte):

echo 000100667 | gawk '{printf "%s:%s:%s,%s\n", $1, $2, $3, $4}' FIELDWIDTHS="2 2 2 3"

6 respostas

Voted

RavinderSingh13 · Answer 1 · 2025-04-21T10:28:21+08:00

Best Answer

RavinderSingh13

2025-04-21T10:28:21+08:002025-04-21T10:28:21+08:00

Com os exemplos apresentados, tente o seguinte awkcódigo. Escrito e testado com GNU awk.

awk -v OFS=":" '
match($0,/^(.{2})(.{2})(.{2})(.{3})( ===> )(.{2})(.{2})(.{2})(.{3})$/,arr){
  print arr[1],arr[2],arr[3]","arr[4] arr[5] arr[6],arr[7],arr[8]","arr[9]
}
' Input_file

Com FIELDWIDTHSsolução: Escrito e testado com amostras mostradas.

awk -v FIELDWIDTHS="2 2 2 3 6 2 2 2 3" -v OFS=":" '{print $1,$2,$3","$4 $5 $6,$7,$8","$9}' Input_file

12

Cyrus · Answer 2 · 2025-04-21T16:09:36+08:00

Cyrus

2025-04-21T16:09:36+08:002025-04-21T16:09:36+08:00

Com GNU sed:

sed -E 's/([0-9].)(..)(..)(...)/\1:\2:\3,\4/g' file

Ele separa qualquer sequência de nove caracteres que começa com um dígito como este (dígitos são posições dentro do padrão): 123456789torna-se 12:34:56,789.

Se for muito genérico, o .("qualquer caractere") deve ser substituído por [0-9] ("dígito").

Saída:

00:01:00.667 ===> 00:01:02.833
00:58:43.000 ===> 00:58:44.000
01:12:48.375 ===> 01:12:51.958

7

Jetchisel · Answer 3 · 2025-04-21T11:11:50+08:00

Jetchisel

2025-04-21T11:11:50+08:002025-04-21T11:11:50+08:00

Usando sed com o -Esinalizador:

sed -E '/^[[:digit:]]{9}/s/([[:digit:]]{2})([[:digit:]]{2})([[:digit:]]{2})([[:digit:]]{3})/\1:\2:\3,\4/g' file.txt

Para corresponder exatamente às strings em uma linha.

sed -E '/^[[:digit:]]{9} ===> [[:digit:]]{9}$/s/([[:digit:]]{2})([[:digit:]]{2})([[:digit:]]{2})([[:digit:]]{3})/\1:\2:\3,\4/g' file.txt

O -Esinalizador/opção que é ERE agora é padrão para sed de acordo com POSIX
O comportamento pode variar dependendo das configurações locais , que afetam como as classes de caracteres [[:digit:]]são [a-z]interpretadas.

6

potong · Answer 4 · 2025-04-21T13:14:58+08:00

potong

2025-04-21T13:14:58+08:002025-04-21T13:14:58+08:00

Isso pode funcionar para você (GNU sed):

sed -E 's/(..)(..)(..)(... ===> ..)(..)(..)/\1:\2:\3,\4:\5:\6,/' file

Use correspondência de padrões e substituição com referências posteriores.

Para uma belt and bracesabordagem:

sed -E '/^[[:digit:]]{9} ===> [[:digit:]]{9}$/s/(..)(..)(..)(... ===> ..)(..)(..)/\1:\2:\3,\4:\5:\6,/' file

Ou:

sed -E '/^[0-9]{9} ===> [0-9]{9}$/s/\b(..)\B(..)\B(..)\B/\1:\2:\3,/g' file

6

Ed Morton · Answer 5 · 2025-04-21T18:58:46+08:00

Ed Morton

2025-04-21T18:58:46+08:002025-04-21T18:58:46+08:00

Usando um awk que suporte gensub()GNU awkou mawk2:

$ awk '
    { print f($1), $2, f($3) }
    function f(s) { return gensub(/(..)(..)(..)(.*)/, "\\1:\\2:\\3,\\4", 1, s) }
' file
00:01:00,667 ===> 00:01:02,833
00:58:43,000 ===> 00:58:44,000
01:12:48,375 ===> 01:12:51,958

ou usando qualquer awk:

$ awk '
    { print f($1), $2, f($3) }
    function f(s) { return substr(s,1,2) ":" substr(s,3,2) ":" substr(s,5,2) "," substr(s,7) }
' file
00:01:00,667 ===> 00:01:02,833
00:58:43,000 ===> 00:58:44,000
01:12:48,375 ===> 01:12:51,958

5

Daweo · Answer 6 · 2025-04-21T18:56:34+08:00

Daweo

2025-04-21T18:56:34+08:002025-04-21T18:56:34+08:00

Eu melhoraria sua solução da seguinte maneira, deixe file.txto conteúdo ser

000100667 ===> 000102833
005843000 ===> 005844000
011248375 ===> 011251958

então

awk 'BEGIN{FIELDWIDTHS="2 2 2 3";RS=" ===> |\n"}{printf "%s:%s:%s,%s%s", $1, $2, $3, $4, RT}' file.txt

dá saída

00:01:00,667 ===> 00:01:02,833
00:58:43,000 ===> 00:58:44,000
01:12:48,375 ===> 01:12:51,958

Explicação: Usei FIELDWIDTHS literalmente, mas informei ao GNU Awk que a linha pode ser separada por ===> (incluindo espaços) OU ( |) quebra de linha. Alterei printfpara que o último caractere seja o terminador de linha ( RT), então ===> para valores à esquerda de ===> e quebra de linha para todos os outros.

(testado no GNU Awk 5.3.1)

2

Reformatar números, inserindo separadores em posições fixas

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Reformatar números, inserindo separadores em posições fixas

6 respostas

relate perguntas