Grep para um conjunto de linhas de $START a $END AND que contém uma correspondência em $MIDDLE

Question

sloppy

Asked: 2025-04-14 08:28:02 +0800 CST2025-04-14 08:28:02 +0800 CST 2025-04-14 08:28:02 +0800 CST

Combine várias variáveis em duas linhas e exclua a entrada inteira

772

MATCH1.MATCH2 {
    always same MATCH3
}

Todos os três MATCHdevem corresponder.

entrada:

foo.bar {
    always same bus
}
1.2 {
    always same 3
}
a.b {
    always same c
}
i.ii {
    always same iii
}
b.2 {
    always same c
}
1.2 {
    always same b
}

digamos que eu queira excluir 1e a entrada MATCH(es) (do nome até a chave de 2fechamento )3}

saída:

foo.bar {
    always same bus
}
a.b {
    always same c
}
i.ii {
    always same iii
}
b.2 {
    always same c
}
1.2 {
    always same b
}

Tentei várias abordagens, sedmas nenhuma delas me levou perto:

sed "/$match1\.$match2/{/$match3//d;}" ./input
sed "/^$match1\.$match2 {/,/^always same $match3/d" ./input
# ...

Eu tive muita dificuldade com o fato de haver duas linhas que precisam ser correspondidas. Tentei adicionar \ne .*no meio, mas sem sucesso.

Aqui está o que usei para excluir a entrada correspondendo apenas à primeira linha, se isso ajudar:

sed "/^$match1\.$match2 {/,/^}/d" ./input # no match3

5 respostas

Voted

Continuous Improvement · Answer 1 · 2025-04-14T09:04:13+08:00

Expressão Regex

(?s)$match1.$match2 \{[^\{\}]*$match3\n\}\n

Observações:

(?s)corresponde ao restante do padrão com os seguintes sinalizadores efetivos: s. smodificador: linha única. Ponto corresponde a caracteres de nova linha.
[^\{\}]corresponde a todos os caracteres não { e }.
isso não pode ser usado diretamente emsed

Se você não estiver restrito a usar sed, você pode tentar usar/ajustar o seguinte script Python3.

Script Python3

import re

# Multi-line text
text = """
foo.bar {
    always same bus
}
1.2 {
    always same 3
}
a.b {
    always same c
}
i.ii {
    always same iii
}
1.2 {
    always same 3
}
b.2 {
    always same c
}
1.2 {
    always same b
}
a.b {
    always same c
}
"""

match1 = "a"
match2 = "b"
match3 = "c"
pattern = rf"(?s){match1}.{match2} \{{[^\{{\}}]*{match3}\n\}}\n"

result = re.sub(pattern, '', text)

print(result)

Saída

foo.bar {
    always same bus
}
1.2 {
    always same 3
}
i.ii {
    always same iii
}
1.2 {
    always same 3
}
b.2 {
    always same c
}
1.2 {
    always same b
}

sloppy · Answer 2 · 2025-04-14T09:46:41+08:00

Best Answer

sloppy

2025-04-14T09:46:41+08:002025-04-14T09:46:41+08:00

Não tenho certeza se essa é a maneira correta de fazer isso, mas consegui com a ajuda do @continuous-improvement:

sed -Ez "s/$match1\.$match2 \{\n[^\{\}]*always same $match3\n\}\n//g" ./input

Comentários e correções serão apreciados!

1

Kusalananda · Answer 3 · 2025-04-14T12:38:20+08:00

Kusalananda

2025-04-14T12:38:20+08:002025-04-14T12:38:20+08:00

$ m1=1 m2=2 m3=3
$ sed "/^$m1\\.$m2 {\$/ { N; / $m3\$/ { N; d; }; }" file
foo.bar {
    always same bus
}
a.b {
    always same c
}
i.ii {
    always same iii
}
b.2 {
    always same c
}
1.2 {
    always same b
}

Supondo que as variáveis de shell m1, m2e m3sejam definidas como expressões regulares válidas, a sedexpressão tenta encontrar linhas que correspondam a ^$m1\.$m1 {$. Quando tal linha é encontrada, ela anexa a linha seguinte ao buffer usando N. Se o buffer agora corresponder $m3$ (incluindo o espaço inicial antes do valor da variável), uma linha adicional é lida do arquivo e o buffer é descartado, omitindo toda a seção de três linhas da saída.

Uma abordagem diferente é sempre ler uma seção inteira de três linhas e então fazer uma única correspondência no buffer de várias linhas:

sed "N; N; /^$m1\\.$m2 {\\n.* $m3\\n}\$/d" file

1

Ed Morton · Answer 4 · 2025-04-14T20:45:00+08:00

Ed Morton

2025-04-14T20:45:00+08:002025-04-14T20:45:00+08:00

Usando qualquer awk, independentemente de suas variáveis de correspondência m1, etc. conterem ou não metacaracteres regexp, pois ele está apenas fazendo comparações literais de strings:

$ awk -v m1=1 -v m2=2 -v m3=3 '
    /^[^ }]/ { a = ($1 == m1"."m2); b=0; rec=$0; next }
    { rec = rec ORS $0 }
    sub(/^ +/,"") { b = ($0 == "always same "m3) }
    /^}$/ && !(a && b) { print rec }
' file
foo.bar {
    always same bus
}
a.b {
    always same c
}
i.ii {
    always same iii
}
b.2 {
    always same c
}
1.2 {
    always same b
}

1

Stéphane Chazelas · Answer 5 · 2025-04-14T14:32:49+08:00

Eu usaria perlem vez de sed:

export match1=1 match2=2 match3=3
perl -0777 -pe 's{
  ^ \h* \Q$ENV{match1}\E \. \Q$ENV{match2}\E \s* \{
        \s* always \s+ same \s+ \Q$ENV{match3}\E \s*
        \} \h* \n}{}gmx' input

-pé o sedmodo em que a expressão (passada para -e) é avaliada para cada registro de entrada.
-0<octal>altera o separador de registro de entrada, aqui 777sendo maior que qualquer valor de byte possível, toda a entrada será tratada como um todo.
s{regex}{replacement}flagscom
- flagster mfor multiline for ^e $para corresponder no início e no fim de cada linha no assunto, não apenas no início e no fim do assunto, gpara substituir todas as ocorrências, xpara permitir espaços em branco na expressão regular para torná-la mais legível.
- replacementaqui vazio
- regextem:
  - \hpara qualquer espaço em branco horizontal (em particular, não inclui quebra de linha).
  - \spara qualquer espaço em branco, incluindo nova linha (talvez você queira substituir alguns dos \ss por \hse não quiser que a nova linha seja correspondida, como se não quiser permitir uma quebra de linha entre alwayse same)
  - \Q$ENV{matchN}\Einsere a variável de ambiente correspondente no regexp, mas \Qé utada (até o \End) para que seja tratada como uma string fixa e não um regexp (o que importaria para valores $matchNcomo 4.5onde .é um operador regexp)

Isso removeria tudo de

1.2 {
    always same 3
}
  1.2{
always
  same  3
}
1.2{always same 3}

Se você precisar remover também:

1.2{other lines
not contain braces
always same 3
and other lines
after as well potentially}

Altere para:

perl -0777 -pe 's{
  ^ \h* \Q$ENV{match1}\E \. \Q$ENV{match2}\E \s* \{
        (?: [^{}\n]* \n )*
        \s* always \s+ same \s+ \Q$ENV{match3}\E \s*
        (?: \n [^{}\n]* )*
        \} \h* \n}{}gmx' input

Incorporar a expansão (pelo shell) $shell_varno sedcódigo como você faz introduz vulnerabilidades de execução de comandos arbitrários e é melhor evitá-la.

Isso não se aplica ao perlacima, pois é uma $perl_variablereferência do Perl em seu operador regexp, não o shell expandindo uma variável do shell no código a ser interpretado pelo Perl.

Combine várias variáveis em duas linhas e exclua a entrada inteira

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Combine várias variáveis ​​em duas linhas e exclua a entrada inteira

5 respostas

relate perguntas

Combine várias variáveis em duas linhas e exclua a entrada inteira