Regex: Corresponde até "," mas não se "," estiver entre colchetes

Question

mon

Asked: 2023-10-08 09:01:07 +0800 CST2023-10-08 09:01:07 +0800 CST 2023-10-08 09:01:07 +0800 CST

sed - por que '[.]' corresponde ao início e ao fim de uma linha? [duplicado]

772

Por que o início e o fim de uma linha correspondem ao [.]*e como evitá-lo?

Parece que o padrão corresponde ao limite do Word, mas não tenho certeza se foi projetado e qual especificação ele implementa.

$ echo " a " | sed -n 's/[.]*/X/pg'
X XaX X

$ echo " a " | sed -n 's/[\b]*/X/pg'
X XaX X

1 respostas

Voted

jhnc · Answer 1 · 2023-10-08T14:32:19+08:00

Observe que \bos colchetes não têm nenhum significado especial. É apenas uma lista de personagens.

[.]*e [\b]*corresponda a zero ou mais caracteres entre colchetes.

Portanto, eles correspondem a qualquer execução de um ou mais caracteres, onde as strings vazias imediatamente anteriores e posteriores a uma execução do(s) caractere(s) são apenas parte dessa execução.

Eles também correspondem a qualquer sequência vazia que não seja imediatamente precedida ou seguida por uma sequência do(s) caractere(s).

Substituindo o espaço por algo mais visível, sua entrada é:sas

Nenhum dos caracteres .nem aparece na string. Portanto, não há corridas de comprimento um ou mais. Com esta entrada, ambos e são equivalentes a "corresponder à string vazia".\b[.]*[\b]*

a string vazia entre o início da linha e as primeiras scorrespondências
a string vazia entre first se amatches
a string vazia entre ae as segundas scorrespondências
a string vazia entre sas correspondências do segundo e do final da linha

Essas 4 correspondências explicam os Xs adicionados à saída do seu exemplo.

Usar \bpara significar limite de palavra não é padrão, embora algumas versões sedo aceitem (ou o relacionado \<e \>).

É mais seguro não usar esta extensão e certamente não com *.

Mesmo versões disso sedparecem apoiá-lo, produzindo resultados não intuitivos e inconsistentes.

Por exemplo, com GNU sed 4.8:

$ echo ,aa, | sed 's/\b/x/g'
,xaax,
$ echo ,aa, | sed 's/\b*/x/g'
,aa,
$ echo ,aa, | sed 's/\b\{1,\}/x/g'
sed: -e expression #1, char 14: Invalid preceding regular expression
$ echo ,aa, | sed 's/\(\b\)\{1,\}/x/g'
,xaax,

Com busybox sed 1.30.1:

$ echo ,aa, | busybox sed 's/\b/x/g'
,xaxa,
$ echo ,aa, | busybox sed 's/\b*/x/g'
,aa,
$ echo ,aa, | busybox sed 's/\b\{1,\}/x/g'
sed: bad regex '\b\{1,\}': Invalid preceding regular expression
$ echo ,aa, | busybox sed 's/\(\b\)\{1,\}/x/g'
,xaxa,

Até mesmo outros programas como Perl requerem cuidados:

$ echo ,aa, | perl -ple 's/\b/x/g'
,xaax,
$ echo ,aa, | perl -ple 's/\b*/x/g'
x,xaxax,x
$ echo ,aa, | perl -ple 's/\b{1,}/x/g'
'1,' is an unknown bound type in regex; marked by <-- HERE in m/\b{1, <-- HERE }/ at -e line 1.
$ echo ,aa, | perl -ple 's/(\b){1,}/x/g'
,xaax,
$ echo ,aa, | perl -ple 's/\b+/x/g'
,xaax,

sed - por que '[.]' corresponde ao início e ao fim de uma linha? [duplicado]

destaque o código em HTML usando <font color="#xxx">

Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

Por que as compreensões de lista criam uma função internamente?

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

Por que o construtor de uma variável global não é chamado em uma biblioteca?

Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

Somente operações bit a bit para std::byte em C++ 17?

sed - por que '[.]' corresponde ao início e ao fim de uma linha? [duplicado]

1 respostas

relate perguntas