Quero criar uma regex que corresponda a todos os caracteres sem escape $
em strings que representam uma regex.
Nesse caso, um caractere não é escapado se ele contiver um número igual de barras invertidas atrás dele (cada par de barras invertidas representa o próprio caractere de barra invertida e, portanto, o próximo caractere não é escapado).
Eu criei este padrão:
(?<!\\)(\\{2})*\$
Explicação: embora isso também corresponda às barras invertidas que precedem o $
, essa é a solução mais próxima que cheguei. Isso garante um número igual de barras invertidas antes de a $
que não é precedido por outra barra invertida, resultando em um número ímpar de barras invertidas.
Meu problema é que parece que preciso de 2 grupos consecutivos não consumidores para tornar o número total de barras invertidas par, mas isso não é possível. Existe outra maneira de fazer isso?
Uma maneira de fazer isso com PCRE é evitar todos os bytes precedidos por uma barra invertida usando a
(*SKIP)(*FAIL)
sequência de verbos e capturar o SINAL DE CÔDIGO em outra ramificação:demonstração
Não se esqueça de que para representar corretamente uma barra invertida literal em uma string PHP entre aspas para um padrão regex, esta deve ser escapada duas vezes (uma vez para a regex, já que é um caractere especial para formar uma sequência de escape como
\w
ou\$
, e uma vez para a string entre aspas já que este mesmo caractere é usado para formar uma sequência de escape também como\'
), então 4 barras invertidas para representar uma única barra invertida literal:demonstração
Uma string nowdoc evita as barras invertidas entre aspas:
Torne o grupo repetitivo não capturável e adicione o meta escape
\K
.Aqui está no Regex101 .
Se você não pudesse usar a sintaxe
\K
and(*SKIP*)(*FAIL*)
, como em Python (e muitos outros tipos de regex), você poderia.Lógica: O grupo 1 (
$1
) consumirá e capturará os caracteres precedentes necessários para uma correspondência. O grupo 2 ($2
) consumirá e capturará o$
, , sem escape\$
, precedido por 0, ou outro número par de, barras invertidas literais,\
.PADRÃO REGEX:
SEQUÊNCIA DE SUBSTITUIÇÃO:
Demonstração Regex: https://regex101.com/r/qq0Bug/2
CADEIA DE TESTE:
RESULTADO:
PARTIDAS E GRUPOS:
NOTAS DE EXAMES REG:
(
Inicie o grupo de captura 1 , referenciado por$1
na string de substituição.[^\\]
Classe de caractere negada[^...]
. Corresponde a qualquer caractere que não seja uma barra invertida literal\
.(?:\\\\)*
Grupo de não captura(?:...)
. Corresponde a dois caracteres de barra invertida literais consecutivos\\
0 ou mais (*
) vezes.)
Fim do grupo 1(\$)
O grupo 2 ($2
) corresponde a um literal$
.