AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77252750
Accepted
mon
mon
Asked: 2023-10-08 15:49:22 +0800 CST2023-10-08 15:49:22 +0800 CST 2023-10-08 15:49:22 +0800 CST

O limite do Word \b não pode ser usado em uma classe de caracteres? [duplicado]

  • 772
Essa pergunta já tem resposta aqui :
Como escrever o limite do Word dentro da classe de caracteres em python sem perder o significado? Desejo adicionar sublinhado(_) na definição do limite do Word(\b) (1 resposta)
Fechado há 16 horas .

O COMO FAZER Expressões Regulares diz que sequências especiais podem ser incluídas em uma classe de caracteres (ênfase minha):

A lista de sequências especiais a seguir não está completa. Para obter uma lista completa de sequências e definições de classe expandidas para padrões de string Unicode, consulte a última parte de Sintaxe de Expressão Regular na referência da Biblioteca Padrão. Em geral, as versões Unicode correspondem a qualquer caractere que esteja na categoria apropriada no banco de dados Unicode.

\dCorresponde a qualquer dígito decimal; isso é equivalente à classe [0-9].

\DCorresponde a qualquer caractere que não seja um dígito; isso é equivalente à classe [^0-9].

\sCorresponde a qualquer caractere de espaço em branco; isso é equivalente à classe [ \t\n\r\f\v].

\SCorresponde a qualquer caractere que não seja espaço em branco; isso é equivalente à classe [^ \t\n\r\f\v].

\wCorresponde a qualquer caractere alfanumérico; isso é equivalente à classe [a-zA-Z0-9_].

\WCorresponde a qualquer caractere não alfanumérico; isso é equivalente à classe [^a-zA-Z0-9_].

Essas sequências podem ser incluídas dentro de uma classe de caracteres . Por exemplo, [\s,.]é uma classe de caracteres que corresponderá a qualquer caractere de espaço em branco, ou ','ou '.'.

No entanto, parece que \bnão pode ser usado em uma classe de personagem.

pattern = r'\bcool\b'
text = "cool"

matches = re.finditer(
    pattern=pattern, 
    string=text.strip(), 
    flags=re.IGNORECASE
)
if matches:
    for match in matches:
        print(f"match: {match.group(0): <20} start: {match.start():<5} end: {match.end():<5} pos: {match.endpos:<5}")
---
match: cool                 start: 0     end: 4     pos: 4    
pattern = r'[\b\s]cool\b'    # <-----
text = "cool"

matches = re.finditer(
    pattern=pattern, 
    string=text.strip(), 
    flags=re.IGNORECASE
)
if matches:
    for match in matches:
        print(f"match: {match.group(0): <20} start: {match.start():<5} end: {match.end():<5} pos: {match.endpos:<5}")
---
No match

Por favor, ajude a entender o comportamento. Pode \bser usado, por exemplo, porque é considerado backspace na classe de personagem? Então está documentado em algum lugar?

python
  • 1 1 respostas
  • 47 Views

1 respostas

  • Voted
  1. Best Answer
    Tim Biegeleisen
    2023-10-08T16:01:16+08:002023-10-08T16:01:16+08:00

    Não é possível incluir um limite de palavra em uma classe de caracteres Python. O \bmarcador pode ser incluído em uma classe de caracteres, mas significa o caractere de retrocesso, não um limite de palavra. Portanto, o seguinte regex não funciona conforme o esperado:

    [\b\s]cool\b
    

    Mas você poderia usar uma alternância em vez da classe de caracteres tentada:

    (?:\b|\s)cool\b
    
    • 1

relate perguntas

  • Como divido o loop for em 3 quadros de dados individuais?

  • Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve