AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77621309
Accepted
Dan
Dan
Asked: 2023-12-07 23:41:14 +0800 CST2023-12-07 23:41:14 +0800 CST 2023-12-07 23:41:14 +0800 CST

Regex para coluna que não produz a saída esperada

  • 772

Eu tenho esse dataframe:

dfsupport = pd.DataFrame({'Date': ['8/12/2020','8/12/2020','13/1/2020','24/5/2020','31/10/2020','11/7/2020','11/7/2020'],
                          'Category': ['Table','Chair','Cushion','Table','Chair','Mats','Mats'],
                          'Sales': ['1 table','3chairs','8 cushions','3Tables','12 Chairs','12Mats','4Mats'],
                          'Paid': ['Yes','Yes','Yes','Yes','No','Yes','Yes',],
                          'Amount': ['93.78','$51.99','44.99','38.24','£29.99','29 21 only','18']
                          })

Que fica assim em forma de tabela:

          Date Category     Sales   Paid      Amount
0   8/12/2020    Table     1 table  Yes       93.78
1   8/12/2020    Chair     3chairs  Yes      $51.99
2   13/1/2020  Cushion  8 cushions  Yes       44.99
3   24/5/2020    Table     3Tables  Yes       38.24
4  31/10/2020    Chair   12 Chairs   No      £29.99
5   11/7/2020     Mats      12Mats  Yes  29 21 only
6   11/7/2020     Mats       4Mats  Yes          18

Quero remover os dois elementos de string acima. Aprendi a substituir com sucesso $ e £ por:

patternv='|'.join(re.escape(x) for x in ['$', '£'])
dfsupport['Amount'] = dfsupport['Amount'].str.replace(patternv,regex=True)

Agora quero substituir a entrada que possui "somente 29 21" na coluna Valor. Minha tentativa foi:

patterns="{r'(\d{1,})\s(\d{1,2})\D+' : r'\1 \2'}"
dfsupport['Amount']=dfsupport['Amount'].str.replace(patterns,regex=True)

No entanto, minha tentativa leva ao erro:

Traceback (most recent call last):
  File "/home/cloud/code/learning/howmany.py", line 160, in <module>
    dfsupport['Amount'] = dfsupport['Amount'].str.replace(patternv,regex=True)
                          ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/cloud/.venv/lib/python3.12/site-packages/pandas/core/strings/accessor.py", line 136, in wrapper
    return func(self, *args, **kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^
TypeError: StringMethods.replace() missing 1 required positional argument: 'repl'

Como faço para corrigir isso?

Devo acrescentar que pretendo ter a saída como "29.21"

segui a pergunta aqui

python
  • 1 1 respostas
  • 44 Views

1 respostas

  • Voted
  1. Best Answer
    mozway
    2023-12-07T23:43:28+08:002023-12-07T23:43:28+08:00

    Está faltando o segundo parâmetro (obrigatório) de str.replace:

    dfsupport['Amount'] = dfsupport['Amount'].str.replace(r'(\d{1,})\s(\d{1,2})\D+',
                                                          r'\1.\2', regex=True)
    

    Parece também que você está tentando usar um dicionário patterns, mas isso não está funcionando do jeito que você fez, você tem que passar um único regex.

    Se quiser passar um dicionário, use replace(sem str.):

    patterns = {r'(\d{1,})\s(\d{1,2})\D+' : r'\1.\2'}
    dfsupport['Amount'] = dfsupport['Amount'].replace(patterns,regex=True)
    

    Saída:

             Date Category       Sales Paid  Amount
    0   8/12/2020    Table     1 table  Yes   93.78
    1   8/12/2020    Chair     3chairs  Yes  $51.99
    2   13/1/2020  Cushion  8 cushions  Yes   44.99
    3   24/5/2020    Table     3Tables  Yes   38.24
    4  31/10/2020    Chair   12 Chairs   No  £29.99
    5   11/7/2020     Mats      12Mats  Yes   29.21
    6   11/7/2020     Mats       4Mats  Yes      18
    
    • 1

relate perguntas

  • Como divido o loop for em 3 quadros de dados individuais?

  • Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve