AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77620921
Accepted
Dan
Dan
Asked: 2023-12-07 22:44:41 +0800 CST2023-12-07 22:44:41 +0800 CST 2023-12-07 22:44:41 +0800 CST

A substituição da string do pandas não está substituindo todas as seleções

  • 772

Eu tenho esse dataframe:

dfsupport = pd.DataFrame({'Date': ['8/12/2020','8/12/2020','13/1/2020','24/5/2020','31/10/2020','11/7/2020','11/7/2020'],
                          'Category': ['Table','Chair','Cushion','Table','Chair','Mats','Mats'],
                          'Sales': ['1 table','3chairs','8 cushions','3Tables','12 Chairs','12Mats','4Mats'],
                          'Paid': ['Yes','Yes','Yes','Yes','No','Yes','Yes',],
                          'Amount': ['93.78','$51.99','44.99','38.24','£29.99','29 only','18']
                          })

Estou tentando substituir os sinais de moeda por espaços em branco, mas o procedimento abaixo não funciona.

patternv='|'.join(['$', '£'])
dfsupport['Amount'] = dfsupport['Amount'].str.replace(patternv,'')

Por que isso não funciona?

Imprima o dataframe após o acima:

          Date Category       Sales Paid   Amount
0   8/12/2020    Table     1 table  Yes    93.78
1   8/12/2020    Chair     3chairs  Yes   $51.99
2   13/1/2020  Cushion  8 cushions  Yes    44.99
3   24/5/2020    Table     3Tables  Yes    38.24
4  31/10/2020    Chair   12 Chairs   No   £29.99
5   11/7/2020     Mats      12Mats  Yes  29 only
6   11/7/2020     Mats       4Mats  Yes       18
         Date Category      Sales Paid  Amount
1   8/12/2020    Chair    3chairs  Yes  $51.99
4  31/10/2020    Chair  12 Chairs   No  £29.99 

Eu segui esta pergunta , então não sei por que a minha não está funcionando.

python
  • 3 3 respostas
  • 47 Views

3 respostas

  • Voted
  1. Best Answer
    mozway
    2023-12-07T22:46:42+08:002023-12-07T22:46:42+08:00

    Você está perdendo duas coisas importantes:

    • escapando dos caracteres regex com re.escape( $significa "fim de string")
    • definindo o regex=Truemodo de str.replace(agora Falsepor padrão)
    import re
    
    patternv='|'.join(map(re.escape, ['$', '£']))
    dfsupport['Amount'] = dfsupport['Amount'].str.replace(patternv, '', regex=True)
    

    Saída:

             Date Category       Sales Paid   Amount
    0   8/12/2020    Table     1 table  Yes    93.78
    1   8/12/2020    Chair     3chairs  Yes    51.99
    2   13/1/2020  Cushion  8 cushions  Yes    44.99
    3   24/5/2020    Table     3Tables  Yes    38.24
    4  31/10/2020    Chair   12 Chairs   No    29.99
    5   11/7/2020     Mats      12Mats  Yes  29 only
    6   11/7/2020     Mats       4Mats  Yes       18
    
    • 6
  2. jezrael
    2023-12-07T22:46:35+08:002023-12-07T22:46:35+08:00

    Primeiro escape dos caracteres regex na compreensão do gerador e depois especifique regex=Truepara Series.str.replacesubstituir substrings:

    import re
    
    patternv='|'.join(re.escape(x) for x in ['$', '£'])
    dfsupport['Amount'] = dfsupport['Amount'].str.replace(patternv,'', regex=True)
    print (dfsupport)
             Date Category       Sales Paid   Amount
    0   8/12/2020    Table     1 table  Yes    93.78
    1   8/12/2020    Chair     3chairs  Yes    51.99
    2   13/1/2020  Cushion  8 cushions  Yes    44.99
    3   24/5/2020    Table     3Tables  Yes    38.24
    4  31/10/2020    Chair   12 Chairs   No    29.99
    5   11/7/2020     Mats      12Mats  Yes  29 only
    6   11/7/2020     Mats       4Mats  Yes       18
    
    • 2
  3. PaulS
    2023-12-07T23:01:08+08:002023-12-07T23:01:08+08:00

    Outra solução possível, usando pandas.Series.str.extract:

    dfsupport['Amount'] = dfsupport['Amount'].str.extract(r'(\d+\.\d+|\d+)')
    

    Saída:

             Date Category       Sales Paid Amount
    0   8/12/2020    Table     1 table  Yes  93.78
    1   8/12/2020    Chair     3chairs  Yes  51.99
    2   13/1/2020  Cushion  8 cushions  Yes  44.99
    3   24/5/2020    Table     3Tables  Yes  38.24
    4  31/10/2020    Chair   12 Chairs   No  29.99
    5   11/7/2020     Mats      12Mats  Yes     29
    6   11/7/2020     Mats       4Mats  Yes     18
    
    • 1

relate perguntas

  • Como divido o loop for em 3 quadros de dados individuais?

  • Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve