AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 76920401
Accepted
Karthik S
Karthik S
Asked: 2023-08-17 17:54:51 +0800 CST2023-08-17 17:54:51 +0800 CST 2023-08-17 17:54:51 +0800 CST

Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • 772

Eu tenho um dataframe com 12 colunas. Neles tenho muitas colunas flutuantes, que preciso verificar se os valores são aproximadamente iguais ou próximos o suficiente.

Dados de amostra:

df = pd.DataFrame({'id' : ['abc', 'pqr', 'xyz', 'cbz'],
                  'col1' : [0.0234, 0.001852, 4.123, 0.0012],
                  'col2' : [0.0235, 0.001851, 0.0123, 0.0013],
                  'col3' : [0.0233, 0.001849, 0.124, 0.0011]})
df

    id  col1      col2      col3
0   abc 0.0234    0.0235    0.0233
1   pqr 0.001852  0.001851  0.001849
2   xyz 4.123     0.0123    0.124

Posso usar np.isclosee definir um limite aplicável ao meu caso, que seria 0,062. Mas alguém pode me informar como comparar se col1 é aproximadamente igual a col2 aproximadamente igual a col3. Se até 1 coluna não satisfizer a condição, o resultado deverá ser Falsecomo no caso de id xyz.

python
  • 3 3 respostas
  • 42 Views

3 respostas

  • Voted
  1. Best Answer
    jezrael
    2023-08-17T18:04:09+08:002023-08-17T18:04:09+08:00

    Você pode comparar todas as colunas de transposição primeiro e testar se todos os valores são Trues por numpy.all:

    df = pd.DataFrame({'id' : ['abc', 'pqr', 'xyz', 'cbz'],
                      'col1' : [0.0234, 0.001852, 4.123, 0.0012],
                      'col2' : [0.0235, 0.001851, 0.0123, 0.0013],
                      'col3' : [0.0233, 0.001849, 0.124, 0.0011]})
    
    cols= ['col1','col2','col3']
    
    out = np.isclose(df[cols[1:]].to_numpy(), 
                     df[cols[0]].to_numpy()[:, None], 
                     atol=0.062).all(axis=1)
    print (out)
    [ True  True False  True]
    
    print (df.loc[out, 'id'])
    0    abc
    1    pqr
    3    cbz
    Name: id, dtype: object
    
    • 1
  2. Timeless
    2023-08-17T18:33:30+08:002023-08-17T18:33:30+08:00

    IIUC, você pode usar:

    thresh = 0.062
    
    arr = df.set_index("id").to_numpy()
    
    diff = np.abs(arr[:, :, None] - arr[:, None, :])
    
    m = np.all(diff <= thresh, axis=(1, 2))
    

    Saída :

    >>> m
    # array([ True,  True, False,  True])
    
    >>> df["id"].loc[~m].values
    # array(['xyz'], dtype=object)
    
    • 1
  3. R.B
    2023-08-17T20:12:01+08:002023-08-17T20:12:01+08:00

    Lista abrangente usando np.isclosee combinando matrizes booleanas com np.logical_and:

    float_columns = df.select_dtypes(float).columns
    condition = np.logical_and(
        *[np.isclose(df[previous_column], df[next_column], atol=0.062)
        for previous_column, next_column in zip(float_columns[:-1], float_columns[1:])]
    )
    >>> condition
    array([ True,  True, False])
    
    • 0

relate perguntas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve