AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77253713
Accepted
P.Jo
P.Jo
Asked: 2023-10-08 21:00:48 +0800 CST2023-10-08 21:00:48 +0800 CST 2023-10-08 21:00:48 +0800 CST

chamando loc com uma matriz booleana contendo NA

  • 772

O documento pandas on loc afirma que pode ser usado com matrizes booleanas, mais especificamente afirma o seguinte:

"As entradas permitidas são: ... Uma matriz booleana (quaisquer valores NA serão tratados como falsos)."

Minha pergunta: como você pode criar uma matriz booleana contendo valores NA? Quero dizer: uma matriz numpy bool não pode conter Nans e se interpretarmos isso de forma mais liberal como afirmando "uma lista contendo valores booleanos e na", então loc lança exceções, por exemplo:

d_test = pd.DataFrame({"id": [1,2,3,5], "q1": [1,4,4,2], "q2": [4,np.nan,9,0]}, index=["a","b","c","d"])
t1 = [True,False,False,np.nan]
d_test.loc[t1] # KeyError
#same with None:
t1 = [True,False,False,None]

Então, minha pergunta: como esta frase deve ser interpretada?

pandas
  • 2 2 respostas
  • 35 Views

2 respostas

  • Voted
  1. Best Answer
    Timeless
    2023-10-08T21:13:25+08:002023-10-08T21:13:25+08:00

    Eu acho que eles significam um BooleanArray ( que pode ser criado com pd.array ):

    Matriz de dados booleanos ( True/ False) com valores ausentes .

    t1 = [True,False,False,np.nan]
    
    out = d_test.loc[pd.array(t1, dtype="boolean")]
    

    Então, como np.nané tratado como False, apenas a primeira linha está sendo selecionada pela máscara.

    Saída :

    print(out)
    
       id  q1   q2
    a   1   1 4.00
    
    • 3
  2. Corralien
    2023-10-08T21:32:35+08:002023-10-08T21:32:35+08:00

    Além da resposta do @Timeless. Se você converter sua lista como Indexou Serieso tipo padrão será inferido pelo Pandas:

    >>> help(pd.Index)
    
    ...
     |  dtype : NumPy dtype (default: object)
     |      If dtype is None, we find the dtype that best fits the data.
     |      If an actual dtype is provided, we coerce to that dtype if it's safe.
     |      Otherwise, an error will be raised.
    ...
    

    No seu caso, t1será um objeto:

    >>> pd.Index(t1)
    Index([True, False, False, nan], dtype='object')
    

    Se você forçar o dtypeas boolean:

    >>> pd.Index(t1, dtype='boolean')  # From pd.BooleanDtype()
    Index([True, False, False, <NA>], dtype='boolean')
    

    Tome cuidado com a diferença entre booleane bool, o resultado não é o mesmo!

    >>> pd.Index(t1, dtype='bool')
    Index([True, False, False, True], dtype='bool')
    

    Somente a forma booleana (seja qual for o dtype boolou boolean) é permitida para mascarar seu dataframe:

    >>> d_test.loc[pd.Index(t1, dtype='boolean')]  # what you want
       id  q1   q2
    a   1   1  4.0
    
    >>> d_test.loc[pd.Index(t1, dtype='bool')]  # what you don't want
       id  q1   q2
    a   1   1  4.0
    d   5   2  0.0
    
    • 3

relate perguntas

  • Extraia a string da linha duplicada, remova a duplicata, forneça a contagem de strings [duplicada]

  • percorrendo colunas para gerar countplot () seaborn

  • Como posso obter o máximo de cada linha em uma coluna de índice

  • Crie uma matriz dask com pyarrow dtype

  • Divida as entradas no dataframe [duplicado]

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve