Como divido o loop for em 3 quadros de dados individuais?

Question

Pro Q

Asked: 2024-06-28 10:14:41 +0800 CST2024-06-28 10:14:41 +0800 CST 2024-06-28 10:14:41 +0800 CST

Como prever o tipo resultante após indexar um DataFrame do Pandas

772

Eu tenho um Pandas DataFrame, conforme definido aqui :

df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Aritra'],
                   'Age': [25, 30, 35],
                   'Location': ['Seattle', 'New York', 'Kona']},
                  index=([10, 20, 30]))

No entanto, quando indexo this DataFrame, não posso prever com precisão que tipo de objeto resultará da indexação:

# (1) str
df.iloc[0, df.columns.get_loc('Name')]
# (2) Series
df.iloc[0:1, df.columns.get_loc('Name')]

# (3) Series
df.iloc[0:2, df.columns.get_loc('Name')]
# (4) DataFrame
df.iloc[0:2, df.columns.get_loc('Name'):df.columns.get_loc('Age')]

# (5) Series
df.iloc[0, df.columns.get_loc('Name'):df.columns.get_loc('Location')]
# (6) DataFrame
df.iloc[0:1, df.columns.get_loc('Name'):df.columns.get_loc('Location')]

Observe que cada um dos pares acima contém os mesmos dados . (por exemplo, (2)é uma série que contém uma única string, (4)é um DataFrame que contém uma única coluna, etc.)

Por que eles produzem diferentes tipos de objetos? Como posso prever que tipo de objeto será gerado?

Dados os dados, parece que a regra é baseada em quantas fatias (dois pontos) você tem no índice:

0 fatias ( (1)): valor escalar
1 fatia ( (2), (3), (5)):Series
2 fatias ( (4), (6)):DataFrame

No entanto, não tenho certeza se isso é sempre verdade e, mesmo que seja sempre verdade, quero saber o mecanismo subjacente que explica por que isso acontece.

Passei um tempo olhando a documentação de indexação , mas ela não parece descrever esse comportamento com clareza. A documentação da ilocfunção também não descreve os tipos de retorno.

Também estou interessado na mesma pergunta forloc em vez de iloc, mas, como locé inclusive , os resultados não são tão desconcertantes. (Ou seja, você não pode obter pares de índices com tipos diferentes nos quais os índices deveriam extrair exatamente os mesmos dados.)

1 respostas

Voted

mozway · Answer 1 · 2024-06-28T13:34:19+08:00

Você entendeu a ideia geral. Para simplificar, o que importa não é o número de itens, mas o tipo de indexador.

Você pode indexar como 0D (com um escalar), vamos considerar o índice por enquanto:

df.iloc[0]

df.loc[0]

ou 1D (com uma fatia ou iterável):

df.loc[[0]]

df.loc[1:2]

df.loc[:0]

Então a regra é simples, considere ambos os eixos, se ambos forem 0D você obtém um escalar (aqui uma string), se ambos forem 1D você obtém um DataFrame, caso contrário, uma Série:

columns      0D         1D
index                     
0D       scalar     Series
1D       Series  DataFrame

Alguns exemplos para ilustrar isso:

type(df.iloc[1:2, 1:2])        # 1D / 1D
# pandas.core.frame.DataFrame

type(df.iloc[:0, :0])          # 1D / 1D
# pandas.core.frame.DataFrame  (EMPTY DataFrame)

type(df.iloc[[], []])          # 1D / 1D
# pandas.core.frame.DataFrame  (EMPTY DataFrame)

type(df.iloc[[1,2], 0])        # 1D / 0D
# pandas.core.series.Series

type(df.iloc[0, [0]])          # 0D / 1D
# pandas.core.series.Series

type(df.iloc[0, 0])            # 0D / 0D
# str

Como prever o tipo resultante após indexar um DataFrame do Pandas

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Como prever o tipo resultante após indexar um DataFrame do Pandas

1 respostas

relate perguntas