Como divido o loop for em 3 quadros de dados individuais?

Question

x_Amir_x

Asked: 2024-03-16 00:57:06 +0800 CST2024-03-16 00:57:06 +0800 CST 2024-03-16 00:57:06 +0800 CST

Como obter a primeira instância de uma máscara se ela estiver nas N primeiras linhas?

772

Este é o meu DataFrame.

import pandas as pd
df = pd.DataFrame(
    {
        'a': [100, 1123, 9999, 100, 1, 954, 1],
        'b': [1000, 11123, 1123, 0, 55, 0, 1],
    },
)

A saída esperada é a criação da coluna c:

      a      b       c
0   100   1000     NaN
1  1123  11123     NaN
2  9999   1123  9999.0
3   100      0     NaN
4     1     55     NaN
5   954      0     NaN
6     1      1     NaN

A máscara é:

mask = ((df.a > df.b))

Quero pegar a primeira linha que atenda às condições desta máscara SE APENAS estiver nas 3 primeiras linhas e colocar df.apara criar c. Para este exemplo este código funciona:

df.loc[mask.cumsum().eq(1) & mask, 'c'] = df.a

Mas para este DataFrame ele deve retornar NaNporque ca primeira instância de masknão está nas 3 primeiras linhas. Mas não funciona.

df = pd.DataFrame(
    {
        'a': [0, 0, 0, 0, 0, 954, 1],
        'b': [1000, 11123, 1123, 0, 55, 0, 1],
    },
)

3 respostas

Voted

e-motta · Answer 1 · 2024-03-16T01:00:40+08:00

Best Answer

e-motta

2024-03-16T01:00:40+08:002024-03-16T01:00:40+08:00

Você pode adicionar uma condição à máscara com base no índice:

mask = (df.a > df.b) & (df.index < 3)

Para o seu segundo exemplo, isso resultará em:

     a      b   c
0    0   1000 NaN
1    0  11123 NaN
2    0   1123 NaN
3    0      0 NaN
4    0     55 NaN
5  954      0 NaN
6    1      1 NaN

2

mudskipper · Answer 2 · 2024-03-16T01:06:19+08:00

mudskipper

2024-03-16T01:06:19+08:002024-03-16T01:06:19+08:00

Se quiser que a coluna csaia exatamente como na sua pergunta, você pode usar o seguinte código:

mask = ((df.a > df.b) & (df.index < 3))
df["c"] = df.a[mask]

Quando df.a[mask]é transmitido na última linha, colocará NaNs em todas as linhas onde a máscara for avaliada como False. Então, isso resulta em:

      a      b       c
0   100   1000     NaN
1  1123  11123     NaN
2  9999   1123  9999.0
3   100      0     NaN
4     1     55     NaN
5   954      0     NaN
6     1      1     NaN

2

mozway · Answer 3 · 2024-03-16T01:19:24+08:00

mozway

2024-03-16T01:19:24+08:002024-03-16T01:19:24+08:00

Não há necessidade de calcular outra máscara, apenas o corte df['a']e a reindexação ocorrerão durante a atribuição:

mask = df['a'] > df['b']

df.loc[mask, 'c'] = df['a'].iloc[:3]

Saída:

# example 1
      a      b       c
0   100   1000     NaN
1  1123  11123     NaN
2  9999   1123  9999.0
3   100      0     NaN
4     1     55     NaN
5   954      0     NaN
6     1      1     NaN

# example 2
     a      b   c
0    0   1000 NaN
1    0  11123 NaN
2    0   1123 NaN
3    0      0 NaN
4    0     55 NaN
5  954      0 NaN
6    1      1 NaN

1

Como obter a primeira instância de uma máscara se ela estiver nas N primeiras linhas?

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Como obter a primeira instância de uma máscara se ela estiver nas N primeiras linhas?

3 respostas

relate perguntas