Como divido o loop for em 3 quadros de dados individuais?

Question

AmirX

Asked: 2024-06-20 15:00:59 +0800 CST2024-06-20 15:00:59 +0800 CST 2024-06-20 15:00:59 +0800 CST

Como posso encontrar a primeira linha após várias linhas duplicadas?

772

Meu DataFrame é:

import pandas as pd
df = pd.DataFrame(
    {
        'x': ['a', 'a', 'a','b', 'b','c', 'c', 'c',],
        'y': list(range(8))
    }
)

E este é o resultado esperado. Quero criar uma coluna z:

   x  y    z
0  a  0    NaN
1  a  1    NaN 
2  a  2    NaN
3  b  3    3
4  b  4    NaN
5  c  5    NaN
6  c  6    NaN
7  c  7    NaN

A lógica é:

Quero encontrar a primeira linha após o primeiro grupo de linhas duplicadas. Por exemplo, em column x, o valor aé o primeiro valor duplicado. Quero encontrar uma linha após o atérmino dos valores. E então coloque o ydessa linha por zcoluna.

Esta é a minha tentativa que não me deu o resultado:

m = (df.x.duplicated())
out = df[m]

1 respostas

Voted

mozway · Answer 1 · 2024-06-20T15:07:13+08:00

Uma opção, usando uma máscara personalizada:

# flag rows after the first group
m = df['x'].ne(df['x'].iat[0]).cummax()

# pick the first one
out = df[m & ~m.shift(fill_value=False)]

Se o seu primeiro valor for sempre ae você quiser encontrar o primeiro não, avocê também poderá usar:

m2 = df['x'].eq('a')

out = df[m2.shift(fill_value=False) & ~m2]

Ou, se você tiver certeza de que há pelo menos uma linha após os as iniciais:

out = df.loc[[df['x'].ne('a').idxmax()]]

Saída:

   x  y
3  b  3

Alguns intermediários (todas as abordagens):

   x  y      m  ~m.shift(fill_value=False)     m2  m2.shift(fill_value=False)  df['x'].ne('a')
0  a  0  False                        True   True                       False            False
1  a  1  False                        True   True                        True            False
2  a  2  False                        True   True                        True            False
3  b  3   True                        True  False                        True             True
4  b  4   True                       False  False                       False             True
5  c  5   True                       False  False                       False             True
6  c  6   True                       False  False                       False             True
7  c  7   True                       False  False                       False             True

Como posso encontrar a primeira linha após várias linhas duplicadas?

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Como posso encontrar a primeira linha após várias linhas duplicadas?

1 respostas

relate perguntas