Meu DataFrame é:
import pandas as pd
df = pd.DataFrame(
{
'a': [-3, -1, -2, -5, 10, -3, -13, -3, -2, 1, 2, -100],
}
)
Resultado esperado:
a
0 -3
1 -1
2 -2
3 -5
Lógica:
Quero retornar a maior sequência de números negativos. E se houver mais de uma sequência maior, quero devolver a primeira sequência. Existem df
duas listras negativas com tamanho 4, então a primeira é retornada.
Esta é minha tentativa, mas sempre que uso idxmax()
em meu código, quero verificar novamente porque às vezes fica complicado em alguns cenários.
import numpy as np
df['sign'] = np.sign(df.a)
df['sign_streak'] = df.sign.ne(df.sign.shift(1)).cumsum()
m = df.sign.eq(-1)
group_sizes = df.groupby('sign_streak').size()
largest_group = group_sizes.idxmax()
largest_group_df = df[df['sign_streak'] == largest_group]
Seu código está bom, você poderia simplificá-lo um pouco, evitando as colunas intermediárias:
Ou, como você realmente não se importa com a diferença 0/+:
Nota:
idxmax
está sempre bem se você quiser a primeira partida.Saída: