Como divido o loop for em 3 quadros de dados individuais?

Question

Kyle Carow

Asked: 2024-10-02 02:29:55 +0800 CST2024-10-02 02:29:55 +0800 CST 2024-10-02 02:29:55 +0800 CST

Fatiar condicionalmente um multiíndice pandas em um nível específico

772

Para meu DataFrame multi-indexado fornecido:

df = pd.DataFrame(
    np.random.randn(12),
    index=[
        [1,1,2,3,4,4,5,5,6,6,7,8],
        [1,2,1,1,1,2,1,2,1,2,2,2],
    ]
)

            0
1 1  1.667692
  2  0.274428
2 1  0.216911
3 1 -0.513463
4 1 -0.642277
  2 -2.563876
5 1  2.301943
  2  1.455494
6 1 -1.539390
  2 -1.344079
7 2  0.300735
8 2  0.089269

Gostaria de dividi-lo de forma que eu mantenha apenas as linhas onde o segundo nível de índice contém AMBOS 1 e 2

            0
1 1  1.667692
  2  0.274428
4 1 -0.642277
  2 -2.563876
5 1  2.301943
  2  1.455494
6 1 -1.539390
  2 -1.344079

Como posso fazer isso?

3 respostas

Voted

PaulS · Answer 1 · 2024-10-02T02:35:49+08:00

Best Answer

PaulS

2024-10-02T02:35:49+08:002024-10-02T02:35:49+08:00

Outra solução possível, que se baseia no seguinte:

df.groupby(level=0)agrupa o dataframe pelo primeiro nível do índice.
filter(lambda x: set(x.index.get_level_values(1)) == {1, 2})verifica se o segundo nível do índice para cada grupo contém 1 e 2 e retém apenas os grupos que atendem a essa condição.

df.groupby(level=0).filter(lambda x: set(x.index.get_level_values(1)) == {1, 2})

Saída:

            0
1 1 -1.085631
  2  0.997345
4 1 -0.578600
  2  1.651437
5 1 -2.426679
  2 -0.428913
6 1  1.265936
  2 -0.866740

4

mozway · Answer 2 · 2024-10-02T02:32:14+08:00

mozway

2024-10-02T02:32:14+08:002024-10-02T02:32:14+08:00

Você pode converter o Multindex to_framepara poder executar uma operação groupby.transformcom a set.issubsetfinalidade de gerar uma série para indexação booleana :

out = df[df.index.to_frame().groupby(0)[1].transform({1, 2}.issubset)]

NB. se você quiser exatamente (não pelo menos) {1, 2}, use lambda x: set(x) == {1, 2}a função as em transform.

Se você precisar executar isso em comandos encadeados:

df.loc[lambda x: x.index.to_frame().groupby(0)[1].transform({1, 2}.issubset)]

Saída:

            0
1 1 -1.017357
  2  0.869500
4 1 -1.348415
  2  0.625116
5 1  0.708617
  2  0.438953
6 1  0.632509
  2  0.693872

Intermediário:

df.index.to_frame().groupby(0)[1].transform({1, 2}.issubset)

1  1     True
   2     True
2  1    False
3  1    False
4  1     True
   2     True
5  1     True
   2     True
6  1     True
   2     True
7  2    False
8  2    False
Name: 1, dtype: bool

3

sammywemmy · Answer 3 · 2024-10-02T05:27:24+08:00

sammywemmy

2024-10-02T05:27:24+08:002024-10-02T05:27:24+08:00

Esta é uma alternativa às outras respostas que devem ter melhor desempenho (de preferência ignorando o groupby e usando os métodos do tipo set do próprio pandas): Obtenha os valores no nível 0, onde o nível 1 é 1 e 2, e indexe o dataframe com eles:

mi = df.index
filter1=mi.get_locs([slice(None), 1])
filter2=mi.get_locs([slice(None), 2])
indexer=base[filter1].intersection(base[filter2])
df.loc[indexer]

            0
1 1  0.395119
  2 -0.358966
4 1  0.023952
  2  0.976810
5 1  0.217600
  2 -1.385707
6 1  1.334745
  2 -0.018886

Se você tiver mais valores, poderá usar uma compreensão.

2

Fatiar condicionalmente um multiíndice pandas em um nível específico

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Fatiar condicionalmente um multiíndice pandas em um nível específico

3 respostas

relate perguntas