Como divido o loop for em 3 quadros de dados individuais?

Question

Giampaolo Levorato

Asked: 2024-11-12 03:39:46 +0800 CST2024-11-12 03:39:46 +0800 CST 2024-11-12 03:39:46 +0800 CST

Contar elementos em uma linha e criar contador de colunas no pandas

772

Criei o seguinte dataframe do pandas:

import pandas as pd

ds = {'col1' : ['A','A','B','C','C','D'],
      'col2' : ['A','B','C','D','D','A']}

df = pd.DataFrame(data=ds)

O dataframe se parece com isto:

print(df)

  col1 col2
0    A    A
1    A    B
2    B    C
3    C    D
4    C    D
5    D    A

Os valores possíveis em col1e col2são A, B, Ce D.

Preciso criar 4 novas colunas, chamadas:

countA:conta quantos Aestão em cada linha/registro
countB:conta quantos Bestão em cada linha/registro
countC:conta quantos Cestão em cada linha/registro
countD:conta quantos Destão em cada linha/registro

Então, a partir do exemplo acima, o dataframe resultante ficaria assim:

Alguém pode me ajudar, por favor?

4 respostas

Voted

ThomasIsCoding · Answer 1 · 2024-11-12T03:52:53+08:00

ThomasIsCoding

2024-11-12T03:52:53+08:002024-11-12T03:52:53+08:00

Provavelmente isso pode funcionar para você

from numpy import unique

for k in unique(df.values):
    df['count'+k] = df.eq(k).sum(axis=1)

o que dá

  col1 col2  countA  countB  countC  countD
0    A    A       2       0       0       0
1    A    B       1       1       0       0
2    B    C       0       1       1       0
3    C    D       0       0       1       1
4    C    D       0       0       1       1
5    D    A       1       0       0       1

6

rhug123 · Answer 2 · 2024-11-12T04:30:09+08:00

Best Answer

rhug123

2024-11-12T04:30:09+08:002024-11-12T04:30:09+08:00

Aqui está uma maneira de usarpd.get_dummies()

df.join(pd.get_dummies(df,prefix='',prefix_sep='').T.groupby(level=0).sum().T.rename('count{}'.format,axis=1))

e aqui está uma maneira de usarvalue_counts()

df.join(df.stack().groupby(level=0).value_counts().unstack(fill_value = 0).rename('count{}'.format,axis=1))

Saída:

  col1 col2  countA  countB  countC  countD
0    A    A       2       0       0       0
1    A    B       1       1       0       0
2    B    C       0       1       1       0
3    C    D       0       0       1       1
4    C    D       0       0       1       1
5    D    A       1       0       0       1

2

mozway · Answer 3 · 2024-11-12T12:06:01+08:00

mozway

2024-11-12T12:06:01+08:002024-11-12T12:06:01+08:00

Mantenha-o simples, você pode stack+ droplevelpara obter uma série, depois crosstabcontar e joina saída, opcionalmente depois add_prefixrenomear as colunas:

# reshape to 1D
s = df.stack().droplevel(-1)

# count and add to original
out = df.join(pd.crosstab(s.index, s).add_prefix('count'))

Saída:

  col1 col2  countA  countB  countC  countD
0    A    A       2       0       0       0
1    A    B       1       1       0       0
2    B    C       0       1       1       0
3    C    D       0       0       1       1
4    C    D       0       0       1       1
5    D    A       1       0       0       1

1

yellow_dot · Answer 4 · 2024-11-12T15:31:14+08:00

yellow_dot

2024-11-12T15:31:14+08:002024-11-12T15:31:14+08:00

Você pode comparar uma coluna inteira com uma letra específica, converter booleanos para int e somar tais séries obtidas para cada letra. Por exemplo:

importar pandas como pd

ds = {'col1' : ['A','A','B','C','C','D'],
      'col2' : ['A','B','C','D','D','A']}

df = pd.DataFrame(data=ds)

to_count = ['col1', 'col2']
for letter in ['A', 'B', 'C', 'D']:
    df[f'count_{letter}'] = sum([(df[col] == letter).astype(int) for col in to_count])

retorna:

    col1 col2 count_A count_B count_C count_D
0   A   A   2   0   0   0
1   A   B   1   1   0   0
2   B   C   0   1   1   0
3   C   D   0   0   1   1
4   C   D   0   0   1   1
5   D   A   1   0   0   1

0

Contar elementos em uma linha e criar contador de colunas no pandas

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Contar elementos em uma linha e criar contador de colunas no pandas

4 respostas

relate perguntas