AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77673792
Accepted
x_Amir_x
x_Amir_x
Asked: 2023-12-17 16:52:32 +0800 CST2023-12-17 16:52:32 +0800 CST 2023-12-17 16:52:32 +0800 CST

sequência agrupada de números e uma linha depois, verifique o primeiro valor de uma coluna para cada grupo e crie uma nova coluna

  • 772

Este é o meu dataframe:

df = pd.DataFrame(
    {
        'a': [0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0],
        'b': [1, -1, -1, -1, 1, -1, 1, 1, -1, 1, 1, -1, 1, 1, -1, 1, 1]    
    }
)

E esta é a saída que eu quero. Quero criar uma coluna c:

   a  b  c
0   0  1  0
1   0 -1  0
2   1 -1  0
3   1 -1  0
4   1  1  1
5   1 -1  1
6   0  1  0
7   0  1  0
8   0 -1  0
9   1  1  1
10  1  1  1
11  1 -1  1
12  0  1  0
13  0  1  0
14  1 -1  0
15  1 -1  1
16  0  1  0

Esta é basicamente uma extensão deste post . As linhas destacadas abaixo resumem a maneira como isso precisa ser feito.

insira a descrição da imagem aqui

Primeiro de tudo, na coluna a, os grupos são criados por sequência de 1s e uma linha após o término da sequência. As linhas destacadas na coluna asão esses grupos. A solução para esta etapa está aqui .

Agora o que preciso é verificar a coluna bde cada grupo no arquivo a. Encontre o primeiro valor que é 1 pol bpara cada grupo. E então qualquer valor que vier antes disso se tornará 0. É assim que a coluna cé criada.

Por exemplo, para o primeiro grupo em a, o primeiro valor da coluna bé 1 é o número da linha 4. Os valores anteriores nesse grupo tornam-se 0. E o resultado é o primeiro grupo destacado na coluna c.

Observe que se para um grupo todos os valores bNÃO forem 1, o grupo correspondente se ctornará todos 0s.

Isto é o que eu tentei, mas não consigo encontrar a solução completa:

g = df.loc[::-1, 'a'].eq(0).cumsum()
x = df.groupby(g).filter(lambda x: x.b.iloc[0] == 1)
python
  • 2 2 respostas
  • 48 Views

2 respostas

  • Voted
  1. Best Answer
    mozway
    2023-12-17T16:59:38+08:002023-12-17T16:59:38+08:00

    Uma variação da resposta vinculada usando groupby.cummaxon df['b'].eq(1)e uma máscara intermediária derivada da garoupa:

    m = df.loc[::-1, 'a'].eq(0)
    g = m.cumsum()
    
    df['c'] = np.where(df['b'].eq(1).groupby(g).cummax() & ~m, 1, 0)
    

    Saída e intermediários:

        a  b  c      m     ~m  cummax  cummax&~m
    0   0  1  0   True  False    True      False
    1   0 -1  0   True  False   False      False
    2   1 -1  0  False   True   False      False
    3   1 -1  0  False   True   False      False
    4   1  1  1  False   True    True       True
    5   1 -1  1  False   True    True       True
    6   0  1  0   True  False    True      False
    7   0  1  0   True  False    True      False
    8   0 -1  0   True  False   False      False
    9   1  1  1  False   True    True       True
    10  1  1  1  False   True    True       True
    11  1 -1  1  False   True    True       True
    12  0  1  0   True  False    True      False
    13  0  1  0   True  False    True      False
    14  1 -1  0  False   True   False      False
    15  1  1  1  False   True    True       True
    16  0  1  0   True  False    True      False
    
    • 1
  2. jezrael
    2023-12-17T17:11:46+08:002023-12-17T17:11:46+08:00

    Crie uma máscara por GroupBy.cummaxe encadeie com Series.duplicated, para definir 0,1a conversão de booleano para números inteiros:

    g = df.loc[::-1, 'a'].eq(0).cumsum()
    df['c'] = (df['b'].eq(1).groupby(g).cummax() & g.duplicated()).astype(int)
    print (df)
        a  b  c
    0   0  1  0
    1   0 -1  0
    2   1 -1  0
    3   1 -1  0
    4   1  1  1
    5   1 -1  1
    6   0  1  0
    7   0  1  0
    8   0 -1  0
    9   1  1  1
    10  1  1  1
    11  1 -1  1
    12  0  1  0
    13  0  1  0
    14  1 -1  0
    15  1  1  1
    16  0  1  0
    
    • 1

relate perguntas

  • Como divido o loop for em 3 quadros de dados individuais?

  • Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve